Practice makes perfect
文献集锦
如何理论创新?
管理学理论集锦
Python实际应用
聚类标准误与固定效应
巫师3:狂猎
Stata应用技巧
Python知识与技巧
双重差分法(DID)
创新文献阅读与摘要
计量经济学
Python绘图相关
如何在 Pandas DataFrame 中创建一个空列
type
status
date
slug
summary
tags
category
icon
password
网址
作者
标签
文章链接
发布时间
来源
在 Pandas 中创建空列是数据预处理和特征工程中的常见操作。以下是几种创建空列的方法及其适用场景的详细说明。
1. 使用赋值操作创建空列
基本方法
输出结果
各方法比较
方法 | 数据类型 | 说明 |
None | object | Python原生空值,会强制列转为object类型 |
np.nan | float64 | NumPy的缺失值表示,列会转为float类型 |
pd.NA | 保持原类型 | Pandas 1.0+引入,能更好保持数据类型 |
2. 使用 assign() 方法创建空列
3. 使用 insert() 在指定位置插入空列
4. 创建特定类型的空列
指定数据类型创建空列
5. 批量创建多个空列
6. 创建空列的最佳实践
- 数据类型一致性:根据后续使用场景选择适当的空值表示方式
- 数值计算:使用
np.nan - 字符串操作:使用
pd.NA或空字符串'' - 分类数据:使用
pd.Categorical([], categories=[])
- 性能考虑:对于大型DataFrame,预分配内存更高效
- 与现有操作链式结合:
7. 实际应用示例
注意事项
- 使用
None会导致列自动转换为object类型,可能影响性能
np.nan只能用于数值列,会强制转换为float64
pd.NA是最通用的缺失值表示,能保持数据类型
- 在创建空列后,可以使用
df.info()检查列的数据类型是否符合预期
Prev
在 Pandas 中将 DataFrame 列转换为日期时间
Next
爬取空气质量数据
Loading...