Practice makes perfect
文献集锦
如何理论创新?
管理学理论集锦
Python实际应用
聚类标准误与固定效应
巫师3:狂猎
Stata应用技巧
Python知识与技巧
双重差分法(DID)
创新文献阅读与摘要
计量经济学
Python绘图相关
如何在 Pandas DataFrame 中创建一个空列
type
Post
status
Published
date
Apr 19, 2025
slug
summary
tags
category
Python知识与技巧
icon
password
网址
作者
标签
文章链接
发布时间
来源
在 Pandas 中创建空列是数据预处理和特征工程中的常见操作。以下是几种创建空列的方法及其适用场景的详细说明。
1. 使用赋值操作创建空列
基本方法
输出结果
各方法比较
方法 | 数据类型 | 说明 |
None | object | Python原生空值,会强制列转为object类型 |
np.nan | float64 | NumPy的缺失值表示,列会转为float类型 |
pd.NA | 保持原类型 | Pandas 1.0+引入,能更好保持数据类型 |
2. 使用 assign() 方法创建空列
3. 使用 insert() 在指定位置插入空列
4. 创建特定类型的空列
指定数据类型创建空列
5. 批量创建多个空列
6. 创建空列的最佳实践
- 数据类型一致性:根据后续使用场景选择适当的空值表示方式
- 数值计算:使用
np.nan - 字符串操作:使用
pd.NA或空字符串'' - 分类数据:使用
pd.Categorical([], categories=[])
- 性能考虑:对于大型DataFrame,预分配内存更高效
- 与现有操作链式结合:
7. 实际应用示例
注意事项
- 使用
None会导致列自动转换为object类型,可能影响性能
np.nan只能用于数值列,会强制转换为float64
pd.NA是最通用的缺失值表示,能保持数据类型
- 在创建空列后,可以使用
df.info()检查列的数据类型是否符合预期
Prev
在 Pandas 中将 DataFrame 列转换为日期时间
Next
爬取空气质量数据
Loading...