如何在 Pandas DataFrame 中创建一个空列

type
status
date
slug
summary
tags
category
icon
password
网址
作者
标签
文章链接
发布时间
来源
在 Pandas 中创建空列是数据预处理和特征工程中的常见操作。以下是几种创建空列的方法及其适用场景的详细说明。

1. 使用赋值操作创建空列

基本方法

输出结果

各方法比较

方法
数据类型
说明
None
object
Python原生空值,会强制列转为object类型
np.nan
float64
NumPy的缺失值表示,列会转为float类型
pd.NA
保持原类型
Pandas 1.0+引入,能更好保持数据类型

2. 使用 assign() 方法创建空列

3. 使用 insert() 在指定位置插入空列

4. 创建特定类型的空列

指定数据类型创建空列

5. 批量创建多个空列

6. 创建空列的最佳实践

  1. 数据类型一致性:根据后续使用场景选择适当的空值表示方式
      • 数值计算:使用 np.nan
      • 字符串操作:使用 pd.NA 或空字符串 ''
      • 分类数据:使用 pd.Categorical([], categories=[])
  1. 性能考虑:对于大型DataFrame,预分配内存更高效
    1. 与现有操作链式结合

      7. 实际应用示例

      注意事项

      1. 使用 None 会导致列自动转换为 object 类型,可能影响性能
      1. np.nan 只能用于数值列,会强制转换为 float64
      1. pd.NA是最通用的缺失值表示,能保持数据类型
      1. 在创建空列后,可以使用 df.info() 检查列的数据类型是否符合预期
      Prev
      在 Pandas 中将 DataFrame 列转换为日期时间
      Next
      爬取空气质量数据
      Loading...
      Article List
      Practice makes perfect
      文献集锦
      如何理论创新?
      管理学理论集锦
      Python实际应用
      聚类标准误与固定效应
      巫师3:狂猎
      Stata应用技巧
      Python知识与技巧
      双重差分法(DID)
      创新文献阅读与摘要
      计量经济学
      Python绘图相关