Practice makes perfect
文献集锦
如何理论创新?
管理学理论集锦
Python实际应用
聚类标准误与固定效应
巫师3:狂猎
Stata应用技巧
Python知识与技巧
双重差分法(DID)
创新文献阅读与摘要
计量经济学
Python绘图相关
遗漏变量偏误检验
用split函数切割字符串
type
Post
status
Published
date
Apr 18, 2025
slug
summary
tags
category
Python知识与技巧
icon
password
网址
作者
标签
文章链接
发布时间
来源
在Python的字符串处理中,
split()是一个非常常用的方法。split()方法有一个不太为人熟知但非常有用的参数叫做expand(在pandas的str.split()中),让我们来详细讲解它的用法。基本split()方法
首先回顾一下基本的
split()用法:pandas中的str.split()和expand参数
在pandas库中,
str.split()方法有一个expand参数,它可以将分割后的结果扩展为DataFrame的列。基本语法
pat: 分隔符,默认为空白符
n: 分割次数,-1表示全部分割
expand: 如果为True,返回DataFrame/MultiIndex;如果为False,返回Series/Index
expand=False (默认)
当
expand=False时,split()返回一个包含列表的Series:输出:
expand=True
当
expand=True时,split()会将分割后的各部分作为新列返回:输出:
expand参数的实际应用
1. 分割固定格式的数据
输出:
2. 控制分割次数
结合
n参数可以控制分割次数:输出:
3. 处理不等长的分割结
输出:
注意事项
- 当
expand=True时,返回的是一个DataFrame,而不是Series
- 缺失值会用
NaN填充
- 分割后的列数由最大分割结果决定
- 在纯Python的字符串
split()中没有expand参数,这是pandas特有的功能
总结
expand参数在pandas的str.split()中非常有用,特别是当你需要将分割后的字符串部分作为单独的列处理时。它提供了一种简洁的方式将字符串数据转换为结构化数据,便于后续的分析和处理。上一篇
爬取空气质量数据
下一篇
腾讯 NLP 的情感分析教程
Loading...