📅  最后修改于: 2023-12-03 15:37:25.432000             🧑  作者: Mango
在进行数据清洗和处理时,我们经常需要将文本数据拆分为多个子字段进行处理。在 Pandas DataFrame 中,我们可以使用 str.split()
方法将文本列拆分为多个子列。
下面我们来演示如何在 Pandas DataFrame 中将文本列拆分为两列。
假设我们有以下一个包含姓名和姓氏的数据框:
import pandas as pd
data = {
'Name': ['Alice Smith', 'Bob Johnson', 'Charlie Brown'],
'Age': [25, 30, 35]
}
df = pd.DataFrame(data)
我们想要将 Name
列拆分成 First Name
和 Last Name
两列,我们可以使用 str.split()
方法将其拆分:
df[['First Name', 'Last Name']] = df['Name'].str.split(' ', expand=True)
此处我们使用 expand=True
参数将拆分结果扩展为多列返回。
完整的代码如下:
import pandas as pd
data = {
'Name': ['Alice Smith', 'Bob Johnson', 'Charlie Brown'],
'Age': [25, 30, 35]
}
df = pd.DataFrame(data)
df[['First Name', 'Last Name']] = df['Name'].str.split(' ', expand=True)
print(df)
输出结果如下:
Name Age First Name Last Name
0 Alice Smith 25 Alice Smith
1 Bob Johnson 30 Bob Johnson
2 Charlie Brown 35 Charlie Brown
以上就是在 Pandas DataFrame 中将文本列拆分为两列的方法介绍。