📅  最后修改于: 2023-12-03 15:24:18.423000             🧑  作者: Mango
在 pandas 中,我们可以使用 split
方法来拆分一列中的字符串。这个方法会返回一个新的 DataFrame,其中包含拆分后的字符串。本文将介绍如何在 pandas 中使用 split
。
在开始之前,我们需要先安装 pandas。我们可以使用以下命令来安装:
pip install pandas
同时,我们需要有一个 DataFrame 来演示如何使用 split
方法。我们可以使用以下代码来创建一个 DataFrame:
import pandas as pd
data = {
'name': ['Tom', 'Jerry', 'Mickey'],
'age': [20, 30, 25],
'genre': ['M-F', 'F', 'M-F']
}
df = pd.DataFrame(data)
print(df)
输出结果如下:
name age genre
0 Tom 20 M-F
1 Jerry 30 F
2 Mickey 25 M-F
在这个 DataFrame 中,我们有一个名为 genre
的列,其中包含了不同的字符串。我们将使用 split
方法对这个列进行拆分。
使用 split
方法很简单。我们可以直接在 DataFrame 中的列上调用这个方法。例如,我们可以使用以下代码来拆分 genre
列:
df[['gender', 'preference']] = df['genre'].str.split('-', expand=True)
print(df)
这个代码中,我们使用了 str
属性来获取 genre
列中的字符串,并在其上调用了 split
方法。我们将返回的结果赋值给了 df[['gender', 'preference']]
,这相当于在 DataFrame 中新增了两列。
在 split
方法中,我们指定了 -
作为分隔符,因此,在字符串中包含了 -
的位置进行拆分。expand=True
表示我们想要将所有拆分后的结果作为新的列添加到 DataFrame 中。
输出结果如下:
name age genre gender preference
0 Tom 20 M-F M F
1 Jerry 30 F NaN NaN
2 Mickey 25 M-F M F
在拆分后的 DataFrame 中,我们可以看到新增了两列:gender
和 preference
。同时,原来的 genre
列中的值被拆分到了新的两列中。
在本文中,我们介绍了如何在 pandas 中使用 split
方法来对字符串进行拆分。我们使用了一个包含三列数据的 DataFrame 来进行演示,其中包含了一个需要被拆分的字符串列。我们通过调用 split
方法并指定分隔符来拆分了这个字符串列,并将返回的结果作为新列添加到了原 DataFrame 中。