📜  如何在 pandas 中使用 split - Python (1)

📅  最后修改于: 2023-12-03 15:24:18.423000             🧑  作者: Mango

如何在 pandas 中使用 split - Python

在 pandas 中,我们可以使用 split 方法来拆分一列中的字符串。这个方法会返回一个新的 DataFrame,其中包含拆分后的字符串。本文将介绍如何在 pandas 中使用 split

开始之前

在开始之前,我们需要先安装 pandas。我们可以使用以下命令来安装:

pip install pandas

同时,我们需要有一个 DataFrame 来演示如何使用 split 方法。我们可以使用以下代码来创建一个 DataFrame:

import pandas as pd

data = {
  'name': ['Tom', 'Jerry', 'Mickey'],
  'age': [20, 30, 25],
  'genre': ['M-F', 'F', 'M-F']
}

df = pd.DataFrame(data)
print(df)

输出结果如下:

     name  age genre
0     Tom   20   M-F
1   Jerry   30     F
2  Mickey   25   M-F

在这个 DataFrame 中,我们有一个名为 genre 的列,其中包含了不同的字符串。我们将使用 split 方法对这个列进行拆分。

使用 split 方法

使用 split 方法很简单。我们可以直接在 DataFrame 中的列上调用这个方法。例如,我们可以使用以下代码来拆分 genre 列:

df[['gender', 'preference']] = df['genre'].str.split('-', expand=True)
print(df)

这个代码中,我们使用了 str 属性来获取 genre 列中的字符串,并在其上调用了 split 方法。我们将返回的结果赋值给了 df[['gender', 'preference']],这相当于在 DataFrame 中新增了两列。

split 方法中,我们指定了 - 作为分隔符,因此,在字符串中包含了 - 的位置进行拆分。expand=True 表示我们想要将所有拆分后的结果作为新的列添加到 DataFrame 中。

输出结果如下:

     name  age genre gender preference
0     Tom   20   M-F      M          F
1   Jerry   30     F    NaN        NaN
2  Mickey   25   M-F      M          F

在拆分后的 DataFrame 中,我们可以看到新增了两列:genderpreference。同时,原来的 genre 列中的值被拆分到了新的两列中。

总结

在本文中,我们介绍了如何在 pandas 中使用 split 方法来对字符串进行拆分。我们使用了一个包含三列数据的 DataFrame 来进行演示,其中包含了一个需要被拆分的字符串列。我们通过调用 split 方法并指定分隔符来拆分了这个字符串列,并将返回的结果作为新列添加到了原 DataFrame 中。