📅  最后修改于: 2023-12-03 15:18:14.538000             🧑  作者: Mango
在处理数据时,有时需要对字符串类型的列截取前面的几个字符。这时可以使用 pandas 中的 str
方法,对字符串列进行操作。下面介绍如何使用 pandas 截取列字符串的前 n 个字符。
首先,我们先使用 pandas 读取一个包含字符串名字的数据集:
import pandas as pd
data = {
"name": ["Alice", "Bob", "Carol", "David", "Eric"],
"age": [25, 32, 18, 47, 53],
"score": [80, 92, 70, 88, 79]
}
df = pd.DataFrame(data)
现在,我们有一个包含名字、年龄和分数的 DataFrame,现在我们要截取名字列的前三个字符。
df['name'].str[:3]
上述代码中的 .str
方法将名字列转换为字符串类型,并使用字符串切片操作截取前三个字符。输出结果为:
0 Ali
1 Bob
2 Car
3 Dav
4 Eri
Name: name, dtype: object
可以看到,所有名字的前三个字符都被截取出来了。如果想截取更多的字符,只需要将切片操作中的数字改为对应的字符数即可。
此外,还可以在 .str
方法中使用 slice
函数来进行截取,例如截取名字列的前两个字符:
df['name'].str.slice(stop=2)
输出结果为:
0 Al
1 Bo
2 Ca
3 Da
4 Er
Name: name, dtype: object
以上就是使用 pandas 截取列字符串前 n 个字符的方法。