📅  最后修改于: 2023-12-03 15:18:15.601000             🧑  作者: Mango
在处理 Pandas 数据时,我们经常需要过滤字符串长度以筛选出特定数据集。Pandas 基于字符串长度的过滤功能可以帮助我们方便地进行这项操作。
下面我们将介绍如何使用 Pandas 过滤字符串长度。
首先,我们需要准备一些数据。下面是一组字符串型数据:
import pandas as pd
data = {'Name': ['John Smith', 'Anna Brown', 'Peter Chan', 'Jessica Li', 'Hans Mueller'],
'Age': [25, 34, 19, 47, 52],
'Salary': [5000, 7500, 4000, 9000, 6000]}
df = pd.DataFrame(data)
假设我们想要从数据中筛选出名字长度小于 10 的人员信息。可以使用 Pandas 中的 str.len()
函数获取名字的长度,并使用布尔索引进行筛选。
df_filtered = df[df['Name'].str.len() < 10]
print(df_filtered)
运行结果:
Name Age Salary
2 Peter Chan 19 4000
在上面的代码中,我们通过 df['Name'].str.len()
获取名字的长度,然后使用布尔索引 df['Name'].str.len() < 10
对数据进行筛选,最后将结果存储到 df_filtered
变量中。
Pandas 中的 str.len()
函数可以方便地获取字符串的长度,并通过布尔索引实现字符串长度上的过滤操作。这对于处理 Pandas 数据时,筛选出特定的数据集非常有帮助。