📌  相关文章
📜  pandas 过滤字符串长度 - Python (1)

📅  最后修改于: 2023-12-03 15:18:15.601000             🧑  作者: Mango

Pandas 过滤字符串长度 - Python

在处理 Pandas 数据时,我们经常需要过滤字符串长度以筛选出特定数据集。Pandas 基于字符串长度的过滤功能可以帮助我们方便地进行这项操作。

下面我们将介绍如何使用 Pandas 过滤字符串长度。

准备工作

首先,我们需要准备一些数据。下面是一组字符串型数据:

import pandas as pd

data = {'Name': ['John Smith', 'Anna Brown', 'Peter Chan', 'Jessica Li', 'Hans Mueller'],
        'Age': [25, 34, 19, 47, 52],
        'Salary': [5000, 7500, 4000, 9000, 6000]}

df = pd.DataFrame(data)
过滤字符串长度

假设我们想要从数据中筛选出名字长度小于 10 的人员信息。可以使用 Pandas 中的 str.len() 函数获取名字的长度,并使用布尔索引进行筛选。

df_filtered = df[df['Name'].str.len() < 10]

print(df_filtered)

运行结果:

        Name  Age  Salary
2  Peter Chan   19    4000

在上面的代码中,我们通过 df['Name'].str.len() 获取名字的长度,然后使用布尔索引 df['Name'].str.len() < 10 对数据进行筛选,最后将结果存储到 df_filtered 变量中。

总结

Pandas 中的 str.len() 函数可以方便地获取字符串的长度,并通过布尔索引实现字符串长度上的过滤操作。这对于处理 Pandas 数据时,筛选出特定的数据集非常有帮助。