📜  pandas 按模糊值过滤行 - Python (1)

📅  最后修改于: 2023-12-03 15:18:14.991000             🧑  作者: Mango

Pandas 按模糊值过滤行 - Python

在pandas中,我们可以使用str对象上的方法来过滤包含特定文本的行。这种过滤方法适合用于文本列上,比如一个包含许多字符串的列。在本文中,我们将使用pandas的str.contains()方法过滤一个包含多种不同文本的列。

数据准备

首先,让我们创建一个包含多种文本的示例DataFrame。

import pandas as pd

# 创建一个包含文本的DataFrame
df = pd.DataFrame({'文本列': ['Python', 'Pandas', 'Numpy', 'Scikit-learn', 'Matplotlib', 'Seaborn', 'Pycharm', 'Jupyter']})

我们将使用上面创建的df作为例子,通过str.contains()方法过滤包含特定文本的行。

过滤行

现在,我们将使用str.contains()方法过滤包含特定文本的行。

# 选择包含'Py'的行
df_filtered = df[df['文本列'].str.contains('Py')]

# 打印结果
print(df_filtered)

输出:

           文本列
0        Python
1        Pandas
6       Pycharm
7       Jupyter

如上例所示,我们将创建一个名为df_filtered的新DataFrame,其中包含df中包含'Py'字符串的行。

结论

这篇文章介绍了如何使用pandas的str.contains()方法过滤包含特定文本的行。我们提供了一个简单的示例,使用str.contains()过滤包含'Py'字符串的行。

使用这种方法,你可以自定义过滤条件,以适应不同的数据集和应用场景。这使得pandas成为数据清理和数据分析中非常强大的工具之一。