📜  pandas 过滤和更改值 - Python (1)

📅  最后修改于: 2023-12-03 14:45:04.949000             🧑  作者: Mango

Pandas 过滤和更改值 - Python

Pandas是Python的一个开源数据分析库,提供高效的数据操作界面和灵活的数据分析工具。本文介绍Pandas中如何通过条件过滤和赋值操作实现对数据集的快速过滤和更改操作。

条件过滤

Pandas中支持通过条件表达式生成布尔值的方式进行过滤操作。例如,我们可以针对某个DataFrame对象进行过滤,筛选出符合条件的行或列数据,以得到满足需求的数据子集合。

import pandas as pd

# 构造一个示例DataFrame
data = {'Name': ['John', 'Paul', 'George', 'Ringo'], 
        'Age': [20, 22, 21, 25],
        'Country': ['USA', 'UK', 'UK', 'USA']}
df = pd.DataFrame(data)

# 根据条件筛选数据
filtered_df = df[df['Age'] > 21]

上述代码中,我们先构造了一个包含姓名、年龄和国家三个列的DataFrame对象,接着根据“年龄大于21岁”的条件表达式筛选出符合条件的行数据,最终得到了一个新的DataFrame对象filtered_df,其中包含了两个年龄大于21岁的数据行。

赋值更改

除了条件过滤,Pandas还支持对DataFrame对象进行赋值操作,从而实现对数据集的更改操作。例如,我们可以直接对某个DataFrame对象的某个列或单元格赋值,来快速更改数据集中相应的数据。

# 更改数据
df.loc[2, 'Country'] = 'France'
df['Age'] += 1

上述代码中,我们先通过.loc方法来选择要更改的行和列,然后对它们进行直接赋值操作。在此示例中,我们将第三行的“Country”列数值更改为'France',另外同时将所有“Age”列的数值加1。

除了直接赋值操作之外,我们还可以通过apply和map等函数来对整列或整个数据集进行更精细化的计算和更改操作,以实现更加高效的数据分析和操作。

总结

本文介绍了Pandas中的条件过滤和赋值更改等数据操作方式,并提供了相关代码示例和详细解释。开发者可以在实际使用中结合具体业务场景,灵活制定数据分析方案和操作策略,以实现更高质量、更有效率的数据分析和应用。