📅  最后修改于: 2023-12-03 15:18:14.954000             🧑  作者: Mango
Pandas 是 Python 数据分析领域的重要库之一。在数据处理中,选择特定的行是一项常见任务。本文将介绍如何按多个条件选择行。
为了方便演示,我们首先需要创建一个示例数据集。示例数据包含以下列:
import pandas as pd
data = {'name': ['Tom', 'Jerry', 'Mike', 'Lucy', 'Amy'],
'gender': ['M', 'M', 'M', 'F', 'F'],
'age': [20, 22, 21, 19, 20],
'score': [85, 92, 88, 78, 90]}
df = pd.DataFrame(data)
Pandas 中的 loc
方法可以按条件选择行。假设我们要选择性别为男性的行,可以使用以下代码:
male = df.loc[df['gender'] == 'M']
print(male)
输出如下:
name gender age score
0 Tom M 20 85
1 Jerry M 22 92
2 Mike M 21 88
以上代码中的 df['gender'] == 'M'
是一个条件语句,可以选择 gender
列中值为 M
的行。运用 .loc
方法,可以将满足条件的行筛选出来。
如果要按多个条件选择行,需要将多个条件用 &
或 |
符合连接起来。例如,假设我们想要选择年龄大于 20 岁且分数大于等于 90 分的男性行,可以使用以下代码:
condition = (df['gender'] == 'M') & (df['age'] > 20) & (df['score'] >= 90)
result = df.loc[condition]
print(result)
输出如下:
name gender age score
1 Jerry M 22 92
以上代码中,&
符号连接的条件表示满足三个条件的交集,|
符号连接的条件表示满足两个条件的并集。
本文介绍了 Pandas 如何按多个条件选择行。如果需要对数据进行更细致的处理,可以查看 Pandas 文档,或使用相关数据分析库。