📅  最后修改于: 2023-12-03 14:45:02.465000             🧑  作者: Mango
Pandas 是 Python 中最流行的数据处理和分析库之一。它支持多种数据结构和函数,包括数据框架(DataFrame),一种类似于表格的数据结构。
在 Pandas 中,我们可以按行索引来选择和操作数据。本文将介绍如何使用 Pandas 按行索引来操作数据帧。
首先,我们需要建立一个数据帧。可以使用 Pandas 中的 DataFrame()
函数,如下所示:
import pandas as pd
# 创建一个数据帧
df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Age': [25, 32, 18, 47],
'City': ['London', 'New York', 'Paris', 'Berlin']})
# 查看数据帧
print(df)
这个数据帧有四个行,每个行有三个属性:名称
,年龄
和 城市
。
首先,我们可以按照行索引值(从零开始的整数)选择数据。例如,我们可以选择第三行数据:
# 使用 iloc 属性选择第三行数据
row_2 = df.iloc[2]
# 打印结果
print(row_2)
输出结果如下:
Name Charlie
Age 18
City Paris
Name: 2, dtype: object
我们还可以选择多行数据。例如,我们可以选择前两行数据:
# 使用 iloc 属性选择前两行数据
top_two_rows = df.iloc[:2]
# 打印结果
print(top_two_rows)
输出结果如下:
Name Age City
0 Alice 25 London
1 Bob 32 New York
除了使用行索引来选择数据,我们还可以使用布尔索引。布尔索引是一种按照条件选择数据的方式。可以使用比较运算符(如 <
、>
、==
等)或者其他逻辑运算符来创建布尔值序列。
例如,我们可以选择年龄大于 30 岁的人:
# 选择年龄大于 30 岁的行
older_than_30 = df[df['Age'] > 30]
# 打印结果
print(older_than_30)
输出结果如下:
Name Age City
1 Bob 32 New York
3 David 47 Berlin
我们也可以使用符合条件的多个布尔值来选择数据。例如,我们可以选择某个城市里的人:
# 选择城市为‘New York’的行
new_yorkers = df[df['City'] == 'New York']
# 打印结果
print(new_yorkers)
输出结果如下:
Name Age City
1 Bob 32 New York
在 Pandas 中,我们可以使用行索引来选择和操作数据帧。我们可以按照行索引值、布尔索引值或其他方式来选择数据,进而完成数据处理和分析任务。