📜  pandas df by row index - Python (1)

📅  最后修改于: 2023-12-03 14:45:02.465000             🧑  作者: Mango

使用 Pandas 按行索引来操作数据帧(DataFrame)

Pandas 是 Python 中最流行的数据处理和分析库之一。它支持多种数据结构和函数,包括数据框架(DataFrame),一种类似于表格的数据结构。

在 Pandas 中,我们可以按行索引来选择和操作数据。本文将介绍如何使用 Pandas 按行索引来操作数据帧。

建立数据帧

首先,我们需要建立一个数据帧。可以使用 Pandas 中的 DataFrame() 函数,如下所示:

import pandas as pd

# 创建一个数据帧
df = pd.DataFrame({'Name': ['Alice', 'Bob', 'Charlie', 'David'],
                   'Age': [25, 32, 18, 47],
                   'City': ['London', 'New York', 'Paris', 'Berlin']})

# 查看数据帧
print(df)

这个数据帧有四个行,每个行有三个属性:名称年龄城市

使用行索引选择数据

首先,我们可以按照行索引值(从零开始的整数)选择数据。例如,我们可以选择第三行数据:

# 使用 iloc 属性选择第三行数据
row_2 = df.iloc[2]

# 打印结果
print(row_2)

输出结果如下:

Name      Charlie
Age            18
City        Paris
Name: 2, dtype: object

我们还可以选择多行数据。例如,我们可以选择前两行数据:

# 使用 iloc 属性选择前两行数据
top_two_rows = df.iloc[:2]

# 打印结果
print(top_two_rows)

输出结果如下:

     Name  Age      City
0   Alice   25    London
1     Bob   32  New York
使用布尔索引选择数据

除了使用行索引来选择数据,我们还可以使用布尔索引。布尔索引是一种按照条件选择数据的方式。可以使用比较运算符(如 <>== 等)或者其他逻辑运算符来创建布尔值序列。

例如,我们可以选择年龄大于 30 岁的人:

# 选择年龄大于 30 岁的行
older_than_30 = df[df['Age'] > 30]

# 打印结果
print(older_than_30)

输出结果如下:

    Name  Age      City
1    Bob   32  New York
3  David   47    Berlin

我们也可以使用符合条件的多个布尔值来选择数据。例如,我们可以选择某个城市里的人:

# 选择城市为‘New York’的行
new_yorkers = df[df['City'] == 'New York']

# 打印结果
print(new_yorkers)

输出结果如下:

  Name  Age      City
1  Bob   32  New York
结论

在 Pandas 中,我们可以使用行索引来选择和操作数据帧。我们可以按照行索引值、布尔索引值或其他方式来选择数据,进而完成数据处理和分析任务。