📜  基于索引 pandas 隔离行 - Python (1)

📅  最后修改于: 2023-12-03 15:23:39.804000             🧑  作者: Mango

基于索引 pandas 隔离行 - Python

在 Pandas 中,我们可以使用索引来隔离数据行。这个功能非常有用,特别是当你需要只选择特定的行,做进一步的数据分析时。

下面是一个演示如何使用 Pandas 索引来隔离行的简单例子:

import pandas as pd

# 创建一个数据帧
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
                   'age': [25, 32, 18, 47, 23],
                   'score': [85, 79, 92, 67, 91]})

# 使用 loc[] 函数来隔离行
df_selected = df.loc[[0, 2, 4]]

# 输出隔离后的结果
print(df_selected)

这个例子中,我们首先创建了一个数据帧,其中包括了每个人的名字、年龄和分数。然后,我们使用 loc[] 函数来隔离了这个数据帧中的第 1、3 和 5 行,并将结果保存在了一个新的数据帧 df_selected 中。

接下来我们将输出 df_selected,来查看我们隔离的结果:

| | name | age | score | |:-:|:-:|:-:|:-:| | 0 | Alice | 25 | 85 | | 2 | Charlie | 18 | 92 | | 4 | Emily | 23 | 91 |

可以看到,我们成功地隔离了数据帧中指定的几行,只保留了我们需要的数据。

这种方法不仅可以使用整数作为索引值,还可以使用布尔型、切片、条件表达式等方式进行隔离。请看下面的代码片段:

# 使用布尔型索引来隔离行
df_selected = df.loc[df['score'] > 90]

# 使用切片语法隔离一段连续的行
df_selected = df.loc[1:3]

# 使用条件表达式隔离行
df_selected = df.loc[(df['age'] > 20) & (df['age'] < 40)]

现在你已经掌握了如何使用 Pandas 索引来隔离行的方法,在真正开展项目之前,可以通过本地的数据来多练习几次,更好的理解 Pandas 的索引机制。