📜  在工作表 pandas 中查找数据 - Python (1)

📅  最后修改于: 2023-12-03 15:08:01.700000             🧑  作者: Mango

在工作表 pandas 中查找数据 - Python

在数据分析过程中,有时需要在数据集中查找特定的数据。Pandas是一个很好的数据处理库,提供了很多方法来查找数据。在本文中,我们将介绍如何在Pandas工作表中查找数据。

导入Pandas

首先,需要导入Pandas库。

import pandas as pd
加载数据

我们将使用Pandas内置的数据集来演示数据查找的方法。首先,我们需要加载数据集。Pandas提供了很多方法来加载数据集,例如:read_csvread_excelread_table等。这里我们使用read_csv方法。

url = "https://people.sc.fsu.edu/~jburkardt/data/csv/hw_200.csv"
df = pd.read_csv(url)

现在,我们已经成功地将数据集加载到一个Pandas Dataframe对象中。

查找数据

在Pandas中,有很多方法可以用来查找数据。这里我们介绍的是最常用的几种方法。

1. loc方法

loc方法用来通过标签来查找数据。它的语法如下:

df.loc[row_label, column_label]

其中,row_labelcolumn_label可以是单个标签,也可以是包含多个标签的列表。

例如,我们可以通过以下方式来获取身高为70英寸的人的所有信息:

df.loc[df["Height"] == 70.0, :]

这里省略了column_label,表示获取所有列的数据。

2. iloc方法

iloc方法用来通过位置索引来查找数据。它的语法如下:

df.iloc[row_index, column_index]

其中,row_indexcolumn_index可以是单个位置索引,也可以是包含多个位置索引的列表。

例如,我们可以通过以下方式来获取第10行和第20行的所有信息:

df.iloc[[9, 19], :]
3. isin方法

isin方法用来查找某个列中的特定数据。它的语法如下:

df[df["column_name"].isin(list)]

其中,column_name表示要查找的列名,list表示包含要查找数据的列表。

例如,我们可以通过以下方式来查找性别为女性的所有数据:

df[df["Gender"].isin(["Female"])]
总结

本文介绍了在Pandas中查找数据的三种方法:locilocisin。使用这些方法可以很方便地在一份数据集中查找需要的数据。