📅  最后修改于: 2023-12-03 15:21:53.586000             🧑  作者: Mango
在 Python 中的 pandas 库中,数据框(DataFrame)被用来表示表格型的数据结构。当我们想要在数据框中选择特定行时,可以使用以下几种方式。
使用 loc 方法,可以通过行和列标签来选择数据:
import pandas as pd
df = pd.read_csv('data.csv')
# 选取行标签为 0 和 2 的数据,以及 'Name' 和 'Age' 两列
selected_data = df.loc[[0, 2], ['Name', 'Age']]
以上代码中,我们首先导入了 pandas 库,然后通过 read_csv 方法读取了一个 csv 文件,生成了一个数据框 df。接着,使用 loc 方法选择了行标签为 0 和 2 的数据,以及 'Name' 和 'Age' 两列,并将结果存入了 selected_data 变量中。
使用 iloc 方法,可以通过行和列的整数位置来选择数据:
import pandas as pd
df = pd.read_csv('data.csv')
# 选取第一行和第三行,以及第一列和第二列的数据
selected_data = df.iloc[[0, 2], [0, 1]]
以上代码中,我们使用 iloc 方法选择了第一行和第三行,以及第一列和第二列的数据,并将结果存入了 selected_data 变量中。
使用 Boolean indexing,可以通过自定义的条件来选择数据:
import pandas as pd
df = pd.read_csv('data.csv')
# 选取 'Age' 列中大于 25 的数据
selected_data = df[df['Age'] > 25]
以上代码中,我们选取了 'Age' 列中大于 25 的数据,并将结果存入了 selected_data 变量中。该方式非常灵活,只需要满足自定义的条件即可。
通过以上三种方式,我们可以轻松地从 Python 的数据框中选择特定行的数据。这些方式都具有灵活性和可定制性,可以根据实际需求进行选择。