📅  最后修改于: 2023-12-03 14:45:02.378000             🧑  作者: Mango
Pandas是Python数据分析中最热门的库之一,广泛应用于数据清洗、数据处理、数据分析等领域。其中,DataFrame是Pandas最常用的数据结构之一。Pandas DataFrame 基于标签的索引可以帮助我们方便地处理和分析数据。
在介绍Pandas DataFrame 基于标签的索引之前,我们先来看一下如何建立DataFrame。DataFrame可以视为一个表格,它有行和列组成。创建DataFrame需要使用Pandas库中的DataFrame()函数。例如:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 17, 32, 19],
'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
print(df)
输出结果如下:
name age gender
0 Alice 25 F
1 Bob 17 M
2 Charlie 32 M
3 David 19 M
在Pandas DataFrame中,我们可以使用基于标签的索引来选取相关数据。基于标签的索引分为两种:
下面我们分别介绍两种索引方式。
使用loc[]函数可以基于标签/名称轴索引数据。loc[]函数的常用格式如下:
df.loc[[行标签列表], [列标签列表]]
其中行标签列表是必须的,而如果不指定列标签列表,则默认选取所有的列。行标签可以使用标签名称或者切片方式进行查询。
例如,我们可以使用如下方式查询所有行数据和列数据:
print(df.loc[:, :])
输出结果如下:
name age gender
0 Alice 25 F
1 Bob 17 M
2 Charlie 32 M
3 David 19 M
我们还可以使用如下方式查询所有行数据和指定列数据:
print(df.loc[:, ['name', 'age']])
输出结果如下:
name age
0 Alice 25
1 Bob 17
2 Charlie 32
3 David 19
同时我们也可以使用行标签切片方式查询部分数据:
print(df.loc[1:3, :])
输出结果如下:
name age gender
1 Bob 17 M
2 Charlie 32 M
3 David 19 M
使用iloc[]函数可以基于整数位置轴索引数据。iloc[]函数的常用格式如下:
df.iloc[[行位置列表], [列位置列表]]
其中行位置列表是必须的,而如果不指定列位置列表,则默认选取所有的列。
例如,我们可以使用如下方式查询所有行数据和列数据:
print(df.iloc[:, :])
输出结果如下:
name age gender
0 Alice 25 F
1 Bob 17 M
2 Charlie 32 M
3 David 19 M
我们还可以使用如下方式查询所有行数据和指定列数据:
print(df.iloc[:, [0, 1]])
输出结果如下:
name age
0 Alice 25
1 Bob 17
2 Charlie 32
3 David 19
同时我们也可以使用行位置切片方式查询部分数据:
print(df.iloc[1:3, :])
输出结果如下:
name age gender
1 Bob 17 M
2 Charlie 32 M
在本篇介绍中,我们学习了如何建立Pandas DataFrame,并通过loc[]和iloc[]函数介绍了如何基于标签的索引选取数据。了解了基于标签的索引,我们可以更加方便地对DataFrame中的数据进行处理、分析和可视化展示。