📅  最后修改于: 2023-12-03 15:41:45.325000             🧑  作者: Mango
Pandas 是 Python 中非常流行的数据分析库,它提供了 Series 和 DataFrame 两种数据结构来处理数据。在使用 Pandas 进行数据处理时,我们需要经常访问其中的元素,本文将介绍如何访问 Pandas 系列的元素。
Series 是一种一维数组,它由一组数据和一组与之相关的标签组成,我们可以通过标签来访问其中的元素。
Pandas 提供了 .loc
和 .iloc
两种方法来通过索引访问元素。
.loc
:通过标签索引访问元素。import pandas as pd
s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])
print(s.loc['a']) # 输出 1
print(s.loc[['a', 'c', 'e']]) # 输出包含三个元素的 Series 对象
.iloc
:通过位置索引访问元素。import pandas as pd
s = pd.Series([1, 2, 3, 4, 5])
print(s.iloc[0]) # 输出 1
print(s.iloc[[0, 2, 4]]) # 输出包含三个元素的 Series 对象
Pandas 提供了类似于 NumPy 的布尔索引来实现通过条件访问元素的功能。
import pandas as pd
s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])
print(s[s > 3]) # 输出大于 3 的元素所组成的 Series 对象
DataFrame 是一种二维表格数据结构,它由若干个 Series 对象组成,每个 Series 对象代表一列数据,我们可以通过列名和行名来访问其中的元素。
Pandas 提供了 .loc
和 .iloc
两种方法来通过索引访问元素。
.loc
:通过列名和行名访问元素。import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [21, 22, 23]})
print(df.loc[0, 'name']) # 输出 Alice
print(df.loc[[0, 2], 'age']) # 输出包含两个元素的 Series 对象
print(df.loc[df.age > 21, ['name', 'age']]) # 输出所有年龄大于 21 的行组成的 DataFrame 对象
.iloc
:通过位置索引访问元素。import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [21, 22, 23]})
print(df.iloc[0, 0]) # 输出 Alice
print(df.iloc[[0, 2], 1]) # 输出包含两个元素的 Series 对象
print(df.iloc[df.age > 21, [0, 1]]) # 输出所有年龄大于 21 的行组成的 DataFrame 对象
Pandas 提供了类似于 NumPy 的布尔索引来实现通过条件访问元素的功能。
import pandas as pd
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [21, 22, 23]})
print(df[df.age > 21]) # 输出所有年龄大于 21 的行组成的 DataFrame 对象
以上就是我们常用的访问 Pandas 系列的元素的方法,希望对你有帮助。