📅  最后修改于: 2023-12-03 15:25:21.550000             🧑  作者: Mango
在 Pandas 中,我们可以将一列作为 DataFrame 的索引。这在数据清理和分析中是一个常见的操作。下面是如何将一个列作为索引的方法。
import pandas as pd
# 创建 DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': ['a', 'b', 'c', 'd']})
# 将列 'B' 设置为索引
df.set_index('B', inplace=True)
# 打印 DataFrame
print(df)
输出结果:
A
B
a 1
b 2
c 3
d 4
上述代码中,我们首先创建了一个包含两列的 DataFrame。然后我们使用 set_index
方法,将列 B
设置为索引。设置完成后,我们可以使用 .loc
方法来根据索引获取数据。
# 从索引中提取特定行的数据
print(df.loc['a'])
# 从索引中提取多行的数据
print(df.loc[['a', 'b']])
# 从索引中提取指定行和列的数据
print(df.loc[['a', 'b'], ['A']])
# 重设索引
df.reset_index(inplace=True)
print(df)
输出结果:
B A
0 a 1
1 b 2
2 c 3
3 d 4
# 列出非重复的索引
print(df.index.unique())
输出结果:
Index(['a', 'b', 'c', 'd'], dtype='object', name='B')
在 Pandas 中将一列作为 DataFrame 的索引通常是一个很有用的操作。我们可以通过 set_index
方法轻松实现。一旦索引设置完成,我们可以使用不同的方法来访问和操作数据。