📅  最后修改于: 2023-12-03 15:03:28.225000             🧑  作者: Mango
DataFrame.set_index
是Pandas库中的一个非常重要的函数,用于将DataFrame中的一列或多列设置为索引,这样可以方便地对数据进行筛选、切片、聚合等操作。
DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)
参数说明:
keys
:要设置为索引的列或列名的字符串或列表。drop
:布尔值,默认为True,表示是否将列从DataFrame中删除,如果设置为False,则会在DataFrame中保留这些列。append
:布尔值,默认为False,表示是否将索引添加到现有索引之后,如果设置为True,则会将索引添加到现有索引之后。inplace
:布尔值,默认为False,表示是否在原DataFrame上操作,如果设置为True,则会在原DataFrame上进行修改。verify_integrity
:布尔值,默认为False,表示是否检查索引是否唯一,如果设置为True,则会检查索引是否唯一,如果有重复的索引,则会抛出ValueError异常。import pandas as pd
# 创建DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8], 'C': [9, 10, 11, 12]})
# 打印DataFrame
print(df)
# 将A列作为索引
df.set_index('A', inplace=True)
# 打印新的DataFrame
print(df)
# 将B和C列作为索引(多重索引)
df.set_index(['B', 'C'], inplace=True)
# 打印新的DataFrame
print(df)
输出结果:
A B C
0 1 5 9
1 2 6 10
2 3 7 11
3 4 8 12
B C
A
1 5 9
2 6 10
3 7 11
4 8 12
A
B C
5 9 1
6 10 2
7 11 3
8 12 4
从上面的示例可以看出,set_index
函数可以轻松地将DataFrame的列设置为索引,并可以根据需要添加多重索引。