📅  最后修改于: 2023-12-03 14:55:14.188000             🧑  作者: Mango
在使用 pandas
进行数据处理时,有时候需要更改 DataFrame 中的列名称,以便更方便地处理数据或将 DataFrame 输出为其他格式(如 CSV)。
更改 DataFrame 中的列名称可以使用 pandas.DataFrame.rename()
方法,该方法的基本语法如下:
df.rename(columns={'旧列名1':'新列名1', '旧列名2':'新列名2', ...}, inplace=True)
其中:
df
表示要进行操作的 DataFrame;columns
参数是一个字典,用于指定要更改的列名称,字典中的键表示要更改的列的旧名称,值表示要更改为的新名称;inplace
参数表示是否在原 DataFrame 上直接进行更改,默认是 False
。下面看一个例子,假设有一个名为 data
的 DataFrame,包含两列数据 col1
和 col2
:
import pandas as pd
data = pd.DataFrame({'col1': [1, 2, 3], 'col2': [4, 5, 6]})
print(data)
输出结果如下:
col1 col2
0 1 4
1 2 5
2 3 6
现在将 col1
更改为 A
,col2
更改为 B
,代码如下:
data.rename(columns={'col1': 'A', 'col2': 'B'}, inplace=True)
print(data)
输出结果如下:
A B
0 1 4
1 2 5
2 3 6
除了基本语法以外,pandas.DataFrame.rename()
方法还提供了很多其他的用法,比如支持正则表达式替换、同时更改行索引名称等。具体可以参考 官方文档。
使用 pandas.DataFrame.rename()
方法可以非常方便地对 DataFrame 中的列名称进行更改。需要注意的是,由于该方法会返回新的 DataFrame,因此要么使用 inplace=True
对原 DataFrame 直接进行更改,要么将返回值重新赋值给 DataFrame 变量。