📅  最后修改于: 2023-12-03 15:18:15.025000             🧑  作者: Mango
当我们处理数据时,在 Pandas 中 DataFrame 数据框是最常用的数据结构之一。数据框由行和列组成,每一列都有一个对应的列名。
我们可以使用 DataFrame 的 columns
属性来获取数据框的全部列名。
import pandas as pd
df = pd.read_csv('data.csv')
columns = df.columns
print(columns)
输出结果:
Index(['Name', 'Age', 'Gender'], dtype='object')
我们可以得到如上格式的 Pandas Index(索引)对象,其中包含了数据框的全部列名。
我们可以使用 DataFrame 的 rename()
方法来修改数据框的列名。下面的例子中,我们将数据框的列名从默认的 0
和 1
修改为了 Name
和 Age
。
import pandas as pd
df = pd.read_csv('data.csv', header=None)
df = df.rename(columns={0: 'Name', 1: 'Age'})
print(df.columns)
输出结果:
Index(['Name', 'Age'], dtype='object')
我们可以看到数据框的列名已经被修改了。
我们可以使用 DataFrame 的 insert()
或 assign()
方法来新增列,其中 insert()
方法需要我们指定列的位置、列名和列的值,而 assign()
方法仅需要指定列名和列的值。下面的例子模拟了一场选美比赛,我们将参赛者的得分新增为一列。
import pandas as pd
df = pd.read_csv('beauty_contest.csv')
scores = [89, 92, 85, 94, 90, 88]
df = df.assign(Score=scores)
print(df)
输出结果:
Name Age Gender Score
0 Amy 20 F 89
1 Jane 21 F 92
2 Tom 19 M 85
3 Bob 22 M 94
4 Kim 20 F 90
5 Jack 21 M 88
我们可以看到新的一列已经被添加到了数据框中。
我们可以使用 DataFrame 的 drop()
方法来删除数据框中的一列。下面的例子中,我们删除了数据框中的 Gender
列。
import pandas as pd
df = pd.read_csv('beauty_contest.csv')
df = df.drop(columns=['Gender'])
print(df)
输出结果:
Name Age
0 Amy 20
1 Jane 21
2 Tom 19
3 Bob 22
4 Kim 20
5 Jack 21
我们可以看到 Gender
列已经被删除了。