📅  最后修改于: 2023-12-03 15:12:21.440000             🧑  作者: Mango
在 Pandas 中,DataFrame (DF) 是一个二维带标签的数据结构。它由行(索引)和列(标签)组成, 而我们可以通过选择行和列来获取想要的数据。
选择 DF 列时,首先需要理解 DataFrame 的基本结构,即:DataFrame 由一组 Series 组成,每个 Series 代表行向量的一列。因此,我们可以通过 DataFrame 的列标签获取特定的 Series,而 Series 可以像一维数组一样进行操作。
以下是一些选择 DF 列的方法:
要选择一列,请使用 DataFrame[column_name],其中 column_name 是指要选择的列的标签。
import pandas as pd
# 创建数据,包含三列分别为 A, B, C
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
# 选择列 B
column_b = df['B']
print(column_b)
# 输出:
# 0 4
# 1 5
# 2 6
# Name: B, dtype: int64
从 DataFrame 中选择列还可以使用点号(.)操作符。
# 选择列 A
column_a = df.A
# 或者
column_a = df['A']
print(column_a)
# 输出:
# 0 1
# 1 2
# 2 3
# Name: A, dtype: int64
Pandas 还提供了两个方法 iloc 和 loc。 iloc 使用列索引,loc 使用列标签名称来选择列。
# 选择第一列
first_column = df.iloc[:, 0]
# 或者
first_column = df.loc[:, 'A']
print(first_column)
# 输出:
# 0 1
# 1 2
# 2 3
# Name: A, dtype: int64
我们可以选择多个列:
# 选择列 A 和 B
column_ab = df[['A', 'B']]
print(column_ab)
# 输出:
# A B
# 0 1 4
# 1 2 5
# 2 3 6
我们也可以通过 drop 方法删除列:
# 删除列 A
df = df.drop('A', axis=1)
print(df)
# 输出:
# B C
# 0 4 7
# 1 5 8
# 2 6 9
以上是选择 DF 列的方法。使用这些方法,也可以选择多行和多列,进行数据的处理和操作。