📜  选择 DF 列 python (1)

📅  最后修改于: 2023-12-03 15:12:21.440000             🧑  作者: Mango

选择 DF 列 Python

在 Pandas 中,DataFrame (DF) 是一个二维带标签的数据结构。它由行(索引)和列(标签)组成, 而我们可以通过选择行和列来获取想要的数据。

选择 DF 列

选择 DF 列时,首先需要理解 DataFrame 的基本结构,即:DataFrame 由一组 Series 组成,每个 Series 代表行向量的一列。因此,我们可以通过 DataFrame 的列标签获取特定的 Series,而 Series 可以像一维数组一样进行操作。

以下是一些选择 DF 列的方法:

使用方括号

要选择一列,请使用 DataFrame[column_name],其中 column_name 是指要选择的列的标签。

import pandas as pd

# 创建数据,包含三列分别为 A, B, C
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})

# 选择列 B
column_b = df['B']

print(column_b)

# 输出:
# 0    4
# 1    5
# 2    6
# Name: B, dtype: int64
使用点号

从 DataFrame 中选择列还可以使用点号(.)操作符。

# 选择列 A
column_a = df.A

# 或者
column_a = df['A']

print(column_a)

# 输出:
# 0    1
# 1    2
# 2    3
# Name: A, dtype: int64
使用 iloc 和 loc

Pandas 还提供了两个方法 iloc 和 loc。 iloc 使用列索引,loc 使用列标签名称来选择列。

# 选择第一列
first_column = df.iloc[:, 0]

# 或者
first_column = df.loc[:, 'A']

print(first_column)

# 输出:
# 0    1
# 1    2
# 2    3
# Name: A, dtype: int64
多列选择

我们可以选择多个列:

# 选择列 A 和 B
column_ab = df[['A', 'B']]

print(column_ab)

# 输出:
#    A  B
# 0  1  4
# 1  2  5
# 2  3  6
删除列

我们也可以通过 drop 方法删除列:

# 删除列 A
df = df.drop('A', axis=1)

print(df)

# 输出:
#    B  C
# 0  4  7
# 1  5  8
# 2  6  9

以上是选择 DF 列的方法。使用这些方法,也可以选择多行和多列,进行数据的处理和操作。