📅  最后修改于: 2023-12-03 15:07:45.272000             🧑  作者: Mango
在使用 pandas 处理数据时,我们经常需要从 DataFrame 中选取部分列进行操作。pandas 提供了多种选取列的方式,其中一种是传递列名列表。
传递单一列表时,可以使用 DataFrame 的 []
操作符和列名列表来选取列。例如:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
cols = ['A', 'C']
subset_df = df[cols]
print(subset_df)
输出:
A C
0 1 7
1 2 8
2 3 9
传递多个列表时,可以使用 DataFrame 的 loc
或 iloc
方法和列名列表来选取列。例如:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9], 'D': [10, 11, 12]})
cols1 = ['A', 'C']
cols2 = ['B', 'D']
subset_df = df.loc[:, cols1 + cols2]
print(subset_df)
输出:
A C B D
0 1 7 4 10
1 2 8 5 11
2 3 9 6 12
注意,在使用 loc
或 iloc
方法时,应使用 :
表示选取所有行。此外,需要将列名列表合并为一个列表,再进行选取。
通过传递列名列表,可以方便地选取 DataFrame 的部分列进行操作。需要注意的是,在使用 loc
或 iloc
方法时,应使用 :
表示选取所有行,并将列名列表合并为一个列表。