📅  最后修改于: 2023-12-03 15:08:02.695000             🧑  作者: Mango
数据框是Python中处理和分析数据的基本工具之一,而选择数据框中的特定列则是常见的操作之一,本文将介绍在Python中如何选择数据框的列。
在Python中,使用方括号[]可以选择数据框的列。在方括号中输入列名,即可选择相应的列。示例代码如下:
import pandas as pd
# 创建数据框
data = {'name': ['Alice', 'Bob', 'Cathy', 'David'],
'age': [25, 32, 18, 47],
'gender': ['F', 'M', 'F', 'M'],
'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen']}
df = pd.DataFrame(data)
# 选择单个列
name_col = df['name']
print(name_col)
# 选择多个列
name_and_age_cols = df[['name', 'age']]
print(name_and_age_cols)
此时输出结果为:
0 Alice
1 Bob
2 Cathy
3 David
Name: name, dtype: object
name age
0 Alice 25
1 Bob 32
2 Cathy 18
3 David 47
需要注意的是,如果选择多个列,则需要将列名放在一个列表中,如示例代码中的['name', 'age']
。
使用loc
也可以选择数据框的列。需要用到的方法为.loc[:, [列名1, 列名2, ...]]
,其中前一个冒号表示选择所有的行,后面跟着的列表则为选择的列名。示例代码如下:
import pandas as pd
# 创建数据框
data = {'name': ['Alice', 'Bob', 'Cathy', 'David'],
'age': [25, 32, 18, 47],
'gender': ['F', 'M', 'F', 'M'],
'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen']}
df = pd.DataFrame(data)
# 使用loc选择列
name_and_age_cols = df.loc[:, ['name', 'age']]
print(name_and_age_cols)
此时输出结果与方法1中的一致。
使用iloc
也可以选择数据框的列。需要用到的方法为.iloc[:, [列索引1, 列索引2, ...]]
,其中前一个冒号表示选择所有的行,后面跟着的列表则为选择的列的索引。示例代码如下:
import pandas as pd
# 创建数据框
data = {'name': ['Alice', 'Bob', 'Cathy', 'David'],
'age': [25, 32, 18, 47],
'gender': ['F', 'M', 'F', 'M'],
'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen']}
df = pd.DataFrame(data)
# 使用iloc选择列
name_and_age_cols = df.iloc[:, [0, 1]]
print(name_and_age_cols)
此时输出结果与方法1中的一致。
本文介绍了在Python中选择数据框的列的三种方法,分别是使用方括号、使用loc和使用iloc。需要注意的是,如果需要选择多个列,则应该将列名或列索引放在一个列表中。