📅  最后修改于: 2023-12-03 15:04:14.798000             🧑  作者: Mango
数据框是Python中用于存储和操作表格数据的一种数据结构。在进行数据分析和机器学习任务时,我们通常需要从数据框中选择我们需要的列,以便进行后续分析和建模。
要选择单个列,你只需要在数据框中使用列名作为索引,如下所示:
import pandas as pd
# 创建数据框
df = pd.DataFrame({'姓名':['张三','李四','王五'],'年龄':[20,25,30],'性别':['男','女','男']})
# 选择单个列
ages = df['年龄']
print(ages)
输出:
0 20
1 25
2 30
Name: 年龄, dtype: int64
在选择单个列时,返回的是一个Series对象而不是数据框。如果你需要以数据框的形式选择列,则需要将列名放到一个列表中,如下所示:
import pandas as pd
# 创建数据框
df = pd.DataFrame({'姓名':['张三','李四','王五'],'年龄':[20,25,30],'性别':['男','女','男']})
# 以数据框的形式选择列
data = df[['姓名']]
print(data)
输出:
姓名
0 张三
1 李四
2 王五
要选择多个列,只需在数据框中使用列名列表作为索引,如下所示:
import pandas as pd
# 创建数据框
df = pd.DataFrame({'姓名':['张三','李四','王五'],'年龄':[20,25,30],'性别':['男','女','男']})
# 选择多个列
data = df[['姓名','年龄']]
print(data)
输出:
姓名 年龄
0 张三 20
1 李四 25
2 王五 30
在选择多个列时,返回的仍然是一个数据框。如果你只需要选择单个列,则需要将列名放在一个列表中,如下所示:
import pandas as pd
# 创建数据框
df = pd.DataFrame({'姓名':['张三','李四','王五'],'年龄':[20,25,30],'性别':['男','女','男']})
# 选择单个列
age = df[['年龄']]
print(age)
输出:
年龄
0 20
1 25
2 30
本文介绍了如何使用Python从数据框中选择列名。在选择列时,请注意返回结果的数据类型以及如何选择单个列或多个列。简单易懂!