📅  最后修改于: 2023-12-03 15:08:13.410000             🧑  作者: Mango
在pandas中,我们可以使用df.select_dtypes()方法仅从具有特定数据类型的Dataframe中选择列。该方法在实际工作中非常有用,因为有时我们只需要处理某些数据类型的列。
下面是一个示例:
import pandas as pd
# 创建一个数据帧
df = pd.DataFrame({
'名字': ['Alice', 'Bob', 'Charlie'],
'年龄': [25, 30, 35],
'信用积分': [600, 700, 800],
'婚姻状态': ['已婚', '未婚', '未婚']
})
# 输出数据帧
print(df)
# 仅选择数值列
numeric_cols = df.select_dtypes(include=['int64'])
print(numeric_cols)
输出:
名字 年龄 信用积分 婚姻状态
0 Alice 25 600 已婚
1 Bob 30 700 未婚
2 Charlie 35 800 未婚
年龄 信用积分
0 25 600
1 30 700
2 35 800
在上面的例子中,我们首先创建了一个数据框,然后使用select_dtypes方法仅选择了包含int64数据类型的列,并将其分配给变量numeric_cols。
我们还可以使用exclude属性来排除某些数据类型的列。
import pandas as pd
# 创建一个数据帧
df = pd.DataFrame({
'名字': ['Alice', 'Bob', 'Charlie'],
'年龄': [25, 30, 35],
'信用积分': [600, 700, 800],
'婚姻状态': ['已婚', '未婚', '未婚']
})
# 输出数据帧
print(df)
# 排除非数值列
numeric_cols = df.select_dtypes(exclude=['object'])
print(numeric_cols)
输出:
名字 年龄 信用积分 婚姻状态
0 Alice 25 600 已婚
1 Bob 30 700 未婚
2 Charlie 35 800 未婚
年龄 信用积分
0 25 600
1 30 700
2 35 800
以上就是从具有特定数据类型的 Dataframe 中获取列的操作。这是一种非常有用的技术,可以帮助我们更好地处理数据集。