📜  如何仅从具有特定数据类型的 datframe 中获取列 - Python (1)

📅  最后修改于: 2023-12-03 15:08:13.410000             🧑  作者: Mango

如何仅从具有特定数据类型的 dataframe 中获取列 - Python

在pandas中,我们可以使用df.select_dtypes()方法仅从具有特定数据类型的Dataframe中选择列。该方法在实际工作中非常有用,因为有时我们只需要处理某些数据类型的列。

下面是一个示例:

import pandas as pd

# 创建一个数据帧
df = pd.DataFrame({
   '名字': ['Alice', 'Bob', 'Charlie'],
   '年龄': [25, 30, 35],
   '信用积分': [600, 700, 800],
   '婚姻状态': ['已婚', '未婚', '未婚']
})

# 输出数据帧
print(df)

# 仅选择数值列
numeric_cols = df.select_dtypes(include=['int64'])
print(numeric_cols)

输出:

        名字  年龄  信用积分 婚姻状态
0    Alice  25    600    已婚
1      Bob  30    700    未婚
2  Charlie  35    800    未婚

   年龄  信用积分
0  25    600
1  30    700
2  35    800

在上面的例子中,我们首先创建了一个数据框,然后使用select_dtypes方法仅选择了包含int64数据类型的列,并将其分配给变量numeric_cols。

我们还可以使用exclude属性来排除某些数据类型的列。

import pandas as pd

# 创建一个数据帧
df = pd.DataFrame({
   '名字': ['Alice', 'Bob', 'Charlie'],
   '年龄': [25, 30, 35],
   '信用积分': [600, 700, 800],
   '婚姻状态': ['已婚', '未婚', '未婚']
})

# 输出数据帧
print(df)

# 排除非数值列
numeric_cols = df.select_dtypes(exclude=['object'])
print(numeric_cols)

输出:

        名字  年龄  信用积分 婚姻状态
0    Alice  25    600    已婚
1      Bob  30    700    未婚
2  Charlie  35    800    未婚

   年龄  信用积分
0  25    600
1  30    700
2  35    800

以上就是从具有特定数据类型的 Dataframe 中获取列的操作。这是一种非常有用的技术,可以帮助我们更好地处理数据集。