📜  python dataframe 获取数字列 - Python (1)

📅  最后修改于: 2023-12-03 15:04:04.691000             🧑  作者: Mango

Python DataFrame 获取数字列

在数据分析和机器学习中,我们常常需要从数据框或数据集中选择或提取数字列。 Python Pandas 数据框为我们提供了一个很好的工具来完成这个任务。

获取数字列

要从数据框中选择数字列,我们可以使用 select_dtypes 函数并指定 include='number' 参数。这将选择所有数字列,并返回一个新的数据框。

# 导入pandas库
import pandas as pd

# 创建样本数据框
data = {'Name': ['Tom', 'Kate', 'John', 'Emily'],
        'Age': [28, 25, 26, 31],
        'City': ['New York', 'Paris', 'Berlin', 'London'],
        'Salary': [5000, 4500, 4000, 6000]}
df = pd.DataFrame(data)

# 获取数字列
num_col = df.select_dtypes(include='number')
print(num_col)

输出:

   Age  Salary
0   28    5000
1   25    4500
2   26    4000
3   31    6000

在上面的代码块中,我们首先导入 Pandas 库,并创建了一个名为 data 的字典,其中包含了一个名为 df 的数据框。我们然后使用 select_dtypes 函数并指定 include='number' 参数来获取所有数字列。最后,我们打印结果。

获取特定类型的数字列

如果我们只想选择特定类型的数字列,如整数或浮点数列,我们可以使用 select_dtypes 函数并指定 include='number'include='integer'include='float' 参数。我们还可以使用 exclude 参数来排除不需要的列。

# 获取整数列
int_col = df.select_dtypes(include='integer')
print(int_col)

# 获取浮点数列
float_col = df.select_dtypes(include='float')
print(float_col)

输出:

   Age
0   28
1   25
2   26
3   31

   Salary
0    5000
1    4500
2    4000
3    6000

在上面的代码块中,我们分别使用 include='integer'include='float' 参数获取整数列和浮点数列。我们还可以使用 exclude 参数来排除不需要的列,例如 exclude='Age' 就会排除 Age 列。

结论

在 Python Pandas 数据框中,我们可以使用 select_dtypes 函数来选择或提取数字列。我们还可以使用 includeexclude 参数来选择特定类型的数字列或排除不需要的列。这些函数可以帮助我们更方便地进行数据清理和特征选择。