📅  最后修改于: 2023-12-03 15:04:04.691000             🧑  作者: Mango
在数据分析和机器学习中,我们常常需要从数据框或数据集中选择或提取数字列。 Python Pandas 数据框为我们提供了一个很好的工具来完成这个任务。
要从数据框中选择数字列,我们可以使用 select_dtypes
函数并指定 include='number'
参数。这将选择所有数字列,并返回一个新的数据框。
# 导入pandas库
import pandas as pd
# 创建样本数据框
data = {'Name': ['Tom', 'Kate', 'John', 'Emily'],
'Age': [28, 25, 26, 31],
'City': ['New York', 'Paris', 'Berlin', 'London'],
'Salary': [5000, 4500, 4000, 6000]}
df = pd.DataFrame(data)
# 获取数字列
num_col = df.select_dtypes(include='number')
print(num_col)
输出:
Age Salary
0 28 5000
1 25 4500
2 26 4000
3 31 6000
在上面的代码块中,我们首先导入 Pandas 库,并创建了一个名为 data
的字典,其中包含了一个名为 df
的数据框。我们然后使用 select_dtypes
函数并指定 include='number'
参数来获取所有数字列。最后,我们打印结果。
如果我们只想选择特定类型的数字列,如整数或浮点数列,我们可以使用 select_dtypes
函数并指定 include='number'
或 include='integer'
或 include='float'
参数。我们还可以使用 exclude
参数来排除不需要的列。
# 获取整数列
int_col = df.select_dtypes(include='integer')
print(int_col)
# 获取浮点数列
float_col = df.select_dtypes(include='float')
print(float_col)
输出:
Age
0 28
1 25
2 26
3 31
Salary
0 5000
1 4500
2 4000
3 6000
在上面的代码块中,我们分别使用 include='integer'
和 include='float'
参数获取整数列和浮点数列。我们还可以使用 exclude
参数来排除不需要的列,例如 exclude='Age'
就会排除 Age
列。
在 Python Pandas 数据框中,我们可以使用 select_dtypes
函数来选择或提取数字列。我们还可以使用 include
和 exclude
参数来选择特定类型的数字列或排除不需要的列。这些函数可以帮助我们更方便地进行数据清理和特征选择。