📅  最后修改于: 2023-12-03 15:07:45.260000             🧑  作者: Mango
在 Pandas Dataframe 中,我们经常需要选择具有特定数据类型的列进行操作。例如,我们可能只想要操作数值型数据,或者字母型数据。通过 Pandas 提供的数据类型选择方法,我们可以轻松地获取到指定数据类型的列。
要选择数值型数据,我们可以使用 select_dtypes
方法,指定 include
参数为数值型数据类型。例如,我们可以选择 int64
或 float64
数据类型:
numeric_cols = df.select_dtypes(include=['int64', 'float64']).columns
numeric_df = df[numeric_cols]
上面的代码将会选择所有具有 int64
或 float64
数据类型的列,并创建一个新的 DataFrame。
要选择字母型数据,我们可以使用 select_dtypes
方法,指定 include
参数为字符串数据类型。例如,我们可以选择 object
数据类型:
string_cols = df.select_dtypes(include=['object']).columns
string_df = df[string_cols]
上面的代码将会选择所有具有 object
数据类型的列,并创建一个新的 DataFrame。
要选择布尔型数据,我们可以使用 select_dtypes
方法,指定 include
参数为布尔型数据类型。例如,我们可以选择 bool
数据类型:
bool_cols = df.select_dtypes(include=['bool']).columns
bool_df = df[bool_cols]
上面的代码将会选择所有具有 bool
数据类型的列,并创建一个新的 DataFrame。
要选择日期型数据,我们可以使用 select_dtypes
方法,指定 include
参数为日期型数据类型。例如,我们可以选择 datetime64
数据类型:
date_cols = df.select_dtypes(include=['datetime64']).columns
date_df = df[date_cols]
上面的代码将会选择具有 datetime64
数据类型的列,并创建一个新的 DataFrame。
通过 select_dtypes
方法,我们可以方便地选择具有特定数据类型的列,并创建一个新的 DataFrame。这样可以使数据处理更加高效和方便。