如何检查 Pandas DataFrame 中的数据类型?
Pandas DataFrame 是一种可变大小和异构表格数据的二维数据结构。 Python中有不同的内置数据类型可用。用于检查数据类型的两种方法是pandas.DataFrame.dtypes和pandas.DataFrame.select_dtypes。
考虑一个购物商店的数据集,其中包含有关客户序列号、客户姓名、所购买商品的产品 ID、产品成本和购买日期的数据。
Python3
#importing pandas as pd
import pandas as pd
# Create the dataframe
df = pd.DataFrame({
'Cust_No': [1,2,3],
'Cust_Name': ['Alex', 'Bob', 'Sophie'],
'Product_id': [12458,48484,11311],
'Product_cost': [65.25, 25.95, 100.99],
'Purchase_Date': [pd.Timestamp('20180917'),
pd.Timestamp('20190910'),
pd.Timestamp('20200610')]
})
# Print the dataframe
df
Python3
# Print a list datatypes of all columns
df.dtypes
Python3
# print datatype of particular column
df.Cust_No.dtypes
Python3
# Returns Two column of int64
df.select_dtypes(include = 'int64')
Python3
# Returns columns excluding int64
df.select_dtypes(exclude = 'int64')
Python3
# Print an empty list as there is
# no column of bool type
df.select_dtypes(include = "bool")
输出:
方法一:使用 pandas.DataFrame.dtypes
对于用户从数据集中检查特定 Dataset 或特定列的 DataType 可以使用此方法。此方法返回每列的数据类型列表,或者也只返回特定列的数据类型
示例 1:
Python3
# Print a list datatypes of all columns
df.dtypes
输出:
示例 2:
Python3
# print datatype of particular column
df.Cust_No.dtypes
输出:
dtype('int64')
方法二:使用 pandas.DataFrame.select_dtypes
与检查数据类型不同,用户可以选择执行检查以获取特定数据类型的数据(如果存在),否则返回空数据集。此方法根据列 dtypes 返回 DataFrame 列的子集。
示例 1:
Python3
# Returns Two column of int64
df.select_dtypes(include = 'int64')
输出:
示例 2:
Python3
# Returns columns excluding int64
df.select_dtypes(exclude = 'int64')
输出 :
示例 3:
Python3
# Print an empty list as there is
# no column of bool type
df.select_dtypes(include = "bool")
输出 :