📅  最后修改于: 2023-12-03 15:03:30.474000             🧑  作者: Mango
在 Pandas 中,我们可以使用 dtype
属性检查数据帧或系列中的列的数据类型。当我们在处理数据时,最好检查每个列的数据类型以确保数据类型正确,并在需要时转换数据类型。
import pandas as pd
# 创建一个数据帧
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Age': [25, 32, 18, 47],
'City': ['New York', 'London', 'Paris', 'Tokyo'],
'Salary': [50000, 70000, 30000, 90000]}
df = pd.DataFrame(data)
# 检查数据帧中的每一列的数据类型
for column in df.columns:
print(f"{column} 的数据类型是 {df[column].dtype}")
上述代码将输出以下结果:
Name 的数据类型是 object
Age 的数据类型是 int64
City 的数据类型是 object
Salary 的数据类型是 int64
我们可以看到,Name
和 City
列被检测为对象类型,即字符串类型。
在数据预处理中,我们可能需要将一些列从对象类型转换为其他类型,例如日期时间、数字等。这可以通过 Pandas 中的 astype()
方法实现。
# 将 "Age" 列从 int64 类型转换为 float64 类型
df["Age"] = df["Age"].astype("float64")
print(df.dtypes)
上述代码将输出以下结果:
Name object
Age float64
City object
Salary int64
dtype: object
现在,我们可以看到 Age
列的数据类型已经从 int64
类型转换为 float64
类型。
总之,Pandas 的 dtype()
属性可以检查数据帧或系列中的列的数据类型,并且可以使用 astype()
方法更改列的数据类型。