📅  最后修改于: 2023-12-03 15:24:18.382000             🧑  作者: Mango
在 Pandas DataFrame 中,字符串类型的数据有时需要转换为浮点数类型,这可以使用 astype() 方法实现。astype() 方法可以将一列数据类型转换为指定数据类型。下面是实现的代码片段:
import pandas as pd
# 创建一个 DataFrame 对象
df = pd.DataFrame({'A': ['1.23', '2.34', '3.45', '4.56', '5.67']})
# 将字符串列转换为浮点型
df['A'] = df['A'].astype(float)
# 打印结果
print(df)
上述代码中的 astype(float) 语句将字符串列 A 转换为浮点数类型。astype() 方法内也可以传入其他数据类型,如 int、bool 等。如果转换后的字符串不是纯数字格式(如包含其他字符或空格),则会引发 ValueError 异常。
如果需要批量转换多列数据类型,可以使用 apply() 或 applymap() 方法实现。apply() 方法适用于 DataFrame 中的一整行或一整列,applymap() 方法适用于 DataFrame 中的每个单元格。下面是实现的代码片段:
import pandas as pd
# 创建一个 DataFrame 对象
df = pd.DataFrame({'A': ['1.23', '2.34', '3.45', '4.56', '5.67'], 'B': ['1.1', '2.2', '3.3', '4.4', '5.5'], 'C': ['1.0', '2.0', '3.0', '4.0', '5.0']})
# 批量转换多列数据类型
df = df.apply(lambda x: x.astype(float))
# 打印结果
print(df)
上述代码中的 apply() 方法将所有列的数据类型转换为浮点数类型,lambda 函数会对每一列进行单独处理。
除了上面提到的方法外,还可以使用 pd.to_numeric() 方法将字符串转换为数字类型。pd.to_numeric() 方法也支持缺失值的处理(如将字符串 'NaN' 转换为 np.nan),并且可以处理整个 DataFrame 或 Series 对象。下面是实现的代码片段:
import pandas as pd
import numpy as np
# 创建一个 DataFrame 对象
df = pd.DataFrame({'A': ['1.23', '2.34', '3.45', '4.56', '5.67'], 'B': ['1.1', '2.2', np.nan, '4.4', '5.5'], 'C': ['1.0', '2.0', '3.0', np.nan, '5.0']})
# 将字符串列转换为浮点型
df = df.apply(pd.to_numeric, errors='coerce')
# 打印结果
print(df)
上述代码中的 pd.to_numeric() 方法将所有列的数据类型转换为数字类型,并将无法转换的数据类型转换为缺失值(np.nan)。errors='coerce' 参数表示要将无法转换的数据类型转换为缺失值。