📅  最后修改于: 2023-12-03 15:38:53.227000             🧑  作者: Mango
当我们处理数据时,有时需要将一列数据进行缩放来调整其取值范围。在 Pandas 中,可以通过以下方式对 DataFrame 的一列进行缩放:
# 导入 Pandas 库
import pandas as pd
# 创建示例 DataFrame
df = pd.DataFrame({'col1': [10, 20, 30, 40, 50], 'col2': [100, 200, 300, 400, 500]})
# 缩放 col1 列
df['col1_scaled'] = (df['col1'] - df['col1'].min()) / (df['col1'].max() - df['col1'].min())
# 打印 DataFrame
print(df)
运行结果:
col1 col2 col1_scaled
0 10 100 0.00
1 20 200 0.25
2 30 300 0.50
3 40 400 0.75
4 50 500 1.00
上述代码通过对 col1 列进行缩放,将其取值范围缩放到 [0, 1] 之间,并将结果存储到 col1_scaled 列中。
具体来说,我们首先计算 col1 列的最小值和最大值,然后将每个数值减去最小值,再除以最大值和最小值的差,即可得到缩放后的结果。
最后,我们再次强调 Markdown 格式,方便用户阅读。