📅  最后修改于: 2023-12-03 15:10:48.250000             🧑  作者: Mango
在数据处理中,经常需要对数据进行标准化或最小最大缩放。Python提供了方便的库来实现这些缩放技术。本文将介绍如何使用Python中的StandardScaler
和MinMaxScaler
来进行标准化和最小最大缩放。
StandardScaler
是一种标准化的技术,用于将数据缩放到具有零均值和单位方差的标准正态分布中。这种标准化技术是处理数据中心化和规范化的一种方法,可以使得不同特征的数据都具有相同的尺度。
from sklearn.preprocessing import StandardScaler
# 创建 StandardScaler 对象
scaler = StandardScaler()
# 将数据集 X 缩放到标准正态分布中
X_scaled = scaler.fit_transform(X)
fit_transform(X)
:将数据集 X
缩放到标准正态分布中。import numpy as np
from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler
# 加载 iris 数据集
iris = load_iris()
X = iris.data
# 创建 StandardScaler 对象
scaler = StandardScaler()
# 将数据集 X 缩放到标准正态分布中
X_scaled = scaler.fit_transform(X)
# 输出缩放后的数据集 X
print(X_scaled)
缩放后的输出:
[[-0.90068117 1.03205722 -1.3412724 -1.31297673]
[-1.14301691 -0.1249576 -1.3412724 -1.31297673]
[-1.38535265 0.33784833 -1.39813811 -1.31297673]
...
[ 1.44883158 -0.1249576 1.03453922 1.44795564]
[ 0.79566902 0.80065426 1.09799528 1.71090158]
[ 0.4321654 -0.1249576 0.91450487 1.44795564]]
MinMaxScaler
是一种最小最大缩放技术,用于将数据缩放到指定的范围内。这种缩放技术可以将数据缩放到预先定义的最小值和最大值之间,通常是0到1之间。
from sklearn.preprocessing import MinMaxScaler
# 创建 MinMaxScaler 对象
scaler = MinMaxScaler()
# 将数据集 X 缩放到指定范围内
X_scaled = scaler.fit_transform(X)
fit_transform(X)
:将数据集 X
缩放到指定范围中。import numpy as np
from sklearn.datasets import load_iris
from sklearn.preprocessing import MinMaxScaler
# 加载 iris 数据集
iris = load_iris()
X = iris.data
# 创建 MinMaxScaler 对象
scaler = MinMaxScaler()
# 将数据集 X 缩放到指定范围内
X_scaled = scaler.fit_transform(X)
# 输出缩放后的数据集 X
print(X_scaled)
缩放后的输出:
[[0.22222222 0.625 0.06779661 0.04166667]
[0.16666667 0.41666667 0.06779661 0.04166667]
[0.11111111 0.5 0.05084746 0.04166667]
...
[0.61111111 0.41666667 0.71186441 0.91666667]
[0.52777778 0.58333333 0.74576271 0.95833333]
[0.44444444 0.41666667 0.69491525 0.91666667]]
以上就是 Python 中标准缩放器与最小最大缩放器的介绍。了解和掌握这两种缩放技术可以帮助我们更好地处理和分析数据。