📜  标准缩放器与最小最大缩放器 - Python (1)

📅  最后修改于: 2023-12-03 15:10:48.250000             🧑  作者: Mango

标准缩放器与最小最大缩放器 - Python

在数据处理中,经常需要对数据进行标准化或最小最大缩放。Python提供了方便的库来实现这些缩放技术。本文将介绍如何使用Python中的StandardScalerMinMaxScaler来进行标准化和最小最大缩放。

StandardScaler

StandardScaler是一种标准化的技术,用于将数据缩放到具有零均值和单位方差的标准正态分布中。这种标准化技术是处理数据中心化和规范化的一种方法,可以使得不同特征的数据都具有相同的尺度。

from sklearn.preprocessing import StandardScaler

# 创建 StandardScaler 对象
scaler = StandardScaler()

# 将数据集 X 缩放到标准正态分布中
X_scaled = scaler.fit_transform(X)
参数说明
  • fit_transform(X):将数据集 X 缩放到标准正态分布中。
示例
import numpy as np
from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler

# 加载 iris 数据集
iris = load_iris()
X = iris.data

# 创建 StandardScaler 对象
scaler = StandardScaler()

# 将数据集 X 缩放到标准正态分布中
X_scaled = scaler.fit_transform(X)

# 输出缩放后的数据集 X
print(X_scaled)

缩放后的输出:

[[-0.90068117  1.03205722 -1.3412724  -1.31297673]
 [-1.14301691 -0.1249576  -1.3412724  -1.31297673]
 [-1.38535265  0.33784833 -1.39813811 -1.31297673]
 ...
 [ 1.44883158 -0.1249576   1.03453922  1.44795564]
 [ 0.79566902  0.80065426  1.09799528  1.71090158]
 [ 0.4321654  -0.1249576   0.91450487  1.44795564]]
MinMaxScaler

MinMaxScaler是一种最小最大缩放技术,用于将数据缩放到指定的范围内。这种缩放技术可以将数据缩放到预先定义的最小值和最大值之间,通常是0到1之间。

from sklearn.preprocessing import MinMaxScaler

# 创建 MinMaxScaler 对象
scaler = MinMaxScaler()

# 将数据集 X 缩放到指定范围内
X_scaled = scaler.fit_transform(X)
参数说明
  • fit_transform(X):将数据集 X 缩放到指定范围中。
示例
import numpy as np
from sklearn.datasets import load_iris
from sklearn.preprocessing import MinMaxScaler

# 加载 iris 数据集
iris = load_iris()
X = iris.data

# 创建 MinMaxScaler 对象
scaler = MinMaxScaler()

# 将数据集 X 缩放到指定范围内
X_scaled = scaler.fit_transform(X)

# 输出缩放后的数据集 X
print(X_scaled)

缩放后的输出:

[[0.22222222 0.625      0.06779661 0.04166667]
 [0.16666667 0.41666667 0.06779661 0.04166667]
 [0.11111111 0.5        0.05084746 0.04166667]
 ...
 [0.61111111 0.41666667 0.71186441 0.91666667]
 [0.52777778 0.58333333 0.74576271 0.95833333]
 [0.44444444 0.41666667 0.69491525 0.91666667]]

以上就是 Python 中标准缩放器与最小最大缩放器的介绍。了解和掌握这两种缩放技术可以帮助我们更好地处理和分析数据。