📜  python中的多元线性回归(1)

📅  最后修改于: 2023-12-03 15:34:26.223000             🧑  作者: Mango

Python中的多元线性回归

多元线性回归是一种在统计学中常用的方法,用于分析多个自变量和一个因变量之间的关系。在Python中,我们可以使用scikit-learn库来实现多元线性回归。

数据集的准备

在进行多元线性回归前,我们需要准备一个数据集。下面的代码将使用scikit-learn库中的make_regression方法生成一个随机数据集:

from sklearn.datasets import make_regression

X, y = make_regression(n_samples=100, n_features=3, noise=0.1, random_state=42)

这里我们生成了一个包含100个样本和3个特征的数据集。其中,noise参数指定了加入噪声数据的标准差。

模型的训练

有了数据集后,我们就可以开始训练模型了。在scikit-learn中,我们可以使用LinearRegression类来实现多元线性回归。下面是实例化这个类并训练模型的代码:

from sklearn.linear_model import LinearRegression

model = LinearRegression()
model.fit(X, y)
模型的预测

训练好模型后,我们就可以使用它来对新的数据进行预测了。下面是使用模型对新数据进行预测的代码:

import numpy as np

new_data = np.array([[1.5, 2.0, 3.5]])
prediction = model.predict(new_data)

这里我们使用了numpy库来生成一个包含新数据的数组。使用模型的predict方法进行预测后,我们得到了一个预测值。

总结

在Python中,使用scikit-learn库实现多元线性回归非常简单。只需要准备好数据集、实例化LinearRegression类并使用fit方法训练模型,就可以使用predict方法对新数据进行预测了。