📅  最后修改于: 2023-12-03 15:34:26.223000             🧑  作者: Mango
多元线性回归是一种在统计学中常用的方法,用于分析多个自变量和一个因变量之间的关系。在Python中,我们可以使用scikit-learn库来实现多元线性回归。
在进行多元线性回归前,我们需要准备一个数据集。下面的代码将使用scikit-learn库中的make_regression方法生成一个随机数据集:
from sklearn.datasets import make_regression
X, y = make_regression(n_samples=100, n_features=3, noise=0.1, random_state=42)
这里我们生成了一个包含100个样本和3个特征的数据集。其中,noise参数指定了加入噪声数据的标准差。
有了数据集后,我们就可以开始训练模型了。在scikit-learn中,我们可以使用LinearRegression类来实现多元线性回归。下面是实例化这个类并训练模型的代码:
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X, y)
训练好模型后,我们就可以使用它来对新的数据进行预测了。下面是使用模型对新数据进行预测的代码:
import numpy as np
new_data = np.array([[1.5, 2.0, 3.5]])
prediction = model.predict(new_data)
这里我们使用了numpy库来生成一个包含新数据的数组。使用模型的predict方法进行预测后,我们得到了一个预测值。
在Python中,使用scikit-learn库实现多元线性回归非常简单。只需要准备好数据集、实例化LinearRegression类并使用fit方法训练模型,就可以使用predict方法对新数据进行预测了。