📜  毫升 |使用Python 的多元线性回归(1)

📅  最后修改于: 2023-12-03 15:11:01.768000             🧑  作者: Mango

使用Python的多元线性回归

多元线性回归是一种模型,用于预测一个因变量和两个或多个自变量之间的关系。在本文中,我们将使用Python的scikit-learn库来执行多元线性回归。

准备数据

首先,我们需要准备一些数据来训练我们的模型。我们将使用一个关于可乐罐大小和可乐价格的数据集,其中包括可乐罐的容量和价格。以下是一个示例数据集:

|容量(毫升)|价格(元)| |-----------|---------| |250 |2.50 | |330 |3.25 | |500 |4.50 | |750 |6.00 |

我们可以使用Python的pandas库来读取和处理数据集。以下是示例代码片段:

import pandas as pd

# 读取数据集
data = pd.read_csv('data.csv')

# 显示前几行数据
print(data.head())

在读取数据集之后,我们需要将数据集分成两个部分:一个用于训练模型,一个用于测试模型。我们可以使用Python的train_test_split函数来完成这个任务。以下是示例代码片段:

from sklearn.model_selection import train_test_split

# 将数据集分为2个部分
train_data, test_data = train_test_split(data, test_size=0.2, random_state=42)

# 显示训练集和测试集大小
print(f"Training set size: {len(train_data)}")
print(f"Testing set size: {len(test_data)}")
训练模型

在准备好训练集和测试集之后,我们就可以实例化多元线性模型并训练它了。以下是示例代码片段:

from sklearn.linear_model import LinearRegression

# 创建模型
model = LinearRegression()

# 训练模型
model.fit(train_data[['Capacity (ml)']], train_data['Price (yuan)'])
测试模型

使用测试集来测试我们的模型的准确性。以下是示例代码片段:

# 对测试集进行预测
predictions = model.predict(test_data[['Capacity (ml)']])

# 显示预测结果
for i, prediction in enumerate(predictions):
    print(f"Predicted price for can {i+1}: {prediction:.2f} yuan")

# 显示评分
score = model.score(test_data[['Capacity (ml)']], test_data['Price (yuan)'])
print(f"Model score: {score:.2f}")
结论

使用Python的scikit-learn库进行多元线性回归可以非常方便地对数据进行建模和预测。通过准备数据、训练模型、测试模型,我们可以了解数据集中变量之间的关系,并预测未来的结果。