📅  最后修改于: 2023-12-03 15:11:38.924000             🧑  作者: Mango
在机器学习领域,绘制真实值与实际值(Actual vs Predicted)图表是评估线性回归模型性能的一种广泛使用的技术。这种图表能够显示模型预测的结果与实际观测值之间的差异。
绘制真实值与实际值有以下优点:
明确直观:通过图表能够非常直观地了解模型的预测效果,直接比较模型预测值和真实值的差异。
客观准确:图表能够客观呈现模型预测值和真实值的偏差分布情况,用于评价模型预测的准确性。
可以找出异常值:比较真实值和预测值之间的差异,能够找出一些预测值与真实值之差较大的异常点,用于进一步排除模型的缺陷。
下面我们通过Python代码实现绘制真实值与实际值的过程。
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.linear_model import LinearRegression
# 导入数据
data = pd.read_csv('data.csv')
# 划分自变量和因变量
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
# 构建线性回归模型
model = LinearRegression()
model.fit(X, y)
# 预测结果
y_pred = model.predict(X)
# 绘制真实值与实际值图表
plt.scatter(y, y_pred)
plt.xlabel('Actual')
plt.ylabel('Predicted')
plt.title('Actual vs Predicted')
plt.show()
我们首先导入需要使用的库,然后通过pd.read_csv()
函数导入需要使用的数据集。然后,我们将数据划分为自变量和因变量,并构建线性回归模型。接着,我们使用model.predict()
函数得到预测结果,并使用plt.scatter()
函数绘制出真实值与实际值之间的分布情况,并加上适当的标注。
通过上述代码,我们可以绘制出真实值与实际值之间的图表,用于评价机器学习模型预测的性能。通过这种图表,我们可以在直观和客观的情况下检查模型的预测准确性,并可以找出一些异常点,用于进一步优化机器学习模型的性能。