📜  python 回归线 - Python (1)

📅  最后修改于: 2023-12-03 15:04:15.586000             🧑  作者: Mango

Python 回归线

回归线是统计学中一种广泛应用的线性回归方法,可用于建立输入变量和输出变量之间的线性关系模型。在 Python 中,可以使用许多库来实现回归线模型,包括 NumPy、Pandas 和 Scikit-learn 等。

NumPy

NumPy 是用于数值计算的常用 Python 库之一。它提供了一个名为 polyfit() 的函数,可用于拟合回归线。

import numpy as np
import matplotlib.pyplot as plt

# 生成数据
x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 4, 5, 4, 5])

# 计算回归线
p = np.polyfit(x, y, 1)
line = p[0] * x + p[1]

# 绘制数据和回归线
plt.scatter(x, y)
plt.plot(x, line)
plt.show()

numpy_regression_line.png

Pandas

Pandas 是一个用于数据处理和分析的 Python 库。在 Pandas 中,可以使用 DataFrame 对象来存储和操作数据,并使用 plot() 方法可视化回归线。

import pandas as pd
import matplotlib.pyplot as plt

# 创建数据框
df = pd.DataFrame({'x': [1, 2, 3, 4, 5], 'y': [2, 4, 5, 4, 5]})

# 计算回归线
fit = np.polyfit(df['x'], df['y'], 1)
df['line'] = fit[0] * df['x'] + fit[1]

# 绘制数据和回归线
df.plot(kind='scatter', x='x', y='y')
plt.plot(df['x'], df['line'])
plt.show()

pandas_regression_line.png

Scikit-learn

Scikit-learn 是一个用于机器学习的 Python 库。它提供了一个名为 LinearRegression 的类,可用于拟合回归线模型。

from sklearn.linear_model import LinearRegression
import numpy as np
import matplotlib.pyplot as plt

# 生成数据
x = np.array([1, 2, 3, 4, 5]).reshape((-1, 1))
y = np.array([2, 4, 5, 4, 5])

# 训练模型
model = LinearRegression().fit(x, y)

# 计算回归线
xfit = np.linspace(1, 5, 100).reshape((-1, 1))
yfit = model.predict(xfit)

# 绘制数据和回归线
plt.scatter(x, y)
plt.plot(xfit, yfit)
plt.show()

scikit_learn_regression_line.png

以上就是在 Python 中实现回归线模型的三种不同方法,包括使用 NumPy、Pandas 和 Scikit-learn 库。无论您要从事何种数据分析任务,这些库都是必不可少的工具。