📅  最后修改于: 2023-12-03 14:46:46             🧑  作者: Mango
逻辑回归是一种广泛使用的机器学习算法,适用于二元分类问题。在Python中,使用Scikit-learn库中的LogisticRegression函数来实现逻辑回归。
准备数据时,需要将目标变量映射到0和1的二元值。可以使用pandas库载入数据并进行预处理。
import pandas as pd
data = pd.read_csv('data.csv')
data['Target'] = data['Target'].map({'No': 0, 'Yes': 1})
为了评估模型的性能,需要将数据分成训练集和测试集。可以使用Scikit-learn库中的train_test_split函数实现。
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
使用LogisticRegression函数进行模型训练。
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X_train, y_train)
使用训练集和测试集数据对模型进行评估。
from sklearn.metrics import accuracy_score
y_pred_train = model.predict(X_train)
y_pred_test = model.predict(X_test)
print('Train accuracy:', accuracy_score(y_train, y_pred_train))
print('Test accuracy:', accuracy_score(y_test, y_pred_test))
可以使用模型对新数据进行预测。
new_data = [[25, 0, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 1]]
new_data_pred = model.predict(new_data)
print('New data prediction:', new_data_pred[0])
通过以上步骤,可以完成逻辑回归模型的训练和预测,在实际问题中得到应用。