📜  Scikit 学习随机森林分类器 - Python (1)

📅  最后修改于: 2023-12-03 15:05:05.353000             🧑  作者: Mango

Scikit 学习随机森林分类器 - Python

随机森林是一种集成学习方法,它由多个决策树组成,并使用随机抽样来增加模型的多样性。在 Scikit-learn 中,我们可以使用 sklearn.ensemble.RandomForestClassifier 类来创建随机森林模型。

安装 Scikit-learn

在使用 Scikit-learn 之前,我们需要先安装它。可以使用以下命令来在 Python 环境中安装 Scikit-learn:

pip install -U scikit-learn
导入模块和数据集

在开始创建随机森林模型之前,我们需要导入必要的模块和数据集。以下是导入模块和使用 Scikit-learn 中的 Iris 数据集的示例代码:

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# 导入数据集并拆分为训练集和测试集
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=42)
创建随机森林模型

使用以下代码创建随机森林模型:

# 创建随机森林模型
rfc = RandomForestClassifier(n_estimators=100, random_state=42)

# 在训练集上拟合模型
rfc.fit(X_train, y_train)

在上面的例子中,我们创建了一个有 100 个决策树的随机森林模型,并使用训练集对其进行了拟合。

使用随机森林模型进行预测

使用以下代码来预测测试集中的数据并计算预测准确率:

# 在测试集上进行预测并计算准确率
y_pred = rfc.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")

在上面的例子中,我们使用测试集中的数据进行了预测,并计算了模型的准确率。

总结

随机森林是一种强大的集成方法,它可以用于分类和回归问题。在 Scikit-learn 中,我们可以使用 sklearn.ensemble.RandomForestClassifier 类来创建随机森林模型,并使用它来进行预测。