📅  最后修改于: 2023-12-03 15:05:05.353000             🧑  作者: Mango
随机森林是一种集成学习方法,它由多个决策树组成,并使用随机抽样来增加模型的多样性。在 Scikit-learn 中,我们可以使用 sklearn.ensemble.RandomForestClassifier
类来创建随机森林模型。
在使用 Scikit-learn 之前,我们需要先安装它。可以使用以下命令来在 Python 环境中安装 Scikit-learn:
pip install -U scikit-learn
在开始创建随机森林模型之前,我们需要导入必要的模块和数据集。以下是导入模块和使用 Scikit-learn 中的 Iris 数据集的示例代码:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
# 导入数据集并拆分为训练集和测试集
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=42)
使用以下代码创建随机森林模型:
# 创建随机森林模型
rfc = RandomForestClassifier(n_estimators=100, random_state=42)
# 在训练集上拟合模型
rfc.fit(X_train, y_train)
在上面的例子中,我们创建了一个有 100 个决策树的随机森林模型,并使用训练集对其进行了拟合。
使用以下代码来预测测试集中的数据并计算预测准确率:
# 在测试集上进行预测并计算准确率
y_pred = rfc.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy}")
在上面的例子中,我们使用测试集中的数据进行了预测,并计算了模型的准确率。
随机森林是一种强大的集成方法,它可以用于分类和回归问题。在 Scikit-learn 中,我们可以使用 sklearn.ensemble.RandomForestClassifier
类来创建随机森林模型,并使用它来进行预测。