📅  最后修改于: 2023-12-03 14:47:18.293000             🧑  作者: Mango
Scikit-learn是一个Python机器学习库,提供了采用统一接口的各种监督和无监督学习算法,例如回归,分类和聚类,并支持数据预处理,模型选择和评估,以及数据可视化。
可以使用pip工具来安装Scikit-learn:
pip install -U scikit-learn
如果你想使用Scikit-learn示例数据集,还需要安装SciPy库:
pip install scipy
以下是Scikit-learn的基本用法:
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
# 加载示例数据集(鸢尾花数据集)
iris = datasets.load_iris()
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(
iris.data, iris.target, test_size=0.4, random_state=0)
# 使用KNN算法拟合模型
knn = KNeighborsClassifier()
knn.fit(X_train, y_train)
# 在测试集上评估模型
accuracy = knn.score(X_test, y_test)
print("Accuracy: %.2f%%" % (accuracy * 100.0))
这是Scikit-learn的简要介绍。Scikit-learn是Python中一个很方便易用的机器学习库,可以加速模型开发和预测部署。使用Scikit-learn,你可以很容易的完成从EDA到模型开发和评估所有的过程。