📜  监督学习和无监督学习(1)

📅  最后修改于: 2023-12-03 14:56:27.320000             🧑  作者: Mango

监督学习和无监督学习

在机器学习领域,监督学习和无监督学习是两种最基本的学习方式。它们各自有着不同的应用场景和算法。

监督学习

监督学习是指从已有的标记数据中学习,将未知的数据映射到已有的类别中。在这种情况下,我们需要的是训练样本数据和相应的正确标签。监督学习是一种分类和回归的方法,常见算法有决策树、朴素贝叶斯、支持向量机、神经网络等。

分类

分类是从一组已知类别的样本中学习一个分类函数或者分类模型,然后用这个模型对未知数据进行分类。常用的分类算法有:KNN、决策树、朴素贝叶斯、逻辑回归、支持向量机、神经网络等。

回归

回归是预测一个连续变量的值,可以用于预测股票价格、房屋价格等。 常用的回归算法有:线性回归、多项式回归、逻辑回归、支持向量机、神经网络等。

无监督学习

无监督学习是指从未经标记的数据中学习模式和结构。它没有外部的指导,无需事先知道数据的特征和分布。因此,它适合于处理大量的、复杂的、高维度的数据,例如图像和语音。一般来说,无监督学习有聚类、密度估计、降维等方面的应用,常见的算法有K-Means、EM算法、PCA等。

聚类

聚类是将相似的数据点分到同一个类别,将不同的数据点分到不同类别的过程。常用的聚类算法有:K-Means、层次聚类、DBSCAN、谱聚类等。

密度估计

密度估计是通过一些技术挖掘大数据的规律性以实现对复杂现象的分析。常用的密度估计算法有核密度估计、最近邻估计等。

降维

降维是将高维数据转化成低维数据,并且尽可能地保留数据的信息。常用的降维算法有PCA、LDA等。

总结

监督学习和无监督学习是机器学习中最基础、最重要的两个领域之一,两者都有着自己特定的应用场景和算法。在实际应用中,需要结合具体的问题来选择适合的学习方式和算法。