监督学习:监督学习是模型的学习,其中具有输入变量(例如x)和输出变量(例如Y)以及将输入映射到输出的算法。
也就是说, Y = f(X)
为什么要监督学习?
基本目标是很好地近似映射函数(如上所述),以便在存在新的输入数据(x)时可以预测相应的输出变量。
之所以称为监督学习,是因为可以将学习过程(来自训练数据集)视为指导整个学习过程的老师。因此,“学习算法”对训练数据进行迭代预测,并由“教师”进行校正,并且当算法达到可接受的性能水平(或所需的准确性)时,学习将停止。
监督学习的例子
假设有一个装满一些新鲜水果的篮子,任务是将同一类型的水果放在一个地方。
另外,假设水果是苹果,香蕉,樱桃,葡萄。
假设人们已经从他们以前的工作(或经验)中得知,篮子中每种水果的形状都如此,那么他们很容易将同一类型的水果放在一个地方。
在这里,以前的工作被称为数据挖掘术语中的训练数据。因此,它从训练数据中学到东西。这是因为它具有一个响应变量,该变量表示y,如果某些水果具有某某特性,那么它就是葡萄,并且每种水果都类似。
这种类型的信息是从用于训练模型的数据中解密出来的。
这种学习称为监督学习。
此类问题在经典分类任务下列出。无监督学习:无监督学习是仅输入数据(例如X)存在而没有相应输出变量的地方。
为什么要进行无监督学习?
无监督学习的主要目的是对数据中的分布进行建模,以了解有关数据的更多信息。
之所以这样称呼,是因为没有正确的答案,也没有这样的老师(不同于监督学习)。算法由他们自己设计,以发现和呈现数据中有趣的结构。
无监督学习的例子
再次,假设有一个篮子,里面装有一些新鲜水果。任务是将同一类型的水果放在一个地方。
这次没有任何关于这些水果的信息,这是第一次看到或发现这些水果
因此,如何在没有任何类似知识的情况下将相似的水果分组。
首先,选择特定水果的任何物理特性。假设颜色。
然后根据颜色排列水果。组将如下所示:
红颜色组:苹果和樱桃水果。
绿颜色组:香蕉和葡萄。
所以现在,再以另一个物理字符说, size ,所以现在这些组将是这样的。
红色和大尺寸:苹果。
红色和小尺寸:樱桃果实。
绿色和大尺寸:香蕉。
绿色和小尺寸:葡萄。
工作完成了!
在这里,无需事先知道或学习任何东西。这意味着,没有火车数据,也没有响应变量。这种学习称为无监督学习。
黑白差异有监督学习和无监督学习:
SUPERVISED LEARNING | UNSUPERVISED LEARNING | |
---|---|---|
Input Data | Uses Known and Labeled Data as input | Uses Unknown Data as input |
Computational Complexity | Very Complex | Less Computational Complexity |
Real Time | Uses off-line analysis | Uses Real Time Analysis of Data |
Number of Classes | Number of Classes are known | Number of Classes are not known |
Accuracy of Results | Accurate and Reliable Results | Moderate Accurate and Reliable Results |