无监督学习:
这是一种学习,我们在训练时不给模型指定目标,即训练模型仅具有输入参数值。该模型本身必须找到可以学习的方式。图A中的数据集是购物中心数据,其中包含订阅其客户的客户的信息。订阅后,他们将获得一张会员卡,因此,商场将获得有关客户及其每次购买的完整信息。现在,使用这些数据和无监督的学习技术,购物中心可以轻松地根据我们输入的参数对客户进行分组。
我们提供的培训数据是–
- 非结构化数据:可能包含嘈杂(无意义)的数据,缺失的值或未知的数据
- 未标记的数据:数据仅包含输入参数的值,没有目标值(输出)。与“监督”方法中标记为“一个”的标签相比,它很容易收集。
无监督学习的类型:
- 聚类:我们的机器模型发现,该技术广泛应用于基于不同模式的数据分组。例如,在上图中,我们没有得到输出参数值,因此该技术将用于根据数据提供的输入参数对客户端进行分组。
- 关联:该技术是一种基于规则的ML技术,可发现大型数据集的参数之间的某些非常有用的关系。例如,商店使用基于该技术的算法来基于顾客行为找出一种产品的销售与另一种销售之间的关系。一旦训练有素,这些模型就可以用于通过计划不同的报价来增加其销售量。
一些算法:
半监督学习:
顾名思义,它的工作介于有监督技术和无监督技术之间。当我们处理带有一点标记的数据而其余大部分未标记的数据时,我们将使用这些技术。我们可以使用非监督技术来预测标签,然后将这些标签提供给监督技术。此技术最适用于通常未标记所有图像的图像数据集的情况。
强化学习:
在这种技术中,模型使用奖励反馈来学习行为或模式,从而不断提高其性能。这些算法特定于特定问题,例如Google自驾车,AlphaGo,其中机器人与人类甚至自己竞争,以使Go Game的性能越来越好。每次我们输入数据时,他们都会学习并将数据添加到它的知识即训练数据中。因此,它学得越多,就越能得到训练并因此经验丰富。
- 代理观察输入。
- 代理通过做出一些决定来执行操作。
- 在执行之后,代理会获得奖励并相应地得到加强,并且模型会将状态-动作信息对存储起来。
一些算法:
- 时差(TD)
- Q学习
- 深度对抗网络
希望你喜欢这篇文章