📜  机器学习进行数据分析

📅  最后修改于: 2020-12-02 06:43:58             🧑  作者: Mango


机器学习是计算机科学的一个子领域,它处理诸如模式识别,计算机视觉,语音识别,文本分析之类的任务,并且与统计和数学优化有着紧密的联系。应用包括搜索引擎,垃圾邮件过滤,光学字符识别(OCR)等的开发。数据挖掘,模式识别和统计学习领域之间的界限不清楚,基本上都涉及类似的问题。

机器学习可以分为两种任务-

  • 监督学习
  • 无监督学习

监督学习

监督学习是指一种问题,其中有一个定义为矩阵X的输入数据,我们有兴趣预测响应y 。其中X = {x 1 ,x 2 ,…,x n }具有n个预测变量,并且具有两个值y = {c 1 ,c 2 }

一个示例应用程序是使用人口统计特征作为预测变量来预测网络用户点击广告的可能性。通常称为预测点击率(CTR)。然后y = {click,not-click} ,预测变量可以是使用的IP地址,他进入站点的日期,用户所在的城市,国家/地区以及其他可用的功能。

无监督学习

无监督学习处理的问题是找到彼此相似的组而无需上课。有几种方法可用于学习从预测变量到找到在每个组中共享相似实例且彼此不同的组的映射。

无监督学习的一个示例应用是客户细分。例如,在电信行业中,一项常见的任务是根据用户提供给手机的使用情况对用户进行细分。这样一来,营销部门就可以针对每个群体使用不同的产品。