介绍
机器学习是人们曾经遇到过的最令人兴奋的技术之一。从名称可以明显看出,它为计算机提供了与人类更相似的能力:学习能力。如今,机器学习正在被积极地使用,也许在比人们期望的更多的地方。我们可能不知不觉地使用了数十次学习算法。机器学习的应用包括:
- Web搜索引擎: google,bing等搜索引擎之所以如此出色的原因之一是因为该系统已经学会了如何通过复杂的学习算法对页面进行排名。
- 照片标记应用程序:无论是Facebook还是任何其他照片标记应用程序,标记朋友的能力都使它更加流行。由于在应用程序后面运行的人脸识别算法,因此一切皆有可能。
- 垃圾邮件检测器:我们的邮件代理(如Gmail或Hotmail)在分类邮件并将垃圾邮件移至垃圾邮件文件夹方面为我们做了大量的工作。这又是通过在邮件应用程序后端中运行的垃圾邮件分类器来实现的。
如今,公司正在使用机器学习来改善业务决策,提高生产力,检测疾病,预测天气并做更多的事情。随着技术的迅猛发展,我们不仅需要更好的工具来了解当前拥有的数据,而且还需要为将要拥有的数据做好准备。为了实现这个目标,我们需要构建智能机器。我们可以编写一个程序来做简单的事情。但是在大多数情况下,很难在其中进行智能化。最好的方法是让机器自己学习一些东西。学习机制–如果机器可以从输入中学习,那么它将为我们完成艰苦的工作。这是机器学习付诸实践的地方。机器学习的一些示例是:
- 数据库挖掘以实现自动化的增长:典型的应用程序包括Web单击数据,以实现更好的UX(用户体验);医疗记录,以实现医疗保健中的更好的自动化;生物数据等等。
- 无法编程的应用程序:有些任务无法编程,因为我们使用的计算机不是以这种方式建模的。示例包括自动驾驶,来自无序数据的识别任务(面部识别/手写识别),自然语言处理,计算机视觉等。
- 了解人类学习:这是我们所了解并模仿人类大脑的最接近的东西。这是一场新革命的开始,即真正的AI。现在,在简要了解之后,让我们对机器学习进行更正式的定义
- Arthur Samuel(1959年): “机器学习是使计算机无需明确编程即可学习的领域。” Samuel编写了一种Checker播放程序,该程序可以随着时间的推移而学习。起初它很容易赢得。但是随着时间的流逝,它学会了所有的董事会职位,最终导致他获胜或失败,因此成为了比塞缪尔本人更好的棋手。这是定义机器学习的最早期尝试之一,而且不太正式。
- 汤姆·米歇尔(1999): “如果某计算机程序在T的任务中的性能(由P衡量)随着经验E的提高而提高,那么据说它可以从经验E中学习有关某类任务T和性能度量P的信息。”这是一个更正式和数学的定义。对于以前的国际象棋程序
- E是游戏数。
- T正在对计算机下棋。
- P是计算机的赢/输。
在下一个教程中,我们将对机器学习问题的类型进行分类,还将讨论有关机器学习的有用软件包和设置环境,以及如何使用它来设计新项目。
参考:
[1]彼得·哈灵顿(Peter Harrington)在实践中的机器学习。
[2] cs229.stanford.edu