📜  什么是机器学习?

📅  最后修改于: 2021-10-19 05:06:28             🧑  作者: Mango

您是否会在 Netflix 和 Amazon Prime 上获得有关接下来应该观看的电影的自动推荐?或者,您可能会在 Facebook 或 LinkedIn 上获得“您可能认识的人”的选项?您还可以在手机上使用 Siri、Alexa 等。这就是机器学习!这是一项越来越受欢迎的技术。很有可能您身边的几乎所有技术都使用了机器学习!

什么是机器学习?

这几乎不是一个新概念。研究人员一直对机器无需人类详细编程而自行学习的能力着迷。然而,随着现代大数据的出现,这变得容易多了。大量数据可用于创建在技术行业中实际可行的更准确的机器学习算法。因此,尽管机器学习已经存在了很长时间,但它现在是行业中的一个流行词。

但是您是否想知道机器学习到底是什么?它有哪些不同的类型以及有哪些不同的机器学习算法?继续阅读以找到所有问题的答案!

什么是机器学习?

机器学习,顾名思义,就是机器自动学习,无需明确编程或无需任何直接人工干预即可学习。这个机器学习过程首先为他们提供高质量的数据,然后通过使用数据和不同的算法构建各种机器学习模型来训练机器。算法的选择取决于我们拥有什么类型的数据以及我们试图自动化的任务类型。

至于机器学习的正式定义,我们可以说机器学习算法从经验 E 中学习关于某种类型的任务 T性能度量 P ,如果它在 T 中的任务的性能,以 P 衡量,随着经验而提高E.

例如,如果使用机器学习算法下棋。那么经验 E 是下多盘棋,任务 T 是和很多玩家下棋,性能度量 P 是算法在这盘棋中获胜的概率。

人工智能和机器学习有什么区别?

人工智能和机器学习相互关联,但也存在一些差异。人工智能是一个总体概念,旨在创造模仿人类智能的智能。人工智能是一个通用概念,涉及为机器创造类似人类的批判性思维能力和推理能力。另一方面,机器学习是人工智能的一个子集或特定应用程序,旨在创建可以从数据中自主学习的机器。机器学习是特定的,而不是通用的,这意味着它允许机器使用数据对特定问题进行预测或做出一些决定。

机器学习有哪些类型?

现在让我们看看不同类型的机器学习:

1. 监督机器学习

想象一个老师在监督一个班级。老师已经知道正确答案,但学习过程不会停止,直到学生也学习了答案。这是监督机器学习算法的本质。在这里,算法从训练数据集中学习并做出与实际输出值进行比较的预测。如果预测不正确,则修改算法直到它令人满意。这个学习过程一直持续到算法达到所需的性能水平。然后它可以为任何新输入提供所需的输出值。

2. 无监督机器学习

在这种情况下,班级没有老师,学生们自己学习!所以对于无监督机器学习算法,没有具体的答案要学习,也没有老师。通过这种方式,该算法不会为输入计算出任何输出,而是会探索数据。该算法在无人监督的情况下寻找数据中的底层结构,以便越来越多地了解数据本身。

3. 半监督机器学习

学生在半监督机器学习中既可以向老师学习,也可以自己学习。你可以从名字本身猜到这一点!这是监督和无监督机器学习的组合,它使用少量标记数据(如监督机器学习)和大量未标记数据(如无监督机器学习)来训练算法。首先,标记数据用于部分训练机器学习算法,然后这个部分训练的模型用于伪标记其余未标记数据。最后,机器学习算法使用标记和伪标记数据的组合进行全面训练。

4. 强化机器学习

好吧,这里是假设的学生,他们随着时间的推移从自己的错误中学习(这就像生活!)。因此,强化机器学习算法通过反复试验来学习最佳动作。这意味着算法通过学习基于其当前状态的行为来决定下一步行动,这将最大化未来的奖励。这是使用奖励反馈完成的,该反馈允许强化算法学习哪些是导致最大奖励的最佳行为。这种奖励反馈被称为强化信号。

有哪些流行的机器学习算法?

让我们看看一些基于特定类型机器学习的流行机器学习算法。

监督机器学习

监督机器学习包括回归和分类算法。这些类别中一些比较流行的算法是:

1. 线性回归算法

线性回归算法提供了自变量和因变量之间的关系。它展示了当自变量以任何方式改变时对因变量的影响。因此,自变量称为解释变量,因变量称为感兴趣因子。线性回归算法用法的一个例子是根据房产大小、房间数量等分析该地区的房产价格。

2.逻辑回归算法

Logistic 回归算法处理离散值,而线性回归算法处理连续值的预测。这意味着逻辑回归是二元分类的更好选择。 Logistic 回归中的事件如果发生则归类为 1,否则归类为 0。因此,特定事件发生的概率是基于给定的预测变量来预测的。 Logistic 回归算法使用的一个例子是在医学中根据肿瘤的大小预测一个人是否患有恶性乳腺癌肿瘤。

3.朴素贝叶斯分类器算法

朴素贝叶斯分类器算法用于对网页、文档、电子邮件等数据文本进行分类。该算法基于概率的贝叶斯定理,并将元素值分配给可用类别之一的总体。朴素贝叶斯分类器算法使用的一个例子是电子邮件垃圾邮件过滤。 Gmail 使用此算法将电子邮件分类为垃圾邮件或非垃圾邮件。

无监督机器学习

无监督机器学习主要包括聚类算法。该类别中一些比较流行的算法是:

1. K均值聚类算法

假设您想在维基百科上搜索“Harry”这个名字。现在,“哈利”可以指哈利波特、英国哈里王子或维基百科上任何其他受欢迎的哈利!因此,维基百科使用 K 均值聚类算法(因为它是一种流行的聚类分析算法)对讨论相同想法的网页进行分组。 K 均值聚类算法通常使用 K 个聚类对给定的数据集进行操作。以这种方式,输出包含 K 个簇,输入数据在这些簇之间进行分区。

2. Apriori 算法

Apriori 算法使用 if-then 格式来创建关联规则。这意味着如果某个事件 1 发生,那么某个事件 2 也发生的概率很高。例如:如果有人购买汽车,那么他们也很有可能购买汽车保险。 Apriori 算法通过观察购买汽车后购买汽车保险的人数来生成此关联规则。例如,Google 自动完成使用 Apriori 算法。当在 Google 中键入一个词时,Apriori 算法会查找通常在该词之后键入的关联词并显示可能性。

什么是深度学习?

深度学习是机器学习的一个子集。它基于实例学习,就像人类一样,使用人工神经网络。创建这些人工神经网络是为了模仿人脑中的神经元,以便深度学习算法可以更有效地学习。深度学习现在如此流行是因为它在现代技术中的广泛应用。从自动驾驶汽车到图像、语音识别和自然语言处理,深度学习用于实现以前无法实现的结果。

什么是人工神经网络?

人工神经网络以人脑中的神经元为模型。它们包含称为单元的人工神经元。这些单元排列在一系列层中,这些层共同构成了系统中的整个人工神经网络。一个层可以只有十几个单位或数百万个单位,因为这取决于系统的复杂性。通常,人工神经网络具有输入层、输出层以及隐藏层。输入层接收来自外部世界的数据,神经网络需要分析或学习这些数据。然后这些数据通过一个或多个隐藏层,将输入转换为对输出层有价值的数据。最后,输出层以人工神经网络对所提供输入数据的响应形式提供输出。

在大多数神经网络中,单元从一层互连到另一层。这些连接中的每一个都有决定一个单元对另一个单元的影响的权重。随着数据从一个单元传输到另一个单元,神经网络对数据的了解越来越多,最终导致输出层的输出。

机器学习有什么用?

几乎所有现代技术都使用机器学习,而且这种情况在未来只会增加。事实上,机器学习在各个领域都有应用,从智能手机技术到医疗保健再到社交媒体等等。

智能手机使用 Siri、Alexa、Cortana 等个人语音助理。这些个人助理是基于 ML 的语音识别的一个例子,它使用自然语言处理与用户交互并相应地制定响应。机器学习也用于社交媒体。让我们以 Facebook 的“你可能认识的人”为例。令人难以置信的是,社交媒体平台如何猜测您在现实生活中可能熟悉的人。而且大多数时候他们是对的!!!这是通过使用机器学习算法来完成的,该算法分析您的个人资料、您的兴趣、您当前的朋友以及他们的朋友和各种其他因素,以计算您可能认识的人。

机器学习在医疗诊断中也非常重要,因为它可用于诊断医疗领域的各种问题。例如,机器学习用于肿瘤学来训练算法,该算法可以在微观层面以与受过训练的医生相同的准确度识别癌组织。机器学习的另一个著名应用是谷歌地图。谷歌地图算法依靠不同时间范围的预测,并考虑交通拥堵、路障等各种因素,自动选择从一个点到另一个点的最佳路线。 通过这种方式,你可以看到机器学习的应用是无限。如果有的话,它们只会增加,机器学习有朝一日可能会用于几乎所有研究领域!

机器学习算法是完全客观的吗?

机器学习算法使用数据集进行训练。不幸的是,有时数据可能有偏差,因此机器学习算法并不完全客观。这是因为数据可能包括人类偏见、历史不平等或基于性别、种族、国籍、性取向等的不同判断指标。例如,亚马逊发现他们基于机器学习的招聘算法对女性存在偏见。这可能是因为招聘算法被训练为通过研究亚马逊对过去 10 年提交的简历的反应来分析候选人的简历。然而,过去分析这些简历的人力招聘人员大多是男性,对女性候选人有固有的偏见,这些偏见被传递给了 AI 算法。

这意味着现实世界中使用的某些机器学习算法可能由于数据存在偏差而不够客观。但是,公司正在努力确保仅使用客观算法。一种方法是预处理数据,以便在 ML 算法对数据进行训练之前消除偏差。另一种方法是在对数据进行训练后对 ML 算法进行后处理,使其满足可以预先确定的任意公平常数。

哪些云计算平台提供机器学习?

有许多云计算平台为其他公司提供机器学习服务。其中最受欢迎的是:

1. 亚马逊网络服务(AWS)

Amazon Web Services 提供的一些产品包括用于创建和训练机器学习模型的 Amazon SageMaker、用于提高预测准确性的 Amazon Forecast、用于使用自然语言处理进行语言翻译的 Amazon Translate、用于将文本转换为逼真语音的 Amazon Polly 等.

2. 微软 Azure

Microsoft Azure 提供的一些产品包括用于创建和部署机器学习模型的 Microsoft Azure 机器学习、用于提供智能认知服务的认知服务、用于基于 Apache Spark 的分析的 Databricks、用于智能和智能机器人服务的机器人服务等。

3. 谷歌云

Google Cloud 提供的一些产品包括用于训练 AutoML 机器学习模型的 Google Cloud AutoML、用于云视觉的 Vision AI、用于从语音到文本的传输的 Speech-to-Text、用于从文本到语音的传输的 Text-to-Speech, Natural Language 用于自然语言处理等。

4.IBM 沃森云

IBM Watson Cloud 提供的部分产品包括用于构建机器学习和人工智能模型的 IBM Watson Studio、用于从语音到文本传输的 Speech-to-Text、用于从文本到语音传输的 Text-to-Speech、用于创建和管理虚拟助手、用于自然语言处理的自然语言理解等。

学习机器学习的课程有哪些?

GeeksforGeeks等平台上有很多在线课程,可以帮助你有效地学习机器学习。这些课程可以轻松教授机器学习的基础知识,还可以让您通过各种项目了解这些概念的实际实施。一些流行的课程是 –机器学习基础与Python – Live机器学习 – 基础课程