机器学习教程 - 芒果文档

📅 最后修改于: 2022-05-13 01:58:08.993000 🧑 作者: Mango

Google 的机器学习应用程序机器学习是人工智能 (AI) 和计算机科学的一个领域，专注于使用数据和算法来模仿人们的学习方式，目标是稳步提高准确性。在当今时代，每个人都知道谷歌，使用谷歌，也使用谷歌搜索任何信息。是的，这篇文章是关于谷歌最常用的机器学习应用程序。应用：1.谷歌地图：如果我们需要方向或交通信息，我们最有可能使用谷歌地图。 “尽管交通繁忙，但你走的是最快的路线，”前几天我去另一个城市...

机器学习中的堆叠

📅 最后修改于: 2022-05-13 01:58:08.996000 🧑 作者: Mango

机器学习中的堆叠Stacking 是一种集成多个分类或回归模型的方法。集成模型的方法有很多，广为人知的模型是Bagging或Boosting。 Bagging 允许对多个具有高方差的相似模型进行平均以减少方差。 Boosting 构建多个增量模型以减少偏差，同时保持较小的方差。堆叠（有时称为堆叠泛化）是一种不同的范式。堆叠的目的是为同一问题探索不同模型的空间。这个想法是你可以用不同类型的模型来解决...

人工智能中的随机博弈

📅 最后修改于: 2022-05-13 01:58:08.999000 🧑 作者: Mango

人工智能中的随机博弈许多不可预见的外部事件会使我们处于现实生活中不可预见的境地。许多游戏，例如掷骰子，都有随机元素来反映这种不可预测性。这些被称为随机游戏。双陆棋是一款融合了技巧和运气的经典游戏。合法的走法是由每位玩家在白棋开始时掷骰子决定的，例如，在下图所示的五子棋场景中，掷出了 6–5 并且有四个备选走法。这是一个标准的步步高姿势。游戏的目的是尽快将所有棋子从棋盘上移走。白方顺时针向25移动，...

人工智能：失业的原因

📅 最后修改于: 2022-05-13 01:58:09.002000 🧑 作者: Mango

人工智能：失业的原因人工智能以难以想象的方式极大地改善了我们的世界，但人们对其可能对就业和劳动力的可信度产生的影响感到担忧。有一些预测告诉我们，由于自动化和神经网络，未来十年可能会有数百万人面临失业。由于人工智能，商业、教育、市场和政府部门发生了重大转变。人工智能可以替代人类的领域交通：通过增强的自动化和机器学习，我们能够设计和制造能够感知环境并在没有或几乎没有人工干预的情况下安全移动的车辆。这些...

曼和惠特尼 U 检验

📅 最后修改于: 2022-05-13 01:58:09.005000 🧑 作者: Mango

曼和惠特尼 U 检验Mann 和 Whitney 的 U 检验或 Wilcoxon 秩和检验是非参数统计假设检验，用于分析序数数据的两个独立样本之间的差异。在这个测试中，我们提供了两个随机抽取的样本，我们必须验证这两个样本是否来自同一个群体。Mann-Whitney U 检验的假设：两组的所有观察都是相互独立的。因变量的值应该是有序的（意味着它们可以相互比较并按从高到低的顺序排列）。自变量应该是两...

正则化判别分析

📅 最后修改于: 2022-05-13 01:58:09.008000 🧑 作者: Mango

正则化判别分析正则化判别分析线性判别分析和 QDA 直接适用于观察数量远大于预测变量数量 n>p 的情况。在这些情况下，它提供了很多优势，例如易于应用（因为我们不必计算每个类的协方差）和对模型假设偏差的鲁棒性。然而，当 LDA 的使用成为一个严峻的挑战时，例如观察的数量少于微阵列设置等预测变量，因为这里有两个挑战样本协方差矩阵是奇异的，不能求逆。高维数使得直接矩阵运算变得强大，从而阻碍了该方法的适...

不同回归模型的优缺点

📅 最后修改于: 2022-05-13 01:58:09.011000 🧑 作者: Mango

不同回归模型的优缺点回归是典型的监督学习任务。它用于要预测的值是连续的情况。例如，在给定一组特征或预测变量（里程、品牌、年龄）的情况下，我们使用回归来预测目标数值，例如汽车的价格。我们用许多汽车示例训练系统，包括预测变量和相应的汽车价格（标签）。回归模型的类型：简单线性回归是一种线性回归模型，它使用一条直线来估计一个自变量和一个因变量之间的关系。示例：薪水 = a0+ a1*经验（y = a0+ ...

ML – 基于内容的推荐系统

📅 最后修改于: 2022-05-13 01:58:09.013000 🧑 作者: Mango

ML – 基于内容的推荐系统基于内容的推荐器根据我们从用户那里获取的数据工作，无论是显式（评级）还是隐式（单击链接）。我们通过数据创建用户配置文件，然后用于向用户提出建议，随着用户提供更多输入或对推荐采取更多操作，引擎变得更加准确。用户资料：在用户配置文件中，我们创建了描述用户偏好的向量。在创建用户配置文件时，我们使用效用矩阵来描述用户和项目之间的关系。有了这些信息，我们可以对用户喜欢哪个项目做出...

Kullback-Leibler 散度

📅 最后修改于: 2022-05-13 01:58:09.016000 🧑 作者: Mango

Kullback-Leibler 散度熵：熵是一种测量随机变量 X 的不确定性/随机性的方法换句话说，熵测量随机变量中的信息量。它通常以位为单位进行测量。联合熵：一对离散随机变量 X, Y ~ p (x, y) 的联合熵是指定它们的值平均所需的信息量。条件熵：给定另一个 X 的随机变量 Y 的条件熵表示在另一方知道 X 的情况下，一个人平均还需要提供多少额外信息来传达 Y。例子：计算公平硬币的熵：...

广义线性模型

📅 最后修改于: 2022-05-13 01:58:09.019000 🧑 作者: Mango

广义线性模型先决条件：线性回归逻辑回归以下文章讨论了广义线性模型(GLM)，它解释了线性回归和逻辑回归如何成为更广泛的模型类别的成员。 GLM 可用于通过使用最能描述数据或给定用于训练模型的标签的分布类型来构建回归和分类问题的模型。下面给出了一些类型的数据集和相应的分布，它们将帮助我们为特定类型的数据构建模型（这里指定的术语数据是指输出数据或数据集的标签）。二元分类数据——伯努利分布实值数据 - ...

学习一规则算法

📅 最后修改于: 2022-05-13 01:58:09.022000 🧑 作者: Mango

学习一规则算法先决条件：基于规则的分类器学习一个规则：这种方法在顺序学习算法中用于学习规则。它返回一个包含至少一些示例的规则（如图 1 所示）。然而，真正强大的是它能够在给定的属性之间创建关系，从而覆盖更大的假设空间。图 1：Learn-One-Rule 示例学习一规则算法Learn-One-Rule 算法遵循贪婪搜索范式，它以高精度搜索规则，但其覆盖率非常低。它对特定实例的所有正例进行分类。它返...

毫升 |模型得分和错误

📅 最后修改于: 2022-05-13 01:58:09.025000 🧑 作者: Mango

毫升 |模型得分和错误在机器学习中，主要任务之一是使用各种分类和回归算法对数据进行建模并预测输出。但是由于算法太多，要选择哪一个来预测最终数据真的很困难。因此，我们需要比较我们的模型并选择准确率最高的模型。使用 sklearn 库，我们可以找出我们的 ML 模型的分数，从而选择具有更高分数的算法来预测我们的输出。另一个好方法是计算误差，例如平均绝对误差和均方误差，并尝试将它们最小化以改进我们的模型...

自动机器学习

📅 最后修改于: 2022-05-13 01:58:09.028000 🧑 作者: Mango

自动机器学习Tpot 是Python中的自动化机器学习包，它使用遗传编程概念来优化机器学习管道。它通过智能探索数以千计的可能性来找到适合您数据的最佳参数，从而自动化机器学习中最乏味的部分。 Tpot 是 Tpot 建立在 scikit-learn 之上，所以它的代码看起来类似于 scikit-learn。Tpot 自动化的 ML 管道的一部分Tpot 使用遗传编程来生成优化的搜索空间，它们受到达尔...

生成对抗网络的用例

📅 最后修改于: 2022-05-13 01:58:09.031000 🧑 作者: Mango

生成对抗网络的用例生成对抗网络 (GAN)最常用于从给定的图像数据集生成图像，但除此之外，GAN 现在还用于各种应用。这些是一类具有鉴别器块和生成器块的神经网络，它们一起工作并且能够产生新的样本，而不仅仅是对样本类别进行分类和预测。一些新发现的 GAN 用例是：安全：事实证明，人工智能对许多行业来说是一个福音，但它也被网络威胁问题所包围。事实证明，GAN 对处理对抗性攻击有很大帮助。对抗性攻击使用...

日志和指标

📅 最后修改于: 2022-05-13 01:58:09.033000 🧑 作者: Mango

日志和指标数据科学和机器学习都需要数据，更准确地说是一堆信息。日志和指标是两种很棒的数据收集技术。这些方式不会在不被注意的情况下留下单个信息。这两者都有不同的用例和不同的表示方式。在互联网上，您可以找到不同的日志和指标收集和表示工具。其中一些将在下面的文章中提出。您还将了解谷歌和微软如何处理这些海量数据。什么是日志？需要日志文件来存储已发生或正在发生的不同事件。事件可以像登录、访问网站、下载任何类...