📝 机器学习教程

383篇技术文档
  模式识别的应用

📅  最后修改于: 2022-05-13 01:58:07.555000        🧑  作者: Mango

模式识别的应用模式识别是一门使用统计、概率、计算几何、机器学习、信号处理和算法设计工具从感知数据进行推断的科学。模式识别的应用有:机器视觉:机器视觉系统通过相机捕捉图像并对其进行分析以生成对图像=d 对象的描述。例如,在制造业的检查中,当制造的物体通过相机时,必须在线分析图像。计算机辅助诊断 (CAD):CAD 有助于协助医生做出诊断决定。计算机辅助诊断已应用于医学领域,如X射线、心电图、超声图像...

  毫升 | K-Medoids 聚类与解决的例子

📅  最后修改于: 2022-05-13 01:58:07.562000        🧑  作者: Mango

毫升 | K-Medoids 聚类与解决的例子K-Medoids(也称为 Partitioning Around Medoid)算法由 Kaufman 和 Rousseeuw 于 1987 年提出。中心点可以定义为簇中的点,它与簇中所有其他点的相异性最小。通过使用E = |Pi - Ci|medoid(Ci)和object(Pi)的不相似度。The cost in K-Medoids algori...

  单变量优化——数据科学

📅  最后修改于: 2022-05-13 01:58:07.572000        🧑  作者: Mango

单变量优化——数据科学维基百科将优化定义为通过系统地从允许的集合中选择输入值并计算函数值来最大化或最小化实际函数的问题。这意味着当我们谈论优化时,我们总是对找到最佳解决方案感兴趣。因此,假设一个人有某种函数形式(例如以f(x)的形式),并且他正在尝试为这种函数形式找到最佳解决方案。现在,最好的意思是什么?可以说他对最小化这种函数形式或最大化这种函数形式感兴趣。通常,优化问题具有三个组成部分。min...

  NLP中的自注意力

📅  最后修改于: 2022-05-13 01:58:07.581000        🧑  作者: Mango

NLP中的自注意力自注意力是由 Google Research 和 Google Brain 的研究人员提出的。由于编码器-解码器在处理长序列时面临挑战,因此提出了它。作者还提供了注意力和转换器架构的两种变体。这种转换器架构在 WMT 翻译任务上产生了最先进的结果。编码器-解码器模型:编码器-解码器模型在不同的论文中提出。这两篇论文的区别是基于输入和输出长度的关系从高层来看,该模型包括两个子模型:...

  重采样方法介绍

📅  最后修改于: 2022-05-13 01:58:07.591000        🧑  作者: Mango

重采样方法介绍在阅读机器学习和数据科学时,我们经常遇到一个术语,称为不平衡类分布,通常发生在其中一个类中的观察值远高于或低于任何其他类时。由于机器学习算法倾向于通过减少错误来提高准确性,因此它们不考虑类分布。这个问题在欺诈检测、异常检测、面部识别等示例中很普遍。两种常见的重采样方法是 -交叉验证引导交叉验证——交叉验证用于估计与模型相关的测试误差以评估其性能。验证集方法:这是最基本的方法。它只是将...

  什么是数据可视化,为什么重要?

📅  最后修改于: 2022-05-13 01:58:07.602000        🧑  作者: Mango

什么是数据可视化,为什么重要?在进入“数据可视化”这个术语之前,让我们先简单讨论一下“数据科学”这个术语,因为这两个术语是相互关联的。但是如何?让我们了解一下。因此,简单来说,“数据科学是使用统计和机器学习技术分析原始数据的科学,目的是得出有关该信息的结论”。但是你知道什么是数据科学管道吗?In simple words, a pipeline in data science is “a set ...

  生成对抗网络 (GAN) 的基础知识

📅  最后修改于: 2022-05-13 01:58:07.613000        🧑  作者: Mango

生成对抗网络 (GAN) 的基础知识GAN 是一种使用 CNN(卷积神经网络)等深度学习方法进行生成建模的方法。生成式建模是一种无监督学习方法,涉及自动发现和学习输入数据中的模式,以便该模型可用于从原始数据集中生成新示例。GAN 是一种通过将问题框架化为具有两个子模型的监督学习问题来训练生成模型的方法。 GAN 有两个组成部分:生成器:它被训练生成新的数据集,例如在计算机视觉中,它从现有的现实世界...

  ML——注意力机制

📅  最后修改于: 2022-05-13 01:58:07.621000        🧑  作者: Mango

ML——注意力机制介绍:假设我们已经了解普通 Seq2Seq 或编码器-解码器模型的工作原理,让我们关注如何进一步提升它并提高我们预测的准确性。我们将考虑机器翻译这个很好的老例子。动机:在 Seq2Seq 模型中,编码器读取输入句子一次并对其进行编码。在每个时间步,解码器使用这个嵌入并产生一个输出。但是人类不会翻译这样的句子。我们不会记住输入并尝试重新创建它,如果我们这样做,我们可能会忘记某些单词...

  毫升 |查找 S 算法

📅  最后修改于: 2022-05-13 01:58:07.628000        🧑  作者: Mango

毫升 |查找 S 算法介绍 :find-S算法是机器学习中的一种基本概念学习算法。 find-S 算法找到适合所有正例的最具体的假设。这里我们必须注意,该算法只考虑那些正面的训练示例。 find-S 算法从最具体的假设开始,并在每次未能对观察到的正训练数据进行分类时推广该假设。因此,Find-S 算法从最具体的假设转移到最普遍的假设。重要代表:?表示该属性可以接受任何值。为属性指定一个必需的值(例...

  数据科学项目的结构

📅  最后修改于: 2022-05-13 01:58:07.635000        🧑  作者: Mango

数据科学项目的结构在本文中,提到了数据科学项目的5 个阶段——提问阶段:这是数据科学项目中最重要的阶段提问阶段可帮助您了解数据并决定分析类型一些 SQL 查询的结果会过滤您的数据并回答您的问题要从更大的数据集中提取数据,可以使用分布式存储,如 Apache Hadoop、Spark 或 Flink有6种类型的问题:描述性问题:当您需要分析数据的特征时,会提出描述性问题探索性问题:提出探索性问题以查...

  命题逻辑混合代理和逻辑状态

📅  最后修改于: 2022-05-13 01:58:07.642000        🧑  作者: Mango

命题逻辑混合代理和逻辑状态先决条件:人工智能中的 Wumpus 世界为了为 wumpus 世界创建一个混合代理,推断世界状态各个方面的能力可以很简单地与条件-动作规则和问题解决算法相结合。代理程序使知识库和当前策略保持最新。非时间公理——那些不依赖于,例如将正方形的微风与凹坑的存在联系起来的公理 - 包含在初始知识库中。在每个时间步添加新的感知短语,以及依赖于的所有公理,例如后继状态公理。 (代理...

  瓦尔德测试

📅  最后修改于: 2022-05-13 01:58:07.653000        🧑  作者: Mango

瓦尔德测试先决条件:最大似然估计NOTE :It is advised to read the prerequisite article before moving on to Wald Test.编程需要懂一点英语Wald 检验:这是对最大似然估计 (MLE) 计算的参数进行的假设检验。它检查真实输入参数的值是否与 MLE 计算的参数具有相同的可能性。简单来说,这个wald估计值越大,输入参数为...

  剪影指数 – 集群有效性指数 | 2套

📅  最后修改于: 2022-05-13 01:58:07.659000        🧑  作者: Mango

剪影指数 – 集群有效性指数 | 2套先决条件:Dunn 索引和 DB 索引 - 集群有效性索引许多有趣的算法被应用于分析非常大的数据集。大多数算法不提供任何验证和评估方法。因此很难断定哪些是最好的集群并且应该进行分析。有几个指标可用于预测最佳集群——剪影索引邓恩指数数据库索引CS指数I-索引XB 或谢本尼索引现在,让我们讨论内部集群有效性索引Silhouette Index。剪影索引 –轮廓分析...

  神经网络中的激活函数

📅  最后修改于: 2022-05-13 01:58:07.666000        🧑  作者: Mango

神经网络中的激活函数建议在阅读本文之前先了解什么是神经网络。在构建神经网络的过程中,您要做出的选择之一是在网络的隐藏层和输出层使用什么激活函数。本文讨论了一些选择。神经网络的元素:-输入层:-该层接受输入特征。它向网络提供来自外界的信息,在这一层不进行任何计算,这里的节点只是将信息(特征)传递给隐藏层。隐藏层:-该层的节点不暴露于外部世界,它们是任何神经网络提供的抽象的一部分。隐藏层对通过输入层输...

  超分辨率 GAN (SRGAN)

📅  最后修改于: 2022-05-13 01:58:07.673000        🧑  作者: Mango

超分辨率 GAN (SRGAN)SRGAN 是由 Twitter 的研究人员提出的。这种架构的动机是在我们放大图像时从图像中恢复更精细的纹理,这样它的质量就不会受到影响。还有其他方法,例如双线性插值,可用于执行此任务,但它们会导致图像信息丢失和平滑。在这篇论文中,作者提出了两种架构,一种没有 GAN(SRResNet),一种有 GAN(SRGAN)。得出的结论是,与 SRGAN 相比,SRGAN ...