📝 机器学习教程
383篇技术文档📅  最后修改于: 2022-05-13 01:58:07.788000        🧑  作者: Mango
机器学习专业人士面临的 7 大挑战在机器学习中,会发生一个分析数据以构建或训练模型的过程。它无处不在;从亚马逊产品推荐到自动驾驶汽车,它始终具有巨大的价值。根据最新研究,到 2024 年,全球机器学习市场预计将增长 43%。这场革命在很大程度上提高了对机器学习专业人士的需求。人工智能和机器学习工作在过去四年中实现了 75% 的显着增长率,并且该行业正在持续增长。机器学习领域的职业可以提供工作满意度...
📅  最后修改于: 2022-05-13 01:58:07.796000        🧑  作者: Mango
毫升 |多元线性回归(反向消除技术)多元线性回归是一种回归类型,其中模型取决于多个自变量(而不是在简单线性回归的情况下仅取决于一个自变量)。多元线性回归有几种构建有效模型的技术,即:全押向后消除前向选择双向消除在本文中,我们将使用后向消除技术实现多元线性回归。向后消除包括以下步骤:选择一个显着性水平以留在模型中(例如 SL = 0.05)用所有可能的预测变量拟合模型考虑具有最高 P 值的预测变量。...
📅  最后修改于: 2022-05-13 01:58:07.803000        🧑  作者: Mango
生成对抗网络 (GAN) 有何特别之处粉丝们欣喜若狂的原因有很多,包括 GAN 是第一个产生令人信服的好结果的生成算法,以及它们开辟了许多新的研究方向。在过去的几年里,GANs被认为是最突出的机器学习研究,从那时起,GANs彻底改变了深度学习的概念,在人工智能史上产生了一些重大的技术突破生成对抗网络生成对抗网络 (GAN)是一类功能强大的神经网络,用于无监督学习。它基本上由一个由两个相互竞争的神经...
📅  最后修改于: 2022-05-13 01:58:07.810000        🧑  作者: Mango
毫升 |回归分析中的 R 平方R 平方是一种统计度量,表示回归模型的拟合优度。 r-square 的理想值为 1。r-square 的值越接近 1,模型拟合越好。R-square 是残差平方和(SSres)与总平方和(SStot) 的比较。总平方和是通过数据点与平均线之间的垂直距离的平方和来计算的。通过数据点与最佳拟合线之间的垂直距离的平方和计算得出的残差平方和。R 平方使用以下公式计算:其中SS...
📅  最后修改于: 2022-05-13 01:58:07.816000        🧑  作者: Mango
ML – 不同的回归类型回归分析:它是一种预测建模技术,用于研究因变量(目标)和自变量(预测变量)之间的关系。为了建立不同变量之间可能的关系,实施了各种统计方法模式,称为回归分析。基本上,回归分析建立了一个方程来解释一个或多个预测变量与响应变量之间的显着关系,并估计当前的观察结果。回归模型属于监督学习,我们试图在连续输出中预测结果,这意味着我们试图将输入变量映射到某个连续函数。根据房屋的大小、价格...
📅  最后修改于: 2022-05-13 01:58:07.823000        🧑  作者: Mango
Python的文本预处理 |套装 – 1先决条件:NLP 简介每当我们有文本数据时,我们都需要对数据应用几个预处理步骤,将单词转换为可与机器学习算法配合使用的数字特征。问题的预处理步骤主要取决于领域和问题本身,因此,我们不需要将所有步骤应用于每个问题。在本文中,我们将看到Python的文本预处理。我们将在这里使用 NLTK(自然语言工具包)库。文字小写:我们将文本小写以减少文本数据的词汇量。例子:...
📅  最后修改于: 2022-05-13 01:58:07.830000        🧑  作者: Mango
三次样条插值插值:我们通过绘制一条穿过xi的平滑曲线来估计任意x 的f(x)。如果所需的x介于xi的最大值和最小值之间,则称为插值,否则称为外插。随机点线性插值:线性插值是一种利用线性多项式(如直线方程)对点进行曲线拟合的方法。这类似于通过在数据集中的两个点画一条线来连接点。线性插值多项式插值:多项式插值是通过创建更高次多项式来连接这些点来拟合曲线的方法。样条插值:与多项式插值x'类似的样条插值在...
📅  最后修改于: 2022-05-13 01:58:07.837000        🧑  作者: Mango
毫升 |使用Python 的多元线性回归线性回归:它是预测分析的基本和常用类型。它是一种对因变量和一组给定的自变量之间的关系进行建模的统计方法。它们有两种类型:简单线性回归多元线性回归让我们使用Python讨论多元线性回归。多元线性回归尝试通过将线性方程拟合到观测数据来模拟两个或多个特征与响应之间的关系。执行多重线性回归的步骤几乎与简单线性回归的步骤相似。区别在于评价。我们可以用它来找出哪个因素对...
📅  最后修改于: 2022-05-13 01:58:07.844000        🧑  作者: Mango
理解辅助分类器:GAN先决条件:GAN(通用对抗网络)在本文中,我们将讨论一种特殊的类条件 GAN 或 c-GAN,称为辅助分类器 GAN 或 AC-GAN。在开始之前,了解什么是类条件 GAN 是很重要的。类条件 GAN (c-GAN):c-GAN 可以理解为带有一些条件参数的 GAN。我们考虑原始 GAN 框架并以类标签的形式添加先验信息。在 c-GAN 中,生成器中添加了一个额外的参数“y”...
📅  最后修改于: 2022-05-13 01:58:07.850000        🧑  作者: Mango
使用 NLTK 的 N-Gram 语言建模语言建模是确定任何单词序列的概率的方法。语言模型在各种各样的应用,如语音识别,垃圾邮件过滤等,其实用,语言建模是许多国家的最先进的自然语言处理模型的实现背后的主要目的。语言建模方法:两种类型的语言建模:统计语言建模:统计语言建模或语言建模是概率模型的发展,该模型能够在给定前面的单词的情况下预测序列中的下一个单词。N-gram 语言建模等示例。神经语言建模:...
📅  最后修改于: 2022-05-13 01:58:07.858000        🧑  作者: Mango
多人游戏中的最优决策当指定 MAX(我们这边的玩家)在初始状态下的移动,然后 Max 移动到由 MIN 产生的每个可能响应的状态时,最优解成为一种或有策略。然后 MAX 在由 MIN 对这些移动的每个可能响应所产生的状态下移动,依此类推。从当前状态,上图中的极小极大方法计算极小极大选择。它直接使用每个后继状态的极小最大值的简单递归计算来实现定义方程。随着递归展开,它一直向下延伸到树的叶子,然后通过...
📅  最后修改于: 2022-05-13 01:58:07.866000        🧑  作者: Mango
局部异常因子什么是局部异常因子?局部异常值因子 (LOF) 是一种用于无监督异常值检测的算法。它产生一个异常分数,表示数据集中的异常值数据点。它通过测量给定数据点相对于其附近数据点的局部密度偏差来实现这一点。LOF 的工作:局部密度是通过估计相邻数据点(k-最近邻)之间的距离来确定的。因此对于每个数据点,可以计算局部密度。通过比较这些,我们可以检查哪些数据点具有相似的密度,哪些密度低于其邻居。具有...
📅  最后修改于: 2022-05-13 01:58:07.873000        🧑  作者: Mango
变压器入门Transformer 是 2017 年提出的深度学习模型,本质上用于 NLP 任务。如果您从事自然语言处理任务,例如文本摘要、翻译或情感预测,那么您会经常遇到这个术语。RNN 遇到了导致长期记忆丧失的消失梯度问题。RNN 按顺序处理文本,这意味着如果有一个长句,例如“XYZ 于 2019 年去过法国,当时没有新冠肺炎病例,他在那里遇到了那个国家的总统。”现在,如果我们问这里的“那个国家...
📅  最后修改于: 2022-05-13 01:58:07.880000        🧑  作者: Mango
分解随机合成器Transformer 模型在各种不同的 NLP 任务中取得了巨大的成功。这导致变压器在很大程度上取代了许多最先进架构中以前的自回归循环神经网络架构。在这个转换器的核心,该架构使用了一种称为 Query-Key 点积注意力的方法。这种transformer架构的成功主要归功于self-attention机制。分解随机密集合成器是一种注意力模型,在 Google Research 的论...
📅  最后修改于: 2022-05-13 01:58:07.887000        🧑  作者: Mango
数据挖掘系统的分类数据挖掘被认为是一个跨学科领域。它包括一组不同的学科,如统计学、数据库系统、机器学习、可视化和信息科学。数据挖掘系统的分类有助于用户理解系统并将他们的需求与这些系统相匹配。数据挖掘系统可以根据各种标准进行分类,如下所示:根据适应的应用分类:这涉及特定领域的应用。例如,数据挖掘系统可以针对电信、金融、股票市场、电子邮件等进行相应的定制。根据使用的技术类型分类:这种技术涉及用户交互的...