📝 机器学习教程
383篇技术文档📅  最后修改于: 2022-05-13 01:58:07.893000        🧑  作者: Mango
单变量优化与多变量优化维基百科将优化定义为通过系统地从允许的集合中选择输入值并计算函数值来最大化或最小化实际函数的问题。这意味着当我们谈论优化时,我们总是对找到最佳解决方案感兴趣。因此,假设一个人有某种函数形式(例如以 f(x) 的形式),并且他正在尝试为这种函数形式找到最佳解决方案。现在,最好的意思是什么?可以说他对最小化这种函数形式或最大化这种函数形式感兴趣。通常,优化问题具有三个组成部分。最...
📅  最后修改于: 2022-05-13 01:58:07.899000        🧑  作者: Mango
猫群优化大自然充满了社会隔间来开展各种工作。即使所有人和集体行为的最终目标都是生存,但出于各种原因:狩猎、保护、航行和觅食动物以群体、牛群、学校、殖民地和羊群的形式工作和互动。生物发现最佳情况并以群体形式有效执行任务是非常有趣的。很明显,这种最佳和有效的行为已经演变了数千年。所以我们激励他们解决我们的问题是相当合乎逻辑的。这是称为群智能 (SI) 的研究领域的主要目标。在群智能(SI)领域已经提出...
📅  最后修改于: 2022-05-13 01:58:07.906000        🧑  作者: Mango
Python|使用 Sklearn 创建测试数据集Python 的 Sklearn 库提供了一个很棒的示例数据集生成器,它将帮助您创建自己的自定义数据集。它快速且易于使用。以下是它提供的样本类型。对于上述所有方法,您需要导入sklearn.datasets.samples_generator。Python3Python3Python3Python3sklearn.datasets.make_blo...
📅  最后修改于: 2022-05-13 01:58:07.912000        🧑  作者: Mango
重复保持方法介绍先决条件:介绍保持方法重复保持方法是保持方法的迭代,即它是保持方法的重复执行。这个方法可以重复——'K' 次/迭代。在这种方法中,我们采用数据集的随机抽样。数据集是随机分区的,而不是基于任何公式。[注意:随机抽样是指从总体中选择“n”个人,选择方式是每组“n”个人都有相同的机会被选中。 ]示例 – 考虑一个随机分层为训练集和测试集的数据集。我们对“K”次迭代重复保持方法。让我们假设...
📅  最后修改于: 2022-05-13 01:58:07.918000        🧑  作者: Mango
遗传算法中的交叉交叉是一种遗传运算符,用于从一代到下一代改变一个或多个染色体的编程。交叉是有性生殖。从交配池中随机挑选两条字符串进行交叉,以产生优良的后代。选择的方法取决于编码方法。不同类型的交叉:单点交叉 :选择了父有机体字符串上的交叉点。生物体字符串超出该点的所有数据在两个亲代生物体之间交换。字符串的特点是位置偏差。两点交叉:这是 N 点交叉技术的一个特例。在单个染色体(字符串)上随机选择两个...
📅  最后修改于: 2022-05-13 01:58:07.924000        🧑  作者: Mango
数据科学概述数据科学是对数据的研究。就像生物科学是对生物学的研究,物理科学是对物理反应的研究。数据是真实的,数据具有真实的属性,如果我们要研究它们,就需要研究它们。数据科学涉及数据和一些迹象。这是一个过程,而不是一个事件。它是使用数据来理解太多不同的事物、了解世界的过程。假设当您有一个模型或建议的问题解释,并且您尝试使用您的数据验证该建议的解释或模型时。它是展现隐藏(或抽象)在数据背后的洞察力和趋...
📅  最后修改于: 2022-05-13 01:58:07.932000        🧑  作者: Mango
基于实例的学习被归类为基于实例的学习的机器学习系统是这样的系统,它用心学习训练实例,然后基于某些相似性度量推广到新实例。之所以称为基于实例,是因为它根据训练实例构建假设。它也被称为基于记忆的学习或惰性学习。该算法的时间复杂度取决于训练数据的大小。该算法的最坏情况时间复杂度为O (n),其中 n 是训练实例的数量。例如,如果我们要使用基于实例的学习算法创建垃圾邮件过滤器,而不是仅仅标记已经标记为垃圾...
📅  最后修改于: 2022-05-13 01:58:07.938000        🧑  作者: Mango
本地关系网络局部关系网络是由清华大学和微软研究院的研究人员提出的。本文背后的想法是,卷积层多年来一直是计算机视觉领域的主要特征提取器。然而,这种空间聚合过程只是一种模式匹配过程,对于对具有变化空间分布的视觉元素进行建模的视觉过程是低效的。为了解决这种低效率问题,本文提出了一种新的图像特征提取器,称为局部关系层,它根据局部像素对的组合关系自适应地确定聚合权重。通过这种关系方法,它可以以更有效的方式将...
📅  最后修改于: 2022-05-13 01:58:07.946000        🧑  作者: Mango
深入了解强化学习自从旧 Atari 游戏赢得 Minds 的惊人结果以来,强化学习的主题近年来绝对增长了,AlphaGo 在机械臂操纵方面取得了惊人的突破,甚至在 1v1 dota 中击败了职业选手。自 2012 年 ImageNet 分类挑战取得令人瞩目的突破以来,监督深度学习的成功不断堆积,各行各业的人们开始使用深度神经网络解决各种新问题,包括如何学习智能行为在复杂的动态环境中。为什么监督学习...
📅  最后修改于: 2022-05-13 01:58:07.955000        🧑  作者: Mango
Sheppard 的片刻修正 |机器学习先决条件:原始和中心时刻我们假设在分组数据中频率集中在类间隔的中间部分。这个假设在一般情况下不成立,并且引入了分组错误。这种影响可以在计算矩时通过使用类间隔宽度的信息来纠正。Sheppard's Correction for grouping error只不过是对分组数据或连续数据的计算样本矩的调整。 WF Sheppard 教授证明,如果频率分布是连续的,...
📅  最后修改于: 2022-05-13 01:58:07.961000        🧑  作者: Mango
理解 GoogLeNet 模型——CNN 架构Google Net(或 Inception V1)是由 Google 研究(与多所大学合作)于 2014 年在题为“Going Deeper with Convolutions”的研究论文中提出的。该架构是 ILSVRC 2014 图像分类挑战赛的获胜者。与之前的获胜者 AlexNet(ILSVRC 2012 的获胜者)和 ZF-Net(ILSVRC...
📅  最后修改于: 2022-05-13 01:58:07.968000        🧑  作者: Mango
情绪中位数检验Mood 的中值检验:它是单向方差分析的一种非参数替代方法。这是 Pearson 卡方检验的一个特例。它测试两个或更多组的中位数是否不同,并计算可能包括总体中位数之间差异的值范围。在此测试中,不同的数据组具有相似形状的分布。每个样本中的数据被分配到两组——一种由值高于样本组合中位数的数据组成。另一个由值在中位数或以下的数据组成。Mood 中位数检验的假设数据应仅包括一个分类因素。响应...
📅  最后修改于: 2022-05-13 01:58:07.975000        🧑  作者: Mango
ROBERTa 模型概述RoBERTa 代表稳健优化的 BERT 预训练方法。它是由 Facebook 和华盛顿大学的研究人员提出的。本文的目标是优化 BERT 架构的训练,以便在预训练期间花费更少的时间。对 BERT 的修改:RoBERTa 的架构与 BERT 几乎相似,但为了改进 BERT 架构的结果,作者对其架构和训练过程进行了一些简单的设计更改。这些变化是:移除下一句预测 (NSP) 目标...
📅  最后修改于: 2022-05-13 01:58:07.981000        🧑  作者: Mango
人工智能的影响和例子人工智能是一种有望改变世界运作方式的技术。这是前所未有的经济影响规模,它影响着我们生活的每个行业和各个方面。人工智能对不同的人意味着不同的东西。视频游戏设计师——对于视频游戏设计师来说,人工智能意味着编写影响机器人游戏方式以及环境对玩家反应方式的代码。编剧——对于编剧来说,人工智能意味着一个字符像人类一样,混合了一些电脑功能。数据科学家——对于科学家来说,人工智能可能是一种探索...
📅  最后修改于: 2022-05-13 01:58:07.988000        🧑  作者: Mango
管理机器学习项目的 7 个最佳工具对于每个 ML 爱好者或从事这些项目的学生/开发人员来说,管理机器学习项目并不是一件容易的事。甚至 Gartner 在其一项研究中也得出结论,今年 85% 的 ML 项目都失败了。而且,如果您的个人弱点或从事任何机器学习项目的整个团队的弱点在需要时没有被适当的专业知识和协作所取代,那么这种趋势可能会在未来继续下去。无论您正在从事的项目是否也可能在没有任何事先暗示的...