📝 机器学习教程
383篇技术文档📅  最后修改于: 2022-05-13 01:58:08.517000        🧑  作者: Mango
分位数分位数图分位数-分位数图是一种图形方法,用于确定两个数据样本是否来自同一总体。 qq 图是第一个数据集的分位数与第二个数据集的分位数的图。分位数是指低于给定值的点的分数(或百分比)。出于参考目的,还绘制了一条 45% 的线,如果样本来自同一总体,则点沿着这条线。正态分布:正态分布(又名高斯分布/贝尔曲线)是一种连续概率分布,表示从随机生成的真实值中获得的分布。下面是代表不同标准偏差的部分数据...
📅  最后修改于: 2022-05-13 01:58:08.524000        🧑  作者: Mango
毫升 |集群间和集群内距离聚类分析 -聚类过程的目的是发现数据属性之间的整体分布模式和有趣的相关性。将一组对象分组的任务是使同一组中的对象彼此之间比其他组中的对象更相似。聚类分析本身不是一种特定的算法,而是要解决的一般任务。它可以通过各种算法来实现,这些算法在理解集群的构成以及如何有效地找到它们方面存在显着差异。集群的流行概念包括集群成员之间距离较小的组、数据空间的密集区域、间隔或特定的统计分布。...
📅  最后修改于: 2022-05-13 01:58:08.530000        🧑  作者: Mango
斯皮尔曼等级相关性什么是相关性检验?两个变量之间的关联强度称为相关性检验。例如,如果我们想知道父子的身高是否有关系,可以计算一个相关系数来回答这个问题。有关相关性的更多信息,请参阅此。相关分析方法:主要有两种类型的相关性:参数相关性——皮尔逊相关性(r):它测量两个变量(x 和 y)之间的线性相关性,被称为参数相关性检验,因为它取决于数据的分布。非参数相关 - Kendall(tau)和Spear...
📅  最后修改于: 2022-05-13 01:58:08.539000        🧑  作者: Mango
机器学习中的 Bagging 与 Boosting众所周知,集成学习通过组合多个模型来帮助提高机器学习结果。与单个模型相比,这种方法允许产生更好的预测性能。基本思想是学习一组分类器(专家)并让他们投票。Bagging和Boosting是集成学习的两种类型。这两个减少了单个估计的方差,因为它们结合了来自不同模型的多个估计。所以结果可能是一个稳定性更高的模型。让我们一目了然地理解这两个术语。Baggi...
📅  最后修改于: 2022-05-13 01:58:08.546000        🧑  作者: Mango
短期记忆在更广泛的神经学家和研究大脑的社区中,人们一致认为,两个暂时不同的过程有助于大脑功能的获得和表达。这些变化可能导致神经元操作的长期改变,例如通过突触传递中的活动依赖性变化。现在有强有力的证据表明一个互补的过程,在称为短期记忆或 STM 的中间时间尺度上起作用。执行需要临时存储和操作以指导适当操作的任务的过程。以下是在学习 STM 时应解决的一些重要问题:如何选择神经信息进行存储并临时存储在...
📅  最后修改于: 2022-05-13 01:58:08.553000        🧑  作者: Mango
神经网络和深度学习系统之间的区别自 1950 年代后期成立以来,人工智能和机器学习已经走过了漫长的道路。近年来,这些技术变得相当复杂和先进。虽然数据科学领域的技术进步值得称赞,但它们导致了大量的术语超出了普通人的理解。有这么多各种规模的公司都在使用这些技术,即。人工智能和机器学习在他们的日常应用中。然而,许多人难以区分其庞大的术语。大多数人甚至可以互换使用“机器学习”、“深度学习”和“人工智能”这...
📅  最后修改于: 2022-05-13 01:58:08.560000        🧑  作者: Mango
分类中使用的交叉熵成本函数成本函数的简要概念您的老师如何评估您是否在整个学年都学习过?她在最后进行测试,并通过交叉检查您的答案与所需答案来对您的表现进行评分。如果你设法保持了自己的准确性,并且你的分数超过了某个基准,那么你就通过了。如果您还没有(尽管不太可能),您需要提高准确性并再次尝试。因此,粗略地说,测试用于分析您在课堂上的表现。在机器学习术语中,“成本函数”用于评估模型的性能。可能出现的一个...
📅  最后修改于: 2022-05-13 01:58:08.568000        🧑  作者: Mango
人工智能中的环境类型人工智能中的环境是代理的周围。代理通过传感器从环境中获取输入,并通过执行器将输出传递给环境。有几种类型的环境:完全可观察 vs 部分可观察确定性与随机性竞争与合作单代理 vs 多代理静态与动态离散 vs 连续1. 完全可观察与部分可观察当代理传感器能够在每个时间点感知或访问代理的完整状态时,它被称为完全可观察的环境,否则它是部分可观察的。维护一个完全可观察的环境很容易,因为不需...
📅  最后修改于: 2022-05-13 01:58:08.574000        🧑  作者: Mango
ML – 遗传算法的收敛介绍:遗传算法是概率搜索优化技术,它对染色体群体进行操作,代表给定问题的潜在解决方案。在标准的遗传算法中,1 和 0 的二进制字符串代表染色体。每个染色体都分配了一个适应度值,表示其反映给定目标函数的质量。这样的种群是通过繁殖和重组运算符进化出来的,以培育出最优解的染色体。进化继续运行,直到满足某个终止条件。到目前为止遇到的最好的染色体然后被认为是找到的解决方案。遗传算法同...
📅  最后修改于: 2022-05-13 01:58:08.580000        🧑  作者: Mango
认知计算认知计算是计算的一个分支,它像大脑一样使用计算机模型来寻找某些复杂问题的答案。认知计算基本上是神经形态和冯诺依曼计算模型的融合。传统上,计算机基于冯诺依曼计算机模型,因为它们过去用于执行分析操作而不是执行推理操作,但是如今计算机网络已经变得越来越进步。当今世界正在关注人工智能和机器学习在计算机和各种设备中的集成,以解决各种复杂问题。目前,许多设备使用人工神经网络 (ANN)来模拟大脑工作的...
📅  最后修改于: 2022-05-13 01:58:08.587000        🧑  作者: Mango
非负矩阵分解先决条件:低秩近似</p>非负矩阵分解:对于维度为mxn的矩阵A,其中每个元素≥ 0,NMF 可以将其分解为两个分别具有维度 mxk和kxn 的矩阵 W 和 H,并且这两个矩阵仅包含非负元素。这里,矩阵 A 定义为:该方法广泛用于执行诸如面部识别中的特征减少和各种 NLP 任务等任务。直觉:图 1:NMF 直觉NMF 的目标是降维和特征提取。因此,当我们将较低的维度设置为 k 时,NM...
📅  最后修改于: 2022-05-13 01:58:08.593000        🧑  作者: Mango
使用 pelican 构建您的数据科学博客获得数据科学工作的第一步是建立可靠的个人资料。有抱负的数据科学家经常在该领域进行研究和研究,但未能在正确的方向上采取正确的步骤。但专家建议有抱负的数据科学家写博客或制作视频教程,以展示他们在数据科学领域的知识。它不仅表明候选人拥有知识,而且还证明了您的书面或口头技能。教程是学习新事物的一种方式,尤其是当它在网络上由您编写时。优点是,这个概念会留在你的脑海中...
📅  最后修改于: 2022-05-13 01:58:08.599000        🧑  作者: Mango
归纳学习算法归纳学习算法 (ILA) 是一种迭代和归纳机器学习算法,用于生成一组分类规则,生成“IF-THEN”形式的规则,对于一组示例,在每次迭代时生成规则和附加到规则集。基本理念:基本上有两种方法可以从领域专家那里提取知识,然后是机器学习。对于非常大量的数据,领域专家并不是非常有用和可靠。所以我们转向机器学习方法来完成这项工作。使用机器学习 一种方法是以算法的形式复制专家逻辑,但这项工作非常繁...
📅  最后修改于: 2022-05-13 01:58:08.606000        🧑  作者: Mango
Python和 Jupyter 安装在windows中安装Python 。Step1:首先打开chrome或firefox等网络浏览器步骤 2:在搜索选项卡中输入此链接“Python”步骤3:在该网站寻找下载链接,点击下载最新版本的PythonStep4:下载后我们可以通过点击可执行文件进行安装在安装过程中单击立即安装并添加路径如何使用命令提示符运行Python代码Step1:安装成功后;打开记事...
📅  最后修改于: 2022-05-13 01:58:08.612000        🧑  作者: Mango
探索性数据分析 (EDA) – 类型和工具John Tukey 提倡探索性数据分析,以鼓励统计学家探索数据,并可能制定可能导致新数据收集和实验的假设。 EDA 更专注于检查模型拟合和假设检验所需的假设。它还在处理缺失值和根据需要进行变量转换时进行检查。EDA 建立了对数据、与信息或流程相关的问题的强大理解。这是获取数据故事的科学方法。探索性数据分析的类型:单变量非图形多元非图形单变量图形多元图形1...