📝 机器学习教程
383篇技术文档📅  最后修改于: 2022-05-13 01:58:07.278000        🧑  作者: Mango
Moore – Penrose 伪逆|数学在线性代数伪逆() 的矩阵A是逆矩阵的推广。伪逆最常见的用途是计算缺乏唯一解的线性方程组的最佳拟合解。Moore – Penrose 逆是最广为人知的矩阵伪逆类型。术语广义逆有时用作伪逆的同义词。让系统给出如下:我们知道A和,我们想找到.在哪里:和是向量,A是一个矩阵如果 A 是方阵,我们进行如下操作:但是如果 A 不是方阵,我们就不能计算通常的.然而,我...
📅  最后修改于: 2022-05-13 01:58:07.285000        🧑  作者: Mango
IBM HR Analytics 使用随机森林分类器对员工流失和绩效进行分析人员流失是一个影响所有企业的问题,无论公司的地理位置、行业和规模如何。这是一个组织的主要问题,预测人员流动是许多组织人力资源 (HR) 需求的首要任务。组织面临因员工流失而导致的巨额成本。随着机器学习和数据科学的进步,可以预测员工流失,我们将使用随机森林分类器算法进行预测。数据集:IBM 人力资源部门发布的数据集在 Kag...
📅  最后修改于: 2022-05-13 01:58:07.295000        🧑  作者: Mango
使用 Sunbird 处理缺失值Sunbird库用于特征工程目的。在这个库中,您将获得处理缺失值、异常值、分类编码、归一化和标准化、特征选择技术等的各种技术。安装:处理缺失值:数据集可能存在缺失值,这可能会导致某些机器学习算法出现问题。在对预测评估进行建模之前,识别和替换输入数据中每一列的缺失值确实是一个很好的做法。这称为插补。1. 中值插补数据集中具有常量数值的列,这些数值被列中剩余值的中位数替...
📅  最后修改于: 2022-05-13 01:58:07.307000        🧑  作者: Mango
毫升 |回归模型中的虚拟变量陷阱在了解哑变量陷阱之前,让我们先了解什么是真正的哑变量。回归模型中的虚拟变量:在统计学中,特别是在回归模型中,我们处理各种类型的数据。数据可以是定量的(数字的)或定性的(分类的)。数值数据可以在回归模型中轻松处理,但我们不能直接使用分类数据,它需要以某种方式进行转换。为了将分类属性转换为数值属性,我们可以使用标签编码程序(标签编码为每个类别的数据分配一个唯一的整数)。...
📅  最后修改于: 2022-05-13 01:58:07.318000        🧑  作者: Mango
信息检索中的准确率和召回率信息系统可以用两个指标来衡量:准确率和召回率。当用户决定搜索某个主题的信息时,整个数据库和要获得的结果可以分为4类:相关和检索相关且未检索不相关和检索不相关且未检索相关项目是帮助用户回答问题的那些文档。非相关项目是不提供实际有用信息的项目。对于每个项目,有两种可能性可以通过用户的查询检索或不检索。精度定义为相关和检索到的文档数(检索到的对用户实际有用并符合其搜索需求的项目...
📅  最后修改于: 2022-05-13 01:58:07.328000        🧑  作者: Mango
使用 KNN 和 KDTree 进行信息检索的介绍指南什么是信息检索(IR)?它可以定义为一种软件程序,用于从大型集合(通常存储在计算机上)中查找满足信息需求的非结构化性质(通常是文本)的材料(通常文档)。它可以帮助用户找到他们所需的信息,但不会明确返回他们问题的答案。它提供有关可能包含所需信息的文档的存在和位置的信息。信息检索用例信息检索可用于许多场景,其中一些是:网络搜索电子邮件搜索搜索您的笔...
📅  最后修改于: 2022-05-13 01:58:07.342000        🧑  作者: Mango
Power BI – 在层次结构中向下钻取和向上钻取先决条件:工具和功能本文展示了如何在 Power BI 中向上和向下钻取以通过不同级别可视化数据。使用向下钻取和向上钻取您的数据点,您可以深入探索有关您的数据的详细信息。当视觉对象具有层次结构时,您可以向下钻取以显示其他详细信息。什么是钻孔?钻取使您能够在数据源的维度层次结构中的不同级别之间导航。这允许您查看特定区域的基础数据,并根据您的信息需求...
📅  最后修改于: 2022-05-13 01:58:07.353000        🧑  作者: Mango
深度参数连续卷积神经网络深度参数连续内核卷积是由 Uber Advanced Technologies Group 的研究人员提出的。本文背后的动机是简单的 CNN 架构采用类似网格的架构,并使用离散卷积作为其基本块。这抑制了他们对许多实际应用程序执行精确卷积的能力。因此,他们提出了一种称为参数连续卷积的卷积方法。参数连续卷积:参数连续卷积是一种可学习的运算符,可在非网格上运行结构化数据和探索跨越...
📅  最后修改于: 2022-05-13 01:58:07.364000        🧑  作者: Mango
毫升 |基于案例推理 (CBR) 分类器正如我们所知,最近邻分类器将训练元组存储为欧几里得空间中的点。但是基于案例的推理分类器 (CBR)使用问题解决方案数据库来解决新问题。它将用于解决问题的元组或案例存储为复杂的符号描述。社区康复如何运作?当出现要分类的新案例时,基于案例的推理器(CBR)将首先检查是否存在相同的训练案例。如果找到,则返回该案例的随附解决方案。如果没有找到相同的案例,则 CBR ...
📅  最后修改于: 2022-05-13 01:58:07.373000        🧑  作者: Mango
ANN – 自组织神经网络 (SONN)自组织神经网络 (SONN)是人工神经网络中的一种无监督学习模型,称为自组织特征映射或 Kohonen 映射。这些特征图是在模型训练(基于竞争学习)期间生成的输入空间的二维离散形式。这种现象与生物系统非常相似。在人的皮层中,多维的感觉输入空间(如听觉、运动、触觉、视觉、体感等)由二维图表示。这种高维输入到降维映射的投影被称为拓扑守恒。而这种拓扑保存映射可以通...
📅  最后修改于: 2022-05-13 01:58:07.381000        🧑  作者: Mango
Adagrad 优化器背后的直觉Adagrad代表自适应梯度优化器。有梯度下降、随机梯度下降、小批量 SGD 等优化器,都用于减少与权重相关的损失函数。权重更新公式如下:基于迭代,这个公式可以写成:在哪里w(t)= 当前迭代的 w 值,w(t-1)= 前一次迭代的 w 值,η= 学习率。在 SGD 和小批量 SGD 中,每个权重的 η 值曾经是相同的,或者说对于每个参数。通常,η = 0.01。但...
📅  最后修改于: 2022-05-13 01:58:07.389000        🧑  作者: Mango
人工智能——术语人工智能是一项研究,使计算机,机器人,一般来说,机器在解决任何问题时会思考人类的智力如何工作,思考和学习。这将影响比平常更智能的软件系统。人工智能的主要目标是增强与自然知识相关的计算机功能,用于说明、逻辑、知识和问题解答。人工智能研究的目的是逻辑、知识表示、规划、知识、自然语言处理、实现以及移动和操纵对象的能力。通用情报部门有长期意图。方法包括统计方法、计算智能和传统的编码 AI。...
📅  最后修改于: 2022-05-13 01:58:07.396000        🧑  作者: Mango
霍普菲尔德神经网络先决条件:RNN由 John J. Hopfield 博士发明的 Hopfield 神经网络由一层“n”个完全连接的循环神经元组成。它通常用于执行自动关联和优化任务。它是使用收敛的交互过程计算的,它产生与我们普通神经网络不同的响应。离散 Hopfield 网络:它是一个完全互连的神经网络,其中每个单元都连接到其他每个单元。它以离散方式运行,即它提供有限的不同输出,通常有两种类型:...
📅  最后修改于: 2022-05-13 01:58:07.404000        🧑  作者: Mango
SEMMA模型SEMMA 是构建机器学习模型的顺序方法,它包含在“SAS Enterprise Miner”中,SAS Institute Inc. 是最大的商业统计和商业智能软件生产商之一的产品。然而,顺序步骤指导机器学习系统的开发。让我们看一下五个连续的步骤,以便更好地理解它。机器学习中的SEMMA模型示例:这一步是关于从为构建模型提供的大型数据集中选择正确体积数据集的子集。它将帮助我们非常有...
📅  最后修改于: 2022-05-13 01:58:07.411000        🧑  作者: Mango
Dex 散点图散点图用于确定两个变量之间是否存在某种相关性。此图使用点来表示数据集中的不同数据点。 dex(设计和实验)散点图是一种用于过程分析的技术。Dex 散点图用于回答三个重要问题:哪些数据点是异常值?如果数据点来自不同的概率分布或来自不同的确定性数据点,则称为异常值。最重要的因素是什么?在这里,重要的因素是当我们将因子从“+”侧更改为“-”侧或反之亦然时导致响应变量发生显着变化的那些因素。...