📝 机器学习
41篇技术文档📅  最后修改于: 2020-09-29 01:33:00        🧑  作者: Mango
关联规则学习关联规则学习是一种无监督的学习技术,它检查一个数据项与另一个数据项之间的依存关系,并相应地进行映射,以使其更具收益。它试图在数据集的变量之间找到一些有趣的关系或关联。它基于不同的规则来发现数据库中变量之间有趣的关系。关联规则学习是机器学习中非常重要的概念之一,它被用于市场篮分析,Web使用挖掘,连续生产等。这里,市场篮分析是各种大型零售商用来发现关联的技术。项目之间。我们可以通过以超市...
📅  最后修改于: 2020-09-29 03:21:19        🧑  作者: Mango
机器学习中的混淆矩阵混淆矩阵是用于确定给定一组测试数据的分类模型的性能的矩阵。只能确定测试数据的真实值是否已知。矩阵本身很容易理解,但是相关术语可能会造成混淆。由于它以矩阵形式显示模型性能中的误差,因此也称为误差矩阵。混淆矩阵的一些功能如下:对于分类器的2个预测类,矩阵是2 * 2表,对于3个类,它是3 * 3表,依此类推。矩阵分为两个维度,即预测值和实际值以及预测的总数。预测值是由模型预测的那些...
📅  最后修改于: 2020-09-29 03:24:49        🧑  作者: Mango
机器学习中的交叉验证交叉验证是一种通过在输入数据的子集上训练模型效率并对输入数据的先前未见子集进行测试来验证模型效率的技术。我们也可以说这是一种检查统计模型如何概括为独立数据集的技术。在机器学习中,始终需要测试模型的Solidity。这意味着仅基于训练数据集;我们无法将模型拟合到训练数据集上。为此,我们保留数据集的特定样本,该样本不属于训练数据集。之后,我们在部署之前在该样本上测试我们的模型,并且...
📅  最后修改于: 2020-09-29 03:26:44        🧑  作者: Mango
数据科学与机器学习之间的区别数据科学是数据清洗,准备和分析的研究,而机器学习是AI和数据科学子领域的分支。数据科学和机器学习是两种流行的现代技术,并且以不适当的速度在增长。但是,这两个流行语以及人工智能和深度学习是一个非常令人困惑的术语,因此了解它们之间的区别非常重要。在本主题中,我们将仅了解数据科学和机器学习之间的区别,以及它们之间的关系。数据科学和机器学习彼此密切相关,但是功能不同,目标也不同...
📅  最后修改于: 2020-09-29 03:28:28        🧑  作者: Mango
机器学习和深度学习之间的区别机器学习和深度学习是数据科学的两个主要概念,也是人工智能的子集。大多数人认为机器学习,深度学习以及人工智能是相同的流行语。但实际上,所有这些术语都是不同的,但彼此相关。在本主题中,我们将学习机器学习与深度学习有何不同。但是在学习差异之前,首先让我们简要介绍一下机器学习和深度学习。什么是机器学习?机器学习是人工智能和不断发展的技术的一部分,它使机器能够从过去的数据中学习并...
📅  最后修改于: 2020-09-29 03:29:44        🧑  作者: Mango
降维技术简介什么是降维?给定数据集中存在的输入要素,变量或列的数量称为维数,而减少这些特征的过程称为维数减少。数据集在各种情况下都包含大量输入特征,这使得预测建模任务更加复杂。由于很难对具有大量特征的训练数据集进行可视化或做出预测,因此在这种情况下,需要使用降维技术。降维技术可以定义为:“这是一种将较高维度的数据集转换为较小维度的数据集,以确保提供相似信息的方法。”这些技术广泛用于机器学习中,以在...
📅  最后修改于: 2020-09-29 04:43:16        🧑  作者: Mango
机器学习算法机器学习算法是可以从数据中学习隐藏模式,预测输出并根据自身经验提高性能的程序。可以在机器学习中针对不同的任务使用不同的算法,例如可以用于诸如股票市场预测之类的预测问题的简单线性回归,而可以将KNN算法用于分类问题。在本主题中,我们将概述一些流行且最常用的机器学习算法,以及它们的用例和类别。机器学习算法的类型机器学习算法大致可分为三类:监督学习算法无监督学习算法强化学习算法下图说明了不同...
📅  最后修改于: 2020-09-29 04:44:53        🧑  作者: Mango
机器学习中的过度拟合和不足拟合过度拟合和欠拟合是机器学习中发生的两个主要问题,它们降低了机器学习模型的性能。每个机器学习模型的主要目标是很好地概括。在这里,泛化定义了ML模型通过调整给定的未知输入集来提供合适输出的能力。这意味着在对数据集进行训练之后,它可以产生可靠且准确的输出。因此,欠拟合和过拟合是需要检查模型性能的两个术语以及模型是否泛化得很好。在了解过拟合和欠拟合之前,让我们了解一些基本术语...
📅  最后修改于: 2020-09-29 04:46:07        🧑  作者: Mango
主成分分析主成分分析是一种无监督的学习算法,用于减少机器学习中的维数。这是一个统计过程,借助正交变换将相关特征的观察结果转换为一组线性不相关特征。这些新的转换后的功能称为主成分。它是用于探索性数据分析和预测建模的流行工具之一。这是一种通过减少方差从给定的数据集中绘制强模式的技术。PCA通常尝试找到低维表面来投影高维数据。PCA通过考虑每个属性的方差来工作,因为高属性显示类别之间的良好划分,因此降低...
📅  最后修改于: 2020-09-29 05:23:34        🧑  作者: Mango
什么是P值在统计假设检验中,通过假设无效假设(H0)为真,P值(有时称为概率值)用于观察检验结果或更极端的结果。在数据科学中,有很多概念是从不同学科借来的,p值就是其中之一。 p值的概念来自统计,并广泛用于机器学习和数据科学中。P值还用作确定拒绝点的替代方法,以便提供最小或最小否定假设的显着性水平。它表示为介于0和1之间的显着性水平,如果p值较小,则将有强有力的证据拒绝原假设。如果p值的值非常小,...
📅  最后修改于: 2020-09-29 05:24:44        🧑  作者: Mango
机器学习中的正则化什么是正则化?正则化是机器学习的最重要概念之一。它是一种通过向模型添加额外信息来防止模型过度拟合的技术。有时,机器学习模型在训练数据上表现良好,但在测试数据上表现不佳。这意味着当通过在输出中引入噪声来处理看不见的数据时,该模型无法预测输出,因此该模型称为过拟合。可以借助正则化技术来解决此问题。可以以某种方式使用该技术,该技术将允许通过减小变量的大小来维护模型中的所有变量或特征。因...