📅  最后修改于: 2020-09-28 05:47:07             🧑  作者: Mango
回归和分类算法是监督学习算法。两种算法都用于机器学习中的预测并与标记的数据集一起使用。但是两者之间的区别在于它们如何用于不同的机器学习问题。
回归算法和分类算法之间的主要区别在于:回归算法用于预测连续值,例如价格,工资,年龄等;分类算法用于预测/分类离散值,例如,男性或女性,真或假,垃圾邮件或非垃圾邮件等
考虑下图:
分类是找到一个函数的过程,该函数有助于根据不同的参数将数据集分为几类。在分类中,在训练数据集上训练计算机程序,并基于该训练将数据分类为不同的类别。
分类算法的任务是找到将输入(x)映射到离散输出(y)的映射函数 。
示例:了解分类问题的最佳示例是电子邮件垃圾邮件检测。该模型基于数百万个具有不同参数的电子邮件进行了训练,并且每当收到新电子邮件时,它都会识别该电子邮件是否为垃圾邮件。如果电子邮件是垃圾邮件,则将其移至“垃圾邮件”文件夹。
ML分类算法的类型:
分类算法可以进一步分为以下几种类型:
回归是寻找因变量和自变量之间的相关性的过程。它有助于预测连续变量,例如预测市场趋势,预测房价等。
回归算法的任务是找到将输入变量(x)映射到连续输出变量(y)的映射函数 。
示例:假设我们要进行天气预报,因此为此,我们将使用回归算法。在天气预报中,该模型是根据过去的数据进行训练的,一旦训练完成,就可以轻松预测未来几天的天气。
回归算法的类型:
Regression Algorithm | Classification Algorithm |
---|---|
在回归中,输出变量必须是连续的值 | 在分类中,输出变量必须是离散值 |
回归算法的任务是将输入值(x)映射到连续输出变量(y) | 分类算法的任务是将输入值(x)映射到离散的输出变量(y) |
回归算法主要使用连续的数据 | 分类算法主要使用离散的数据 |
在回归分析中,我们试图找到能更准确地预测输出的最佳拟合线 | 在分类中,我们尝试寻找决策边界,以将数据集划分为不同的类 |
回归算法可以用来解决天气预报、房价预测等回归问题 | 分类算法可用于解决垃圾邮件识别、语音识别、癌细胞识别等分类问题 |
回归算法可以进一步分为线性回归和非线性回归 | 分类算法可分为二元分类器和多类分类器 |