先决条件:分类与回归
分类和回归是两个主要的预测问题,通常会与数据挖掘和机器学习一起处理。
分类是发现或发现模型或函数的过程,该过程有助于将数据分为多个类别,即离散值。在分类中,根据输入中提供的一些参数将数据分类在不同的标签下,然后为数据预测标签。
可以以“ IF-THEN”规则的形式演示导出的映射函数。分类过程处理的问题是,数据可以分为二进制或多个离散标签。
让我们举一个例子,假设我们要根据较早记录的一些参数来预测A队获胜的可能性。然后会有两个标签“是”和“否”。
图片:二进制分类和多分类回归是寻找模型或函数以将数据区分为连续实值而不是使用类或离散值的过程。它还可以根据历史数据来识别分布运动。由于回归预测模型可以预测数量,因此,必须将模型的技能报告为这些预测中的错误
让我们在回归中也使用类似的示例,借助早期记录的一些参数,我们发现某些特定区域可能下雨。然后就有可能与下雨有关。
图片:日回归vs降雨(mm)
比较和回归之间的比较:
Paramenter | CLASSIFICATION | REGRESSION |
---|---|---|
Basic | Mapping Function is used for mapping of values to predefined classes. | Mapping Function is used for mapping of values to continuous output. |
Involves prediction of | Discrete values | Continuous values |
Nature of the predicted data | Unordered | Ordered |
Method of calculation | by measuring accuracy | by measurement of root mean square error |
Example Algorithms | Decision tree, logistic regression, etc. | Regression tree (Random forest), Linear regression, etc. |