📜  敏捷数据科学-预测的作用

📅  最后修改于: 2021-01-23 05:51:46             🧑  作者: Mango


在本章中,我们将了解预测在敏捷数据科学中的作用。交互式报告展示了数据的不同方面。预测构成敏捷冲刺的第四层。

第四层

进行预测时,我们总是参考过去的数据,并将其用作未来迭代的推论。在这个完整的过程中,我们将数据从历史数据的批处理过渡到有关未来的实时数据。

预测的作用包括以下内容-

  • 预测有助于预测。一些预测是基于统计推断的。一些预测是基于专家的观点。

  • 统计推断涉及各种预测。

  • 有时预测是准确的,而有时预测是不准确的。

预测分析

预测分析包括来自预测建模,机器学习和数据挖掘的各种统计技术,这些技术可以分析当前和历史事实以对未来和未知事件做出预测。

预测分析需要训练数据。训练后的数据包括独立和相关的功能。相关功能是用户试图预测的值。独立特征是描述我们希望基于依赖特征进行预测的事物的特征。

对特征的研究称为特征工程。这对于做出预测至关重要。数据可视化和探索性数据分析是功能工程的一部分;这些构成了敏捷数据科学的核心。

特征工程

做出预测

敏捷数据科学中有两种预测方法-

  • 回归

  • 分类

建立回归或分类完全取决于业务需求及其分析。连续变量的预测导致回归模型,分类变量的预测导致分类模型。

回归

回归考虑了包含特征的示例,从而产生了数值输出。

分类

分类接受输入并产生分类。

–定义统计预测输入并使机器能够学习的示例数据集称为“训练数据”。