📜  数据科学过程

📅  最后修改于: 2022-05-13 01:57:05.521000             🧑  作者: Mango

数据科学过程

数据科学可以是一个结合了处理大量信息、创建计算、使用机器学习等以提供贸易见解的空间。它结合了处理大量信息的工作。包括不同的过程来从源推断信息,如数据提取、信息准备、模型规划、模型构建等等。下图描绘了数据科学的各种过程。

数据处理

让我们简要介绍一下每个过程。

  • 发现

    首先,获得与企业相关的不同决定、先决条件、需求和所需预算是非常必要的。您必须有能力询问正确的问题,例如您是否拥有所需的资产。这些资产可以是个人、创新、时间和信息。在此阶段,您也必须概述贸易问题并定义要测试的起始假设 (IH)。

  • 资料准备

    在此阶段,您希望调查、预处理和调整数据以进行建模。您将能够执行信息清理、更改和可视化。这将帮助您发现异常并建立因素之间的关系。清理并整理好信息后,就该对其进行探索性分析了。

  • 模型规划

    在这里,您可以决定绘制因素之间联系的策略和方法。这些连接将为您在下一阶段执行的计算奠定基础。您可以利用不同的事实方程和可视化设备应用探索性数据分析 (EDA)。

  • 建筑模型

    在此阶段,您将创建用于训练和测试目的的数据集。您可以分析不同的学习过程,如分类、关联和聚类,最后实现最优秀的拟合技术来构建节目。

  • 操作化

    在这个阶段,你传达最后的简报、代码和专门的报告。在扩展中,现在还在实时生成环境中实现了一个试点项目。这将使您清楚地了解执行和其他相关限制。

  • 沟通结果

    目前,评估目标的结果至关重要。因此,在最后阶段,您要识别所有关键发现,与合作伙伴沟通,并根据第 1 阶段创建的标准决定风险投资的结果是胜利还是失败。