📜  敏捷数据科学-数据科学过程

📅  最后修改于: 2021-01-23 05:48:55             🧑  作者: Mango


在本章中,我们将了解数据科学过程以及理解该过程所需的术语。

“数据科学是数据接口,算法开发和技术的融合,以解决复杂的分析问题”。

数据科学过程

数据科学是一个涵盖科学方法,过程和系统的跨学科领域,其类别包括机器学习,数学和统计知识以及传统研究。它还包括黑客技巧和大量专业知识的结合。数据科学借鉴了数学,统计学,信息科学和计算机科学,数据挖掘和预测分析的原理。

下面提到了构成数据科学团队一部分的不同角色-

顾客

客户是使用产品的人。他们的兴趣决定了项目的成功,他们的反馈在数据科学中非常有价值。

业务发展

这个数据科学团队可以直接或通过创建登录页面和促销活动来吸引早期客户。业务开发团队交付产品的价值。

产品经理

产品经理重视创造最好的产品,这在市场上很有价值。

互动设计师

他们专注于围绕数据模型进行设计交互,以便用户找到适当的价值。

数据科学家

数据科学家以新的方式探索和转换数据,以创建和发布新功能。这些科学家还结合了来自各种来源的数据,以创造新的价值。他们在与研究人员,工程师和Web开发人员一起创建可视化文件中发挥着重要作用。

研究人员

顾名思义,研究人员参与了研究活动。它们解决了数据科学家无法解决的复杂问题。这些问题涉及机器学习和统计模块的重点和时间。

适应变化

数据科学的所有团队成员都必须适应新的变化并在需求的基础上开展工作。为了采用敏捷方法论和数据科学,应进行一些更改,这些更改如下:

  • 选择通才而不是专家。

  • 小团队优先于大团队。

  • 使用高级工具和平台。

  • 持续不断地共享中间工作。

注意

在敏捷数据科学团队中,一小组通才使用可扩展的高级工具,并通过迭代将数据精炼成越来越高的价值状态。

考虑以下与数据科学团队成员的工作相关的示例-

  • 设计师提供CSS。

  • Web开发人员构建整个应用程序,了解用户体验和界面设计。

  • 数据科学家应致力于研究和构建包括Web应用程序在内的Web服务。

  • 研究人员在代码库中工作,该代码库显示了解释中间结果的结果。

  • 产品经理尝试识别和理解所有相关领域中的缺陷。