📜  数据架构设计与数据管理

📅  最后修改于: 2021-08-24 04:42:50             🧑  作者: Mango

在计算机和Internet的初期,使用的数据已不像今天那样多。因此,所有用户和商业企业都可以在一台计算机上如此轻松地存储和管理数据,因为数据从未超出数据量达到19 EB,但现在这个时代的数据每天增加了约2.5兆亿。

大多数数据是从Facebook,Instagram,Twitter等社交媒体网站生成的,其他来源可以是电子商务,电子商务交易,医院,学校,银行数据等。传统的数据存储技术。因此,大数据应运而生,用于处理大而不纯的数据。

大数据是从社交媒体,GPS,传感器等各种来源收集大数据集并对其进行系统分析并使用企业使用的一些工具和技术提取有用模式的领域。在分析和确定数据之前,数据架构必须由架构师设计。

数据架构设计和数据管理:
数据体系结构设计是一组标准,由某些策略,规则,模型和标准组成,这些策略管理,收集什么类型的数据,从何处收集数据,收集数据的安排,存储数据,利用和保护数据进入系统和数据仓库进行进一步分析。

数据是企业体系结构的重要支柱之一,通过它可以成功地执行业务战略。

数据体系结构设计对于创建数据系统之间发生的交互的愿景非常重要,例如,如果数据架构师想要实现数据集成,那么它将需要两个系统之间的交互,并且通过使用数据体系结构,可以在过程中实现数据交互的理想模型可以实现。

数据体系结构还描述了用于管理数据的数据结构的类型,它为数据预处理提供了一种简便的方法。数据体系结构分为三个基本模型,然后进行组合:

  • 概念模型 –
    它是一种使用实体关系(ER)模型来建立实体及其属性之间关系的业务模型。
  • 逻辑模型–
    它是一个以逻辑形式表示问题的模型,例如数据的行和列,类,xml标记和其他DBMS技术。
  • 物理模型–
    物理模型负责数据库设计,例如哪种类型的数据库技术将适合于体系结构。

数据架构师负责数据体系结构的所有设计,创建,管理,部署,并定义如何存储和检索数据,其他决策由内部机构制定。

影响数据架构的因素:
几乎不会影响数据体系结构的因素是业务策略,业务需求,所使用的技术,经济性和数据处理需求。

  • 业务需求 –
    这些因素包括诸如业务扩展,系统访问性能,数据管理,事务管理,通过将原始数据转换为图像文件和记录来使用原始数据,然后将其存储在数据仓库中等因素。数据仓库是在业务中存储事务的主要方面。
  • 商业政策–
    这些策略是对描述数据处理方式有用的规则。这些政策是由内部组织机构和其他政府机构制定的。
  • 使用的技术–
    这包括使用先前完成的数据体系结构设计的示例,以及使用现有的许可软件购买,数据库技术。
  • 商业经济学–
    业务增长和亏损,利率,贷款,市场状况以及总体成本等经济因素也将对设计架构产生影响。
  • 数据处理需求–
    这些因素包括诸如数据挖掘,大型连续事务,数据库管理以及其他数据预处理需求之类的因素。

数据管理 :

  • 数据管理是管理任务的过程,例如提取数据,存储数据,传输数据,处理数据,然后以低成本消耗保护数据。
  • 数据管理的主要动机是以最佳方式管理和保护人员和组织的数据,以便他们可以轻松地创建,访问,删除和更新数据。
  • 因为数据管理是每个企业成长中必不可少的过程,否则,就无法制定政策和决策来促进业务发展。数据管理越好,业务效率就越高。
  • 像大数据这样的大数据传统上难以管理,因此必须利用最佳技术和工具来进行数据管理,例如Hadoop,Scala,Tableau,AWS等。这些技术和工具可以进一步用于大数据分析,以实现以下方面的改进:模式。
  • 可以通过对员工进行必要的培训并由DBA,数据分析师和数据架构师进行维护来实现数据管理。