📜  什么是 Hadoop 中的 Schema On Read 和 Schema On Write?

📅  最后修改于: 2021-10-27 06:33:11             🧑  作者: Mango

Schema on-Read是 Hadoop 和其他数据处理技术等新工具中的新数据调查方法。在此模式中,分析师必须识别每组数据,使其更加通用。当数据组织不是最佳目标但数据收集是优先事项时,将使用此模式。这使得在同一数据上创建两个视图变得更加容易。这种 Schema 的使用使得 Hadoop 技术在当今的业务场景中更加流行。

使用 Schema On Read 的优点

  • 这种方法为我们提供了要使用的数据类型的灵活性的好处。
  • 它提高了数据生成速度,提高了数据的可用性。
  • 它提供了存储非结构化、半结构化、松散或无组织数据的灵活性。

使用 Schema On Read 的缺点

  • 需要投入时间在读取模式中创建作业。
  • 它不允许您查看模式并确定其中存在哪些数据。
  • 就计算资源的利用而言,它有点贵。

读取模式

写入模式是一种将数据存储到数据库中的技术。这为增强传统复杂系统提供了一种新方法。这是一种通过 Schema-on-Read 处理数据的新方法,因为它为大数据和分析中的企业提供了灵活性。它为用户提供了实现数据一致性的能力,但对插入的数据类型有很大的限制,这使得它拒绝了许多非结构化类型的数据。通过对硬件和软件的一些改动,它可以轻松处理各种数据。

使用 Schema On Write 的优点

  • 这种方法有助于表达数据点之间的关系。
  • 在描述模式时,用户/工具可以开始工作。
  • 这种方法使您可以存储密集数据。

使用 Schema On Write 的缺点

  • 架构是为特定目的而构建的。
  • 模式 需要足够的建模才能使其为工作做好准备。
  • 半结构化或非结构化数据并不适合这种方法。

写入时的架构