📜  HDFS的功能

📅  最后修改于: 2020-12-03 01:40:16             🧑  作者: Mango

HDFS功能和目标

Hadoop分布式文件系统(HDFS)是一个分布式文件系统。它是Hadoop的核心部分,用于数据存储。它旨在在商用硬件上运行。

与其他分布式文件系统不同,HDFS具有高度的容错能力,可以部署在低成本硬件上。它可以轻松处理包含大型数据集的应用程序。

让我们看看HDFS的一些重要功能和目标。

HDFS的功能

  • 高度可扩展-HDFS具有高度可扩展性,因为它可以扩展单个群集中的数百个节点。
  • 复制-由于某些不利条件,包含数据的节点可能会丢失。因此,为克服此类问题,HDFS始终在另一台计算机上维护数据副本。
  • 容错-在HDFS中,容错表示发生故障时系统的坚固性。 HDFS具有高度的容错能力,如果任何计算机发生故障,则包含该数据副本的另一台计算机将自动变为活动状态。
  • 分布式数据存储-这是HDFS最重要的功能之一,它使Hadoop非常强大。在这里,数据被分为多个块并存储到节点中。
  • 便携式-HDFS的设计方式使其可以轻松地从平台移植到另一个平台。

HDFS的目标

  • 处理硬件故障-HDFS包含多台服务器计算机。无论如何,如果任何计算机出现故障,HDFS的目标是快速恢复它。
  • 流数据访问-HDFS应用程序通常在通用文件系统上运行。此应用程序需要对其数据集进行流式访问。
  • 一致性模型-在HDFS上运行的应用程序需要遵循“一次写入多次就绪”方法。因此,一旦创建文件就无需更改。但是,可以将其附加和截断。