📅  最后修改于: 2020-12-03 01:48:33             🧑  作者: Mango
什么是HBase
Hbase是一个基于Hadoop的开源和分类地图数据。它是面向列的并且可以水平扩展。
它基于Google的Big Table。它具有一组表,这些表将数据保留为键值格式。 Hbase非常适合稀疏数据集,而稀疏数据集在大数据用例中非常常见。 Hbase提供了几乎可以使用任何编程语言进行开发的API。它是Hadoop生态系统的一部分,可提供对Hadoop File System中数据的随机实时读写访问。
为什么选择HBase
- 随着数据变大,RDBMS呈指数级下降
- 期望数据具有高度结构化的能力,即能够适应定义良好的模式
- 模式的任何更改都可能需要停机
- 对于稀疏数据集,维护NULL值的开销过多
Hbase的特点
- 水平可伸缩:您可以随时添加任意数量的列。
- 自动故障转移:自动故障转移是一种资源,系统管理员可以在系统受到破坏时自动将数据处理切换到备用系统
- 与Map / Reduce框架的集成:所有命令和Java代码在内部实现Map / Reduce以完成任务,并且它是基于Hadoop分布式文件系统构建的。
- 稀疏,分布式,持久性,多维排序的映射,按行键,列键和时间戳编制索引。
- 通常称为键值存储或面向列族的数据库,或存储版本化的地图。
- 从根本上讲,它是一个用于通过随机访问存储和检索数据的平台。
- 它不关心数据类型(对于同一列,将一个整数存储在一行中,将字符串存储在另一行中)。
- 它不会在您的数据中强制执行关系。
- 它旨在运行在使用商用硬件构建的计算机集群上。