Hive是建立在 Hadoop 之上的数据仓库解决方案。在Hive,数据在 Hadoop 分布式文件系统 (HDFS) 中进行管理。在此模式中,读取时不需要约束检查,因为它在 RDBMS 中是必需的。它特别适用于处理非常大的数据集。 Hive使用称为Hive查询语言 (HQL) 的查询语言。
在 Unix 上使用 HQL 创建表的步骤:
第 1 步:编写命令“hive”来创建数据库。
第二步:新建一个数据库。
hive(default)> create database name_of_database
> ;
步骤 3:要查看 hive write 命令中存在的所有数据库:
hive(default)>show databases
第 4 步:要使用在第 2 步中创建的数据库,请编写以下命令:
hive(default)>use name_of_database;
第 5 步:要创建表,请使用以下命令:
hive(name_of_database)> create table table_name
> (
> id int,
> name string,
> city string
>);
第六步:创建表并在写表命令中插入记录:
hive(name_of_database)> insert into table table_name
> values (101,'Ayush','Saxena');
按回车后, Hive查询将自动触发 MapReduce 作业并开始处理。
第 7 步:要显示表中存在的所有记录,请编写查询:
>select * from table_name;