📅  最后修改于: 2023-12-03 15:24:28.839000             🧑  作者: Mango
Hive是一个开源的数据仓库工具,它是基于Hadoop的MapReduce框架开发的。 Hive提供了一个SQL样式的查询语言(HQL),使得开发者可以使用类似于SQL的语法来查询Hadoop中存储的数据。在Hive中创建表是一个非常基本的操作。下面我们来看一下如何在Hive中创建表。
在创建表之前,我们需要先连接到Hive。可以使用hive命令行工具来连接到Hive:
hive
下面是创建一个student表的例子:
CREATE TABLE student (
id INT,
name STRING,
age INT
)
上面的命令创建了一个名为student的表,表中包含三列:id,name和age。每列的数据类型分别为INT,STRING和INT。
Hive支持很多种不同的存储格式,如ORC,Parquet,Avro等。可以使用STORED AS关键字指定表的存储格式。例如,以下命令创建一个以ORC格式存储的表:
CREATE TABLE student (
id INT,
name STRING,
age INT
)
STORED AS ORC;
如果你的数据是以某种分隔符分隔的,那么你可以使用ROW FORMAT DELIMITED关键字指定分隔符。例如,以下命令创建了一个使用逗号作为分隔符的表:
CREATE TABLE student (
id INT,
name STRING,
age INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';
上面的命令创建了一个名为student的表,并指定了使用逗号作为分隔符。
可以使用LOCATION关键字指定表的数据存储位置。例如,以下命令创建一个名为student的表,并将数据存储在/user/hive/warehouse/student目录下:
CREATE TABLE student (
id INT,
name STRING,
age INT
)
STORED AS ORC
LOCATION '/user/hive/warehouse/student';
上面的命令创建了一个名为student的表,并把数据存储在/user/hive/warehouse/student目录下。
可以使用DESCRIBE命令查看表的结构:
DESCRIBE student;
上面的命令会输出student表的结构,包括列名、数据类型和注释信息。
在Hive中创建表是一个非常基本的操作,通过使用上述命令可以轻松地创建一个表并指定表的存储格式、分隔符和存储位置等信息。这些基础命令是Hive使用的必备技能。