📜  如何在Hive创建表?(1)

📅  最后修改于: 2023-12-03 15:24:28.839000             🧑  作者: Mango

如何在Hive创建表?

Hive是一个开源的数据仓库工具,它是基于Hadoop的MapReduce框架开发的。 Hive提供了一个SQL样式的查询语言(HQL),使得开发者可以使用类似于SQL的语法来查询Hadoop中存储的数据。在Hive中创建表是一个非常基本的操作。下面我们来看一下如何在Hive中创建表。

步骤
1. 连接到Hive

在创建表之前,我们需要先连接到Hive。可以使用hive命令行工具来连接到Hive:

hive
2. 创建表

下面是创建一个student表的例子:

CREATE TABLE student (
   id INT,
   name STRING,
   age INT
)

上面的命令创建了一个名为student的表,表中包含三列:id,name和age。每列的数据类型分别为INT,STRING和INT。

3. 指定表的存储格式

Hive支持很多种不同的存储格式,如ORC,Parquet,Avro等。可以使用STORED AS关键字指定表的存储格式。例如,以下命令创建一个以ORC格式存储的表:

CREATE TABLE student (
  id INT,
  name STRING,
  age INT
)
STORED AS ORC;
4. 指定表的分隔符

如果你的数据是以某种分隔符分隔的,那么你可以使用ROW FORMAT DELIMITED关键字指定分隔符。例如,以下命令创建了一个使用逗号作为分隔符的表:

CREATE TABLE student (
  id INT,
  name STRING,
  age INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';

上面的命令创建了一个名为student的表,并指定了使用逗号作为分隔符。

5. 指定表的数据存储位置

可以使用LOCATION关键字指定表的数据存储位置。例如,以下命令创建一个名为student的表,并将数据存储在/user/hive/warehouse/student目录下:

CREATE TABLE student (
  id INT,
  name STRING,
  age INT
)
STORED AS ORC
LOCATION '/user/hive/warehouse/student';

上面的命令创建了一个名为student的表,并把数据存储在/user/hive/warehouse/student目录下。

6. 查看表结构

可以使用DESCRIBE命令查看表的结构:

DESCRIBE student;

上面的命令会输出student表的结构,包括列名、数据类型和注释信息。

总结

在Hive中创建表是一个非常基本的操作,通过使用上述命令可以轻松地创建一个表并指定表的存储格式、分隔符和存储位置等信息。这些基础命令是Hive使用的必备技能。