📜  使用 CLOUDERA 在 HIVE 中操作数据库 – VMWARE Work Station

📅  最后修改于: 2021-10-27 06:47:14             🧑  作者: Mango

我们将创建一个数据库并在我们的数据库中创建一个表。并将涵盖使用 CLOUDERA – VMWARE Work Station 的 HIVE 中的数据库操作。让我们一一讨论。

介绍:

  • Hive是一个 ETL 工具,它在用户和集成了 Hadoop 的 Hadoop 分布式文件系统之间提供类似 SQL 的接口。
  • 它建立在 Hadoop 之上。
  • 它有助于读取、写入和处理存储在分布式存储中并通过结构查询语言 (SQL) 语法查询的广泛数据集。

要求:

  • 需要安装Cloudera – vmware 工作站。
  • Windows 下载链接 – https://www.cloudera.com/downloads/cdh.html

云时代:

Cloudera 使您能够部署和管理 Apache Hadoop,操作和分析您的数据,并确保数据安全和受到保护。

安装后打开 Cloudera 的步骤

第 1 步:在您的桌面上可以使用 VMware 工作站。打开那个。

第 2 步:现在您将获得一个界面。单击打开虚拟设备。

第 3 步:选择路径 – 在这一步中,您必须选择下载文件的路径和文件。

第 4 步:现在您的虚拟环境正在创建。

第 5 步:您可以在此路径中查看您的虚拟机详细信息。

第 6 步:现在打开终端以开始使用 hive 命令。

第 7 步:现在在终端中输入 hive。它将给出如下输出。

[cloudera@quickstart ~]$ hive
2020-12-09 20:59:24,314 WARN  [main] mapreduce.TableMapReduceUtil: 
The hbase-prefix-tree module jar containing PrefixTreeCodec is not present.  Continuing without it.
Logging initialized using configuration in file:/etc/hive/conf.dist/hive-log4j.properties
WARNING: Hive CLI is deprecated and migration to Beeline is recommended.
hive>  

第 8 步:现在,您已准备就绪,可以开始输入 hive 命令了。

HIVE中的数据库操作

1.创建数据库

句法:

create database database_name;

例子:

create database geeksportal;

输出:

2. 创建表

句法:

create database.tablename(columns);

例子:

create table geeksportal.geekdata(id int,name string);

这里 id 和字符串是两列。

输出 :

3. 显示数据库

句法:

show databases;

输出:显示创建的数据库。

4. 描述数据库

句法:

describe database database_name;

例子:

describe  database geeksportal;

输出:显示特定数据库的 HDFS 路径。