使用 CLOUDERA 在 HIVE 中操作数据库 – VMWARE Work Station

我们将创建一个数据库并在我们的数据库中创建一个表。并将涵盖使用 CLOUDERA – VMWARE Work Station 的 HIVE 中的数据库操作。让我们一一讨论。

介绍：

Hive是一个 ETL 工具，它在用户和集成了 Hadoop 的 Hadoop 分布式文件系统之间提供类似 SQL 的接口。
它建立在 Hadoop 之上。
它有助于读取、写入和处理存储在分布式存储中并通过结构查询语言 (SQL) 语法查询的广泛数据集。

要求：

需要安装Cloudera – vmware 工作站。
Windows 下载链接 – https://www.cloudera.com/downloads/cdh.html

云时代：

Cloudera 使您能够部署和管理 Apache Hadoop，操作和分析您的数据，并确保数据安全和受到保护。

安装后打开 Cloudera 的步骤

第 1 步：在您的桌面上可以使用 VMware 工作站。打开那个。

第 2 步：现在您将获得一个界面。单击打开虚拟设备。

第 3 步：选择路径 – 在这一步中，您必须选择下载文件的路径和文件。

第 4 步：现在您的虚拟环境正在创建。

第 5 步：您可以在此路径中查看您的虚拟机详细信息。

第 6 步：现在打开终端以开始使用 hive 命令。

第 7 步：现在在终端中输入 hive。它将给出如下输出。

[cloudera@quickstart ~]$ hive
2020-12-09 20:59:24,314 WARN  [main] mapreduce.TableMapReduceUtil: 
The hbase-prefix-tree module jar containing PrefixTreeCodec is not present.  Continuing without it.
Logging initialized using configuration in file:/etc/hive/conf.dist/hive-log4j.properties
WARNING: Hive CLI is deprecated and migration to Beeline is recommended.
hive>

第 8 步：现在，您已准备就绪，可以开始输入 hive 命令了。

HIVE中的数据库操作

1.创建数据库

句法：

create database database_name;

例子：

create database geeksportal;

输出：

2. 创建表

句法：

create database.tablename(columns);

例子：

create table geeksportal.geekdata(id int,name string);

这里 id 和字符串是两列。

输出：

3. 显示数据库

句法：

show databases;

输出：显示创建的数据库。

4. 描述数据库

句法：

describe database database_name;

例子：

describe  database geeksportal;

输出：显示特定数据库的 HDFS 路径。