📜  HiveQL-加入

📅  最后修改于: 2020-12-03 03:55:29             🧑  作者: Mango

HiveQL-加入

HiveQL Join子句用于根据两个或多个表之间的相关列合并数据。 HiveQL联接的各种类型为:-

  • 内部联接
  • 左外连接
  • 右外连接
  • 完全外部加入

在这里,我们将在下表的记录上执行join子句:


内部加入HiveQL

HiveQL内部联接用于返回满足联接条件的多个表的行。换句话说,连接条件在每个要连接的表中找到匹配记录。

Hive内部联接示例

在此示例中,我们采用了两个表employee和employee_department。雇员表的主键(empid)代表雇员部门表的外键(depid)。让我们使用以下步骤执行内部联接操作:-

  • 选择我们要在其中创建表的数据库。
hive> use hiveql;

  • 现在,使用以下命令创建表:
hive> create table employee(empid int, empname string , state string)
row format delimited
fields terminated by ',' ;

  • 将相应的数据加载到表中。
hive> load data local inpath '/home/codegyani/hive/employee' into table employee;

  • 现在,使用以下命令创建另一个表:
hive> create table employee_department(depid int, department_name string)
row format delimited
fields terminated by ',' ;

  • 将相应的数据加载到表中。
hive> load data local inpath '/home/codegyani/hive/employee_department' into table employee_department;

  • 现在,使用以下命令执行内部联接操作:-
hive>select  e1.empname, e2.department_name from employee e1 join employee_department e2 on e1.empid= e2.depid;



HiveQL中的左外连接

HiveQL左外部联接返回左(第一个)表中的所有记录,仅返回右(第二个)表中的联接条件在其中找到匹配项的记录。

蜂巢中的左外连接示例

在此示例中,我们执行左外部联接操作。

  • 让我们使用以下命令执行左外部联接操作:-
hive> select  e1.empname, e2.department_name from employee e1 left outer join employee_department e2 on e1.empid= e2.depid;



右外加入HiveQL

HiveQL右外部联接返回右(第二个)表中的所有记录,仅返回左(第一个)表中的联接条件在其中找到匹配项的记录。

蜂巢中的左外连接示例

在此示例中,我们执行左外部联接操作。

  • 让我们使用以下命令执行左外部联接操作:-
hive> select  e1.empname, e2.department_name from employee e1 right outer join employee_department e2 on e1.empid= e2.depid;



完全外部加入

HiveQL完全外部联接返回两个表中的所有记录。它为任一表中的丢失记录分配Null。

Hive中完全外部联接的示例

在此示例中,我们执行完整的外部联接操作。

  • 让我们使用以下命令执行完整的外部联接操作:-
select  e1.empname, e2.department_name from employee e1 full outer join employee_department e2 on e1.empid= e2.depid;