📅  最后修改于: 2020-12-03 03:55:29             🧑  作者: Mango
HiveQL Join子句用于根据两个或多个表之间的相关列合并数据。 HiveQL联接的各种类型为:-
在这里,我们将在下表的记录上执行join子句:
HiveQL内部联接用于返回满足联接条件的多个表的行。换句话说,连接条件在每个要连接的表中找到匹配记录。
在此示例中,我们采用了两个表employee和employee_department。雇员表的主键(empid)代表雇员部门表的外键(depid)。让我们使用以下步骤执行内部联接操作:-
hive> use hiveql;
hive> create table employee(empid int, empname string , state string)
row format delimited
fields terminated by ',' ;
hive> load data local inpath '/home/codegyani/hive/employee' into table employee;
hive> create table employee_department(depid int, department_name string)
row format delimited
fields terminated by ',' ;
hive> load data local inpath '/home/codegyani/hive/employee_department' into table employee_department;
hive>select e1.empname, e2.department_name from employee e1 join employee_department e2 on e1.empid= e2.depid;
HiveQL左外部联接返回左(第一个)表中的所有记录,仅返回右(第二个)表中的联接条件在其中找到匹配项的记录。
在此示例中,我们执行左外部联接操作。
hive> select e1.empname, e2.department_name from employee e1 left outer join employee_department e2 on e1.empid= e2.depid;
HiveQL右外部联接返回右(第二个)表中的所有记录,仅返回左(第一个)表中的联接条件在其中找到匹配项的记录。
在此示例中,我们执行左外部联接操作。
hive> select e1.empname, e2.department_name from employee e1 right outer join employee_department e2 on e1.empid= e2.depid;
HiveQL完全外部联接返回两个表中的所有记录。它为任一表中的丢失记录分配Null。
在此示例中,我们执行完整的外部联接操作。
select e1.empname, e2.department_name from employee e1 full outer join employee_department e2 on e1.empid= e2.depid;