📅  最后修改于: 2021-01-07 11:04:09             🧑  作者: Mango
Apache Pig UNION运算符用于计算两个或更多关系的并集。它不维护元组的顺序。它也不会消除重复的元组。
在此示例中,我们计算两个关系的数据。
$ nano punion1.txt
$ nano punion2.txt
$ cat punion1.txt
$ cat punion2.txt
$ hdfs dfs -put punion1.txt /pigexample
$ hdfs dfs -put punion2.txt /pigexample
$ pig
grunt> A = load '/pigexample/punion1.txt' using PigStorage(',') as (a1:int,a2:int);
grunt> DUMP A;
grunt> B = LOAD '/pigexample/punion2.txt' USING PigStorage(',') AS (b1:int,b2:int,b3:int);
grunt> DUMP B;
grunt> Result = UNION A,B;
grunt> DUMP Result;
在这里,我们得到了期望的输出。