📅  最后修改于: 2021-01-07 10:58:40             🧑  作者: Mango
Apache Pig FILTER运算符用于删除关系中的重复元组。最初,Pig对给定的数据进行排序,然后消除重复项。
在此示例中,我们消除了重复的元组。
$ nano pfilter.txt
$ cat pfilter.txt
$ hdfs dfs -put pfilter.txt /pigexample
$ pig
grunt> A = LOAD '/pigexample/pfilter.txt' USING PigStorage(',') AS (a1:int,a2:int);
grunt> DUMP A;
grunt> Result = FILTER A BY a2==8;
grunt> DUMP Result;
在这里,我们得到了期望的输出。