📅  最后修改于: 2021-01-07 11:00:29             🧑  作者: Mango
Apache Pig GROUP运算符用于将数据分组为一个或多个关系。它对包含相似组键的元组进行分组。如果组密钥具有多个字段,则将其视为元组,否则它将与组密钥具有相同的类型。结果,它提供的关系每组包含一个元组。
在此示例中,我们根据姓氏将给定数据分组。
$ nano piginput2.txt
$ cat piginput2.txt
$ hdfs dfs -put /home/codegyani/piginput2.txt /pigexample
$ pig
grunt> A = LOAD '/pigexample/piginput2.txt' USING PigStorage(',') AS (fname:chararray,l_name:chararray,id:int);
grunt> DUMP A;
grunt> groupbylname = group A by l_name ;
grunt> DUMP groupbylname;
在这里,我们得到了期望的输出。