📜  Apache Pig SPLIT运算符

📅  最后修改于: 2021-01-07 11:03:13             🧑  作者: Mango

Apache Pig SPLIT运算符

Apache Pig SPLIT运算符符根据提供的表达式将关系分为两个或多个关系。在此,元组可以分配给一个或多个关系,也可以不分配给一个或多个关系。

SPLIT运算符的示例

在此示例中,我们将提供的关系分为两个关系。

执行SPLIT Operator的步骤

  • 在本地计算机上创建一个文本文件,并提供一些值。
$ nano psplit.txt

  • 检查写入文本文件的值。
$ cat psplit.txt

  • 将文本文件上载到HDFS的特定目录中。
$ hdfs dfs -put psplit.txt /pigexample
  • 打开Pig MapReduce运行模式。
$ pig
  • 加载包含数据的文件。
grunt> A = LOAD '/pigexample/psplit.txt' USING PigStorage(',') AS (a1:int,a2:int) ;
  • 现在,执行并验证数据。
grunt> DUMP A;

  • 让我们提供表达式以拆分关系。
grunt> SPLIT A INTO X IF a1<=2, Y IF a1>2;

  • 现在,执行并验证第一个关系的数据。
grunt> DUMP X;

  • 现在,执行并验证第二个关系的数据。
grunt> DUMP Y;

在这里,我们得到了期望的输出。