📝 Apache Pig教程
36篇技术文档📅  最后修改于: 2020-12-02 05:35:49        🧑  作者: Mango
JOIN运算符用于合并来自两个或多个关系的记录。在执行联接操作时,我们将每个关系中的一个(或一组)元组声明为键。当这些键匹配时,两个特定的元组将匹配,否则记录将被删除。联接可以是以下类型-自加入内部联接外连接-左连接,右连接和完全连接本章举例说明如何在Pig Latin中使用join运算符。假设我们在HDFS的/ pig_data /目录中有两个文件,即customers.txt和orders.t...
📅  最后修改于: 2020-12-02 05:36:10        🧑  作者: Mango
CROSS运算符计算两个或多个关系的叉积。本章举例说明如何在Pig Latin中使用交叉运算符。句法下面给出的是CROSS运算符的语法。例假设我们在HDFS的/ pig_data /目录中有两个文件,即customers.txt和orders.txt,如下所示。customer.txtorders.txt并将我们将这两个文件与客户和订单的关系加载到Pig中,如下所示。现在让我们使用这两个关系上的叉...
📅  最后修改于: 2020-12-02 05:36:28        🧑  作者: Mango
Pig Latin的UNION运算符用于合并两个关系的内容。要对两个关系执行UNION操作,它们的列和域必须相同。句法下面给出的是UNION运算符的语法。例假设我们在HDFS的/ pig_data /目录中有两个文件,即student_data1.txt和student_data2.txt,如下所示。Student_data1.txtStudent_data2.txt并将这两个文件通过关系Stud...
📅  最后修改于: 2020-12-02 05:36:46        🧑  作者: Mango
SPLIT运算符用于将一个关系拆分为两个或多个关系。句法下面给出的是SPLIT运算符的语法。例假设我们在HDFS目录/ pig_data /中有一个名为student_details.txt的文件,如下所示。student_details.txt并将该文件加载到Pig中,其关系名称为Student_details,如下所示。现在让我们将该关系分为两个,一个列出年龄小于23岁的雇员,另一个列出年龄在...
📅  最后修改于: 2020-12-02 05:37:03        🧑  作者: Mango
FILTER运算符用于根据条件从关系中选择所需的元组。句法下面给出的是FILTER运算符的语法。例假设我们在HDFS目录/ pig_data /中有一个名为student_details.txt的文件,如下所示。student_details.txt并将该文件加载到Pig中,其关系名称为Student_details,如下所示。现在让我们使用“过滤器”运算符来获取属于城市Chennai的学生的详细...
📅  最后修改于: 2020-12-02 05:37:21        🧑  作者: Mango
DISTINCT运算符用于从关系中删除冗余(重复)元组。句法下面给出的是DISTINCT运算符的语法。例假设我们在HDFS目录/ pig_data /中有一个名为student_details.txt的文件,如下所示。student_details.txt并将该文件加载到Pig中,其关系名称为Student_details,如下所示。现在,让我们使用DISTINCT运算符从名为Student_de...
📅  最后修改于: 2020-12-02 05:37:38        🧑  作者: Mango
FOREACH运算符用于根据列数据生成指定的数据转换。句法下面给出的是FOREACH运算符的语法。例假设我们在HDFS目录/ pig_data /中有一个名为student_details.txt的文件,如下所示。student_details.txt并将该文件加载到Pig中,其关系名称为Student_details,如下所示。现在让我们从关系student_details获得ID,年龄和城市每...
📅  最后修改于: 2020-12-02 05:37:56        🧑  作者: Mango
ORDER BY运算符用于基于一个或多个字段按排序顺序显示关系的内容。句法下面给出的是ORDER BY运算符的语法。例假设我们在HDFS目录/ pig_data /中有一个名为student_details.txt的文件,如下所示。student_details.txt并将该文件加载到Pig中,其关系名称为Student_details,如下所示。现在,让我们根据学生的年龄按降序对关系进行排序,并...
📅  最后修改于: 2020-12-02 05:38:13        🧑  作者: Mango
LIMIT运算符用于从关系中获取有限数量的元组。句法下面给出LIMIT运算符的语法。例假设我们在HDFS目录/ pig_data /中有一个名为student_details.txt的文件,如下所示。student_details.txt并将该文件加载到Pig中,其关系名称为Student_details,如下所示。现在,让我们根据学生的年龄按降序对关系进行排序,并使用ORDER BY运算符将其存...
📅  最后修改于: 2020-12-02 05:38:31        🧑  作者: Mango
Apache Pig提供了各种内置函数,即eval,load,store,math, 字符串,bag和tuple函数。评估功能以下是Apache Pig提供的评估函数列表。S.N.Function & Description1AVG()To compute the average of the numerical values within a bag.2BagToString()To conca...
📅  最后修改于: 2020-12-02 05:38:45        🧑  作者: Mango
Apache Pig中的Load和Store函数用于确定数据如何从Pig中输出。这些函数与load和store运算符。以下是Pig中可用的加载和存储功能列表。S.N.Function & Description1PigStorage()To load and store structured files.2TextLoader()To load unstructured data into Pig...
📅  最后修改于: 2020-12-02 05:38:58        🧑  作者: Mango
下面给出的是Bag和Tuple函数的列表。S.N.Function & Description1TOBAG()To convert two or more expressions into a bag.2TOP()To get the topNtuples of a relation.3TOTUPLE()To convert one or more expressions into a tuple...
📅  最后修改于: 2020-12-02 05:39:16        🧑  作者: Mango
在Apache Pig中,我们具有以下String函数。S.N.Functions & Description1ENDSWITH(string, testAgainst)To verify whether a given string ends with a particular substring.2STARTSWITH(string, substring)Accepts two string ...
📅  最后修改于: 2020-12-02 05:39:35        🧑  作者: Mango
Apache Pig提供以下日期和时间函数-S.N.Functions & Description1ToDate(milliseconds)This function returns a date-time object according to the given parameters. The other alternative for this function are ToDate(ios...
📅  最后修改于: 2020-12-02 05:39:53        🧑  作者: Mango
我们在Apache Pig中具有以下数学函数-S.N.Functions & Description1ABS(expression)To get the absolute value of an expression.2ACOS(expression)To get the arc cosine of an expression.3ASIN(expression)To get the arc sin...