📜  Apache Tajo-自定义函数

📅  最后修改于: 2020-12-02 06:10:26             🧑  作者: Mango


Apache Tajo支持自定义/用户定义函数(UDF)。可以在Python创建自定义函数。

自定义函数只是带有装饰器“ @output_type()”的普通Python函数,如下所示-

@ouput_type(“integer”) 
def sum_py(a, b): 
   return a + b; 

可以通过在“ tajosite.xml”中添加以下配置来注册带有UDF的Python脚本。

 
   tajo.function.python.code-dir 
   file:///path/to/script1.py,file:///path/to/script2.py 

一旦脚本被注册,重新启动集群,UDF将在SQL查询中立即可用,如下所示-

select sum_py(10, 10) as pyfn; 

Apache Tajo也支持用户定义的聚合函数,但不支持用户定义的窗口函数。