📝 Apache Tajo教程
26篇技术文档📅  最后修改于: 2020-12-02 06:07:18        🧑  作者: Mango
在上一章中,您已经了解了如何在Tajo中创建表。本章介绍Tajo中的SQL语句。创建表语句在开始创建表之前,请在Tajo安装目录路径中创建文本文件“ students.csv”,如下所示-students.csvIdNameAddressAgeMarks1Adam23 New Street21902Amit12 Old Street13953Bob10 Cross Street12804David...
📅  最后修改于: 2020-12-02 06:07:38        🧑  作者: Mango
本章详细说明了聚合和窗口功能。汇总功能集合函数从一组输入值产生单个结果。下表详细描述了聚合函数列表。S.No.Function & Description1AVG(exp)Averages a column of all records in a data source.2CORR(expression1, expression2)Returns the coefficient of correl...
📅  最后修改于: 2020-12-02 06:08:39        🧑  作者: Mango
本章说明以下重要查询。谓词说明加入让我们继续执行查询。谓词谓词是用于评估真/假值和未知的表达式。在WHERE子句和HAVING子句以及其他需要布尔值的构造的搜索条件中使用谓词。IN谓词确定要测试的表达式的值是否与子查询或列表中的任何值匹配。子查询是一种普通的SELECT语句,其结果集为一列和一个或多个行。此列或列表中的所有表达式必须与要测试的表达式具有相同的数据类型。句法询问结果上面的查询将产生以...
📅  最后修改于: 2020-12-02 06:08:55        🧑  作者: Mango
Tajo支持各种存储格式。要注册存储插件配置,您应该将更改添加到配置文件“ storage-site.json”。storage-site.json结构定义如下-每个存储实例由URI标识。PostgreSQL存储处理程序Tajo支持PostgreSQL存储处理程序。它使用户查询可以访问PostgreSQL中的数据库对象。它是Tajo中的默认存储处理程序,因此您可以轻松配置它。组态在这里,“data...
📅  最后修改于: 2020-12-02 06:09:19        🧑  作者: Mango
Apache Tajo支持HBase集成。这使我们能够访问Tajo中的HBase表。 HBase是建立在Hadoop文件系统之上的面向列的分布式数据库。它是Hadoop生态系统的一部分,可提供对Hadoop File System中数据的随机实时读写访问。配置HBase集成需要执行以下步骤。设置环境变量将以下更改添加到“ conf / tajo-env.sh”文件。包含HBase路径后,Tajo会...
📅  最后修改于: 2020-12-02 06:09:33        🧑  作者: Mango
Tajo支持HiveCatalogStore与Apache Hive集成。通过此集成,Tajo可以访问Apache Hive中的表。设置环境变量将以下更改添加到“ conf / tajo-env.sh”文件。包含Hive路径后,Tajo会将Hive库文件设置为classpath。目录配置将以下更改添加到“ conf / catalog-site.xml”文件中。一旦配置了HiveCatalogSt...
📅  最后修改于: 2020-12-02 06:09:49        🧑  作者: Mango
Swift是一个分布式且一致的对象/ blob存储。 Swift提供了云存储软件,因此您可以使用一个简单的API来存储和检索大量数据。 Tajo支持Swift集成。以下是Swift集成的先决条件-迅速Hadoop的核心-site.xml将以下更改添加到hadoop的“ core-site.xml”文件中-这将用于Hadoop访问Swift对象。完成所有更改后,移至Tajo目录以设置Swift环境变...
📅  最后修改于: 2020-12-02 06:10:11        🧑  作者: Mango
Apache Tajo提供JDBC接口来连接和执行查询。我们可以使用相同的JDBC接口从基于Java的应用程序连接Tajo。现在让我们了解如何在本节中使用JDBC接口连接Tajo并在示例Java应用程序中执行命令。下载JDBC驱动程序通过访问以下链接下载JDBC驱动程序-http://apache.org/dyn/closer.cgi/tajo/tajo-0.11.3/tajo-jdbc-0.11...
📅  最后修改于: 2020-12-02 06:10:26        🧑  作者: Mango
Apache Tajo支持自定义/用户定义函数(UDF)。可以在Python创建自定义函数。自定义函数只是带有装饰器“ @output_type(<tajo sql datatype>)”的普通Python函数,如下所示-可以通过在“ tajosite.xml”中添加以下配置来注册带有UDF的Python脚本。一旦脚本被注册,重新启动集群,UDF将在SQL查询中立即可用,如下所示-Apache T...
📅  最后修改于: 2020-12-02 06:10:41        🧑  作者: Mango
以下资源包含有关Apache Tajo的其他信息。请使用它们来获得有关此方面的更深入的知识。Apache Tajo上的有用链接Apache Tajo Wiki–Apache Tajo的维基百科参考。关于Apache Tajo的有用书籍要在此页面上注册您的网站,请发送电子邮件至...
📅  最后修改于: 2020-12-02 06:10:55        🧑  作者: Mango
Apache Tajo是用于Hadoop的开源分布式数据仓库框架。 Tajo最初由位于韩国的基于Hadoop的基础架构公司Gruter创立。后来,来自英特尔,Etsy,NASA,Cloudera和Hortonworks的专家也对该项目做出了贡献。 Tajo是韩语中的鸵鸟。在2014年3月,Tajo被授予顶级开源Apache项目。本教程将探索Tajo的基础知识并继续进行下去,它将解释集群设置,Taj...