📝 Apache Tajo教程

26篇技术文档
  Apache Tajo教程

📅  最后修改于: 2020-12-02 06:00:57        🧑  作者: Mango

Apache Tajo是用于Hadoop的开源分布式数据仓库框架。 Tajo最初由位于韩国的基于Hadoop的基础架构公司Gruter创立。后来,来自英特尔,Etsy,NASA,Cloudera和Hortonworks的专家也对该项目做出了贡献。 Tajo是韩语中的鸵鸟。在2014年3月,Tajo被授予顶级开源Apache项目。本教程将探索Tajo的基础知识并继续进行下去,它将解释集群设置,Taj...

  Apache Tajo-简介

📅  最后修改于: 2020-12-02 06:01:23        🧑  作者: Mango

分布式数据仓库系统数据仓库是一个关系数据库,旨在用于查询和分析,而不是用于事务处理。它是面向主题的,集成的,随时间变化且非易失性的数据收集。该数据可帮助分析师在组织中做出明智的决策,但是关系数据量却每天都在增加。为了克服这些挑战,分布式数据仓库系统出于在线分析处理(OLAP)的目的而跨多个数据存储库共享数据。每个数据仓库可能属于一个或多个组织。它执行负载平衡和可伸缩性。元数据被复制并集中分布。Ap...

  Apache Tajo-体系结构

📅  最后修改于: 2020-12-02 06:01:43        🧑  作者: Mango

下图描述了Apache Tajo的体系结构。下表详细描述了每个组件。S.No.Component & Description1ClientClientsubmits the SQL statements to the Tajo Master to get the result.2MasterMaster is the main daemon. It is responsible for query...

  Apache Tajo-安装

📅  最后修改于: 2020-12-02 06:02:09        🧑  作者: Mango

要安装Apache Tajo,您的系统上必须装有以下软件-Hadoop 2.3或更高版本Java 1.7或更高版本Linux或Mac OS现在让我们继续执行以下步骤来安装Tajo。验证Java安装希望您已经在计算机上安装了Java版本8。现在,您只需要进行验证即可。要验证,请使用以下命令-如果在计算机上成功安装了Java,则可以看到已安装Java的当前版本。如果未安装Java,请按照以下步骤在计算...

  Apache Tajo-配置设置

📅  最后修改于: 2020-12-02 06:02:34        🧑  作者: Mango

Tajo的配置基于Hadoop的配置系统。本章详细说明Tajo配置设置。基本设置Tajo使用以下两个配置文件-catalog-site.xml-目录服务器的配置。tajo-site.xml-其他Tajo模块的配置。分布式模式配置分布式模式设置在Hadoop分布式文件系统(HDFS)上运行。让我们按照以下步骤配置Tajo分布式模式设置。tajo-site.xml该文件位于/ / path / to ...

  Apache Tajo-Shell命令

📅  最后修改于: 2020-12-02 06:03:01        🧑  作者: Mango

在本章中,我们将详细了解Tajo Shell命令。要执行Tajo Shell命令,您需要使用以下命令启动Tajo服务器和Tajo Shell-启动服务器启动外壳上面的命令现在可以执行了。元命令现在让我们讨论元命令。 Tsql元命令以反斜杠(’\’)开头。帮助命令“ \?”命令用于显示帮助选项。询问结果以上\?命令列出了Tajo中的所有基本用法选项。您将收到以下输出-列表数据库要列出Tajo中的所有...

  Apache Tajo-数据类型

📅  最后修改于: 2020-12-02 06:03:20        🧑  作者: Mango

要在Tajo Shell中执行查询,请打开终端并移至Tajo安装目录,然后键入以下命令-您现在将看到响应,如以下程序所示:您现在可以执行查询。否则,您可以通过Web控制台应用程序将查询运行到以下URL-http:// localhost:26080 /原始数据类型Apache Tajo支持以下原始数据类型列表-S.No.Data type & Description1integerUsed for...

  Apache Tajo-运算符

📅  最后修改于: 2020-12-02 06:03:35        🧑  作者: Mango

Tajo中使用以下运算符执行所需的操作。S.No.Operator & Description1Arithmetic operatorsPresto supports arithmetic operators such as &plus;, −, &ast;, /, %.2Relational operators<, >, <=, >=, =, <>3Logical operatorsAND, O...

  Apache Tajo-SQL函数

📅  最后修改于: 2020-12-02 06:03:48        🧑  作者: Mango

到目前为止,您已经知道在Tajo上运行简单的基本查询。在接下来的几章中,我们将讨论以下SQL函数-数学函数字符串函数日期时间函数JSON函数...

  Apache Tajo-数学函数

📅  最后修改于: 2020-12-02 06:04:10        🧑  作者: Mango

数学函数对数学公式进行运算。下表详细描述了功能列表。S.No.Function & Description1abs(x)Returns the absolute value of x.2cbrt(x)Returns the cube root of x.3ceil(x)Returns x value rounded up to the nearest integer.4floor(x)Return...

  Apache Tajo-字符串函数

📅  最后修改于: 2020-12-02 06:04:29        🧑  作者: Mango

下表列出了Tajo中的字符串函数。S.No.Function & Description1concat(string1, …, stringN)Concatenate the given strings.2length(string)Returns the length of the given string.3lower(string)Returns the lowercase format f...

  Apache Tajo-DateTime函数

📅  最后修改于: 2020-12-02 06:04:50        🧑  作者: Mango

Apache Tajo支持以下DateTime函数。S.No.Function & Description1add_days(date date or timestamp, int dayReturns date added by the given day value.2add_months(date date or timestamp, int month)Returns date added...

  Apache Tajo-JSON函数

📅  最后修改于: 2020-12-02 06:05:04        🧑  作者: Mango

下表列出了JSON函数-S.No.Function & Description1json_extract_path_text(js on text, json_path text)Extracts JSON string from a JSON string based on json path specified.2json_array_get(json_array text, index in...

  Apache Tajo-数据库创建

📅  最后修改于: 2020-12-02 06:05:24        🧑  作者: Mango

本节说明Tajo DDL命令。 Tajo有一个名为default的内置数据库。创建数据库语句创建数据库是用于在Tajo中创建数据库的语句。该语句的语法如下-询问结果上面的查询将产生以下结果。数据库是Tajo中的名称空间。一个数据库可以包含多个具有唯一名称的表。显示当前数据库要检查当前数据库名称,请发出以下命令-询问结果上面的查询将产生以下结果。连接到数据库到目前为止,您已经创建了一个名为“ tes...

  Apache Tajo-表管理

📅  最后修改于: 2020-12-02 06:06:07        🧑  作者: Mango

表是一个数据源的逻辑视图。它由逻辑架构,分区,URL和各种属性组成。 Tajo表可以是HDFS中的目录,单个文件,一个HBase表或RDBMS表。Tajo支持以下两种类型的表-外部表内部表外部表创建表时,外部表需要location属性。例如,如果您的数据已经以Text / JSON文件或HBase表的形式存在,则可以将其注册为Tajo外部表。以下查询是创建外部表的示例。这里,外部关键字-用于创建外...