📜  Apache Tajo-配置设置

📅  最后修改于: 2020-12-02 06:02:34             🧑  作者: Mango


Tajo的配置基于Hadoop的配置系统。本章详细说明Tajo配置设置。

基本设置

Tajo使用以下两个配置文件-

  • catalog-site.xml-目录服务器的配置。
  • tajo-site.xml-其他Tajo模块的配置。

分布式模式配置

分布式模式设置在Hadoop分布式文件系统(HDFS)上运行。让我们按照以下步骤配置Tajo分布式模式设置。

tajo-site.xml

该文件位于/ / path / to / tajo / conf目录,并用作其他Tajo模块的配置。要以分布式模式访问Tajo,请对“ tajo-site.xml”进行以下更改。

 
   tajo.rootdir 
   hdfs://hostname:port/tajo 

  
 
   tajo.master.umbilical-rpc.address 
   hostname:26001 
 
 
 
   tajo.master.client-rpc.address 
   hostname:26002 

  
 
   tajo.catalog.client-rpc.address 
   hostname:26005 
   

主节点配置

Tajo使用HDFS作为主要存储类型。配置如下,应将其添加到“ tajo-site.xml”中

 
   tajo.rootdir 
   hdfs://namenode_hostname:port/path 
 

目录配置

如果要自定义目录服务,请将$ path / to / Tajo / conf / catalogsite.xml.template复制到$ path / to / Tajo / conf / catalog-site.xml,并根据需要添加以下任何配置。

例如,如果您使用“ Hive目录存储”来访问Tajo,则配置应类似于以下内容-

 
   tajo.catalog.store.class 
   org.apache.tajo.catalog.store.HCatalogStore 
 

如果您需要存储MySQL目录,请应用以下更改-

 
   tajo.catalog.store.class 
   org.apache.tajo.catalog.store.MySQLStore 
 

 
   tajo.catalog.jdbc.connection.id 
    

 
 
   tajo.catalog.jdbc.connection.password 
    

 
 
   tajo.catalog.jdbc.uri 
   jdbc:mysql://:/
      ?createDatabaseIfNotExist = true 
 

同样,您可以在配置文件中注册其他Tajo支持的目录。

工人配置

默认情况下,TajoWorker将临时数据存储在本地文件系统上。它在“ tajo-site.xml”文件中定义如下:

 
   tajo.worker.tmpdir.locations 
   /disk1/tmpdir,/disk2/tmpdir,/disk3/tmpdir 
 

要增加每个辅助资源的运行任务容量,请选择以下配置-

 
   tajo.worker.resource.cpu-cores 
   12 

 
 
   tajo.task.resource.min.memory-mb 
   2000 

  
 
   tajo.worker.resource.disks 
   4 
 

要使Tajo worker以专用模式运行,请选择以下配置-

 
   tajo.worker.resource.dedicated 
   true