📅  最后修改于: 2020-12-02 06:02:34             🧑  作者: Mango
Tajo的配置基于Hadoop的配置系统。本章详细说明Tajo配置设置。
Tajo使用以下两个配置文件-
分布式模式设置在Hadoop分布式文件系统(HDFS)上运行。让我们按照以下步骤配置Tajo分布式模式设置。
该文件位于/ / path / to / tajo / conf目录,并用作其他Tajo模块的配置。要以分布式模式访问Tajo,请对“ tajo-site.xml”进行以下更改。
tajo.rootdir
hdfs://hostname:port/tajo
tajo.master.umbilical-rpc.address
hostname:26001
tajo.master.client-rpc.address
hostname:26002
tajo.catalog.client-rpc.address
hostname:26005
Tajo使用HDFS作为主要存储类型。配置如下,应将其添加到“ tajo-site.xml”中。
tajo.rootdir
hdfs://namenode_hostname:port/path
如果要自定义目录服务,请将$ path / to / Tajo / conf / catalogsite.xml.template复制到$ path / to / Tajo / conf / catalog-site.xml,并根据需要添加以下任何配置。
例如,如果您使用“ Hive目录存储”来访问Tajo,则配置应类似于以下内容-
tajo.catalog.store.class
org.apache.tajo.catalog.store.HCatalogStore
如果您需要存储MySQL目录,请应用以下更改-
tajo.catalog.store.class
org.apache.tajo.catalog.store.MySQLStore
tajo.catalog.jdbc.connection.id
tajo.catalog.jdbc.connection.password
tajo.catalog.jdbc.uri
jdbc:mysql://:/
?createDatabaseIfNotExist = true
同样,您可以在配置文件中注册其他Tajo支持的目录。
默认情况下,TajoWorker将临时数据存储在本地文件系统上。它在“ tajo-site.xml”文件中定义如下:
tajo.worker.tmpdir.locations
/disk1/tmpdir,/disk2/tmpdir,/disk3/tmpdir
要增加每个辅助资源的运行任务容量,请选择以下配置-
tajo.worker.resource.cpu-cores
12
tajo.task.resource.min.memory-mb
2000
tajo.worker.resource.disks
4
要使Tajo worker以专用模式运行,请选择以下配置-
tajo.worker.resource.dedicated
true