📜  Apache NiFi-配置(1)

📅  最后修改于: 2023-12-03 14:59:20.668000             🧑  作者: Mango

Apache NiFi 配置

Apache NiFi 是 Apache 软件基金会开发的一款开源的数据流处理工具。它为数据流设计了简单,易于使用和强大的界面,并提供了一个可扩展的架构,支持高可靠性和大规模数据流传输、集成和处理。

Apache NiFi 的配置非常灵活,可以通过多种方式进行设置和调整。接下来,将介绍一些常见的配置方案。

配置基本信息

在配置 NiFi 基本信息之前,请确保在本地或者云服务器上已成功安装 NiFi。当 NiFi 启动后,在浏览器中输入 http://localhost:8080/nifi 即可进入 NiFi 页面。

NiFi 基本信息可以在 conf/nifi.properties 文件中进行配置。以下是一些常见的配置项:

##############################################################
# General NiFi properties
##############################################################

# web properties #
nifi.web.http.host=
nifi.web.http.port=8080
nifi.web.https.host=
nifi.web.https.port=
nifi.web.https.network.interface.default=
nifi.web.jetty.working.directory=./work/jetty

# cluster common properties #
nifi.cluster.is.node=false
nifi.cluster.node.address=
nifi.cluster.node.protocol.port=

# cluster node properties #
nifi.cluster.node.protocol.threads=10
nifi.cluster.node.protocol.max.threads=50
nifi.cluster.node.event.history.size=25

# security properties #
nifi.security.keystore=
nifi.security.keystoreType=
nifi.security.keystorePasswd=
nifi.security.keyPasswd=
nifi.security.truststore=
nifi.security.truststoreType=
nifi.security.truststorePasswd=

# kerberos properties #
nifi.kerberos.krb5.file=
nifi.kerberos.service.principal=
nifi.kerberos.service.keytab.location=
配置更多服务

NiFi 还提供了一些可选的服务和功能,您可以选择性地配置 them。

配置 Apache Kafka

按照以下步骤配置 Apache Kafka:

  1. 下载 Kafka 并解压缩它。
  2. 在 NiFi 的 conf/nifi.properties 文件中添加以下配置:
nifi.remote.input.host=ip-xxx-xx-xx-xxx.us-west-2.compute.internal
nifi.remote.input.socket.port=9999

nifi.kafka.bootstrap.servers=ip-xxx-xx-xx-xxx:9092
nifi.kafka.topic=some-topic
nifi.kafka.schema.registry.url=http://ip-xxx-xx-xx-xx-xxx:8081

nifi.remote.input.hostnifi.remote.input.socket.port 是用来制定 Kafka 接收数据的主机和端口的。nifi.kafka.bootstrap.servers 是用来制定 Kafka 的服务地址的。

配置 Apache Flink

按照以下步骤配置 Apache Flink:

  1. 下载 Flink 并解压缩它。
  2. 在 NiFi 的 conf/nifi.properties 文件中添加以下配置:
nifi.flink.home=<flink home>
nifi.flink.tmp=<flink home>/tmp
nifi.execute.processors.in.parallel=true
nifi.processing.batch.size=20000

nifi.flink.home 是您已安装的 Flink 的根目录。 nifi.flink.tmp 是 Flink 用来保存临时文件的目录。

配置 Apache Spark

按照以下步骤配置 Apache Spark:

  1. 下载 Spark 并解压缩它。
  2. 在 NiFi 的 conf/nifi.properties 文件中添加以下配置:
nifi.spark.master=yarn
nifi.spark.home=<spark home>
nifi.spark.jars=<jars>
nifi.spark.eventLog.enabled=true
nifi.spark.eventLog.dirs=<event log directory>

nifi.spark.master 是用来指定 Spark 的 master 的。nifi.spark.home 是 Spark 的安装目录。nifi.spark.jars 是用来指定额外的 Spark Jar 包的。nifi.spark.eventLog.enabled 是指定是否开启 Spark 的 event log 记录。 nifi.spark.eventLog.dirs 是用来指定 event log 文件夹的。

结语

Apache NiFi 是一个非常强大的数据流处理工具,它提供了灵活的配置选项,可以满足不同场景下的实际需求。但是在生产环境中,NiFi 的配置可能更加复杂,建议仔细阅读官方文档并咨询专业人员。