📜  Apache NiFi-基本概念

📅  最后修改于: 2020-11-18 08:39:25             🧑  作者: Mango


Apache NiFi由Web服务器,流控制器和处理器组成,它们在Java虚拟机上运行。它还具有3个存储库Flowfile存储库,内容存储库和资源存储库,如下图所示。

Apache Web服务器

流文件存储库

该存储库存储遍历apache NiFi数据流的每个流文件的当前状态和属性。该存储库的默认位置在apache NiFi的根目录中。可以通过更改名为“ nifi.flowfile.repository.directory”的属性来更改此存储库的位置。

内容仓库

该存储库包含NiFi所有流文件中存在的所有内容。它的默认目录也位于NiFi的根目录中,可以使用“ org.apache.nifi.controller.repository.FileSystemRepository”属性进行更改。该目录在磁盘中使用大空间,因此建议在安装磁盘中具有足够的空间。

来源库

该存储库跟踪并存储在NiFi中流动的所有流文件的所有事件。有两个来源存储库-易失性来源存储库(在此存储库中,所有来源数据在重启后都会丢失)和持久性来源存储库。其默认目录也位于NiFi的根目录中,可以使用相应存储库的“ org.apache.nifi.provenance.PersistentProvenanceRepository”和“ org.apache.nifi.provenance.VolatileProvenanceRepositor”属性对其进行更改。

来源库