📜  Apache NiFi-处理器

📅  最后修改于: 2020-11-18 08:40:37             🧑  作者: Mango


Apache NiFi处理器是创建数据流的基本模块。每个处理器具有不同的功能,这有助于创建输出流文件。下图所示的数据流是使用GetFile处理器从一个目录中获取文件,然后使用PutFile处理器将其存储在另一目录中。

PutFile处理器

获取文件

GetFile进程用于从特定目录中获取特定格式的文件。它还为用户提供了其他选项,以便对提取进行更多控制。我们将在下面的属性部分中讨论它。

获取文件

GetFile设置

以下是GetFile处理器的不同设置-

名称

在“名称”设置中,用户可以根据项目或通过该名称为处理器定义任何名称,这将使名称更有意义。

启用

用户可以使用此设置启用或禁用处理器。

处罚期限

此设置使用户可以在流文件失败的情况下增加惩罚持续时间。

收益期限

此设置用于指定处理器的屈服时间。在此期间,不会再次安排该过程。

公告级别

此设置用于指定该处理器的日志级别。

自动终止关系

它具有检查该特定进程的所有可用关系的列表。通过选中这些框,用户可以对处理器进行编程以在该事件上终止流文件,而不必在流中进一步发送它。

自动终止关系

GetFile调度

这些是GetFile处理器提供的以下调度选项-

排程策略

您可以通过选择时间驱动程序来安排时间,也可以通过选择CRON驱动程序选项来指定CRON字符串。

并发任务

此选项用于定义此处理器的并发任务计划。

执行

用户可以使用此选项定义在所有节点中运行处理器还是仅在主节点中运行处理器。

运行时间表

它用于定义时间驱动策略的时间或CRON驱动策略的CRON表达式。

运行时间表

GetFile属性

GetFile提供了多个属性,如下图所示,将诸如输入目录和文件过滤器之类的强制属性扩展为诸如路径过滤器和最大文件大小之类的可选属性。用户可以使用这些属性来管理文件提取过程。

GetFile属性

GetFile注释

本部分用于指定有关处理器的任何信息。

GetFile注释

PutFile

PutFile处理器用于将文件从数据流存储到特定位置。

PutFile

PutFile设置

PutFile处理器具有以下设置-

名称

在“名称”设置中,用户可以根据项目或通过使名称更有意义的名称为处理器定义任何名称。

启用

用户可以使用此设置启用或禁用处理器。

处罚期限

此设置使用户可以在流文件失败的情况下增加惩罚持续时间。

收益期限

此设置用于指定处理器的屈服时间。在此持续时间内,该过程不再被安排。

公告级别

此设置用于指定该处理器的日志级别。

自动终止关系

此设置具有检查该特定进程的所有可用关系的列表。通过选中这些框,用户可以对处理器进行编程以在该事件上终止流文件,而不必在流中进一步发送它。

自动终止

PutFile调度

这些是PutFile处理器提供的以下调度选项-

排程策略

您可以通过选择计时器驱动程序或通过选择CRON驱动程序选项指定CRON字符串按时间安排进程。还有一个实验策略“事件驱动”,它将在特定事件上触发处理器。

并发任务

此选项用于定义此处理器的并发任务计划。

执行

用户可以使用此选项定义在所有节点中运行处理器还是仅在主节点中运行处理器。

运行时间表

它用于定义计时器驱动策略的时间或CRON驱动策略的CRON表达式。

Putfile运行时间表

PutFile属性

PutFile处理器提供诸如目录之类的属性以指定用于文件传输的输出目录,并提供其他属性来管理传输,如下图所示。

PutFile属性

PutFile注释

本节用于指定有关处理器的任何信息。

Putfile注释