📅  最后修改于: 2021-01-05 03:00:09             🧑  作者: Mango
用户应了解以下有关流处理的概念:
这是必不可少的,也是最令人困惑的概念。在流处理中,大多数操作都依赖时间。因此,对于这种流应用程序,通常的时间观念是典型的任务。
Kafka Stream处理涉及以下时间概念:
流处理应用程序中维护着不同的状态。
状态为:
表是由主键唯一标识的记录的集合。触发查询以检查特定时间点的数据状态。表格不包含历史记录,特别是除非我们设计了历史记录。另一方面,流包含更改的历史记录。流是事件的字符串,其中每个事件都会导致更改。因此,表和流是同一枚硬币的两侧。因此,要将表转换为流,用户需要捕获修改表的命令。诸如插入,更新和删除之类的命令将被捕获并存储到流中。另外,如果用户要将流转换为表,则需要转换流包含的所有更改。这种转换过程也称为实现流。因此,我们可以具有将流转换为表以及将表转换为流的双重过程。
时间窗口一词是指将总时间分成几部分。因此,取决于时间窗口的流上有一些操作。这样的操作称为窗口操作。例如,对在两个流上执行的加入操作进行窗口化。尽管人们很少关心操作所需的窗口类型。