📜  Apache Flink-批处理与实时处理

📅  最后修改于: 2020-10-30 10:07:35             🧑  作者: Mango


在大数据方面,有两种处理类型-

  • 批量处理
  • 实时处理

基于一段时间内收集到的数据进行的处理称为批处理。例如,一家银行经理想要处理过去一个月的数据(随着时间的推移而收集),以了解过去1个月中被取消的支票数量。

基于即时数据的即时结果处理称为实时处理。例如,发生欺诈交易(即时结果)后,银行经理立即收到欺诈警报。

下表列出了批处理和实时处理之间的区别-

Batch Processing Real-Time Processing

Static Files

Event Streams

Processed Periodically in minute,
hour, day etc.

Processed immediately

nanoseconds

Past data on disk storage

In Memory Storage

Example − Bill Generation

Example − ATM Transaction Alert

如今,每个组织中都在大量使用实时处理。欺诈检测,医疗保健中的实时警报和网络攻击警报等用例需要实时处理即时数据。即使是几毫秒的延迟也会产生巨大的影响。

这种实时用例的理想工具是可以输入数据流而不是批处理的工具。 Apache Flink是该实时处理工具。