📅  最后修改于: 2020-10-30 10:07:35             🧑  作者: Mango
在大数据方面,有两种处理类型-
基于一段时间内收集到的数据进行的处理称为批处理。例如,一家银行经理想要处理过去一个月的数据(随着时间的推移而收集),以了解过去1个月中被取消的支票数量。
基于即时数据的即时结果处理称为实时处理。例如,发生欺诈交易(即时结果)后,银行经理立即收到欺诈警报。
下表列出了批处理和实时处理之间的区别-
Batch Processing | Real-Time Processing |
---|---|
Static Files |
Event Streams |
Processed Periodically in minute, |
Processed immediately nanoseconds |
Past data on disk storage |
In Memory Storage |
Example − Bill Generation |
Example − ATM Transaction Alert |
如今,每个组织中都在大量使用实时处理。欺诈检测,医疗保健中的实时警报和网络攻击警报等用例需要实时处理即时数据。即使是几毫秒的延迟也会产生巨大的影响。
这种实时用例的理想工具是可以输入数据流而不是批处理的工具。 Apache Flink是该实时处理工具。