📅  最后修改于: 2020-10-30 10:07:51             🧑  作者: Mango
Apache Flink是可以处理流数据的实时处理框架。它是一个开源流处理框架,用于高性能,可伸缩和准确的实时应用程序。它具有真正的流模型,并且不会将输入数据作为批处理或微批处理。
Apache Flink由Data Artisans公司创建,现在由Apache Flink社区根据Apache许可进行开发。到目前为止,这个社区有479位贡献者和15500多个提交。
下图显示了Apache Flink生态系统的不同层-
Apache Flink具有多个可以读取/写入数据的选项。以下是基本存储列表-
您可以在本地模式,集群模式或云上部署Apache Fink。群集模式可以是独立模式,YARN,MESOS。
在云上,Flink可以部署在AWS或GCP上。
这是运行时层,提供了分布式处理,容错能力,可靠性,本地迭代处理能力等。
这是Apache Flink的顶层,也是最重要的层。它具有负责批处理的Dataset API和负责流处理的Datastream API。还有其他库,例如Flink ML(用于机器学习),Gelly(用于图形处理),SQL表格。该层为Apache Flink提供了多种功能。