📅  最后修改于: 2020-12-27 02:32:24             🧑  作者: Mango
Apache Spark是一个开放源代码群集计算框架。其主要目的是处理实时生成的数据。
Spark建立在Hadoop MapReduce的顶部。它经过优化可在内存中运行,而诸如Hadoop的MapReduce之类的替代方法则可以在计算机硬盘之间来回写入数据。因此,Spark处理数据的速度比其他方法快得多。
Spark由2009年在加州大学伯克利分校AMPLab的Matei Zaharia发起。它于2010年在BSD许可下开源。
2013年,该项目被Apache Software Foundation收购。 2014年,Spark成为Apache顶级项目。
随处运行-它可以轻松地在Hadoop,Apache Mesos,Kubernetes,独立或云中运行。