📅  最后修改于: 2023-12-03 14:51:11.839000             🧑  作者: Mango
Apache Spark 是一款流行的开源分布式计算框架,支持各种大数据处理场景。本文将介绍如何在 Ubuntu 上安装 Spark 2.4.0。
Spark 是基于 Java 开发的,因此需要先安装 Java 开发环境。执行以下命令安装 Java:
sudo apt-get update
sudo apt-get install default-jdk
在安装 Spark 之前,需要先从官方网站上下载 Spark。可以使用以下命令下载 Spark 2.4.0:
wget http://apache.mirrors.ionfish.org/spark/spark-2.4.0/spark-2.4.0-bin-hadoop2.7.tgz
下载完成后,解压 Spark 到指定目录,例如 /usr/local/spark:
sudo tar xvf spark-2.4.0-bin-hadoop2.7.tgz -C /usr/local/
sudo mv /usr/local/spark-2.4.0-bin-hadoop2.7 /usr/local/spark
将 Spark 的 bin 目录添加到系统环境变量中,以便在任何位置使用 Spark 命令:
echo 'export PATH=$PATH:/usr/local/spark/bin' >> ~/.bashrc
source ~/.bashrc
现在,您已经通过 Ubuntu 上的 Spark 安装完成了。您可以通过以下方式启动 Spark:
spark-shell
以上命令将在控制台中启动 Spark-shell。您也可以使用其他命令,如:
pyspark # 启动 PySpark
spark-submit # 提交 Spark 应用程序
现在,您已经成功地在 Ubuntu 上安装了 Spark 2.4.0!