📜  在 ubuntu 上安装 spark 2.4.0 - Shell-Bash (1)

📅  最后修改于: 2023-12-03 14:51:11.839000             🧑  作者: Mango

在 Ubuntu 上安装 Spark 2.4.0

Apache Spark 是一款流行的开源分布式计算框架,支持各种大数据处理场景。本文将介绍如何在 Ubuntu 上安装 Spark 2.4.0。

步骤 1 - 安装 Java

Spark 是基于 Java 开发的,因此需要先安装 Java 开发环境。执行以下命令安装 Java:

sudo apt-get update
sudo apt-get install default-jdk
步骤 2 - 下载 Spark

在安装 Spark 之前,需要先从官方网站上下载 Spark。可以使用以下命令下载 Spark 2.4.0:

wget http://apache.mirrors.ionfish.org/spark/spark-2.4.0/spark-2.4.0-bin-hadoop2.7.tgz
步骤 3 - 解压 Spark

下载完成后,解压 Spark 到指定目录,例如 /usr/local/spark:

sudo tar xvf spark-2.4.0-bin-hadoop2.7.tgz -C /usr/local/
sudo mv /usr/local/spark-2.4.0-bin-hadoop2.7 /usr/local/spark
步骤 4 - 配置环境变量

将 Spark 的 bin 目录添加到系统环境变量中,以便在任何位置使用 Spark 命令:

echo 'export PATH=$PATH:/usr/local/spark/bin' >> ~/.bashrc
source ~/.bashrc
步骤5 - 启动 Spark

现在,您已经通过 Ubuntu 上的 Spark 安装完成了。您可以通过以下方式启动 Spark:

spark-shell

以上命令将在控制台中启动 Spark-shell。您也可以使用其他命令,如:

pyspark # 启动 PySpark
spark-submit # 提交 Spark 应用程序

现在,您已经成功地在 Ubuntu 上安装了 Spark 2.4.0!