📜  使用 intelligej 运行 spark scala (1)

📅  最后修改于: 2023-12-03 15:06:47.320000             🧑  作者: Mango

使用 Intellij 运行 Spark Scala

Intellij 是一款常用的集成开发环境(IDE),它支持 Scala 语言和 Apache Spark。在本文中,我们将介绍如何在 Intellij 中使用 Scala 和 Spark,以及如何配置 Spark 应用程序。

步骤 1:安装 Intellij

首先,如果您还没有安装 Intellij,请下载并安装它。Intellij 提供了可免费下载的 Community 版本以及付费的 Ultimate 版本,我们这里使用 Community 版本。请前往下面的链接下载并安装:

Intellij Community 下载链接

步骤 2:安装 Scala 插件

Intellij 内置支持 Scala ,但是我们需要安装 Scala 插件以获取更好的支持。请按以下步骤安装 Scala 插件:

  1. 打开 Intellij。
  2. 打开 Settings 对话框(菜单栏 > File > Settings)。
  3. 在左侧面板中,选择 Plugins。
  4. 在搜索框中输入 Scala 并点击搜索按钮。
  5. 找到 Scala 插件并安装。
  6. 安装完成后,重启 Intellij。
步骤 3:创建 Scala 项目

现在,我们可以使用 Intellij 创建一个 Scala 项目。请按以下步骤创建 Scala 项目:

  1. 打开 Intellij。
  2. 点击菜单栏上的 File > New > Project。
  3. 选择 Scala 选项,并选择 sbt 项目类型。
  4. 输入项目名称,并选择项目存储位置。
  5. 创建项目。
  6. 在项目结构中,向 build.sbt 中添加以下依赖项:
libraryDependencies += "org.apache.spark" %% "spark-core" % "2.4.5"
libraryDependencies += "org.apache.spark" %% "spark-sql" % "2.4.5"
步骤 4:编写代码

现在,我们可以开始编写 Scala 代码。请按以下步骤将代码添加到 Scala 项目中:

  1. 右键单击 src/main/scala 目录,并选择 New > Scala Class。
  2. 输入类名称和对象名称。
  3. 复制以下代码并粘贴到类文件中:
import org.apache.spark.sql.SparkSession

object ExampleApp {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession.builder
      .appName("ExampleApp")
      .master("local[*]")
      .getOrCreate()

    val data = spark.read.text("data/input.txt")

    data.show()

    spark.stop()
  }
}

这个例子非常简单,它读取输入文本文件,并将文件的内容打印到控制台上。

步骤 5:运行应用

在 Intellij 中运行 Spark 应用程序需要配置一个运行配置。请按以下步骤配置运行配置:

  1. 点击菜单栏上的 Run > Edit Configurations。

  2. 点击 + 号并选择 Application。

  3. 配置运行配置如下:

    • Name:ExampleApp
    • Main class:ExampleApp
    • Use classpath of module:选择项目名称
    • JRE:选择默认 JRE
    • Environment variables:
      • SPARK_HOME:指向 Spark 安装目录
      • HADOOP_HOME:指向 Hadoop 安装目录
  4. 点击 OK 按钮保存运行配置。

现在,我们可以运行 Spark 应用程序。请按以下步骤运行应用程序:

  1. 单击菜单栏上的 Run > Run 'ExampleApp'。
  2. 应用程序将开始运行并输出数据集的内容。
结论

本文介绍了如何在 Intellij 中使用 Scala 和 Spark,以及如何配置 Spark 应用程序。我们完成了一个简单的示例应用程序,该应用程序使用 Spark 读取文本文件并将其打印到控制台上。现在,您可以开始使用 Intellij 开发更复杂的应用程序!