📜  如何在 Linux 中安装 Apache Pig?

📅  最后修改于: 2021-10-27 06:37:50             🧑  作者: Mango

Pig 是用于处理大型数据集的高级平台或工具。它为 MapReduce 上的处理提供了高级抽象。它提供了一种高级脚本语言,称为 Pig Latin,用于开发数据分析代码。

为了安装 Apache Pig,您必须在您的系统上安装 Hadoop 和Java 。

步骤 1:从此链接下载新版本的 Apache Pig。在我来说,我已经下载了猪的猪0.17.0.tar.gz版本,这是在大小最新约220MB。

第 2 步:现在将下载的 Pig tar 文件移动到您想要的位置。在我的情况下,我将它移动到我的/Documents文件夹。

Apache Pig 安装 - 1

第 3 步:现在我们在以下命令的帮助下提取这个 tar 文件(确保检查您的 tar 文件名):

tar -xvf pig-0.17.0.tar.gz

Apache Pig 安装-2

第 4 步:安装完成后,我们就可以切换到我们的 Hadoop 用户了。就我而言,它是hadoopusr 。如果您还没有为 Hadoop 创建单独的专用用户,那么在这种情况下,无需移动该文件并根据.bashrc文件中的PIG PATH设置路径。要切换用户,您可以使用以下命令,也可以通过切换用户设置手动切换

su - hadoopusr

Apache Pig 安装 - 3

第 5 步:现在我们需要将此提取的文件夹移动到hadoopusr用户。为此,请使用以下命令(确保您提取的文件夹的名称是 pig-0.17.0 否则相应地更改它)

sudo mv pig-0.17.0 /usr/local/

Apache Pig 安装 - 4

第 6 步:现在一旦我们移动了它,我们需要更改 Pig 位置的环境变量。为此,使用以下命令打开bashrc文件。

sudo gedit ~/.bashrc

Apache Pig 安装 - 5

打开文件后,将以下路径保存在此 bashrc 文件中。

#Pig location
export PIG_INSTALL=/usr/local/pig-0.17.0
export PATH=$PATH:/usr/local/pig-0.17.0/bin

Apache Pig 安装 - 6

步骤 7:然后使用以下命令检查您是否已正确配置它:

source ~/.bashrc

Apache Pig 安装 - 7

第 8 步:一旦正确,我们就成功地将 pig 安装到我们的 Hadoop 单节点设置中,现在我们使用以下 pig 命令启动 pig。

pig

Apache Pig 安装 - 8 类=

第 9 步:您可以使用以下命令检查您的 Pig 版本。

pig -version

检查 Apache Pig 版本