📜  在 Windows 10 中以伪分布式模式安装和设置 Hadoop(1)

📅  最后修改于: 2023-12-03 14:51:13.289000             🧑  作者: Mango

在 Windows 10 中以伪分布式模式安装和设置 Hadoop

概述

在 Windows 10 上以伪分布式模式安装和设置 Hadoop 可以让程序员在本地开发环境中模拟分布式计算的场景。本文将介绍如何在 Windows 10 中安装和设置 Hadoop。

步骤
1. 准备工作

在开始之前,需要确保以下工具已经安装和配置好:

  • Java JDK:确保已经正确安装和配置了 Java JDK。
  • 确保你已经具备管理员权限,因为安装和配置 Hadoop 需要修改系统环境变量。
2. 安装和配置 Hadoop

2.1 下载 Hadoop

首先,访问 Hadoop 官方网站(https://hadoop.apache.org/)并下载最新稳定版本的 Hadoop。

2.2 解压缩 Hadoop

将下载的 Hadoop 压缩文件解压到你选择的目录中。

2.3 配置 Hadoop 环境变量

  • 在系统环境变量中添加一个新的变量,变量名为 HADOOP_HOME,变量值为解压后的 Hadoop 目录的路径(例如,C:\hadoop)。
  • 在系统环境变量的 Path 变量中追加 %HADOOP_HOME%\bin%HADOOP_HOME%\sbin
3. 修改 Hadoop 配置文件

3.1 修改 core-site.xml

在 Hadoop 配置目录(默认为 %HADOOP_HOME%\etc\hadoop)下,找到 core-site.xml 文件,并用文本编辑器打开。

将以下内容添加到 <configuration> 标签中:

<property>
  <name>fs.defaultFS</name>
  <value>hdfs://localhost:9000</value>
</property>

3.2 修改 hdfs-site.xml

在 Hadoop 配置目录下,找到 hdfs-site.xml 文件,并用文本编辑器打开。

将以下内容添加到 <configuration> 标签中:

<property>
  <name>dfs.replication</name>
  <value>1</value>
</property>

3.3 修改 mapred-site.xml

在 Hadoop 配置目录下,找到 mapred-site.xml.template 文件并将其复制为 mapred-site.xml

用文本编辑器打开 mapred-site.xml,并将以下内容添加到 <configuration> 标签中:

<property>
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
</property>
4. 启动 Hadoop

现在可以通过以下步骤启动 Hadoop:

  • 打开命令提示符(cmd)。
  • 切换到 Hadoop 安装目录的 sbin 目录(例如,cd C:\hadoop\sbin)。
  • 运行 start-dfs.cmd 启动 Hadoop 分布式文件系统。
  • 运行 start-yarn.cmd 启动 Hadoop 的资源管理器。
5. 测试安装

要验证 Hadoop 是否成功安装和设置,请打开浏览器并访问 http://localhost:9870。你将看到 Hadoop 的 Web 界面,显示了 Hadoop 集群的详细信息。

总结

通过按照以上步骤,在 Windows 10 中以伪分布式模式安装和设置 Hadoop。这样,你就可以在本地开发环境中模拟分布式计算的场景,并开始使用 Hadoop 进行大数据处理了。

注意:本文介绍的是在 Windows 10 上以伪分布式模式安装和设置 Hadoop。在生产环境中,可能需要其他配置和调整。