从零开始Hadoop安装和配置（超详细图文步骤）

难以触及的高度

26314人浏览 · 2024-04-25 13:49:06

难以触及的高度 · 2024-04-25 13:49:06 发布

从零开始Hadoop安装和配置

1）首先下载hadoop-2.7.2的jar包

2）下面我们配置Hadoop环境

a.配置主机名和ip地址映射

b.进入到hadoop中配置xml文件

①首先修改vim hadoop-env.sh

②然后修改vim core-site.xml

③然后修改vim hdfs-site.xml

④然后修改vim mapred-site.xml

1.Hadoop学习前的准备

1）首先安装虚拟机

VMWare 虚拟机：因为它不是一个硬件而是用软件做出来的模拟真机所以叫做虚拟机但实际上它里面也可以安装Linux和Windows 实际它的实现

虚拟机中想要实现某个操作时将需求发给Windows 调用Windows的CPU Windows完成以后再将结果返回给虚拟机然后在虚拟机显示出来实际上虚拟机起了一个中间人的作用

将虚拟机安装完成后我们打开如果需要输入密钥我们填一下

ZF3R0-FHED2-M80TY-8QYGC-NPKYF
YF390-0HF8P-M81RQ-2DXQE-M2UT6
ZF71R-DMX85-08DQY-8YMNC-PPHV8

以上密钥如果不能使用请及时联系小编

2）然后我们开始安装Linux

我们创建一个普通用户可以使用自己的名字密码一定要记住

点击选择最小安装然后开始安装安装完成后会自动重启

然后我们使用root用户登录输入密码开始配置

输入vi /etc/sysconfig/network-scripts/ifcfg-ens33vi 相当于Windows下双击打开文件修改原有内容并添加以下内容

然后我们修改一下主机名关闭一下防火墙及其自启动

hostnamectl set-hostname centos1 //修改主机名systemctl stop firewalld.service  //停止防火墙systemctl disable firewalld.service #禁止firewall开机启动hostname 查看计算机名

配置好以后我们关闭虚拟机

3）配置一下网络

Linux通过这个IP就可以访问Windows了所以两者必须一致我们要修改虚拟网络适配器

上述操作全部完成我们现在打开cmd 输入ping（心跳） +Linux的ip地址能够ping通说明我们可以进行通信了配置成功

4）连接虚拟机

上一节配置完成了基础的虚拟机配置及网络配置下面我们开始建立连接我们为什么要与虚拟机建立链接呢？

连接虚拟机就好像跟亲友联系一样总得找个便捷又好用的工具才行 Secure CRT就像是一把能打开通向虚拟机大门的“钥匙” 让我可以从本地电脑轻松地访问和管理虚拟机而且使用 Secure CRT连接虚拟机还可以通过 SSH 或 Telnet 协议建立安全的远程连接保护数据传输的安全性总之 Secure CRT连接虚拟机就是为了简化操作提高效率让我在技术世界里如鱼得水！

首先我们安装下载一下所需要的文件并解压到当前文件夹

双击打开.exe文件

输入我们的主机名IP地址用户名root 点击连接

输入我们设置的密码出现下面的页面就是连接成功了

5）设置免密登录

Linux规定任何软件访问都需要输入密码但是我们在开发的时候有很多台服务器尤其是集群一方面是程序员访问集群或者集群内布互相访问那么我们在每次操作时都要输入密码是很麻烦的所以说我们要设置一下免密登录

生成公钥私钥

将公钥拷贝给本机免密登录设置完成

2.下面我们下载配置一下JDK

1）yum install在线安装软件

yum install net-tools //支持ifconfig
yum install vim //支持vim
yum install glibc.i686 --java命令不好使

2）jdk

因为Hadoop是Java做的所以我们需要jdk的支持我们下载上传一下jdk到我们的jtxy1的/root/目录下

上传完成以后我们开始安装jdk 首先解压

tar -zxvf jdk-8u144-linux-x64.tar.gz -C /usr/local/

-zxvf：z 解压 x 抽取 v 查看进度 -C 到xx目录下

修改一下jdk的名字方便后续操作

3）下面我们配置一下Java的环境变量

vim /etc/profile 按i 进入到INSERT状态下

添加以下两行代码完成后点击Esc Shift+: 输入wq 保存并退出

export JAVA_HOME=/usr/local/jdkexport PATH=$PATH:$JAVA_HOME/bin

$：指的是取变量值然后与后面输入的进行拼接

在shell编程中我们可以定义一个变量如v=33 那么如果我们在它的前面加一个export 我们就可以在所有路径中访问它了

4）添加完以后我们输入source /etc/profile 使里面的变量生效

生效以后这个变量变成一个全局变量我们就可以访问Java了

注意：我们在java下面如果输入cd before 我们是进不去的因为这样他会认为是进入java下面的目录所以我们要加绝对路径 cd d:/before

3.下面我们开始安装配置Hadoop

1）首先下载hadoop-2.7.2的jar包

并添加到我们的jtxy1的/root/目录下

上传完成以后我们开始安装hadoop 首先解压

tar -zxvf hadoop-2.7.2.tar.gz -C /usr/local/

-zxvf：z 解压 x 抽取 v 查看进度 -C 到xx目录下

修改一下hadoop的名字方便后续操作

2）下面我们配置Hadoop环境

a.配置主机名和ip地址映射

vim /etc/hosts

b.进入到hadoop中配置xml文件

cd /usr/local/hadoop/etc/hadoop/

①首先修改vim hadoop-env.sh

export JAVA_HOME=/usr/local/jdk

②然后修改vim core-site.xml

<property>      <name>fs.defaultFS</name>      <value>hdfs://centos1:9000</value>    </property>    <!-- 指定hadoop运行时产生文件的存储目录,最终分片的块数据 -->    <property>      <name>hadoop.tmp.dir</name>      <value>/usr/local/hadoop/tmp</value>                              </property>

③然后修改vim hdfs-site.xml

 <property>                   <name>fs.checkpoint.period</name>                    <value>3000</value>                </property>    <!-- 指定HDFS副本的数量 （集群下，有多台机，可多份，目前就一台）-->    <property>      <name>dfs.replication</name>      <value>1</value>                </property>                <property>        <name>dfs.permissions</name>        <value>false</value> </property>

④然后修改vim mapred-site.xml

先修改一下名字 mv mapred-site.xml.template mapred-site.xml

  <!-- 告诉hadoop 指定mr运行在yarn上 -->    <property>      <name>mapreduce.framework.name</name>      <value>yarn</value>        </property>

⑤最后修改yarn-site.xml

 <!-- 指定YARN的老大（ResourceManager）的地址 yarn -->    <property>      <name>yarn.resourcemanager.hostname</name>      <value>centos1</value>        </property>    <!-- reducer获取数据的方式是shuffle方式 -->        <property>      <name>yarn.nodemanager.aux-services</name>      <value>mapreduce_shuffle</value>        </property>

3）配置Hadoop环境变量

export HADOOP_HOME=/usr/local/hadoopexport PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

配置完成后我们source /etc/profile 使变量生效一下

到这里 Hadoop的安装配置我们就完成啦

4.hadoop初始化

下面我们将namenode进行一下初始化

hdfs namenode -format

(创建文件存储目录：账本目录namenode datanode的目录)

5.hadoop 启动！

初始化完成以后我们启动一下Hadoop

启动文件系统：start-dfs.sh

启动计算系统：start-yarn.sh

下面我们就可以开始Hadoop的学习啦！

成功与不成功之间有时距离很短——只要后者再向前几步。

阅读全文

AI总结

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

2025 GitCode 开发者冬日嘉年华：AI 与开源的深度交融之旅

GitCode 开源社区

GitCode 光引计划投稿 | GoIoT：开源分布式物联网开发平台

GitCode 开源社区

JeeSite 快速开发平台：全能企业级快速开发解决方案｜GitCode 光引计划征文展示

GitCode 开源社区

所有评论(0)

难以触及的高度

@2301_77836489

已为社区贡献6条内容

从零开始Hadoop安装和配置（超详细图文步骤）

难以触及的高度

从零开始Hadoop安装和配置

1.Hadoop学习前的准备

1）首先安装虚拟机

2）然后我们开始安装Linux

3）配置一下网络

4）连接虚拟机

5）设置免密登录

2.下面我们下载配置一下JDK

1）yum install在线安装软件

2）jdk

3）下面我们配置一下Java的环境变量

3.下面我们开始安装配置Hadoop

1）首先下载hadoop-2.7.2的jar包

2）下面我们配置Hadoop环境

a.配置主机名和ip地址映射

b.进入到hadoop中 配置xml文件

①首先 修改vim hadoop-env.sh

②然后 修改vim core-site.xml

③然后 修改vim hdfs-site.xml

④然后 修改vim mapred-site.xml

⑤最后 修改yarn-site.xml

3）配置Hadoop环境变量

4.hadoop初始化

5.hadoop 启动！

所有评论(0)

难以触及的高度

登录社区云

GitCode 开源社区

b.进入到hadoop中配置xml文件

①首先修改vim hadoop-env.sh

②然后修改vim core-site.xml

③然后修改vim hdfs-site.xml

④然后修改vim mapred-site.xml

⑤最后修改yarn-site.xml