hadoop实战(二)ubuntu18.04搭建hadoop集群

释放双眼，带上耳机，听听看~！

一、安装JDK

官网下载jdk压缩包并解压， vim /etc/proflie 或者修改vi ~/.bashrc 加上如下：


1
2
3
4
5
1export JAVA_HOME=/home/hadoop/jdk1.8.0_161

2export HADOOP_HOME=/home/hadoop/hadoop-2.9.1

3export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

4

5

然后是Source /etc/proflie 或者Source ~/.bashrc ，查看java是否配置成功使用java -version

二、配置ssh免密登录

因为需要涉及到启动hadoop集群，其实是用ssh来实现，如果每次手动去输入密码，一旦节点过多就会很麻烦，可以配置免密登录来解决。


1
2
3
4
5
6
7
8
1cd ~/.ssh

2ssh-keygen -R IP 删除旧的秘钥

3ssh-keygen -t rsa （四个回车）

4执行完这个命令后，会生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）

5将公钥拷贝到要免密登陆的目标机器上

6ssh-copy-id localhost（目标主机地址）

7

8

三、修改hosts

为了方便使用，这里手动添加两个域名解析，


1
2
3
4
5
6
7
1vi /etc/hosts

2192.168.206.131 mini1

3192.168.206.132 mini2

4192.168.206.130 mini3

5192.168.206.134 mini4

6

7

四、配置hadoop

首先应该下载压缩包 http://archive.apache.org/dist/hadoop/core/ ，下载需要的版本然后解压，注意：hadoop2.x的配置文件$HADOOP_HOME/etc/hadoop，进入到目录中
1、hadoop-env.sh，知道jdk路径


1
2
3
4
5
1   vim hadoop-env.sh

2   #第27行

3   export JAVA_HOME=/home/hadoop/jdk1.8.0_161

4

5

2、core-site.xml


1
2
3
4
5
6
7
8
9
10
11
12
1   &lt;!-- 指定HADOOP所使用的文件系统schema（URI），HDFS的老大（NameNode）的地址 --&gt;

2           &lt;property&gt;

3               &lt;name&gt;fs.defaultFS&lt;/name&gt;

4               &lt;value&gt;hdfs://mini1:9000&lt;/value&gt;

5           &lt;/property&gt;

6           &lt;!-- 指定hadoop运行时产生文件的存储目录 --&gt;

7           &lt;property&gt;

8               &lt;name&gt;hadoop.tmp.dir&lt;/name&gt;

9               &lt;value&gt;/home/hadoop/hadoop-2.9.1/hadoopdata&lt;/value&gt;

10      &lt;/property&gt;

11

12

3、hdfs-site.xml


1
2
3
4
5
6
7
8
9
10
11
1   &lt;property&gt;

2       &lt;name&gt;dfs.replication&lt;/name&gt;

3       &lt;value&gt;3&lt;/value&gt;

4   &lt;/property&gt;

5   

6   &lt;property&gt;

7       &lt;name&gt;dfs.secondary.http.address&lt;/name&gt;

8       &lt;value&gt;mini1:50090&lt;/value&gt;

9   &lt;/property&gt;

10

11

4、mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)


1
2
3
4
5
6
7
8
9
1    mv mapred-site.xml.template mapred-site.xml

2   vim mapred-site.xml

3   &lt;!-- 指定mr运行在yarn上 --&gt;

4   &lt;property&gt;

5       &lt;name&gt;mapreduce.framework.name&lt;/name&gt;

6       &lt;value&gt;yarn&lt;/value&gt;

7   &lt;/property&gt;

8

9

5、yarn-site.xml


1
2
3
4
5
6
7
8
9
10
11
1   &lt;property&gt;

2       &lt;name&gt;yarn.resourcemanager.hostname&lt;/name&gt;

3       &lt;value&gt;mini1&lt;/value&gt;

4   &lt;/property&gt;

5   &lt;!-- reducer获取数据的方式 --&gt;

6   &lt;property&gt;

7       &lt;name&gt;yarn.nodemanager.aux-services&lt;/name&gt;

8       &lt;value&gt;mapreduce_shuffle&lt;/value&gt;

9   &lt;/property&gt;

10

11

完成之后需要先格式化hdfs文件系统


1
2
3
1hdfs namenode -format (hadoop namenode -format)

2

3

启动hadoop


1
2
3
4
5
6
7
1   先启动HDFS

2   sbin/start-dfs.sh

3   

4   再启动YARN

5   sbin/start-yarn.sh

6

7

验证是否启动成功


1
2
3
4
5
6
7
8
9
10
11
12
1   使用jps命令验证

2   27408 NameNode

3   28218 Jps

4   27643 SecondaryNameNode

5   28066 NodeManager

6   27803 ResourceManager

7   27512 DataNode

8

9   http://192.168.206.101:50070 （HDFS管理界面）

10  http://192.168.206.101:8088 （MR管理界面）

11

12

{{userData.name}}已认证

hadoop实战(二)ubuntu18.04搭建hadoop集群

一、安装JDK

二、配置ssh免密登录

三、修改hosts

四、配置hadoop

MongoDB最简单的入门教程之一环境搭建

Ubuntu上NFS的安装配置

{{userData.name}}已认证

一、 安装JDK

二、配置ssh免密登录

三、修改hosts

四、配置hadoop

Related posts:

MongoDB最简单的入门教程之一 环境搭建

Ubuntu上NFS的安装配置

Nginx反向代理 实现Web负载均衡

Nginx+keepalived 双机热备（主从模式）

nginx配置https

LAMP环境搭建

一、安装JDK

MongoDB最简单的入门教程之一环境搭建

Nginx反向代理实现Web负载均衡