Hadoop下载、安装、配置、免密码登录以及shell命令说明

释放双眼，带上耳机，听听看~！

镜像环境：centos7_64位，可去官网进行下载

hadoop版本：hadoop-2.8.5,可去官网下载

安装hadoop的前提必须要安装jdk，这个很简单的，不易细说jdk的安装。

一、hadoop下载，我这里下载的是hadoop-2.8.5.tar.gz

二、hadoop安装

（1）、在虚拟机下新建目录soft,命令：mkdir soft

（2）、将下载的hadoop上传到虚拟机下，可使用工具Filezilla进行上传


1
2
3
4
5
6
7
8
9
10
1[root@cluster-3 ~]# hadoop version

2Hadoop 2.8.5

3Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r 0b8464d75227fcee2c6e7f2410377b3d53d3d5f8

4Compiled by jdu on 2018-09-10T03:32Z

5Compiled with protoc 2.5.0

6From source with checksum 9942ca5c745417c14e318835f420733

7This command was run using /usr/local/hadoop-2.8.5/share/hadoop/common/hadoop-common-2.8.5.jar

8[root@cluster-3 ~]# 

9

10

（3）、解压hadoop到/usr/local/目录下，解压命令为


1
2
3
4
1cd /soft

2

3tar -zxvf hadoop-2.8.5.tar.gz -C /usr/local/

4

（4）、将hadoop环境配到系统环境变量中，命令：vi /etc/profile，然后输入i进行编辑模式，填写以下内容即可


1
2
3
4
5
6
7
8
1export HADOOP_HOME=/usr/local/hadoop-2.8.5

2export JAVA_HOME=/usr/local/jdk

3export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

4export PATH=$JAVA_HOME/bin:$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

5export PATH=$PATH:/soft/mysql/bin

6export CATALINA_HOME=/usr/local/tomcat

7

8

按ESC，输入:wq进行保存，

最后保证系统环境变量配置有效，输入source /etc/profile

（5）经过以上保证了hadoop安装成功，可通过命令：hadoop version查看版本，若安装成功，会如下所示：


1
2
3
4
5
6
7
8
9
10
1[root@cluster-3 ~]# hadoop version

2Hadoop 2.8.5

3Subversion https://git-wip-us.apache.org/repos/asf/hadoop.git -r 0b8464d75227fcee2c6e7f2410377b3d53d3d5f8

4Compiled by jdu on 2018-09-10T03:32Z

5Compiled with protoc 2.5.0

6From source with checksum 9942ca5c745417c14e318835f420733

7This command was run using /usr/local/hadoop-2.8.5/share/hadoop/common/hadoop-common-2.8.5.jar

8[root@cluster-3 ~]# 

9

10

三、hadoop的配置（只需要配置5个文件）

以下3个配置是非主要配置：

（1）修改主机名（我的主机名为：cluster-3）

命令：vi /etc/sysconfig/network,添加如下信息


1
2
3
4
1NETWORKING=yes

2HOSTNAME=cluster-3

3

4

（2）将集群加入配置中，命令： vi /etc/hosts ，如下所示，有多少个集群，就在这里进行添加ip和主机名即可


1
2
3
4
5
6
1127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4

2::1         localhost localhost.localdomain localhost6 localhost6.localdomain6

3192.168.79.130  cluster-3

4192.168.79.131  cluster-1

5

6

（3）在windows下进行hosts文件的编辑，找到C:\Windows\System32\drivers\etc,以管理员方式打开hosts文件，进行编辑，将IP和主机名进行添加，如下所示：


1
2
3
4
5
6
7
1# localhost name resolution is handled within DNS itself.

2127.0.0.1       localhost

3::1             localhost

4192.168.79.132 weekend110

5192.168.79.131 cluster-1

6192.168.79.130 cluster-3

7

以下5个是hadoop的主要配置文件，cd /usr/local/hadoop-2.8.5/etc/hadoop 目录下进行配置

（1）hadoop-env.sh文件配置,把jdk的环境加入，系统默认是{JAVA_HOME},这里把他写死


1
2
1export JAVA_HOME=/usr/local/jdk1.8.0_191

2

（2）core-site.xml文件配置，
在hadoop-2.8.5下新建目录data存储临时文件


1
2
3
4
5
6
7
8
9
10
11
12
13
14
1&lt;configuration&gt;

2

3&lt;property&gt;

4&lt;name&gt;fs.defaultFS&lt;/name&gt;

5&lt;value&gt;hdfs://cluster-3:9000&lt;/value&gt;      //主机名和端口号

6&lt;/property&gt;

7&lt;!-- 指定hadoop运行时产生文件的存储目录 --&gt;

8&lt;property&gt;

9&lt;name&gt;hadoop.tmp.dir&lt;/name&gt;

10&lt;value&gt;/usr/local/hadoop-2.8.5/data&lt;/value&gt;

11&lt;/property&gt;

12&lt;/configuration&gt;

13

14

（3）hdfs-site.xml文件配置


1
2
3
4
5
6
7
8
1&lt;configuration&gt;

2&lt;property&gt;

3&lt;name&gt;dfs.replication&lt;/name&gt;

4&lt;value&gt;1&lt;/value&gt;      //HDF副本数，这里看有几台机器

5&lt;/property&gt;

6&lt;/configuration&gt;

7

8

（4）mapred-site.xml文件配置

将mapred-site.xml.template修改为 mapred-site.xml，命令：mv mapred-site.xml.template mapred-site.xml


1
2
3
4
5
6
1&lt;!-- 指定mr运行在yarn上 --&gt;

2       &lt;property&gt;

3           &lt;name&gt;mapreduce.framework.name&lt;/name&gt;

4           &lt;value&gt;yarn&lt;/value&gt;

5    &lt;/property&gt;

6

（5）yarn-site.xml文件配置


1
2
3
4
5
6
7
8
9
10
11
1&lt;!-- 指定YARN的老大（ResourceManager）的地址 --&gt;

2&lt;property&gt;

3   &lt;name&gt;yarn.resourcemanager.hostname&lt;/name&gt;

4   &lt;value&gt;cluster-3&lt;/value&gt; //主机名

5&lt;/property&gt;

6&lt;!-- reducer获取数据的方式 --&gt;

7&lt;property&gt;

8   &lt;name&gt;yarn.nodemanager.aux-services&lt;/name&gt;

9   &lt;value&gt;mapreduce_shuffle&lt;/value&gt;

10&lt;/property&gt;

11

四、启动hadoop集群

（1）格式化namenode（是对namenode进行初始化）
命令： hdfs namenode -format (hadoop namenode -format)

（2）启动hadoop（也可以使用命令：start-all.sh启动hdfs和yarn）

先启动HDFS，命令：start-dfs.sh

再启动yarn,命令：stadrt-yarn.sh

（3）验证是否启动成功，使用命令:jps


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
1[root@cluster-3 hadoop]# start-all.sh

2This script is Deprecated. Instead use start-dfs.sh and start-yarn.sh

3Starting namenodes on [cluster-3]

4cluster-3: starting namenode, logging to /usr/local/hadoop-2.8.5/logs/hadoop-root-namenode-cluster-3.out

5localhost: starting datanode, logging to /usr/local/hadoop-2.8.5/logs/hadoop-root-datanode-cluster-3.out

6Starting secondary namenodes [0.0.0.0]

70.0.0.0: starting secondarynamenode, logging to /usr/local/hadoop-2.8.5/logs/hadoop-root-secondarynamenode-cluster-3.out

8starting yarn daemons

9starting resourcemanager, logging to /usr/local/hadoop-2.8.5/logs/yarn-root-resourcemanager-cluster-3.out

10localhost: starting nodemanager, logging to /usr/local/hadoop-2.8.5/logs/yarn-root-nodemanager-cluster-3.out

11[root@cluster-3 hadoop]# jps

129108 DataNode

139828 Jps

149413 ResourceManager

159261 SecondaryNameNode

169535 NodeManager

17[root@cluster-3 hadoop]# 

18

19

（4）启动成功后，可以使用浏览器登录：

cluster-3:50070 （HDFS管理界面）
cluster-3:8088 （MR管理界面）

如果不行的话就把防火墙关了，命令：systemctl stop firewalld,查看防火墙状态：systemctl status firewalld

HDFS管理界面：

Hadoop下载、安装、配置、免密码登录以及shell命令说明

MR管理界面：

Hadoop下载、安装、配置、免密码登录以及shell命令说明

五、配置免密登录，命令：ssh-keygen -t rsa，在进行如下操作


1
2
3
4
5
6
7
8
9
10
11
1[root@cluster-3 ~]# cd .ssh/

2[root@cluster-3 .ssh]# ll

3总用量 20

4-rw-r--r--. 1 root root  793 1月  21 22:34 authorized_keys

5-rw-------. 1 root root 1675 1月  21 21:55 id_rsa

6-rw-r--r--. 1 root root  396 1月  21 21:56 id_rsa.pub

7-rw-r--r--. 1 root root  396 1月  21 22:34 id_rsa.pub-1

8-rw-r--r--. 1 root root  712 1月  21 22:35 known_hosts

9[root@cluster-3 .ssh]# 

10

11

如果没有文件authorized_keys,可以新建这个文件，最后将公钥密码加入进来即可，命令: cat id_rsa.pub >> authorized_keys

这样就可以免密登录了

六、hadoop 的shell命令

hadoop fs -fs / 查看跟目录下的文件

hadoop fs -mkdir aaa / 在跟目录下新建文件夹aaa

hadoop fs -put a.txt /aaa 上传文件a.txt到hdfs的aaa文件夹下

hadoop fs -rm -r /aaa/a.txt 删除aaa下的a.txt文件

{{userData.name}}已认证

Hadoop下载、安装、配置、免密码登录以及shell命令说明

Windows服务器如何发现被黑

详解Node.js API系列 Crypto加密模块(2) Hmac

{{userData.name}}已认证

Related posts:

Windows服务器如何发现被黑

详解Node.js API系列 Crypto加密模块(2) Hmac

Kubernetes入门

linux 安装nginx+php+mysql

Linux下chkconfig命令详解

使用 Python 获取 Linux 系统信息