一、安装前置条件说明
1.1 JDK版本说明
HBase 需要依赖JDK环境,同时HBase 2.0+ 以上版本不再支持JDK 1.7 ,需要安装JDK 1.8+ 。JDK 安装方式见本仓库:
Linux环境下JDK安装
1.2 Standalone模式和伪集群模式的区别
- 在Standalone模式下,所有守护进程都运行在一个jvm进程/实例中;
- 在伪分布模式下,HBase仍然在单个主机上运行,但是每个守护进程(HMaster,HRegionServer 和 ZooKeeper)则分别作为一个单独的进程运行。
说明:两种模式任选其一进行部署即可,对于开发测试来说区别不大。
二、Standalone 模式
2.1 下载并解压
从官方网站下载所需要版本的二进制安装包,并进行解压:
1
2
3 1# tar -zxvf hbase-2.1.4-bin.tar.gz
2
3
2.2 配置环境变量
1
2
3 1# vim /etc/profile
2
3
添加环境变量:
1
2
3
4 1export HBASE_HOME=/usr/app/hbase-2.1.4
2export PATH=$HBASE_HOME/bin:$PATH
3
4
使得配置的环境变量生效:
1
2
3 1# source /etc/profile
2
3
2.3 进行HBase相关配置
修改安装目录下的conf/hbase-env.sh,指定JDK的安装路径:
1
2
3
4 1# The java implementation to use. Java 1.8+ required.
2export JAVA_HOME=/usr/java/jdk1.8.0_201
3
4
修改安装目录下的conf/hbase-site.xml,增加如下配置:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 1<configuration>
2 <property>
3 <name>hbase.rootdir</name>
4 <value>file:///home/hbase/rootdir</value>
5 </property>
6 <property>
7 <name>hbase.zookeeper.property.dataDir</name>
8 <value>/home/zookeeper/dataDir</value>
9 </property>
10 <property>
11 <name>hbase.unsafe.stream.capability.enforce</name>
12 <value>false</value>
13 </property>
14</configuration>
15
16
hbase.rootdir: 配置hbase数据的存储路径;
hbase.zookeeper.property.dataDir: 配置zookeeper数据的存储路径;
hbase.unsafe.stream.capability.enforce: 使用本地文件系统存储,不使用HDFS的情况下需要禁用此配置,设置为false。
2.4 启动HBase
由于已经将HBase的bin目录配置到环境变量,直接使用以下命令启动:
1
2
3 1# start-hbase.sh
2
3
2.5 验证启动是否成功
验证方式一 :使用jps命令查看HMaster进程是否启动。
1
2
3
4
5 1[root@hadoop001 hbase-2.1.4]# jps
216336 Jps
315500 HMaster
4
5
验证方式二 :访问HBaseWeb UI 页面,默认端口为16010 。
三、伪集群模式安装(Pseudo-Distributed)
3.1 Hadoop单机伪集群安装
这里我们采用HDFS作为HBase的存储方案,需要预先安装Hadoop。Hadoop的安装方式单独整理至:
Hadoop单机伪集群搭建
3.2 Hbase版本选择
HBase的版本必须要与Hadoop的版本兼容,不然会出现各种Jar包冲突。这里我Hadoop安装的版本为hadoop-2.6.0-cdh5.15.2,为保持版本一致,选择的HBase版本为hbase-1.2.0-cdh5.15.2 。所有软件版本如下:
- Hadoop 版本: hadoop-2.6.0-cdh5.15.2
- HBase 版本: hbase-1.2.0-cdh5.15.2
- JDK 版本:JDK 1.8
3.3 软件下载解压
下载后进行解压,下载地址:http://archive.cloudera.com/cdh5/cdh/5/
1
2
3 1# tar -zxvf hbase-1.2.0-cdh5.15.2.tar.gz
2
3
3.4 配置环境变量
1
2
3
4 1# vim /etc/profile
2
3
4
添加环境变量:
1
2
3
4 1export HBASE_HOME=/usr/app/hbase-1.2.0-cdh5.15.2
2export PATH=$HBASE_HOME/bin:$PATH
3
4
使得配置的环境变量生效:
1
2
3
4 1# source /etc/profile
2
3
4
3.5 进行HBase相关配置
1.修改安装目录下的conf/hbase-env.sh,指定JDK的安装路径:
1
2
3
4 1# The java implementation to use. Java 1.7+ required.
2export JAVA_HOME=/usr/java/jdk1.8.0_201
3
4
2.修改安装目录下的conf/hbase-site.xml,增加如下配置(hadoop001为主机名):
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19 1<configuration>
2 <!--指定 HBase 以分布式模式运行-->
3 <property>
4 <name>hbase.cluster.distributed</name>
5 <value>true</value>
6 </property>
7 <!--指定 HBase 数据存储路径为HDFS上的hbase目录,hbase目录不需要预先创建,程序会自动创建-->
8 <property>
9 <name>hbase.rootdir</name>
10 <value>hdfs://hadoop001:8020/hbase</value>
11 </property>
12 <!--指定 zookeeper 数据的存储位置-->
13 <property>
14 <name>hbase.zookeeper.property.dataDir</name>
15 <value>/home/zookeeper/dataDir</value>
16 </property>
17</configuration>
18
19
3.修改安装目录下的conf/regionservers,指定region servers的地址,修改后其内容如下:
1
2
3 1hadoop001
2
3
3.6 启动
1
2
3 1# bin/start-hbase.sh
2
3
3.7 验证启动是否成功
验证方式一 :使用jps命令查看进程。其中HMaster,HRegionServer是HBase的进程,HQuorumPeer是HBase内置的Zookeeper的进程,其余的为HDFS和YARN的进程。
1
2
3
4
5
6
7
8
9
10
11
12
13
14 1[root@hadoop001 conf]# jps
228688 NodeManager
325824 GradleDaemon
410177 Jps
522083 HRegionServer
620534 DataNode
720807 SecondaryNameNode
818744 Main
920411 NameNode
1021851 HQuorumPeer
1128573 ResourceManager
1221933 HMaster
13
14
验证方式二 :访问HBase Web UI 界面,需要注意的是1.2 版本的HBase的访问端口为60010
更多大数据系列文章可以参见个人 GitHub 开源项目: 程序员大数据入门指南