接上篇《大数据学习入门(二)大数据平台有哪些系统及能力?》。我们介绍了一下大数据相关的平台,从这篇开始,我们主要介绍相关的开发系列。
提到大数据,在技术层面大家理所应当的想到hadoop,但是个人想表达一下,hadoop目前在大数据领域其实已经没有以前那么火了,当然这里不是说它过时了,而是想表达火过了。现在的大数据公司业务主要的方向还是数仓和数据中台(关于数仓和数据中台,可以看看本站的相关文章)。
hadoop有很多种安装方式,有试用二进制包安装的,有试用CDH版本的,有试用ambari版本的。由于我们的生产环境是基于ambari安装的,所以这里介绍下ambari的安装方式。进入正题。
这里我们准备3台云服务器,这里演示的服务器主要以腾讯云服务器为准,操作系统是centos7.6。
序号 | 服务器名称 | 服务器ip | 角色及描述 |
1 | node1 | 172.19.0.6 | master |
2 | node2 | 172.19.0.14 | slave1 |
3 | node3 | 172.19.0.2 | slave2 |
对应的服务器信息是上诉信息。
1.1、修改hostname
我们首先登录到这三台服务器上,修改下对应的hostname
登录第一台服务器执行
hostname node1 su
登录第二台服务器执行
hostname node2 su
登录第三台服务器执行
hostname node3 su
1.2、配置host
我们登录每台服务器,在/etc/hosts文件里面添加如下信息
172.19.0.6 node1 172.19.0.14 node2 172.19.0.2 node3
1.3、配置ssh免密码登录
这里我们直接使用root账号配置即可。在每台机器上重复操作如下命令
ssh-keygen 一路回车即可 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys scp -r ~/.ssh/id_rsa.pub node2:~ scp -r ~/.ssh/id_rsa.pub node3:~ 然后使用root账号登录第二台和第三台服务器执行 cat ~/id_rsa.pub >> ~/.ssh/authorized_keys rm -rf ~/id_rsa.pub
重复即可,知道这三台服务器可以任意两两ssh免密码登录
1.4、登录node1服务器,下载安装httpd
yum install -y httpd.x86_64 systemctl enable httpd.service systemctl start httpd.service
安装完后,我们可以看到有对应的目录:/var/www/html,同时也可以访问: http://node1 能看到对应的界面
1.5、安装mysql
这里安装一个mysql,我们直接使用docker创建一个即可,可参考《mysql dokcer-compose安装》。
1.6、下载ambari的安装包
这里下载ambari的安装包有以下几个:
ambari-2.7.4.0-centos7.tar.gz 点击下载
HDP-3.1.4.0-centos7-rpm.tar.gz 点击下载
HDP-UTILS-1.1.0.22-centos7.tar.gz 点击下载
mysql-connector-java.jar 点击下载
HDP-GPL-3.1.4.0-centos7-gpl.tar.gz 点击下载
1.7、上传下载的文件
把上面下载的3个tar.gz包上传到node1服务器的/var/www/html/文件夹下,并解压
把mysql-connector-java.jar上传到node1服务器的/usr/share/java/目录下,如果没有这个目录,直接创建即可。
1.8、创建repo文件
进入到node1服务器的/etc/yum.repos.d/目录下,创建如下文件,并粘贴对应的内容
1)创建ambari.repo
#VERSION_NUMBER=2.7.4.0-118 [ambari-2.7.4.0] #json.url = http://public-repo-1.hortonworks.com/HDP/hdp_urlinfo.json name=ambari Version - ambari-2.7.4.0 baseurl=http://node1/ambari/centos7/2.7.4.0-118 gpgcheck=1 gpgkey=http://node1/ambari/centos7/2.7.4.0-118/RPM-GPG-KEY/RPM-GPG-KEY-Jenkins enabled=1 priority=1
2)创建hdp.repo
#VERSION_NUMBER=3.1.4.0-315 [HDP-3.1.4.0] name=HDP Version - HDP-3.1.4.0 baseurl=http://node1/HDP/centos7/3.1.4.0-315 gpgcheck=1 gpgkey=http://node1/HDP/centos7/3.1.4.0-315/RPM-GPG-KEY/RPM-GPG-KEY-Jenkins enabled=1 priority=1 [HDP-UTILS-1.1.0.22] name=HDP-UTILS Version - HDP-UTILS-1.1.0.22 baseurl=http://node1/HDP-UTILS/centos7/1.1.0.22 gpgcheck=1 gpgkey=http://node1/HDP/centos7/3.1.4.0-315/RPM-GPG-KEY/RPM-GPG-KEY-Jenkins enabled=1 priority=1
3)创建hdp-utils.repo
[HDP-UTILS-1.1.0.22] name=Hortonworks Data Platform Utils Version - HDP-UTILS-1.1.0.22 baseurl=http://node1/HDP-UTILS/centos7/1.1.0.22/ gpgcheck=1 enabled=1 priority=1
4)创建hdp.gpl.repo
#VERSION_NUMBER=3.1.4.0-315 [HDP-GPL-3.1.4.0] name=HDP-GPL Version - HDP-GPL-3.1.4.0 baseurl=http://node1/HDP-GPL/centos7/3.1.4.0-315 gpgcheck=1 gpgkey=http://node1/HDP-GPL/centos7/3.1.4.0-315/RPM-GPG-KEY/RPM-GPG-KEY-Jenkins enabled=1 priority=1
1.9、安装ambari-server
在node1服务器上安装ambari-server
yum install ambari-server
这里安装的时候,直接y即可。
1.10、登录mysql,创建库表
1)登录到我们刚才使用docker启动的mysql里面
2)创建数据库 ambari
3)进入到ambari的数据库
4)执行Ambari-DDL-MySQL-CREATE.sql文件,这个sql文件的地址在node1服务器的 /var/lib/ambari-server/resources/Ambari-DDL-MySQL-CREATE.sql,当ambari-server安装完后,这个sql就会自动存在。
以上我们创建了库,并且执行了sql,创建了表信息。
1.11、初始化ambari环境
安装了ambari之后,我们要先初始化啊mbari环境的配置文件,这里执行
ambari-server setup
然后一路下来一般用默认配置即可,只有在选择数据库的时候,我们选择mysql
然后配置里面,填写对应的mysql信息即可,然后继续一直y。直到提示:Ambari Server 'setup' completed successfully. 就代表ambari的环境初始化完成了。
1.12、启动ambari
ambari-server start
出现如下页面就代表ambari启动完了。
可以看到启动的端口是8080
1.13、访问ambari环境
我们在node1服务器上安装的ambari,所以使用node1上面的ambari的IP+端口访问即可。
这里访问的用户名是:admin 密码是admin
登录进来后就可以看到管理界面了。
还没有评论,来说两句吧...