离线数仓-伪分布虚拟机(所有组件部署完成,全流程运行成功)(数仓4.0-2.0,CDH)
所有组件
部署好的
镜像下载
(在下面),仅供参考学习。(百度网盘,微云下载…)
博主通过学习尚硅谷数仓项目,将部署好的数仓虚拟机打包成ovf文件,由于博主电脑内存较小,博主使用了伪分布式集群搭建,全流程运行成功。分享虚拟机镜像文件给予大家学习。搭建数仓只需一台虚拟机,且最低配置(内存:3G,磁盘:20G,CUP:1,Linux最小化安装)
导入镜像的前提设置
记得跟博主设置一样的IP不然可能会出现集群无法使用
修改虚拟机IP
根据下图参考修改
镜像ovf文件的导入
VMware导入ova/ovf虚拟机文件
镜像ovf下载(将下载的所有文件,放在同一个文件夹下)
数仓4.0(已上传)
架构图
注意没学完数仓4.0的Kerberos(视频的P167及其之后视频),数仓4.0启动不了(可选择学完或使用数仓3.0)
视频链接地址
尚硅谷大数据电商数仓V4.0
部署好的虚拟机镜像下载
数仓4.0镜像-百度网盘下载
提取码:
yyds
虚拟机描述(账号密码)
数仓4.0
系统:CentOS 7.5
主机名:warehouse
IP:192.168.88.103
Linux:root:root atguigu:atguigu
Mysql:root:000000 azkaban:azkaban ranger:ranger
Azkaban:atguigu:atguigu
Kylin:ADMIN:KYLIN
Superset:root:root
Zabbix:Admin:zabbix
Grafana:admin:admin
Kerberos:admin:admin atguigu:atguigu hdfs/hadoop:hdfs
Ranger:admin:atguigu123
Atlas:admin:admin
数仓3.0(已上传)
架构
视频链接地址
尚硅谷大数据电商数仓V3.0
部署好的虚拟机镜像下载
数仓3.0镜像-百度网盘下载
密码:
yyds
操作演示地址
离线数仓3(伪分布)—运行结果预览
虚拟机描述(账号密码)
数仓3.0
系统:CentOS 7.9
主机名:servers
IP:192.168.88.102
Linux:root:123456
Mysql:root:123456 azkaban:123456
Kafka:admin:123456
Kylin:ADMIN:KYLIN
Superset:servers:servers
Azkaban:servers:servers
Zabbix:Admin:zabbix
数仓2.0(已上传)
架构
视频链接地址
尚硅谷大数据电商数仓V2.0
部署好的虚拟机镜像下载
数仓2.0镜像-百度网盘下载
密码:
yyds
虚拟机描述(账号密码)
数仓2.0
系统:CentOS6.8
主机名:cluster
IP:192.168.88.101
Linux:root:123456
Mysql:root:123456
Azkaban:admin:admin
Superset:admin:admin
Kylin:ADMIN:KYLIN
Zabbix:Admin:zabbix
Atlas:admin:admin
CDH数仓(已上传)
架构
注意:伪分布内存较少(CDH的资源监控无法正常显示)
视频链接地址
尚硅谷大数据CDH电商数仓
部署好的虚拟机镜像下载
CDH数仓镜像-百度网盘下载
提取码:
yyds
虚拟机描述(账号密码)
CDH
CentOS6.8
Linux:root:123456
mysql:root:000000
Cloudera Manager:admin:admin
Hue:admin:admin yarn:yarn
如有问题可在评论区评论,博主会及时回复
版权归原作者 坤坤不爱吃鱼 所有, 如有侵权,请联系我们删除。