0


大数据:Hadoop HDFS,基础架构,去中心化,中心化模式,HDFS基础架构,虚拟机和云服务器部署HDFS

大数据:Hadoop HDFS,基础架构,去中心化,中心化模式,HDFS基础架构,虚拟机和云服务器部署HDFS

2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试

文章目录

大数据:Hadoop HDFS

在这里插入图片描述
在这里插入图片描述

为什么需要分布式存储?

在这里插入图片描述
文件有100TB
服务器一个机子,能存的下吗?????
no

太大了
需要很多个服务器,分开存
这就是分布式存储

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
网络传输速度也快了
在这里插入图片描述
一个人,干很慢的
仨一起就快了
跟实际的操作车间一样的
在这里插入图片描述
皆大欢喜
为什么,这就是
在这里插入图片描述

分布式的基础架构分析

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
多就难管了
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
master主
slave从
主从模式
在这里插入图片描述
Hadoop就是主从中心化模式

中央集权,集体领导
在这里插入图片描述

HDFS的基础架构

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
HDFileSystem
Hadoop分布式文件系统
主从模式
架构就是中心化的模式
在这里插入图片描述
HDFS主从角色
在这里插入图片描述
仨角色,
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

namenode主
DataNode从
secondarynode辅助
在这里插入图片描述
牛逼屌爆了
仨角色
功能都干嘛
记住

HDFS集群环境部署

在这里插入图片描述
在这里插入图片描述
下载安装包
在这里插入图片描述
Download
最新即可
二进制安装包,即可
exe实体
在这里插入图片描述
在国外的网站,我们访问慢速,需要外网

在这里插入图片描述
用仨服务器来模拟
美滋滋的

在这里插入图片描述
1主,3从,1辅助

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
core-site.xml
通信地址
缓冲文件
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
基本属性
了解即可
在这里插入图片描述
每个node上,都有各自的文件夹
在这里插入图片描述
Hadoop在node1中有了
还需要远程复制到node23中
把Hadoop版本那个文件整体拷贝

node23上也软件连一个快捷方式Hadoop
命名简单
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
把root的权限换给Hadoop用户
chown -R hadoop:hadoop /data
归属权限,子文件夹也是,用户是,归属给hadoop用户
仨node都这么干

在这里插入图片描述
磁盘格式化

启动集群
查看是看namenode的
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
DataNode【livenode】

在这里插入图片描述
在这里插入图片描述

云服务器中部署HDFS

在这里插入图片描述
在这里插入图片描述
和虚拟机中一样部署
都是Linux系统上部署

下载安装包
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
云上部署是公网ip访问
在这里插入图片描述
在这里插入图片描述
这波云服务器才能通过node1去访问云服务器
切换回虚拟机,就注释下面的环境就行
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
备份,镜像,快照,就可以修复了
在这里插入图片描述
在这里插入图片描述
留存压缩包
打包好的

部署,解压,然后对应的主机名,映射,ip搞定就行
启动就行


总结

提示:重要经验:

1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。

标签: 大数据 hadoop hdfs

本文转载自: https://blog.csdn.net/weixin_46838716/article/details/130944694
版权归原作者 冰露可乐 所有, 如有侵权,请联系我们删除。

“大数据:Hadoop HDFS,基础架构,去中心化,中心化模式,HDFS基础架构,虚拟机和云服务器部署HDFS”的评论:

还没有评论