安装配置flume(超详细)

(百度网盘连接:链接:https://pan.baidu.com/s/1VeelyVBttwLMRS-2LGzp8w?内容:export JAVA_HOME=/home/newadd/software/jdk1.8.0_171。2、解压:tar -zxvf apache-flume-1.7.0-bi

大数据从入门到实战-HDFS-JAVA接口之删除文件

HDFS-JAVA接口之删除文件

【大数据】记一次hadoop集群missing block问题排查和数据恢复

记一次 Hadoop 集群 missing block 问题解决及排查思路,集群环境总共有2个NN节点,3个JN节点,40个DN节点,基于hadoop-3.3.1的版本。集群采用的双副本,未使用ec纠删码。因为出现了missing block块高于namenode安全模式启动的阈值,导致nameno

Hadoop伪分布集群配置(我用的是VMwareWorkstation)

记录学习,加深巩固,方便回忆!

大数据 | 实验一:大数据系统基本实验 | 熟悉常用的HDFS操作

1)理解 HDFS 在 Hadoop 体系结构中的角色。2)熟练使用 HDFS 操作常用的 shell 命令。3)熟悉 HDFS 操作常用的 Java API。

HDFS上传文件的过程

hdfs上传文件的过程

头歌 分布式文件系统HDFS 答案

迢迢牵牛星,皎皎河汉女。纤纤擢素手,札札弄机杼。终日不成章,泣涕零如雨。河汉清且浅,相去复几许?盈盈一水间,脉脉不得语。HDFS的块比磁盘的块大,其目的是为了最小化寻址开销。第2关:HDFS-JAVA接口之读取文件。第3关:HDFS-JAVA接口之上传文件。第4关:HDFS-JAVA接口之删除文件。

Hadoop HA 部署

Hadoop HA 部署、1+x大数据中级认证

Hbase Hbck2修复工具介绍和实践

Hbase Hbck2修复工具介绍和实践,我们在Hbase 的使用过程中,我们可能遇到过因为:机房断电、机房断网、ZK或者HBase的GC时间过长等原因引发的一系列HBase不可用的问题,这些问题通常需要通过hbase-operator-tool(HBase集群修复工具)中的工具来解决

实验4 RDD编程初级实践

一、实验目的(1)熟悉Spark的RDD基本操作及键值对操作;(2)熟悉使用RDD编程解决实际具体问题的方法。二、实验平台操作系统:Ubuntu16.04Spark版本:2.1.0三、实验内容和要求实验内容与完成情况:1.spark-shell交互式编程(1)该系总共有多少学生;(2)该系共开设来多

Hadoop集群间文件拷贝

文章主要介绍了Hadoop集群减文件拷贝的使用,借助源码简要分析了拷贝过程。

hadoop HA高可用集群实战

HA(high available),即高可用(24h不中断服务)实现高可用最关键的策略是消除单点故障。HA严格来说是应该分成各个组件的HA机制hadoop2.0之前,在HDFS集群中NamNode存在单点故障(SPOF)NameNode主要存在以下两个方敏影响HDFS集群。NameNode机器发生

数据同步工具DataX从Mysql同步数据到HDFS实战

会先写入临时文件,如果成功,则将临时文件rename,再删除临时文件;如果失败,直接删除临时文件。会在该文件名后添加随机的后缀,作为每个线程写入的实际文件名。我自己在下面的模板文件中添加了一些说明注释。

Hadoop集群配置及运行

本文章基于尚硅谷Hadoop 3.x视频进行总结,仅作为学习交流使用

HDFS常用命令汇总

HDFS常用命令

HDFS文件上传与下载

运行后显示如下,此时Desktop/logs/目录下的log文件已经上传到HDFS的/log1目录中。运行后显示如下,此时Desktop/logs/目录下的log文件已经上传到HDFS的/log2目录中。运行后显示如下,在/home/dolphin/Desktop/logs目录下有一个log文件。此

HDFS总结

客户端拿到数据存放节点位置信息后,会和对应的DataNode节点进行直接交互,进行数据写入,由于数据块具有副本replication,在数据写入时采用的方式是先写第一个副本,写完后再从第一个副本的节点将数据拷贝到其它节点,依次类推,直到所有副本都写完了,才算数据成功写入到HDFS上,副本写入采用的是

Hadoop学习笔记之HDFS

支持海量数据的存储,成百上千的计算机组成存储集群,HDFS可以运行在低成本的硬件之上,具有的高容错、高可靠性、高可扩展性、高吞吐率等特征,非常适合大规模数据集上的应用。

HDFS的文件存储格式以及HDFS异构存储和存储策略

HDFS常见的文件存储格式。冷数据、热数据、暖数据、冻数据的异构存储。HDFS块存储类型的选择策略:HOT 、COLD、WARM、LAZY_PERSIST 以及相关操作的方法。

登录可以使用的更多功能哦! 登录
作者榜
...
资讯小助手

资讯同步

...
内容小助手

文章同步

...
Deephub

公众号:deephub-imba

...
奕凯

公众号:奕凯的技术栈