hadoop-3.3.3完全分布式集群搭建
hadoop-3.3.3完全分布式集群搭建前言环境准备软件版本集群规划一、配置jdk环境变量1. 解压jdk2. 修改/etc/profile文件二、hadoop集群搭建1. 关闭防火墙2. 修改主机名3. 添加ip映射4. 配置免密登录5. 修改hadoop配置文件1. 解压2. 配置hadoop
MetaX组件化框架
MetaX 是 58 无线 Android 团队开发一套彻底的组件化框架,它意在降低底层库的升级成本、业务个性化成本和提升业务线编译速度
一文通吃:从 ZooKeeper 一致性,Leader选举讲到 ZAB 协议与 PAXOS 算法(上)
本文将从ZooKeeper集群如何保证一致性,讲到zookeeper保证数据一致性的协议,然后展开讲Zookeeper集群Leader选举,包括集群三种节点的类型,ZAB协议中节点的四种状态,以及两种情况下Leader选举的过程。然后会详细展开讲解ZAB协议,包括ZAB协议中ZXID的结构,ZAB协
sqoop把hive中的数据导入mysql
使用sqoop将hive中的数据导入mysql中记录简单案例首先开启集群:start-all.sh在hive中建库建表,并插入一条数据来为自己做实验:验证一下,是否插入成功:在mysql中建表,并且要与hive中传过来的数据字段相对应:建表后为空:用sqoop将hive中的数据传到mysql中:ex
使用docker搭建hive测试环境
使用docker compose搭建hive测试环境
hbase 启动失败的解决办法
常见的hbase启动失败问题的解决办法
flume采集数据直接存到hive中
小白都能学会的flume采集数据到hive的教程
【 大数据分析Hadoop + Spark 】10分钟搭建Hadoop(伪分布式 )+ Spark(Local模式)环境
【 大数据分析Hadoop + Spark 】10分钟搭建Hadoop(伪分布式 )+ Spark(Local模式)环境
【分布式数据库技术】相关知识概述
分布式数据库技术-基础知识概述1. NoSQL数据库的类型有哪些?2. 怎么判断一个数据库是否是NoSQL数据库?3. NoSQL技术诞生的最初发点是为了解决什么问题?4. 列族数据库存储结构?5. NoSQL数据库有哪些不同类型并举例说明?6. 文档数据库存储的基本元素是哪些?7. Nosql事务
iceberg Flink操作
数据湖iceberg flink实操
Springboot下RabbitMq的简单使用
相关依赖<parent> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-parent</artifactId&g
大数据技术之Hadoop(MapReduce核心思想和工作流程)
文章目录MapReduce 核心思想MapReduce工作流程MapReduce 核心思想MapReduce分为Map阶段和Reduce阶段。Map阶段:前两个MapTask对黄色的区域进行统计,最后一个MapTask对灰色区域进行统计,Map阶段先将数据读到内存,之后对数据进行处理,按照空格将单词
重学scala:scala中的变量、方法、函数
文章目录简介1、 scala中声明变量2、惰性变量3、基本数据类型4、scala类型层次结构5、scala中的条件表达式6、scala方法的重载7、scala中的块表达式8、循环1、for循环2、while循环9、方法和函数1、方法2、函数3、方法和函数的区别4、方法转换为函数提示:代码实例重点在于
SpringBoot整合RabbitMQ实现消息的发送与接收,确认消息,延时消息
文章目录安装消息中间件Windows安装ErLangWindows安装RabbitMq安装RabbitMq UI界面安装延时消息插件SpringBoot整合消息发送端order-service添加依赖application.ymlRabbitMqConfig实体对象生产者服务接口生产者服务实现类测试
第9篇:ElasticSearch分布式搜索6大能力
Elasticsearch最大的优势在于其检索能力。那为了适配日常不同业务的多种查询需求,Elasticsearch为我们提供了六大搜索方式: 轻量搜索、表达式搜索、复杂搜索、全文搜索、短语搜索和高亮搜索。
SpringBoot整合RabbitMQ--死信队列/延迟队列--用法/实例
本文用示例介绍SpringBoot整合RabbitMQ时如何处理死信队列/延迟队列。
第2期:大数据岗位有哪些
目前大数据是一个非常有发展前景的岗位,在IT界薪资待遇也很高,很多人想从事这方面的工作,那下面我们谈谈大数据可以应用到哪些领域,需要哪些技术、都有哪些岗位。
同步存量数据
同步存量数据把数据源端的数据通过Kettle读取,然后通过消息队列中间件(Kafka)导出软件准备Kettle:pdi-ce-9.3.0.0-428kettle简介Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。
一.Kafka入门到精通-Kafka快速入门
前言在内卷严重的程序员圈子中,原地踏步就是退步,所以不能再躺平啦,赶紧爬起来学习,接下来博主将推出《Kafka入门到精通》系列文章,让你可以在企业中玩起Kafka来得心应手,此乃升职加薪必备呀。Kafka认识Kafka 是由Linkedin公司开发的,支持多分区、多副本,基于 Zookeeper 的
zookeeper使用详解
zookeeper