了解开源消息代理RabbitMQ
RabbitMQ是一个消息代理:它接受并转发消息。你可以把它想象成邮局:当你把要寄的邮件放进邮箱时,你可以确定邮递员最终会把邮件送到收件人那里。在这个比喻中,RabbitMQ是一个邮筒、一个邮局和一个邮递员。RabbitMQ和邮局之间的主要区别在于,它不处理纸张,而是接受、存储和转发二进制数据消息。
hadoop搭建,jps没有datanode节点解决办法(实用简化版)
办法2.删除master节点 usr/local/hadoop/dfs目录下的data和name目录,然后创建新的data,name。(若仍报错,请检查usr/local/hadoop/etc/hadoop目录下配置文件,确保文件路径正确,都可以打开)本人情况:Hadoop分布式搭建,有主节点mas
记一次 RabbitMQ 消费者莫名消失问题的排查
2、OOM 不一定会导致 JVM 退出,但是 SimpleMessageListenerContainer 会捕获它,然后中止当前线程,对应的队列消费者也就无了3、业务代码 catch Error 虽说只是缓兵之计,但从健壮性考虑的话,也是一个不错的解决办法4、但 OOM 的原因还得继续排查,然后对
消息队列(基于Kafka)八股复习/面试提词器
消息队列八股提词器更新,三大件完结!
【大数据】深入了解Hadoop
hdfs的元数据两个部分内存上的元数据在服务运行期间,所有的元数据会先存储在内存上文件信息,datanode信息,块信息元数据文件为了避免内存上的元数据丢失,会将内存的上的元数据保存在磁盘上secondarynamenode完成元数据文件的保存存储位置在hadoop的指定数据edits_xxxxx
【kafka】基本概念
kafka基本概念:包括主题、分区、副本、以及详细介绍副本机制
大数据技术进阶-spark的分布式join策略选择(附实例)
不论是shuffle join还是broadcast join,一旦数据分发完毕,理论上可以采用HJ、SMJ、NLJ这3种实现机制中的任意一种,完成Executors内部的数据关联。因此,两种分发模式,与三种实现机制,组合起来,共有6种分布式join策略。对于等值关联,spark sql优先考虑采用
1、消息队列框架:Kafka - 开源项目研究文章
Apache Kafka是一个高性能的分布式发布-订阅消息队列系统,最初由LinkedIn公司开发,并在2010年贡献给了Apache基金会成为顶级开源项目。Kafka的主要应用场景包括日志收集、消息系统、用户活动跟踪、运营指标记录和流式处理等。 Kafka的架构包括以下几个核心组件:To
解决RabbitMQ设置TTL过期后不进入死信队列
解决RabbitMQ设置TTL过期后不进入死信队列
RabbitMQ的性能调优有哪些常用方法?
RabbitMQ 的性能调优是一个多方面的过程,涉及到配置调整、硬件优化以及代码层面的改进。
Kafka入门-分区及压缩
Kafka入门-分区及压缩
Kafka Broker 的 Leader 选举机制
定义Leader 选举:Leader 选举是指在 Kafka 中,当某个分区的 Leader Broker 发生故障或不可用时,系统会自动选举一个新的 Leader Broker 来接管该分区的过程。目的高可用性:通过 Leader 选举机制,Kafka 可以确保在 Leader Broker 故障
RabbitMQ的六种消息模式(golang实现)
RabbitMQ 提供六种消息模式,适用于不同的应用场景:简单模式用于一对一消息传递,工作队列模式通过多个消费者分发任务,发布/订阅模式广播消息给多个队列,路由模式通过路由键精确分发消息,主题模式支持模糊匹配的路由键,RPC 模式实现远程调用与异步响应。每种模式灵活应对不同的分布式消息需求,实现高效
案例:ZooKeeper + Kafka消息队列集群部署
概念:消息队列、Kafka、ZooKeeper;案例步骤:Kafka + ZooKeeper高可用集群
在Centos7中安装Hadoop详细教程
在末端添加以下代码,如果跟我路径一致,可直接复制,不一样的话,要注意自己安装路径,即上面上传解压的路径。第一个property中的Value:hdfs://zhang:9000/,修改主机名,比如我的主机名为zhang,端口号9000是固定的,特别注意下 主机名,可以使用。第二个property中的
Zookeeper的监听机制
Zookeeper是一个开源的、分布式的,为分布式框架提供协调服务的Apache框架。它基于观察者模式设计,能够存储和管理分布式系统中大家共同关心的数据,并接收观察者的注册。一旦数据状态发生变化,Zookeeper将负责通知已经在其上注册的观察者(即监听器)做出相应的反应。
Hadoop 常用生态组件
Flink 独立运行:与 Spark 一样,Flink 支持独立的 Local 模式和 Standalone 模式,不依赖 Hadoop 的 HDFS 或 YARN。:Flink 可以与 HDFS 集成,用 HDFS 作为分布式文件系统来存储和读取大规模数据,特别适用于批处理场景。:Flink 可以
Kafka快速入门
首先引入这样一个场景:A服务可以发送200qps(Queries Per Second,是指每秒查询率),而B服务可以处理100qps。很显然,B服务很可能会被A服务压垮掉。怎么为了保证B不被压垮的同时还能处理A消息,没有什么是不能通过一层中间件解决的,如果有,那就再加一层。开始很容易想到,可以在B
kafka-消费者组偏移量重置
kafka-消费者组偏移量重置
理解 RabbitMQ:生产者、连接、通道、交换机、队列与消费者的消息流
生产者(Producer):发送消息的一方。通常在需要时建立连接,不保持长时间连接。连接(Connection):生产者和消费者与 RabbitMQ 之间的物理 TCP 连接。多个通道可以复用一个连接,减少资源消耗。通道(Channel):轻量级的虚拟通信路径,用于执行消息的发送和接收操作。交换机(