1、相关概念
1.1、消息队列(MQ)
MQ(message queue),从字面意思上看,本质是个队列,FIFO 先入先出,只不过队列中存放的内容是message 而已,还是一种跨进程的通信机制,用于上下游传递消息。在互联网架构中,MQ 是一种非常常见的上下游“逻辑解耦+物理解耦”的消息通信服务。使用了 MQ 之后,消息发送上游只需要依赖 MQ,不用依赖其他服务。
为什么要使用MQ,是这样的先了解一下同步通讯和异步通讯的区别,同步通讯时效性比较高,对数据可以做出立即的响应,但是随之而来的它存在的问题,不同业务之间的耦合度高,当执行业务需要连贯的业务逻辑时,性能和吞吐能力下降,涉及多个业务相互调用的时候业务链中的任何一个挂掉就会导致一连串的业务失败也就是级联失败。
异步通讯的话的使整个项目的耦合度降低,吞吐量提升,同时实现故障隔离避免出先级联失败的情况,缺点时时效性没有那么强。(不行加一层!!!),那么么学习的消息队列就是基于异步方式的通讯。
1.2、消息队列优点
1.2.1、解耦合
应用中有支付业务、订单业务、短信业务、存储业务等等。用户支付后,如果耦合调用订单业务、短信业务、存储业务,任何一个子系统出了故障,都会造成下单操作异常。当转变成基于消息队列的方式后,系统间调用的问题会减少很多,比如下单之后的订单业务系统因为发生故障,需要几分钟来修复。在这几分钟的时间里,订单系统要处理的内存被缓存在消息队列中,用户的下单支付操作可以正常完成。当订单系统恢复后,继续处理订单信息即可,用户感受不到订单系统的故障,提升系统的可用性。
1.2.2、流量消峰
举个例子,如果订单系统最多能处理一万次订单,这个处理能力应付正常时段的下单时绰绰有余,正常时段我们下单一秒后就能返回结果。但是在高峰期,如果有两万次下单操作系统是处理不了的,只能限制订单超过一万后不允许用户下单。使用消息队列做缓冲,我们可以取消这个限制,把一秒内下的订单分散成一段时间来处理,这时有些用户可能在下单十几秒后才能收到下单成功的操作,但是比不能下单的体验要好。
1.2.3、异步处理
有些服务间调用是异步的,例如 A 调用 B,B 需要花费很长时间执行,但是 A 需要知道 B 什么时候可以执行完,以前一般有两种方式,A 过一段时间去调用 B 的查询 api 查询。或者 A 提供一个 callback api,B 执行完之后调用 api 通知 A 服务。这两种方式都不是很优雅,使用消息总线,可以很方便解决这个问题,A 调用 B 服务后,只需要监听 B 处理完成的消息,当 B 处理完成后,会发送一条消息给 MQ,MQ 会将此消息转发给 A 服务。这样 A 服务既不用循环调用 B 的查询 api,也不用提供 callback api。同样 B 服务也不用做这些操作。A 服务还能及时的得到异步处理成功的消息。
1.3、消息中间件
1.3.1、ActiveMQ
优点:单机吞吐量万级,时效性 ms 级,可用性高,基于主从架构实现高可用性,消息可靠性较低的概率丢失数据
缺点:官方社区现在对 ActiveMQ 5.x **维护越来越少,高吞吐量场景较少使用**。
1.3.2、Kafka
大数据的杀手锏,谈到大数据领域内的消息传输,则绕不开 Kafka,这款为**大数据而生**的消息中间件,以其**百万级****TPS** 的吞吐量名声大噪,迅速成为大数据领域的宠儿,在数据采集、传输、存储的过程中发挥着举足轻重的作用。目前已经被 LinkedIn,Uber, Twitter, Netflix 等大公司所采纳。
优点: 性能卓越,单机写入 TPS 约在百万条/秒,最大的优点,就是吞**吐量高**。时效性 ms 级可用性非常高,kafka 是分布式的,一个数据多个副本,少数机器宕机,不会丢失数据,不会导致不可用,消费者采用 Pull 方式获取消息,,消息有序, 通过控制能够保证所有消息被消费且仅被消费一次;有优秀的第三方Kafka Web 管理界面 Kafka-Manager;在日志领域比较成熟,被多家公司和多个开源项目使用;功能支持:功能较为简单,主要支持简单的 MQ 功能,在大数据领域的实时计算以及**日志采集**被大规模使用。
缺点:Kafka 单机超过 64 个队列/分区,Load 会发生明显的飙高现象,队列越多,load 越高,发送消息响应时间变长,使用短轮询方式,实时性取决于轮询间隔时间,消费失败不支持重试;支持消息顺序,但是一台代理宕机后,就会产生消息乱序,**社区更新较慢**;
1.3.3、RocketMQ
RocketMQ 出自阿里巴巴的开源产品,用 Java 语言实现,在设计时参考了 Kafka,并做出了自己的一些改进。被阿里巴巴广泛应用在订单,交易,充值,流计算,消息推送,日志流式处理,binglog 分发等场景。
优点:**单机吞吐量十万级**,可用性非常高,分布式架构,**消息可以做到****0****丢失**,MQ 功能较为完善,还是分布式的,扩展性好,支持 **10****亿级别的消息堆积**,不会因为堆积导致性能下降,源码是 java 我们可以自己阅读源码,定制自己公司的 MQ
缺点:**支持的客户端语言不多**,目前是 java 及 c++,其中 c++不成熟;社区活跃度一般,没有在 MQ核心中去实现 JMS 等接口,有些系统要迁移需要修改大量代码。
1.3.4、RabbitMQ
2007 年发布,是一个在 AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,是**当前最主流的消息中间件之一**。
优点:由于 erlang 语言的高并发特性,性能较好;吞吐量到万级,MQ 功能比较完备,健壮、稳定、易用、跨平台、支持多种语言 如:Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP等,支持 AJAX 文档齐全;开源提供的管理界面非常棒,用起来很好用,社区活跃度高;更新频率相当高。
总结:
安全选RocketMQ,高吞吐选kafka,对这两个方面没有那么高的话就选RabbitMQ。
2、RabbitMQ
2.1、核心概念
- 生产者:产生数据发送消息的程序是生产者
- 交换机:交换机是 RabbitMQ 非常重要的一个部件,一方面它接收来自生产者的消息,另一方面它将消息推送到队列中。交换机必须确切知道如何处理它接收到的消息,是将这些消息推送到特定队列还是推送到多个队列,亦或者是把消息丢弃,这个得有交换机类型决定。
- 队列:队列是 RabbitMQ 内部使用的一种数据结构,尽管消息流经 RabbitMQ 和应用程序,但它们只能存储在队列中。队列仅受主机的内存和磁盘限制的约束,本质上是一个大的消息缓冲区。许多生产者可以将消息发送到一个队列,许多消费者可以尝试从一个队列接收数据。这就是我们使用队列的方式。
- 消费者:消费与接收具有相似的含义。消费者大多时候是一个等待接收消息的程序。请注意生产者,消费者和消息中间件很多时候并不在同一机器上。同一个应用程序既可以是生产者又是可以是消费者。
2.2、工作模式
hello world(简单模式):一个生产者,一个消费者,消费生产最简单的模式。
Work Queues(工作模式):一个生产者多个消费者,消费者之间存在竞争关系,每个消费者获取到的消息唯一。
Publish/Subscribe(订阅模式):一个生产者发送的消息会被多个消费者获取。
Routing(路由模式):发送消息到交换机并且要指定路由key ,消费者将队列绑定到交换机时需要指定路由key。
Topics(匹配模式):将路由键和某模式进行匹配,此时队列需要绑定在一个模式上,“#”匹配一个词或多个词,“*”只匹配一个词。
Publisher Confirms(发布者确认):消息发布者发布消息后确认消息的消费者收到消息。
2.3、工作架构
- Broker:接收和分发消息的应用,RabbitMQ Server就是Message Broker
- Virtual host:出于多租户和安全因素设计的,把AMQP 的基本组件划分到一个虚拟的分组中,类似于网络中的namespace概念。当多个不同的用户使用同一个RabbitMQserver提供的服务时,可以划分出多个虚拟主机,每个用户在自己的虚拟主机创建exchange/queue 等。
- Connection:publisher/consumer和broker之间的TCP连接
- Channel:如果每一次访问RabbitMQ 都建立一个Connection,在消息量大的时候建立TCP Connection的开销将是巨大的,效率也较低。Channel是在connection内部建立的逻辑连接,如果应用程序支持多线程,通常每个thread创建单独channel进行通讯,AMQP method包含了channel id 帮助客户端和message broker 识别channel,所以channel之间是完全隔离的。Channel作为轻量级的Connection极大减少了操作系统建立TCP connection的开销。
- Exchange:message 到达broker 的第一站,根据分发规则,匹配查询表中的routing key,分发消息到queue 中去。常用的类型有:direct (point-to-point),topic (publish-subscribe) and fanout (multicast)。
- Queue:消息最终被送到这里等待consumer取走。
- Binding:exchange和queue之间的虚拟连接,binding中可以包含routing key,Binding信息被保存到exchange中的查询表中,用于message的分发依据。
2.4、安装RabbitMQ
由于RabbitMQ是使用Erlang进行开发的,所以在安装的时候要首先安装Erlang的环境,对于版本的依赖比较强这里参考官方的版本之间的对应关系,进行下载安装。此外可以使下面的网址进行快速的检索自己需要下载文件:https://packagecloud.io/rabbitmq/erlang/packages。这里有一个要注意的地方查看自己床的linux版本,el6、el7、el8还是el9,使用下面命令可以查看。
uname -a
然后将下载好的文件上传到虚拟机中,接下来就是具体的安装和配置了
#安装erlang
rpm -ivh erlang-23.3.4.11-1.el7.x86_64.rpm
#安装依赖包
yum install socat -y
#安装rabbitmq
rpm -ivh rabbitmq-server-3.10.0-1.el7.noarch.rpm
#配置开机启动
chkconfig rabbitmq-server on
#启动
[root@localhost /]# /sbin/service rabbitmq-server start
#查看状态
/sbin/service rabbitmq-server status
#关闭
/sbin/service rabbitmq-server stop
#开启 web 管理插件
rabbitmq-plugins enable rabbitmq_management
#重新开启服务
/sbin/service rabbitmq-server start
到这里已经安装完毕,现在就可以直接访问ui界面http://192.168.200.88:15672/#/ ,记得关闭防火墙!默认的密码和账号是guest,但是初次登录是不成功的是因为没有权限,那么接下来就是要创建用户和设置密码分配权限。
#创建账号
rabbitmqctl add_user admin 123
#创建账号密码
rabbitmqctl set_user_tags admin administrator
#设置用户权限使用命令set_permissions [-p <vhostpath>] <user> <conf> <write> <read>
rabbitmqctl set_permissions -p "/" admin ".*" ".*" ".*"
用户 user_admin 具有/vhost1 这个 virtual host 中所有资源的配置、写、读权限
#当前用户和角色
rabbitmqctl list_users
再次访问
关闭应用的命令为
rabbitmqctl stop_app
清除的命令为
rabbitmqctl reset
重新启动命令为
rabbitmqctl start_app
3、工作模式
3.1、简单模式
依赖
<!--rabbitmq 依赖客户端-->
<dependency>
<groupId>com.rabbitmq</groupId>
<artifactId>amqp-client</artifactId>
<version>5.14.0</version>
</dependency>
<!--操作文件流的一个依赖-->
<dependency>
<groupId>commons-io</groupId>
<artifactId>commons-io</artifactId>
<version>2.11.0</version>
</dependency>
**生产者 **
package com.songzhishu.rabbitmq.producer;
import com.rabbitmq.client.Channel;
import com.rabbitmq.client.Connection;
import com.rabbitmq.client.ConnectionFactory;
import java.io.IOException;
import java.util.concurrent.TimeoutException;
/**
* @BelongsProject: RabbitMQ
* @BelongsPackage: com.songzhishu.rabbitmq.producer
* @Author: 斗痘侠
* @CreateTime: 2024-01-28 17:46
* @Description: 消息生产者
* @Version: 1.0
*/
public class MessageProduction {
public static final String QUEUE_NAME = "hello";
public static void main(String[] args) throws IOException, TimeoutException {
//创建连接工厂
ConnectionFactory factory = new ConnectionFactory();
//设置RabbitMQ相关信息
factory.setHost("192.168.200.88");
factory.setUsername("admin");
factory.setPassword("10100109");
//创建一个新的连接
Connection connection = factory.newConnection();
//创建一个通道
Channel channel = connection.createChannel();
//声明一个队列 参数:队列名称、
// 是否持久化 存储到磁盘、默认存储到内存、
// 是否排他 消息队列是否和其他消费者共享
// 是否自动删除是指当队列中没有消息,是否自动删除掉队列
// 其他参数
channel.queueDeclare(QUEUE_NAME, false, false, false, null);
//发送消息到队列中 参数:交换机名称、队列名称路由的key值、其他参数、消息内容
channel.basicPublish("", QUEUE_NAME, null, "Hello RabbitMQ".getBytes());
System.out.println("Producer Send +'" + "Hello RabbitMQ" + "'");
}
}
消费者
package com.songzhishu.rabbitmq.consumer;
import com.rabbitmq.client.*;
import java.io.IOException;
import java.util.concurrent.TimeoutException;
/**
* @BelongsProject: RabbitMQ
* @BelongsPackage: com.songzhishu.rabbitmq.consumer
* @Author: 斗痘侠
* @CreateTime: 2024-01-28 18:13
* @Description: 消费者接收消息
* @Version: 1.0
*/
public class ConsumerReceiving {
public static final String QUEUE_NAME = "hello";
public static void main(String[] args) throws IOException, TimeoutException {
ConnectionFactory factory = new ConnectionFactory();
//设置RabbitMQ相关信息
factory.setHost("192.168.200.88");
factory.setUsername("admin");
factory.setPassword("10100109");
//创建一个新的连接
Connection connection = factory.newConnection();
Channel channel = connection.createChannel();
//接收到消息后的回调
DeliverCallback deliverCallback = (consumerTag, delivery) -> {
String message = new String(delivery.getBody(),"UTF-8");
System.out.println("Consumer Received '" + message + "'");
};
//取消消息的回调
CancelCallback cancelCallback = consumerTag -> {
System.out.println("消息消费被中断");
};
//创建一个通道 参数:
// 队列名称
// 是否自动确认消息 true表示自动确认消息 false表示不自动确认消息
channel.basicConsume(QUEUE_NAME,true,deliverCallback,cancelCallback);
System.out.println("Consumer Waiting Received messages");
}
}
3.2、工作模式
工作队列(又称任务队列)的主要思想是避免立即执行资源密集型任务,而不得不等待它完成。相反我们安排任务在之后执行。我们把任务封装为消息并将其发送到队列。在后台运行的工作进程将弹出任务并最终执行作业。当有多个工作线程时,这些工作线程将一起处理这些任务。轮询的方式处理队列中的消息,消费者之间是竞争关系而且对于每一个消息只能被处理一次。
生产者
package com.songzhishu.rabbitmq.producer;
import com.rabbitmq.client.Channel;
import com.songzhishu.rabbitmq.util.RabbitMqUtils;
import java.util.Scanner;
/**
* @BelongsProject: RabbitMQ
* @BelongsPackage: com.songzhishu.rabbitmq.producer
* @Author: 斗痘侠
* @CreateTime: 2024-01-28 18:47
* @Description: TODO
* @Version: 1.0
*/
public class WorkProducer {
public static final String QUEUE_NAME = "hello";
public static void main(String[] args) throws Exception {
Channel channel = RabbitMqUtils.getChannel();
channel.queueDeclare(QUEUE_NAME, false, false, false, null);
//从控制台发送20条消息
Scanner scanner = new Scanner(System.in);
while (scanner.hasNext()) {
String message = scanner.next();
channel.basicPublish("", QUEUE_NAME, null, message.getBytes());
System.out.println("生产者发送消息:" + message);
}
}
}
消费者
package com.songzhishu.rabbitmq.consumer;
import com.rabbitmq.client.Channel;
import com.songzhishu.rabbitmq.util.RabbitMqUtils;
/**
* @BelongsProject: RabbitMQ
* @BelongsPackage: com.songzhishu.rabbitmq.producer
* @Author: 斗痘侠
* @CreateTime: 2024-01-28 18:36
* @Description: 消费者1
* @Version: 1.0
*/
public class WorkOne {
public static final String QUEUE_NAME = "hello";
public static void main(String[] args) throws Exception {
Channel channel = RabbitMqUtils.getChannel();
//消息接收
channel.basicConsume(QUEUE_NAME, true, (consumerTag, message) -> {
System.out.println("消费者接收到的消息:" + new String(message.getBody()));
}, consumerTag -> {
System.out.println("接收消息失败");
});
System.out.println("消费者2启动完毕,等待接收消息...");
}
}
这里利用idea的功能,启动多个实例,然后运行后查看控制台,两个消费者一人一个轮询方式接受消息。
3.3、消息应答
消费者完成一个任务可能需要一段时间,如果其中一个消费者处理一个长的任务并仅只完成了部分突然它挂掉了,会发生什么情况。RabbitMQ 一旦向消费者传递了一条消息,便立即将该消息标记为删除。在这种情况下,突然有个消费者挂掉了,我们将丢失正在处理的消息。以及后续发送给该消费这的消息,因为它无法接收到。
为了保证消息在发送过程中不丢失,rabbitmq 引入消息应答机制,消息应答就是:**消费者在接收到消息并且处理该消息之后,告诉 rabbitmq 它已经处理了,rabbitmq 可以把该消息删除了。** 简单的理解就是发布者发布后不是立即删除队列中的消息,而是选择一种在消费者接受并且确认消息后,然后才会删除队列中的消息,保证消息传递的可靠性。
3.3.1、自动应答方式
消息发送后立即被认为已经传送成功,这种模式需要在**高吞吐量和数据传输安全性方面做权衡**,因为这种模式如果消息在接收到之前,消费者那边出现连接或者 channel 关闭,那么消息就丢失了,当然另一方面这种模式消费者那边可以传递过载的消息,**没有对传递的消息数量进行限制**,当然这样有可能使得消费者这边由于接收太多还来不及处理的消息,导致这些消息的积压,使得内存耗尽,最终这些消费者线程被操作系统杀死,**所以这种模式仅适用在消费者可以高效并以某种速率能够处理这些消息的情况下使用**。
3.3.2、手动应答方式
在实际的开发中使用的基本上都是以手动的方式进行消息的确认,其中手动确认的api有以下三种方案。
Channel.basicAck(用于肯定确认),RabbitMQ 已知道该消息并且成功的处理消息,可以将其丢弃了。
Channel.basicNack(用于否定确认)
Channel.basicReject(用于否定确认),与 Channel.basicNack 相比少一个参数不处理该消息了直接拒绝,可以将其丢弃了
同时,手动应答还支持批量操作用来减缓网络拥挤,只需要在手动应答的时候选择开启批量应答就可以,但是这批量的操作方式也可能会导致数据的丢失。
3.3.3、消息重新入队
如果消费者由于某些原因失去连接(其通道已关闭,连接已关闭或TCP连接丢失),导致消息未发送ACK确认,RabbitMQ将了解到消息未完全处理,并将对其重新排队。如果此时其他消费者可以处理,它将很快将其重新分发给另一个消费者。这样,即使某个消费者偶尔死亡,也可以确保不会丢失任何消息。
3.3.4、案例
生产者
package com.songzhishu.rabbitmq.producer;
import com.rabbitmq.client.Channel;
import com.songzhishu.rabbitmq.util.RabbitMqUtils;
import java.util.Scanner;
/**
* @BelongsProject: RabbitMQ
* @BelongsPackage: com.songzhishu.rabbitmq.producer
* @Author: 斗痘侠
* @CreateTime: 2024-01-28 21:08
* @Description: 消息确认机制
* @Version: 1.0
*/
public class AckWorkProducer {
public static final String QUEUE_NAME = "ack_queue";
public static void main(String[] args) throws Exception {
Channel channel = RabbitMqUtils.getChannel();
channel.queueDeclare(QUEUE_NAME, false, false, false, null);
Scanner scanner = new Scanner(System.in);
System.out.println("请输入消息:");
while (scanner.hasNext()) {
String message = scanner.next();
channel.basicPublish("", QUEUE_NAME, null, message.getBytes());
System.out.println("生产者发送消息:" + message);
}
}
}
消费者
package com.songzhishu.rabbitmq.consumer;
import com.rabbitmq.client.Channel;
import com.songzhishu.rabbitmq.util.RabbitMqUtils;
/**
* @BelongsProject: RabbitMQ
* @BelongsPackage: com.songzhishu.rabbitmq.consumer
* @Author: 斗痘侠
* @CreateTime: 2024-01-28 21:13
* @Description: TODO
* @Version: 1.0
*/
public class AckWorkTwo1 {
public static final String QUEUE_NAME = "ack_queue";
public static void main(String[] args) throws Exception {
Channel channel = RabbitMqUtils.getChannel();
//消息接收 参数
channel.basicConsume(QUEUE_NAME, false, (consumerTag, message) -> {
//业务处理
try {
Thread.sleep(3000);
} catch (InterruptedException e) {
e.printStackTrace();
}
//手动确认消息
channel.basicAck(message.getEnvelope().getDeliveryTag(),false);
System.out.println("消费者1接收到的消息:" + new String(message.getBody()));
}, consumerTag -> {
System.out.println("接收消息失败");
});
}
}
测试,当模拟消费者1业务错误未确认的消息将由消费者2进行数据处理!
3.4、持久化
3.4.1、队列持久化
之前我们创建的队列都是非持久化的,rabbitmq如果重启的化,该队列就会被删除掉,如果要队列实现持久化需要在声明队列的时候把durable参数设置为持久化。
channel.queueDeclare(QUEUE_NAME, true, false, false, null);
但是需要注意的就是如果之前声明的队列不是持久化的,需要把原先队列先删除,或者重新创建一个持久化的队列,不然就会出现错误。
3.4.2、消息实现持久化
要想让消息实现持久化需要在消息生产者修改代码,然后实现消息持久化,
channel.basicPublish("", QUEUE_NAME, MessageProperties.PERSISTENT_TEXT_PLAIN, message.getBytes());
将消息标记为持久化并不能完全保证不会丢失消息。尽管它告诉RabbitMQ将消息保存到磁盘,但是这里依然存在当消息刚准备存储在磁盘的时候但是还没有存储完,消息还在缓存的一个间隔点。此时并没有真正写入磁盘。持久性保证并不强,但是对于我们的简单任务队列而言,这已经绰绰有余了。
3.5、不公平分发
RabbitMQ默认使用的是轮询的方式进行消息的分发,但是在某种场景下这种策略并不是很好,比方说有两个消费者在处理任务,其中有个消费者1处理任务的速度非常快,而另外一个消费者2 处理速度却很慢,这个时候我们还是采用轮训分发的化就会到这处理速度快的这个消费者很大一部分时间处于空闲状态,而处理慢的那个消费者一直在干活,这种分配方式在这种情况下其实就不太好,但是RabbitMQ并不知道这种情况它依然很公平的进行分发。
为了避免这种情况,我们可以设置参数channel.basicQos(1)
意思就是如果这个任务我还没有处理完或者我还没有应答你,你先别分配给我,我目前只能处理一个任务,然后rabbitmq就会把该任务分配给没有那么忙的那个空闲消费者,当然如果所有的消费者都没有完成手上任务,队列还在不停的添加新任务,队列有可能就会遇到队列被撑满的情况,这个时候就只能添加新的worker或者改变其他存储任务的策略。
3.6、预取值
本身消息的发送就是异步发送的,所以在任何时候,channel上肯定不止只有一个消息另外来自消费者的手动确认本质上也是异步的。因此这里就存在一个未确认的消息缓冲区,因此希望开发人员能**限制此缓冲区的大小,以避免缓冲区里面无限制的未确认消息问题**。这个时候就可以通过使用basic.qos方法设置“**预取计数**”值来完成的。**该值定义通道上允许的未确认消息的最大数量**。一旦数量达到配置的数量,RabbitMQ将停止在通道上传递更多消息,除非至少有一个未处理的消息被确认,例如,假设在通道上有未确认的消息5、6、7,8,并且通道的预取计数设置为4,此时RabbitMQ将不会在该通道上再传递任何消息,除非至少有一个未应答的消息被ack。比方说tag=6这个消息刚刚被确认ACK,RabbitMQ将会感知这个情况到并再发送一条消息。消息应答和QoS预取值对用户吞吐量有重大影响。通常,增加预取将提高向消费者传递消息的速度。**虽然自动应答传输消息速率是最佳的,但是,在这种情况下已传递但尚未处理的消息的数量也会增加,从而增加了消费者的RAM消耗**(随机存取存储器)应该小心使用具有无限预处理的自动确认模式或手动确认模式,消费者消费了大量的消息如果没有确认的话,会导致消费者连接节点的内存消耗变大,所以找到合适的预取值是一个反复试验的过程,不同的负载该值取值也不同100到300范围内的值通常可提供最佳的吞吐量,并且不会给消费者带来太大的风险。预取值为1是最保守的。当然这将使吞吐量变得很低,特别是消费者连接延迟很严重的情况下,特别是在消费者连接等待时间较长的环境中。对于大多数应用来说,稍微高一点的值将是最佳的。
**0轮询,1不公平分发,其他数字预取值 **
4、发布确认
生产者将信道设置成confirm模式,一旦信道进入confirm模式,**所有在该信道上面发布的消息都将会被指派一个唯一的ID**(从1开始),一旦消息被投递到所有匹配的队列之后,broker 就会发送一个确认给生产者(包含消息的唯一ID),这就使得生产者知道消息已经正确到达目的队列了,如果消息和队列是可持久化的,那么确认消息会在将消息写入磁盘之后发出,broker回传给生产者的确认消息中delivery-tag域包含了确认消息的序列号,此外broker也可以设置basic.ack的multiple域,表示到这个序列号之前的所有消息都已经得到了处理。
confirm模式最大的好处在于他是异步的,一旦发布一条消息,生产者应用程序就可以在等信道返回确认的同时继续发送下一条消息,当消息最终得到确认之后,生产者应用便可以通过回调方法来处理该确认消息,如果RabbitMQ因为自身内部错误导致消息丢失,就会发送一条nack消息,生产者应用程序同样可以在回调方法中处理该nack消息。
发布确认默认是没有开启的,如果要开启需要调用方法confirmSelect,每当你要想使用发布确认,都需要在channel上调用该方法。
4.1、确认发布方式
4.1.1、单个确认发布
这是一种简单的确认方式,它是一种**同步确认发布**的方式,也就是发布一个消息之后只有它被确认发布,后续的消息才能继续发布,waitForConfirmsOrDie(long)这个方法只有在消息被确认的时候才返回,如果在指定时间范围内这个消息没有被确认那么它将抛出异常。
这种确认方式有一个最大的缺点就是:**发布速度特别的慢,**因为如果没有确认发布的消息就会阻塞所有后续消息的发布,这种方式最多提供每秒不超过数百条发布消息的吞吐量。当然对于某些应用程序来说这可能已经足够了。
public static void one() throws Exception {
Channel channel = RabbitMqUtils.getChannel();
String queueName = UUID.randomUUID().toString();
channel.queueDeclare(queueName, false, false, false, null);
//开启发布确认
channel.confirmSelect();
long begin = System.currentTimeMillis();
for (int i = 0; i < 1000; i++) {
String message = i + "";
channel.basicPublish("", queueName, null, message.getBytes());
//单个消息确认
boolean flag = channel.waitForConfirms();
if (flag) {
System.out.println("消息发送成功");
}
}
long end = System.currentTimeMillis();
System.out.println("发布1000条单个确认消息耗时:" + (end - begin) + "ms");
}
发布1000条单个确认消息耗时:501ms
4.1.2、批量确认发布
上面那种方式非常慢,与单个等待确认消息相比,先发布一批消息然后一起确认可以极大地提高吞吐量,当然这种方式的缺点就是:当发生故障导致发布出现问题时,不知道是哪个消息出现问题了,我们必须将整个批处理保存在内存中,以记录重要的信息而后重新发布消息。当然这种方案仍然是同步的,也一样阻塞消息的发布。
public static void batch() throws Exception {
Channel channel = RabbitMqUtils.getChannel();
String queueName = UUID.randomUUID().toString();
channel.queueDeclare(queueName, false, false, false, null);
//开启发布确认
channel.confirmSelect();
long begin = System.currentTimeMillis();
//批量确认消息大小
int batchSize = 100;
for (int i = 0; i < 1000; i++) {
String message = i + "";
channel.basicPublish("", queueName, null, message.getBytes());
//多个消息确认
if (i % batchSize == 0) {
channel.waitForConfirms();
System.out.println("消息发送成功");
}
}
long end = System.currentTimeMillis();
System.out.println("发布1000条批量确认消息耗时:" + (end - begin) + "ms");
}
发布1000条批量确认消息耗时:61ms
4.1.3、异步确认发布
异步确认虽然编程逻辑比上两个要复杂,但是性价比最高,无论是可靠性还是效率都没得说,他是利用回调函数来达到消息可靠性传递的,这个中间件也是通过函数回调来保证是否投递成功,下面就让我们来详细讲解异步确认是怎么实现的。
public static void async() throws Exception {
Channel channel = RabbitMqUtils.getChannel();
String queueName = UUID.randomUUID().toString();
channel.queueDeclare(queueName, false, false, false, null);
//开启发布确认
channel.confirmSelect();
long begin = System.currentTimeMillis();
//消息确认成功回调函数 消息确认失败回调函数 参数 1:消息的标记 参数 2:是否批量确认
channel.addConfirmListener((deliveryTag, multiple) -> {
System.out.println("发布确认消息成功:" + deliveryTag);
}, (deliveryTag, multiple) -> {
System.out.println("发布确认消息失败:" + deliveryTag);
});
for (int i = 0; i < 1000; i++) {
String message = i + "";
channel.basicPublish("", queueName, null, message.getBytes());
}
long end = System.currentTimeMillis();
System.out.println("发布1000条异步确认消息耗时:" + (end - begin) + "ms");
}
发布1000条异步确认消息耗时:39ms
如何处理异步未确认消息,最好的解决的解决方案就是把未确认的消息放到一个基于内存的能被发布线程访问的队列,比如说用ConcurrentLinkedQueue这个队列在confirm callbacks与发布线程之间进行消息的传递。
4.2、总结
- 单独发布消息:同步等待确认,简单,但吞吐量非常有限。
- 批量发布消息:批量同步等待确认,简单,合理的吞吐量,一旦出现问题但很难推断出是那条消息出现了问题。
- 异步处理:最佳性能和资源使用,在出现错误的情况下可以很好地控制,但是实现起来稍微难些。
版权归原作者 蒋一清 所有, 如有侵权,请联系我们删除。