当前位置：首页 > news >正文

canal rocketmq

news 2026/2/10 13:42:42

上篇文章canal 消费进度说到直接使用ClusterCanalConnector并发消费是有问题的，可以先用单点将canal事件发送到mq中，再由mq并发处理，另外mq还可以做到削峰的作用，让canal数据不至于阻塞。

使用队列，可以自己起一个单实例服务使用ClusterCanalConnector将消息丢队列里，也可以直接使用canal server， canal server原生支持几种队列：Kafka, RocketMQ ,RabbitMQ, PulsarMQ，下面了解一下canal sever具体的处理过程。

canal server将消息投递到mq中

在canal server中，如果检测到配置了mq，就会启动线程来读取bin log事件，并投递到mq中：
CanalMQStarter

while (running && destinationRunning.get()) {Message message;if (getTimeout != null && getTimeout > 0) {message = canalServer.getWithoutAck(clientIdentity,getBatchSize,getTimeout.longValue(),TimeUnit.MILLISECONDS);} else {message = canalServer.getWithoutAck(clientIdentity, getBatchSize);}final long batchId = message.getId();int size = message.isRaw() ? message.getRawEntries().size() : message.getEntries().size();if (batchId != -1 && size != 0) {canalMQProducer.send(canalDestination, message, new Callback() {@Overridepublic void commit() {canalServer.ack(clientIdentity, batchId); // 提交确认}@Overridepublic void rollback() {canalServer.rollback(clientIdentity, batchId);}}); // 发送message到topic} else {try {Thread.sleep(100);} catch (InterruptedException e) {// ignore}}}

从代码可以看到，首先调用getWithoutAck从实例获取事件，然后调用canalMQProducer.send将消息投递到队列中，如果投递成功就执行ack，否则执行rollback，因为投递消息到队列是非常快的操作，所以这就降低了阻塞的风险。

最终发送mq消息的代码如下(CanalRocketMQProducer)：

    private void sendMessage(Message message, int partition) {//...SendResult sendResult = this.defaultMQProducer.send(message, (mqs, msg, arg) -> {if (partition >= mqs.size()) {return mqs.get(partition % mqs.size());} else {return mqs.get(partition);}}, null);//...}

这里有个分区的概念，对于RocketMQ来说就是队列选择，这关系到顺序消费。

业务代码使用RocketMQCanalConnector消费数据

    while (running) {try {connector.connect();connector.subscribe();while (running) {List<Message> messages = connector.getListWithoutAck(1000L, TimeUnit.MILLISECONDS); // 获取messagefor (Message message : messages) {long batchId = message.getId();int size = message.getEntries().size();if (batchId == -1 || size == 0) {// try {// Thread.sleep(1000);// } catch (InterruptedException e) {// }} else {printSummary(message, batchId, size);printEntry(message.getEntries());// logger.info(message.toString());}}connector.ack(); // 提交确认}} catch (Exception e) {logger.error(e.getMessage(), e);}}connector.unsubscribe();// connector.stopRunning();
}

可以看到这和之前ClusterCanalConnector一样的处理方法，只是底层实现不一样，在subscribe的时候，调用了mq的subscribe:

    public synchronized void subscribe(String filter) throws CanalClientException {//...rocketMQConsumer.subscribe(this.topic, "*");rocketMQConsumer.registerMessageListener(new MessageListenerOrderly() {@Overridepublic ConsumeOrderlyStatus consumeMessage(List<MessageExt> messageExts, ConsumeOrderlyContext context) {context.setAutoCommit(true);boolean isSuccess = process(messageExts);if (isSuccess) {return ConsumeOrderlyStatus.SUCCESS;} else {return ConsumeOrderlyStatus.SUSPEND_CURRENT_QUEUE_A_MOMENT;}}});rocketMQConsumer.start();//...}

可以看到这里使用了MessageListenerOrderly来进行顺序消费，使用process来处理消息

private boolean process(List<MessageExt> messageExts) {//...for (MessageExt messageExt : messageExts) {//...if (!flatMessage) {Message message = CanalMessageDeserializer.deserializer(data);messageList.add(message);} else {FlatMessage flatMessage = JSON.parseObject(data, FlatMessage.class);messageList.add(flatMessage);}ConsumerBatchMessage batchMessage;if (!flatMessage) {batchMessage = new ConsumerBatchMessage<Message>(messageList);} else {batchMessage = new ConsumerBatchMessage<FlatMessage>(messageList);}try {messageBlockingQueue.put(batchMessage);} catch (InterruptedException e) {logger.error("Put message to queue error", e);throw new RuntimeException(e);}boolean isCompleted;try {isCompleted = batchMessage.waitFinish(batchProcessTimeout);} catch (InterruptedException e) {logger.error("Interrupted when waiting messages to be finished.", e);throw new RuntimeException(e);}boolean isSuccess = batchMessage.isSuccess();return isCompleted && isSuccess;}

这里将数据放到了messageBlockingQueue中，然后等待消息执行完成， ConsumerBatchMessage内置了一个CountDownLatch， batchMessage.waitFinish会阻塞在这里。
客户端使用getFlatList/getFlatListWithoutAck取数据时，就是从messageBlockingQueue取出数据，调用ack时，会释放ConsumerBatchMessage中的CountDownLatch, 这样mq消费者就可以继续从队列中拿数据了。

    @Overridepublic List<Message> getListWithoutAck(Long timeout, TimeUnit unit) throws CanalClientException {if (this.lastGetBatchMessage != null) {throw new CanalClientException("mq get/ack not support concurrent & async ack");}ConsumerBatchMessage batchMessage = messageBlockingQueue.poll(timeout, unit);//...}@Overridepublic void ack() throws CanalClientException {if (this.lastGetBatchMessage != null) {this.lastGetBatchMessage.ack();}//...}

对于MessageListenerOrderly来说，是一个消费线程对应一个mq队列的，从而实现多线程消费，而这里把不同mq队列的消息在messageBlockingQueue中排队，并且使用getListWithoutAck/ack也不支持并发，又变成了单线程模式，这可能对性能造成影响，建议生产环境对性能有要求时，采用自己写代码来实现mq的消费。

配置

mq相关参数说明

canal rocketmq

canal server将消息投递到mq中

业务代码使用RocketMQCanalConnector消费数据

配置

相关文章：

canal rocketmq

【数据库系统概论】第九章关系查询处理何查询优化

bp盐丘模型波场数值模拟matlab

结构体对齐规则

css 如何让元素内部文本和外部文本一块显示省略号

SQL语句-中级

巧用h2-database.jar连接数据库

136.只出现一次的数字

mysql中遇到查询字段的别名与函数冲突问题

直播获奖

选择适合自身业务的HTTP代理有哪些因素决定？

1.3 do...while实现1+...100 for实现1+...100

react数据管理之setState与Props

如何保护我们的网络安全

springboot 制造装备物联及生产管理ERP系统

Google zxing 生成带logo的二维码图片

使用Python计算平面多边形间最短距离

【Python】Python语言基础（中）

观察者模式、订阅者发布者模式、vtk中的观察者模式

关于element-ui中，页面上有多个el-table并通过v-if、v-else等控制是否显示时，type=selection勾选框失效或不显示的问题

Psychopy音频的使用

select、poll、epoll 与 Reactor 模式

Mysql中select查询语句的执行过程

Vite中定义@软链接

Web后端基础(基础知识)

c# 局部函数定义、功能与示例

MySQL的pymysql操作

Vue 3 + WebSocket 实战：公司通知实时推送功能详解

用 Rust 重写 Linux 内核模块实战：迈向安全内核的新篇章

MySQL体系架构解析（三）：MySQL目录与启动配置全解析