什么是Kafka Connect
Kafka Connect 是一款可扩展并且可靠地在 Apache Kafka 和其他系统之间进行数据传输的工具。 可以很简单的定义 connectors(连接器) 将大量数据迁入、迁出Kafka。
例如我现在想要把数据从MySQL迁移到ElasticSearch,为了保证高效和数据不会丢失,我们选择MQ作为中间件保存数据。这时候我们需要一个生产者线程,不断的从MySQL中读取数据并发送到MQ,还需要一个消费者线程消费MQ的数据写到ElasticSearch,这件事情似乎很简单,不需要任何框架。
但是如果我们想要保证生产者和消费者服务的高可用性,例如重启后生产者恢复到之前读取的位置,分布式部署并且节点宕机后将任务转移到其他节点。如果要加上这些的话,这件事就变得复杂起来了,而Kafka Connect 已经为我们造好这些轮子。
- 实时
- 高可用
- 数据迁移
参考
Kafka Connect 如何工作?
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5jFG6pL2-1681868831890)(/images/tech/kafka-connect.webp)]
Kafka Connect 特性如下:
- Kafka 连接器的通用框架:Kafka Connect 标准化了其他数据系统与Kafka的集成,从而简化了连接器的开发,部署和管理
- 支持分布式模式和单机模式部署
- Rest API:通过简
版权归原作者 goddessblessme 所有, 如有侵权,请联系我们删除。