0


Golang中常用的kafka库

本文将介绍目前主流的三种第三方kafka库,并结合实际使用中遇到的问题,给出实际的解决方案,本文只涉及kafka数据的消费,且其中对所有库的使用仅为测试过的简单代码,仅记录自己踩坑过程。
问题:最开始使用的是sarama-cluster库,git地址为链接: github.com/bsm/sarama-cluster,但是这个库在使用过程中,存在从头消费kafka数据问题,实际消费场景是实时消费kafka数据,其中有关kafka的配置如下:

  1. package main
  2. import (
  3. "time"
  4. "github.com/Shopify/sarama"
  5. cluster "github.com/bsm/sarama-cluster"
  6. )
  7. func main() {
  8. clusterConfig := cluster.NewConfig()
  9. clusterConfig.Consumer.Return.Errors = true
  10. clusterConfig.Group.Return.Notifications = true
  11. clusterConfig.Consumer.Group.Rebalance.Strategy = sarama.BalanceStrategyRange
  12. clusterConfig.Version = sarama.V0_11_0_0
  13. clusterConfig.Consumer.Offsets.CommitInterval = 1 * time.Second
  14. clusterConfig.Consumer.Offsets.Initial = sarama.OffsetNewest
  15. // TODO: 添加你的业务逻辑
  16. }

sarama-cluster已经废弃了,没有人维护了,所以遇到的问题不易找到解决方案,故考虑换库。
注意:在实际使用中,需要考虑一个现实问题,生产数据的kafka集群和消费kafka的集群在两台服务器,且两台服务器之间并没有进行时钟同步,故基于此情况下考虑去消费实时数据

  1. kafka-go

首先考虑比较轻量的kafka-go库,github的地址为链接: github.com/segmentio/kafka-go,具体的代码示例如下:

  1. package main
  2. import (
  3. "time"
  4. "github.com/segmentio/kafka-go"
  5. )
  6. func main() {
  7. brokers := "192.168.13.22:9092"
  8. groupID := "test"
  9. topic := "example"
  10. consumer := kafka.NewReader(kafka.ReaderConfig{
  11. Brokers: brokers,
  12. GroupID: groupID,
  13. Topic: topic,
  14. MinBytes: 10e3, // 10KB
  15. MaxBytes: 10e6, // 10MB
  16. StartOffset: kafka.LastOffset, // 这个很关键,决定了是否是从最新的位置消费数据
  17. })
  18. // 消费数据
  19. for {
  20. msg, err := consumer.ReadMessage(context.Background())
  21. if err != nil {
  22. fmt.Printf("kafka消费异常,err:%v\n", err)
  23. continue
  24. }
  25. fmt.Printf("Message on partition%d, offset %d, topic %s, msg:%s, time[%v]\n", msg.Partition,
  26. msg.Offset, msg.Topic, string(msg.Value), msg.Time)
  27. // TODO: 添加你的业务逻辑
  28. }
  29. }

踩坑点:经过多次尝试和实际代码调试,kafka-go库中需要注意以下几点:

  • broker是slice,故可以设置多个,但是topic是string类型只能是一个,所以如果有多个topic需要消费,只能采取使用NewReader去创建多个kafka消费者实例
  • 关于group id的设置,真的是踩坑无数,如果group id 设置为空的话,只会消费partition为0的数据。group id相同可能会接着上次未消费的数据进行消费而不是实时消费,这个结论没有验证,但是为了保险起见,多个consumer实例设置为不同的group id没有任何问题
  • 如果需要实时消费,即消费最新的数据,一定要设置StartOffset字段为kafka.LastOffset,这个是尝试了很多才找到的
  1. confluent-kafka-go git上的地址为:github.com/confluentinc/confluent-kafka-go/kafka 创建kafkaConsumer实例及消费数据如下:
  1. func NewConFluentConsumer(broker string, groupId string, topics []string) (*kafka.Consumer, error) {
  2. c, err := kafka.NewConsumer(&kafka.ConfigMap{
  3. "bootstrap.servers": broker,
  4. "group.id": groupId,
  5. "auto.offset.reset": "latest",
  6. })
  7. if err != nil {
  8. fmt.Printf("new confluent consumer failed, err[%v]\n", err)
  9. return nil, err
  10. }
  11. err = c.SubscribeTopics(topics, nil)
  12. if err != nil {
  13. fmt.Printf("subscribe topic[%v] failed, err[%v]\n", topics, err)
  14. return nil, err
  15. }
  16. fmt.Printf"new confluent consumer success, broker[%s], groupId[%s], topic[%v]\n", broker, groupId, topics)
  17. return c, nil
  18. }
  19. func ConsumerMessageWorker(consumer *kafka.Consumer) {
  20. if consumer == nil {
  21. return
  22. }
  23. for {
  24. msg, err := consumer.ReadMessage(-1)
  25. if err == nil {
  26. fmt.Printf("Message on partition%d, topic %s, msg:%s\n", msg.TopicPartition.Partition,*msg.TopicPartition.Topic, string(msg.Value))
  27. // TODO 增加消费到的消息处理逻辑
  28. } else if !err.(kafka.Error).IsTimeout() {
  29. // 没超时,但是报错了
  30. // The client will automatically try to recover from all errors.
  31. // Timeout is not considered an error because it is raised by
  32. // ReadMessage in absence of messages.
  33. fmt.Printf("Consumer error: %v (%v)\n", err, msg)
  34. }
  35. }
  36. }

其中kafka消费配置使用的map参数可以在https://github.com/confluentinc/librdkafka/tree/master/CONFIGURATION.md中找到相关的描述
经测试,是可以支持单个broker,多个topic对数据进行消费,但是考虑到此库使用了c库,故在跨平台方面可能对程序的移植存在兼容性问题,故弃用。
阿里云的相关网站上也有kafka消费的一些示例,可以参考,链接如下:https://help.aliyun.com/zh/sls/user-guide/use-confluent-kafka-go-to-achieve-kafka-consumption
3. sarama
比较冗余和复杂,还有考虑到当时的时间问题,没有进行具体的测试


本文转载自: https://blog.csdn.net/CSDN_LJJ0303/article/details/135250139
版权归原作者 csdn_LJJ0303 所有, 如有侵权,请联系我们删除。

“Golang中常用的kafka库”的评论:

还没有评论