背景
一句话说明需求:
- 公司需要监控kafka消息队列的消费情况,强调需查看当前Topic中的message的数量。
一句话说明解决:
- 像Kafka这样的Java进程可以先通过JMX Agent或者第三方Agent(kafka_exporter\KMINION等)获取监控数据,再通过Prometheus采集数据、通过Grafana模板展示数据即可。另外具体的message数量需要通过PromQL语句查询得到。
多说几句:
- kafka应用的具体指标和JVM虚拟机的指标都可以通过JMX监控得到。
- Zabbix也可以监控kafka,也是通过JMX实现。
- Prometheus对自定义监控项更友好,相关的Grafana模板更多。
- 建议同时使用JMX和kminion,同时使用两者的Grafana模板(具体性能损耗的评估稍后有时间我再详细说明,有时间折腾也可以只装一个)
- 三种方式获取的都是kafka监控指标,最终都通过grafana集成显示。
监控效果截图
参考链接
【Grafana模板库:搜索Kafka】
【阿里云官方文档:如何部署和配置Kafka JMX Agent】
实际操作
方式一:使用JMX监控
操作要点
- 下载jmx程序包。
- 修改kafka启动参数
- 重启kafka
- 访问JMX-Agent端口验证监控指标
- 5.修改配置文件,并重启Prometheus
- 访问Prometheus,验证target是否监控成功。
- 配置Grafana:导入模板、配置数据源、查看监控数据。
1.下载jmx程序包
使用阿里云提供的jmx-agent包,比较稳定靠谱,就不故意选择最新版本了。
下载链接:【阿里云JMX-Agent下载】
下载后需传输到kafka所在服务器上,如:
[sysma@kafka-0001 jmx_agent]$ ls
kafka-jmx_prometheus_javaagent-1.18.1.jar
[sysma@kafka-0001 jmx_agent]$ pwd
/ilw/jmx_agent
[sysma@kafka-0001 jmx_agent]$
2.修改kafka启动参数。
修改kafka启动脚本的配置参数,可参考阿里云【阿里云官方文档:如何部署和配置Kafka JMX Agent】
也可参考我的示例文件,对比阿里云文档截图,我的示例文件更为简单直观:
在
EXTRA_ARGS=${EXTRA_ARGS-'-name kafkaServer -loggc '}
这一行之后,新增JMX-agent内容
-javaagent:/ilw/jmx_agent/kafka-jmx_prometheus_javaagent-1.18.1.jar=5506
,目的是下次启动kafka进程的同时,运行一个jmx-agent并指定agent的端口。
完整示例文件如下:
[sysma@kafka-0001 bin]$ pwd
/ilw/kafka_2.12-3.5.0/bin
[sysma@kafka-0001 bin]$ cat kafka-server-start.sh
#!/bin/bash# Licensed to the Apache Software Foundation (ASF) under one or more# contributor license agreements. See the NOTICE file distributed with# this work for additional information regarding copyright ownership.# The ASF licenses this file to You under the Apache License, Version 2.0# (the "License"); you may not use this file except in compliance with# the License. You may obtain a copy of the License at## http://www.apache.org/licenses/LICENSE-2.0## Unless required by applicable law or agreed to in writing, software# distributed under the License is distributed on an "AS IS" BASIS,# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.# See the License for the specific language governing permissions and# limitations under the License.if[$#-lt1];thenecho"USAGE: $0 [-daemon] server.properties [--override property=value]*"exit1fibase_dir=$(dirname $0)if["x$KAFKA_LOG4J_OPTS"="x"];thenexportKAFKA_LOG4J_OPTS="-Dlog4j.configuration=file:$base_dir/../config/log4j.properties"fiif["x$KAFKA_HEAP_OPTS"="x"];thenexportKAFKA_HEAP_OPTS="-Xmx1G -Xms1G"fi##修改前,默认配置如下#EXTRA_ARGS=${EXTRA_ARGS-'-name kafkaServer -loggc'}#修改后,在下一行新增jmx-agent的路径位置,指定jmx暴露端口。EXTRA_ARGS=${EXTRA_ARGS-'-name kafkaServer -loggc -javaagent:/ilw/jmx_agent/kafka-jmx_prometheus_javaagent-1.18.1.jar=5506'}COMMAND=$1case$COMMANDin
-daemon)EXTRA_ARGS="-daemon "$EXTRA_ARGSshift;;
*);;esacexec$base_dir/kafka-run-class.sh $EXTRA_ARGS kafka.Kafka "$@"[sysma@kafka-0001 bin]$
3.重启kafka
启动和停止kafka的脚本如下,也可直接复制命令执行:
[sysma@kafka-0001 ilw]$ cat 03_startKFK-3.5.0.sh
sudo /ilw/kafka_2.12-3.5.0/bin/kafka-server-start.sh /ilw/kafka_2.12-3.5.0/config/server.properties &[sysma@kafka-0001 ilw]$ cat 04_stopKFK-3.5.0.sh
sudo /ilw/kafka_2.12-3.5.0/bin/kafka-server-stop.sh /ilw/kafka_2.12-3.5.0/config/server.properties
4.访问JMX-Agent端口验证监控指标
配置文件中指定了jmx-agent端口为5506。在开放防火墙策略、保证kafka重启成功后,可通过web访问查看相关的监控指标,如下图:
5.修改配置文件,并重启Prometheus
修改配置文件并重启Prometheus
sudovim prometheus.yml
curl-X POST http://127.0.0.1:9091/-/reload
使用curl命令重启prometheus的前提是:首次启动Prometheus时,就启用
web.enable-lifecycle
功能,具体启动命令如下:
#使用sudo权限,后台执行Prometheus启动命令,并启用lifecycle功能,指定监听端口为9091sudonohup ./prometheus --web.enable-lifecycle --web.listen-address=:9091 &
修改内容如下:
6.访问Prometheus,验证target是否监控成功。
7.配置Grafana:导入模板、配置数据源、查看监控数据。
下载dashboard模板,配合jmx-agent使用时,建议使用11962号模板。【Grafana官方:11962号模板下载地址】
导入模板,上传json文件。
查看仪表板,成功取得监控数据。
注意:
- 需要开通kafka、Prometheus、Grafana之间对具体端口的防火墙策略。
- 没啥注意的了,你们先操作吧,方式二、方式三我后面再补充。
方式二:使用kafka_exporter监控
- 下载kafka_exporter程序包。
- 修改kafka_exporter配置文件。
- 启动kafka_exporter。
- 重启prometheus。
- 导入grafana模板。
方式三:使用Kminion监控
- 下载Kminion程序包。
- 修改kminion配置文件。
- 创建kminion配置文件的环境变量。
- 启动kminion。
- 重启prometheus。
- 导入grafana模板。
注意:
- 防火墙策略。
- 端口占用情况。
相关截图
结束
版权归原作者 高达可以过山车不行 所有, 如有侵权,请联系我们删除。