当前位置：首页 > news >正文

Kafka踩过的那些坑:分区副本、ISR抖动、消费位移,这些细节决定系统稳不稳!

news 2026/5/26 19:55:15

承渊政道个人主页❄️个人专栏:《C语言基础语法知识》《数据结构与算法》《C知识内容》《Linux系统知识》《算法刷题指南》《测评文章活动推广》《大模型语言路线学习》《MySQL数据库学习》✨逆境不吐心中苦,顺境不忘来时路!✨ 博主简介:Kafka在实时数据管道和事件驱动架构里是绕不开的选择,高吞吐、低延迟、持久化这几样同时做到,靠的是它内部一套完整的分区副本和ISR机制.但这套机制什么时候会出问题、出问题之后怎么判断和处理,不是看几个配置项就能上手的.用Kafka的过程里最容易踩的坑有几个:消息丢失不知道卡在哪一环、重复消费排查半天发现是消费者提交位移的逻辑有问题、分区副本分配不均导致集群负载倾斜、更严重的是ISR频繁抖动引发集群雪崩.这些问题表面上看起来是配置问题,实际上大多数根因在于对Kafka底层机制理解不够深——不知道什么时候该用acksall、不知道replica.lag.max.messages设多大算合理、不知道Controller选举的逻辑就很难做针对性的调优.这篇不走安装教程的老路,直接从生产实践经验出发,把分区副本机制、ISR、Controller选举、生产者幂等性、消费者位移管理这些核心模块的原理和易错点讲清楚,配上实际踩过的案例做说明.废话不多说,下面跟着小编的节奏一起去疯狂的学习吧!目录1.安装前准备1.1 操作系统要求1.2 java环境要求1.3 安装JDK2.安装 Kafka2.1 下载 Kafka2.2 创建数据日志目录2.3 配置Kafka配置文件2.4 配置zookeeper配置文件3.启动与停止Kafka3.1开启ZooKeeper3.2启动Kafka3.3停止zookeeper3.4停止kafkfa4.创建生产者topic和消费者topic简单示例5.安装cpolar内网穿透工具6.配置公网地址7.保留固定TCP公网地址8.总结1.安装前准备1.1 操作系统要求Kafka可以在多种 [Linux 发行版](https://so.csdn.net/so/search?qLinux 发行版spm1001.2101.3001.7020)上运行,本文以CentOS 7为例,其他发行版步骤类似,只需调整包管理命令.1.2 java环境要求Kafka基于Java开发,需安装JDK 8 或以上版本java-version1.3 安装JDK下载 JDKOracle 官网或 OpenJDK 官网下载 Linux 版本示例OpenJDK 8wgethttps://download.java.net/openjdk/jdk8u41/ri/openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz解压安装包mkdir-p/usr/local/javatar-zxvfopenjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz-C/usr/local/java配置环境变量在 /etc/profile 末尾追加exportJAVA_HOME/usr/local/java/jdk1.8.0_41exportPATH$PATH:$JAVA_HOME/bin使配置生效source/etc/profile验证安装java-version2.安装 Kafka2.1 下载 Kafka官网下载示例版本3.6.2linux系统可以直接命令一键安装wgethttps://downloads.apache.org/kafka/3.9.1/kafka_2.13-3.9.1.tgztar-xzfkafka_2.13-3.9.1.tgzmvkafka_2.13-3.9.1 kafka2.2 创建数据日志目录在kafka解压目录同一路径下创建一个kafka_data用于装kafka和zookeeper的log和数据等mkdir-p/opt/kafka_datamkdir-p/opt/kafka_data/zookeepermkdir-p/opt/kafka_data/logmkdir-p/opt/kafka_data/log/kafkamkdir-p/opt/kafka_data/log/zookeeper2.3 配置Kafka配置文件编辑这个文件broker.id0port9092host.nameiplog.dirs/opt/kafka_data/log/kafkazookeeper.connectlocalhost:21812.4 配置zookeeper配置文件dataDir/opt/kafka_data/zookeeperdataLogDir/opt/kafka_data/log/zookeeperclientPort2181maxClientCnxns100tickTimes2000initLimit10syncLimit53.启动与停止Kafka3.1开启ZooKeeper开启ZooKeeper./zookeeper-server-start.sh../config/zookeeper.properties3.2启动Kafka./kafka-server-start.sh../config/server.properties验证是否启动成功jps输出应包含QuorumPeerMain Kafka3.3停止zookeeper./zookeeper-server-stop.sh../config/zookeeper.properties3.4停止kafkfa./kafka-server-stop.sh../config/server.properties4.创建生产者topic和消费者topic简单示例在一个终端执行创建生产者:(推消息到shan)cd/opt/bin/#进入kafka目录./kafka-console-producer.sh --broker-list192.168.42.140:9092--topicwd_test#wd_test你要建立的topic名在一个终端执行创建消费者:(从shan上消费消息)cd/opt/bin/#进入kafka目录./kafka-console-producer.sh --broker-list192.168.42.140:9092--topicwd_test#消费shan中topic消息查看效果:一个终端不断输入推送的消息,另一个终端则消费这个消息查看当前主题./kafka-topics.sh--zookeeperlocalhost:2181--list你正在家里远程办公,突然接到任务需要验证一个新业务模块的消息生产与消费逻辑.但Kafka集群部署在公司内网测试环境,没有公网IP,防火墙也不开放9099/9092端口——你既无法连接Broker创建Topic,也无法从本地启动生产者或消费者进行调试.传统的做法是提交代码到CI/CD触发部署慢求运维临时开防火墙麻烦或干脆去公司不现实有没有更敏捷的方式有!借助内网穿透工具,我们可以将内网Kafka的9092端口安全暴露到公网.只需一条隧道命令,你的本地开发机就能像在内网一样通过 kafka-topics.sh 创建测试 Topic用 kafka-console-producer.sh 发送消息用 kafka-console-consumer.sh 实时消费验证整个过程无需改动 Kafka 配置、无需网络权限审批,5 分钟打通内外网,让开发调试回归高效.跟我一起来操作吧~5.安装cpolar内网穿透工具cpolar 可以将你本地电脑中的服务(如 SSH、Web、数据库)映射到公网.即使你在家里或外出时,也可以通过公网地址连接回本地运行的开发环境.❤️以下是安装cpolar步骤使用一键脚本安装命令sudocurlhttps://get.cpolar.sh|sh安装完成后,执行下方命令查看cpolar服务状态:(如图所示即为正常启动)sudosystemctl status cpolarCpolar安装和成功启动服务后,在浏览器上输入虚拟机主机IP加9200端口即:【ip:9200】访问Cpolar管理界面,使用Cpolar官网注册的账号登录,登录后即可看到cpolar web 配置界面,接下来在web 界面配置即可打开浏览器访问本地9200端口,使用cpolar账户密码登录即可,登录后即可对隧道进行管理.6.配置公网地址通过配置,你可以在本地 WSL 或 Linux 系统上运行 SSH 服务,并通过 Cpolar 将其映射到公网,从而实现从任意设备远程连接开发环境的目的.隧道名称可自定义,本例使用了:zookeeper,注意不要与已有的隧道名称重复协议tcp本地地址2181端口类型随机临时TCP端口地区China Top创建成功后打开左侧在线隧道列表,可以看到刚刚通过创建隧道生成了公网地址,接下来就可以在其他电脑或者移动端设备(异地)上,使用任意一个地址在终端中访问即可.tcp 表示使用的协议类型2.tcp.cpolar.top是 Cpolar 提供的域名13917是随机分配的公网端口号通过Cpolar提供的公网地址和端口,Kafka就能从本地启动生产者或消费者进行调试啦生产./kafka-console-producer.sh --broker-list2.tcp.cpolar.top:13917--topicshan消费./kafka-console-consumer.sh --bootstrap-server2.tcp.cpolar.top:13917--topicshan7.保留固定TCP公网地址使用cpolar为其配置TCP地址,该地址为固定地址,不会随机变化.选择区域和描述有一个下拉菜单,当前选择的是China Top.右侧输入框,用于填写描述信息.保留按钮在右侧有一个橙色的保留按钮,点击该按钮可以保留所选的TCP地址.列表中显示了一条已保留的TCP地址记录.地区显示为China Top.地址显示为26.tcp.cpolar.top:13166.登录cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道Kafka,点击右侧的编辑.修改隧道信息,将保留成功的TCP端口配置到隧道中.端口类型选择固定TCP端口预留的TCP地址填写保留成功的TCP地址点击更新.创建完成后,打开在线隧道列表,此时可以看到随机的公网地址已经发生变化,地址名称也变成了保留和固定的TCP地址.最后就可以使用命令测试啦8.总结Kafka本身的架构设计是成熟的,但它对运维人员的要求比大多数中间件都要高——分区副本数量决定了集群的并行度和容灾能力,ISR抖动是集群稳定性的风向标,消费位移管理直接决定业务逻辑会不会出现重复处理或漏消息.上线之前有几个必查项分区副本数不能设为1、没有replica副本的分区在宕机时必然丢消息、 unclean.leader.election.enable建议设为false避免数据不一致.整体来说Kafka适合高吞吐量和事件流场景,如果业务本身消息量不大、或者主要是请求响应模式,用RabbitMQ或者直接RPC可能更简单.这套方案值不值得投入,取决于你对实时数据流处理需求的规模.真正的勇者不是流泪的人,而是含泪奔跑的人!敬请期待下一篇文章内容每日心灵鸡汤: 见天地,知敬畏!什么是见世面?就是见到世界不只一面.见天地,方懂敬畏与谦卑.当你走过很多很多地方,见过很多很多人,读过很多很多书,当你感受过世界的广阔、自然的伟大、历史的悠长,你就会慢慢放下内心的固执和自负,生命也会因此变得更加辽阔.见天地,有格局.以地为躯干,以天为魂魄,以山川河流为血脉,在锤炼中塑造自己,不以物喜不以己悲,才能拥有更强大的内核.从见自己到见天地,是不再困于眼前的一方天地,鼓足勇气不断攀登;是勇敢地走出去,闯出一片新的天地.尽兴地活过这一生,仰无愧于天,俯无愧于地,行无愧于人,如此,才算真正见过了天地.

查看全文

http://www.gsyq.cn/news/1395354.html