当前位置: 首页 > news >正文

第3节:Kafka只是消息引擎吗?

Apache Kafka是消息引擎系统,也是一个分布式流处理平台

LinkedIn最开始有强烈的数据强实时处理方面的需求,其内部的诸多子系统要执行多种类型的数据处理与分析,主要包括业务系统和应用程序性能监控,以及用户行为数据处理等。

当时他们碰到的主要问题包括:

  • 数据正确性不足。因为数据的收集主要采用轮询(Polling)的方式,如何确定轮询的间隔时间就变成了一个高度经验化的事情。虽然可以采用一些类似于启发式算法(Heuristic)来帮助评估间隔时间值,但一旦指定不当,必然会造成较大的数据偏差。

  • 系统高度定制化,维护成本高。各个业务子系统都需要对接数据收集模块,引入了大量的定制开销和人工成本。

为了解决这些问题,LinkedIn工程师尝试过使用ActiveMQ来解决这些问题,但效果并不理想。显然需要有一个“大一统”的系统来取代现有的工作方式,而这个系统就是Kafka。

Kafka在设计之初就旨在提供三个方面的特性:

  • 提供一套API实现生产者和消费者;

  • 降低网络传输和磁盘存储开销;

  • 实现高伸缩性架构。

http://www.gsyq.cn/news/1577663.html

相关文章:

  • 文件上传漏洞实战:从原理到upload-labs靶场通关全解析
  • SIVR:基于序列内部方差的大语言模型幻觉检测方法详解与实践
  • Arch Linux下Apache SSL证书配置全指南
  • 【2026实战指南】ITIL 4.0与DevOps融合:企业IT治理效能提升实战
  • GTA-2基准测试:如何量化评估AI智能体的工具调用与工作流执行能力
  • 从零到一:如何用ComfyUI中文工作流合集快速掌握AI绘画创作
  • GitHub 一周热点 119 期:Agent Skills、苹果容器工具、NVIDIA 物理 AI 世界模型详解
  • Fedora LAMP 部署实战:SELinux 与 php-fpm 深度协同指南
  • Shipit在CentOS 7上实现Node.js生产部署自动化
  • 自动驾驶缩比实验:动力学等效与传感器映射的工程实践
  • 最新行业研究发现,量子计算迈入能力构建时代,先发企业正建立后来者难以逾越的优势
  • 恒玄bes2700YP tws蓝牙耳机项目
  • 多模型路由网关:低延迟不宕机的系统设计实践
  • 企业AI落地关键不在模型版本,而在交付链路
  • AI智能体安全评估实战:构建四层防御体系与提示工程模板设计
  • iptables规则查看与删除实战:-nvxL和-D的正确用法
  • Vue.js Devtools 三维调试法:组件-状态-事件联动定位
  • OCSP抓包排查实战:从网络协议到证书验证的深度诊断指南
  • TableSeq框架解析:基于序列生成的端到端表格识别技术实践
  • 模型降阶与滚动时域控制在复杂流体系统优化中的应用
  • 组件的本质:从UI片段到系统契约的演进
  • 3个简单步骤解锁AtlasOS GPU隐藏性能:让你的显卡发挥100%实力
  • 矢量干涉整形:单次曝光实现无散斑全息显示的技术原理与实践
  • Intel微码更新与VRS/L1D侧信道攻击防护实战指南
  • Ubuntu 12.04 LEMP搭建实战:nginx配置与mysql安装配置教程
  • 2026年省心的热水器生产厂家行业全景分析 - mypinpai
  • Ubuntu 18.04 搭建稳定 Python 编程环境实战指南
  • Ubuntu 18.04 安装 MongoDB:apt+systemctl+ufw 协同部署指南
  • 2026免费录音转文字工具保姆级教程:电脑手机都能用,无付费限制
  • VR-Reversal:零成本将3D视频转换为交互式2D体验的终极指南