当前位置: 首页 > news >正文

云原生周刊:在 Kubernetes 上运行机器学习

云原生热点

KGateway v2.1:面向 AI 场景的高可用网关全新升级

KGateway 是一个面向云原生和 AI 场景的高性能网关,支持多租户、统一接入、智能路由与推理服务集成,兼容 Kubernetes Gateway API 标准。

在最新的 v2.1 版本中,KGateway 引入了 agentgateway 组件,增强了 AI 推理和多租户路由能力;全面支持 Gateway API v1.3.0 和 Inference Extension v1.0.0;新增全局策略挂载、加权路由、Pod 模板定制、请求头修改、会话亲和及自动扩缩容等功能。同时优化了监控与健康检查机制,并启用 Leader 选举以提升高可用性。本次更新还废弃旧版 Envoy AI Gateway 与 Inference Extension,为 v2.2 的架构升级做准备。

Cosign 3.0 发布:软件签名工具全面升级,安全与兼容性再提升

Cosign 是 Sigstore 项目下的开源命令行工具,主要用于对容器镜像、软件包等进行签名与验证,以增强软件供应链的安全性。

近日,Cosign v3.0 版本正式发布,Cosign 将若干过去需要通过可选标志才能使用的新功能(如捆绑格式、可信根管理、签名配置支持)设为默认开启,从而加强与 Sigstore 生态中主流部署(如 Homebrew、PyPI、Maven Central 等) 的兼容性。与此同时,Cosign 围绕简化 CLI 及移除旧功能进行了规划,为未来 v4.0 版本的重大改动做好铺垫。

技术实践

文章推荐

在 Kubernetes 上运行机器学习:信任而非技术是最大门槛

本文介绍了,在将机器学习工作负载迁移至 Kubernetes 环境时,真正最大的挑战往往不是技术复杂性本身,而是 信任问题——包括数据质量、模型行为可预测性、团队间协作以及基础设施是否可靠。作者指出,尽管 Kubernetes 提供了强大的调度、扩缩容和资源管理能力,但若数据科学团队、平台团队及运维团队之间缺乏信任支撑、模型生命周期管理松散、监控与反馈机制不完善,那么技术能力再强也难以落地。为此,文章建议优先构建治理和审计流程、搭建可观察模型行为的反馈机制、明确责任边界,从而为 AI 在 Kubernetes 上的可靠运行奠定信任基础。

Kubernetes 7 大常见陷阱及其规避技巧

在这篇文章中,作者从自己在生产环境中管理 Kubernetes 的经验出发,列举了七类常见的部署与运维陷阱——包括未设置资源 requests/limits、忽视 liveness/readiness 探针、单靠 kubectl logs 进行排错、开发与生产配置一模一样、遗留无用资源、缺乏日志/监控机制、以及环境隔离不足等——并针对每个陷阱提供了实践建议,如从小量资源开始、使用自动扩缩容、统一日志监控管道、为不同环境提供差异化配置等,以帮助运维工程师提升集群稳定性、可观察性与效率。

云与 DevOps 趋势:整合治理与智能化转型再加速

本文介绍了 InfoQ 近日发布的《Cloud & DevOps Trends Report 2025》,探讨了云计算与 DevOps 在智能化、平台化及治理领域的最新发展趋势。报告指出,AI 驱动的自动化与智能代理正逐步融入运维与交付流程,推动从“人驱动”向“协同智能”转变;平台工程持续升温,企业更加关注通过统一开发者平台(IDP)提升开发体验与交付效率;混合云与多云架构成为主流实践,以兼顾灵活性与成本控制。与此同时,FinOps 和可观察性 进入成熟期,组织从单纯关注工具选型转向构建端到端的治理与可持续运营体系。总体来看,2025 年的云与 DevOps 发展已从技术演进迈向体系化建设阶段,重点在于“整合、优化与赋能”,以支撑更高效、安全、可控的数字化交付体系。

开源项目推荐

Proton

Proton 是由 Timeplus 开发的一款高性能流处理与分析的 SQL 引擎,采用 C++ 实现并内嵌 ClickHouse 引擎,目标为替代 Apache Flink 与 ksqlDB。它支持从 Kafka、Redpanda、ClickHouse 等多种源头采集数据,提供多流 JOIN、增量物化视图、时间窗口、水印、CDC 等实时流计算功能,同时具备查询历史数据的能力。特点包括:单二进制部署、无 JVM/ZooKeeper 依赖、低延迟高吞吐。适用于流式 ETL、实时分析、监控告警、推荐系统等场景。

Fission

Fission 是一个开源、Kubernetes 原生的 Serverless 函数框架,聚焦“只关心代码”的开发体验:通过 Functions、Environments 与 Triggers 三大概念,把 HTTP、消息队列与定时任务等事件与函数解耦,支持多语言(如 Node.js、Python、Go 等),并提供自动伸缩与极低冷启动(官方称典型约 100ms)以便在 Kubernetes 上快速上线函数与应用。

Rook

Rook 是一个开源的云原生存储编排平台,专为 Ceph 分布式存储系统在 Kubernetes 中的原生化部署、管理、扩缩容而设计。它通过 Operator 模式自动化执行部署、配置、供给、监控、升级、灾难恢复等流程,使存储服务实现自管理、自修复、自扩展。Rook 支持文件、块、对象三种存储模式,适用于生产环境的大规模集群。

Traefik

Traefik 是一个现代开源反向代理和负载均衡器,专为微服务架构设计,能无缝集成诸如 Docker、Kubernetes、Consul、Etcd 等多种编排和服务发现平台,并能通过自动配置来动态处理路由。它支持 HTTP/1-3、TCP、UDP、WebSocket、gRPC 等协议,内置中间件、自动 TLS、服务发现与指标监控等功能,使得在容器化、动态伸缩的环境下运行服务更加简洁高效。

http://www.gsyq.cn/news/33054.html

相关文章:

  • 2025年上海电动阀门厂最新推荐榜,气动阀门/高压阀门/真空阀门/自控阀门/调节阀门/聚焦产品实力与特色服务竞争力深度剖析
  • 上海电磁阀厂家最新竞争力评估推荐:高温电磁阀/高压电磁阀/防爆电磁阀/真空电磁阀/聚焦服务能力与产品特色
  • 如何在iPhone和Android设备上恢复已删除的电话号码
  • 云栖实录:重构可观测 - 打造大模型驱动的云监控 2.0 与 AIOps 新范式
  • 2025年泳池水循环设备厂家权威推荐榜单:泳池水净化设备 /钢结构泳池/泳池恒温设备源头厂家精选
  • 2025年修护/二硫化硒去屑/香氛/控油蓬松/洗发水推荐榜:西安悦己容生物主打植萃护理,四大品牌以精准配方适配多元发质
  • 2025不锈钢剪板折弯推荐榜:上海一步一金属主打定制加工,四大企业以精准工艺赋能工业制造
  • 2025年碳氢肥料生产厂家权威推荐榜单:农产品用料/增产用肥/碳氢核肥邮沃源头厂家精选
  • 算法分析--分治--3.矩阵乘法
  • 2025年高温线缆优质厂家盘点:实力派企业守护工业核心需求,铁氟龙高温线,硅胶高温线,高压高温线厂家推荐
  • my.conf脚本备份
  • Alibaba Cloud Linux 3 +Docker 部署 ThinkPHP6 (宝塔环境)-问题篇 - 实践
  • 2025 年西宁靠谱旅行社,青海出国游报团旅行社,青甘环线旅行社最新推荐,聚焦资质、案例、售后的五家旅行社深度解读
  • 2025 年西北环线旅行社,青海口碑最好的旅行社,青甘大环线旅行社最新推荐,聚焦资质、案例、售后的五家旅行社深度解读
  • 读书笔记:Oracle分区黑科技:间隔引用分区与虚拟列分区详解
  • 2025年在线折光浓度仪厂家权威推荐榜单:在线折光计/在线近红外光谱仪/在线折光率仪源头厂家精选
  • 2025 年精密无缝钢管、合金无缝钢管、高压锅炉无缝钢管厂家最新推荐,精准检测与稳定性能深度解析
  • 第十一届中国大学生程序设计竞赛 女生专场
  • 2025 年 upe 超高分子量聚乙烯板,upe 板超高分子量聚乙烯板,uhmwpe 超高分子量聚乙烯板厂家最新推荐,产能、专利、环保三维数据透视
  • 2025 浸没式/全/液冷超充推荐榜:中碳创新领跑 “超充之城”,四大企业解锁低碳补能新范式
  • 深入解析:数字信号处理 第一章(离散时间信号与系统)【上】
  • 哈希优化策略
  • GNU C和ANSI C的一些差异
  • gcc系编译器、调试器的应用和c/c++编译原理
  • Day6综合案例1-体育新闻列表
  • 题解:AT_agc015_e [AGC015E] Mr.Aoki Incubator
  • SNP特征通道数是什么意思
  • sqlserver 添加或修改字段
  • 小程序语音通话让智能设备会“说话”
  • 易基因: NG (IF29):颠覆认知!深圳仙湖植物园刘阳团队WGBS及超级泛基因组分析揭示苔藓植物基因家族比维管植物更丰富|项目文章