当前位置: 首页 > news >正文

美团1.6万亿模型用国产芯片跑出来的,性能还超了GPT-5.5和Claude

AI圈又炸了一个重磅消息。

美团正式发布LongCat-2.0——1.6万亿参数,MoE架构,原生支持1M超长上下文,预训练数据超过30T tokens。

但最炸的不是参数,是训练方式。

LongCat-2.0是业界第一个在五万张国产算力卡上完成从预训练到推理全流程的万亿参数大模型。

全程跑在国产芯片上,从训练到推理,没有用一块英伟达A100或H100。

这意味着什么?

国产算力第一次真正扛住了万亿参数模型的训练压力。

五万张国产卡,跑通了万亿模型

LongCat团队从2023年开始啃国产算力这块硬骨头。

从千卡起步,逐步攻克算子适配、通信优化、分布式稳定性。三年的时间,终于把五万张国产卡集群跑通了。

几个关键突破:

  • 通过HCCL异常处理、弹性扩缩卡和自动故障恢复,月均日故障率降低70%以上
  • 通过流水线调度、显存优化和算子级控核,训练MFU提升1.5倍
  • 稳态日吞吐超过1T tokens/day
  • 全程未出现不可逆的loss尖刺与回滚

国产芯片虽然单卡性能不如英伟达最顶尖的产品,但计算正确性和精度已经足够满足需求,可以支撑万亿参数模型的稳定训练

这不是实验室里的单次验证,是五万卡集群上的规模化生产。

性能:不只是“能用”,是“能打”

参数大不等于好用。但LongCat-2.0的性能数据确实能打。

SWE-bench Pro(编程基准,考察深层工程能力)上:

  • LongCat-2.0:59.5分
  • GPT-5.5:58.6分
  • Claude Opus 4.6:57.3分
  • Gemini 3.1 Pro:54.2分

超过了GPT-5.5和Claude Opus 4.6。

SWE-bench Multilingual上得分77.3,与Claude Opus 4.6的77.8几乎持平。

Terminal-Bench 2.1上得分70.8,体现了在真实运维与开发终端任务中的稳定执行与纠错能力。

架构层面也有看点:

  • LSA稀疏注意力机制:处理长文本时计算量从平方级降至线性级
  • 零计算专家机制:简单Token不消耗算力,复杂Token自动获得更多计算资源
  • MOPD架构:融合Agent、Reasoning、Interaction三组专家能力

全球开发者用脚投票

LongCat-2.0预览版此前以匿名方式接入了全球最大的大模型API路由平台OpenRouter。

截至6月底,总调用量已跻身全球前三

在Hermes、Claude Code、OpenClaw等Agent场景下,月调用量分列全球第一、第二和第三位。

全球开发者用实际调用行为给出了判断——LongCat-2.0已经进入“值得在生产环境使用”的区间。

社区反馈显示,在工具调用、复杂指令执行等Agent核心能力方面,LongCat-2.0-Preview接近Claude Opus 4.6。

最关键的一点:即将开源

美团宣布将于近期在多平台同步开源Infra框架、推理引擎、模型参数等核心技术。

这意味着开发者可以:

  • 研究万亿参数模型的训练框架
  • 在自己的场景中部署和微调
  • 基于国产算力构建自己的应用

从GLM-5.2到豆包2.1到LongCat-2.0,国产模型正在用三条不同的路径——开源、闭源API、国产算力全栈——同时证明一件事:

国产AI已经不只是“能用”了,是“能打”了。

💬 你会试LongCat-2.0吗?国产算力+万亿模型,你觉得能追上Claude吗?欢迎在评论区聊聊你的看法。

(本文基于美团LongCat-2.0发布会公开信息撰写。勇哥AI实验室,关注AI怎么用。)

http://www.gsyq.cn/news/1612632.html

相关文章:

  • SQL注入手工检测全流程:从原理到实战的深度解析
  • AI Agent平台架构设计:从核心原理到高可用实现与面试指南
  • 告别点灯!用ESP8266+Arduino IDE做个能远程控制的智能开关(附完整代码)
  • 告别Transformer卡顿?手把手带你用Vision Mamba跑通ImageNet分类(附代码)
  • 安达发|aps自动排单:为纺织行业数字化生产注入“增效魔法”
  • 从零实现Transformer:自注意力机制、多头注意力与位置编码详解
  • Node.js性能测试终极指南:Artillery与k6深度对比与实践
  • 告别路由器!用一根网线让ZYNQ7020开发板共享笔记本WiFi上网(Win10保姆级教程)
  • 【VMware NAT端口转发终极指南】:20年虚拟化专家亲授5步精准配置法,99%用户忽略的3个致命陷阱!
  • 保姆级教程:用ESP8266-01和AT指令,5分钟搞定阿里云物联网平台设备连接与数据收发
  • 告别Transformer卡顿?手把手带你用Vision Mamba跑通高分辨率图像分类(附代码)
  • Next.js项目Cypress自动化测试实战:从配置到CI/CD集成
  • wecomapi开发企业微信客户跟进记录如何与消息、标签和工单关联
  • 别再手动建模了!用Python脚本批量生成FreeCAD零件(附随机参数化代码)
  • 在树莓派4B上部署MobileNet-SSD:用OpenCV和Python实现实时物体检测(附完整代码)
  • OVF导出卡在“正在打包”?紧急排查清单来了,10分钟定位磁盘校验、SSL证书、权限三重故障源
  • 用状态机搞定蓝桥杯嵌入式电梯题:STM32G431实战避坑指南
  • 【VMware虚拟网络架构实战指南】:3步搞定多台虚拟机跨网段通信,99%工程师都忽略的5个关键配置
  • Beehive配置加密实战:Spring Boot敏感信息保护与密钥管理
  • 苏州GEO优化:企业内容正在进入“AI可理解”的新阶段
  • 别再手动建模了!用Python脚本批量生成FreeCAD零件,效率提升10倍
  • mavonEditor代码块功能深度探索:从基础语法到高级定制的完整指南
  • 影响游戏开发报价的6大核心真相
  • YOLO与3D点云融合:从原理到实战的3D目标检测指南
  • Ubuntu部署svn1.14.3及权限控制
  • E-Hentai下载器终极指南:三步完成画廊图片批量打包下载
  • 数存科技 × 银河麒麟 V11|全栈适配・全域安全
  • 3分钟掌握AutoTask:安卓自动化神器终极指南
  • Outfit字体:现代品牌视觉系统的几何美学革命
  • Python测试框架终极对决:unittest与pytest深度对比与选型指南