当前位置: 首页 > news >正文

Day-0支持|摩尔线程率先完成MiniMax M3大模型适配

6月12日,MiniMax新一代原生多模态旗舰模型 M3正式开源。同日,摩尔线程旗舰级AI训推一体智算卡MTT S5000已完成对该模型的Day-0极速适配。这是国产大模型与国产算力芯片完成适配的又一例证,也彰显了摩尔线程凭借原生FP8算力底座与高效MUSA软件生态,对前沿大模型需求的即时响应与稳定支撑能力。

▼ MiniMax M3开源地址:

https://huggingface.co/MiniMaxAI/MiniMax-M3

▼ 开发者可下载镜像进行开箱体验:

registry.mthreads.com/mcconline/inference/vllm:v0.20.0-ph1-4.3.5-torch2.9-20260605-mtcc51

MiniMax M3是目前国内唯一同时具备前沿Coding & Agentic能力、超长下文与原生多模态的开源大模型,也是第一个将完整frontier能力带入开放世界的模型。该模型基于自研MSA(MiniMax Sparse Attention)架构,可将上下文窗口扩展至1M级别,并在BrowseComp、SWE-Bench Pro等国际权威评测中达到前沿水平。作为原生多模态模型,M3重构了整个数据管线,从第零步开始多模态训练,使文本和视觉语义空间高度对齐。

MiniMax M3的Coding & Agentic能力在软件工程、终端执行、工具调用等多维度权威评测中达到前沿水平。

针对MiniMax M3的核心技术特性,MTT S5000从硬件算力、软件栈到开源框架进行了全链路精准匹配与深度优化:

▼ 支撑超长上下文:高密度算力与大显存提供坚实支撑。

MSA架构带来的超长上下文窗口,对推理阶段的KV Cache存储和访存带宽提出了极高要求。MTT S5000凭借硬件级原生FP8加速,单卡AI算力(稠密)高达1000 TFLOPS;同时配备80GB大容量显存与1.6TB/s的超高带宽,为百万token级长序列提供充足的缓存空间与卓越的数据吞吐能力。此外,依托MUSA C++与Triton-MUSA等抽象层,M3的新算子结构可实现快速迁移,确保摩尔线程平台能够快速完成架构适配。

▼ 赋能前沿Coding与Agentic能力:实现低延迟、高吞吐的推理优化。

面向M3重点强化的编程与智能体场景,摩尔线程基于此前对DeepSeek-V4、MiniMax M2.7、GLM-5.1等多款国产旗舰模型的Day-0适配经验,已形成一套高效、系统化的复杂推理任务优化方法论。本次适配通过原生算子定制,在保障模型精度无损的前提下,显著提升推理吞吐、降低响应延迟;同时,摩尔线程完成了vLLM与SGLang两大主流推理框架的同步拉起,以MUSA开放架构拥抱开源生态,为开发者提供灵活多样的部署选择。

▼ 推动原生多模态推理:覆盖全精度与贯通全场景。

M3作为从Step 0即进行多模态混合训练的模型更适配当下Agentic AI多元场景的需求,同时这也要求算力底座具备多元化算力。MTT S5000智算卡覆盖从FP8至FP64全计算精度,可无缝适配从模型研发到商业化落地的完整链路,助力国产旗舰大模型快速完成生态普及。

随着MiniMax M3在MTT S5000上完成适配,开发者现在即可基于MUSA软件栈与vLLM/SGLang双框架完成部署,并持续获得算子级性能优化。依托MUSA架构对主流AI生态的深度兼容与持续演进,摩尔线程已具备覆盖前沿模型“适配—部署—优化”的完整工程能力,帮助开发者以更快响应、更稳运行、更低迁移成本接入最新模型能力,加速大模型创新落地与规模化应用。

http://www.gsyq.cn/news/1519773.html

相关文章:

  • BarrageGrab:15个平台实时弹幕抓取的终极WebSocket直连方案
  • Windows平台企业级消息防撤回技术深度解析与完全实施手册
  • Jabel vs 其他方案:为什么选择Jabel而非升级Java版本的终极指南
  • [智能体-391]:智能体(Agent)市场、MCP 工具市场
  • 终极免费暗黑破坏神2存档编辑器:可视化修改完全指南
  • ChatGPT公式粘贴Word乱码?AI导出鸭技巧,三步解决,保留原始格式
  • PPT模板平台:六类工具的功能与适用场景说明 - 品牌测评鉴赏家
  • 降AIGC黑科技!AI率92%暴降至5%!实测10款降AIGC网站!免费降AIGC额度薅到爽!
  • ATT推出iPad专属“无限日通“蜂窝套餐,每天仅需3美元
  • 3步免费解锁Grammarly高级版:自动化Cookie获取工具实战指南
  • Mockoon完整指南:5分钟掌握本地API模拟的核心技巧
  • 构建可扩展的后端系统:负载均衡与水平扩展策略
  • 如何用TV Bro电视浏览器让客厅电视变身智能上网中心:新手的终极操作指南
  • gh_mirrors/ph/php-mvc安全实践:防止CSRF、XSS与SQL注入的终极指南
  • Snipe-IT开源IT资产管理数字化转型实战手册:从资产混乱到精细管控的全面解决方案
  • codex笔记、thinkai中转站
  • OpenCore Legacy Patcher终极指南:让旧Mac免费安装最新macOS的完整解决方案
  • 信奥名校关于初中信奥学生的培养进度与策略
  • 互联网大厂 Java 求职面试:技术栈与场景的深入探讨
  • 活动策划3年,我的真实工具体验:不吹不黑,纯干货分享 - 品牌测评鉴赏家
  • [智能体-392]:AI编程的等级:不同等级的核心特征、AI和开发者的角色、AI的产物、技术栈、主流的AI产品、示例。从代码补全->Vibe Coding->Spec Coding->
  • Python 高手编程系列三千三百七十七:链接
  • [智能体-393]:数字员工(办公)、数字专家、数字工程师(软件)详解,对应的技术栈与现有的平台工具
  • Python 高手编程系列三千三百八十:什么样的测试
  • 攻击量下降风险攀升:AI 赋能下定向钓鱼攻击演化与防御研究
  • 终极提速!LEDE路由器固件缓存加速与网络优化深度指南
  • Java毕业设计-基于 SpringBoot 的校园闲置物品交易平台设计与开发 轻量化闲置物品二手交易管理系统(源码+LW+部署文档+全bao+远程调试+代码讲解等)
  • 2026 世界杯移动端定向钓鱼攻击模式与防御技术研究
  • 8B/10B编码原理与实战:高速串行通信的时钟恢复与直流平衡
  • PyWxDump:微信数据解析技术从困境到突破的三大核心挑战与解决方案