当前位置：首页 > news >正文

国产第一！Qwen3.7-Max全端上线，好易智算同步首发，企业级Agent底座再添新选择

news 2026/6/10 16:50:56

万亿参数、百万Token上下文、35小时自主执行零中断，国产旗舰再进一步

一、千问旗舰再迭代，Qwen3.7-Max正式亮相

2026年5月20日，阿里巴巴在年度云峰会上正式发布新一代千问旗舰模型Qwen3.7-Max，并于5月22日全端上线——千问App（6.9.7及以上版本）、PC客户端、网页端及阿里云百炼API同步开放。

这是千问旗舰模型近三个月内的第三次重大迭代，从3.5到3.6再到3.7，大模型研发节奏明显加速。在第三方机构Arena全球大模型盲测总榜中，Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1，与GPT、Claude、Gemini最强模型同处第一梯队，登顶国产模型榜首。

二、核心升级：从“通用问答”到“智能体执行引擎”

Qwen3.7-Max并非单纯的对话模型，而是专为智能体场景深度优化的全能基座，在多个核心维度实现突破：

1. 万亿参数MoE架构，百万Token超长上下文

模型采用优化版MoE混合专家架构，总参数超过万亿级别，预训练数据量达36万亿Tokens，覆盖119种语言。原生支持百万级Token上下文窗口，能够一次性载入整本专业书籍、大型代码仓库、超长项目文档或海量会议纪要，无需拆分分段。输出长度最大支持64k Tokens，满足长文本生成需求。

2. 35小时自主执行，无人干预稳定运行

在一个模型从未接触过的全新硬件平台——平头哥真武M890芯片上，Qwen3.7-Max在没有任何性能分析数据、硬件文档或示例内核的情况下，从空白空间出发，连续自主工作35小时，独立进行了432次内核评估和1158次工具调用。最终优化后的推理内核较官方参考实现取得10倍加速，且在第25至35小时仍能持续产出有效优化。

3. 编程与通用智能体能力双登顶

编程智能体：Terminal Bench 2.0-Terminus得分69.7，超越DeepSeek-v4-pro-Max和Claude-Opus4.6；多语言编程SWE-Multilingual以78.3分刷新纪录。
通用智能体：在MCP-Atlas（76.4）、MCP-Mark、Skillbench等真实场景测试中，表现均优于GLM5.1、Kimi-K2.6等国产竞品，刷新国产模型上限。

4. 办公自动化与推理能力同步升级

通过MCP集成和多智能体协作，在办公自动化基准SpreadSheetBench-v1中斩获87分，处于行业顶尖水平；推理层面，在GPQA Diamond、HLE、HMMT 2026 Feb等高难度测评中，超越Claude-Opus4.6及所有国产模型；指令遵循IFBench评测得分79.1分，创下新高。

三、API定价与订阅方案

5月22日，Qwen3.7-Max同步登陆阿里云百炼平台，API调用价格为输入12元/百万Tokens、输出36元/百万Tokens。阿里云百炼Token Plan订阅服务也已同步上线，订阅用户可直接调用。与采用缓存折扣后的定价相比，结合平台自身Token消耗管理机制，企业可获得更具成本竞争力的调用方案。