当前位置: 首页 > news >正文

国产第一!Qwen3.7-Max全端上线,好易智算同步首发,企业级Agent底座再添新选择

万亿参数、百万Token上下文、35小时自主执行零中断,国产旗舰再进一步

一、千问旗舰再迭代,Qwen3.7-Max正式亮相

2026年5月20日,阿里巴巴在年度云峰会上正式发布新一代千问旗舰模型Qwen3.7-Max,并于5月22日全端上线——千问App(6.9.7及以上版本)、PC客户端、网页端及阿里云百炼API同步开放。

这是千问旗舰模型近三个月内的第三次重大迭代,从3.5到3.6再到3.7,大模型研发节奏明显加速。在第三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini最强模型同处第一梯队,登顶国产模型榜首

二、核心升级:从“通用问答”到“智能体执行引擎”

Qwen3.7-Max并非单纯的对话模型,而是专为智能体场景深度优化的全能基座,在多个核心维度实现突破:

1. 万亿参数MoE架构,百万Token超长上下文

模型采用优化版MoE混合专家架构,总参数超过万亿级别,预训练数据量达36万亿Tokens,覆盖119种语言。原生支持百万级Token上下文窗口,能够一次性载入整本专业书籍、大型代码仓库、超长项目文档或海量会议纪要,无需拆分分段。输出长度最大支持64k Tokens,满足长文本生成需求。

2. 35小时自主执行,无人干预稳定运行

在一个模型从未接触过的全新硬件平台——平头哥真武M890芯片上,Qwen3.7-Max在没有任何性能分析数据、硬件文档或示例内核的情况下,从空白空间出发,连续自主工作35小时,独立进行了432次内核评估和1158次工具调用。最终优化后的推理内核较官方参考实现取得10倍加速,且在第25至35小时仍能持续产出有效优化。

3. 编程与通用智能体能力双登顶

  • 编程智能体:Terminal Bench 2.0-Terminus得分69.7,超越DeepSeek-v4-pro-Max和Claude-Opus4.6;多语言编程SWE-Multilingual以78.3分刷新纪录。

  • 通用智能体:在MCP-Atlas(76.4)、MCP-Mark、Skillbench等真实场景测试中,表现均优于GLM5.1、Kimi-K2.6等国产竞品,刷新国产模型上限。

4. 办公自动化与推理能力同步升级

通过MCP集成和多智能体协作,在办公自动化基准SpreadSheetBench-v1中斩获87分,处于行业顶尖水平;推理层面,在GPQA Diamond、HLE、HMMT 2026 Feb等高难度测评中,超越Claude-Opus4.6及所有国产模型;指令遵循IFBench评测得分79.1分,创下新高。

三、API定价与订阅方案

5月22日,Qwen3.7-Max同步登陆阿里云百炼平台,API调用价格为输入12元/百万Tokens、输出36元/百万Tokens。阿里云百炼Token Plan订阅服务也已同步上线,订阅用户可直接调用。与采用缓存折扣后的定价相比,结合平台自身Token消耗管理机制,企业可获得更具成本竞争力的调用方案。

四、好易智算同步首发Qwen3.7-Max:企业级Agent部署再添新选择

作为专注为企业提供AI基础设施的平台,好易智算已在第一时间完成Qwen3.7-Max的API接入。

凭借好易智算模型中立的平台架构,企业无需更换现有智能体框架,通过好易智算Harness智能体平台即可一键调用Qwen3.7-Max的旗舰能力,同时继续管理DeepSeek、GLM、Kimi、GPT等多模型调用——真正实现“统一API调用、统一成本管理、统一权限管控”。

好易智算Harness平台内置可观测性仪表盘,支持精细化展示Token用量和费用,平台中的智能体可灵活调用Qwen3.7-Max,支持配置知识库、技能Skill和MCP工具,为企业的Agent化升级提供工程化底座。

当行业竞争已从模型跑分进入Agent执行能力比拼的下半场,选择一套能够承载多模型、管控成本、保障稳定执行的Harness基础设施,已是企业不掉队的必要前提

访问好易智算官网,即刻体验Qwen3.7-Max旗舰能力,还有惊喜折扣>>立即体验

http://www.gsyq.cn/news/1409455.html

相关文章:

  • 阿姆智创IBOX-6076R工控一体机,机器视觉设备控制升级
  • Windows命令行利器:Hexdump十六进制文件解析实战
  • 为什么92.3%的人用错ChatGPT设目标?——斯坦福HAI实验室联合实证:3类错误输入导致目标漂移率提升4.8倍
  • AI应用可观测性工程2026:LLM调用追踪评估与监控全栈实践
  • 睡眠呼吸暂停监测:轻量化CNN与ECG信号分析
  • 跨越十个数量级的能效革命:从GPU到忆阻器,神经计算硬件的能耗全景与路径选择
  • 别再死记硬背梯度下降公式了!用Python动画可视化梯度流,理解优化算法的本质
  • 基于 HarmonyOS 6.0 的日程备忘应用:待办事项板与提醒卡片详解
  • 美股盘前盘后数据接入前的 4 项核验:交易窗口、返回样本、timestamp 与失败分支
  • Cortex-M3开发者文档版本更新解析与应对策略
  • 从顺序表到ArrayList,吃透动态数组的底层逻辑
  • 工业视觉辅助系统:实时检测与装配质量优化
  • 作为Oracle DBA,如何快速处理HANG类故障?
  • 【企业级ChatGPT客服话术安全白皮书】:工信部备案要求下的12类高危话术自动拦截规则(含正则+语义双引擎配置)
  • 研究生读文献亲测好用的工具
  • LeetCode 22. 括号生成(JS里的回溯算法)
  • GS算法与Fienup算法详解:为什么你的相位恢复总不收敛?可能是反馈机制没搞懂
  • 别再纠结MBR还是GPT了!SATA/NVMe固态硬盘装Win10,保姆级分区与引导设置全流程
  • 2026年智慧工地系统推荐榜单:工地人脸识别/塔吊防碰撞/AI视频巡检/扬尘监测/实名制考勤/车辆道闸/升降机监控/劳务管理平台全解析 - 品牌企业推荐师(官方)
  • 基于三轴加速度计的塑料水管泄漏振动检测技术全解析
  • MIT-BIH ECG信号预处理避坑指南:中值滤波窗大小设置与边界失真处理实战
  • Text to SQL准确率为什么上不去?三个核心难点
  • 4J36板材怎么选?国内主流厂家盘点,助您快速匹配优质供应商 - 品牌2025
  • 强化学习实战:用DQN家族玩转Atari游戏,从环境搭建到模型调优的全流程记录
  • 星露谷物语农场规划器:免费在线设计你的完美农场
  • 量子溢出检测电路在生物医学图像处理中的应用与Qiskit实现
  • 收藏!AI岗位暴涨12倍,小白程序员如何抓住这波红利,实现薪资跃迁?
  • 项目介绍 MATLAB实现基于BMA-XGB 贝叶斯模型平均(BMA)结合极端梯度提升(XGB)进行股票价格预测(含模型描述及部分示例代码)专栏近期有大量优惠 还请多多点一下关注 加油 谢谢 你的鼓励
  • 2026年现阶段,如何选择浴室柜定制厂家?深度解析与品牌聚焦 - 2026年企业资讯
  • 告别Flask和Django!用Streamlit+Plotly,5分钟把你的Python数据分析结果变成网页应用