当前位置: 首页 > news >正文

Qwen3.7-Max闯入Code Arena全球前四,成本低性能强挑战顶尖模型

【导语今日Code Arena最新榜单出炉阿里Qwen3.7-Max以1541分闯入全球前四超越GPT-5.5、Gemini 3.5 Flash等顶尖模型成为全球编程模型竞技场上唯一上榜的中国厂商。】Qwen3.7-Max编程竞技赛场的黑马在Code Arena榜单中Qwen3.7-Max以1541分的成绩闯入全球前四超越了GPT-5.5、Gemini 3.5 Flash等一众顶尖模型仅次于Claude Opus 4.7和Opus 4.6。这意味着在全球编程模型的竞技场上阿里是唯一杀进前列的中国厂商。在海外开发者圈子里Qwen3.7-Max也早有声誉。Atomic Chat的对比测试中Qwen3.7-Max只用$1.32的token成本就超越了Opus 4.7和GPT-5.5且性能提升了56%。在「3D像素风微缩宝塔模型」生成任务中其输出速度和质量也全面胜出。实战挑战Qwen3.7-Max优势尽显在「赛车游戏」挑战中Qwen3.7-Max表现出色。输入详细Prompt后它直出可玩的HTML文件虽第一版有小bug但经过第二轮微调一个体验完整的3D赛车游戏就跑了起来。与其他模型相比Qwen3.7-Max有两个独特细节。一是有正经的开始页面点「Start」才进入比赛而其他三家是打开即跑二是满足了添加发动机轰鸣和吃金币音效的要求而其他模型未做到。此外Gemini 3.5 Flash画面单薄、UI布局有问题Claude Opus 4.6赛道金币少、赛车缺乏随机性GPT-5.5金币造型奇怪且其他三家都修了好几轮bug才跑通全部功能只有Qwen3.7-Max首轮生成就基本可玩。Agent基座模型持久作战能力惊人阿里发布Qwen3.7-Max时将其定位为「Agent基座模型」专为长时间自主执行任务设计。内测数据显示在一次自主编程任务中它连续运行35个小时执行1158次工具调用最终生成的代码相较于Triton参考实现达到了惊人的10倍几何平均加速。在推演进行到第30个小时之后模型依然保持敏锐持续挖掘出新的优化空间全程零上下文退化、零指令漂移、零死循环。绝大多数模型在跑长任务时会出现上下文混乱、进入死循环等问题而Qwen3.7-Max解决了这些难题。核心技术升级环境扩展与长程自主执行Qwen3.7-Max编程能力跃升的核心可能与两个训练方法的升级有关。一是环境扩展编程训练时将每个任务拆成任务本身、执行框架、验证方式三个独立维度自由组合使模型学会解决问题的通用策略在不同框架里表现都很稳定。二是长程自主执行引入「动态累积生存博弈」框架让模型在持续变化的模拟环境中做超过一千步的连续决策自己建立假设、根据反馈调整策略且不出现「上下文腐化」。如在YC-Bench模拟创业公司经营一整年Qwen3.7-Max做到了208万美元营收是上一代的两倍还展现出策略进化。编辑观点Qwen3.7-Max在编程模型领域表现卓越其独特的产品定位和核心技术升级使其具备强大竞争力打破了国外模型的长期统治为全球编程模型竞赛带来新的活力。
http://www.gsyq.cn/news/1411453.html

相关文章:

  • GitHub中文汉化插件深度解析:5大核心技术实现全界面无缝本地化
  • 《CSDN技术文章吸睛术》巧用Emoji编码表打造沉浸式阅读氛围
  • 选购一双潮流款有品质感的老爹鞋品牌推荐?
  • 智能媒体捕获工具深度解析:5个专业技巧提升资源获取效率
  • 构建AI前端设计审查工具:从代码解析到规则引擎的工程实践
  • 2026年十大电磁流量计品牌厂家——最好用的仪表都在这里!
  • 2026最新适合学生的英语单词学习软件 这几款好评超高好用不踩坑
  • 2026年第二季度电磁流量计厂家十大品牌选型指南——市政污水计量哪家好?
  • E-Hentai漫画批量下载终极方案:告别繁琐手动保存,一键打包为ZIP文件
  • 为什么你的ChatGPT生日创意总像模板?揭秘NLP语义权重偏差与人格化提示调优技术(附调试日志)
  • 别再死记硬背!用‘SM66.7完成位’和‘SM67.7使能位’玩转西门子200PLC的PTO脉冲输出
  • 脑电(EEG)数据分析避坑指南:如何用随机森林做状态分类并验证结果显著性
  • 你的浏览器为何需要脚本猫?探索浏览器自动化的无限可能
  • 基于Vue.js与GPT-3.5构建个性化AI语言学习应用实战
  • 猫抓插件终极指南:三步轻松下载任何网页视频和音频资源
  • 从‘两两相乘求和’到‘平方和公式’,一个被忽略的数学技巧如何帮你秒杀算法题?
  • 2026年5月广州养老机构推荐:五大排名主城防孤独评测专业价格 - 品牌推荐
  • 构建AI驱动的SEO监控系统:从历史快照到智能归因
  • 猫抓浏览器扩展:5分钟掌握终极网页视频下载解决方案
  • 2026年儋州市黄金回收优选榜单|5家正规靠谱门店推荐+联系方式(黄金+K金+白银+铂金回收) - 盛世金银回收
  • 从原理到源码解析数据权限控制
  • 保姆级教程:用Qt QPainter手搓一个汽车仪表盘控件(附完整源码)
  • RIS辅助自适应混合预编码:低复杂度解决6G毫米波多用户干扰
  • 游戏性能优化神器:DLSS Swapper一键管理超采样文件的完整攻略
  • 从美术到程序:Unity Player面板全流程配置实战,让你的游戏图标、启动动画和窗口表现更专业
  • 2026年德州市黄金回收优选榜单|5家正规靠谱门店推荐+联系方式(黄金+K金+白银+铂金回收) - 盛世金银回收
  • XUnity.AutoTranslator终极指南:Unity游戏本地化完整解决方案
  • 5分钟掌握猫抓插件:智能嗅探网页资源的终极指南
  • FPGA赋能MobileNet V2:从模型优化到硬件加速的端到端实践
  • 如何避免高效执行中的方向迷失:从OKR到动态优先级的防漂移实践