当前位置: 首页 > news >正文

OpenRouter Fusion与agent

openrouter fusion通过agent协调团战方式战胜了fable 5单跑效果,并且其成本可以通过开源模型组合压缩到比单跑的fable 5还低。

一、OpenRouter Fusion:用“团队协作”超越“单打独斗”

1. 什么是Fusion?

OpenRouter Fusion 是一种多模型协同系统,于2026年6月13日正式推出。它的核心理念非常直观:与其依赖一个最强的单模型,不如让多个模型组队协作,再让一个“裁判模型”把所有答案融合成一份最优解

具体工作流程分为三步:

  • 并行研究:用户的请求被同时分发给多个“参团模型”(Panel Models),每个模型都独立进行推理、搜索和答案生成。
  • 结构化分析:一个“裁判模型”(Judge Model)通读所有回答,产出结构化分析——包括哪些是共识、哪些互相矛盾、谁有独到见解、大家共同的盲区在哪里。
  • 综合成稿:最后由调用模型基于这份分析写出最终答案。

整个流程在服务端完成,开发者只需一次API调用,体验与调用单个模型完全一样。

2. 在DRACO基准测试中全面超越单模型

OpenRouter团队选择了Perplexity AI的DRACO深度研究基准进行评测。这个基准涵盖100道跨10个领域的复杂研究任务(学术、金融、法律、医疗等),每道题有约39条带权重的评分标准,答错会扣负分,靠堆字数糊弄拿不到分。

测试结果如下:

类型模型组合DRACO得分
Fusion(顶配)Fable 5 + GPT-5.5,由Opus 4.8合成69.0%
FusionOpus 4.8 + GPT-5.5 + Gemini 3.1 Pro68.3%
FusionOpus 4.8 + GPT-5.567.6%
FusionOpus 4.8 + Opus 4.8(自己融合自己)65.5%
单跑Claude Fable 565.3%
Fusion(预算组)Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro64.7%
单跑DeepSeek V4 Pro60.3%
单跑GPT-5.560.0%
单跑Claude Opus 4.858.8%

3. Fusion如何超越Fable 5等单模型?

第一,顶配组团直接“超出前沿”。Fable 5 + GPT-5.5的融合配置拿下69.0%,比Fable 5单跑的65.3%高出3.7个百分点,超越了所有参与测试的单个模型。

第二,预算组团也能击败顶级单模型。由Gemini 3 Flash、Kimi K2.6和DeepSeek V4 Pro三个相对便宜的模型组成的“预算面板”,融合后拿到64.7%,不仅击败了GPT-5.5(60.0%)和Opus 4.8(58.8%),距离Fable 5的65.3%仅差不到1个百分点。而成本仅需Fable 5的一半左右。

第三,“自己融合自己”也有效。同一个Opus 4.8跑两次再融合,得分从58.8%跃升至65.5%,提升了6.7分。这说明Fusion的提升不仅来自不同模型的多样性,合成(synthesis)步骤本身就有巨大价值——同一模型的不同推理路径也能互补增益。

第四,解决了单模型的“盲区”问题。测试中Fable 5有7道题被自己的内容过滤器拦下,没能跑完。单模型用户会被一个模型的“脾气”、过滤器和盲区绑死。而Fusion中,一个模型掉链子,其他模型还能顶上

4. 背后的原理:多样性胜过单一智能

Fusion之所以能超越单模型,本质上是模型多样性的力量。不同厂商的模型在训练数据、底层架构和推理逻辑上各有差异,面对复杂问题时能提供不同的视角。OpenRouter官方将这种现象类比为人类团队的协作——一支多样化的人类团队能解决任何单个天才都搞不定的问题。

当然,Fusion也有其局限:响应时间约为标准调用的2-3倍,且不适合需要长时间序列推理的复杂任务(这仍是Fable 5的强项)。但它在深度研究、复杂推理等场景中,提供了一条用更低成本获取前沿性能的新路径。


二、Agent在当今大模型应用领域的地位

如果说2023-2024年是“大模型元年”,那么2025年被业界广泛称为“智能体(Agent)元年”。Agent在大模型应用领域的地位,已经从“锦上添花”升级为核心支柱

1. Agent是什么?为什么如此重要?

AI Agent(智能体)是大模型从“认知引擎”迈向“行动主体”的关键一跃。传统的大模型只能“回答问题”,而Agent能够:

  • 自主规划:将复杂任务拆解为可执行的步骤
  • 调用工具:主动使用搜索、代码执行、API调用等外部工具
  • 自主决策:根据环境反馈调整行动策略
  • 多步推理:完成需要长时间上下文的复杂任务

简而言之,大模型是“大脑”,Agent是“大脑+手脚”——它让AI不仅能思考,还能做事。

2. 巨头与资本全面押注Agent

2025年,大模型的竞争焦点全面转向了AI Agent。微软、谷歌、阿里等科技巨头纷纷布局卡位,OpenAI、智谱、Monica等初创公司也争相推出各自的Agent产品。

从企业战略来看,美国主要企业服务公司普遍将AI Agent确立为未来战略的核心方向,整个行业正经历从“工具增强”向“智能体驱动”的体系化转型。

数据也印证了这一趋势:2025年上半年,中国企业级大模型市场日均调用量同比增长363%,呈现爆发式放量态势。而大模型推理成本较2023年下降了90%,推理速度提升了10倍,彻底解决了Agent规模化应用的成本瓶颈

3. Agent驱动的商业奇迹

Agent经济的崛起速度令人震撼:

  • Cursor:两年内年化收入突破5亿美元
  • Perplexity:27个月估值飙升至140亿美元
  • GenSpark:45天达成3600万美元年化收入

这些AI原生企业的爆发式增长,证明了Agent作为大模型落地核心形态的商业价值。

4. Agent的演进路径与未来

AI Agent已形成清晰的演进路径:

  • 2024年:工作流智能体——能处理特定任务,但缺乏自主推理与泛化能力
  • 2025年:推理智能体——依托基座推理大模型的进化,具备任务规划、分析与跨场景适配能力
  • 未来:多智能体协作——多个Agent分工协作,完成更复杂的系统性任务

5. Fusion与Agent的深层关联

值得注意的是,OpenRouter Fusion本质上就是一种“多Agent协作”的雏形。它让多个模型(每个都可视为一个Agent)并行工作,再由裁判模型融合输出。这恰恰印证了Agent领域的一个重要趋势:单一智能体的能力终有上限,多智能体协作才是通往更强AI的路径

正如OpenRouter官方所说,Fusion的设计初衷之一就是让模型自己判断什么时候该“组团”——这本身就是一种Agent决策能力的体现。


结语

OpenRouter Fusion用扎实的基准测试证明了一个重要道理:AI的进步不再仅仅依赖于“造一个更大的模型”,而是可以用“多个模型协作”的方式,以更低的成本超越单个最强的模型

而Agent作为大模型落地的核心形态,正在从概念走向规模化应用。2025年被称为“智能体元年”并非偶然——当大模型的能力已经足够强大,如何让它们真正“做事”,就成了决定下一阶段AI竞争力的关键。Fusion的出现,恰恰是在这个方向上迈出的重要一步。

http://www.gsyq.cn/news/1536940.html

相关文章:

  • 深耕天河的全场景合规搬迁服务品牌|实体正规公司 透明报价无隐形消费
  • MFEM高性能有限元计算架构解析与大规模部署实践
  • 国内改性尼龙厂商实测评测:性能与资质全维度对比 - 奔跑123
  • 劳力士潜航者型实测 昆明金价下行阶段卖表避坑与报价参考 - 奢侈品回收评测
  • Arduino I2C通信避坑指南:从地址冲突、上拉电阻到电平转换,一次讲清楚
  • 别再被libcudnn动态库报错搞懵了!手把手教你用ldconfig和ln -sf搞定CUDA环境(附Anaconda虚拟环境实战)
  • 2026小红书去水印小程序实测排行|5款工具横向对比,不看后悔! - 互联网科技品牌测评
  • 干货|深耕深山滋补二十余载,我把羊肚菌的甄选与食用技巧全解析:不同规格如何选、泡发烹饪避坑指南 - 17322238651
  • 2026 沈阳汽车贴膜门店参考:佰乐行3M汽车贴膜直营店实力资讯整理 - 资讯焦点
  • ComfyUI-SUPIR终极指南:如何用AI轻松实现4倍图像超分辨率修复
  • 2026免费图片去水印工具实测:哪款真正免费又好用?免费图片去水印工具推荐全攻略
  • 深挖大连黄金回收行业乱象!5家口碑老店横向测评,教你精准估算到手金价 - 奢侈品回收评测
  • 2026短视频文案提取全攻略:4种保姆级方法手把手教你
  • 2026年好用的视频去水印软件,视频去水印软件推荐合集
  • 2026 东莞钻石回收机构排行|本地诚信龙头,估价公道半小时上门立估立结 - 奢侈品回收测评
  • 组件通信与注册
  • AI Agent 评估:怎么判断你的智能体到底好不好用?
  • 2026年展台搭建公司TOP10推荐:高级创意/简约稳固/大型小型展位展台设计搭建匠心精选,标杆品牌与靠谱服务深度解析! - 品牌发掘
  • 终极指南:5分钟掌握Marketch,让Sketch设计秒变可测量网页
  • 2026最新B站字幕导出保姆级教程:手把手教你一键提取字幕
  • Gemini 3.5 Flash:架构级优化的本地大模型推理新范式
  • 北京4U机架工控机合规选型排行:5家实力服务商盘点 - 奔跑123
  • 河北双边护栏网厂家综合实力排行:5家头部厂商盘点 - 奔跑123
  • 御网杯wp回顾
  • 2026年国内高级工程师职称评审条件拆解,副高至正高层级进阶指南推荐 - 资讯焦点
  • 常州汽车隔音改装干货!针对本地路况降噪方案,彻底解决高速风噪胎噪 - 音乐人生汽车音响
  • 2026四川动画专业报考指南:学校怎么挑 - 品牌2026
  • 北京正规建账记账代理机构实力排行盘点 - 奔跑123
  • 【信息科学与工程学】【数据科学】第一百八十八篇 线性/非线性泛函分析01
  • __shfl_down_sync()用法理解