当前位置：首页 > news >正文

OpenRouter Fusion与agent

news 2026/6/16 19:08:06

openrouter fusion通过agent协调团战方式战胜了fable 5单跑效果，并且其成本可以通过开源模型组合压缩到比单跑的fable 5还低。

一、OpenRouter Fusion：用“团队协作”超越“单打独斗”

1. 什么是Fusion？

OpenRouter Fusion 是一种多模型协同系统，于2026年6月13日正式推出。它的核心理念非常直观：与其依赖一个最强的单模型，不如让多个模型组队协作，再让一个“裁判模型”把所有答案融合成一份最优解。

具体工作流程分为三步：

并行研究：用户的请求被同时分发给多个“参团模型”（Panel Models），每个模型都独立进行推理、搜索和答案生成。
结构化分析：一个“裁判模型”（Judge Model）通读所有回答，产出结构化分析——包括哪些是共识、哪些互相矛盾、谁有独到见解、大家共同的盲区在哪里。
综合成稿：最后由调用模型基于这份分析写出最终答案。

整个流程在服务端完成，开发者只需一次API调用，体验与调用单个模型完全一样。

2. 在DRACO基准测试中全面超越单模型

OpenRouter团队选择了Perplexity AI的DRACO深度研究基准进行评测。这个基准涵盖100道跨10个领域的复杂研究任务（学术、金融、法律、医疗等），每道题有约39条带权重的评分标准，答错会扣负分，靠堆字数糊弄拿不到分。

测试结果如下：

类型	模型组合	DRACO得分
Fusion（顶配）	Fable 5 + GPT-5.5，由Opus 4.8合成	69.0%
Fusion	Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro	68.3%
Fusion	Opus 4.8 + GPT-5.5	67.6%
Fusion	Opus 4.8 + Opus 4.8（自己融合自己）	65.5%
单跑	Claude Fable 5	65.3%
Fusion（预算组）	Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro	64.7%
单跑	DeepSeek V4 Pro	60.3%
单跑	GPT-5.5	60.0%
单跑	Claude Opus 4.8	58.8%

3. Fusion如何超越Fable 5等单模型？

第一，顶配组团直接“超出前沿”。Fable 5 + GPT-5.5的融合配置拿下69.0%，比Fable 5单跑的65.3%高出3.7个百分点，超越了所有参与测试的单个模型。

第二，预算组团也能击败顶级单模型。由Gemini 3 Flash、Kimi K2.6和DeepSeek V4 Pro三个相对便宜的模型组成的“预算面板”，融合后拿到64.7%，不仅击败了GPT-5.5（60.0%）和Opus 4.8（58.8%），距离Fable 5的65.3%仅差不到1个百分点。而成本仅需Fable 5的一半左右。

第三，“自己融合自己”也有效。同一个Opus 4.8跑两次再融合，得分从58.8%跃升至65.5%，提升了6.7分。这说明Fusion的提升不仅来自不同模型的多样性，合成（synthesis）步骤本身就有巨大价值——同一模型的不同推理路径也能互补增益。

第四，解决了单模型的“盲区”问题。测试中Fable 5有7道题被自己的内容过滤器拦下，没能跑完。单模型用户会被一个模型的“脾气”、过滤器和盲区绑死。而Fusion中，一个模型掉链子，其他模型还能顶上。