DeepSeek-R1 与 OpenAI o3 的启示：Test-Time Compute 技术不再迷信参数堆叠

发布时间：2026/7/26 13:29:45

过去2年，整个行业仿佛陷入了一场参数竞赛，每一次模型发布的叙事如出一辙：“我们堆了更多 GPU，用了更多数据，现在的模型是 1750 亿参数，而不是之前的 1000 亿。”

这种惯性思维让人误以为智能只能在训练阶段“烘焙”定型，一旦模型封装发布，能力天花板就被焊死了。

但到了 2025 年，这个假设彻底被打破了。

先是 DeepSeek-R1 证明了只要给予思考时间，Open-weights 模型也能展现出惊人的推理能力。紧接着 OpenAI o3 登场，通过在单个问题上消耗分钟级而非毫秒级的时间，横扫了各大基准测试。

大家突然意识到我们一直优化错了变量。技术突破点不在于把模型做得更大，而在于让模型在输出结果前学会暂停、思考和验证。

这就是 Test-Time Compute（测试时计算），继 Transformer 之后，数据科学领域最重要的一次架构级范式转移。

https://avoid.overfit.cn/post/a2f09be2577e48b59d2f9f2fc5e6549c

新闻详情