腾讯云智能体开发平台RAG模型商业化倒计时核心功能12月10日起正式计费

发布时间：2026/7/26 12:27:34

腾讯云官方今日发布重要公告，宣布旗下智能体开发平台中的【RAG模型】服务即将结束体验阶段，将于2025年12月10日20时起正式启动商业化计费。这一调整标志着腾讯云在企业级AI应用服务领域的商业化进程迈出关键一步，也为依赖该平台构建智能应用的开发者带来新的成本规划考量。

【免费下载链接】Youtu-Embedding项目地址: https://ai.gitcode.com/tencent_hunyuan/Youtu-Embedding

商业化覆盖范围明确 RAG核心组件纳入计费体系

公告明确指出，本次商业化涉及的RAG模型体系包含文档解析、文档拆分、rerank、embedding、TEXT2SQL及多轮改写模型等核心功能模块。但首轮计费范围将聚焦于智能体开发平台内置的四类关键模型：youtu-reranker、youtu-reranker-llm、youtu-embedding和youtu-embedding-llm。这四类模型作为RAG（检索增强生成）技术架构的核心引擎，承担着知识检索的精准度优化与语义理解的关键作用，其性能直接影响智能问答、数据分析等应用场景的响应质量。

据技术文档显示，embedding模型负责将非结构化文本转化为高维向量实现语义索引，而rerank模型则通过深度排序算法提升检索结果相关性，两者构成智能知识检索的"双引擎"。此次计费调整将这两类基础能力模块单独定价，体现出腾讯云对AI基础设施分模块商业化的战略布局。

多场景计费规则细化知识检索API先行收费

针对不同开发模式下的服务使用场景，腾讯云详细界定了计费适用范围。公告特别强调，本次商业化初期仅对"知识检索API调用场景"实施收费，其他应用场景仍保持体验政策，具体收费时间将另行通知。这一梯度收费策略为开发者提供了缓冲期，有助于企业根据自身业务优先级逐步调整技术架构。

在标准模式下，当应用通过知识库问答功能触发检索操作，或在工作流中调用知识检索/大模型知识问答节点时，系统将自动启用embedding与rerank模型。单工作流模式中，除知识检索节点外，数据库TEXT2SQL插件的使用也将触发相关模型调用。而在复杂的Multi-Agent模式下，知识库问答、数据库TEXT2SQL及知识检索三大类插件的调用均纳入计费监测范围。值得注意的是，知识检索API作为独立服务接口，其所有调用行为将全面纳入本次计费体系。