当前位置: 首页 > news >正文

大模型|大模型中的Pre-Retrieval 预检索优化

🌞欢迎来到人工图像 小部件智能的世界
🌈博客主页:卿云阁

💌欢迎关注🎉点赞👍收藏⭐️留言📝

📆首发时间:🌹2026年6月1日🌹

✉️希望可以和大家一起完成进阶之路!

🙏作者水平很有限,如果发现错误,请留言轰炸哦!万分感谢!


目录

摘要索引

原理介绍

父子索引

假设性问题索引

元数据索引

索引方式的对比

查询补全(Enrich)

Multi-Query 多路召回

Decomposition 问题分解

混合检索

摘要索引

预检索优化:在真正检索之前,提前优化“索引结构、用户问题、检索方式”,让系统召回更准、更

全、更适合回答。

原理介绍

摘要索引优化了传统 RAG 分块语义杂乱、检索不准的问题,核心原则为检索用摘要,回答用原

文。

离线构建:文档切分为文本块后,由大模型为每个块生成摘要,将摘要向量化存入向量库,同时维

护摘要与原始文本块的映射关系,并单独存储原文。

在线问答:用户问题向量化后,在摘要向量库中检索匹配内容,再通过映射关系取出对应原始文本

块,将原文送入大模型生成答案。

简言之,摘要是定位内容的 “路标”,原文是提供细节的 “目的地”,二者缺一不可。

问题是否适合使用摘要索引原因
A:这篇新闻主要讲了什么?适合仅需概括主旨,摘要语义聚焦,可依托摘要完成检索与回答
B:合同第 7 条中约定的违约金比例是多少?不适合需要精准数字、条款细节,摘要易丢失关键信息,更适合直接检索原文
C:这份产品说明书里有没有提到售后服务?具体有哪些政策?可以混合用借助摘要快速定位相关内容,再调取原文查看完整政策细节


父子索引

父子索引用于解决 RAG 中检索与回答对文本块大小的矛盾:大块文本语义混杂、检索精度低,小

块文本检索精准但上下文不足。其核心思路为子块检索,父块回答。

离线构建:先将文档切分为大粒度父块,再把每个父块拆分为多个细粒度子块;仅对子块向量化并

存入向量库,同时维护子块与父块的映射关系,完整保留父块原文。

在线使用:用户提问后,通过向量库检索匹配相关子块,再依据映射关系取出对应父块作为上下

文,交由大模型作答;若多个子块归属同一父块,会自动去重。

该方案兼顾检索精准度与回答上下文完整性,是主流的高阶 RAG 优化方案。


假设性问题索引

假设性问题索引主要解决用户口语化提问与书面化文档难以匹配的问题,传统RAG直接将用户问

题与原文做相似度比对,易因句式、篇幅差异导致检索失效;该方案会在离线阶段把文档切块后,

由大模型为每个文本块生成3~8个用户常见问题,将这些假设问题向量化存入向量库并维护其与原

文的映射关系,在线检索时比对用户问题与库中的假设问题,匹配成功后通过映射调取原始文档作

答,做到检索用问句、回答用原文,既提升匹配精度,又能保留完整细节。

问题匹配问题,检索用问句,回答用原文。


元数据索引

元数据索引依托文档附带的时间、类别、版本等结构化标签,遵循先过滤范围,再语义检索的思路

优化检索效果。离线阶段为每个文本块补充元数据,将文本向量与元数据一同存入向量库;在线检

索时先从用户问题提取筛选条件,通过元数据过滤缩小检索范围,再执行语义匹配。它不会替代向

量检索,而是作为补充手段,在文档数量多、类型杂的知识库中,有效避免无关内容干扰,大幅提

升检索精准度。

索引方式的对比


查询补全(Enrich)

查询补全(Enrich)用于优化语义模糊、指代不明的用户提问,遵循模糊问题先补全,再检索的原

则。它主要有两种实现方式:一是结合历史对话,由大模型将残缺问题改写为语义完整、表意明确

的查询;二是识别关键信息缺失时主动向用户追问。其核心是把隐含信息、模糊指代转为明确内

容,让检索匹配更精准,是 RAG 中常用的查询优化手段。


Multi-Query 多路召回

Multi-Query 多路召回针对单一提问表达方式局限的问题,核心思路是一个问题,多种问法,多路

检索。通过大模型从不同角度改写原始问题,生成多条差异化查询语句并分别检索,再对结果合

并、去重、可选重排序,有效扩大召回范围,避免因表述差异遗漏相关文档,提升检索完整性。该

方式并非简单同义替换,而是围绕核心需求覆盖不同业务角度,是 RAG 中经典的查询优化方案。


Decomposition 问题分解

复杂问题拆开查,多个答案合起来。复杂问题关键词杂乱,直接检索易出现结果不准、答案残缺的

问题,该方法通过大模型将其拆解为多个独立、简单、可单独检索的子问题,主要分为两种执行模

式:相互独立的子问题采用并行分解,同步检索作答;存在依赖关系的子问题采用串行分解,依托

前序答案推进后续检索,最终将所有子问题的结果汇总整合,生成完整全面的最终答案,完美适配

比较类、流程类、多条件、跨文档等复杂提问场景,有效解决传统RAG处理复杂问题时检索混

乱、回答不完整的缺陷。


混合检索

关键词抓准,向量抓意图,专门解决单一检索方式的短板。其中BM25关键词检索擅长精准匹配固

定字段、专业术语、错误码、编号、条款等硬性文本,对字面一致内容命中率高,但无法理解语义

与口语化表达;向量检索擅长识别语义相似、同义替换、模糊口语、主题关联内容,适配自然语言

提问,但对精准字符、固定标识不够敏感。混合检索将二者结合,先分别通过BM25做关键词召

回、向量检索做语义召回,再对两路结果合并去重,可搭配RRF融合排序、Reranker重排序做深

度优化,兼顾检索精准度与语义泛化能力,不依赖单一检索逻辑、容错性更强,项目中还可叠加元

数据、摘要、父子索引等多路检索进一步提升效果。

http://www.gsyq.cn/news/1442555.html

相关文章:

  • 打卡信奥刷题(3350)用C++实现信奥题 P9519 pay
  • 5分钟终极指南:如何用untrunc免费快速修复损坏的MP4视频文件
  • 浅谈RAG前的语义缓存层(3) —— 还是得让大模型兜底
  • MSC新规征求意见稿:细胞库检定要求升级,你注意到这五项了吗?
  • YACReader终极指南:三步打造你的专业漫画图书馆
  • 荧光法溶解氧仪源头厂家推荐榜:2026国产十大优选品牌深度评测与选型指南 - 仪表品牌榜
  • 新建分类
  • 突破60帧束缚:Genshin_StarRail_fps_unlocker带你体验240Hz流畅游戏世界
  • 从零到一:全面解析加密货币交易所的开发与搭建
  • 数字时代知识保存:从百科全书备份到长期存储技术实践
  • 3PEAK思瑞浦 TP5591-SR SOP8 精密运放
  • 如何实现谷歌秒收录?让爬虫每天多抓500次的底层逻辑
  • MapLibre GL JS第36课:一个Source配置多个图层样式
  • PLC项目开发流程详解:从需求分析到现场调试
  • 嘉兴修漏水哪家好|2026嘉兴靠谱防水补漏、全屋漏水维修分区推荐 - 吉修匠
  • 谷歌秒收录需要什么条件?解决“发现未索引”报错的3步急救法
  • 3步解决抖音内容采集难题:你的自动化下载工作流指南
  • 给资产装上“数字翅膀”:RWA系统开发者的千亿级造富风口
  • 抖音创作者作品批量下载神器:5分钟掌握高效视频采集
  • 青岛修漏水哪家好|2026 青岛靠谱防水补漏、全屋漏水维修分区推荐 - 吉修匠
  • YACReader终极指南:如何打造你的个人漫画图书馆
  • 2026年连锁酒店加盟品牌差异横评:定位层级、物业适配与收益模型全对比 - 科技焦点
  • OmenSuperHub深度解析:开源硬件控制工具的技术实现与实践指南
  • 科研写作从低效到持续高产,只需要掌握这套Gemini 3.1 Pro的辅助路径
  • 成都工字钢公司|工字钢厂家|工字钢现货推荐|四川盛世钢联国际贸易有限公司库存 - 四川盛世钢联营销中心
  • LangGraph 深度拆解:从 Agent Demo 到生产级编排系统
  • 3步解锁网易云音乐格式限制?ncmdump让你真正拥有付费音乐
  • FFXIV ACT插件内存操作技术解析:实现副本动画跳过的自动化处理
  • MATIEC:将工业自动化语言带入开源世界的编译器
  • WinUtil:3步快速完成Windows系统优化与软件管理的终极免费方案