当前位置：首页 > news >正文

工业级大模型学习之路025：问题解决-检索质量全为0

news 2026/5/26 2:13:17

问题检索质量评估结果为0说明检索没有找到相关文档问题可能是- 评估数据集生成时的chunk_id与实际向量数据库不匹配- 文档内容与问题不相关原因向量数据库中的ID有两种1. Chroma内部UUID 8e5d606e-896c-4117-83a6-31d3ca4638d9 自动生成2. Metadata中的chunk_id rag_guide_md_0 文档处理器生成评估数据集记录的是- d6dc2ed0-448d-4b4b-8de2-73e81a3dc2fe Chroma的UUID检索器返回的文档中- chunk_id 字段是 rag_guide_md_0 自定义格式评估器比较的是- 把检索结果的 chunk_id 如 rag_guide_md_0 与评估数据集的 relevant_chunk_ids 如 d6dc2ed0-448d-4b4b-8de2-73e81a3dc2fe 进行比较。这两种ID完全不同所以无法匹配导致Recall全为0。评估数据集生成时all_ids self.retriever.vector_store.get()[ids] # 获取的是 Chroma 内部UUID ... relevant_chunk_ids: [chunk_id] # 保存的是UUID如 d6dc2ed0-448d-4b4b-8de2-73e81a3dc2fe评估时比较的是retrieved_ids set([doc.metadata[chunk_id] for doc in retrieved_docs]) # 取的是metadata中的chunk_id如 rag_guide_md_0修复修改 core/rag_evaluator.py # 修复前使用Chroma内部UUID all_ids self.retriever.vector_store.get()[ids] # 修复后使用metadata中的chunk_id chunk_id metadata.get(chunk_id, metadata.get(id, str(hash(chunk_content))))

http://www.gsyq.cn/news/1373573.html

相关文章：

统信UOS 20.1060专业版美化全攻略：从桌面到开机GRUB，一张图搞定所有壁纸

Sysinternals Autoruns深度指南：不止于查毒，更是Windows系统管理的瑞士军刀

Adobe-GenP 3.0：5分钟快速激活Adobe全系列软件的终极指南

多模态模型在昇腾上的部署架构

Transformer注意力机制优化2026：Flash Attention到MLA的工程进化

AArch64内存模型与缓存一致性管理实践

量子通信技术突破：量子处理器如何提升经典通信容量

14.解决 99% 刷机故障！从底层原理到脚本实操，杜绝 IMEI / 基带永久损坏

CANN 显存管理与内存优化：NPU 存储体系的深度剖析

AI Native 公司构建指南：从 Anthropic 创始人手册到工程实践

拆解：我们为宁步建设做南京办公室装修GEO的完整步骤与底层思考

17.通杀安卓 /iOS 全机型！Linux 原生刷机方案，EDL 底层救砖 + 自动化源码开源

2026年至今，西安地区高适配机械弹簧供应商深度解析：为何“兵华弹簧制造”备受青睐？ - 2026年企业推荐榜

【万字文档+源码】基于SpringBoot+Vue高校实验室预约系统-计算机专业项目设计分享

从“画箭头”到1亿播放量：机械工程师梁乐平，如何用CAD绘图书写知识传播新篇章？

蓝牙低功耗基3-蓝牙低功耗中的数据交4

保姆级教程：在Ubuntu 18.04上用RTX 3060复现ICCV 2021的PMF点云分割模型

OpenSUSE 15.6操作系统在VMware Workstation中安装配置

Windows电脑C盘告急？手把手教你将Ollama模型安装到其他盘符（附环境变量配置详解）

2026年Q2浙江防水堵漏怎么选：嘉善防水补漏公司/桐乡防水补漏公司/海宁防水补漏公司/海盐防水补漏公司/防水补漏工程/选择指南 - 优质品牌商家

2026抖店转让优质平台推荐指南：天猫店铺转让的正规平台、抖店转让平台哪家口碑最好、正规的跨境网店转让平台、淘宝店铺转让平台有哪些选择指南 - 优质品牌商家

AI与精益创业结合驱动产品创新的方法论

Keil RTX5迁移调试问题与RTOS组件使用指南

保姆级避坑指南：在Ubuntu 20.04上从零部署OpenPCDet+PointPillars到ROS（含TensorRT 8.5加速）

避坑指南：麒麟系统安装.NET Core SDK和Avalonia UI的常见错误与解决

2026年5月新消息：果筐机厂家综合实力盘点，宁波华维机械为何值得关注？ - 2026年企业推荐榜

别再手动开终端了！用这个Shell脚本，5分钟搞定Ubuntu 22.04的个性化工作区

除了Ctrl+Alt+A，国产系统（UOS/麒麟/NFS）还有哪些隐藏的截图姿势？

Windows Server 2019/2022部署Filebrowser踩坑实录：从下载到NSSM服务化，一篇讲透所有配置细节

计算机工程投稿经历（2026年5月份录用）