当前位置: 首页 > news >正文

《Llamaindex大模型RAG开发实践》笔记

关联知识库:《Llamaindex大模型RAG开发实践》笔记

Workflow

  1. import data(llamaHub)
  2. create doc from source data
  3. create textNode from docs
  4. create index from textNode

import data

  • xxReader
  • cloud service

Data to Doc

  • simple one
  • by sentence
  • by token
  • for code(AST)

NodeParser

  • by sentence
  • use LangChain module
  • markdown
  • json
  • ...

metadata setting 质>量

  • 手动
  • 自动提取器
    • Summary Extractor
    • Title one
    • Keyword one
    • Pydantic lib
    • marvin

数据隐私与脱敏 HuggingFace LLM

import pipeline 4 cache

Build Index

Custom Setting

Settings

  • LLM
  • Embedding
  • Index Parser

About package chain

  • metadata(摘要,关键词等等)
  • index(摘要,关键词,树,知识图谱)
  • retriever(向量检索器,摘要检索器等)

以上,属于llamaindex封装好的简单rag构建链路。
同时,llamaindex也提供更加定制化,精细化的构建方式

检索器原理

遍历索引并选取相关节点以构建所需上下文

  • default: VectorIndexRetriever
  • xxRetriever
  • xxSelector
  • 密集检索和稀疏检索以及混合检索
  • small-to-big 检索
  • and so on
    (是本书,也是本目录)

后处理

节点的筛选,优化

过滤,转换,重排序

by

  • xxPostprocessor

or 基于大模型的后处理器

  • xxRerank
    eg:LongLLMLinguaPostprocessor
    2310.05736v2

评估重排的有效性:

  • 基准数据集
  • 用户反馈收集
  • AB测试
    。。。

响应合成

输出解析

结构化输出

  • LangchainOutputParser
  • Pydantic

Chain so far

节点
索引
检索器
后处理器
响应合成器
输出解析器
查询引擎

查询引擎

QueryEngine

  • 19个(大目录)

SubQuestionQueryEngine 多步骤推理的复杂查询

聊天引擎 4 对话历史记录

ChatEngine 多轮对话

结合上下文的问题压缩模式

LLMCompiler智能体

规划
分派
执行

llamaindex :AgentRunner & AgentWorker

C9 - C11

llamaindex高度定制化特性
RAG核心:LLM & Embddding Modol

本地运行

  • llama.cpp
  • Ollama
  • LM Studio

OpenRouter 模型路由

llama packs

追踪评估

  • Phoenix(span,trace)
  • RAGAS

部署

streamlit社区云

基于对话代理的界面会简化用户的交互体验

展望

当模型能够处理相当长的上下文,我们还是否需要RAG?

永远不要停止学校的步伐,因为追求知识是一条永无止境的道路

http://www.gsyq.cn/news/73743.html

相关文章:

  • # AWS全球宕机:DNS故障引发互联网级连锁反应
  • # 智能编辑器与传统IDE混合使用实践指南
  • # 35岁外包被裁后的一键复仇:Schultz事件背后的科技行业内部威胁新趋势
  • # 【测试场景2】2025年10月AI行业动态深度报告:技术突破、市场动向与产业洞察
  • AI规则管理实践经验:规则过多与AI注意力问题
  • 人机共创精简价值Prompt
  • 可复用Prompt识别与生成专家Prompt
  • # 思维链提示论文解读:开启LLM推理能力的钥匙(Google 2022)
  • VS2022启用调试外部NuGet源码
  • alpine设置开机自启动服务
  • Scalar可视化OpenAPI文档中心
  • .NET Core 微服务之Grpc远程调用
  • 用 PHP(Laravel)+ ImageMagick + Tesseract 实现验证码识别
  • 网络学习细节学习
  • 12月5日日记
  • FEM/BDC Test Platform for BMW Key Programmer – Test F20 F30 F35 X5 X6 I3 Without Gearbox Plug
  • 上海助听器验配哪家好?2025 年12月权威机构推荐报告:从资质核验到场景适配的全维度选择策略
  • ssh连接错误:WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED! - Hello
  • 联想小新Pad Studio平板重装国际版系统教程(TB351FU)
  • DEBIAN 12.6手动安装LNMP环境记录
  • CDN 迁移至 EdgeOne 工具使用指南
  • S6 All System OBD Scanner: 28 Resets (IMMO/BMS/TPMS/ABS) + Lifetime Free Scans
  • Qt C++ 软件开发工程师面试题 - 教程
  • LLL格基约简算法(2)
  • 实用指南:MySQL 基础完全指南(视频教程)
  • 探寻并预防机器学习模型中的安全漏洞
  • 国家智库发文回应AI就业焦虑:替代之外,人机协作、灵活就业是趋势
  • Harmony鸿蒙编写0基础入门到精通Day11--TypeScript篇
  • 12/5
  • Accurate Camera Calibration using Iterative Refinement of Control Points