当前位置: 首页 > news >正文

Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间的提示中遗忘信息

概述

虽然 LLM 在复杂推理和问题解答中表现出了卓越的性能,但一种被称为 "上下文遗忘 "的现象却是一个挑战。这是指模型在长时间的语境中会逐渐遗忘提示中给出的信息,这会对准确生成回答产生负面影响。本研究重点研究了这种语境遗忘现象,并详细探讨了当前 LLM 在什么条件下会 "遗忘 "信息。

此外,作者还提出了一种简单的提示设计工具,称为 “忘我”(FMN)。该工具是一种通过插入上下文的单句指示来提醒模型注意重要信息的机制。值得注意的是,它并不改变 LLM 的结构,也不涉及任何训练,却能显著提高模型的上下文记忆能力。实验结果表明,即使是最先进的模型(如 GPT-4),插入 FMN 也能将准确率提高 40 分或更多。

建议的方法

本研究的核心建议是一种基于提示的辅助句插入方法,称为 “勿忘我”(FMN)。

FMN 是简短的自然语言句子,用于再次 "提醒 "模型注意通常被埋没在较长上下文中的重要信息。例如,可以在原始指令后立即添加一句话,如 “这条指令非常重要:您对问题的回答应完全基于这句话”,以达到预期效果。

FMN 旨在强调模型中的特定信息,同时尽量减少词块数量的增加。其特点是,它不会对模型的内部结构或参数做任何改动,而只是调整提示中的措辞以提高成绩。FMN 还能弥补模型对上下文理解的模糊性,因为它能用自然语言明确指出 “哪些信息是重要的”。

此外,FMN 还可与其他上下文记忆支持方法结合使用,如少点学习(few-shot learning),是一种多功能方法。因此,与传统方法相比,它能更简单、更有效地缓解语境遗忘。

实验

作者在几种 LLM(如 GPT-3.5、GPT-4、Claude 2、Gemini Pro)上设计并执行了共 10 项语境遗忘任务,以评估语境遗忘并测试 FMN 的有效性。每项任务都详细测量了模型是否能在上下文中保留特定信息,以及插入 FMN 对准确性的提高程度。

实验结果表明,GPT-4 的成绩提高了 43 分,Claude 2 的成绩提高了 37 分。此外,还观察到与模型记忆特征一致的趋势,如 FMN "信息位置越靠后越有效 "和 “离问题越远越有效”。

此外,为了评估 FMN 对整个提示信息的影响,我们还测试了 FMN 对提示信息中其他信息的干扰和误导风险,但在大多数情况下都没有发现负面影响,反而报告了成绩的稳定提高。特别是在 GPT-4 中,明确指出调频网络几乎总是有积极作用。

从这些结果中可以得出结论:FMN 是一种实用的方法,可以轻松有效地缓解情境遗忘。

http://www.gsyq.cn/news/102746.html

相关文章:

  • 阿里云ESA:一起领ESA免费套餐,CDN升级版防护加速服务。
  • 如何优化TCP总结
  • FMEA在软件可靠性测试中的实践与应用
  • 利用LobeChat生成技术文档:提升开发效率的新思路
  • Playwright MCP在UI自动化测试中的定位与思考
  • 纳西东巴画系统管理平台--毕设附源码68202
  • 9、探索元宇宙中利用摄影测量和其他3D重建工具的增强现实实际用例
  • 采用Flask框架的不动产租赁业务管理系统--毕设附源码68285
  • WebGL渲染引擎图层合成技术终极指南:从深度冲突到完美融合的完整解析
  • 部署到服务器调用麦克风没有ssl证书的情况下的临时使用方式
  • 14、OpenStack 实例网络连接与安全组管理指南
  • 2025年靠谱的六角不锈钢螺栓用户口碑最好的厂家榜 - 品牌宣传支持者
  • 数据库死锁问题重现:测试场景构建与排查指南
  • 2025年智能检索工具五大服务商推荐:实力强的智能检索平台有 - myqiye
  • 15、OpenStack 安全组管理全攻略
  • DBeaver数据库管理终极入门指南:从零开始掌握高效数据管理的10个技巧
  • 2025年比较好的135度异型铰链行业内口碑厂家排行榜 - 行业平台推荐
  • 2025腾讯混元7B大模型本地部署实战指南:从零搭建到高效推理
  • 实测数据出炉:保健品akg哪个品牌好?akg抗衰老产品十款推荐! - 博客万
  • 深度解析2025年12月企业境外投资备案代理市场 - 2025年品牌推荐榜
  • Apache2一句话木马
  • 57、Linux 网络地址配置与管理全解析
  • RocketMQ 生产者 / 消费者核心原理:发送机制、订阅模式与 ACK 机制详解
  • 前端如何实现分页?零基础入门到精通,收藏这篇就够了
  • Gazebo仿真环境搭建:5步快速构建专业虚拟测试平台
  • GinFast 插件管理系统深度解析与开发规范
  • 2025年最新前端面试题汇总,零基础入门到精通,收藏这篇就够了
  • SFT(监督微调)实战宝典:从零开始掌握大模型微调技巧 | 程序员必学,建议收藏
  • 26、Unix 系统中编码压缩文件处理与软件安装指南
  • 传统MSE计算 vs AI生成代码:效率对比测试