当前位置: 首页 > news >正文

【Agent智能体9 | 反思设计模式-提示词工程的进阶法则】

声明本篇博客是以吴恩达的【Agent智能体】教程为基础并对其中的内容做了笔记整理以及个人收获的总结。这篇文章通过对比“直接生成“与“反思机制”的输出结果以及“零样本”与“多样本”提示词之间的效果差距为你揭示了为什么 AI 总是容易在简单任务上犯低级错误。而且介绍了反思的应用场景以及实操技巧帮助你后续进行实操。直接生成Direct generation图中发出指令让它“写一篇关于黑洞的文章”或者“写一段计算复利的 Python 代码”。模型看到指令就直接干活了。这就是典型的就是零样本提示这样输出的结果通常质量不是很高零样本提示和少量样本提示的对比零样本提示 (Zero-shot Prompting)直接给模型下达指令或提问不提供任何参考示例。模型完全依赖它在训练阶段学到的知识来直接生成回答。让它把日期转换成MM/DD/YYYY格式只给了待转换的变量{input_date}没有给任何转换的示范。单样本提示 (One-shot Prompting)在给出你真正需要处理的任务之前先给模型提供一个标准的“输入-输出”示例打一个样为了确保模型知道你想要的具体格式你先给了一个例子Input: Jan 1st, 2025对应Output: 01/01/2025。然后再给出你需要它实际处理的{input_date}。结果这样能极大提高模型按照你期望的特定格式或语调输出的准确率。少样本/多样本提示 (Few-shot Prompting)在提示词中提供两个或更多的示例。不仅给了一个例子还给了第二个例子Input: 21st June, 2025对应Output: 06/21/2025。结果当任务比较复杂或者容易产生歧义时提供多个例子可以帮模型更好地总结出规律Pattern反思为什么有效数据证明如图我们可以通过数据看到反思的优势核心观点“Reflection consistently outperforms direct generation on a variety of tasks.”在各种任务中反思的表现始终优于直接生成。什么任务适合用反思应用场景这个图展示了 AI 在“直接生成”时常犯的错以及如何用“反思提示词”来纠正。案例拆解写 HTML 代码经常漏掉符号。反思指令“验证这段 HTML 代码。”写泡茶步骤可能会跳过某些步骤。反思指令“检查这些步骤是否连贯且完整。”起域名名字可能很难读或者有歧义。反思指令“这个域名有负面含义吗是不是很难发音”结论当任务需要高准确度、逻辑严密或涉及主观感受时AI 的第一反应往往有漏洞这时候用反思指令去“堵漏”非常管用。如何写好反思提示词实操技巧核心观点反思不是简单地对 AI 说“你重写一遍”或“你写得不好”而是需要提供明确的审查标准。底部的法则Clearly indicate the reflection action (明确指示反思的动作)告诉它要“检查”、“审查”或“验证”。Specify criteria to check (提供具体的检查标准)告诉它具体要检查什么。图中的优秀案例起域名时的反思不是说“再想几个”而是说“检查你刚才建议的域名。看看好不好发音想一下在其他语言里有没有负面意思最后只输出符合这些标准的名字。”改写邮件时的反思“检查第一版草稿。看看语气够不够专业有没有可能让人觉得没礼貌的词核对所有事实、日期和承诺是否准确然后再写出下一版。”总结这些例子很好的展示了在使用大型语言模型时非常核心的一种提示词工程Prompt Engineering技巧通过提供不同数量的“样本”来引导模型输出。如果这篇文章对你有帮助欢迎点赞、评论、关注、收藏。你们的支持是我前进的动力
http://www.gsyq.cn/news/1405757.html

相关文章:

  • 【Agent智能体8 | 反思设计模式-大语言模型反思机制的四个演进阶段】
  • Halcon实战:从单张到批量,高效读取图片的三种核心方法
  • 神经形态AIoT开发新范式:NMLOps与云原生平台实践
  • cpm-ant-10b应用场景探索:解锁AI在客服、创作与代码生成领域的强大潜力
  • AI搜索排名服务不同预算档位的决策参考:从四档需求看选择 - 资讯纵览
  • Formbricks:开源问卷调查工具,用户研究和产品反馈神器
  • 恶搞整活指南:如何让好兄弟以为在下载三角洲外挂,结果却安装了暗区突围?
  • 终极指南:如何在Windows电脑上直接安装和运行安卓应用(无需模拟器)
  • Open-LLaMA 3B V2 Wizard Evol Instruct V2 196k:华为昇腾平台上的高性能开源语言模型完全指南 [特殊字符]
  • 中国教育研究(香港)-收费1500-期刊-只有issn-维普收录
  • KMS_VL_ALL_AIO:一站式智能激活解决方案,告别Windows和Office授权烦恼
  • Cola-DLM部署优化终极指南:10个GPU内存管理与推理加速技巧 [特殊字符]
  • 终极指南:在Windows 10上免费安装Android子系统的完整教程
  • 你的内容被AI“看见“了吗?一套自测大模型内容可见性的完整方法
  • Livox雷达驱动点云格式实战:从CustomMsg到PCL标准格式的转换与选择
  • 如何扩展SD_PixelArt_SpriteSheet_Generator:自定义训练与模型微调指南
  • 昌都外贸网站开发找哪家?WaiMaoYa 外贸鸭实景展示产能与实力,精准打动海外大客户 - 外贸独立站运营
  • Taotoken的TokenPlan套餐如何为高频用户带来显著成本优势
  • 5步深度配置方案:打造高效Klipper 3D打印控制界面
  • 基于FPAA的仿生六足机器人分层CPG控制器设计与实现
  • AI教材生成新趋势!低查重AI工具让教材编写轻松又高效
  • TimeMoE-200M实战案例:用200M参数模型实现工业传感器数据精准预测
  • 普宁注册公司哪家代办好|注册公司全程不跑腿怎么做到 - 品牌观察
  • GeckoLib动画引擎:为Minecraft模组注入灵魂的完整指南
  • 终极指南:如何让你的Linux系统轻松支持rtl88x2bu无线网卡
  • 3个步骤,让诺基亚时代的Java游戏在你的现代设备上重生
  • 深度解析:Go 语言 GMP 调度器模型与内核线程探测
  • 2026江苏长晶科技(JSCJ)优质授权代理商推荐 - 资讯纵览
  • 广州商业场所除四害服务选择指南:2026年企业必备 - 资讯速览
  • 网卡公司排名前十怎么筛?选型负责人的多家实地经验复盘 - 资讯纵览