声明本篇博客是以吴恩达的【Agent智能体】教程为基础并对其中的内容做了笔记整理以及个人收获的总结。这篇文章通过对比“直接生成“与“反思机制”的输出结果以及“零样本”与“多样本”提示词之间的效果差距为你揭示了为什么 AI 总是容易在简单任务上犯低级错误。而且介绍了反思的应用场景以及实操技巧帮助你后续进行实操。直接生成Direct generation图中发出指令让它“写一篇关于黑洞的文章”或者“写一段计算复利的 Python 代码”。模型看到指令就直接干活了。这就是典型的就是零样本提示这样输出的结果通常质量不是很高零样本提示和少量样本提示的对比零样本提示 (Zero-shot Prompting)直接给模型下达指令或提问不提供任何参考示例。模型完全依赖它在训练阶段学到的知识来直接生成回答。让它把日期转换成MM/DD/YYYY格式只给了待转换的变量{input_date}没有给任何转换的示范。单样本提示 (One-shot Prompting)在给出你真正需要处理的任务之前先给模型提供一个标准的“输入-输出”示例打一个样为了确保模型知道你想要的具体格式你先给了一个例子Input: Jan 1st, 2025对应Output: 01/01/2025。然后再给出你需要它实际处理的{input_date}。结果这样能极大提高模型按照你期望的特定格式或语调输出的准确率。少样本/多样本提示 (Few-shot Prompting)在提示词中提供两个或更多的示例。不仅给了一个例子还给了第二个例子Input: 21st June, 2025对应Output: 06/21/2025。结果当任务比较复杂或者容易产生歧义时提供多个例子可以帮模型更好地总结出规律Pattern反思为什么有效数据证明如图我们可以通过数据看到反思的优势核心观点“Reflection consistently outperforms direct generation on a variety of tasks.”在各种任务中反思的表现始终优于直接生成。什么任务适合用反思应用场景这个图展示了 AI 在“直接生成”时常犯的错以及如何用“反思提示词”来纠正。案例拆解写 HTML 代码经常漏掉符号。反思指令“验证这段 HTML 代码。”写泡茶步骤可能会跳过某些步骤。反思指令“检查这些步骤是否连贯且完整。”起域名名字可能很难读或者有歧义。反思指令“这个域名有负面含义吗是不是很难发音”结论当任务需要高准确度、逻辑严密或涉及主观感受时AI 的第一反应往往有漏洞这时候用反思指令去“堵漏”非常管用。如何写好反思提示词实操技巧核心观点反思不是简单地对 AI 说“你重写一遍”或“你写得不好”而是需要提供明确的审查标准。底部的法则Clearly indicate the reflection action (明确指示反思的动作)告诉它要“检查”、“审查”或“验证”。Specify criteria to check (提供具体的检查标准)告诉它具体要检查什么。图中的优秀案例起域名时的反思不是说“再想几个”而是说“检查你刚才建议的域名。看看好不好发音想一下在其他语言里有没有负面意思最后只输出符合这些标准的名字。”改写邮件时的反思“检查第一版草稿。看看语气够不够专业有没有可能让人觉得没礼貌的词核对所有事实、日期和承诺是否准确然后再写出下一版。”总结这些例子很好的展示了在使用大型语言模型时非常核心的一种提示词工程Prompt Engineering技巧通过提供不同数量的“样本”来引导模型输出。如果这篇文章对你有帮助欢迎点赞、评论、关注、收藏。你们的支持是我前进的动力