当前位置: 首页 > news >正文

【Agent智能体10 | 反思设计模式-AI数据分析的可视化实战】

声明:本篇博客是以吴恩达的【Agent智能体】教程为基础,并对其中的内容做了笔记整理以及个人收获的总结。

上一篇【Agent智能体9 | 反思设计模式-提示词工程的进阶法则】主要是聚焦提示词工程,讨论了如何写好的提示词(例如:多给几个样本,给出审查标准等),来让语言模型进行自我反思。

这篇主要是用了一个更为复杂的例子(可视化咖啡销量),视角切换到了智能体工作流( agentic workflow)方面,且引入了多模型协作的例子,通过这个例子,你可以肉眼可见地感受到,引入反思机制后,AI 输出结果的惊人进化!

任务背景:可视化咖啡销量(Visualizing coffee sales)

  • 输入数据:一份包含日期(date)、价格(price)和咖啡名称(coffee_name)的原始表格数据
  • 用户需求:“创建一个图表,比较 2024 年和 2025 年第一季度(Q1)的咖啡销量” (Create a plot comparing Q1 coffee sales in 2024 and 2025)。

分析:如果只是简单地把这个需求丢给普通的 LLM,它可能会写出一段能运行但图表效果很差的代码。智能体工作流就是为了解决这个问题。

图表生成的智能体工作流 (Chart generation agentic workflow)

整个流程展示了 AI 如何通过“迭代”来完成任务:

  • 步骤 1:初次生成 (Write python code)用户输入提示词后,LLM 首先生成了第一版 Python 代码(V1 code),利用pandasmatplotlib处理数据并绘图。
  • 步骤 2:执行并输出 (Execute V1 code)系统在后台运行这段代码,生成了第一版图表(plot.png)。可以看到,左下角的第一版图表是一个“堆叠柱状图”。这种图表虽然没有明显的语法错误,但很难让人直观地对比不同咖啡在两年的销量变化,阅读体验很差。
  • 步骤 3:反思与批评 (Critique image, update code)这是智能体工作流的关键!系统并没有直接把第一版图表交给用户,而是将生成的图表和代码再次交给 LLM 进行审查。LLM 发现图表不够清晰,于是修改了代码(生成 V2 code)。
  • 步骤 4:再次执行得到最终结果 (Execute new code)运行第二版代码后,得到了右下角的新图表(plot_v2.png)。这变成了一个“分组柱状图”,将 2024 和 2025 年的数据并列放置,清晰明了地展示了每种咖啡的销量对比

使用不同的 LLM 进行反思(Reflection with a different LLM)

  • 模型 1(生成器 - Code generation):负责根据用户的提示词写出第一版基础代码。

    • 提示词:“编写 Python 代码生成可视化图表以回答用户的问题 {用户提示词}”
  • 模型 2(审查员 - Reflection):负责扮演“质检员”。可以是同一个模型,也可以是一个能力更强、专门用于分析不同视角的其他 LLM。系统会将第一版代码、生成的图片以及对话历史发给它。

    • 提示词:“你是一位专家级数据分析师,负责提供建设性的反馈。第一步:审查附带的图表的可读性、清晰度和完整性。第二步:编写新代码来落实你的改进建议。”

这样充分利用不同LLM的优势,可以得到质量更高的结果!

总结

这套流程展示了Agentic Workflow(智能体工作流)相较于传统的Zero-shot(零样本一次性生成)的巨大优势

但是,反思在一些应用上提升有限:在另一些应用上提升明显,还有些应用几乎没有提升。不过了解反思对应用影响是很有帮助的。下篇文章将简单讲述评估反射的一些方式。

如果这篇文章对你有帮助,欢迎点赞、评论、关注、收藏。你们的支持是我前进的动力!

http://www.gsyq.cn/news/1424265.html

相关文章:

  • 别再死磕Vivado了!用VSCode写ZYNQ代码,效率翻倍的保姆级配置指南
  • 多 Agent 对证循环协作架构:Hermes + Claude Code + Codex 三角色工作流实战
  • WarcraftHelper魔兽争霸III优化工具:5分钟解锁游戏全部潜力,告别老旧限制
  • Arm CCI-550/CCI-500地址通道带宽异常分析与优化
  • 这6个动作让python selenium爬虫规避检测
  • 【Claude NPV分析权威指南】:20年财务AI专家首曝大模型估值新范式,3步精准测算项目真实价值
  • Linux服务器内存升级避坑指南:手把手教你用dmidecode查清空余卡槽和兼容参数
  • 180、运动控制中的行业标准:CNC标准ISO 841
  • 哪些25-30万五座SUV车型值得选?2026年5月推荐TOP5评测家用空间案例适用场景 - 品牌推荐
  • dto 转entity方法
  • 抖音下载神器终极指南:一键获取无水印视频的完整教程
  • 银河麒麟V10系统下,用vsftpd搭建FTP服务器的保姆级避坑指南
  • 2025-2026年北京定制游旅行社推荐:口碑好的服务企业团建方案落地难案例 - 品牌推荐
  • 2026年杭州权威赋能教育学校评测:浙江青少年叛逆学校、浙江青少年夜不归宿、浙江青少年心理咨询学校、浙江青少年心理辅导学校选择指南 - 优质品牌商家
  • 如何告别多显示器鼠标跳跃?LittleBigMouse的智能DPI感知技术揭秘
  • 离线环境救星:手把手教你用DISM命令搞定Win10 .NET 3.5安装(告别0x8024402c错误)
  • 国内合规垫圈生产企业实测排行:防松垫圈、垫圈定制、DTI垫圈、压力指示垫圈、双叠自锁垫圈、接地垫圈、垫圈选择指南 - 优质品牌商家
  • Win11 WSL2 + Ubuntu 18.04:手把手教你配置ROS开发环境并跑通第一个rviz
  • 2026年5月留香沐浴露品牌推荐:十大排名运动后留香评测专业价格 - 品牌推荐
  • Sysinternals Autoruns实战:从“计划任务”里挖出潜伏的挖矿脚本(附排查思路)
  • 基于大语言模型的生成式智能体架构设计与应用实践
  • 2026年5月留香沐浴露品牌推荐:十大专业评测持久留香价格适用场景 - 品牌推荐
  • Hugging Face数据集实战指南:10大精选与NLP模型微调全流程
  • 2026年节日送礼毛绒玩具怎么选:五家优选品牌深度解析 - 科技焦点
  • 2026年5月工控主板厂家推荐:口碑好的产品解决产线频繁死机导致停产 - 品牌推荐
  • Kotlin 泛型
  • BI上线沦为摆设无价值,智能BI如何落地实效不做面子工程?
  • 2026年5月30全国沙发翻新优选匠阁、御匠、锦修上门换皮换布全解析,三大连锁品牌推荐靠谱哪家好?价格和方式 - 卓一科技
  • E图提取技术与e-boost框架在EDA中的高效应用
  • 2026年节日限定盲盒毛绒玩具怎么挑:五家优选品牌解析 - 科技焦点