当前位置: 首页 > news >正文

AI懂不懂幽默

前言过去的几年里往往一觉睡醒打开手机。媒体里就在说哪哪哪又开始打战了哪哪哪又发布了新的AI技术了。过去的几年里笔者基本平均每个月会回一趟老家此处感谢AI带来了自动驾驶。去一些 有锄头和镰刀没有战争和AI的地方——自家的天台菜园、朋友家的海边果园看小西瓜一天天变成大西瓜。身边没有人会说用XXX三分钟可以写出一个“坦克大战”游戏程序。回到深圳为了不被这个AI时代抛弃。还是得和小伙伴去学习一个个新出的“AI”技术探索其能力边界。类似一次次台风前夕 我们的心情——“怕它不来 又怕它乱来”。笔者所在的程序员圈子 对于AI的态度是——怕它不强又怕它太强。业界目前推了许多benchmark 来测评AI能力的方法但笔者好像还没看到 有benchmark涉及到这么一个主题——AI懂不懂幽默。本文笔者想浅浅地搜索一下这一主题。测试数据测试数据 选用笔者之前爬取的两千多条笑话(段子)。懒得写SQL我们直接用“claude code”查看一下数据的基本情况。❯ 用python读取本地数据库用户名为XXX密码为XXX, 库名为XXX, 表名为XXX ❯ 表里有多少条数据共有多少分类让AI挑选最好笑的我们同样用“claude code”进行实现大致指令如下 分类选出一条最好笑的笑话 要选出最好笑的不是随机返回 把每个分类的笑话喂给大模型让他返回最好笑的一个 将输出形成csv文件中间遇到 max_tokens不够大的问题自己手动调大了下数值。核心代码如下prompt f以下是{joke_type}分类下的所有笑话每条前面有编号。 {joke_list} 请从中选出你觉得最好笑的1条只返回 JSON 格式 {{index: 编号, reason: 一句话说明为什么好笑}} 不要返回其他内容。 for attempt in range(max_retries): try: resp client.messages.create( modelMODEL, max_tokens4096, thinking{type: disabled}, messages[{role: user, content: prompt}], ) raw for block in resp.content: if block.type text: raw block.text.strip() if not raw: # print(f模型返回空内容:, resp.content) raise ValueError(模型返回空内容) return extract_json(raw) except Exception as e: if attempt max_retries - 1: time.sleep(2) continue raise最终得到的输出如下多次执行返回的结果 并不一致选取其中一次对于AI选用模型为“deepseek-v4-pro”的返回笔者虽然对于很多类别的选取结果 不太认可。但确实也没法说 AI返回的结果 一无是处。AI评选逻辑为了探究AI的评选逻辑。我们通过deepseek的对话窗口让它对两段笑话进行评选得到的结果如下不得不说回答得挑不出毛病。总结从上述的文本表现上看我们很难说AI不懂幽默。它能识别笑话的套路谐音梗、反转、预期违背等能告诉你一个笑话为什么好笑甚至能根据你的要求生成笑话。不过AI自己也谦虚地表示以下源于AI的回答如果“懂”是指像人类那样因为某个笑话会心一笑那 AI 不懂。AI没有情绪没有生活经历不会因为一个段子分泌多巴胺。有点像背下了全世界所有菜谱但自己永远尝不到咸淡的大厨。后语向Deepseek提以下问题的时候笔者脑里浮现了校园时代的画面几个小伙伴异口同声地说出“我有时间也不捡屎”然后一起开怀大笑。值得珍惜从来不是多巧妙的段子而是那些一起笑、一起犯傻的人。
http://www.gsyq.cn/news/1387056.html

相关文章:

  • 告别假死与掉线:实战中稳定维持Metasploit会话的3个关键配置
  • 告别移植烦恼:手把手教你用华为ExaGear在ARM服务器上无缝运行x86老程序
  • 钉钉微应用本地开发避坑指南:路由模式选错、跨域配置漏了?看这篇就够了
  • 如何在Windows电脑上轻松运行安卓应用?APK安装器的完整指南
  • Excel 物流货运记账表模板【万象EXCEL(二十七)】—东方仙盟
  • 别再乱接线了!手把手教你用万用表和逻辑分析仪搞定无刷电机霍尔与绕组的对应关系
  • LabVIEW调用MATLAB脚本总报错?别慌,这2个坑我帮你踩过了(附完整路径配置流程)
  • Python002-第二章01.字面量与变量
  • Kaggle新手必看:除了submission.csv,Windows上提交结果前你该检查的5个细节
  • 栅极驱动器芯片,光耦,数字隔离器芯片主要区别和用途
  • 手机数据恢复工具,找回丢失误删除的图片、视频、音频、通讯录、聊天记录!支持无法开机状态资料提取,跨平台数据管理备份转移,手机系统修复、重装、数据清理等功能!
  • 从OpenGL到Unity Shader:给图形学初学者的渲染管线迁移指南
  • 小程序数据采集(18)- 小程序设备群控与协议态矩阵调度体系搭建
  • AMD Ryzen 7 3800X + VMware 15.1.0 保姆级黑苹果安装避坑指南(macOS Catalina 10.15.5)
  • HarmonyOS 6 Chip 组件:设置 Symbol 类型图标使用文档
  • 【回眸】小红书新手运营实战指南:从账号搭建到权重引流
  • Direct Corpus Interaction (DCI) 论文理念助力Agent发展
  • Linux 网络基础之数据链路层(十四)ARP协议及原理,ARP欺骗
  • 深入理解《Effective Java》 之条目2:当构造器参数较多时考虑使用生成器
  • 从‘公开’到‘私有’:深入理解虚幻蓝图变量权限,打造更健壮的交互逻辑
  • day30_fasttext分类任务
  • OpenGL笔记之光照原理一漫反射
  • 【Linux 系列·第 02 篇】操作系统原理:进程·内存·文件系统·I/O——Linux 怎么工作
  • Maven高级—分模块设计与开发、继承、聚合和私服
  • 从‘虚轴’到‘实轴’:深入解读汇川Inoproshop中CIA402轴的两种工作模式与应用场景
  • Spine动画在Unity里卡顿?性能优化实战:从Draw Call、材质实例化到网格合并
  • 给OpenGL学完就忘的你:用Unity Shader重温渲染管线,打通任督二脉
  • ARM SPE技术:硬件级性能分析与优化实践
  • TVA视觉智能体专栏(五):2026工业视觉行业复盘:低端调参彻底内卷,TVA智能体成工程师高薪破局核心
  • 没有银弹,从来就没有