当前位置: 首页 > news >正文

AI的两种致命短板:不会自己画地图,也不会想“如果当初“

AI的两种致命短板:不会自己画地图,也不会想"如果当初"目前的AI大模型有两个非常隐蔽、但极其致命的问题。第一个是没有"原生探索能力"——你告诉AI去做什么它就做什么,但你如果不告诉它"周围有什么",它也不会主动去探索。第二个是不会因果推理——它知道"A和B经常一起出现",但不知道"如果A没有发生,B还会不会发生"。这两个问题看似独立,但实际上是同一个问题的两面:AI能识别模式,但不会理解世界。一、AI没有"原生探索能力":它不会自己画地图你进入一个陌生城市时,会自然而然地观察路标、记住地形、在脑子里画一张地图。这个过程不需要任何人给你布置任务——它就是你的"原生能力"。但AI没有这个能力。1.1 World Knowledge:让AI学会画地图腾讯AI Lab和港科大2026年5月发表的一篇论文,提出了一个非常直观的概念:World Knowledge(世界知识)——让AI在进入一个新环境时,主动建立一个"心智地图"。有原生探索无原生探索进入新环境自动观察需要人类告诉它"那里有什么"自动建立环境模型每次遇到已知事实都要查资料经验累积式学习每次从零开始逐渐减少问题永远需要全量信息实验数据:一个只有14B参数的模型,在学会了"自己画地图"之后,反杀了Gemini-2.5-Flash(一个参数多10倍以上的模型)。这不是"一个14B模型比大模型聪明",而是:14B模型有了"心智地图",而大模型没有。1.2 心智地图是什么?心智地图不是"记住所有数据",而是一个结构化的环境模型。以Markdown格式为例,一个AI进入"学习Python编程"这个环境时,应该画出来的地图可能是:# Python编程环境心智地图 ## 核心概念 - 变量:存储数据的容器 - 条件:if/elif/else - 循环:for/while - 函数:def定义代码块 ## 关键关系 - 变量必须先赋值再用 - 循环嵌套时内部循环先执行完 - 函数参数按位置或关键字传递 ## 常见路径 - 入门路径:变量→条件→循环→函数→类 - 数据分析路径:NumPy→Pandas→Matplotlib ## 未知区域 - 装饰器:听过但不会用 - 生成器:知道概念但没用过关键特征:这张地图不仅包含"有什么",还包含"和什么有关系"、“怎么学最有效”、“哪里是我不会的”。心智地图要素作用没有它的后果核心概念知道环境中有哪些东西遇到概念就卡住关键关系知道概念之间怎么连接学了一堆孤立知识常见路径知道怎么走最有效走了最绕的路未知区域知道自己不知道什么以为自己全懂了1.3 奖励机制:怎么让AI学会画地图?设计者用了一个非常巧妙的"基于结果的奖励"(Outcome-Based Reward):不是奖励AI"地图画得好不好看",而是奖励AI"有了地图之后,执行任务的分数比没有地图时高多少"。场景无地图得分有地图得分提升复杂数据分析65%83%+18%多步推理54%72%+18%新领域探索37%61
http://www.gsyq.cn/news/1405623.html

相关文章:

  • 突破显存限制:ComfyUI TTP Toolset实现8K超分辨率的终极指南 [特殊字符]
  • 如何快速上手WebGAL:面向创作者的视觉小说引擎完整指南
  • LaWGPT法律大模型实战指南:从零部署到专业应用的完整方案
  • 革命性文本生成模型Llama-3-Instruct-8B-SPPO-Iter3:昇腾处理器完美适配指南
  • Adobe插件安装终极指南:三步搞定.zxp文件,告别复杂操作
  • 3分钟快速上手:Win11Debloat终极Windows系统优化完全指南
  • 跨团队数据库协同难?浅谈多人协作运维的标准化工作流设计
  • Unity 3D模型导入终极指南:GLTFUtility完全配置教程
  • BAAI/bge-small-zh-v1.5与主流框架集成:FlagEmbedding、Sentence-Transformers、Langchain对比教程
  • Fast-GitHub:基于浏览器扩展的GitHub网络优化架构解析
  • 葡萄牙语仇恨言论识别准确率达78%:bertimbau_hate_speech-openmind 模型原理详解
  • 国内热门大理石方尺直销厂家综合实力排行盘点 - 奔跑123
  • 基于FPGA的动态可重构网络拟态加密系统设计与实现
  • Stable Diffusion WebUI预处理实战:5个高效工具提升AI绘画数据质量
  • 15分钟掌握robot_localization:从零开始实现机器人多传感器融合定位
  • 如何在Windows上快速获取专业级curl工具:curl-for-win完整指南
  • 跨平台实战:QGC地面站视频流配置与GStreamer部署全攻略
  • 终极自动化strm文件生成方案:alist-strm让流媒体管理效率提升90%
  • 062N皇后
  • 零代码文本挖掘神器:KH Coder完整指南带你轻松分析多语言内容
  • TranslucentTB 安装指南:让Windows任务栏焕发透明魅力
  • 突破语言壁垒:multilingual-e5-base支持的100种语言及应用场景全览 [特殊字符]
  • OpCore Simplify配置工具:5步快速构建Hackintosh的终极解决方案
  • 技术深度解析:MPC Video Renderer架构设计与HDR渲染实战指南
  • 超高分子量聚乙烯板质量鉴别与合规供应商技术解析 - 奔跑123
  • 离线总有机碳分析仪/TOC分析仪专业选型指南:市场格局、品牌对比与采购核心要点解析 - 品牌推荐大师
  • UPS电源输出端可以接变频器吗?3个致命错误千万别犯
  • 实战演练:从漏洞利用到图形化渗透,详解Getshell后的3389接管全流程
  • 国内大理石构件厂家实力排行:精度与交付维度实测 - 奔跑123
  • 从理论到实战:主流3D激光SLAM算法核心思想与工程实现深度对比