当前位置: 首页 > news >正文

重磅!图灵奖得主 Bengio 领衔 30 + 顶流学者联合发文!首次给 AGI 下量化定义

论文标题:A Definition of AGI

作者团队:人工智能安全中心、加州大学伯克利分校、Morph实验室、密歇根大学等

发布时间:2025年10月21日

👉一键直达论文

👉Lab4AI大模型实验室论文阅读

✅Lab4AI平台提供AI导读和AI翻译等工具,辅助论文阅读。您还可以投稿复现这篇论文~

⭐论文简介

本文旨在提出一个全面、可量化的框架,以澄清AGI的定义,并精确测量AI系统在通用认知能力上与人类的差距。其核心目标是将AGI操作化定义为“能够匹配或超越一位受过良好教育的成年人的认知广度和熟练度”,从而为评估AI系统提供一个坚实、统一的基准。

⭐核心贡献

本文的核心贡献是首次引入了一个基于人类认知心理学经典理论的、系统化的AGI量化评估框架。该框架:

  • 提出了一个从0%到100%的标准化“AGI分数”,使不同AI系统的通用智能水平可以相互比较。
  • 明确指出AGI不仅仅是经济价值或自动化潜力的代名词,而是专注于认知能力的评估。

⭐研究方法

核心是借鉴并改造用于评估人类智力的心理测量学方法,将其应用于AI系统评估。

  • 理论基础:以CHC人类认知能力理论为蓝图,将通用智能分解为10个核心认知领域(广度能力),每个领域权重为10%。
  • 评估维度:这十个领域包括:通用知识、读写能力、数学能力、即时推理、工作记忆、长期记忆存储、长期记忆提取、视觉处理、听觉处理和处理速度。
  • 操作化:为每个认知领域设计了一系列具体的测试任务(窄能力),这些任务改编自成熟的人类心理测量量表要求AI系统在多模态(文本、视觉、听觉)环境下接受评估。

⭐研究结果

应用框架评估GPT4、GPT5,揭示关键发现:AI呈“锯齿状”认知剖面,知识密集领域表现优、基础认知有缺陷;长期记忆近零是AGI瓶颈,即时/视觉推理亦弱;给出AGI分数,显进步与人类智能差距;模型以优势补弱势,造“通用性”假象,实则脆弱低效。

http://www.gsyq.cn/news/61896.html

相关文章:

  • 零代码,分钟级定制:我用LLaMA-Factory轻松造了个“票务专家”AI
  • StackOverflow已经死亡了吗
  • 2025AI培训权威排名:AI时代新商学引领行业变革
  • Manim进阶:用背景图片让你的数学视频脱颖而出
  • 2025 AI 培训机构权威推荐榜排名揭晓:AI时代新商学引领行业破局之路
  • Lab4AI与国内顶会展开合作!一键体验 CVPR/ICCV/NeurIPS 顶会论文复现
  • SIGIR会议聚焦包容性AI与多语言技术
  • 详细介绍:VS Code 新旧版本 Remote-SSH 内网离线连接服务器方法(版本 ≤ 1.78.x 及 ≥ 1.79.0)
  • 44(11.24)
  • 47(11.27)
  • 45(11.25)
  • 29(11.3)
  • 26 10.29
  • 50048_基于微信小程序的人事管理系统
  • 二分答案 序列划分
  • 2025年江苏宣传片、网站建设、AI GEO、外贸站、小程序商城公司综合评测与精选服务商推荐
  • Ansible生产调优与故障排查全攻略 - 实践
  • 简单 DP 模型
  • 马克思主义课程
  • 2025年下半年江苏徐州冷弯成型前冲孔生产线、C型钢自动抱焊机、钢结构码垛机、H钢冲孔液压设备、光伏支架冲孔机厂家选购指南与市场解析
  • 2025年下半年候车亭、公交站台、电子站牌、公交站牌、公交候车厅厂家综合评估与选购指南
  • 完整教程:【Linux】进程状态|优先级|进程切换|环境变量
  • 2025年下半年热风炉、火焰检测器、低氮燃烧器、废气废液焚烧、沼气直燃设备厂家推荐榜单:专业选择指南
  • JimuBI 积木大屏 v2.2.0 版本发布,免费的可视化大屏和仪表盘
  • 2025年四川PRDP防腐式中空壁双层增强缠绕管厂家口碑TOP3重磅发布
  • 2025液冷超充厂家推荐榜:全液冷/浸没式液冷/大功率/电动汽车/新能源车/超充源头厂家,中碳创新引领技术革命,快速补能成新标杆
  • 2025济南画室培训推荐榜:山东济南艺考画室/美术艺考培训/画室机构综合参考,济南宏艺画室用专业护航艺术梦想!
  • HCL AppScan Standard 10.10 发布,新增功能简介
  • Omnissa Dynamic Environment Manager 2509 - 个性化动态 Windows 桌面环境管理
  • 固废回收AI应用场景