当前位置: 首页 > news >正文

Large Language Models as Model Organisms for Human Associative Learning

文章核心总结与翻译

一、主要内容

本文将大型语言模型(LLMs)作为人类联想学习的计算模型,通过适配认知神经科学的联想学习范式,探究6个开源LLM在上下文学习(ICL)中的表征动态变化。核心发现包括:LLM的表征变化符合非单调可塑性假说(NMPH),仅在学习巩固阶段呈现U型曲线(中等相似的token对会分化);提出“词汇干扰”概念,即新联想与模型先验知识的竞争会调节表征变化,干扰越强分化越明显;LLM的学习过程分为编码、巩固、遗忘三阶段,且不同模型的遗忘机制存在差异。

二、创新点

  1. 首次将LLM作为“模型有机体”用于人类联想学习研究,解决了生物系统中难以控制变量、采样密集度不足的实验难题。
  2. 验证了NMPH在LLM中的适用性,发现该非单调模式仅存在于巩固阶段,揭示了学习阶段与表征变化的关联。
  3. 提出“词汇干扰”这一可量化的新因素,阐明局部token相似性与全局词汇竞争对表征变化的联合影响。
  4. 系统划分LLM联想学习的三阶段动态,为理解模型记忆重组机制提供了新框架。

三、关键部分翻译(Markdown格式)

Abstract(摘要)

联想学习——即在共现项目间建立关联——是人类认知的基础,会以复杂方式重塑内部表征。在生物系统中测试表征变化如何发生的假说具有挑战性,但大型语言模型(LLMs)提供了一种可扩展的替代方案。基于LLMs的上下文学习能力,我们适配了一种认知神经

http://www.gsyq.cn/news/1631541.html

相关文章:

  • 云数据库无法连通解决
  • 用 Excel / Python 做快消补货周报:从销量、库存、在途生成动作清单
  • v4l2驱动框架——ctrl_handler
  • 小学期第一周学习笔记
  • 2024服务器应急响应实战:病毒木马排查与安全加固全流程
  • Does Model Size Matter? A Comparison of Small and Large Language Models for Requirements Classifi...
  • 品牌食品被指存在异物:三维协同证据体系构建
  • Systemd和Systemctl的关系及相关理解
  • E-Hentai漫画收藏神器:一键打包下载全攻略
  • 如何让产品参与测试/验证
  • Linux:进程信号
  • Pipeline-聚类质心提取
  • devkit-pipeline最佳实践:企业级开发团队的10个经验分享
  • 一人公司技术栈指南:VIbecoding之后,为什么一定要重视 BaaS (后端即服务)
  • 无人机航拍小目标检测系统 无人机监控 无人机安防巡检 无人机交通管理应用
  • Ubuntu 26.04下实现无边框全屏窗口:Wayland与X11的实战指南
  • 5分钟快速上手:E-Hentai漫画下载工具完全指南
  • TRAE Work(工作版)vs Code(编程 / 代码版)完整区别
  • 【YOLOv12多模态融合改进】| TGRS 2025 HFFE分层特征融合编码器 双模态注意力加权 + 跨尺度对齐融合,强化弱小目标多模态特征互补
  • 扣子3.0来了:从“单兵作战“到“AI团队操作系统“,一个300+技能创作者的深度体感
  • ChatGPT Plus 和 Pro 到底怎么选?不要盲目升级
  • Python之struvolpy包语法、参数和实际应用案例
  • 戴森球计划工厂蓝图库:3步打造高效星际工厂的革新性方案
  • LangChain 框架上手难吗,看完这几个实战案例你就懂了
  • 【MATLAB例程|车联网6】考虑调头车流扰动与网联车辆实时感知信息的干线多交叉口 FAC-CV 全感应协调控制仿真与性能对比分析
  • 软件测试入门——第二十课(接口测试基础)
  • 普通人想靠 AI 大模型找工作,这几个简历项目哪个最加分
  • Gemini 转 Word 工具推荐?AI 导出鸭硬核测评,告别格式乱码
  • 【JavaScript 标签(Label)完全指南:语法、使用场景、作用与意义|告别多层循环跳转难题(面试必刷)】
  • dirmap高级Web目录扫描工具:从原理到实战的完整指南