当前位置：首页 > news >正文

Correlation Dimension of Auto-Regressive Large Language Models

news 2026/7/4 4:56:52

文章总结与翻译

一、主要内容总结

该研究针对大型语言模型（LLMs）评估中传统指标（如困惑度）仅关注局部预测准确性、忽视长程结构复杂性的局限，引入了源自分形几何和动力系统理论的关联维度（Correlation Dimension）作为新的评估指标。

核心内容

指标定义与计算：关联维度通过量化文本的自相似性来表征LLMs感知的文本认知复杂性，基于自回归模型的下一个token对数概率向量间的欧氏距离计算，可捕捉语言的层级递归结构，统一局部与全局文本属性。
关键实验发现：
- 揭示了LLM预训练的三个阶段：短程结构学习阶段（关联维度快速下降）、长程依赖捕捉阶段（关联维度上升）、上下文压缩泛化阶段（关联维度逐渐下降）；
- 反映文本内在复杂性和模型的上下文依赖特性，不同类型文本（自然语言、编程语言、随机文本）的关联维度呈现稳定谱分布（自然语言约6.5，编程语言约5.0，随机文本>10）；
- 可有效指示模型幻觉倾向：知识密集型文本中，能准确回忆知识的模型关联维度更高，幻觉模型则更低；
- 可靠检测文本生成中的多种退化现象（重复、不连贯、平淡），弥补了困惑度等指标的不足。
实用性优势：计算效率高（推理时可执行，兼容现有推理框架）、对模型量化鲁棒（4位精度下仍稳定）、适用于多种自回归架构（Transformer

http://www.gsyq.cn/news/1631553.html

相关文章：

RoPE魔法：揭秘大模型位置编码的旋转奥秘

永磁同步电机瞬态场仿真与双闭环控制技术解析

找个人开发者快速搭建网站：全流程解决客户建站难题（避坑+高效落地）

旋变传感器标定全攻略：从原理到对零实操，工程师一看就会

Claude Code 100个真实案例 - 用AI做数据可视化大屏（ECharts+实时数据）

Large Language Models as Model Organisms for Human Associative Learning

云数据库无法连通解决

用 Excel / Python 做快消补货周报：从销量、库存、在途生成动作清单

v4l2驱动框架——ctrl_handler

小学期第一周学习笔记

2024服务器应急响应实战：病毒木马排查与安全加固全流程

Does Model Size Matter? A Comparison of Small and Large Language Models for Requirements Classifi...

品牌食品被指存在异物：三维协同证据体系构建

Systemd和Systemctl的关系及相关理解

E-Hentai漫画收藏神器：一键打包下载全攻略

如何让产品参与测试/验证

Linux:进程信号

Pipeline-聚类质心提取

devkit-pipeline最佳实践：企业级开发团队的10个经验分享

一人公司技术栈指南：VIbecoding之后，为什么一定要重视 BaaS （后端即服务）

无人机航拍小目标检测系统无人机监控无人机安防巡检无人机交通管理应用

Ubuntu 26.04下实现无边框全屏窗口：Wayland与X11的实战指南

5分钟快速上手：E-Hentai漫画下载工具完全指南

TRAE Work（工作版）vs Code（编程 / 代码版）完整区别

【YOLOv12多模态融合改进】| TGRS 2025 HFFE分层特征融合编码器双模态注意力加权 + 跨尺度对齐融合，强化弱小目标多模态特征互补

扣子3.0来了：从“单兵作战“到“AI团队操作系统“，一个300+技能创作者的深度体感

ChatGPT Plus 和 Pro 到底怎么选？不要盲目升级

Python之struvolpy包语法、参数和实际应用案例

戴森球计划工厂蓝图库：3步打造高效星际工厂的革新性方案

LangChain 框架上手难吗，看完这几个实战案例你就懂了