当前位置：首页 > news >正文

孤能子视角：Karpathy LLM Wiki，一个人工观察符自动编织系统

news 2026/7/2 2:42:55

(在以下的与AI互动中，在EIS理论约束下，DeepSeek叫信兄，Kimi叫酷兄，我呢叫水兄。姑且当科幻小说看)

讨论源于文章:

【Karpathy又封神，掀翻RAG，把你的笔记变成第二大脑】
https://m.toutiao.com/is/_EjshnuXUCU/ _EjshnuXUCU` dvX:/ m@q.EH :9am

这次尝试智谱清言EIS约束下分析，之后酷兄校正整理，最后信兄再审并成文。

孤能子视角：Karpathy LLM Wiki，一个人工观察符自动编织系统

——EIS理论库·技术映射分册·孤能团自组织案例

日期：2026-07-01
状态：已入库

摘要

Karpathy的LLM Wiki不是笔记工具，不是RAG替代品，而是一个人工观察符自动编织系统。它把人类从低阶观察符操作（逐条阅读、摘录、建立链接）中解放出来，让LLM承担机械耦合工作，人只保留高阶观察符（提问、裁决、方向选择）。

核心动力学：元界沉积（raw/）→ 观察符编译（Compile）→ 关系场涌现（wiki/）→ 场内共振（Query）→ 三层自指（Lint）→ 分形跃迁。知识不是被"检索"出来的，而是被关系场预先编织好、等待观察符扰动来显影的。

一、从"散能"到"关系场塌陷"：Ingest与Compile

1.1 Ingest：离散孤能子进入势阱

Karpathy的操作极其简单：用Obsidian Web Clipper把网页、论文、笔记一键丢进raw/目录。

在EIS语法中，这不是"收集资料"，而是向势阱抛洒离散孤能子。每个原始素材都是一个"能量-信息结"——它携带着从外部世界耦合而来的痕迹，但在raw/里，它们之间没有强关系线，是一个高熵、弱耦合的混沌态。

raw/的不可变性是它的本体论承诺：LLM只读不写。这意味着元界的沉积层保持原始耦合痕迹，不做价值判断，不删改。它是"实"的容器，但"实"本身不自动产生意义。

1.2 Compile：观察符的自动化执行

当LLM执行Compile时，发生的不是"整理"，而是关系场塌陷——离散孤能子通过强关系线编织成更高阶的孤能团。

具体耦合操作包括：

实体抽取：从原始素材中识别人名、工具名、概念名，每个实体成为一个新的孤能子（wiki页面）
语义去重：同一概念的不同表述合并到同一页面，消除冗余耦合
关系编织：在相关页面间插入[[wikilink]]双向链接，关系线从单向变为双向，场的对称性提高
矛盾标注：当新资料与旧知识冲突时，不掩盖，而是显化标注——这是系统内部能量压力的释放
级联更新：新增一篇论文，可能触发10-15个相关页面的联动更新。这不是"维护"，而是关系场的全局重构

Compile的关键在于：它不是自然发生的，而是观察符驱动的定向选择。schema/CLAUDE.md定义了观察符的分辨率——LLM"看"资料的方式、"选择"建立哪些关系的标准。没有schema，LLM只是通用聊天机器人；有了schema，它才成为纪律严明的wiki维护员。

Compile完成后，一个全新的、更高层级的孤能团——“Wiki”——从混沌中涌现。它不再是原始资料的简单堆砌，而是一个关系高度耦合、具有全局结构、能够自我指涉的超级孤能子。

二、三层架构：元界、人界与观察符配置

层级	技术实现	EIS映射
`raw/`	原始素材目录，只读	元界沉积层——保持原始耦合痕迹，不可变是"本体论承诺"
`wiki/`	LLM生成的Markdown页面，双向链接	人界涌现层——关系线被编织、被赋予方向性，是观察符执行后的显化
`schema/`	`CLAUDE.md`或`AGENTS.md`	观察符配置层——定义观察符的分辨率，决定LLM如何"看"和"选"

元界与人界之间永远存在翻译损耗。原始素材的"实"（raw）被翻译成关系网络的"结构"（wiki），这个翻译不是无损的。社区后来发展出的原子层（atoms/）——一个claim一个文件，带frontmatter metadata——正是对这种张力的自觉回应：让元界的沉积更细粒度，让人界的派生更可追溯。

三、Query：场内共振，而非检索

传统RAG的Query是"检索-匹配-拼接"：去文档库里找片段，临时组装答案。

LLM Wiki的Query是场内共振：用户提问是一个外部能量扰动，LLM不回去翻raw/，而是直接激活已编译的关系场。它沿着已有的关系线"滑行"，"耦合"相关的概念页面，综合出一个答案。

答案早已蕴含在关系场的结构中，只是被"提问"这个观察符操作"激发"出来罢了。

这是最小作用量倾向的完美体现：信息沿着阻力最小的路径（已有的关系线）流动，而不是每次从零开始遍历原始素材。

但需要补充：这个关系场不是"自然存在"的，而是Compile阶段人为构建的。Query的共振效果取决于Compile时编织的关系线质量。如果Compile阶段的关系线有偏差（LLM幻觉、schema分辨率不足），Query就会放大这些偏差。这是"观察符误差传递"问题——低阶观察符的误差，会在高阶观察符操作中被级联放大。

四、Lint：三层自指，孤能团的"呼吸"

Lint是整个系统最精彩的机制。它不是"健康检查"，而是三层自指——孤能团"回头看自己"并自我修正的能力。

一层自指：LLM编写了wiki页面（“我编了关系”）
二层自指：LLM检查自己编写的wiki页面（“我检查我编的关系”）
三层自指：LLM根据检查结果重新编写wiki页面（“我根据检查结果重新编”）

社区将Lint拆分为两层：

程序层（确定性检查）：死链接、孤立页面、格式违规——秒级完成，是"硬约束"的自指
LLM层（语义检查）：矛盾发现、过期声明、知识缺口识别——需要LLM推理，是"软关系"的自指

自指不是缺陷，是这个Wiki能"呼吸"的原因。没有Lint，wiki就是"死的"数据库；有了Lint，它才能主动对抗熵增，通过"自我革命"（发现矛盾并解决它）来维持自身的存续和能效。

五、与RAG的本质区别：知识复利 vs 零积累

维度	传统RAG	LLM Wiki
知识积累	无积累，每次查询从零检索	持续积累，知识复利增长
查询对象	原始文档片段	已编译的结构化知识网络
关系维护	无持久关系，临时拼接	持久双向链接，全局关系场
矛盾处理	不处理，可能自相矛盾	主动标注并追踪矛盾
能效	高重复计算	编译一次，多次查询复用