当前位置：首页 > news >正文

AI Berkshire：基于多Agent对抗的价值投资研究框架实战指南

news 2026/7/5 12:47:02

1. 先搞清楚 AI Berkshire 到底解决什么问题，以及它和普通 AI 聊天的区别

如果你用过 Claude 或 ChatGPT 分析股票，大概率会得到一个“一方面……另一方面……”的平衡分析，最后以“投资有风险，请自行判断”收尾。这种回答看起来都对，但没法用来做投资决策，因为它缺乏结构、深度和可执行的结论。

AI Berkshire解决的就是这个问题。它不是一个简单的提示词合集，而是一个基于Claude Code或Codex的、系统化的价值投资研究框架。它的核心价值在于，将巴菲特、芒格、段永平、李录四位投资大师的方法论，结构化地“翻译”成了 AI Agent 可以执行的、可复现的研究流程。

简单说，它让你从“和 AI 聊天”升级到“指挥一个 AI 投研团队”。这个团队内部有分工、有对抗、有校验，最终产出的不是一篇散文，而是一份带有明确结论（通过/不通过/灰色地带）、价格区间和分层建议的投研报告。

最值得关注的点有三个：

强制输出结论，不打太极：普通 AI 会给你模棱两可的分析，AI Berkshire 会强制输出“买/不买/观望”，并给出对应的价格区间和仓位建议。
多 Agent 对抗分析，而非单一视角：不是用一个大师的视角看问题，而是让四个“AI 分析师”（分别代表四位大师）并行研究、互相挑战，最后综合结论。这能有效避免单一视角的盲点。
金融数据严谨性：它内置了 Python 工具来精确计算市值、PE 等关键指标，并进行多源交叉验证，避免了 LLM “心算”常犯的单位混淆、小数点错误等低级但致命的问题。

所以，它适合两类人：一是对价值投资感兴趣，但缺乏系统研究方法的个人投资者；二是希望用 AI 提升研究效率，但苦于现有工具输出质量不稳定的从业者。如果你只是想问“XX股票明天涨不涨”，那它不适合你。它的目标是帮你做深度、可复现的基本面研究。

2. 环境准备与安装：Claude Code 还是 Codex？

在动手安装 AI Berkshire 的技能（Skills）之前，你需要先有一个能运行它的“大脑”，也就是Claude Code或Codex客户端。这是两个不同的东西，选择哪一个取决于你的使用习惯和访问条件。

2.1 客户端选择与安装

Claude Code是 Anthropic 官方推出的命令行 AI 编程助手。它的交互更偏向开发者，在终端里通过自然语言对话来编写、解释和调试代码。AI Berkshire 最初就是为它设计的。

Codex是 OpenAI 推出的一个类似的产品，也是一个命令行 AI 助手。AI Berkshire 也提供了对它的兼容支持。

我的建议是：优先选择你已有账号且网络访问稳定的那个平台。两者的核心功能（运行 AI Berkshire Skills）在体验上大同小异。

安装 Claude Code：

npm install -g @anthropic-ai/claude-code

安装后，在终端输入claude即可启动。首次使用需要配置 API 密钥。

安装 Codex：macOS/Linux 用户通常用 curl 安装：

curl -fsSL https://chatgpt.com/codex/install.sh | sh

或者用 npm：

npm install -g @openai/codex

Windows 用户可以使用 PowerShell 命令安装。安装后，在终端输入codex启动并配置 API 密钥。

验证安装：安装完成后，在终端运行claude --version或codex --version，能正常输出版本号就说明基础环境 OK。

2.2 一个重要设置：关于工具调用权限

当你运行 AI Berkshire 的 Skills 时，它们会频繁调用网络搜索、文件读写、Python 计算等工具。Claude Code 默认会对每一次工具调用都进行交互式确认，这会严重打断研究流程。

如果你在可信的环境（比如你自己的电脑）中使用，并且信任 AI Berkshire 的代码，可以启动跳过权限确认模式来获得流畅体验：

claude --dangerously-skip-permissions

注意：这个命令会关闭 Claude Code 的工具审批保护机制。请确保你理解并信任你将要运行的命令和工作目录。Codex 通常没有这么严格的权限确认，流程会更顺畅一些。

2.3 安装 AI Berkshire Skills

这是核心步骤。Skills 就是 AI Berkshire 框架提供的各种研究“技能包”，比如深度研究、财报分析、行业筛选等。

克隆仓库：首先把项目代码拉到本地。

git clone https://github.com/xbtlin/ai-berkshire.git cd ai-berkshire

根据你的客户端安装 Skills：
- 如果你是 Claude Code 用户：
```
./scripts/install-claude-commands.sh
```
  这个脚本会把 Skills 复制到 Claude Code 的全局命令目录。安装后，在 Claude Code 会话中直接输入/就能看到所有可用的命令，比如/investment-research。
- 如果你是 Codex 用户：
```
./scripts/install-codex-skills.sh
```
  这个脚本会把 Skills 安装到~/.codex/skills目录。安装后，需要重启你的 Codex 客户端，新的 Skills 才会生效。（可选）如果你希望获得类似 Claude Code 那种以/开头的快捷体验，可以再运行：
```
./scripts/install-codex-prompts.sh
```
  这会在 Codex 的/菜单里添加一些自定义提示词。

安装完成后，你的 AI 助手就“装备”上了这套价值投资研究框架。接下来就是实际使用了。

3. 核心技能实战：从单公司研究到行业筛选

AI Berkshire 提供了 18 个 Skills，覆盖深度研究、财报分析、行业筛选、持仓管理和思维工具。不要一上来就全部尝试，我建议从最核心、最能体现其价值的几个开始。

3.1 单公司深度研究：`/investment-research`

这是最基础的技能，用于对一家上市公司进行全方位的深度分析。它会按七个模块顺序执行：数据收集、生意本质分析（段永平视角）、护城河分析（巴菲特视角）、逆向思考（芒格视角）、管理层评估、文明趋势（李录视角），最后是估值与安全边际。

如何使用：在 Claude Code 中，直接输入：

/investment-research 腾讯

或者，在 Codex 中（如果安装了 prompts）输入：

/prompts:investment-research 腾讯

如果没装 prompts，就在 Codex 里用自然语言描述任务，比如：“使用 investment-research 技能研究腾讯”。

你会得到什么？一份结构化的报告，而不是一段聊天记录。报告末尾会有一个“综合决策备忘录”表格，对生意质量、护城河、管理层、风险、趋势、估值六个维度进行五星评分，并给出综合结论和投资建议。

关键价值点：

信息丰富度评级：报告开头会对研究标的的信息透明度评级（A/B/C），防止你被“资料多=确定性高”的幻觉欺骗。比如研究一家数据很少的初创公司，它会明确告诉你这是 C 级信息，结论置信度较低。
镜子测试：这是巴菲特和段永平都强调的原则。报告会要求你用 5 句话向自己解释为什么买。如果说不清楚，就直接否决。AI 会帮你生成这个“镜子测试”陈述。
三情景估值：不是给一个单一目标价，而是给出乐观、中性、悲观三种情景下的估值区间，让你对安全边际有更立体的认识。

3.2 多 Agent 团队研究：`/investment-team`

这是 AI Berkshire 的精华。它不再是单个 AI 思考，而是同时启动4 个独立的 AI Agent，分别从商业模式（段永平）、财务估值（巴菲特）、行业竞争（芒格）、风险与管理层（李录）四个视角并行研究同一家公司。

如何使用：

/investment-team 美团

与单技能研究的区别：

深度和广度倍增：四个 Agent 会各自进行网络搜索、数据验证，相当于四个分析师同时工作，信息覆盖更全。
视角对抗：最终报告会清晰展示四个视角的评分和核心判断。你可能会看到“巴菲特视角”认为估值很便宜（4.4/5），但“李录视角”认为长期确定性不足（2.0/5）。这种冲突恰恰是真实投资决策中需要权衡的地方，单一 AI 分析很难产生这种张力。
效率：虽然消耗的 Token 更多，但因为是并行，总时间可能比你自己一个个问题问要短，且结论更结构化。

输出示例：报告会汇总四个 Agent 的发现，给出一句话结论、四维评分总表，以及针对激进、稳健、保守不同策略的具体操作建议和价格区间。这才是能直接指导操作的分析。

3.3 快速筛查：`/investment-checklist`

当你面对一堆公司，想快速判断哪家值得深入时，就用这个。它模拟巴菲特买入前的六层筛选漏斗：

能力圈（我能理解吗？）
好生意（经济特征如何？）
护城河（竞争优势深不深？）
管理层（值得信任吗？）
安全边际（价格便宜吗？）
决策纪律（是理性还是 FOMO？）

如何使用（支持多公司对比）：

/investment-checklist 腾讯, 阿里巴巴, 美团, 拼多多

它的优势：

速度快：10分钟左右就能对多家公司完成初筛。
结论明确：每家公司都会有一个明确的“通过”、“有条件通过”或“不通过”的结论，并附上在每一关的简要评价。
强制纪律：它内置了“快速否决清单”，比如管理层诚信有污点、业务模式无法理解等，触线即一票否决，避免在烂生意上浪费时间。

3.4 行业漏斗筛选：`/industry-funnel`

当你对一个行业感兴趣（比如“AI算力”、“新能源车”），但不知道具体该看哪几家公司时，这个技能非常有用。它执行一个逐层收敛的筛选流程：

全市场扫描：抓取该主题下活跃度、涨幅、市值靠前的公司（约30-60家）。
价值投资硬指标粗筛：用5条核心价值指标（如ROE、毛利率、负债率等）过滤，剩下≤10家。
精细分析：对剩下的公司进行简要分析（300-500字）。
终选3家：不是简单按分数排名，而是按“组合互补性”选出3家（例如：一家高确定性龙头、一家中等弹性选手、一家高弹性黑马）。
输出推荐组合：给出核心、卫星、期权的仓位建议。

如何使用：

/industry-funnel AI算力

与/industry-research的区别：

industry-research更像一份行业全景图，按产业链上下游切片，分析每个环节的机遇。
industry-funnel更像一个“选股漏斗”，目标是从茫茫股海中，帮你聚焦到最值得深入研究的少数几只个股上。它的输出更直接，就是“买哪几个”以及“为什么是它们”。

4. 让研究落地：数据严谨、流程可复现与实战边界

AI 做金融研究，最怕两件事：一是数据算错，二是每次输出都不一样、无法比较。AI Berkshire 在这两点上做了大量工程化工作。

4.1 金融数据严谨性工具

LLM 不擅长精确计算。让它算 PE，它可能把港币和人民币单位搞混，或者小数点位错一位。AI Berkshire 的解决方案是：关键计算全部交给 Python 工具。

项目里有一个tools/financial_rigor.py脚本，专门处理这类问题。例如，进行市值验算：

python3 tools/financial_rigor.py verify-market-cap \ --price 510 \ --shares 9.11e9 \ --reported 4.65e12 \ --currency HKD

这个命令会用“股价 × 总股本”重新计算市值，并与报告中的市值对比，如果偏差超过阈值就会告警。所有计算都使用 Python 的decimal.Decimal进行精确十进制运算，避免浮点数误差。

在 Skills 执行过程中，这些工具会被自动调用，对获取到的财务数据进行交叉验证。这意味着，你最终报告里的估值数字，不是 AI “随口一说”，而是经过程序校验的。这是从“聊天”走向“研究”的关键一步。

4.2 可复现的研究流程

直接问 AI“分析一下腾讯”，今天它可能重点讲游戏，明天可能重点讲金融科技，输出格式和深度都不稳定。这导致你无法进行横向公司对比，也无法跟踪同一家公司随时间的变化。

AI Berkshire 的每一个 Skill 都是一个标准化的研究流程。只要输入公司名和必要的参数（如财报期），输出的报告结构、分析维度、评分标准都是完全一致的。

这带来了两个巨大好处：

横向可比：你可以用/investment-checklist一次性分析 7 家公司，得到的评分表格是同一套标准下的结果，可以直接对比茅台、腾讯、英伟达的优劣。
纵向可追踪：半年后，你用同样的 Skill 再次分析腾讯，得到的新报告可以直接和半年前的对比，清晰地看到哪些维度发生了变化（例如护城河评分下降、估值区间上移等）。

4.3 实战中的边界与注意事项

虽然框架强大，但把它用好的关键，在于理解它的边界。

第一，它不是预测股价的“水晶球”。它的核心是基本面研究和决策纪律。它帮你搞清楚一家公司是不是好生意、有没有护城河、价格便不便宜、风险在哪里。至于明天股价涨还是跌，它不回答，也回答不了。那些展示的实盘收益，是方法论在特定市场环境下的结果，不代表未来。

第二，Garbage in, garbage out（垃圾进，垃圾出）。AI 的分析质量极度依赖输入信息的质量。虽然 Skills 会主动进行网络搜索，但对于一些冷门、非公开或高度专业的信息，AI 可能找不到或理解有偏差。对于关键数据（尤其是未上市公司的数据），你需要保持警惕，最好能手动进行二次核实。

第三，它消耗的 Token 不少，尤其是多 Agent 任务。一次完整的/investment-team分析，因为涉及多个 Agent 并行搜索和长文输出，Token 消耗可能是普通对话的数十倍。请确保你的 API 配额和预算充足。对于初步筛查，可以先用/investment-checklist这种轻量级技能。

第四，最终决策权在你。AI Berkshire 提供了结构化的分析、多维度的评分和明确的建议，但它只是一个“超级研究员”。是否采纳、何时买入、买多少，这些真正的投资决策必须由你自己做出，并为你自己的资金负责。框架里反复强调的“镜子测试”，就是让你自己把逻辑想通。

第五，关于“安装失败”或“Skill 不生效”。90% 的问题出在环境上。

Claude Code 用户：确保用--dangerously-skip-permissions模式启动，否则每一步工具调用都要你手动确认。
Codex 用户：安装 Skills 后，一定要重启 Codex 客户端。Codex 是在启动时加载 Skills 目录的。
路径问题：安装脚本假设你的~/.codex或 Claude Code 命令目录是标准的。如果自定义过，可能需要手动调整脚本或复制文件。
网络问题：Skills 会调用网络搜索，请确保你的 API 有网络搜索权限，且网络连接通畅。

5. 从使用到理解：设计理念与高级应用

当你熟练使用几个核心 Skill 后，可以更进一步，去理解它背后的设计理念，甚至进行一些自定义，让它更贴合你的需求。

5.1 四大师方法论是如何融合与对抗的？

AI Berkshire 不是把四位大师的观点简单并列。它的设计精髓在于制造有益的思维冲突。

段永平（商业模式）问：“这是不是一门好生意？用户是不是真的需要它？”
巴菲特（护城河与估值）问：“它的竞争优势够不够深、够不够久？现在价格够不够便宜？”
芒格（逆向思考）问：“反过来想，这家公司可能会怎么死？我们在哪些地方可能错了？”
李录（文明趋势）问：“它所在的行业，是处于一个长期的上升通道，还是可能被新技术颠覆？”

当你运行/investment-team时，这四个“AI 分析师”会各自带着这些问题去研究。最终的报告会呈现他们各自的答案和评分。可能巴菲特给了高分（因为便宜），但李录给了低分（因为长期不确定性高）。这种冲突不是 Bug，而是Feature。它强迫你思考不同维度的权衡，而不是得到一个和稀泥的“整体看好”结论。

5.2 如何利用框架进行持仓管理和事件跟踪？

除了研究新公司，AI Berkshire 对已有持仓的管理也提供了工具。

/portfolio-review（组合管理与优化）：输入你的持仓比例（如“腾讯30%，美团20%，茅台20%，现金30%”），它会分析你的组合集中度、行业分布、整体估值，并给出再平衡建议。帮你从“研究单个公司”上升到“管理一个投资组合”的层面。
/thesis-tracker（投资论文追踪）：买入一家公司时，你必然有一个“投资逻辑”（例如：看好其云业务增长）。这个 Skill 帮你定期（比如每季度）回顾这个逻辑是否依然成立，有没有被证伪的迹象。这是对抗“禀赋效应”（因为持有而爱上它）和“确认偏误”（只找支持自己的信息）的纪律工具。
/news-pulse（股价异动快速归因）：当持仓股票突然大涨或大跌时，人容易恐慌或兴奋。这个 Skill 能在 10-15 分钟内，快速扫描公司事件、行业政策、市场情绪等信息，判断这次波动主要是由“价值事件”、“情绪波动”还是“原因不明”驱动的，并给出“是否需要深度研究”或“仅观察”的行动建议。避免你因为一篇小作文就匆忙操作。

5.3 自定义与扩展的可能性

AI Berkshire 的 Skills 本质上是结构化的提示词（Prompt）和工具调用流程。它的代码和 Skill 源文件（在skills/目录下）是开放的。

如果你对某个大师的方法论有特别深的理解，或者你想加入自己的筛选指标（比如你对现金流有特殊要求），你可以去修改对应的 Skill 文件。例如，在/investment-checklist里加入你自己的“第七关”。

更高级的用法，是参考它的多 Agent 协作框架，构建你自己的研究流程。比如，你可以创建一个专注于“科技股成长性分析”的团队，里面的 Agent 分别负责分析 TAM（总可寻址市场）、竞争格局、研发效率和估值模型。

最后，也是最重要的提醒：这个框架是一个强大的“思维脚手架”和“研究助理”，它能极大提升你获取信息、处理信息、结构化思考的效率。但它不能替代你的独立判断和持续学习。真正的价值投资，功夫在诗外，在于你对商业的深刻理解、对人性的洞察以及对自己的控制。AI Berkshire 帮你把“研究”这部分做得更扎实、更纪律严明，而最终的“决策”和“等待”，依然是你自己的修行。

查看全文

http://www.gsyq.cn/news/1640227.html