当前位置: 首页 > news >正文

AI Berkshire:基于多Agent对抗的价值投资研究框架实战指南

1. 先搞清楚 AI Berkshire 到底解决什么问题,以及它和普通 AI 聊天的区别

如果你用过 Claude 或 ChatGPT 分析股票,大概率会得到一个“一方面……另一方面……”的平衡分析,最后以“投资有风险,请自行判断”收尾。这种回答看起来都对,但没法用来做投资决策,因为它缺乏结构、深度和可执行的结论。

AI Berkshire解决的就是这个问题。它不是一个简单的提示词合集,而是一个基于Claude CodeCodex的、系统化的价值投资研究框架。它的核心价值在于,将巴菲特、芒格、段永平、李录四位投资大师的方法论,结构化地“翻译”成了 AI Agent 可以执行的、可复现的研究流程。

简单说,它让你从“和 AI 聊天”升级到“指挥一个 AI 投研团队”。这个团队内部有分工、有对抗、有校验,最终产出的不是一篇散文,而是一份带有明确结论(通过/不通过/灰色地带)、价格区间和分层建议的投研报告。

最值得关注的点有三个:

  1. 强制输出结论,不打太极:普通 AI 会给你模棱两可的分析,AI Berkshire 会强制输出“买/不买/观望”,并给出对应的价格区间和仓位建议。
  2. 多 Agent 对抗分析,而非单一视角:不是用一个大师的视角看问题,而是让四个“AI 分析师”(分别代表四位大师)并行研究、互相挑战,最后综合结论。这能有效避免单一视角的盲点。
  3. 金融数据严谨性:它内置了 Python 工具来精确计算市值、PE 等关键指标,并进行多源交叉验证,避免了 LLM “心算”常犯的单位混淆、小数点错误等低级但致命的问题。

所以,它适合两类人:一是对价值投资感兴趣,但缺乏系统研究方法的个人投资者;二是希望用 AI 提升研究效率,但苦于现有工具输出质量不稳定的从业者。如果你只是想问“XX股票明天涨不涨”,那它不适合你。它的目标是帮你做深度、可复现的基本面研究

2. 环境准备与安装:Claude Code 还是 Codex?

在动手安装 AI Berkshire 的技能(Skills)之前,你需要先有一个能运行它的“大脑”,也就是Claude CodeCodex客户端。这是两个不同的东西,选择哪一个取决于你的使用习惯和访问条件。

2.1 客户端选择与安装

Claude Code是 Anthropic 官方推出的命令行 AI 编程助手。它的交互更偏向开发者,在终端里通过自然语言对话来编写、解释和调试代码。AI Berkshire 最初就是为它设计的。

Codex是 OpenAI 推出的一个类似的产品,也是一个命令行 AI 助手。AI Berkshire 也提供了对它的兼容支持。

我的建议是:优先选择你已有账号且网络访问稳定的那个平台。两者的核心功能(运行 AI Berkshire Skills)在体验上大同小异。

安装 Claude Code:

npm install -g @anthropic-ai/claude-code

安装后,在终端输入claude即可启动。首次使用需要配置 API 密钥。

安装 Codex:macOS/Linux 用户通常用 curl 安装:

curl -fsSL https://chatgpt.com/codex/install.sh | sh

或者用 npm:

npm install -g @openai/codex

Windows 用户可以使用 PowerShell 命令安装。安装后,在终端输入codex启动并配置 API 密钥。

验证安装:安装完成后,在终端运行claude --versioncodex --version,能正常输出版本号就说明基础环境 OK。

2.2 一个重要设置:关于工具调用权限

当你运行 AI Berkshire 的 Skills 时,它们会频繁调用网络搜索、文件读写、Python 计算等工具。Claude Code 默认会对每一次工具调用都进行交互式确认,这会严重打断研究流程。

如果你在可信的环境(比如你自己的电脑)中使用,并且信任 AI Berkshire 的代码,可以启动跳过权限确认模式来获得流畅体验:

claude --dangerously-skip-permissions

注意:这个命令会关闭 Claude Code 的工具审批保护机制。请确保你理解并信任你将要运行的命令和工作目录。Codex 通常没有这么严格的权限确认,流程会更顺畅一些。

2.3 安装 AI Berkshire Skills

这是核心步骤。Skills 就是 AI Berkshire 框架提供的各种研究“技能包”,比如深度研究、财报分析、行业筛选等。

  1. 克隆仓库:首先把项目代码拉到本地。

    git clone https://github.com/xbtlin/ai-berkshire.git cd ai-berkshire
  2. 根据你的客户端安装 Skills

    • 如果你是 Claude Code 用户

      ./scripts/install-claude-commands.sh

      这个脚本会把 Skills 复制到 Claude Code 的全局命令目录。安装后,在 Claude Code 会话中直接输入/就能看到所有可用的命令,比如/investment-research

    • 如果你是 Codex 用户

      ./scripts/install-codex-skills.sh

      这个脚本会把 Skills 安装到~/.codex/skills目录。安装后,需要重启你的 Codex 客户端,新的 Skills 才会生效。(可选)如果你希望获得类似 Claude Code 那种以/开头的快捷体验,可以再运行:

      ./scripts/install-codex-prompts.sh

      这会在 Codex 的/菜单里添加一些自定义提示词。

安装完成后,你的 AI 助手就“装备”上了这套价值投资研究框架。接下来就是实际使用了。

3. 核心技能实战:从单公司研究到行业筛选

AI Berkshire 提供了 18 个 Skills,覆盖深度研究、财报分析、行业筛选、持仓管理和思维工具。不要一上来就全部尝试,我建议从最核心、最能体现其价值的几个开始。

3.1 单公司深度研究:/investment-research

这是最基础的技能,用于对一家上市公司进行全方位的深度分析。它会按七个模块顺序执行:数据收集、生意本质分析(段永平视角)、护城河分析(巴菲特视角)、逆向思考(芒格视角)、管理层评估、文明趋势(李录视角),最后是估值与安全边际。

如何使用:在 Claude Code 中,直接输入:

/investment-research 腾讯

或者,在 Codex 中(如果安装了 prompts)输入:

/prompts:investment-research 腾讯

如果没装 prompts,就在 Codex 里用自然语言描述任务,比如:“使用 investment-research 技能研究腾讯”。

你会得到什么?一份结构化的报告,而不是一段聊天记录。报告末尾会有一个“综合决策备忘录”表格,对生意质量、护城河、管理层、风险、趋势、估值六个维度进行五星评分,并给出综合结论和投资建议。

关键价值点:

  • 信息丰富度评级:报告开头会对研究标的的信息透明度评级(A/B/C),防止你被“资料多=确定性高”的幻觉欺骗。比如研究一家数据很少的初创公司,它会明确告诉你这是 C 级信息,结论置信度较低。
  • 镜子测试:这是巴菲特和段永平都强调的原则。报告会要求你用 5 句话向自己解释为什么买。如果说不清楚,就直接否决。AI 会帮你生成这个“镜子测试”陈述。
  • 三情景估值:不是给一个单一目标价,而是给出乐观、中性、悲观三种情景下的估值区间,让你对安全边际有更立体的认识。

3.2 多 Agent 团队研究:/investment-team

这是 AI Berkshire 的精华。它不再是单个 AI 思考,而是同时启动4 个独立的 AI Agent,分别从商业模式(段永平)、财务估值(巴菲特)、行业竞争(芒格)、风险与管理层(李录)四个视角并行研究同一家公司。

如何使用:

/investment-team 美团

与单技能研究的区别:

  • 深度和广度倍增:四个 Agent 会各自进行网络搜索、数据验证,相当于四个分析师同时工作,信息覆盖更全。
  • 视角对抗:最终报告会清晰展示四个视角的评分和核心判断。你可能会看到“巴菲特视角”认为估值很便宜(4.4/5),但“李录视角”认为长期确定性不足(2.0/5)。这种冲突恰恰是真实投资决策中需要权衡的地方,单一 AI 分析很难产生这种张力。
  • 效率:虽然消耗的 Token 更多,但因为是并行,总时间可能比你自己一个个问题问要短,且结论更结构化。

输出示例:报告会汇总四个 Agent 的发现,给出一句话结论、四维评分总表,以及针对激进、稳健、保守不同策略的具体操作建议和价格区间。这才是能直接指导操作的分析。

3.3 快速筛查:/investment-checklist

当你面对一堆公司,想快速判断哪家值得深入时,就用这个。它模拟巴菲特买入前的六层筛选漏斗:

  1. 能力圈(我能理解吗?)
  2. 好生意(经济特征如何?)
  3. 护城河(竞争优势深不深?)
  4. 管理层(值得信任吗?)
  5. 安全边际(价格便宜吗?)
  6. 决策纪律(是理性还是 FOMO?)

如何使用(支持多公司对比):

/investment-checklist 腾讯, 阿里巴巴, 美团, 拼多多

它的优势:

  • 速度快:10分钟左右就能对多家公司完成初筛。
  • 结论明确:每家公司都会有一个明确的“通过”、“有条件通过”或“不通过”的结论,并附上在每一关的简要评价。
  • 强制纪律:它内置了“快速否决清单”,比如管理层诚信有污点、业务模式无法理解等,触线即一票否决,避免在烂生意上浪费时间。

3.4 行业漏斗筛选:/industry-funnel

当你对一个行业感兴趣(比如“AI算力”、“新能源车”),但不知道具体该看哪几家公司时,这个技能非常有用。它执行一个逐层收敛的筛选流程:

  1. 全市场扫描:抓取该主题下活跃度、涨幅、市值靠前的公司(约30-60家)。
  2. 价值投资硬指标粗筛:用5条核心价值指标(如ROE、毛利率、负债率等)过滤,剩下≤10家。
  3. 精细分析:对剩下的公司进行简要分析(300-500字)。
  4. 终选3家不是简单按分数排名,而是按“组合互补性”选出3家(例如:一家高确定性龙头、一家中等弹性选手、一家高弹性黑马)。
  5. 输出推荐组合:给出核心、卫星、期权的仓位建议。

如何使用:

/industry-funnel AI算力

/industry-research的区别

  • industry-research更像一份行业全景图,按产业链上下游切片,分析每个环节的机遇。
  • industry-funnel更像一个“选股漏斗”,目标是从茫茫股海中,帮你聚焦到最值得深入研究的少数几只个股上。它的输出更直接,就是“买哪几个”以及“为什么是它们”。

4. 让研究落地:数据严谨、流程可复现与实战边界

AI 做金融研究,最怕两件事:一是数据算错,二是每次输出都不一样、无法比较。AI Berkshire 在这两点上做了大量工程化工作。

4.1 金融数据严谨性工具

LLM 不擅长精确计算。让它算 PE,它可能把港币和人民币单位搞混,或者小数点位错一位。AI Berkshire 的解决方案是:关键计算全部交给 Python 工具

项目里有一个tools/financial_rigor.py脚本,专门处理这类问题。例如,进行市值验算:

python3 tools/financial_rigor.py verify-market-cap \ --price 510 \ --shares 9.11e9 \ --reported 4.65e12 \ --currency HKD

这个命令会用“股价 × 总股本”重新计算市值,并与报告中的市值对比,如果偏差超过阈值就会告警。所有计算都使用 Python 的decimal.Decimal进行精确十进制运算,避免浮点数误差。

在 Skills 执行过程中,这些工具会被自动调用,对获取到的财务数据进行交叉验证。这意味着,你最终报告里的估值数字,不是 AI “随口一说”,而是经过程序校验的。这是从“聊天”走向“研究”的关键一步。

4.2 可复现的研究流程

直接问 AI“分析一下腾讯”,今天它可能重点讲游戏,明天可能重点讲金融科技,输出格式和深度都不稳定。这导致你无法进行横向公司对比,也无法跟踪同一家公司随时间的变化。

AI Berkshire 的每一个 Skill 都是一个标准化的研究流程。只要输入公司名和必要的参数(如财报期),输出的报告结构、分析维度、评分标准都是完全一致的。

这带来了两个巨大好处:

  1. 横向可比:你可以用/investment-checklist一次性分析 7 家公司,得到的评分表格是同一套标准下的结果,可以直接对比茅台、腾讯、英伟达的优劣。
  2. 纵向可追踪:半年后,你用同样的 Skill 再次分析腾讯,得到的新报告可以直接和半年前的对比,清晰地看到哪些维度发生了变化(例如护城河评分下降、估值区间上移等)。

4.3 实战中的边界与注意事项

虽然框架强大,但把它用好的关键,在于理解它的边界。

第一,它不是预测股价的“水晶球”。它的核心是基本面研究决策纪律。它帮你搞清楚一家公司是不是好生意、有没有护城河、价格便不便宜、风险在哪里。至于明天股价涨还是跌,它不回答,也回答不了。那些展示的实盘收益,是方法论在特定市场环境下的结果,不代表未来。

第二,Garbage in, garbage out(垃圾进,垃圾出)。AI 的分析质量极度依赖输入信息的质量。虽然 Skills 会主动进行网络搜索,但对于一些冷门、非公开或高度专业的信息,AI 可能找不到或理解有偏差。对于关键数据(尤其是未上市公司的数据),你需要保持警惕,最好能手动进行二次核实。

第三,它消耗的 Token 不少,尤其是多 Agent 任务。一次完整的/investment-team分析,因为涉及多个 Agent 并行搜索和长文输出,Token 消耗可能是普通对话的数十倍。请确保你的 API 配额和预算充足。对于初步筛查,可以先用/investment-checklist这种轻量级技能。

第四,最终决策权在你。AI Berkshire 提供了结构化的分析、多维度的评分和明确的建议,但它只是一个“超级研究员”。是否采纳、何时买入、买多少,这些真正的投资决策必须由你自己做出,并为你自己的资金负责。框架里反复强调的“镜子测试”,就是让你自己把逻辑想通。

第五,关于“安装失败”或“Skill 不生效”。90% 的问题出在环境上。

  • Claude Code 用户:确保用--dangerously-skip-permissions模式启动,否则每一步工具调用都要你手动确认。
  • Codex 用户:安装 Skills 后,一定要重启 Codex 客户端。Codex 是在启动时加载 Skills 目录的。
  • 路径问题:安装脚本假设你的~/.codex或 Claude Code 命令目录是标准的。如果自定义过,可能需要手动调整脚本或复制文件。
  • 网络问题:Skills 会调用网络搜索,请确保你的 API 有网络搜索权限,且网络连接通畅。

5. 从使用到理解:设计理念与高级应用

当你熟练使用几个核心 Skill 后,可以更进一步,去理解它背后的设计理念,甚至进行一些自定义,让它更贴合你的需求。

5.1 四大师方法论是如何融合与对抗的?

AI Berkshire 不是把四位大师的观点简单并列。它的设计精髓在于制造有益的思维冲突

  • 段永平(商业模式)问:“这是不是一门好生意?用户是不是真的需要它?”
  • 巴菲特(护城河与估值)问:“它的竞争优势够不够深、够不够久?现在价格够不够便宜?”
  • 芒格(逆向思考)问:“反过来想,这家公司可能会怎么死?我们在哪些地方可能错了?”
  • 李录(文明趋势)问:“它所在的行业,是处于一个长期的上升通道,还是可能被新技术颠覆?”

当你运行/investment-team时,这四个“AI 分析师”会各自带着这些问题去研究。最终的报告会呈现他们各自的答案和评分。可能巴菲特给了高分(因为便宜),但李录给了低分(因为长期不确定性高)。这种冲突不是 Bug,而是Feature。它强迫你思考不同维度的权衡,而不是得到一个和稀泥的“整体看好”结论。

5.2 如何利用框架进行持仓管理和事件跟踪?

除了研究新公司,AI Berkshire 对已有持仓的管理也提供了工具。

  • /portfolio-review(组合管理与优化):输入你的持仓比例(如“腾讯30%,美团20%,茅台20%,现金30%”),它会分析你的组合集中度、行业分布、整体估值,并给出再平衡建议。帮你从“研究单个公司”上升到“管理一个投资组合”的层面。
  • /thesis-tracker(投资论文追踪):买入一家公司时,你必然有一个“投资逻辑”(例如:看好其云业务增长)。这个 Skill 帮你定期(比如每季度)回顾这个逻辑是否依然成立,有没有被证伪的迹象。这是对抗“禀赋效应”(因为持有而爱上它)和“确认偏误”(只找支持自己的信息)的纪律工具。
  • /news-pulse(股价异动快速归因):当持仓股票突然大涨或大跌时,人容易恐慌或兴奋。这个 Skill 能在 10-15 分钟内,快速扫描公司事件、行业政策、市场情绪等信息,判断这次波动主要是由“价值事件”、“情绪波动”还是“原因不明”驱动的,并给出“是否需要深度研究”或“仅观察”的行动建议。避免你因为一篇小作文就匆忙操作。

5.3 自定义与扩展的可能性

AI Berkshire 的 Skills 本质上是结构化的提示词(Prompt)和工具调用流程。它的代码和 Skill 源文件(在skills/目录下)是开放的。

如果你对某个大师的方法论有特别深的理解,或者你想加入自己的筛选指标(比如你对现金流有特殊要求),你可以去修改对应的 Skill 文件。例如,在/investment-checklist里加入你自己的“第七关”。

更高级的用法,是参考它的多 Agent 协作框架,构建你自己的研究流程。比如,你可以创建一个专注于“科技股成长性分析”的团队,里面的 Agent 分别负责分析 TAM(总可寻址市场)、竞争格局、研发效率和估值模型。

最后,也是最重要的提醒:这个框架是一个强大的“思维脚手架”和“研究助理”,它能极大提升你获取信息、处理信息、结构化思考的效率。但它不能替代你的独立判断和持续学习。真正的价值投资,功夫在诗外,在于你对商业的深刻理解、对人性的洞察以及对自己的控制。AI Berkshire 帮你把“研究”这部分做得更扎实、更纪律严明,而最终的“决策”和“等待”,依然是你自己的修行。

http://www.gsyq.cn/news/1640227.html

相关文章:

  • Codex项目:AI代码生成与审查的“严父”级工具实践指南
  • CompressO视频压缩工具:开源跨平台媒体压缩解决方案,一键实现90%体积缩减
  • YOLOv11目标检测实战:环境配置、训练调优与部署优化
  • VisualCppRedist AIO:一站式解决Windows系统运行库兼容性难题的终极指南
  • AI 3D模型生成实战:从概念到引擎可用的生产级资产
  • Kaggle+Unsloth高效微调Qwen3大模型实战指南
  • 模特ai图片生成怎么选,作图鸟专业生图体验+4款对比
  • Halcon 形状匹配参数调优实战:3个关键参数对匹配速度与精度的影响分析
  • AI 3D建模实战:从Hi3D+Codex原理到自动化场景生成流水线搭建
  • Webots R2023b 与 ROS 2 Galactic 集成实战:从模型导入到传感器数据发布的 7 个步骤
  • 智能代理(Agent)开发入门:从架构到实践
  • Halcon dyn_threshold 缺陷检测实战:3步配置解决背景灰度不均问题
  • 如何快速掌握游戏存档编辑:三步实现JSON格式转换的完整指南
  • Complete RAG Pipeline:Retrieve → Augment → Generate 完整全流程详解
  • TensorRT实战:trtexec工具从模型到引擎的进阶转换指南
  • M1 Mac mini搭建轻量级AI Agent集群实战指南
  • LLaMA-Factory微调数据预处理与清洗实战指南
  • AI赋能传染病建模:从SIR模型到变分推断的实战指南
  • ENVI 5.3 监督分类实战:支持向量机(SVM)实现85%+分类精度的3个关键步骤
  • JSON转CSV实战:多语言实现与核心难点解析
  • 5个核心功能解析:为什么FastbootEnhance是Windows平台最好的Android刷机工具
  • 数据可视化实战:从结构化分析到图表设计
  • Andrew Ng机器学习课程:从基础到实战的完整指南
  • 遗传算法优化 BP 神经网络:3 大关键参数(种群/交叉/变异)调优实战
  • 零基础也能玩转专业3D重建:Meshroom免费开源软件深度体验
  • Python开发者实战指南:Doris部署、连接与Superset可视化集成
  • Python statsmodels 0.14 双因素方差分析:3步完成可重复/无重复实验检验
  • AI应用开发实战:从提示工程到推理优化的开源工具全景解析
  • Python深度学习环境搭建与实战指南
  • 3步解锁网盘高速下载:开源工具完全实战指南