当前位置: 首页 > news >正文

普通人也能做专业量化!香港大学免费开源 Vibe-Trading用自然语言来写策略

翻看Vibe-Trading的文档,我觉得它并不是给现有交易框架套一层AI壳,而是从零设计了一个AI代理作为中枢、市场数据和回测引擎作为四肢的研究系统。你给代理一句自然语言指令,它自己决定用哪些数据源、生成什么策略、跑什么回测、最后吐出报告给使用者。

项目来自香港大学数据科学实验室(HKUDS),今年4月1号才提交第一行代码。到现在不到三个月,Star已经超过14,000。迭代节奏极其密集——README里的News板块几乎每天都有更新,从最初的单一agent模式一路加到了现在的79个finance skill、36个MCP工具、18个数据源和452个预置Alpha因子。

它本质上是一个"工具编排器",不是一个策略库。Vibe-Trading不卖策略,不卖信号,它卖的是让AI代理帮你跑研究流程的能力。你问"帮我回测一个BTC-USDT金叉死叉策略,2024全年,输出收益和回撤",代理会自己选OKX数据源,生成策略代码,调用backtest引擎,验证结果,最后给你一份报告。

这个设计很像AI编程工具(Claude Code、Codex)的思路——代理替你做工具选择、环境准备和结果验证,你只需要提出问题和审阅输出。只不过Vibe-Trading针对的是金融量化这个垂直领域。

数据源方面。18个数据源覆盖A股(腾讯行情、通达信mootdx、东方财富、baostock、akshare、tushare)、美股(yahoo、stooq、sina、yfinance、finnhub、alphavantage、tiingo、fmp)、港股(eastmoney、futu、yfinance、akshare)、加密货币(okx、ccxt)和期货/宏观数据。每个市场有完整的自动降级链——被IP封了自动切下一个,不需要手动运维。你还可以把自己的CSV/Parquet/DuckDB文件注册为数据源。

不过:这些依赖都是体验级的。README里WARNING随处可见,broker连接器标注着"experimental / use at your own risk",Robinhood Agentic Trading需要在settings里配置mandate(交易标的白名单、仓位上限、每日交易次数上限),还有一个文件系统级别的紧急刹车——在指定目录touch一个kill-switch文件就能立刻中止所有自动交易。

安装很简单:

pip install vibe-trading-ai

之后用vibe-trading run -p "你的研究问题"就能启动交互。项目也支持Docker部署,且最近的更新解决了容器重建导致用户数据丢失的问题(持久化内存、session索引、自定义skill、broker配置现在都通过命名volume保存)。

同类项目比,有三个维度值得展开说一下。

第一个维度:和传统回测框架(vnpy、backtrader、zipline)的区别。传统框架的入口是写代码——你定义策略类、配置数据源、设置参数、跑回测。Vibe-Trading的入口是自然语言。它内部当然也会生成代码、调用回测引擎,但你不需要手动写。这对不擅长编程的交易员是个降门槛的设计。但代价也很明显:AI生成的策略代码质量不稳定——项目甚至专门写了一个pre-flight验证器,在import之前先做AST扫描,检查策略代码是否有循环自引用、缺失generate方法、错误的返回类型等。

第二个维度:和AI Agent平台(LangChain Agent、AutoGPT)的区别。这类通用Agent能搜网页、读文件、写代码,但它们不懂什么是OHLCV格式、什么是前复权、为什么回测数据要point-in-time。Vibe-Trading在这些细节上做了领域深度的积累——比如tushare的财务数据加载是按公告披露日期对齐的,不会出现用未来数据作弊的情况;又比如Shadow Account功能会自动从你的真实交易记录中提取买入卖出规律,然后回测"如果你严格按自己的规则来,能多赚多少"。

第三个维度:和商业量化平台(聚宽、米筐、QuantConnect)的区别。商业平台提供统一的托管环境和数据,但策略代码通常被锁定在平台上。Vibe-Trading完全本地化运行,数据源也是开放集成的,策略代码本质上就是本地生成的Python文件。它的Wiki上已经有由社区贡献的实测报告(比如"GTJA的191个Alpha因子到2026年哪些还活着"),读起来有点像量化圈内部的作业复盘。

说说坑。

项目的迭代节奏太快了。从README的News板块能看到,6月11号swarm worker才接上market data loader,6月18号Research Autopilot才闭环,6月19号刚发v0.1.10加18个数据源。很多功能像是"刚跑通demo就上线了",比如6月25号还在修backtest验证输出的JSON里包含NaN/Infinity导致严格解析器报错的问题。如果你是生产环境用户,这个成熟度显然不够。

其次,LLM依赖带来了不可控的成本和稳定性问题。每次agent run都会产生token消耗,虽然项目在6月14号加了per-run token用量追踪,但没有内置的价格估算。DeepSeek/Kimi/Gemini等不同provider的兼容性问题也被频繁提及——项目在6月12号专门做了一个Provider Reliability Overhaul来解决这些问题。

权限方面也有需要注意的地方。如果启用了shell工具(需要设置环境变量VIBE_TRADING_ENABLE_SHELL_TOOLS=1),AI代理就能在本地执行命令。虽说有文件沙箱隔离,但如果你在Docker外裸跑,还是建议先读一遍项目的安全文档。

什么样的读者适合用,什么样的不适合。

如果你是一个对量化有兴趣、但不太想从零学vnpy或backtrader的开发者,Vibe-Trading的"自然语言驱动"模式能让你快速验证想法。从一句prompt到一份回测报告,整个过程可能只需要几分钟。项目的Web UI也做得比较清爽,research goal、run detail、correlation heatmap等功能都是能看的。

如果你已经有一套成熟的量化策略和严格的回测框架,把它当纯粹的AI辅助研究工具用(仅用它的数据加载、Alpha Zoo因子库和报告生成,不走agent托管交易),是个合理的用法。它生成的Pine Script、通达信公式和MQL5导出也可以直接拿去别处用。

但如果你需要一个生产级、低延迟的交易执行系统,这个项目目前不对路。broker连接器的paper/live隔离机制虽然设计得认真(通过账户ID格式、host分离、demo flag等结构性guard来区隔),但整个agent loop的稳定性和延迟特性不适合高频场景。README自己也一再强调"experimental"。

最后说一个细节:Alpha Zoo里的452个因子,每个都带有中英文docstring(来自社区贡献者的批量翻译),而且项目有一个CI gate专门检查因子代码的AST——只允许import pandas/numpy/scipy等白名单库,禁止os/sys/socket等——防止用户提交的社区因子偷偷联网或读写文件。这个细节说明团队在开放性和安全性之间有比较清醒的判断。

项目地址:https://github.com/HKUDS/Vibe-Trading 竞品参考: - vnpy(https://github.com/vnpy/vnpy)——成熟的中国市场量化交易框架,支持CTP等数十个交易接口,Vibe-Trading的AI代理驱动模式与传统vnpy的策略代码编写模式是互补关系而非直接替代 - backtrader(https://github.com/mementum/backtrader,最后更新2023-04)——经典的Python事件驱动回测框架,已停止活跃维护,在灵活性和成熟度上超过Vibe-Trading,但不具备AI代理和自然语言驱动能力 - OpenBB(https://github.com/OpenBB-finance/OpenBB)——AI增强的投资研究平台,侧重数据探索与可视化,提供了类似的自然语言查询能力但缺少交易代理执行层
http://www.gsyq.cn/news/1602436.html

相关文章:

  • Sublime Text 3 —— 打造沉浸式编码体验:Material主题与Fira Code字体的黄金组合
  • Windows 11 系统优化终极指南:使用 Win11Debloat 实现专业级性能与隐私保护
  • 告别乱码困扰:SOLIDWORKS工程图转DWG字体映射实战指南
  • 如何完全掌控你的惠普暗影精灵:3个技巧释放笔记本终极性能
  • TPIC7710EVM评估套件:电子驻车制动ASIC开发实战指南
  • AI证书靠不靠谱,先看颁发主体和能力评价方式
  • Sora本质是时空建模:AI视频生成的物理世界模拟器
  • MSP430F42xA电气特性深度解析:从数据手册到稳定硬件设计实战
  • 终极视频修复指南:3步恢复损坏MP4/MOV文件的免费开源方案
  • OOTDiffusion:基于潜在扩散模型的虚拟试穿架构设计与性能优化实战
  • MIPI DSI转eDP桥接芯片SN65DSI86/96评估板硬件设计与调试实战
  • Linux 终端图像管理利器:feh 模式详解与实战指南
  • Awesome-Dify-Workflow:让AI工作流开发像搭积木一样简单
  • 如何通过3个关键技巧将黑盒日志转化为精准PID调参指南
  • 实证写作不再卡数据!Paperxie 数据分析模块,一站式搞定论文量化研究全流程
  • LMH6401 DVGA评估板实战:从硬件连接到性能测试全解析
  • ROS 分布式多机通信全解:局域网 / WiFi/5G 远程集群完整部署方案
  • 蓝宝是正宗德国品牌吗?国内消费者口碑怎么样?
  • 三步搭建个人音乐云服务器:Navidrome开源音乐流媒体终极指南
  • 终极OBS-ASIO插件:专业音频流媒体完整配置指南
  • ComfyUI ControlNet Aux插件完全指南:解锁AI绘画的终极控制力
  • 终极音乐解锁指南:3分钟掌握浏览器端音乐解密技术
  • ChatGPT Plus/Team/Enterprise套餐深度拆解(附实测吞吐量、响应延迟与SLA违约率数据)
  • WechatDecrypt终极指南:快速解密微信聊天数据库的完整解决方案
  • 发票遗失登报挂失怎么弄?发票遗失登报挂失收费标准是什么?
  • 10年车,年审要怎么处理?
  • 3步完成专业色彩校准:用novideo_srgb解决广色域显示器色彩失真问题
  • BiliPlus:5大核心功能优化B站体验,让视频浏览更高效更清爽
  • TPIC7710EVM评估板深度解析:从硬件设计到GUI软件实战指南
  • SRC漏洞挖掘实战指南:从Web安全基础到高效渗透测试