当前位置: 首页 > news >正文

节省token方案

headroom是一款AI Agent上下文压缩工具,核心作用是大幅降低LLM对话的Token消耗,适配Codex、Claude Code、Cursor等主流AI编程工具。该工具依赖终端执行核心命令,同时支持对接Codex桌面应用,并非纯图形化工具。

完整安装步骤(必须在终端操作)

headroom主流通过Python安装,环境要求Python 3.10及以上版本:

  1. 打开系统终端(Windows终端/PowerShell、Mac/Linux终端)。
  2. 执行完整版安装命令(推荐,包含全部功能):
    pip install "headroom-ai[all]"
  3. 若使用Node/TypeScript环境,可执行:
    npm install headroom-ai
  4. 验证安装:终端输入headroom --version,输出版本号即代表安装成功。

四大使用模式(结合Codex场景)

工具提供4种接入方式,全部以终端命令为基础,可分别适配Codex终端版和桌面版:

模式一:Agent Wrap模式(适配Codex终端CLI)

专门用于一键包装Codex命令行客户端,零额外配置:

headroom wrap codex # 执行后拉起Codex会话,自动压缩上下文
  • 特点:所有对话历史、代码上下文被自动压缩。
  • 查看统计:使用headroom statsheadroom perf查看Token消耗及节省数据。

模式二:Proxy代理模式(适配Codex桌面应用)

让Codex桌面端间接使用压缩能力:

  1. 终端启动本地代理服务(默认8787端口):
    headroom proxy --port 8787
  2. 打开Codex桌面应用,配置其请求代理指向http://localhost:8787
  3. 此后桌面端所有对话和上下文自动压缩,无需修改代码。

模式三:代码集成模式(开发者自定义集成)

在Python或TypeScript代码中直接调用压缩函数:

  • Python示例
    from headroom import compress compressed_messages = compress(messages, model="对应模型名称") # 传入Codex消息列表

模式四:MCP Server模式(适配Claude Desktop等MCP协议客户端)

启动MCP服务以支持压缩能力:

headroom mcp install # 安装并启动MCP服务
  • 适用场景:桌面端可直接调用压缩和检索功能,全程依托后台终端运行。

针对核心问题解答

  1. 能否在Codex桌面应用端直接使用?
    可以,但不能脱离终端。Codex桌面端本身无内置图形化入口,需先在终端启动proxymcp服务,再配置桌面端对接本地服务。

  2. 是否必须终端调用?
    核心操作(安装、启动代理、Wrap包装、服务部署)必须在终端执行。日常使用分场景:

    • Codex终端版:全程终端操作,使用headroom wrap codex一步完成接入。
    • Codex桌面版:仅首次需在终端启动后台服务,后续正常使用图形界面即可。

补充实用命令与注意事项

  1. 停止服务:终端按下Ctrl + C可关闭代理或Wrap会话。
  2. 端口冲突:若8787端口占用,自定义端口执行headroom proxy --port 自定义端口号
  3. 跨端联动:Codex终端会话可输入/app快速跳转至桌面端,压缩配置同步生效。
http://www.gsyq.cn/news/1535175.html

相关文章:

  • 魔兽争霸3终极修复指南:5分钟解决现代系统兼容性问题
  • 2026重庆市家用空调-中央空调等维修安装移机加氟-本地精选指南 -欧米到家 - 欧米到家
  • AI在重型机械标准解析中的典型失效模式分析
  • 2026年 仪表木箱/仪器木箱/出口木箱厂家推荐榜单:重型木箱、免熏蒸木箱、钢带木箱源头工厂实力解析及选购指南 - 品牌发掘
  • DeepSeek-R1本地部署指南:Windows下Ollama+Open WebUI实战
  • 如何在Blender中快速导入和制作MMD动画:blender_mmd_tools完全指南
  • 2026苏州五大城区奢品回收测评|上门变现避雷,高报价靠谱门店盘点 - 薛定谔的梨花猫
  • 大模型免费时代:推理效率、稳定性与确定性工程实践
  • 第6章:容器日志与监控——用 ELK 或 Loki 收集容器日志
  • 昆明黄金回收交易详解 2026金价参考及本地靠谱门店盘点 - 润富黄金回收
  • 论文写作AI软件哪个好?豆包、deepseek、掌桥科研对比 - 掌桥科研-AI论文写作
  • 对比实验全流程解析:从设计到决策的数据驱动方法
  • 佳能清零软件使用方法,ts3380,ts9020,mg3640s,mg3680,g3800,g3000报错5b00,5b02,5b04,1700,1702,1704,p07,e08亲测完美维修好了。
  • 微软Copilot嵌入式AI办公实战:降本增效的日常生产力革命
  • 2026年6月淮南黄金回收避坑干货 正规商家行情盘点 - 余生黄金回收
  • 西工大827信号与系统专业课保姆级攻略:如何用国防科大、西电名师的课高效提分?
  • ModOrganizer2终极指南:5步掌握免费游戏模组管理神器
  • 合肥旧金回收科普:选对商家不上当,这些细节你得懂 - 余生黄金回收
  • 2026儋州实业商行公司注销代办指南,工商税务同步注销高口碑财税优选榜 - GrowthUME
  • 2026:成都温江区室内除甲醛避坑测评,甲醛治理公司怎么分辨专业度,实测对比后推荐成都肃醛环保 - 专注室内空气检测治理
  • 2026河源黄金与奢侈品回收全指南:靠谱门店排名+避坑干货 - 生活测评小能手
  • Ps 怎么新增空白图层?3 种零基础快速创建方法
  • 终极文档下载解决方案:一键免费获取百度文库、道客巴巴等30+平台文档
  • 3分钟上手:本地千万级图片搜索神器ImageSearch完整指南
  • 2026年化学试剂厂家推荐:广东翁江化学试剂有限公司核心产品全解析 - 品牌推荐官
  • 混合型网络流量伪装与绕过技术:从TLS指纹到协议混淆的实战解析
  • 40_Java日志框架使用指南
  • 蒸馏出来的角色,如何真正「上岗」?用活字格打造你自己的AI数字分身
  • 从Vue 2老项目迁移到Vue 3,我踩过的这些坑你一定要避开(附详细步骤)
  • SQL主键设计原理与高可用实战:从索引机制到分布式ID选型