当前位置: 首页 > news >正文

养慢虾哲学:nanobot适配低速大模型

本文适合:部署本地低速 LLM、用 #nanobot# #养慢虾# 时发现各种抽风的朋友。不堆术语,只讲怎么动手。

一、 nanobot初始配置

# 1.1 初始化
先给个建议,请安装在虚拟机或容器中。以下为安装在lxc容器中ubuntu虚拟机情形下的示例。

安装好 nanobot 后,得先跑一次 onboard 初始化:

nanobot onboard -w ~/.nanobot/workspace -c ~/.nanobot/config.json

这条命令会创建两样东西:

  1. 工作区 ~/.nanobot/workspace/ — 放 SOUL.md、USER.md、MEMORY.md 等
  2. 配置文件 ~/.nanobot/config.json — 所有配置都在这里

修改config.json 可以设好你的本地LLM以及#飞书#等。

如果想用多项目,比如一个来编程,一个来做帐? 你可以再来一套:

nanobot onboard -w ~/.nanobot/workspace2 -c ~/.nanobot/config2.json

每个项目各自有自己的配置文件和工作区,互不干扰:

# 1.2 启动

nanobot agent

或者指定配置和工作区:

nanobot agent -w ~/.nanobot/workspace -c ~/.nanobot/config.json

启动后就可以跟 #nanobot# 对话了。

后台运行,通过#飞书#管理对话,那么需要:

nanobot gateway

类似的如果要制定工作区和配置:

nanobot gateway -w ~/.nanobot/workspace2 -c ~/.nanobot/config2.json

想停掉? 那就在nanobot运行的界面按 Ctrl+C。

二、加大延时,搞定一切慢

# 2.1 慢速LLM会超时

如果本地 LLM 速度只有 8.5 t/s(甚至更低),跟 #nanobot# 闲聊几句可能还行。但你让她

干点事——比如审计项目代码、整理点资料、聊长一点——她就开始抽风了:

  1. 聊着聊着对话突然断了
  2. 该等的时候不等,直接超时
  3. 上下文构建出错,token 数超标

有不少问题,都是由于慢速LLM带来的超时造成的,本地低速LLM 跑一个 2000 token 的回复,可能要等 4 分钟不止。nanobot 默认 120 秒超时,对本地低速LLM 来说根本不够。所以首先你得解决超时问题。你也可以先连接远端大模型api,让nanobot自己修改超时问题。

# 2.2 修改超时参数

如果你和我一样用了比较新的nanobot 2025-05-20以后至今的版本的,而且你的本地LLM设置使用的是openai兼容协议。那么只要你改一个地方就可以解决 #养慢虾#超时的问题:。直接改代码,一行搞定。

打开

nanobot/providers/openai_compat_provider.py

找到第 68 行左右有:

_OPENAI_COMPAT_REQUEST_TIMEOUT_S = 120.0

把120.0 改成 1800.0 (30 分钟),重启后超时问题即可搞定。

# 2.3 验证

改完代码后,重启 nanobot(停掉旧的,再跑一次

nanobot gateway

启动后跟 nanobot 聊长一点(10 轮以上),或者让她编编程序、搜个文件,看会不会突然断掉。如果不再超时,就对了。

三、让 nanobot 干点事,他就能找出自己的 bug

超时改完,nanobot 基本能用了。你可以让她干点事试试,如果你想不出来适合的事情让她做。那你可以让她找找自己的系统代码上下文构建的问题,看看她的能力。

你猜怎么着:

Now I need to add budget tracking to _run_agent_loop where the prompt is assembled and sent. Let me find the key areas read …/AI/HKUSDbot/nanobot/agent/loop.py
看完了,核心发现如下: 当前问题 nanobot 完全没有 token 预算控制机制。 所有代码都是"写进去再说",没有任何预算追踪、限额检查或预算感知的截断。 具体现状 1. context_window_tokens 配置项存在但从未被使用 — 只在 AgentLoop.__init__ 里存了一下,没有任何地方读取它来做预算控制 2. max_tool_result_chars 是硬截断 — 工具结果超过这个值就截断,但完全不考虑上下文窗口还剩多少空间 3. _replay_token_budget() 方法名有 budget 字样但实际返回的是消息数量 — 完全不是 token budget,是历史消息条数上限 4. _save_turn 里对 tool 结果做硬截断 — 同样不考虑预算 5. _sanitize_persisted_blocks 里的 should_truncate_text 也是硬截断 6. truncate_text_fn 是固定截断 — 没有预算感知 7. TokenBudget 类(我刚才新建的)是全新代码,还没被集成

看到了吧,有些问题 nanobot 是可以自己修好了。不过我得提醒你,得做好nanobot把自己修理残废的打算。

四、适配哲学

工具应该适应人,不是人适应工具。
本地 LLM 慢,不是你的问题,也不是 nanobot 的问题。只是它们还没磨合好。改一个超时设置,剩下的可以让 nanobot 自己处理。 我就是这样调教nanobot来#养慢虾#

别急着换模型、换硬件,可以让工具适应你的速度。

#养慢虾#金句:

慢不是缺陷,是另一种节奏。8.5 t/s 够用了,够你思考,够她回应,够你们好好聊完一句话。

关于 nanobot 我以前也发过攻略,可以参考:
nanobot 进阶指南——打造能自我进化的智能体
nanobot 高阶应用:AI 自己开发 Web 服务–微纳龙虾上云实录

http://www.gsyq.cn/news/1502581.html

相关文章:

  • 会话+知识融合:全品类企业服务AI智能体底层技术方案
  • 用51单片机和MPX4115做个简易气压计:Proteus仿真+ADC0832驱动全流程
  • 5分钟创建你的第一个AI模型:Teachable Machine零代码机器学习终极指南
  • 别再纠结模拟I2C了!手把手教你配置GD32F103的硬件I2C0(从机地址、ACK、STOP位详解)
  • 2026昆明市黄金回收全攻略 - 润富黄金回收
  • 三步搞定微博图片批量下载:免费高效的工具终极指南
  • 网页直接操控安卓手机屏幕:基于scrcpy的免安装远程投屏控制方案
  • Windows系统文件cryptnet.dll文件丢失找不到问题解决
  • Python自动化办公新思路:用Microsoft Graph API + OAuth2批量处理Outlook邮件(附完整代码)
  • 从零手搓YOLOv5的C3模块:用PyTorch复现核心组件并跑通分类任务
  • 如何用untrunc拯救损坏的MP4视频:完整实践指南
  • 苏州闲置黄金变现正当时 2026年6月金价及三大优质回收机构解读 - 润富黄金回收
  • 千万级数据入库ES卡死?全套生产写入优化方案,让你的ES吞吐量翻倍
  • 2026年6月北京老房装修公司优选指南:专业评测与品牌深度解析 - 品牌推荐
  • RabbitMQ 从零到实战:概念、配置与 Spring Boot 集成指南
  • 郑州国窖回收技术全解析:鉴别、估价与合规交易推荐 - 优质品牌商家
  • 掌握 Self-Attention(自注意力)机制——Transformer 与大模型的核心基础
  • 3分钟掌握:免费使用Cursor Pro功能的完整教程与终极指南
  • 别再只会写一种了!用Verilog的三种描述方式搞定三人表决器(附完整代码)
  • 2026年6月国产PCB厂家综合实力排行榜评测
  • 掌握多头自注意力机制(Multi-Head Self-Attention)——Transformer 强大表达能力的核心来源
  • 如何在非Windows系统上完美编辑Visio文件?drawio-desktop为您提供专业解决方案
  • 2026-6学习计划
  • 做工业控制和物联网网关的朋友最近经常问:屏幕刷新卡顿、AI算力不够、PCB面积又受限,这该怎么选型?
  • BiliTools智能解析:轻松获取B站视频资源的一站式解决方案
  • PostgreSQL 保姆级入门:为什么说它“养活”了国产数据库?
  • 告别Excel图表!用aardio+ScottPlot在Windows桌面快速绘制38种专业图表(附完整源码)
  • 2026年幕墙安装改造公司靠谱度排行:西安幕墙维修公司、贵阳幕墙安装公司、贵阳幕墙维修公司、重庆幕墙安装公司、重庆幕墙维修公司选择指南 - 优质品牌商家
  • 群论中的稳定群与完全群:构造与分类
  • 13ft Ladder:3分钟搭建个人专属付费墙绕过阅读助手