当前位置: 首页 > news >正文

OpenClaw从入门到应用——工具(Tools):PDF

通过OpenClaw实现副业收入《OpenClaw赚钱实录从“养龙虾“到可持续变现的实践指南》pdfpdf用于分析一个或多个 PDF 文档并返回文本内容。快速行为概览对于 Anthropic 和 Google 模型提供商使用原生提供商模式。对于其他提供商使用提取回退模式先提取文本需要时再提取页面图像。支持单次pdf或多次pdfs输入每次调用最多处理 10 个 PDF 文件。可用性仅当 OpenClaw 能够为代理解析出支持 PDF 的模型配置时此工具才会被注册agents.defaults.pdfModel回退到agents.defaults.imageModel回退到基于可用认证的尽力而为的提供商默认值如果无法解析出可用的模型则不会公开pdf工具。输入参考pdfstring单个 PDF 路径或 URLpdfsstring[]多个 PDF 路径或 URL最多总共 10 个promptstring分析提示词默认为Analyze this PDF document.pagesstring页面筛选器例如1-5或1,3,7-9modelstring可选的模型覆盖格式为provider/modelmaxBytesMbnumber每个 PDF 的大小上限单位MB输入注意事项pdf和pdfs在加载前会被合并并去重。如果未提供 PDF 输入工具会报错。pages会被解析为从 1 开始的页码经过去重、排序后限制在配置的最大页数范围内。maxBytesMb默认为agents.defaults.pdfMaxBytesMb或10。支持的 PDF 引用本地文件路径包括~展开file://URLhttp://和https://URL引用注意事项其他 URI 方案例如ftp://会被拒绝并返回unsupported_pdf_reference。在沙盒模式下远程http(s)URL 会被拒绝。启用仅工作区文件策略时位于允许根目录之外的本地文件路径会被拒绝。执行模式原生提供商模式原生模式适用于anthropic和google提供商。该工具将原始 PDF 字节直接发送到提供商 API。原生模式限制不支持pages。如果设置了pages工具会返回错误。提取回退模式回退模式适用于非原生提供商。流程从选定的页面提取文本最多agents.defaults.pdfMaxPages页默认20页。如果提取的文本长度少于200个字符则将选定页面渲染为 PNG 图像并将其包含在内。将提取的内容加上提示词发送到选定的模型。回退模式详情页面图像提取使用4,000,000的像素预算。如果目标模型不支持图像输入并且没有可提取的文本工具会报错。提取回退需要pdfjs-dist以及用于图像渲染的napi-rs/canvas。配置{ agents: { defaults: { pdfModel: { primary: anthropic/claude-opus-4-6, fallbacks: [openai/gpt-5-mini], }, pdfMaxBytesMb: 10, pdfMaxPages: 20, }, }, }有关完整的字段详细信息请参阅配置参考。输出详情该工具在content[0].text中返回文本并在details中返回结构化元数据。常见的details字段model解析后的模型引用provider/modelnative原生提供商模式为true回退模式为falseattempts成功前失败的回退尝试次数路径字段单个 PDF 输入details.pdf多个 PDF 输入details.pdfs[]包含pdf条目沙盒路径重写元数据适用时rewrittenFrom错误行为缺少 PDF 输入抛出pdf required: provide a path or URL to a PDF document错误PDF 数量过多在details.error too_many_pdfs中返回结构化错误不支持的引用方案返回details.error unsupported_pdf_reference原生模式使用了pages抛出清晰的pages is not supported with native PDF providers错误示例单个 PDF{pdf:/tmp/report.pdf,prompt:Summarize this report in 5 bullets}多个 PDF{pdfs:[/tmp/q1.pdf,/tmp/q2.pdf],prompt:Compare risks and timeline changes across both documents}经过页面筛选的回退模型{pdf:https://example.com/report.pdf,pages:1-3,7,model:openai/gpt-5-mini,prompt:Extract only customer-impacting incidents}
http://www.gsyq.cn/news/1295235.html

相关文章:

  • 抖音弹幕抓取神器:5分钟快速上手与深度应用指南
  • 中国科学院大学与上海人工智能实验室联手打造的“排版医生“
  • 2026年义乌高端灯具甄选指南:无主灯设计与全屋灯光深度评测 | 西顿照明金华总经销别墅无主灯定制防眩护眼灯酒店工程照明商业空间灯光三年质保终身售后 - 企业品牌优选推荐官
  • 从API密钥管理角度体验Taotoken平台的安全与便捷
  • 3分钟上手串口助手:跨平台串口调试工具完全指南
  • 5分钟掌握NGA论坛终极优化方案:告别杂乱,专注内容
  • 可以紧致皮肤的护肤品推荐 CA逆时光 30天让细纹彻底隐身 - 全网最美
  • 2026数据分析项目去哪里找?五种获取路径深度对比,职卓科技全流程
  • 汕头祥龙再生资源回收:澄海可靠的办公室拆除公司 - LYL仔仔
  • 邮件安全网关怎么选?三种类型网关和功能对比全面解析
  • Prometheus外置抓取器:扩展监控能力与复杂场景适配方案
  • 零代码物联网实战:用WipperSnapper与Adafruit IO快速采集模拟与I2C传感器数据
  • 软件安全设计实战:从威胁建模到安全编码的完整指南
  • 植物导水率测量仪产品介绍和厂家推荐 - 品牌推荐大师
  • 安防监控全光网解决方案:高清视频实时回传无压力
  • 如何高效使用AutoHotkey V2扩展库:7个实用技巧提升自动化开发效率
  • 服务器硬件集成与定制化解决方案:从部件到系统的产业实践
  • 【深度学习】Ubuntu服务器从零部署:Anaconda环境搭建、PyCharm配置与YOLOv8项目实战全解析
  • Kubernetes 安全加固清单:从 RBAC 到 etcd 加密的生产实践
  • 利用taotoken多模型能力为内容创作平台提供ai增强服务
  • AI 开发狂飙!.NET 11 Preview 4 原生集成向量搜索 + MCP 模板,EF Core 直接对标 RAG 应用
  • PDF怎么转换格式?2026在线转换工具实测对比与方法详解 - 软件小管家
  • 使用 Hermes Agent 连接 Taotoken 扩展 AI 工具能力
  • 技术人如何做好年终汇报?这3个模板让你脱颖而出
  • 在macOS上运行Windows应用:为什么传统方案失败而Whisky成功
  • 知名水果礼盒厂商对接方式amp;专属定制水果礼盒全套落地方案,海棠果礼盒/香妃果礼盒/小苹果礼盒,水果礼盒厂商哪家可靠 - 品牌推荐师
  • 3分钟拯救你的B站视频:m4s-converter零转码转换完全指南
  • PDF怎么转Word?2026免费PDF转Word软件推荐与实测对比 - 软件小管家
  • 明日方舟自动化助手终极指南:一键解放双手的完整教程
  • draw.io桌面版:免费开源的跨平台绘图神器,彻底告别Visio依赖