核心用法
clawd-docs-v2 是一个专为 ClawdBot 设计的智能文档访问助手,采用三层递进式架构:
1. Golden Snippets(黄金片段):预缓存 7 个高频查询答案(300-500 tokens),覆盖 Telegram 设置、OAuth 排错、更新流程等 80-90% 的常见需求
2. 本地搜索索引:零 Token 消耗的 keyword 匹配,支持同义词扩展
3. 按需抓取:仅当缓存未命中时,使用 Clawdbot 原生 web_fetch 工具获取完整页面(8-12k tokens)
关键操作流程:检查本地 snippet → 查询索引 → 读取页面缓存 → web_fetch 抓取,严格遵循成本递增原则。
显著优点
- 极致 Token 效率:相比直接抓取,80-90% 查询可通过 snippets 解决,节省 90%+ Token
- 零外部成本:v2.2.0 迁移至原生
web_fetch,彻底替代 brightdata($0.003/次 → $0) - 速度优势:snippet 读取毫秒级,web_fetch 约 400ms,远快于 brightdata 的 2-5s
- 智能保鲜:TTL 分层策略(安装文档 1 天刷新,概念文档 14 天),平衡时效与成本
- 多语言支持:内置斯洛伐克语关键词映射("ako nastaviť"、"reštart" 等)
潜在局限
- 覆盖范围依赖:仅 7 个预定义 snippets,边缘问题仍需完整抓取
- 索引维护成本:
docs-index.json需随官方文档更新手动同步 - 缓存失效盲区:TTL 到期后首次查询可能返回陈旧内容
- 无交互式搜索:不支持语义相似度匹配,纯关键词 + 同义词规则
- 仓库未公开:T3 来源可信度,GitHub 仓库状态不透明
适合人群
- ClawdBot 管理员:日常配置、排错、更新操作的高频用户
- 多代理系统开发者:需要查询 multi-agent routing、memory search 等概念文档
- 成本敏感型部署:Token 预算有限,追求极致性价比的生产环境
常规风险
- 误依赖风险:用户可能跳过 snippet 检查直接发起抓取,丧失成本优势
- 缓存污染:本地
~/clawd/data/docs-cache/目录若被手动修改,可能返回错误信息 - 域名可用性:完全依赖 docs.clawd.bot 在线状态,无离线镜像机制
- 工具版本锁定:依赖 Clawdbot 核心的
web_fetch,迁移至其他平台需适配