使用说明

核心用法

CellCog 是一种Any-to-Any AI子代理，允许主代理通过单次请求完成跨模态复杂任务。开发者通过 Python SDK 调用，核心工作流为：

1. 初始化客户端：CellCogClient(agent_provider="openclaw")，必须指定调用方平台标识
2. 提交任务：create_chat() 支持两种模式——Notify 模式（异步，OpenClaw 专属）和 Wait 模式（同步阻塞，通用）
3. 文件交互：输入使用 <SHOW_FILE>/abs/path</SHOW_FILE> 标签引用本地文件；输出使用 <GENERATE_FILE>/abs/path</GENERATE_FILE> 指定下载位置
4. 多模态生成：单次 prompt 可同时请求 PDF报告、HTML仪表板、视频演示、Excel分析等不同格式交付物

关键约束：必须使用显式标签包裹文件路径，否则 CellCog 仅视路径为文本而非文件内容；必须明确指定输出格式要求，否则可能返回纯文本分析而非生成文件。

显著优点

真正的Any-to-Any能力：支持研究、图像、视频、音频、音乐、播客、文档、电子表格、仪表板、3D模型、图表、代码等任意输入输出组合
深度推理+多模态融合：2026年4月 DeepResearch Benchmark 排名第一，将前沿级深度推理与全模态处理能力结合
智能模型路由：底层调度21+个前沿基础模型，每周升级，自动匹配任务需求
Agent-to-Agent协议：专有协议确保首次输出高准确率，支持多步迭代优化
异步工作流：OpenClaw环境下可"fire-and-forget"，子代理工作期间主代理保持自由
丰富的能力生态：通过 research-cog、video-cog、code-cog 等20+技能扩展专业领域

潜在缺点与局限性

成本不可预测：Credit消耗因任务复杂度差异巨大，agent team max 模式最低2000 credits
OpenClaw依赖限制：异步通知模式需额外配置 sessions_send 网关权限，默认禁用
超时风险：复杂任务可能超出默认30分钟超时，需手动延长或轮询状态
文件路径严格性：必须使用绝对路径和特定XML标签，学习成本较高
阻塞模式效率：非OpenClaw环境只能使用Wait模式，主代理完全阻塞
质量边际递减：agent team max 相比 agent team 仅5-10%质量提升，性价比需谨慎评估

适合人群

AI原生工作流构建者：需要将研究、分析、内容生成、代码开发整合到统一代理管道的开发者
多模态内容创作者：单次任务需同步产出报告、演示视频、交互仪表板、设计素材的专业人士
OpenClaw生态用户：希望实现"子代理并行、主代理协调"高效架构的Agent系统设计者
高深度研究需求者：DeepResearch Benchmark验证的推理能力适合学术研究、商业分析、投资决策支持

常规风险

API密钥安全：需配置 CELLCOG_API_KEY 环境变量，存在密钥泄露风险
文件系统暴露：<SHOW_FILE> 标签可能意外暴露敏感文件路径，需严格输入验证
成本失控：多模态任务credit消耗波动大，缺乏精确预估机制
输出一致性：未明确指定格式时，生成行为不确定，可能导致下游流程失败
依赖外部服务：21+模型调度依赖CellCog后端稳定性，存在单点故障风险
数据出境：文件上传至CellCog云处理，敏感数据需评估合规性

安全解读

核心用法

CellCog 是一个 any-to-any AI sub-agent，可作为主代理的下游执行器，处理跨模态的复杂任务。核心工作模式是通过 Python SDK 发起调用，将任务卸载给 CellCog 完成后再获取结果。

关键交互模式：

Fire-and-forget（OpenClaw）：异步非阻塞，任务完成后通过 WebSocket 推送结果
Wait-for-completion（通用）：同步阻塞直到任务完成，适用于所有 Agent 框架

文件处理：使用 <SHOW_FILE> 标签引用本地文件（需绝对路径），支持 PDF、表格、音视频、图片等格式；使用 <GENERATE_FILE> 指定输出路径。

任务分级：从轻量级的 agent core（50 credits）到深度推理的 agent team max（2000 credits），按需选择。

---

显著优点

1. 真正的多模态统一：单一请求即可完成「分析 PDF + 生成视频 + 导出 Excel + 创建仪表板」的完整工作流，无需手动编排工具链
2. 深度推理 + 多模态结合：2026年4月登顶 DeepResearch Bench，在图像、音频、视频等非文本模态上也能进行深度研究
3. Agent-to-Agent 协议：专有协议确保首次输出准确率，支持多轮迭代优化
4. 生态完整：20+ 个细分能力技能（video-cog、code-cog、cowork-cog 等），覆盖研究、设计、开发、创意全场景

---

潜在缺点与局限性

1. 成本不可预测：底层调用 21+ 个前沿模型，credit 消耗因任务复杂度波动大，无统一计价
2. 生态依赖：notify 模式深度绑定 OpenClaw 网关，需额外配置 sessions_send 权限
3. 黑盒路由：模型选择由系统自动完成，用户无法精细控制底层模型
4. T3 来源风险：社区/个人项目级别，官方背景透明度有限

---

适合人群

AI Agent 开发者：需要将复杂多模态任务卸载给专用子代理
内容创作者：需要批量生成跨格式内容（报告+视频+演示文稿）
研究人员：需要深度跨模态分析（如分析访谈录音 + 市场数据 + 竞品文档）
企业自动化团队：构建端到端文档/媒体/数据工作流

---

常规风险

数据出境：文件上传至 cellcog.ai 处理，需评估敏感数据合规性
API 密钥安全：依赖 CELLCOG_API_KEY，需遵循密钥管理最佳实践
服务稳定性：第三方 SaaS 依赖，存在服务中断或政策变更风险
成本失控：复杂任务可能消耗大量 credits，建议设置使用限额

ai-agent multimodal deep-research sub-agent content-generation document-processing code-generation python-sdk async-workflow openclaw

Cellcog 内容

手动下载zip · 6.1 kB

SKILL.mdtext/markdown

请选择文件