核心用法
OpenClaw Visual 是一款本地图片生成技能,核心流程为「内容识别 → 模板选择 → HTML 生成 → 本地渲染 → 输出图片」。支持五种预设模板:quote-card(金句卡片)、moment-card(瞬间卡片)、daily-journal(日记手账)、social-share(社交分享)、dashboard(数据仪表盘)。用户可通过自然语言指令触发,如"帮我把这段话做成图片"或"生成今日日志分享图",系统自动识别内容类型并匹配最佳模板。
显著优点
纯本地处理:所有渲染通过 node-html-to-image(Puppeteer)或可选的 Playwright 在本地完成,无需调用外部 API,保障数据隐私。模板丰富:覆盖金句、日记、数据仪表盘等多种场景,采用瑞士风格网格系统和现代极简设计。零外部依赖:使用系统字体栈,无需下载网络字体;SVG 图标内联,无外部资源依赖。灵活扩展:支持自定义模板和主题,开发者可按规范添加新模板。
潜在缺点与局限性
资源消耗较高:Chromium 实例峰值内存可达 500MB,在低配设备上可能影响性能。沙箱降级:使用 --no-sandbox 参数运行 Chromium,虽为容器环境必要配置,但安全隔离级别有所降低。外部图片风险:moment-card 模板支持加载外部 URL 图片,存在理论 SSRF 风险。模板变量注入:虽使用安全的正则替换,但用户输入的 HTML 内容仍可能在 Puppeteer 渲染时执行脚本。无实时预览:生成过程黑盒,用户无法中途调整样式。
适合的目标群体
- 个人知识管理用户:使用 PhoenixClaw 记录日志,希望将每日复盘转为可视化分享图
- 内容创作者:需要将金句、读书笔记快速生成社交媒体配图
- 效率工具爱好者:追求本地优先、隐私优先的工作流,不愿依赖云端设计工具
- OpenClaw 生态用户:已深度使用 OpenClaw 会话记录和日志系统,希望增强内容呈现形式
使用风险
性能风险:首次运行需下载 Chromium,可能耗时较长;并发请求可能导致内存溢出。依赖风险:node-html-to-image 和 Playwright 版本更新可能引入 Breaking Changes。输入风险:恶意构造的 {{CONTENT}} 变量可能包含脚本,虽在隔离环境执行,但仍建议对敏感场景启用内容过滤。路径风险:输出路径由调用方控制,需确保写入目录无敏感文件,防止覆盖攻击。