核心用法
CAD Agent 是一个专为 AI Agent 设计的 3D CAD 渲染服务器,采用"命令-渲染-迭代"的闭环工作流。用户通过 HTTP API 发送 build123d Python 代码创建或修改模型,服务端在隔离容器内执行建模逻辑,并返回 VTK 渲染的 PNG 图像供视觉验证。核心端点包括 /model/create 创建模型、、/model/modify 迭代修改、、/render/multiview 生成多视图渲染,以及 /export 导出 STL/STEP/3MF 等制造格式。整个设计哲学强调"渲染即眼睛"——Agent 必须依赖视觉反馈而非想象来推进设计。
显著优点
架构隔离性:所有 CAD 逻辑被严格限制在 Docker 容器内,Agent 仅通过 REST 接口交互,从根本上杜绝了主机环境被污染的风险。可视化迭代:相比传统代码式 CAD,实时渲染反馈大幅降低了设计试错成本,特别适合参数化探索和 3D 打印前的可打印性验证。技术栈成熟:底层采用 build123d(OpenCASCADE 的 Python 封装)和 VTK,两者均为工业级开源几何内核与可视化库。工作流完整:从建模、测量、渲染到导出制造文件,覆盖机械设计的完整生命周期。
潜在缺点与局限性
部署复杂度:需要 Docker 环境,且在嵌套容器场景(如 Clawdbot sandbox)中存在网络访问限制,需改用 docker exec 方式调试。代码执行风险:/model/create 和 /model/modify 端点直接执行用户提供的 Python 代码,尽管有容器隔离,仍存在潜在的沙箱逃逸或资源耗尽风险。功能边界:专注于 build123d 生态,不支持 Fusion 360、SolidWorks 等商业 CAD 格式的原生编辑,复杂曲面建模能力有限。无持久化存储:模型仅存于容器内存,重启后丢失,需自行管理导出文件。
适合的目标群体
- 硬件创客与 3D 打印爱好者:快速验证可打印的机械零件设计
- AI Agent 开发者:为机器人/自动化系统赋予空间推理与视觉反馈能力
- 教育场景:参数化 CAD 教学的轻量化演示环境
- 快速原型团队:需要低成本、可脚本化的机械设计验证流程
使用风险
性能风险:VTK 渲染在复杂模型上可能消耗大量 CPU/GPU 资源,建议设置容器资源限制。依赖风险:build123d 和 VTK 的版本兼容性需持续关注,基础镜像更新可能引入破坏性变更。网络暴露:服务默认绑定 0.0.0.0,在共享主机上需配合防火墙规则限制访问。代码注入:恶意构造的 Python 代码可能尝试容器逃逸,生产环境应启用 seccomp/AppArmor 加固。