核心用法
CAD Agent是一个基于Docker的渲染服务器,让AI Agent通过"发送代码→接收图像→视觉迭代"的闭环完成机械设计。核心架构遵循容器内全隔离原则:所有CAD逻辑(build123d建模、VTK渲染、网格处理)均在容器内执行,Agent仅通过HTTP发送指令并观察返回的PNG图像。
标准工作流:
1. POST /model/create 创建build123d模型
2. POST /render/multiview 或 /render/3d 获取渲染图
3. 人工/Agent查看图像,判断是否符合预期
4. POST /model/modify 迭代修改代码
5. 循环直至满意后 POST /export 导出STL/STEP/3MF
显著优点
- 视觉闭环:将传统"盲写代码→导出→外部查看"的割裂流程压缩为秒级反馈循环,大幅降低3D建模的认知负荷
- 技术栈现代:基于build123d(Pythonic参数化CAD)和VTK(工业级渲染),优于传统OpenSCAD方案
- 容器化安全:设计文件与渲染计算完全隔离于容器,主机零依赖,支持快速部署
- 打印就绪:内置
/analyze/printability等制造性检查接口,打通设计到3D打印的最后一公里
局限性与风险
- 网络依赖:嵌套容器环境(如Clawdbot沙箱)存在
localhost访问限制,需改用docker exec替代curl - 无持久状态:容器重启后模型丢失,需自行管理设计源码
- 渲染瓶颈:复杂模型的VTK渲染可能成为延迟瓶颈,未提及GPU加速支持
- 代码注入面:
model/create和model/modify直接执行用户提交的Python代码,虽有容器隔离,但仍需警惕供应链攻击(如恶意PyPI依赖)
适合人群
- 需要快速验证3D打印件原型的机械工程师
- 通过自然语言控制CAD的AI Agent开发者
- 厌恶CAD软件GUI、偏好代码驱动设计的参数化建模爱好者
常规风险
- 容器逃逸风险(低概率,但HTTP服务暴露增加了攻击面)
- 设计文件意外泄露(已通过.gitignore和pre-commit hook缓解)
- build123d版本迭代导致的API兼容性断裂