核心用法
AgentSentinel 是一款为 AI Agent 设计的本地安全断路器,通过三层机制保护用户:
1. 预算熔断:默认会话预算 $5.00、单次运行 $1.00,超支自动拦截
2. 操作预审:执行删除文件、数据传输、未知代码等敏感操作前,强制调用 check_safety 验证
3. 人工审批:高危操作触发 request_approval,等待人类确认后方可执行
用户通过 sentinel_wrapper.py 命令行工具与系统交互,支持本地独立运行或连接 agentsentinel.dev 云端获取实时仪表盘和审批工作流。
显著优点
- 零信任架构:默认拒绝危险操作(如
rm -rf /),需显式配置白名单 - 成本透明:实时追踪 API 调用开销,防止意外账单
- 渐进式安全:本地模式即可工作,云端功能按需启用
- Fail Open 设计:SDK 加载失败时优雅降级,不阻塞主流程
潜在缺点与局限性
- T3 来源风险:个人开发者账号(jimmystacks)维护,长期可持续性存疑
- 外部依赖:必须安装
agentsentinel-sdk,纯离线环境无法使用 - 数据出境:启用云端同步后,操作元数据发送至美国服务器
- 验证较基础:仅 API Key 长度校验,缺乏深度参数消毒
适合的目标群体
- 使用 Claude/ChatGPT API 进行自动化开发的技术用户
- 需要为团队 AI 工具设置成本上限的中小型企业
- 担心 Agent 误删数据或无限循环消耗 Token 的谨慎型用户
使用风险
- 供应链风险:SDK 闭源,需信任 pip 包完整性
- 配置漂移:
callguard.yaml预算规则可能被本地修改绕过 - 网络依赖:远程审批流程依赖 agentsentinel.dev 服务可用性