agent-sentinel

🛡️ AI操作预算熔断与行为审计

个人开发者打造的Agent安全断路器,通过本地预算限制和远程监控,为AI操作提供成本管控与危险行为拦截。

收藏
3.3k
安装
1.2k
版本
v0.1.1
CLS 安全性认证2026-06-04
点击查看完整报告 >

使用说明

核心用法

AgentSentinel 是一款为 AI Agent 设计的本地安全断路器,通过三层机制保护用户:

1. 预算熔断:默认会话预算 $5.00、单次运行 $1.00,超支自动拦截
2. 操作预审:执行删除文件、数据传输、未知代码等敏感操作前,强制调用 check_safety 验证

3. 人工审批:高危操作触发 request_approval,等待人类确认后方可执行

用户通过 sentinel_wrapper.py 命令行工具与系统交互,支持本地独立运行或连接 agentsentinel.dev 云端获取实时仪表盘和审批工作流。

显著优点

  • 零信任架构:默认拒绝危险操作(如 rm -rf /),需显式配置白名单
  • 成本透明:实时追踪 API 调用开销,防止意外账单
  • 渐进式安全:本地模式即可工作,云端功能按需启用
  • Fail Open 设计:SDK 加载失败时优雅降级,不阻塞主流程

潜在缺点与局限性

  • T3 来源风险:个人开发者账号(jimmystacks)维护,长期可持续性存疑
  • 外部依赖:必须安装 agentsentinel-sdk,纯离线环境无法使用
  • 数据出境:启用云端同步后,操作元数据发送至美国服务器
  • 验证较基础:仅 API Key 长度校验,缺乏深度参数消毒

适合的目标群体

  • 使用 Claude/ChatGPT API 进行自动化开发的技术用户
  • 需要为团队 AI 工具设置成本上限的中小型企业
  • 担心 Agent 误删数据或无限循环消耗 Token 的谨慎型用户

使用风险

  • 供应链风险:SDK 闭源,需信任 pip 包完整性
  • 配置漂移callguard.yaml 预算规则可能被本地修改绕过
  • 网络依赖:远程审批流程依赖 agentsentinel.dev 服务可用性

安全解读

核心用法

AgentSentinel 是一款面向 AI Agent 运行的安全防护层,主要提供两大能力:本地预算熔断云端实时监控

本地模式:通过 check_safety 工具在执行敏感操作(删除文件、执行未知代码、大量 API 调用)前进行预算检查与风险评估;get_status 可实时查看会话成本与剩余预算;request_approval 在超出阈值时触发人工审批流程。

云端模式:运行 login 连接 agentsentinel.dev 后,可将操作日志、成本数据同步至云端仪表盘,支持实时可视化监控与人工审批工作流。

显著优点

1. 主动防御机制:在危险操作执行前强制检查,降低误删数据、预算透支等风险。
2. 成本可控:内置预算追踪,防止 Agent 在循环调用中耗尽 API 额度。

3. 人机协同:云端模式支持人工介入审批,适合高风险业务场景。

4. 轻量集成:通过 pip 安装 SDK 即可使用,对现有工作流侵入性低。

潜在缺点与局限性

1. 数据外传风险:云端模式会将 API 密钥、预算、操作日志传输至第三方服务器(api.agentsentinel.dev),存在隐私合规隐患。
2. 来源可信度中等:开发者 jimmystacks 为个人开发者,项目较新(约30天),长期维护能力存疑。

3. 外部 SDK 黑盒:核心功能依赖 agent_sentinel SDK,静态分析无法验证其实际行为。

4. 本地文件写入login 命令会自动向 .env 文件追加密钥,可能污染工作环境。

5. GDPR 合规警告:数据最小化原则未完全满足,欧盟用户需额外注意。

适合人群

  • AI Agent 高频使用者:担心 Agent 失控、预算失控的开发者
  • 团队协作场景:需要成本分摊与操作审计的团队
  • 安全意识较强但缺乏自建监控能力的个人开发者

不适合:对数据本地化要求极高的政企用户、完全离线环境的用户。

常规风险

| 风险项 | 等级 | 说明 |
|--------|------|------|
| 数据外泄至第三方 | 中 | 云端模式默认传输预算与操作日志 |
| API 密钥本地持久化 | 低 | `.env` 文件写入可能被其他应用读取 |
| SDK 供应链攻击 | 低-中 | 依赖外部 SDK,需关注更新动态 |
| 服务中断风险 | 中 | 个人项目,长期维护不确定性 |

建议配置:生产环境优先使用本地模式,禁用 enable_remote_sync;云端功能仅用于非敏感测试场景,并配合网络监控工具验证实际流量。

agent-sentinel 内容

手动下载zip · 3.4 kB
sentinel_wrapper.pytext/plain
请选择文件