核心用法
AgentSentinel 是一个代理级防护层,通过三重机制控制AI操作风险:
1. 预算熔断:实时监控会话消耗,超支自动拦截
2. 敏感操作审批:删除文件、数据传输、执行未知代码等危险动作强制人工确认
3. 预检协议:复杂任务执行前必须调用 check_safety 评估
典型工作流:执行任务前 → get_status 查预算 → check_safety 评估风险 → 若需审批则 request_approval → 获批准后执行。
显著优点
- 双向保护:既防API费用失控,也防数据误删/代码注入
- 低侵入设计:通过SDK封装,不改造原有代理逻辑
- 合规友好:满足金融、医疗等场景的审计追踪要求
潜在局限
- 依赖Python运行时和外部SDK(
agentsentinel-sdk) - 人工审批环节可能打断自动化流程的实时性
- 成本估算依赖开发者主观判断(
--cost参数) - 目前仅覆盖命令级防护,语义级风险(如提示词注入)未涉及
适合人群
- 运行高成本LLM代理的开发者/团队
- 处理敏感数据(PII、财务记录)的自动化工作流
- 需要SOC2/ISO27001合规审计的企业场景
常规风险
- 供应链风险:SDK和wrapper脚本的来源可信度待验证
- 单点故障:若sentinel服务宕机,可能阻塞正常代理操作
- 配置漂移:环境变量
AGENT_SENTINEL_API_KEY泄露将导致防护失效