Prompt Safe

🧩 Token安全提示组装 · 记忆零溢出保障

llm-utilities榜 #1

Token安全的提示词组装框架,通过两阶段上下文构建和内存安全阀机制,确保API不会因token溢出而失败。

收藏
5.4k
安装
2.3k
版本
1.0.0
CLS 安全性认证2026-06-23
点击查看完整报告 >

使用说明

核心用法

Prompt Assemble 是一套标准化的token安全提示词组装框架,专为需要构建LLM提示词并集成记忆检索的AI Agent设计。其核心流程采用六阶段架构:基础配置 → 最小上下文构建 → 内存需求判断 → 内存检索(可选)→ Token估算 → 安全阀决策 → 最终组装。

框架的两阶段上下文构建机制确保:第一阶段仅加载系统提示、最近3条消息和用户输入,完全不加载内存第二阶段仅在检测到用户输入包含"previously"、"do you remember"等记忆触发词时,才检索最多3条记忆,并压缩至每条约3行摘要。

显著优点

1. 绝对token安全:设置85%模型上限的硬安全阀,从架构层面杜绝内存相关token溢出
2. 内存可丢弃设计:内存被明确定义为"可丢弃的增强项",而非刚性依赖,确保降级时的系统稳定性

3. 决策集中化:所有token预算决策统一在组装层处理,避免分布式逻辑导致的不可控风险

4. 明确的内存标准:清晰区分可持久化内容(用户偏好、长期目标)与禁止内容(原始对话日志、推理痕迹)

潜在缺点与局限性

  • 记忆触发词依赖:仅基于关键词匹配判断内存需求,可能遗漏隐含的上下文关联需求
  • 记忆深度受限:最多3条记忆、每条约3行的严格限制,可能不足以支撑复杂的长程依赖场景
  • 无动态预算调整:85%固定安全阀无法根据任务复杂度灵活调整,可能造成token利用效率不足
  • 实现复杂度:需要Agent开发者完整遵循六阶段流程,而非简单的函数调用,接入成本较高

适合人群

  • 构建生产级LLM Agent的开发者
  • 需要集成长期记忆系统但担心token溢出的团队
  • 对API稳定性有严格要求的金融、医疗、企业自动化场景
  • 正在从原型阶段向可扩展架构迁移的项目

常规风险

| 风险类型 | 说明 |
|---------|------|
| 配置误用 | 擅自修改SAFETY_MARGIN或MEMORY_TOP_K可能破坏安全保证 |
| 内存污染 | 若违反"禁止存储原始对话日志"规则,可能导致递归膨胀 |
| 过度依赖关键词 | 用户未使用触发词但确实需要上下文时,体验下降 |
| 估算误差 | 不同tokenizer的实际token数可能与估算存在偏差 |

安全认证状态

⚠️ 注意:提供的安全认证报告为系统自动生成的占位文本,未执行实际安全扫描。建议在生产部署前进行独立安全审计。

安全解读

核心用法

prompt-assemble 是一套标准化的 Token 安全 Prompt 组装框架,专为需要构建 LLM 提示词的 Agent 设计。其核心流程分为六个阶段:Base 配置 → Minimal 上下文构建 → 内存需求判断 → 内存检索(可选)→ Token 估算 → 安全阀决策 → 最终组装。

开发者只需调用 build_prompt(user_input, memory_search_fn, get_recent_dialog_fn) 即可完成安全组装。框架内置智能触发器检测用户输入是否包含记忆相关关键词(如 "previously", "last time"),仅在必要时检索最多 3 条记忆,并强制限制每条记忆摘要不超过 3 行。

Memory Safety Valve 是核心安全机制:当预估 Token 超过模型上限的 85% 时,自动丢弃记忆层,仅保留系统提示词、近期对话和当前输入,确保 API 调用永不失败。

显著优点

1. 零外部依赖:仅使用 Python 标准库,供应链攻击风险为零
2. 刚性安全边界:硬规则保障——永不降级系统提示、永不截断用户输入、仅记忆层可丢弃

3. 智能内存管理:明确的长期记忆白名单/黑名单,防止原始对话日志污染上下文

4. 防御性设计:两阶段构建确保最小可用上下文优先,内存仅为"可丢弃的增强"

潜在局限

1. Token 估算为启发式:采用字符数/固定比例估算,非精确 Tiktoken 计算,极端场景可能偏差
2. 记忆触发器为硬编码:关键词列表固定,可能漏检隐含的记忆需求表达

3. 无多模态支持:当前仅处理文本,图像/音频 Token 未纳入预算计算

4. 内存摘要质量依赖外部实现summarize() 函数由调用方提供,质量不可控

适合人群

  • 构建复杂多轮对话 Agent 的开发者
  • 需要接入长期记忆系统但担心 Token 爆炸的团队
  • 追求 API 稳定性高于记忆召回率的场景(如客服、任务执行类 Agent)
  • 对供应链安全敏感、希望零依赖部署的环境

常规风险

  • 极端长输入风险:百万级字符输入可能导致 _estimate_tokens 内存问题(已标记为 INFO 级建议)
  • 记忆过度丢弃:在 Token 紧张场景下可能频繁进入安全阀,导致用户体验断层
  • 估算偏差累积:多轮对话中 Token 估算误差可能累积,建议定期校准

安全评估

CLS-Certify 认证得分 95/100,S 级,静态分析 98 分、动态行为 95 分。无危险函数、无网络请求、无文件系统操作、无隐私数据收集,完全符合 GDPR 最小化原则和 CCPA 要求。

注意:当前未声明开源许可证,建议补充 MIT/Apache-2.0 以提升合规性。

Prompt Safe 内容

references文件夹
scripts文件夹
手动下载zip · 8.4 kB
memory_standards.mdtext/markdown
请选择文件