Memory Pipeline

赋予AI真正的持久记忆

基于认知架构设计的AI智能体记忆系统,通过事实提取、知识图谱构建和每日简报生成,彻底解决会话冷启动问题,获安全评级S级。

收藏
7.2k
安装
2.8k
版本
0.4.0
CLS 安全性认证2026-05-18
点击查看完整报告 >

使用说明

核心用法

Memory Pipeline 是一套完整的智能体记忆管理方案,采用三阶段流水线架构:

1. Extract(提取):从每日笔记和会话记录中提取结构化事实(决策、偏好、学习成果),输出为 extracted.jsonl
2. Link(关联):构建知识图谱,通过语义嵌入建立事实间的双向关联,检测矛盾并标记过时信息

3. Brief(简报):生成精简的 BRIEFING.md(<2000字符),整合人格特征、用户背景、活跃项目和待办事项

额外支持外部知识导入(ChatGPT导出文件解析)和四个可选的性能钩子(pre-game briefing、工具策略、结果压缩、事后复盘),实现跨会话的执行纪律。

显著优点

  • 认知架构而非简单检索:模仿人类记忆机制,强调提取优于积累、关联优于相似度匹配
  • 零冷启动:每日简报直接注入系统提示,无需依赖检索时机的运气
  • 执行心理学应用:将反馈闭环置于会话之间,避免执行中打断(no mid-swing coaching)
  • 零依赖风险:纯Python标准库实现,无第三方包供应链攻击面
  • 来源可信:仅连接OpenAI/Anthropic/Gemini官方API,HTTPS加密传输

潜在缺点与局限性

  • T3来源可信度:个人开发者维护,无企业背书或大规模社区验证
  • 凭证管理待改进:API密钥优先从明文文件读取,存在暴露风险
  • 无内置重试机制:网络不稳定时可能导致Pipeline中断
  • 路径验证不足:外部文件导入存在理论上的路径遍历风险
  • 维护不确定性:版本0.4.0,迭代历史较短,长期支持存疑

适合人群

  • 高频使用AI辅助工作的个人开发者、研究者、知识工作者
  • 需要跨会话保持一致性的长期项目场景
  • 愿意承担T3来源风险、具备基础代码审查能力的用户
  • 不适合:对供应链安全要求极高的企业环境、无法自主审计代码的非技术用户

常规风险

| 风险类型 | 等级 | 说明 |
|---------|------|------|
| 供应链攻击 | 极低 | 零第三方依赖 |
| 数据外泄 | 低 | 仅传输至知名LLM服务商 |
| 凭证泄露 | 中 | 明文文件存储API密钥 |
| 路径遍历 | 低 | 外部导入功能输入验证不足 |
| 功能中断 | 中 | 无重试机制,API限流敏感 |

安全解读

Memory Pipeline 综合评估

核心用法

Memory Pipeline 是一套完整的 AI Agent 记忆与性能管理系统,采用「提取-链接-简报」三段式架构:

1. 事实提取(Extract):基于 LLM 自动分析每日笔记和会话转录,识别决策、偏好、学习成果等结构化事实,输出为 extracted.jsonl

2. 知识图谱构建(Link):生成语义嵌入,建立事实间的双向关联,检测矛盾并标记过时信息,形成可查询的知识网络

3. 智能简报(Brief):每日自动生成 <2000 字符的 BRIEFING.md,整合人格特质、项目状态、近期决策和待办事项

此外支持 ChatGPT 历史对话导入,并可选配四种「性能钩子」:会话前简报注入、工具调用策略、结果压缩、行动后复盘。

显著优点

  • 认知架构设计:不同于简单的向量检索,模拟人类记忆机制——提取优先于累积,关联优先于存储
  • 零冷启动:每日预加载的简报让 Agent 即刻进入状态,无需反复询问背景
  • 闭环比干预:基于运动心理学原理,反馈在会话间而非会话中完成,避免打断心流
  • 多供应商支持:OpenAI、Anthropic、Gemini 密钥自动识别,降低配置门槛
  • 可扩展的数据管道:标准化的导入接口,支持自定义数据源接入

潜在局限

  • 依赖外部 API:核心功能需调用 LLM,产生成本且受网络条件制约
  • 隐私权衡:会话内容需发送至第三方服务商处理,敏感场景需谨慎
  • 配置复杂度:完整启用性能钩子需要理解 JSON 配置,对非技术用户有门槛
  • 维护开销:每日自动运行需配合 Heartbeat 机制,长期项目需持续投入

适合人群

  • 长期协作型 AI 项目(如持续数周的软件开发、研究课题)
  • 对 Agent 一致性有较高要求的专业用户
  • 已有大量 ChatGPT 历史对话需要整合复用的用户
  • 愿意投入认知架构调优的技术爱好者

常规风险

  • API 密钥管理:脚本需读取环境变量中的敏感凭证,建议创建专用低权限密钥
  • 数据外发:内容处理依赖外部 LLM 服务商,需知情同意
  • 存储位置:记忆文件默认存放于工作空间,敏感项目需配合文件权限管理
  • 成本控制:嵌入生成和事实提取产生持续调用费用,高频使用需预算规划

Memory Pipeline 内容

references文件夹
scripts文件夹
src文件夹
手动下载zip · 30.9 kB
setup.mdtext/markdown
请选择文件