chatgpt-import

📥 ChatGPT历史一键迁移搜索

🥥4总安装量 2评分人数 2
100% 的用户推荐

OpenClaw官方数据迁移工具,将ChatGPT对话历史转为可搜索的本地知识库,需上传至OpenAI API生成嵌入向量。

B

存在边界风险,建议在隔离环境中验证

  • 来自可信组织或认证账号,需要结合权限范围判断
  • ✅ 代码开源可审计,无动态代码加载或危险函数
  • ✅ 纯 Python 标准库实现,零第三方依赖风险
  • ⚠️ 对话内容需上传至 OpenAI API 生成嵌入向量
  • ⚠️ 敏感信息泄露风险,需用户自行预处理过滤
  • ⚠️ 依赖外部 API 密钥,存在密钥管理安全责任

使用说明

核心用法

chatgpt-import 是 OpenClaw 生态专用的 ChatGPT 历史迁移工具,通过三步工作流实现对话数据的结构化导入:首先从 ChatGPT 导出 conversations.json 文件,随后使用 Python 脚本将 JSON 转换为 Markdown 格式(支持 --min-messages 过滤无效对话),最后调用 OpenAI Embedding API 生成向量并写入 SQLite 数据库。完成后的数据库通过 OpenClaw 配置文件的 memorySearch.extraPaths 字段接入,重启网关即可实现历史对话的全文检索。

显著优点

该工具设计简洁且高度透明:纯 Python 标准库实现,零第三方依赖,彻底杜绝供应链攻击风险;代码完全开源可审计,所有文件操作均带安全边界(如禁止覆盖现有数据库);成本控制精准,2400 条对话仅需约 0.15 美元;输出格式为标准 SQLite,便于二次开发与跨平台迁移。文档层面,SKILL.md 对 API 成本、数据上传风险、密钥管理均有明确警示,体现负责任的安全披露态度。

潜在缺点与局限性

核心局限在于强制依赖 OpenAI 云端服务:对话内容必须离开本地环境传输至 api.openai.com,对含敏感信息的场景构成合规障碍;无本地嵌入模型替代方案,隐私敏感用户无法完全自主控制数据;缺乏内置的敏感信息扫描机制,需用户手动预处理;批量嵌入过程受限于 OpenAI API 速率限制,大规模历史导入可能耗时较长;此外,嵌入模型选择受限(仅支持 OpenAI 指定模型),无法灵活切换至开源替代方案。

适合的目标群体

  • OpenClaw 深度用户:希望统一检索 ChatGPT 历史与新对话的进阶用户
  • 个人知识管理爱好者:构建可搜索的 AI 对话存档,形成第二大脑
  • 非敏感场景迁移需求:日常咨询、学习笔记、公开技术讨论等低隐私风险内容
  • 成本敏感型开发者:需低成本实现对话数据向量化的独立开发者

使用风险

1. 数据隐私风险:对话内容上传至 OpenAI,需遵守其数据保留政策,企业机密、医疗记录、金融数据等严禁导入
2. API 密钥泄露:密钥通过环境变量或命令行传递,多用户服务器场景存在泄露可能

3. 嵌入成本累积:超大规模历史(数万条对话)可能产生意外费用

4. 服务依赖风险:OpenAI API 可用性直接影响功能,无离线降级方案

5. 格式兼容性:未来 ChatGPT 导出格式变更可能导致脚本失效,需关注上游更新

chatgpt-import 内容

文件夹图标references文件夹
文件夹图标scripts文件夹
手动下载zip · 6.5 kB
export-guide.mdtext/markdown
请选择文件