核心用法
chatgpt-import 是 OpenClaw 生态专用的 ChatGPT 历史迁移工具,通过三步工作流实现对话数据的结构化导入:首先从 ChatGPT 导出 conversations.json 文件,随后使用 Python 脚本将 JSON 转换为 Markdown 格式(支持 --min-messages 过滤无效对话),最后调用 OpenAI Embedding API 生成向量并写入 SQLite 数据库。完成后的数据库通过 OpenClaw 配置文件的 memorySearch.extraPaths 字段接入,重启网关即可实现历史对话的全文检索。
显著优点
该工具设计简洁且高度透明:纯 Python 标准库实现,零第三方依赖,彻底杜绝供应链攻击风险;代码完全开源可审计,所有文件操作均带安全边界(如禁止覆盖现有数据库);成本控制精准,2400 条对话仅需约 0.15 美元;输出格式为标准 SQLite,便于二次开发与跨平台迁移。文档层面,SKILL.md 对 API 成本、数据上传风险、密钥管理均有明确警示,体现负责任的安全披露态度。
潜在缺点与局限性
核心局限在于强制依赖 OpenAI 云端服务:对话内容必须离开本地环境传输至 api.openai.com,对含敏感信息的场景构成合规障碍;无本地嵌入模型替代方案,隐私敏感用户无法完全自主控制数据;缺乏内置的敏感信息扫描机制,需用户手动预处理;批量嵌入过程受限于 OpenAI API 速率限制,大规模历史导入可能耗时较长;此外,嵌入模型选择受限(仅支持 OpenAI 指定模型),无法灵活切换至开源替代方案。
适合的目标群体
- OpenClaw 深度用户:希望统一检索 ChatGPT 历史与新对话的进阶用户
- 个人知识管理爱好者:构建可搜索的 AI 对话存档,形成第二大脑
- 非敏感场景迁移需求:日常咨询、学习笔记、公开技术讨论等低隐私风险内容
- 成本敏感型开发者:需低成本实现对话数据向量化的独立开发者
使用风险
1. 数据隐私风险:对话内容上传至 OpenAI,需遵守其数据保留政策,企业机密、医疗记录、金融数据等严禁导入
2. API 密钥泄露:密钥通过环境变量或命令行传递,多用户服务器场景存在泄露可能
3. 嵌入成本累积:超大规模历史(数万条对话)可能产生意外费用
4. 服务依赖风险:OpenAI API 可用性直接影响功能,无离线降级方案
5. 格式兼容性:未来 ChatGPT 导出格式变更可能导致脚本失效,需关注上游更新