discord-soul

🧠 Discord 社区灵魂化与记忆引擎

OpenClaw 官方技能,通过多层安全过滤将 Discord 历史转化为具记忆的社区 AI Agent,让服务器拥有可对话的灵魂与文化传承。

收藏
6.7k
安装
2k
版本
v1.0.0
CLS 安全性认证2026-05-09
点击查看完整报告 >

使用说明

核心用法

discord-soul 通过一套完整的管道将 Discord 服务器历史转化为具有持续记忆能力的 AI Agent。首先使用 DiscordChatExporter CLI 导出服务器数据,然后通过多层安全管道处理(Regex 预过滤识别 25+ 种提示注入模式,Claude Haiku 进行语义风险评估),将清洗后的数据存入 SQLite。接着生成按日划分的记忆文件,并按时间顺序模拟 Agent 的"成长"过程——逐日处理消息,动态更新 SOUL.md(社区身份)、LEARNINGS.md(模式发现)、AGENTS.md(关键人物)等核心文件,最终在 OpenClaw 框架中部署为可对话的社区灵魂。

显著优点

1. 真正的长期记忆架构:不同于简单的 RAG 检索,该 Skill 通过每日记忆文件和身份演化机制,让 Agent 真正"经历"社区历史,记住内部笑话、文化变迁和关键决策时刻。

2. 业界领先的安全设计:针对 Discord 场景特化的多层防御(Regex 快速过滤 + Haiku 语义评估),能有效拦截提示注入、角色劫持和越狱攻击,确保不可信的用户生成内容不会污染 Agent 提示词。

3. 丰富的社交信号捕获:不仅保存消息文本,还捕获反应表情(🔥 x5)、角色颜色、频道主题、回复线程等元数据,使 Agent 能准确理解社区氛围和人际关系。

4. 持续演化能力:通过 Cron 定时任务支持每日增量更新,Agent 会随社区成长持续学习,保持记忆的新鲜度。

潜在缺点与局限性

1. 技术门槛较高:需要用户熟悉 CLI 工具、配置 Discord Token、Anthropic API Key,并设置 Cron 定时任务,对非技术用户不够友好。

2. 使用成本:虽然本体免费,但 Haiku 安全评估需要消耗 API 调用(约 $0.25/1M tokens),大型社区的历史数据处理可能产生一定费用。

3. 外部依赖强:必须配合 DiscordChatExporter 工具使用,且该工具需要用户自行获取 Discord Token,流程较为繁琐。

4. 只读局限:当前版本主要支持问答和记忆检索,无法执行实际的 Discord 操作(如发送消息、管理频道等)。

适合的目标群体

  • 大型 Discord 社区管理员:需要沉淀社区知识、回答重复性问题("上周我们讨论了什么?"、"谁是某领域专家?")。
  • 社区运营团队:希望分析社区文化演变、识别关键贡献者、保存内部梗和历史决策。
  • 在线社区研究者:需要分析社交网络演变、语言模式变化的研究者。
  • 数字档案馆员:希望为活跃的 Discord 社区建立可查询的历史记忆库。

使用风险

1. 凭证泄露风险:Discord Token 和 Anthropic API Key 需妥善保管,建议使用 600 权限存储 Token 文件。

2. 历史数据敏感:尽管有安全过滤,导出的历史消息可能包含个人隐私信息,需在合规前提下使用。

3. 提示注入残余风险:多层过滤可大幅降低风险,但面对精心构造的对抗性样本仍可能存在漏网之鱼,不建议直接用于处理来自完全不可信来源的 Discord 导出数据。

4. 存储与性能:大型服务器(数十万条消息)的 SQLite 数据库和每日记忆文件可能占用较大磁盘空间,模拟成长过程也需要较长的处理时间。

安全解读

核心用法

Discord Soul 是一套将 Discord 服务器数据转化为"活体AI代理"的完整工作流。用户通过 DiscordChatExporter 导出服务器全部历史消息,经三层安全过滤(Regex模式匹配→Claude Haiku语义评估→安全标记隔离)后,转换为结构化SQLite数据库。随后按时间顺序生成每日记忆文件,让代理"经历"社区的完整历史,逐步形成 SOUL.md(社区身份)、LEARNINGS.md(模式发现)、AGENTS.md(关键人物)等核心文件。最终通过 OpenClaw 框架将代理绑定到 Telegram 等外部平台,实现与社区的智能交互。

显著优点

创新的安全架构:针对 Discord 公共服务器常见的提示词注入风险,设计了业界罕见的三层防护——快速Regex预过滤拦截明显攻击、低成本Haiku语义评估识别隐蔽注入、最终只使用标记为"safe"的消息。这种"安全即功能"的设计理念在同类工具中较为超前。

沉浸式身份生成:不同于简单的RAG检索,该工具通过"模拟成长"机制让代理按时间顺序"经历"社区历史,使文化身份自然涌现而非人工硬编码。生成的记忆文件支持长期追溯,能回答"上周讨论过什么""谁擅长某领域"等语境化问题。

工程化完整度高:从导出、清洗、转换到模拟、部署、更新,提供20+脚本的全链条自动化,包含增量导出、定时任务、错误排查等生产级功能。SQLite结构化存储保留消息、反应、角色、频道元数据等丰富维度。

潜在局限

数据外泄风险:安全评估层需将Discord消息发送至Anthropic API(约$0.25/百万token),虽成本低廉,但对隐私敏感场景构成障碍,且无法完全本地替代。

依赖外部生态:核心功能绑定DiscordChatExporter(社区维护)和OpenClaw框架(特定AI基础设施),迁移成本较高。

维护复杂度:需管理API密钥、定时任务、多版本增量导出,对非技术用户门槛较高。社区文化模拟效果高度依赖消息质量与历史长度,小型或低频服务器可能生成空洞身份。

适合人群

  • Discord社区运营者:希望为活跃社区创建智能助手,自动回答常见问题、传承社区文化
  • AI实验者与研究者:探索集体记忆数字化、群体身份建模等前沿课题
  • 开源项目维护者:需要追踪长期讨论脉络、识别核心贡献者的技术社区
  • 隐私容忍度中等的场景:能接受消息经云端安全评估,但需对成员知情同意

常规风险

数据合规:处理多用户消息需符合GDPR等平台条款,建议部署前获取服务器成员明确同意。

代理行为不可控:生成的"灵魂"文件包含社区真实互动中的偏见、冲突或不当内容,可能在外部平台输出引发争议的回应。

供应链安全:DiscordChatExporter 为第三方工具,需验证来源完整性;Anthropic API 密钥泄露可能导致配额盗用。

提示词逃逸残余:三层过滤降低但无法消除攻击风险,建议对高敏感场景追加人工审核层。

discord-soul 内容

references文件夹
scripts文件夹
templates文件夹
手动下载zip · 33.7 kB
lancedb.mdtext/markdown
请选择文件