OpenViking

🗂️ 字节开源 · 分层语义检索 · AI Agent记忆库

字节跳动开源的新一代AI Agent上下文数据库,支持分层检索与MCP协议,实现比传统向量搜索更精准的语义RAG能力

收藏
20k
安装
4.7k
版本
1.0.1
CLS 安全扫描中
预计需要 3 分钟...

使用说明

OpenViking 综合评估

OpenViking 是字节跳动(ByteDance)开源的 Context Database 上下文数据库,专为 AI Agent 设计的新一代 RAG(检索增强生成)系统。与传统扁平向量存储不同,它采用文件系统范式管理知识,通过 URI 路径(如 viking://resources/...)组织上下文,支持 L0/L1/L2 三层级按需加载机制,实现更精准的目录递归检索。

核心用法

  • query:完整 RAG 管道,语义搜索 + LLM 生成答案
  • search:纯语义搜索,返回匹配文档片段
  • add_resource:向知识库添加文件、目录或 URL

部署需克隆 GitHub 仓库、配置火山引擎/Ark API Key(嵌入模型和 VLM),通过 MCP Server 与 Claude 等客户端连接。

显著优点

1. 分层上下文架构:L0 摘要 → L1 概述 → L2 全文,按需加载降低 token 消耗
2. 目录递归检索:比传统 flat vector search 更准确,保留文档结构关系

3. MCP 原生支持:标准化协议,即插即用接入 Claude Desktop 等工具

4. 开源可定制:基于 Python,uv 管理依赖,易于二次开发

潜在局限

  • 依赖单一云服务商:必须使用火山引擎(Volcengine/Ark)API,国内厂商绑定
  • 本地化部署门槛:需自行维护 uv 环境、配置文件和本地向量存储
  • 生态早期:相比 Pinecone/Weaviate 等成熟方案,社区规模和文档完善度有限

适合人群

  • 需要高精度长文档问答的开发者
  • 构建AI Agent 长期记忆系统的技术团队
  • 希望替代传统向量数据库、保留文件层级语义的企业用户
  • 熟悉 Python 生态、能接受火山引擎 API 的中文开发者

常规风险

  • API 密钥泄露ov.conf 明文存储火山引擎 key,需妥善保管
  • 本地数据安全data/ 目录存储原始向量和文档片段,无内置加密
  • 服务可用性依赖:依赖火山引擎 Embedding 和 LLM API 的稳定性
  • MCP HTTP 传输未加密:默认 localhost 通信,公网部署需额外 TLS 防护

OpenViking 内容

暂无文件树

手动下载zip · 2.7 kB
contentapplication/octet-stream
请选择文件