Local Rag Search

🔍 零 API 成本的智能语义搜索

基于 RAG 语义相似度排名的本地网页搜索技能,无需外部 API 即可通过 DuckDuckGo、Google 等多引擎获取智能搜索结果

收藏
11.3k
安装
3.9k
版本
0.1.0
CLS 安全性认证2026-06-03
点击查看完整报告 >

使用说明

核心用法

Local RAG Search 是一套无需外部 API 即可实现智能网页搜索的 MCP 技能,通过本地 RAG(检索增强生成)语义相似度排名机制,从 DuckDuckGo、Google、Bing、Brave、Wikipedia 等多个搜索引擎获取并智能排序结果。

该技能提供 5 个核心工具:rag_search_ddgs(隐私优先的 DuckDuckGo 搜索)、rag_search_google(技术/深度搜索)、deep_research(多引擎综合研究)、以及两个单引擎快捷版本。支持自然语言查询、参数调优(num_results/top_k)、多后端组合,适用于快速问答、技术调研、多视角研究等场景。

显著优点

1. 零 API 成本:完全本地化运行,无需申请或付费任何搜索引擎 API
2. 隐私可控:DuckDuckGo/Brave 等引擎不追踪用户,Google 提供最全覆盖

3. 语义智能排序:基于 RAG 的相似度评分,优先返回与查询语义最相关的结果

4. 多引擎聚合deep_research 支持最多 9 种后端组合,避免单一引擎偏见

5. 灵活参数:可精细控制召回量(num_results)和最终输出量(top_k

潜在局限

  • 首次搜索需加载模型,存在冷启动延迟
  • 多后端并发会显著降低响应速度
  • 依赖搜索引擎本身的质量,无法访问付费墙内容
  • 本地 RAG 评分可能与商业语义模型存在差异

适合人群

  • 需要高频网页检索但不愿承担 API 费用的开发者
  • 对搜索隐私敏感的研究人员和个人用户
  • 需要多源信息交叉验证的内容创作者
  • 构建本地知识工作流的技术团队

常规风险

  • 搜索结果时效性取决于引擎索引,可能非实时
  • 需自行验证关键事实,避免单一信源依赖
  • Google 后端存在搜索行为追踪风险
  • 模型缓存可能占用本地计算资源

安全解读

Local RAG Search 技能评估

核心用法

Local RAG Search 是一款纯文档型 Agent Skill,旨在指导用户高效使用 mcp-local-rag MCP 服务器进行语义化网页搜索。该技能本身不包含可执行代码,而是作为配置与使用指南,帮助 LLM 调用底层 MCP 服务器完成搜索任务。

五大核心工具

| 工具 | 适用场景 |
|------|---------|
| `rag_search_ddgs` | 隐私优先的一般查询,DuckDuckGo 后端 |
| `rag_search_google` | 技术/科学类深度查询,Google 后端 |
| `deep_research` | 多引擎综合研究,支持 10+ 搜索引擎 |
| `deep_research_google` | 纯 Google 深度研究快捷方式 |
| `deep_research_ddgs` | 纯 DuckDuckGo 深度研究快捷方式 |

关键特性

  • 语义相似度排序:采用 RAG(检索增强生成)技术对搜索结果进行相关性评分
  • 多引擎聚合:可组合 DuckDuckGo、Google、Bing、Brave、Wikipedia 等多种后端
  • 隐私可控:DuckDuckGo 默认不追踪用户,Google 覆盖全面但有追踪
  • 零 API 依赖:无需申请 Google API Key 等外部凭证

显著优点

1. 隐私友好架构:相比传统搜索方案,本地 RAG 搜索无需向 LLM 服务商暴露完整搜索历史,DuckDuckGo 后端更是默认无追踪
2. 语义理解能力:超越关键词匹配的 RAG 评分机制,能识别查询意图与内容的相关性

3. 多源交叉验证deep_research 支持同时查询多个搜索引擎,便于获取多元视角

4. 参数灵活调优:通过 num_results(初始获取量)与 top_k(最终返回量)精确控制搜索深度

5. 技术栈透明:MIT 协议开源,作者信息公开(nkapila6),可追溯可审计

潜在局限

1. 依赖上游 MCP 服务器:本 Skill 仅为文档指南,实际搜索能力依赖 mcp-local-rag 服务器,需单独部署
2. 首次加载延迟:MCP 服务器首次运行需加载语义模型,存在冷启动时间

3. 多引擎性能权衡:后端越多结果越全面,但响应时间线性增加

4. 无实时缓存机制:每次查询均需实时调用搜索引擎,无法离线使用

5. 搜索结果质量波动:依赖底层搜索引擎的实时结果质量,不受本 Skill 控制

适合人群

| 用户类型 | 使用场景 |
|---------|---------|
| 隐私敏感型用户 | 需要搜索但不希望被追踪行为数据 |
| 研究人员 | 需要跨多源验证信息、获取多元观点 |
| 技术开发者 | 查询技术文档、API 参考、最佳实践 |
| 内容创作者 | 快速收集背景资料、核实事实 |
| 企业用户 | 无需申请 API Key 即可启用搜索能力 |

常规风险与注意事项

隐私层面

  • DuckDuckGo 不追踪,但 Google 后端会记录搜索行为
  • 敏感查询建议明确指定 rag_search_ddgs

信息准确性

  • 搜索结果时效性取决于底层引擎索引,可能存在延迟
  • 重要决策建议交叉验证,使用 deep_research 多引擎模式

上游依赖

  • 需关注 mcp-local-rag 仓库的安全更新
  • Docker 部署时需确认镜像来源可信

性能预期

  • 复杂 deep_research 查询可能耗时 10-30 秒
  • 首次查询需等待模型加载完成

安全评级说明

本 Skill 经 CLS-Certify v2.1.0 六维扫描:S 级(92 分)

  • 纯 Markdown 文档,无可执行代码
  • 零外部依赖,无 CVE 漏洞风险
  • 无敏感数据收集,符合 GDPR/CCPA
  • 来源可信(T2 级),作者信息公开透明

Local Rag Search 内容

手动下载zip · 4.7 kB
package.jsonapplication/json
请选择文件