RAG Search

🔍 职业健康法规智能检索引擎

面向职业健康领域的最小化RAG检索后端组件,专注法规标准精准召回,需配合上层应用使用

收藏
8.6k
安装
2.9k
版本
0.1.1
CLS 安全性认证2026-05-20
点击查看完整报告 >

使用说明

核心用法

rag-search 是一个轻量级检索增强生成(RAG)后端技能,专为职业健康领域的法规标准文档检索设计。用户通过自然语言查询触发检索,系统返回结构化的相关文本片段,包含原始内容、来源文件、条款编号、法规层级及相关性评分。

显著优点

1. 领域专业化:针对GBZ职业卫生标准体系优化,理解专业术语如"PC-TWA"、"职业接触限值"等
2. 结构化输出:返回标准化JSON格式,含regulation_level字段便于区分国家法律/标准/行业规范层级

3. 可解释性强:每条结果附带clause条款编号和score相关性分数,支持溯源审计

4. 松耦合设计:作为纯后端组件,可与occupational_health_qaoccupational_health_report_writer等上层应用灵活组合

潜在局限

  • 非终端技能:明确禁止直接面向终端用户,必须由封装层调用
  • 检索范围受限:仅覆盖预构建的职业健康法规知识库,无法实时扩展
  • 无生成能力:仅做检索召回,不包含LLM答案生成或总结功能
  • 评分阈值敏感score字段的 cutoff 策略需调用方自行决策

适合人群

职业健康AI系统开发者、企业EHS平台集成工程师、需要构建合规问答或报告生成系统的技术团队。

常规风险

  • 知识库更新延迟可能导致引用失效标准
  • 条款边界切分误差造成上下文丢失
  • 高相关度低权威性结果(如草案文件)需人工复核

安全解读

核心用法

rag-search 是一个专为职业卫生合规场景设计的后端检索组件,采用RAG(检索增强生成)架构实现向量语义搜索。用户通过自然语言查询职业卫生法规标准(如"GBZ 2.1-2019 苯 职业接触限值"),系统返回结构化检索结果,包含原文内容、标准编号、条款号、法规层级及相关性评分。

调用方式:需通过系统内部调用,不建议终端用户直接使用。面向用户的场景应使用 occupational_health_qaoccupational_health_report_writer 等上层封装技能。

显著优点

1. 精准法规召回:基于向量语义检索,可突破关键词匹配局限,理解同义表述和专业术语变体
2. 结构化输出:返回结果包含 content/source/clause/regulation_level/score 等完整字段,便于下游处理

3. 权威来源标识:明确标注法规层级(国家法律/国家标准/行业标准),辅助合规判断

4. 零第三方依赖:仅依赖本地封装的 search_pipelineembedding_client 模块,供应链攻击风险极低

5. 隐私友好设计:仅处理查询输入,不收集或存储用户敏感信息,符合GDPR数据最小化原则

潜在缺点与局限性

1. 非直接可用:明确标注为后端组件,终端用户无法直接调用,使用门槛较高
2. 本地部署依赖:依赖硬编码的本地向量数据库路径(/root/.openclaw/workspace/rag_system/data/vectors.db),跨环境迁移需手动调整

3. 模块导入非标准:通过 sys.path.insert 运行时修改路径导入本地模块,不符合Python包管理最佳实践

4. 输入验证缺失:当前未对查询参数进行长度和内容校验,存在异常输入风险

5. 错误信息未脱敏:异常返回包含完整堆栈信息,可能泄露内部路径结构

适合人群

  • 职业卫生合规系统开发者:需集成法规检索能力的后端工程师
  • 企业EHS平台搭建者:构建内部职业健康管理系统的技术团队
  • 法规数据库维护方:已有标准化法规向量库,需轻量级检索接口的机构

常规风险

| 风险项 | 等级 | 说明 |
|--------|------|------|
| 本地文件系统访问 | 低 | 仅限读取本地向量数据库,无写入或外传操作 |
| 模块路径注入 | 低 | 运行时修改sys.path,封闭环境内风险可控 |
| 输入污染 | 中 | 缺乏长度限制和过滤规则,建议上层应用做好防护 |
| 依赖漂移 | 低 | 本地模块版本需与向量库格式保持兼容 |

安全认证摘要

经 CLS-Certify v2.1.0 全量扫描,获 S级(90分) 安全评级,雷达图显示静态代码分析95分、动态行为分析85分、依赖审计与网络分析均满分。无威胁模式匹配、无敏感信息泄露、无硬编码凭据,符合GDPR/CCPA合规要求。

RAG Search 内容

手动下载zip · 3.4 kB
handler.pytext/plain
请选择文件