baidu web search

🔍 实时联网搜索,秒查最新资讯

搜索与信息检索榜 #6

集成百度千帆搜索API,为AI提供实时联网检索能力,适用于新闻查证、事实核实、最新资讯获取等场景,数据来源权威但受限于百度搜索生态。

收藏
15.6k
安装
5.4k
版本
1.0.0
CLS 安全性认证2026-06-05
点击查看完整报告 >

使用说明

核心用法

baidu-web-search 是一个面向 OpenClaw/ClawHub 等平台的网络搜索技能,通过调用百度千帆「百度搜索」API 实现全网实时信息检索。用户触发关键词如「查一下」「搜一下」「最近」「今天」或提出需查证的事件/人物/产品时,AI 应调用本技能执行搜索。

调用方式:执行 node scripts/search.js "<查询内容>" [条数],默认返回 20 条结果,支持 1-50 条自定义。脚本自动从环境变量 BAIDU_API_KEY 或本地 config.json 读取凭证,AI 严禁以任何方式接触配置内容。

输出处理:脚本返回结构化 JSON,包含标题、URL、摘要的搜索结果数组。AI 需结合用户提问整合检索内容,给出准确回答并标注来源,而非简单罗列链接。

显著优点

1. 实时性强:直连百度搜索,可获取当日新闻、最新动态,弥补大模型知识截止限制
2. 中文优化:针对中文搜索场景深度适配,理解「查一下」「今年」等口语化表达

3. 集成便捷:支持 OpenClaw/ClawHub 平台一键配置,环境变量自动注入,本地部署亦仅需复制配置文件

4. 安全设计:API Key 与执行逻辑分离,脚本进程内读取凭证,AI 无权限访问敏感信息

潜在局限

  • 搜索生态依赖:结果质量受百度索引范围限制,部分垂直领域(如学术文献、外文资料)覆盖不足
  • 无高级筛选:暂不支持时间范围、站点限定、文件类型等高级搜索语法
  • 结果可控性弱:依赖百度排序算法,无法自定义排序或过滤低质来源
  • 地域限制:部分国际内容可能因地区设置缺失

适合人群

  • 需实时资讯的媒体工作者、市场分析师
  • 进行事实核查的研究人员、内容创作者
  • 中文语境下频繁查询动态信息的普通用户
  • 构建具备联网能力的 AI Agent 的开发者

常规风险

  • 凭证泄露:用户自行保管 BAIDU_API_KEY,若本地配置未加权限控制或误提交 Git,存在泄露风险
  • 结果可信度:百度搜索结果含商业推广及 SEO 内容,AI 需交叉验证关键信息
  • API 稳定性:依赖百度千帆服务可用性,突发流量可能触发限流
  • 隐私合规:搜索关键词经百度处理,敏感查询需注意数据出境合规要求

安全解读

核心用法

baidu-web-search 是一个 Node.js 技能,通过调用百度千帆「百度搜索」API 实现全网实时信息检索。用户只需提供搜索关键词,即可获取包含标题、URL、摘要的结构化结果。

基本调用方式:

cd 技能根目录/baidu-web-search && node scripts/search.js "<查询内容>" [条数]

典型使用场景:

  • 用户表达「查一下」「搜一下」「最近」「今天」等搜索意图
  • 需要验证事实、获取最新新闻、查询特定人物/事件/产品信息
  • 需要权威来源或技术文档支持回答时

输入参数:

  • query(必填):搜索关键词
  • num_results(可选):返回条数,默认 20,范围 1-50

输出格式: JSON 结构,包含 results(数组,每项含 title/url/snippet)、totalquery

---

显著优点

1. 实时性强:直接对接百度搜索引擎,获取最新网络信息,突破大模型知识截止时间限制
2. 结果结构化:返回格式化的 JSON 数据,便于程序化处理和引用

3. API Key 保护机制完善:SKILL.md 中明确规定了 6 条强制安全规则,禁止任何方式读取或输出 API Key,凭证仅由 scripts/search.js 在进程内读取

4. 多平台适配:支持 OpenClaw/ClawHub 平台(环境变量注入)和本地自托管(config.json)两种方式

5. 代码质量良好:经安全扫描,无危险函数使用,输入验证完善,HTTPS 加密传输

---

潜在缺点与局限性

1. 来源可信度 T3:由上海雷克顿科技(个人/社区开发者)维护,相比官方/企业级项目,长期维护稳定性和安全响应速度存在不确定性
2. 未声明开源许可证:package.json 和 SKILL.md 中均未明确许可证,存在法律使用风险

3. 依赖单一外部服务:完全依赖百度千帆 API,若服务不可用或接口变更,功能将中断

4. 无重试机制:当前 axios 请求未配置指数退避重试,网络波动时可能搜索失败

5. 响应数据未验证:直接解析百度 API 返回数据,未做结构和类型校验,API 变更可能导致运行时错误

6. 搜索数据外发:用户查询词会发送至百度服务器,存在隐私考量

---

适合人群

  • 需要为 AI 助手/Agent 扩展实时搜索能力的开发者
  • 使用 OpenClaw/ClawHub 平台的用户(平台已简化配置流程)
  • 能接受 T3 来源风险、具备代码审查能力的个人开发者或小型团队
  • 对百度中文搜索结果有偏好的中文用户

不适合: 对供应商资质有严格要求的企业生产环境、无法接受数据外发至百度的隐私敏感场景

---

常规风险

| 风险类别 | 等级 | 说明 |
|---------|------|------|
| 供应链攻击 | 中 | T3 来源,需定期审查代码更新,防止恶意代码注入 |
| 凭证泄露 | 低 | 虽有完善保护机制,但用户误操作(如截图暴露 config.json)仍可能导致泄露 |
| 服务中断 | 中 | 依赖百度 API,需关注百度服务可用性 |
| 数据隐私 | 中 | 搜索关键词发送至百度,敏感信息应避免直接搜索 |
| 法律合规 | 低 | 未声明许可证,存在潜在法律不确定性 |

建议缓解措施: Fork 后自行维护、添加请求重试和响应验证、定期运行 npm audit、避免搜索敏感个人信息。

baidu web search 内容

scripts文件夹
手动下载zip · 5.0 kB
search.jstext/javascript
请选择文件