baidu-search

🔍 中文智能搜索一键触达

基于百度千帆AI搜索API的实时网络搜索工具,支持多维度过滤与资源类型筛选,适合需要中文信息检索的研究与办公场景。

收藏
5.1k
安装
1.3k
版本
v1.1.0
CLS 安全性认证2026-05-06
点击查看完整报告 >

使用说明

核心用法

baidu-search 是一个调用百度千帆AI搜索API的命令行工具,通过 Python 脚本实现网络搜索功能。用户以 JSON 格式传入搜索参数,包括查询词、版本选择(standard/lite)、资源类型过滤(网页/视频/图片/智能卡片)、站点限定、时间范围筛选及安全搜索开关等。脚本将请求发送至百度官方API,返回结构化搜索结果,并自动移除敏感字段后输出。

显著优点

1. 中文搜索优势:依托百度搜索引擎,对中文内容、国内站点及百科类资源有天然优势,适合中文用户的信息检索需求。

2. 灵活的过滤能力:支持站点白名单/黑名单、时间范围(周/月/半年/年)、资源类型配额分配等多维度筛选,满足精细化搜索场景。

3. 安全设计:API密钥通过环境变量管理,避免硬编码泄露;代码结构清晰,使用标准requests库,无动态代码执行风险。

4. 轻量易用:单脚本实现,依赖简单,JSON参数接口便于与其他工具链集成。

潜在缺点与局限性

1. 网络依赖性强:完全依赖百度API服务可用性,无本地缓存或离线能力;未设置请求超时,极端情况下可能阻塞。

2. 隐私考量:所有搜索查询均发送至百度服务器,敏感信息存在被记录风险;虽移除snippet字段,但完整搜索行为仍对外暴露。

3. 功能边界:仅支持搜索功能,无结果摘要生成、内容抓取或深度分析能力;返回结果结构受百度API限制,自定义空间有限。

4. 参数验证不足:对复杂参数(如resource_type_filter)缺乏深度结构校验,错误输入可能导致API报错而非友好提示。

适合的目标群体

  • 需要实时中文网络信息的AI Agent开发者
  • 研究人员、内容创作者进行资料搜集
  • 企业知识库构建中的外部信息补充场景
  • 对百度生态内容(百科、知道、文库等)有优先需求的用户

使用风险

  • 性能风险:百度API响应延迟或限流可能影响实时性;无重试机制,单次失败即退出。
  • 依赖风险:Python 3及requests库为运行前提,环境缺失将导致功能不可用。
  • 成本风险:百度千帆API按调用量计费,高频使用需关注配额与费用。
  • 合规风险:搜索内容需符合百度API使用条款,违规查询可能导致账号受限。

安全解读

核心用法

baidu-search 通过百度千帆 AI 搜索 API(BDSE)提供实时网络检索能力,支持标准版与轻量版两种模式。核心调用方式为 Python 脚本接收 JSON 参数,执行后返回结构化搜索结果。

基础检索:只需提供 query 参数即可发起搜索,默认返回 20 条网页结果。

进阶配置

  • 资源类型控制:通过 resource_type_filter 指定返回内容类型(网页 max 50、视频 max 10、图片 max 30、aladdin max 5)
  • 时间过滤search_recency_filter 支持 week/month/semiyear/year 快速筛选,或使用 search_filter.range.pageTime 进行精确日期范围限定
  • 站点限定search_filter.match.site 可将搜索范围锁定在特定域名(如 baike.baidu.com)
  • 安全过滤safe_search 开启严格内容过滤
  • 站点屏蔽block_websites 排除指定域名结果

显著优点

1. 中文搜索优势:百度在中文网页覆盖、百科内容、贴吧讨论等本土资源方面具有不可替代性
2. 实时信息获取:弥补大模型知识截止缺陷,获取新闻、股价、赛事结果等时效性内容

3. 多模态结果:单一接口同时返回网页、视频、图片、Aladdin 结构化卡片

4. 精细化过滤:时间、站点、安全等级多维过滤,满足专业检索场景

5. 零本地依赖:除标准库外仅需 requests,部署轻量

潜在缺点与局限性

1. API 依赖成本:需申请百度千帆平台 API Key,存在调用配额与费用
2. 结果质量波动:百度搜索结果受 SEO、广告、百家号内容影响,需人工甄别

3. 英文内容弱势:相比 Google/Bing,英文技术文档、学术资源覆盖不足

4. 返回结果上限:单类型结果有硬顶限制(如网页最多 50 条),深度研究需分页策略

5. 地域限制:部分国际站点内容可能因网络环境无法抓取

适合人群

  • 中文内容研究者:需要检索百度百科、知乎、新闻站点等中文生态内容
  • 实时信息需求者:股价、赛事、政策发布等时效性查询
  • 多模态搜索场景:需要同时获取图文视频素材的内容创作者
  • 国内合规环境:受网络环境限制,优先使用国内云服务的团队

常规风险

  • 隐私暴露:搜索查询通过命令行参数传递,可能被进程监控工具记录(RISK-002,info 级别)
  • 输入验证不足:当前仅校验 query 存在性,其他参数直接透传,极端输入可能导致 API 报错(RISK-001,low 级别)
  • API 密钥管理:依赖环境变量 BAIDU_API_KEY,需确保 CI/CD 与本地环境配置正确,避免泄露
  • 供应商锁定:深度集成后迁移至其他搜索引擎需调整参数结构

安全评估结论

认证报告评定为 S 级(88 分),代码结构简洁(77 行),无危险函数、无硬编码密钥、网络请求仅限百度官方 HTTPS 端点。依赖清晰(标准库 + requests),来源可信(T2/GitHub 组织账号)。建议在敏感场景下改用 stdin 传递参数以降低查询词暴露风险。

baidu-search 内容

scripts文件夹
手动下载zip · 2.7 kB
search.pytext/plain
请选择文件