openclaw-serper

🔍 Google 搜索与深度全文提取专家

🥥33总安装量 16评分人数 13
100% 的用户推荐

基于 Serper API 与 trafilatura 技术,实现 Google 搜索并深度提取网页全文内容,为研究提供清洁、结构化的原始文本数据。

A

基本安全,请在特定环境下使用

  • 来自社区或个人来源,建议先隔离验证
  • ✅ 代码安全规范,无 eval/exec/system 等危险函数,无动态代码加载风险
  • ✅ API Key 通过环境变量/.env 文件加载,无硬编码泄露风险,权限申请与功能匹配
  • ✅ 具备完善的输入验证、参数解析和超时机制(3秒页面获取/10秒 API 请求)
  • ⚠️ 依赖第三方 Serper API 服务进行搜索,查询内容将传输至外部服务器,存在网络传输风险
  • ⚠️ 来源为 T3 级个人开发者账号(nesdeq),虽代码质量满足 A 级标准,但长期维护稳定性需关注

使用说明

该 Skill 通过整合 Serper API 与 trafilatura 库,提供比传统搜索更深入的内容获取能力。用户可通过 default 模式获取 5 个全时段搜索结果的全文,或使用 current 模式获取过去一周的最新资讯与新闻。支持通过 --gl--hl 参数精确控制搜索区域与语言,确保非英语查询能返回本地化结果。所有结果均包含完整的页面文本提取,而非简单的搜索摘要,极大提升了信息获取的完整性和效率。

最突出的优势在于"深度内容提取"——利用 trafilatura 算法清洗网页噪声,返回结构化、可读的纯净文本,极大节省了手动复制粘贴和格式清理的时间。双模式设计兼顾了学术研究与时效性新闻追踪的需求。此外,"查询纪律"的强制约束(单次查询即可覆盖广泛内容,限制最多两次调用)有效防止了 API 资源的浪费,体现了良好的资源管理设计。多语言本地化的细致支持也使其具备全球化应用潜力,且代码规范完善,具备完善的错误处理和超时机制。

作为 T3 来源的个人项目,长期维护稳定性存在不确定性。功能上依赖 Serper API 的可用性与定价策略(虽有 2500 次免费额度,但高频使用需付费)。网络环境的波动会直接影响使用体验,且部分网站存在反爬虫机制,可能导致内容提取失败(此时仅返回摘要)。此外,trafilatura 的提取算法虽优秀,但面对极度复杂的网页结构或 JavaScript 渲染内容时,仍可能丢失部分格式或内容,无法完全替代人工浏览。

主要面向学术研究人员、市场分析师、新闻记者、内容策展人以及需要构建知识库的知识工作者。特别适合那些需要从多个网页源快速收集原始文本进行内容分析、竞品调研或文献综述的用户。对于需要追踪最新技术动态、产品发布或时事新闻的 IT 从业者和咨询顾问也是理想工具。同时适用于需要多语言信息收集的全球化团队。

使用风险方面,首先是 API 依赖风险,Serper API 的服务中断或政策变更将直接影响功能可用性。其次是隐私考量,所有搜索查询均会发送至第三方 API,敏感信息不应通过此工具搜索。网络超时设置(3秒页面获取)在慢速网络或大型页面场景下可能导致获取不完整。最后,虽然代码本身安全(A级),但用户需妥善管理 API Key,避免通过版本控制泄露,且需自行承担第三方服务的数据合规责任。

openclaw-serper 内容

文件夹图标scripts文件夹
文件夹图标spec文件夹
手动下载zip · 11.7 kB
search.pytext/plain
请选择文件