核心用法
Exa-plus 是基于 Exa AI 神经搜索技术的命令行工具,专为研究人员、投资者、招聘人员和开发者设计。核心功能包括:
1. 多模态搜索:通过 search.sh 脚本执行自然语言查询,支持 auto/neural/fast/deep 四种搜索模式,其中 deep 模式提供深度、全面的结果
2. 精准分类检索:内置 8 类专业类别——news(新闻)、company(公司)、people(LinkedIn 人才)、research paper(学术论文)、github(代码仓库)、tweet(推文)、pdf、financial report(财报)
3. 高级过滤系统:支持域名白名单/黑名单(DOMAINS/EXCLUDE)、日期范围(SINCE/UNTIL)、地理位置(LOCATION)
4. 内容提取:通过 content.sh 批量提取网页全文,便于后续分析
显著优点
- 语义理解精准:基于向量和神经网络的搜索结果,比传统关键词搜索更智能
- 专业场景覆盖全:从人才挖掘到学术文献,从代码检索到财经新闻,一站式解决
- 企业级数据源:直接接入 LinkedIn、arXiv、GitHub、Reuters 等权威平台
- 开发者友好:纯 Bash 脚本实现,依赖仅
curl和jq,轻量可扩展
潜在局限
- 商业 API 依赖:需自备 Exa API key,存在调用成本和速率限制
- 中文支持有限:Exa 核心索引以英文内容为主,中文搜索结果质量可能下降
- 日期过滤刚性:
SINCE/UNTIL要求 ISO 格式,不支持相对时间(如"近30天") - 无结果缓存机制:重复查询会消耗 API 额度
适合人群
- VC/PE 投资人进行公司尽调和赛道扫描
- 招聘团队寻找特定地域/技能的候选人
- 科研人员追踪最新论文和技术动态
- 开发者检索 GitHub 代码和开源项目
常规风险
- API 密钥泄露风险:配置文件明文存储密钥,需确保
~/.clawdbot/credentials/exa/目录权限为 700 - 数据合规注意:爬取 LinkedIn 个人信息需遵守 GDPR 等隐私法规
- 成本控制:
deep模式消耗额度较高,建议在批量任务前设置NUM限制