使用说明

核心用法

Exa-plus 是基于 Exa AI 神经搜索技术的命令行工具，专为研究人员、投资者、招聘人员和开发者设计。核心功能包括：

1. 多模态搜索：通过 search.sh 脚本执行自然语言查询，支持 auto/neural/fast/deep 四种搜索模式，其中 deep 模式提供深度、全面的结果
2. 精准分类检索：内置 8 类专业类别——news（新闻）、company（公司）、people（LinkedIn 人才）、research paper（学术论文）、github（代码仓库）、tweet（推文）、pdf、financial report（财报）
3. 高级过滤系统：支持域名白名单/黑名单（DOMAINS/EXCLUDE）、日期范围（SINCE/UNTIL）、地理位置（LOCATION）
4. 内容提取：通过 content.sh 批量提取网页全文，便于后续分析

显著优点

语义理解精准：基于向量和神经网络的搜索结果，比传统关键词搜索更智能
专业场景覆盖全：从人才挖掘到学术文献，从代码检索到财经新闻，一站式解决
企业级数据源：直接接入 LinkedIn、arXiv、GitHub、Reuters 等权威平台
开发者友好：纯 Bash 脚本实现，依赖仅 curl 和 jq，轻量可扩展

潜在局限

商业 API 依赖：需自备 Exa API key，存在调用成本和速率限制
中文支持有限：Exa 核心索引以英文内容为主，中文搜索结果质量可能下降
日期过滤刚性：SINCE/UNTIL 要求 ISO 格式，不支持相对时间（如"近30天"）
无结果缓存机制：重复查询会消耗 API 额度

适合人群

VC/PE 投资人进行公司尽调和赛道扫描
招聘团队寻找特定地域/技能的候选人
科研人员追踪最新论文和技术动态
开发者检索 GitHub 代码和开源项目

常规风险

API 密钥泄露风险：配置文件明文存储密钥，需确保 ~/.clawdbot/credentials/exa/ 目录权限为 700
数据合规注意：爬取 LinkedIn 个人信息需遵守 GDPR 等隐私法规
成本控制：deep 模式消耗额度较高，建议在批量任务前设置 NUM 限制

安全解读

核心用法

exa-plus 是一个命令行式的 Exa AI 搜索客户端，通过 shell 脚本封装实现神经搜索功能。用户需在 ~/.clawdbot/credentials/exa/config.json 配置 API Key 后，使用 bash scripts/search.sh 执行搜索，支持通过环境变量灵活控制搜索行为：

搜索类型：TYPE=auto|neural|fast|deep —— 快速匹配到深度研究
内容分类：CATEGORY=news|company|people|research paper|github|tweet|pdf 等垂直领域
域名过滤：DOMAINS= 白名单 / EXCLUDE= 黑名单，精准控制信源
时间范围：SINCE= / UNTIL= ISO 日期格式，筛选时效性内容
地理位置：LOCATION= 国家代码优化本地结果

此外提供 content.sh 用于提取网页全文内容，适合深度阅读和资料归档。

---

显著优点

1. 神经搜索质量：Exa AI 以语义理解著称，相比传统关键词搜索能捕捉概念相关性，特别适合学术研究、人才发现、竞品调研
2. 垂直场景覆盖：内置 LinkedIn 人脉、公司信息、GitHub 代码、金融报告等专业类别，减少噪音
3. 灵活过滤体系：域名白名单 + 时间窗口 + 地理位置的组合，能快速构建可信信息源
4. 安全架构：API Key 外置存储，无硬编码风险；仅依赖 curl/jq 标准工具，无第三方库污染
5. 隐私合规：数据最小化，仅传输搜索查询，不采集用户系统信息

---

潜在缺点与局限性

API 成本依赖：Exa AI 为付费服务（按 token 或请求计费），深度搜索（deep）成本较高，需用户自行管理预算
网络单点依赖：所有功能依赖 api.exa.ai 可用性，离线场景完全失效
中文支持有限：Exa 训练语料以英文为主，中文搜索结果质量和召回率可能弱于英文
无结果缓存机制：重复查询会重复计费，需用户自行实现缓存层
配置门槛：需手动获取 API Key 并配置 JSON 文件，对非技术用户不够友好

---

适合人群

研究人员：需要精准检索 arXiv、PubMed 等学术资源
投资人/分析师：追踪公司动态、金融报告、行业新闻
招聘/HR：LinkedIn 人才搜索和背景调研
开发者：GitHub 代码示例和技术文档检索
信息工作者：需要构建个人知识库，替代传统搜索引擎的深度搜索场景

---

常规风险

| 风险类型 | 说明 | 缓解建议 |

|---------|------|---------|

| API 密钥泄露 | 配置文件权限不当可能导致 Key 泄露 | 设置文件权限 `chmod 600`，避免版本控制提交 |

| 费用失控 | 深度搜索或高并发可能产生意外账单 | 设置 Exa 控制台用量告警，生产环境加请求限流 |

| 结果偏差 | AI 搜索存在训练数据偏见，可能遗漏小众观点 | 交叉验证多个信源，不依赖单一搜索结论 |

| 服务中断 | Exa AI 服务不可用或 API 变更 | 关注官方变更日志，保留备用搜索方案 |

search-engine ai-search web-scraping linkedin research news api-integration data-intelligence

Exa 内容

scripts文件夹

手动下载zip · 3.5 kB

code.shtext/x-shellscript

请选择文件