使用说明

核心用法

book-reader 是一款专为 AI Agent 设计的命令行书籍阅读工具，支持从多个来源获取书籍并进行结构化阅读。用户可通过 ./book-reader.sh search 搜索书籍（对接 Project Gutenberg 的 gutendex.com API），使用 download 命令获取指定书籍文件，再通过 read 命令进行分块阅读。工具内置智能分块机制，默认每次阅读 50 页，支持 --from-page 和 --pages 参数灵活控制阅读范围。阅读进度自动持久化存储于 ~/.openclaw/workspace/memory/reading-state.json，包含当前书籍、已读页数、书签和笔记等元数据，实现跨会话的断点续读。

显著优点

多源整合能力：同时覆盖 Project Gutenberg（7 万+ 公共领域书籍，完全合法）、Anna's Archive（百万级资源，需自负法律风险）及本地文件三大来源，满足不同场景需求。格式兼容性强：原生支持 EPUB、PDF、TXT 三种主流电子书格式，通过 pandoc、pdftotext 及 Python 库（ebooklib、beautifulsoup4）实现可靠解析。AI 友好设计：智能分块阅读避免上下文窗口溢出，支持摘要生成与知识提取，专为 Agent 学习场景优化。隐私优先架构：所有阅读状态本地存储，无云端同步或数据上传，用户完全掌控个人数据。开源透明：MIT 许可证，代码完全可见，无混淆或隐藏逻辑。

潜在缺点与局限性

法律边界模糊：Anna's Archive 属于影子图书馆，其使用在多数司法管辖区处于法律灰色地带，用户需自行承担合规风险。DRM 明确不支持：设计层面拒绝处理 DRM 保护内容，无法阅读 Kindle、Apple Books 等平台的加密书籍。解析质量波动：PDF OCR 质量依赖源文件，扫描版 PDF 可能出现乱码；EPUB 转纯文本时格式信息丢失，复杂排版还原度有限。性能瓶颈：大型 PDF 解析速度较慢，未实现异步或流式处理。依赖管理负担：需手动安装 poppler-utils、pandoc、Python 库等系统依赖，跨平台配置成本较高。无社交功能：缺乏阅读统计可视化、书友互动或跨设备同步等现代阅读应用常见功能。

适合的目标群体

AI 研究者与开发者：需要为 Agent 构建知识库、进行书籍级 RAG 训练或自动化摘要生成的技术用户。学术研究者：从事人文社科研究，需批量处理公共领域文献、构建文献综述的研究人员。自驱型终身学习者：偏好开源工具、重视数据隐私、习惯命令行工作流的深度阅读者。法律与合规意识强的用户：能够辨识公共领域与受版权保护内容边界，主动选择合法书源的责任使用者。

使用风险

合规风险：误用 Anna's Archive 获取受版权保护书籍可能导致法律纠纷，建议优先使用 Project Gutenberg 并遵守当地版权法。依赖可用性：外部工具（pandoc、poppler-utils）的版本差异可能导致解析行为不一致，建议锁定依赖版本。数据丢失风险：阅读状态仅存储于本地单点文件，无备份机制，系统故障或误删将导致进度丢失。网络安全：下载阶段涉及网络请求，需确保 URL 来源可信，防范中间人攻击或恶意文件注入。性能风险：处理超大 PDF（数百 MB 级）可能触发内存压力，建议在资源充足环境中运行。

安全解读

核心用法

book-reader 是一款专为AI Agent设计的书籍阅读Skill，支持从多个来源获取并处理全本图书。主要功能包括：

搜索与获取：通过Project Gutenberg API（gutendex.com）搜索70,000+公版书籍，支持Anna's Archive及本地文件
多格式解析：原生支持EPUB（ebooklib+BeautifulSoup）、PDF（pdftotext）、TXT，自动转换为可处理的纯文本
分段阅读：--pages N 参数实现智能分块，避免一次性加载大文件导致的上下文溢出
状态持久化：进度自动保存至 ~/.openclaw/workspace/memory/reading-state.json，支持书签与阅读笔记

显著优点

1. 安全可信：S级安全认证（95分），无危险函数调用，无第三方依赖包，仅使用系统标准工具
2. 来源合规：核心依赖Project Gutenberg公版书库，完全合法；明确标注Anna's Archive的法律灰色地带，引导用户负责任使用
3. 隐私优先：阅读状态本地存储，零数据外传，通过GDPR/CCPA合规检查
4. 工程简洁：490行代码实现完整功能，MIT开源许可，维护者来自可信GitHub组织

潜在局限

PDF OCR质量依赖源文件，扫描版PDF解析效果不稳定
EPUB转纯文本会丢失复杂排版格式（表格、图文混排）
无DRM支持（设计如此），无法处理加密商业电子书
大型PDF解析速度较慢，可能影响交互体验

适合人群

需要AI辅助精读长篇著作的研究者与知识工作者
构建个人知识库、进行书籍摘要与提取的AI Agent开发者
注重隐私安全、偏好本地化处理流程的技术用户

常规风险

1. 版权合规：需自行判断下载内容的当地法律适用性，Skill已明确提示"Use responsibly"
2. 依赖工具：需预装poppler-utils、pandoc等系统包，跨平台兼容性依赖用户环境配置
3. 网络来源多样性：除Gutenberg外，Anna's Archive及直接URL来源的声誉"Varies"，存在内容质量与法律风险的不确定性

education-research content-media docs productivity automation

book-reader 内容

手动下载zip · 6.3 kB

book-reader.shtext/x-shellscript

请选择文件