Automate Excel

📊 Excel 批量处理与自动化专家

data-processing榜 #5

基于 openpyxl + pandas 的 Excel 自动化工具集,支持 15+ 种表格处理场景,适合批量合并、筛选、去重、聚合等数据处理任务。

收藏
18.3k
安装
5.5k
版本
0.1.1
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

本 skill 提供完整的 Excel 自动化处理能力,涵盖从基础读写到复杂数据转换的 15+ 种场景。核心使用方式有两种:

1. 脚本直接调用:通过 scripts/ 目录下的独立 Python 脚本执行特定任务,如 merge_sheets.py 合并多表、filter_excel.py 条件筛选、vlookup_multi.py 多表关联等。每个脚本支持 --help 查看参数,可通过命令行或代码调用。

2. 编程 API:基于 openpyxl(保留格式、公式、多工作表)和 pandas(数据分析、透视、合并)双引擎,支持单元格级操作与批量数据处理。提供读取(整表/区域/多 sheet)、写入(新建/追加/多表)、格式保留等完整能力。

显著优点

  • 场景覆盖全面:从简单的 CSV ↔ Excel 转换,到复杂的模板填充、条件格式、多表 VLOOKUP,几乎涵盖日常 Excel 处理的所有需求。
  • 双引擎设计openpyxl 保证格式与兼容性,pandas 提供高效数据分析能力,两者互补。
  • 脚本化 workflow:预置 15+ 个独立脚本,无需重复造轮子,参数清晰、即拿即用。
  • 批量处理能力:支持目录级多文件处理,内置错误捕获与日志记录,适合生产环境。

潜在缺点与局限性

  • 格式保留有限pandas 写入时会丢失原有单元格格式、图表、宏等,需用 openpyxl 单独处理格式。
  • 旧格式支持弱.xls 仅支持读取(依赖 xlrd),无法写入。
  • 大文件性能:超大型 Excel(百万行级)可能内存不足,需分块处理或改用 write_only 模式。
  • 条件格式与图表:当前仅支持基础条件格式,复杂图表、数据透视表需手动操作。

适合人群

  • 数据分析师、财务人员:处理定期报表、多表合并、数据清洗。
  • 开发者/自动化工程师:构建数据处理 pipeline、ETL 流程。
  • 办公效率提升者:替代重复性手工 Excel 操作。

常规风险

  • 数据覆盖风险:输出文件默认覆盖,需注意备份。
  • 编码问题:CSV 处理时需明确指定编码(如 utf-8-sig 防 Excel 中文乱码)。
  • 科学计数法:长数字(身份证号、订单号)需显式设为文本格式,否则被 Excel 自动转换。
  • 公式计算data_only=True 读取时获取的是缓存值而非公式本身。

Automate Excel 内容

暂无文件树

手动下载zip · 9.2 kB
contentapplication/octet-stream
请选择文件