Automate Excel

📊 Excel 批量处理与数据自动化专家

数据处理榜 #1

基于 openpyxl 与 pandas 的专业 Excel 自动化工具集,支持批量合并、筛选、聚合、格式转换及模板填充,适合数据分析师和办公自动化场景。

收藏
14.1k
安装
5.5k
版本
0.1.2
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

automate-excel 是一套面向 Excel 文件处理的自动化技能,涵盖 16 个专用脚本,可完成从基础格式转换到复杂数据处理的完整工作流。核心能力包括:

数据整合merge_sheets.py 支持多文件/多 sheet 合并;merge_tables.pyvlookup_multi.py 实现类 VLOOKUP 的多表关联,支持 left/inner/outer 连接模式。

清洗转换filter_excel.py 提供列条件筛选(=、>、<、~ 包含);deduplicate_excel.py 按指定列去重;split_excel.py 支持按行数分片或按列值拆分为多个文件;transpose_excel.py 实现行列转置。

分析聚合aggregate_excel.py 内置 sum/count/mean/min/max 等聚合函数,支持分组统计;配合 pandas 可实现复杂数据透视。

格式控制format_conditional.py 支持条件格式(大于/小于/色阶/重复值);format_columns_as_text.py 解决长数字科学计数法显示问题;template_fill.py 通过 {{列名}} 占位符实现批量模板填充。

质量保障validate_excel.py 校验必填列、重复键、空行等业务规则。

技术栈采用 openpyxl(保留格式、公式、多工作表)与 pandas(数据分析引擎)双核心,旧格式 .xlsxlrd 支持只读。

显著优点

  • 开箱即用:16 个独立脚本覆盖 90% 常见 Excel 场景,无需编写复杂代码
  • 格式保全:基于 openpyxl 保留原文件格式、公式、样式,优于纯 pandas 方案
  • 批量友好:内置目录遍历与批量处理模式,支持错误隔离和进度反馈
  • 灵活扩展:提供底层 API 示例,用户可基于模板快速定制业务逻辑

潜在局限

  • .xls 格式仅支持只读,写入需先转换为 .xlsx
  • 极大规模文件(百万行级)内存占用较高,未明确支持流式分块处理
  • 复杂图表、宏、VBA 等内容无法保留或编辑
  • 条件格式仅支持基础规则,不支持自定义公式条件

适合人群

数据分析师、财务/运营人员、Python 自动化开发者、需要替代手工 Excel 操作的办公场景用户。

常规风险

  • 数据覆盖风险:输出文件默认覆盖,建议确认备份或使用版本控制
  • 编码问题:CSV 交互时需关注 UTF-8/BOM 编码,避免中文乱码
  • 精度损失:pandas 读取大整数可能转为 float,关键编号列建议强制文本格式
  • 依赖冲突:openpyxl 与 xlrd 版本需匹配,建议通过 requirements.txt 锁定

Automate Excel 内容

暂无文件树

手动下载zip · 9.0 kB
contentapplication/octet-stream
请选择文件