data-analyst

📊 一站式数据洞察分析工作台

编辑精选

openclaw开源的数据分析技能,提供SQL查询、数据可视化、报告生成等完整工具链,帮助用户将原始数据转化为可执行的商业洞察。

收藏
5k
安装
1.8k
版本
v1.0.0
CLS 安全性认证2026-05-01
点击查看完整报告 >

使用说明

核心用法

Data Analyst Skill 是一套完整的数据分析工具集,主要包含六大核心功能模块:SQL查询执行、电子表格分析、数据可视化、报告生成、数据清洗和统计分析。用户通过配置数据源后,即可使用预设的SQL模板进行数据探索、时间序列分析、漏斗分析和队列分析,同时支持Python pandas进行CSV/Excel处理,并利用matplotlib/seaborn生成专业图表。

该技能采用"文档+脚本"的轻量架构:SKILL.md提供详尽的代码模板和最佳实践,scripts目录包含data-init.sh(工作空间初始化)和query.sh(多数据库查询执行)两个实用脚本。用户无需编写复杂代码,复制粘贴模板即可完成从数据清洗到洞察输出的全流程。

显著优点

模板丰富度极高:涵盖20+种常见分析场景的SQL模板(日/周/月聚合、MoM对比、留存队列、转化漏斗等),大幅降低SQL编写门槛。Python示例覆盖pandas核心操作、统计检验和可视化最佳实践,对非专业数据人员友好。

方法论体系完整:不仅提供工具,更内置标准化的分析工作流程(定义问题→理解数据→清洗→探索→分析→沟通)和数据质量检查清单,帮助用户建立专业分析习惯。

零网络依赖:纯本地执行设计,所有数据处理在用户环境完成,无数据外泄风险,适合处理敏感业务数据。

开源可扩展:MIT协议允许自由修改,用户可根据业务需求定制SQL模板和报告格式。

潜在缺点与局限性

依赖外部工具链:技能本身不提供执行环境,需用户自行安装sqlite3/psql/mysql客户端及Python数据科学生态(pandas/matplotlib等),环境配置成本较高。

无自动化调度:缺少定时任务机制,无法实现每日/每周报告的自动更新,需配合crontab等外部工具。

可视化能力有限:Python图表生成依赖本地渲染环境,无交互式BI功能(如下钻、筛选),复杂仪表盘需借助其他工具。

SQL注入风险需用户自担:作为查询执行工具,不对用户输入SQL做语义审查,恶意或错误的SQL可能损坏数据库。

适合的目标群体

  • 业务分析师:需要快速产出数据报告,但SQL/Python基础薄弱
  • 产品经理/运营:自主分析用户行为、活动效果,减少数据团队依赖
  • 初创团队:缺乏专职数据工程师,需要轻量级分析方案
  • 数据科学学习者:通过实战模板掌握标准分析流程和代码规范

使用风险

性能风险:大数据量(百万级以上)的pandas操作可能触发内存溢出,建议配合数据库聚合减少数据拉取量。

依赖版本冲突:matplotlib/seaborn等库版本迭代快,旧模板可能出现API不兼容,建议锁定依赖版本。

数据质量陷阱:模板虽提供清洗检查清单,但无法自动修复业务逻辑错误(如埋点缺失导致的漏斗断层),需人工校验。

数据库权限误配:query.sh依赖环境变量传递连接信息,若误用写权限账户执行,存在误删改数据风险,强烈建议配置只读账户。

安全解读

核心用法

Data Analyst Skill 是一套完整的数据分析工具集,旨在将AI Agent转化为数据驱动的决策助手。核心功能包括六大模块:

1. SQL查询执行:支持标准SQL语法,提供常用分析模板(时间聚合、漏斗分析、留存队列等),兼容PostgreSQL、MySQL、SQLite等主流数据库。

2. 电子表格处理:通过Python pandas处理CSV/Excel/Google Sheets,支持数据清洗、透视表、窗口函数等操作。

3. 数据可视化:集成Matplotlib/Seaborn生成专业图表(线图、柱状图、热力图),同时支持终端ASCII图表快速预览。

4. 报告自动生成:提供标准化Markdown报告模板,含执行摘要、关键指标、洞察建议等结构化模块。

5. 数据清洗工具:内置完整的数据质量检查清单,支持缺失值处理、异常值检测(IQR/Z-score)、格式标准化。

6. 统计分析:涵盖描述性统计、相关性分析、假设检验(T检验、卡方检验等)。

显著优点

  • 开箱即用:提供即用型SQL模板和Python脚本,降低数据分析门槛
  • 多源兼容:统一接口处理数据库、表格、API等多种数据源
  • 文档完善:包含最佳实践指南、常见错误警示、分析流程标准化模板
  • 供应链安全:纯Bash/Python实现,无外部依赖包,攻击面极小
  • 企业级合规:通过GDPR数据最小化、CCPA知情权、DLP防护等合规检查

潜在局限

  • SQL注入风险:query.sh脚本对用户输入SQL缺乏语法验证,依赖调用方控制输入源
  • 凭据管理:数据库连接串依赖环境变量,无内置加密或专用凭据管理工具集成
  • 高级分析局限:未内置机器学习/预测分析功能,复杂建模需借助外部库
  • 性能瓶颈:大规模数据处理(TB级)可能受限于本地内存,无分布式计算支持

适合人群

  • 数据分析师:快速执行探索性分析(EDA)和业务报表生成
  • 产品经理:自主分析用户行为漏斗、功能使用数据
  • 运营团队:监控日常指标,生成周报/月报自动化
  • 技术团队:作为数据管道ETL的补充工具,处理临时查询需求

常规风险

1. 数据误操作:DELETE/DROP等危险SQL语句无二次确认机制
2. 凭据泄露:环境变量中的连接串可能在日志/历史记录中暴露

3. 隐私合规:处理含PII数据时需自行脱敏,工具无内置匿名化功能

4. 版本追溯:建议配合Git管理查询版本,避免分析结果不可复现

data-analyst 内容

scripts文件夹
手动下载zip · 9.4 kB
data-init.shtext/x-shellscript
请选择文件