使用说明

数据分析助手：一站式 Python 数据分析解决方案

核心用法

本 skill 定位于代码生成型数据助手，通过对话指令触发四类核心能力：

1. 数据接入：提供 CSV/Excel/JSON/数据库/API 等多源读取模板，覆盖 pandas 全场景 IO 场景
2. 数据清洗：缺失值处理（删除/均值/众数填充）、重复去重、类型转换、异常值（IQR 法）、字符串标准化
3. 统计分析：描述统计（均值/中位数/标准差/偏度/峰度）、相关矩阵、分组聚合、交叉表、时间序列重采样与滚动窗口
4. 可视化：matplotlib/seaborn 代码片段，含中文设置、基础图表（折线/柱状/散点/箱线/热力图）及高级图表（小提琴图、配对图、时间序列分解）

用户以自然语言下达指令（如"清洗这个数据集，处理缺失值"），系统返回可直接运行的 Python 代码块，降低非技术人员的 Python 上手门槛。

显著优点

即拿即用：所有代码经过中文环境配置（SimHei 字体），开箱即用
体系完整：从数据读取→清洗→分析→可视化→报告生成，形成闭环工作流
业务导向：内置销售分析场景的报告模板（generate_report），含 Top 品类、环比、季节性等指标，贴合电商/运营场景
扩展性强：基于标准 pandas 生态，代码可无缝迁移至 Jupyter、本地 IDE 或云端环境

潜在缺点与局限性

执行环境依赖：需本地预装 Python3 + pandas/matplotlib/seaborn，未提供容器化或在线沙箱方案
无智能推荐：图表选择依赖用户主动提问，缺乏基于数据特征的自动图表建议（如判断数据类型后推荐箱线图或折线图）
大数据风险：提示"大数据集注意内存使用"但未给出具体阈值或分块处理（chunk）示例，可能诱发 OOM
安全空白：安全认证报告为占位文本，未经过实际代码审计或依赖漏洞扫描

适合人群

初级数据分析师：需要现成代码模板快速完成周报
产品经理/运营：无 Python 基础，希望通过复制粘贴完成简单分析
数据科学学习者：作为 pandas 操作速查手册

常规风险

代码执行风险：用户直接运行生成的代码可能覆盖原始数据（未强制要求备份）
统计误用：提供的 IQR 异常值剔除方法可能误伤真实业务波动，需业务二次验证
可视化陷阱：默认配色与中文设置可能与企业 CI 规范冲突，直接用于对外报告存在品牌风险
依赖漂移：模板代码未锁定库版本，pandas/seaborn 升级可能导致 API 不兼容

安全解读

核心评估

数据分析助手（data-analyst-cn）是一款面向中文用户的数据分析技能，基于 pandas、matplotlib、seaborn 等主流 Python 库构建完整的代码模板体系。

显著优点

1. 功能覆盖全面：从数据读取（CSV/Excel/JSON/SQL/API）、清洗（缺失值/异常值/重复值处理）、统计分析（描述统计、相关分析、时间序列）到可视化（基础图表与高级图表）形成完整闭环
2. 模板即战力：提供可直接运行的代码片段，大幅降低数据分析入门门槛，特别适合非技术背景的产品经理和运营人员
3. 自动化报告：内置 generate_report 函数模板，支持一键输出结构化的 Markdown 分析报告
4. 中文适配优化：针对中文字体显示、日期格式等本地化需求做了专门配置

潜在局限

1. 无交互界面：纯代码模板形式，需要用户具备基础的 Python 环境配置能力
2. 性能边界：未针对大数据集（GB级以上）提供优化方案，内存密集型操作可能受限
3. 业务耦合度低：模板通用性强，但需要用户自行结合业务场景调整分析逻辑
4. 版本管理问题：SKILL.md 声明版本（1.0.22）与元数据版本（1.0.52）不一致，存在维护细节疏漏

适合人群

初级至中级数据分析师
需要快速产出数据洞察的产品经理、运营人员
Python 数据分析学习者
需要标准化分析流程的小型团队

常规风险提示

执行代码前需确认数据来源可信度，避免处理敏感个人信息时违反合规要求
模板中的 api.example.com 仅为示例，实际使用时需替换为真实 API 并验证安全性
建议配合虚拟环境使用，隔离依赖冲突风险

data-analysis python pandas visualization business-intelligence code-generator

Data Analyst Cn 内容

手动下载zip · 3.2 kB

SKILL.mdtext/markdown

请选择文件