Data Analyst Cn

📊 Python 数据分析一站式工作台

数据分析师专属 AI 助手,集成 Python pandas 完整工作流,提供清洗、统计、可视化一站式解决方案,大幅提升数据处理效率。

收藏
12.1k
安装
3.4k
版本
1.0.46
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

该 skill 是面向数据分析师、产品经理和运营的 Python 数据分析助手,核心功能覆盖数据全生命周期:

1. 数据接入与预览:提供 CSV/Excel/JSON/数据库/API 等多源数据读取模板,以及 shape、info、describe 等快速数据探查方法。

2. 数据清洗:系统化处理缺失值(删除/均值/众数填充)、重复值去重、数据类型转换、IQR 法异常值剔除及字符串标准化。

3. 统计分析:支持描述统计(均值/中位数/标准差/偏度/峰度)、相关矩阵、分组聚合(groupby/agg)、交叉表等标准分析范式。

4. 时间序列分析:包含日期解析、重采样(日/周/月)、滚动窗口统计、差分与百分比变化、季节分解等时序专用工具。

5. 可视化生成:基于 matplotlib/seaborn 提供折线图、柱状图、散点图、箱线图、热力图、小提琴图、配对图等代码模板,含中文显示配置。

6. 自动化报告:内置可复用的报告生成函数模板,自动输出数据概览、关键指标、分布特征、Top 排名及业务建议。

显著优点

  • 模板即最佳实践:所有代码片段均遵循 pandas/pythonic 规范,可直接生产使用
  • 场景覆盖全面:从原始数据到可视化报告,形成完整闭环
  • 中文环境预配置:解决 matplotlib 中文乱码痛点
  • 业务导向设计:报告模板融入销售额、转化率等商业指标

局限性与风险

  • 执行依赖本地 Python 环境:需预先安装 pandas/numpy/matplotlib/seaborn/statsmodels
  • 大数据集内存瓶颈:未提供分块读取(chunksize)或 Dask 分布式方案
  • 统计深度有限:缺少假设检验、回归建模、机器学习等进阶分析
  • 安全空白:安全认证报告显示"未执行安全扫描",代码注入风险未评估

适合人群

初级至中级数据分析师、需快速产出数据洞察的产品与运营人员、Python 数据分析学习者。

常规风险

  • 直接执行未经验证的代码可能覆盖原始数据
  • 自动填充策略(如均值填充)可能扭曲数据分布
  • 异常值剔除标准(1.5×IQR)需结合业务判断

Data Analyst Cn 内容

暂无文件树

手动下载zip · 3.2 kB
contentapplication/octet-stream
请选择文件