afrexai-disaster-recovery

🛡️ 企业级灾备规划一键生成

基于个人开发者开源项目的纯文档型DR规划技能,为SaaS团队生成符合SOC2/ISO27001/HIPAA合规要求的灾难恢复计划模板,显著降低人工编写成本与合规风险。

收藏
5.1k
安装
1.9k
版本
v1.0.0
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

IT Disaster Recovery Plan Generator 是一款面向基础设施团队的文档生成型技能,通过结构化输入(云服务商、区域部署、数据存储、RTO/RPO目标、团队规模、合规框架、预算层级)自动生成完整的灾难恢复计划文档。用户只需提供技术栈配置和业务约束条件,即可获得包含风险评估矩阵、服务分级分类、故障转移操作手册、备份策略、沟通计划、测试日程及成本模型的标准化DR文档。

显著优点

合规导向设计:内置SOC 2、ISO 27001、HIPAA、PCI DSS四大主流框架的映射关系,自动将DR控制点与具体条款关联,大幅降低审计准备成本。成本敏感架构:提供Startup/Growth/Enterprise三档预算模板,明确标注每项建议的USD成本,避免过度设计。实战可操作性:要求输出具体CLI命令而非抽象描述,每个步骤附带预估耗时,并强制标注单点故障。行业基准数据:引用$5,600/分钟平均停机成本、15-25%基础设施投入的DR预算占比等量化指标,便于管理层决策。分层恢复策略:按RTO将服务划分为Tier 1-3三级,确保关键路径优先恢复,资源分配更合理。

潜在缺点与局限性

纯文档属性:该技能仅生成规划文档,不具备任何自动化执行能力,实际的故障转移、备份验证、监控告警仍需团队自行实施。模板通用性限制:基于AWS/PostgreSQL/Redis/S3等主流技术栈设计,对于采用小众云服务商(如Oracle Cloud、IBM Cloud)或自研中间件的企业,需要大量手动调整。静态知识时效性:RTO/RPO行业基准、合规框架版本、云服务定价等数据可能随时间失效,需定期人工复核更新。个人来源风险:开发者账号为个人身份(1kalin),非企业背书,长期维护承诺存疑。外部链接依赖:文档推广AI Context Packs等付费产品,存在商业引导倾向。

适合的目标群体

  • 早期SaaS创业公司:首次建立DR体系,需要快速产出合规文档以满足客户安全审查
  • 基础设施规模扩张期团队:从单区域向多区域演进,需系统化梳理故障场景
  • 合规驱动型组织:面临SOC 2 Type II或ISO 27001认证审计,需补齐DR控制域文档
  • 技术文档工程师:承担DR计划编写任务,需要结构化模板提升效率
  • 云架构师:为客户或内部团队设计DR方案,需要行业基准参考和成本估算框架

使用风险

执行风险:生成的runbook未经实际演练验证,直接用于生产故障可能导致操作失败,必须配合月度组件故障演练和年度全量DR演练。成本低估风险:文档中的成本模型基于特定假设(如数据量、跨区域流量),实际支出可能因数据增长、API调用激增而偏离预算。合规误读风险:框架映射为通用解读,具体审计要求因审计师理解而异,建议与合规顾问交叉验证。知识过时风险:云服务特性迭代频繁(如AWS新增区域、RDS功能变更),需每季度复核技术准确性。

安全解读

核心用法

该 Skill 是一套结构化灾难恢复(DR)计划生成框架,专为SaaS及云原生团队设计。用户通过提供基础设施栈、RTO/RPO目标、团队规模及合规框架要求,即可获得一份完整的DR文档包,包含风险矩阵、服务分级、故障转移手册、备份策略、沟通计划、测试日程及成本模型。

关键输出组件:

  • 风险矩阵:量化评估区域故障、数据库损坏、勒索软件等威胁的 likelihood × impact
  • 三级服务分级:Critical(RTO<1h)/Important(RTO<4h)/Standard(RTO<24h),指导资源优先级
  • 可执行手册:每步操作附带具体CLI命令与时间估算,拒绝模糊描述
  • 3-2-1备份规则:强制3份拷贝、2种介质、1份异地
  • 合规映射:自动关联SOC 2 CC7.4/7.5、ISO 27001 A.17、HIPAA §164.308(a)(7)、PCI DSS 12.10条款

显著优点

| 维度 | 优势 |
|------|------|
| **专业性** | 内置云架构最佳实践,支持AWS/Azure/GCP多区域、Active-Active/Active-Passive模式 |
| **可落地** | 所有建议分三层预算(Startup/Growth/Enterprise),附带USD成本估算,避免"无限预算"幻觉 |
| **合规就绪** | 输出可直接用于SOC 2 Type II、ISO 27001认证审计的证据材料 |
| **运营闭环** | 包含Tabletop演练、组件故障测试、年度全量DR演练的完整测试矩阵 |

潜在局限

1. 非自动化执行:纯文档型Skill,不直接调用AWS CLI或Terraform,需工程师手动执行手册步骤
2. 依赖输入质量:若用户提供的RTO/RPO目标与架构能力不匹配(如单区域架构要求RTO<1h),输出将包含不可行方案

3. 云厂商偏向性:示例以AWS为主,Azure/GCP细节需用户补充

4. 成本估算为基准:15-25%基础设施DR成本为行业均值,实际受数据量、跨区域流量费用波动影响

适合人群

  • 合规驱动型团队:正在筹备SOC 2 Type II或ISO 27001认证的SaaS公司
  • 事后复盘场景:刚经历 outages、需系统性修补DR漏洞的工程负责人
  • 新团队 onboarding:为8-50人规模的云基础设施团队建立标准化DR流程
  • 年度审计准备:DR plan review周期的自动化文档更新

常规风险

  • 假设验证风险:Skill生成的RTO/RPO可行性依赖用户输入的架构描述准确性,建议在正式采纳前进行架构评审
  • 测试执行风险:Tabletop与真实故障演练存在差距,需配套混沌工程(Chaos Engineering)验证
  • 成本低估风险:跨区域数据复制费用(尤其是S3、RDS快照)可能在账单高峰期显著超出预估
  • 人员单点故障:虽强调"关键人不可用"风险,但runbook有效性仍依赖跨培训实际执行

afrexai-disaster-recovery 内容

手动下载zip · 3.8 kB
README.mdtext/markdown
请选择文件