使用说明

核心用法

cluster-agent-swarm 是一个多 Agent 协同的 Kubernetes/OpenShift 平台运维系统，包含 7 个专业角色：

| Agent | 职责 | 典型场景 |

|-------|------|---------|

| **Orchestrator (Jarvis)** | 任务路由与协调 | 跨 Agent 工作流编排、每日站会汇总 |

| **Cluster Ops (Atlas)** | 集群生命周期管理 | 节点扩缩容、升级、etcd 备份、网络排障 |

| **GitOps (Flow)** | 持续交付 | ArgoCD 应用同步、Helm/Kustomize 部署、回滚 |

| **Security (Shield)** | 安全治理 | RBAC 审计、CVE 扫描、策略验证、Secret 轮换 |

| **Observability (Pulse)** | 监控与告警 | Prometheus 指标查询、日志分析、事件响应 |

| **Artifacts (Cache)** | 制品管理 | 镜像扫描、SBOM 生成、制品晋级 |

| **Developer Experience (Desk)** | 开发者支持 | 命名空间申请、配额管理、新人引导 |

使用前提：需配置 KUBECONFIG、云厂商凭证（AWS/Azure/GCP）、以及可选的 ArgoCD/Vault 等集成。

交互模式：通过 @Mention 跨 Agent 通信，基于心跳调度（5-15 分钟间隔）异步协作，关键操作需人工审批。

---

显著优点

1. 专业化分工：每个 Agent 有明确定义的角色（SOUL），避免通用型 Agent 的职责模糊问题
2. 多云支持：原生支持 OpenShift、EKS、AKS、GKE、ROSA、ARO 六大平台
3. GitOps 原生：深度集成 ArgoCD，支持同步波、钩子、ApplicationSet 等高级特性
4. 安全内建：RBAC 审计、镜像扫描（Trivy/Cosign/Syft）、策略即代码（OPA/Kyverno）
5. 持久化审计：所有操作记录到 WORKING.md、LOGS.md、MEMORY.md，满足合规需求

---

潜在缺点与局限性

| 问题 | 说明 |

|------|------|

| **凭证配置繁重** | 需同时准备 K8s + 云厂商 + 可选服务（ArgoCD/Vault/Registry）的多套凭证 |

| **生产操作风险** | 虽然声称"生产变更需人工审批"，但这是**流程控制而非技术强制**，需外部审批门限制 |

| **脚本化安装** | 非纯指令型 Skill，会从 GitHub 拉取并执行脚本，存在供应链风险 |

| **状态持久化副作用** | Agent 自动提交文件变更，若仓库权限过大，可能扩大误操作影响范围 |

| **心跳调度延迟** | 非实时响应（5-15 分钟心跳），不适合需要秒级响应的紧急场景 |

---

适合人群

平台工程团队：需要统一管理多集群、多租户 K8s 平台的 SRE/Platform Engineer
中大型 DevOps 团队：已有 ArgoCD、Prometheus、Vault 等工具链，希望用 Agent 自动化运维
多云战略企业：同时运行 AWS/Azure/GCP 托管集群，需要统一运维界面
合规敏感行业：金融、政务等需要完整操作审计和 RBAC 治理的场景

不适合：单集群小规模团队、无成熟 GitOps/监控基础设施的初创公司、追求极简工具链的用户。

---

常规风险

1. 权限过度授予：安装文档要求多种高权限凭证（AWS 密钥、Azure SP、GCP SA），若直接授予 cluster-admin 或 Owner 级别，违反最小权限原则
2. 生产环境误操作：*-cleanup.sh、*-delete.sh、*-promote.sh 等脚本具有破坏性，需在非生产环境充分验证
3. 供应链攻击面：脚本可能下载 Trivy、Cosign 等二进制，需确保来源为官方渠道并校验签名
4. 凭证泄露：多环境变量管理复杂，.env 文件或 shell history 可能成为泄露点
5. Agent 幻觉导致级联故障：多 Agent 协作时，一个 Agent 的误判可能通过 @Mention 触发其他 Agent 连锁操作

安全解读

核心用法

Cluster Agent Swarm 是一个面向 Kubernetes/OpenShift 平台的多代理协调系统，包含 7 个专业化角色代理：

Orchestrator (Jarvis)：任务路由与跨代理协调
Cluster Ops (Atlas)：集群生命周期、节点管理、升级运维
GitOps (Flow)：ArgoCD 应用同步、Helm/Kustomize 部署
Security (Shield)：RBAC 审计、策略管理、CVE 扫描
Observability (Pulse)：Prometheus/Loki 指标日志查询
Artifacts (Cache)：镜像仓库管理、SBOM 生成、制品晋级
Developer Experience (Desk)：命名空间供应、开发者自助服务

用户通过 @提及 机制在任务线程中与特定代理交互，各代理按 5/10/15 分钟间隔错峰心跳唤醒，避免资源争抢。

显著优点

1. 角色专业化：每个代理有明确的 SOUL 定义和职责边界，避免通用代理的能力模糊
2. 多平台覆盖：支持 OCP、EKS、AKS、GKE、ROSA、ARO 等主流 Kubernetes 发行版
3. 完备文档：36 个脚本、~6800 行代码均有详细注释，包含完整的安全警告和最佳实践
4. 可观测性集成：内置 Prometheus、Loki、Alertmanager 查询能力，无需额外工具
5. 审计友好：所有操作记录到 WORKING.md、LOGS.md、MEMORY.md，支持事后追溯

潜在缺点与局限性

1. 凭证依赖重：需要配置 AWS/Azure/GCP 多云平台凭证及 Kubeconfig，配置复杂度较高
2. eval 使用风险：可观测性脚本使用 eval curl 动态构建请求，存在命令注入风险（虽未直接暴露用户输入）
3. 破坏性操作无技术强控：kubectl delete 等危险操作依赖"人工审批"的程序声明，非技术强制拦截
4. 外部工具动态下载：脚本提示从 GitHub raw 安装 syft、trivy 等工具，供应链安全风险需用户自行把控
5. 持久化状态风险：MEMORY.md 等文件的自动 commit 机制可能扩大误操作影响范围

适合人群

平台工程师/SRE：需要管理多集群、多租户 Kubernetes 平台的团队
DevOps 工程师：负责 GitOps 工作流、CI/CD 集成的技术人员
安全运维人员：需要进行 RBAC 审计、镜像扫描、合规检查的安全团队
中大型企业：具备一定 Kubernetes 运维基础，有明确的环境隔离（dev/qa/staging/prod）实践

不适合：无 Kubernetes 基础的个人用户、追求零配置开箱即用的场景、无多集群管理需求的单集群环境。

常规风险

| 风险项 | 等级 | 说明 |

|--------|------|------|

| 云凭证泄露 | 高 | 需配置多平台云凭证，应使用专用服务账号而非主账号 |

| 生产误操作 | 中 | 破坏性操作依赖人工审批声明，建议增加技术层面的 dry-run 默认 |

| 供应链攻击 | 中 | 外部工具下载提示需用户手动校验完整性 |

| 命令注入 | 低-中 | eval curl 模式理论上存在注入可能，当前版本未直接暴露用户输入 |

| 权限过大 | 中 | etcd 备份等操作需集群管理员权限，应严格审计 |

使用建议

1. 沙箱优先：务必在 dev/qa 环境充分测试后再用于生产
2. 最小权限：为各代理创建专用 IAM 角色/ServiceAccount，禁止 cluster-admin 泛化授权
3. 技术管控：在平台层增加准入控制器，对 delete/patch 等操作进行二次确认
4. 凭证隔离：生产凭证绝不放入开发环境，使用 Vault 等工具动态注入
5. 定期审计：利用 Shield 代理的 RBAC 审计功能，持续监控权限配置漂移

kubernetes openshift gitops argo-cd multi-agent platform-engineering observability security-scanning devops sre cloud-native helm kustomize

Kubernetes Agent Swarm 内容

agents文件夹

assets文件夹

incidents文件夹

logs文件夹

memory文件夹

skills文件夹

artifacts文件夹

scripts文件夹

cluster-ops文件夹

scripts文件夹

developer-experience文件夹

scripts文件夹

gitops文件夹

scripts文件夹

observability文件夹

scripts文件夹

orchestrator文件夹

scripts文件夹

qmd文件夹

security文件夹

scripts文件夹

troubleshooting文件夹

working文件夹

手动下载zip · 167.1 kB

AGENTS.mdtext/markdown

请选择文件