Kubernetes Agent Swarm

🐝 多智能体 Kubernetes 运维平台

devops榜 #16

多智能体协调系统,覆盖 Kubernetes/OpenShift 全生命周期运维,7个专用代理协同完成集群操作、GitOps、安全、可观测性等任务

收藏
16.6k
安装
6.9k
版本
1.0.2
CLS 安全扫描中
预计需要 3 分钟...

使用说明

核心用法

Cluster Agent Swarm 是一个企业级多智能体平台运维系统,通过 7 个专业化代理(Orchestrator/Cluster Ops/GitOps/Security/Observability/Artifacts/Developer Experience)协同工作,覆盖 Kubernetes 与 OpenShift 全平台。用户可通过统一入口调用完整能力栈,或按需安装独立技能模块。

部署方式

  • 完整安装:npx skills add https://github.com/kcns008/cluster-agent-swarm-skills
  • 单代理安装:通过 GitHub tree 路径指定具体技能

前置要求

  • 集群访问:有效 kubeconfig、kubectl/oc CLI
  • 云凭证:AWS/Azure/GCP 认证(对应平台)
  • 可选集成:ArgoCD、Prometheus、Vault、容器仓库

典型工作流
1. 执行 setup-session.sh 初始化环境上下文

2. 通过 @提及机制跨代理协作(如 @Shield 审核 RBAC 后 @Flow 执行同步)

3. 代理按 staggered heartbeat(5-15分钟间隔)自主唤醒处理任务

显著优点

  • 角色专业化:每个代理有明确定义域,避免通用模型的能力稀释
  • 企业级覆盖:支持 OCP、EKS、AKS、GKE、ROSA、ARO 六大主流平台
  • 安全内建:最小权限原则、生产变更人工审批、全操作审计日志
  • GitOps 原生:深度集成 ArgoCD、Helm、Kustomize,支持多集群 ApplicationSet
  • 人机协作:预定义 guardrails,危险操作强制 human-in-the-loop

潜在局限

  • 凭证复杂度:需预先配置多类云凭证与工具链,初始化门槛较高
  • OpenShift 偏向:虽然声明多平台支持,但 oc CLI 依赖暗示 OCP 优化更深
  • 心跳延迟:非实时响应,P1 事件依赖 5 分钟轮询而非事件驱动
  • 外部依赖重:核心能力依赖 ArgoCD、Prometheus 等外部系统就绪
  • 社区维护状态:GitHub 仓库活跃度与长期维护承诺未经验证

适合人群

  • 运行多集群 Kubernetes/OpenShift 的平台工程团队
  • 已采用 GitOps 工作流并寻求自动化增强的 SRE 组织
  • 需要标准化运维流程、降低人工操作风险的 DevOps 团队
  • 具备成熟凭证管理体系和云原生工具链的中大型企业

常规风险

| 风险类别 | 描述 | 缓解机制 |
|---------|------|---------|
| 凭证泄露 | kubeconfig、云凭证需明文或环境变量配置 | 强制 least privilege、审计日志、禁止代码内嵌 secrets |
| 误操作生产 | 代理可能意外执行破坏性命令 | 生产环境强制人工审批、预定义禁止操作清单 |
| 供应链安全 | 技能包来源为个人 GitHub 仓库(kcns008) | 需代码审计、SBOM 验证、内部镜像托管 |
| 代理冲突 | 多代理并行可能产生竞态条件 | Orchestrator 统一协调、任务状态文件锁 |
| 集成失效 | 外部系统(ArgoCD/Vault)不可用时功能降级 | 优雅降级设计、显式依赖健康检查 |

Kubernetes Agent Swarm 内容

暂无文件树

手动下载zip · 165.9 kB
contentapplication/octet-stream
请选择文件