使用说明

homelab-cluster 是一套面向家庭实验室场景的多层级 AI 推理集群管理方案。该 Skill 不直接执行代码，而是提供完整的架构设计、配置模板和运维最佳实践，帮助用户构建跨越本地 GPU、远程 GPU 和 CPU 备用节点的混合推理基础设施。

核心工作流包括：通过 LiteLLM 网关统一暴露 OpenAI 兼容 API；基于任务类型（代码、推理、对话、视觉等）的智能 MoE 路由；多节点健康监控与自动故障转移；以及针对 Docker 部署的 GPU 内存规划和启动序列优化。

架构成熟度：采用经过实战验证的三层架构（Local/Remote/NAS），明确区分不同硬件角色的职责边界，避免单点故障。

运维深度：提供大量生产级细节，如 Windows Docker 环境下必须使用 volume 而非 bind mount 加载大模型（避免 gRPC-FUSE 死锁）、CUDA 初始化死锁的规避方案、以及 LiteLLM 健康检查端点的正确用法。

安全意识：明确强调凭据管理最佳实践，推荐使用 Azure Key Vault 或 HashiCorp Vault，禁止明文存储和 CLI 参数传递敏感信息。

成本效益：充分利用消费级 GPU（RTX 3090/4090/5090）构建企业级推理能力，详细的 VRAM 规划示例帮助用户最大化硬件利用率。

配置复杂度：需要用户具备 Docker、SSH、网络防火墙、GPU 驱动等多领域知识，新手门槛较高。

平台依赖：部分优化建议（如 Windows Docker volume 策略）具有特定平台局限性，跨平台迁移需重新评估。

无自动化封装：Skill 本身为文档/配置指南，不包含可执行的自动化脚本，用户需自行实现健康检查循环、故障恢复流程等。

社区验证有限：作为 1.0.0 新版本，长期稳定性和边缘场景处理有待更多生产环境验证。

配置错误风险：错误的 GPU 内存规划可能导致 OOM 或模型加载失败；错误的 Docker 启动顺序可能触发 CUDA 死锁。

网络安全风险：默认 HTTP 端点无认证，生产环境必须额外配置 TLS 和访问控制。

供应链风险：依赖 Ollama、llama.cpp、LiteLLM 等外部项目，需持续跟踪安全更新。

运维负担：自动节点恢复涉及 SSH/RDP 凭据管理，配置不当可能引入新的攻击面。

安全解读

homelab-cluster 是一个面向AI推理集群管理的文档型技能，提供从单卡到多节点分布式部署的完整解决方案。核心功能包括：

内置任务分类路由逻辑，自动匹配最优模型：

| 维度 | 评价 |

|------|------|

| **实战深度** | 来自真实homelab battle-tested经验，非理论文档 |

| **问题精准** | 直击Windows Docker大模型部署、CUDA死锁等高频痛点 |

| **架构完整** | 从硬件选型、内存规划到网关统一、故障恢复全链路覆盖 |

| **安全合规** | 明确提示禁用明文凭证，强调vault集成 |

| **零依赖** | 纯Markdown无可执行代码，无供应链攻击面 |

1. 凭证管理：作者虽警告禁用明文，但未提供vault具体配置示例
2. 网络暴露：远程节点RDP/SSH配置不当可能扩大攻击面
3. 资源争用：内存规划示例基于特定量化格式，实际占用因参数而异
4. 单点故障：LiteLLM网关若未做高可用，可能成为集群瓶颈

手动下载zip · 3.2 kB

SKILL.mdtext/markdown

请选择文件