使用说明

核心用法

linux-service-triage 是一款面向运维场景的系统性诊断技能，专为解决Linux服务器应用故障、不可访问或配置错误而设计。其核心工作流涵盖七大维度：服务状态确认、日志证据收集、故障分类、最小修复方案、网络路径验证、重启计划与回滚策略。

执行流程：
1. 范围确认：识别服务名称（systemd单元或PM2进程），确认用户权限边界
2. 证据采集：解析 systemctl status、journalctl、pm2 logs 等输出
3. 故障分类：区分配置错误、依赖缺失、权限拒绝、端口冲突、上游不可达、DNS不匹配六大类
4. 修复提案：提供最小化修复步骤，默认只诊断不执行
5. 网络验证：应用监听 → Nginx代理 → DNS解析 → TLS完整性（如适用）
6. 安全交付：敏感操作需用户显式确认，优先使用 nginx -t 验证配置

显著优点

全链路覆盖：从进程层（systemd/PM2）到网络层（Nginx/DNS）的垂直诊断能力
安全优先设计：只读诊断为默认模式，破坏性操作强制二次确认
结构化输出：统一报告模板（症状-证据-根因-修复-验证-回滚）降低认知负荷
场景化示例：内置权限修复、502错误排查等典型场景的参考实现

潜在局限

非深度工具：明确排除内核调试、性能剖析、安全渗透等高级场景
依赖输入质量：需要用户提供完整的日志片段或状态输出，缺少自动采集能力
TLS管理受限：证书配置需额外确认环境细节，无法自动完成

适合人群

DevOps工程师、SRE、全栈开发者、VPS/独立服务器管理员，尤其适合需要快速恢复线上服务但不愿承担过度操作风险的场景。

常规风险

权限边界误判：用户可能误授权执行高特权命令
配置语法风险：nginx -t 前置检查降低但无法消除配置错误概率
日志信息泄露：用户粘贴日志时可能无意暴露敏感路径或内网信息

安全解读

核心用法

linux-service-triage 是一款诊断指南型 Skill，专注于 Linux 服务故障的标准化排查流程。它不执行任何命令，而是通过结构化问诊帮助用户定位问题根源。使用时需提供服务名称（systemd unit 或 PM2 进程）和故障现象（日志或状态输出），Skill 将输出包含证据分析、根因判定、修复方案及验证步骤的完整诊断报告。

核心工作流程包括：确认服务范围与安全边界 → 收集日志和状态证据 → 按配置错误、依赖缺失、权限问题、端口冲突、上游不可达、DNS 不匹配六大类进行故障归类 → 提供最小化修复方案 → 验证网络路径（应用监听 → Nginx 代理 → DNS 解析 → TLS 检查）。对于需要执行修复命令的场景，Skill 会明确要求用户确认权限后再提供 exact commands。

显著优点

零执行风险：纯 Markdown 文档型设计（T-MD 分类），所有命令仅为参考示例，需用户手动执行，彻底规避远程代码执行风险。

场景覆盖全面：整合 systemd/PM2 进程管理、文件权限诊断、Nginx 反向代理配置、DNS 及 TLS 检查等常见运维痛点，形成端到端的故障排查闭环。

输出标准化：强制使用 TRIAGE REPORT 格式，包含症状、证据、根因、修复计划、验证及回滚步骤，降低沟通成本并留存审计痕迹。

安全设计内置：默认只读诊断，敏感操作需显式确认；推荐 nginx -t 预检、ss 端口验证等安全实践。

潜在缺点与局限性

依赖用户提供信息：若用户未提供 systemctl status、journalctl 等关键输出，Skill 会停止并要求补充，无法主动采集目标系统数据。

无自动化修复能力：所有修复命令均需人工执行，不适合需要批量处理或紧急自动恢复的场景。

高级场景覆盖不足：明确排除内核调试、深度性能分析和安全绕过类需求，复杂网络故障或定制化架构问题可能超出指南范围。

T3 来源可信度：社区/个人开发者维护，无 GitHub 等可信平台背书，尽管代码安全，但诊断建议的持续准确性依赖社区更新。

适合人群

需要标准化排查流程的初级至中级 Linux 运维人员
使用 systemd 或 PM2 管理应用服务的开发者
配置 Nginx 反向代理遇到 502/504 等问题的 Web 工程师
需要安全、可审计诊断指导的企业运维团队

常规风险

| 风险类型 | 说明 |

|---------|------|

| 误操作风险 | 用户复制粘贴命令时可能因环境差异导致意外结果，需严格遵循 "verification → rollback" 流程 |

| 权限管理风险 | 修复命令常需 root 权限，Skill 虽要求确认但无法阻止用户在未授权环境下执行 |

| 信息泄露风险 | 用户粘贴日志时可能包含敏感路径、IP 或内部域名，建议在分享前脱敏 |

| TLS 证书风险 | 涉及证书管理时 Skill 会暂停询问配置细节，防止自动化操作导致证书失效 |

linux systemd nginx troubleshooting devops pm2 dns logs server-admin reverse-proxy permissions

Linux & service basics 内容

references文件夹

手动下载zip · 2.3 kB

triage-commands.mdtext/markdown

请选择文件