linux-troubleshooting
诊断和解决 Linux 系统问题
Linux 管理员面临着需要结构化诊断的复杂系统故障。此工作流提供了一个七阶段方法,系统地识别根本原因并实施经过验证的修复方案。
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“linux-troubleshooting”。 服务器运行缓慢。开始故障排除。
预期结果:
- 阶段 1 - 初始评估完成:
- - 系统运行时间:45 天
- - 操作系统:Ubuntu 22.04 LTS
- - dmesg 中检测到最近的内核更新
- 阶段 2 - 资源分析:
- - CPU: 进程 java 使用 95% (PID 4521)
- - 内存:已使用 7.8GB/8GB,大量 swap 活动
- - 磁盘:/var 使用率 92%
- 建议操作:调查 Java 进程内存泄漏并清理 /var/log 中的磁盘空间
正在使用“linux-troubleshooting”。 nginx 服务在配置更改后无法启动
预期结果:
- 阶段 6 - 服务故障排除结果:
- - systemctl status nginx: 失败,退出码 1
- - journalctl -u nginx: 'nginx: [emerg] unknown directive' 位于第 47 行
- - 配置测试:nginx -t 显示 /etc/nginx/sites-enabled/default 中的语法错误
- 根本原因:最近的配置编辑引入了无效指令
- 修复:从备份恢复先前的配置并重新加载 nginx
安全审计
安全All 47 static analysis findings are false positives. The SKILL.md file is documentation-only (markdown) containing workflow instructions and example commands. The detected 'backtick execution' patterns are markdown code fence markers (```bash), not Ruby/shell backticks. The 'hardcoded URL' and 'reconnaissance' patterns are documented examples for users, not executable code. No actual security risks detected.
低风险问题 (1)
风险因素
质量评分
你能构建什么
生产服务器停机响应
遵循七阶段工作流诊断生产服务器无响应的根本原因(资源耗尽、服务故障或网络问题),并实施经过验证的修复方案。
性能退化调查
使用资源分析和进程调查阶段识别哪些进程消耗了过多的 CPU 或内存,然后与 server-management 技能协作解决问题。
服务故障诊断
应用服务故障排除阶段诊断 systemd 服务无法启动的原因,使用 error-detective 技能审查日志,并实施配置修复。
试试这些提示
使用 linux-troubleshooting 工作流检查系统健康。从阶段 1(初始评估)和阶段 2(资源分析)开始。运行 uptime,使用 top 和 free 检查 CPU 和内存使用情况,使用 df -h 报告磁盘空间。
关键服务无法启动。遵循阶段 6(服务故障排除)检查 systemctl status,使用 journalctl -u service -f 审查日志,并识别配置问题。然后使用阶段 4(日志分析)在 /var/log/ 中搜索相关错误。
用户无法访问我们的 Web 服务器。执行阶段 5(网络诊断)使用 ip addr 检查网络接口,使用 ss -tulpn 验证监听端口,使用 curl 测试连接,使用 dig 检查 DNS 解析。将结果与防火墙规则关联。
生产服务器正在经历关键问题。运行完整的七阶段 linux-troubleshooting 工作流:(1) 初始评估,(2) 资源分析,(3) 进程调查,(4) 日志分析,(5) 网络诊断,(6) 服务故障排除,(7) 解决。记录每个阶段的发现并实施经过验证的修复。
最佳实践
- 在进入下一阶段之前始终记录每个阶段的发现
- 通过重新运行诊断命令来验证修复方案以确认问题解决
- 在解决后创建预防计划以避免问题重复发生
避免
- 跳过阶段且在没有诊断根本原因的情况下直接重启
- 在验证已识别的根本原因之前实施修复
- 在应用解决方案后未能监控系统稳定性