lllllllama

safe-debug

安全调试深度学习错误

安全 79

深度学习调试常常导致投机性的补丁，破坏研究可复现性。本技能提供保守的诊断，并在任何代码修改前设置明确的审批门控，使调试修复与研究贡献保持分离。

🚂

run-train

Run Training Commands with Structured Evidence

低风险 77

Deep learning training runs often lack reproducible evidence and clear status reporting. This skill executes a selected training command conservatively and writes standardized training evidence to train_outputs/.

repo-intake-and-plan

扫描代码库并规划 AI 复现

低风险 74

手动扫描 AI 代码库以查找复现命令既耗时又容易出错。本技能通过自动化 README 优先分析来提取文档化的命令，并生成最小化的可信赖复现计划。

paper-context-resolver

利用上下文解决论文复现差距

安全 72

在复现 AI 研究时，仓库 README 往往会遗漏数据集划分、评估协议或预处理细节等关键信息。此技能可从原始论文源中解决这些狭窄的复现问题，同时保留 README 优先的指导原则。

minimal-run-and-audit

执行和审计AI仓库复现命令

低风险 73

运行AI论文复现实验需要一致的命令执行和标准化的报告。该技能执行冒烟测试、推理运行或评估命令，同时自动生成结构化输出包用于审计跟踪。

explore-run

规划有界探索性实验运行

低风险 78

深度学习研究人员需要快速运行探索性试验，但不应过度声称结果。本技能生成预算感知的变体矩阵，并附带公平比较的免责声明，将探索性证据与可信基线明确分离。

explore-code

Plan Safe ML Code Changes with Rollback Awareness

安全 80

Deep learning researchers need to explore code modifications without breaking trusted baselines. This skill creates conservative, auditable change plans with explicit rollback paths for isolated worktrees.

env-and-assets-bootstrap

引导式AI研究环境和资产配置

低风险 73

配置AI研究环境以复现论文是一项复杂且容易出错的工作。此技能自动化保守的conda优先环境创建和资产路径规划，以减少配置摩擦。

🔍

analyze-project

安全地分析深度学习项目

低风险 78

理解一个新的深度学习代码库既耗时又容易出错。本技能提供只读静态分析，可在不修改代码或运行昂贵的训练任务的情况下，映射模型结构、训练入口点和可疑模式。

ai-research-reproduction

Reproduce AI research repositories with auditable evidence

中风险 76

Reproducing deep learning papers is slow and error-prone because commands, datasets, and assumptions are scattered across READMEs. This skill reads the repository first, selects the smallest documented target, and writes a standardized repro_outputs/ bundle with evidence, deviations, and human decision points.

ai-research-explore

探索新颖深度学习研究候选方案

中风险 71

研究人员难以系统化地探索和排序新颖的深度学习想法并保持科学严谨性。本技能在 current_research 之上提供可审计的候选探索，包含想法筛选、公平比较和受治理的实验工作流。