已发布技能 11
safe-debug
安全调试深度学习错误
深度学习调试常常导致投机性的补丁,破坏研究可复现性。本技能提供保守的诊断,并在任何代码修改前设置明确的审批门控,使调试修复与研究贡献保持分离。
run-train
Run Training Commands with Structured Evidence
Deep learning training runs often lack reproducible evidence and clear status reporting. This skill executes a selected training command conservatively and writes standardized training evidence to train_outputs/.
repo-intake-and-plan
扫描代码库并规划 AI 复现
手动扫描 AI 代码库以查找复现命令既耗时又容易出错。本技能通过自动化 README 优先分析来提取文档化的命令,并生成最小化的可信赖复现计划。
paper-context-resolver
利用上下文解决论文复现差距
在复现 AI 研究时,仓库 README 往往会遗漏数据集划分、评估协议或预处理细节等关键信息。此技能可从原始论文源中解决这些狭窄的复现问题,同时保留 README 优先的指导原则。
minimal-run-and-audit
执行和审计AI仓库复现命令
运行AI论文复现实验需要一致的命令执行和标准化的报告。该技能执行冒烟测试、推理运行或评估命令,同时自动生成结构化输出包用于审计跟踪。
explore-run
规划有界探索性实验运行
深度学习研究人员需要快速运行探索性试验,但不应过度声称结果。本技能生成预算感知的变体矩阵,并附带公平比较的免责声明,将探索性证据与可信基线明确分离。
explore-code
Plan Safe ML Code Changes with Rollback Awareness
Deep learning researchers need to explore code modifications without breaking trusted baselines. This skill creates conservative, auditable change plans with explicit rollback paths for isolated worktrees.
env-and-assets-bootstrap
引导式AI研究环境和资产配置
配置AI研究环境以复现论文是一项复杂且容易出错的工作。此技能自动化保守的conda优先环境创建和资产路径规划,以减少配置摩擦。
analyze-project
安全地分析深度学习项目
理解一个新的深度学习代码库既耗时又容易出错。本技能提供只读静态分析,可在不修改代码或运行昂贵的训练任务的情况下,映射模型结构、训练入口点和可疑模式。
ai-research-reproduction
Reproduce AI research repositories with auditable evidence
Reproducing deep learning papers is slow and error-prone because commands, datasets, and assumptions are scattered across READMEs. This skill reads the repository first, selects the smallest documented target, and writes a standardized repro_outputs/ bundle with evidence, deviations, and human decision points.
ai-research-explore
探索新颖深度学习研究候选方案
研究人员难以系统化地探索和排序新颖的深度学习想法并保持科学严谨性。本技能在 current_research 之上提供可审计的候选探索,包含想法筛选、公平比较和受治理的实验工作流。