Skills publiés 11
safe-debug
Déboguer les erreurs d'apprentissage profond en toute sécurité
Le débogage en apprentissage profond conduit souvent à des correctifs spéculatifs qui compromettent la reproductibilité de la recherche. Cette skill fournit un diagnostic conservateur avec des portes d'approbation explicites avant toute modification de code, en maintenant les correctifs de débogage séparés des contributions de recherche.
run-train
Run Training Commands with Structured Evidence
Deep learning training runs often lack reproducible evidence and clear status reporting. This skill executes a selected training command conservatively and writes standardized training evidence to train_outputs/.
repo-intake-and-plan
Analyser les dépôts et planifier la reproduction d'IA
L'analyse manuelle des dépôts d'IA pour trouver les commandes de reproduction prend du temps et est sujette aux erreurs. Cette compétence automatise l'analyse basée sur le README pour extraire les commandes documentées et générer des plans de reproduction minimaux et fiables.
paper-context-resolver
Résoudre les lacunes de reproduction d'articles avec le contexte
Lors de la reproduction de recherches en IA, les README des dépôts laissent souvent des lacunes critiques concernant les divisions de jeux de données, les protocoles d'évaluation ou les détails de prétraitement. Cette compétence résout ces questions étroites de reproduction à partir des sources primaires de l'article tout en préservant les recommandations du README.
minimal-run-and-audit
Exécuter et auditer les commandes de reproduction de dépôt IA
L'exécution d'expériences de reproduction d'articles d'IA nécessite une exécution cohérente des commandes et des rapports normalisés. Cette compétence exécute des tests de fumée, des exécutions d'inférence ou des commandes d'évaluation tout en générant automatiquement des bundles de sortie structurés pour les pistes d'audit.
explore-run
Planifier des exécutions d'expériences exploratoires délimitées
Les chercheurs en apprentissage profond ont besoin d'exécuter des essais exploratoires rapides sans surévaluer les résultats. Cette compétence génère des matrices de variantes tenant compte du budget, accompagnées de mises en garde sur la comparabilité équitable, en maintenant les preuves exploratoires clairement séparées des bases de référence fiables.
explore-code
Plan Safe ML Code Changes with Rollback Awareness
Deep learning researchers need to explore code modifications without breaking trusted baselines. This skill creates conservative, auditable change plans with explicit rollback paths for isolated worktrees.
env-and-assets-bootstrap
Configurer les environnements et les ressources pour la recherche en IA
La mise en place d'environnements de recherche en IA pour la reproduction d'articles est complexe et sujette aux erreurs. Cette compétence automatise la création conservative d'environnements conda-first et la planification des chemins d'accès aux ressources pour réduire les frictions liées à la configuration.
analyze-project
Analyser les projets de deep learning en toute sécurité
Comprendre un nouveau dépôt de deep learning prend du temps et est source d'erreurs. Cette compétence fournit une analyse statique en lecture seule pour cartographier la structure du modèle, les points d'entrée d'entraînement et les motifs suspects sans modifier le code ni exécuter de coûteux jobs d'entraînement.
ai-research-reproduction
Reproduce AI research repositories with auditable evidence
Reproducing deep learning papers is slow and error-prone because commands, datasets, and assumptions are scattered across READMEs. This skill reads the repository first, selects the smallest documented target, and writes a standardized repro_outputs/ bundle with evidence, deviations, and human decision points.
ai-research-explore
Explorer de nouvelles candidates de recherche en apprentissage profond
Les chercheurs peinent à explorer et classer systématiquement de nouvelles idées d'apprentissage profond avec rigueur scientifique. Cette compétence fournit une exploration de candidates auditables avec validation d'idées, comparaison équitable et workflows d'expériences gouvernés par-dessus current_research.