lllllllama

safe-debug

Déboguer les erreurs d'apprentissage profond en toute sécurité

Sûr 79

Le débogage en apprentissage profond conduit souvent à des correctifs spéculatifs qui compromettent la reproductibilité de la recherche. Cette skill fournit un diagnostic conservateur avec des portes d'approbation explicites avant toute modification de code, en maintenant les correctifs de débogage séparés des contributions de recherche.

🚂

run-train

Run Training Commands with Structured Evidence

Risque faible 77

Deep learning training runs often lack reproducible evidence and clear status reporting. This skill executes a selected training command conservatively and writes standardized training evidence to train_outputs/.

repo-intake-and-plan

Analyser les dépôts et planifier la reproduction d'IA

Risque faible 74

L'analyse manuelle des dépôts d'IA pour trouver les commandes de reproduction prend du temps et est sujette aux erreurs. Cette compétence automatise l'analyse basée sur le README pour extraire les commandes documentées et générer des plans de reproduction minimaux et fiables.

paper-context-resolver

Résoudre les lacunes de reproduction d'articles avec le contexte

Sûr 72

Lors de la reproduction de recherches en IA, les README des dépôts laissent souvent des lacunes critiques concernant les divisions de jeux de données, les protocoles d'évaluation ou les détails de prétraitement. Cette compétence résout ces questions étroites de reproduction à partir des sources primaires de l'article tout en préservant les recommandations du README.

minimal-run-and-audit

Exécuter et auditer les commandes de reproduction de dépôt IA

Risque faible 73

L'exécution d'expériences de reproduction d'articles d'IA nécessite une exécution cohérente des commandes et des rapports normalisés. Cette compétence exécute des tests de fumée, des exécutions d'inférence ou des commandes d'évaluation tout en générant automatiquement des bundles de sortie structurés pour les pistes d'audit.

explore-run

Planifier des exécutions d'expériences exploratoires délimitées

Risque faible 78

Les chercheurs en apprentissage profond ont besoin d'exécuter des essais exploratoires rapides sans surévaluer les résultats. Cette compétence génère des matrices de variantes tenant compte du budget, accompagnées de mises en garde sur la comparabilité équitable, en maintenant les preuves exploratoires clairement séparées des bases de référence fiables.

explore-code

Plan Safe ML Code Changes with Rollback Awareness

Sûr 80

Deep learning researchers need to explore code modifications without breaking trusted baselines. This skill creates conservative, auditable change plans with explicit rollback paths for isolated worktrees.

env-and-assets-bootstrap

Configurer les environnements et les ressources pour la recherche en IA

Risque faible 73

La mise en place d'environnements de recherche en IA pour la reproduction d'articles est complexe et sujette aux erreurs. Cette compétence automatise la création conservative d'environnements conda-first et la planification des chemins d'accès aux ressources pour réduire les frictions liées à la configuration.

🔍

analyze-project

Analyser les projets de deep learning en toute sécurité

Risque faible 78

Comprendre un nouveau dépôt de deep learning prend du temps et est source d'erreurs. Cette compétence fournit une analyse statique en lecture seule pour cartographier la structure du modèle, les points d'entrée d'entraînement et les motifs suspects sans modifier le code ni exécuter de coûteux jobs d'entraînement.

ai-research-reproduction

Reproduce AI research repositories with auditable evidence

Risque moyen 76

Reproducing deep learning papers is slow and error-prone because commands, datasets, and assumptions are scattered across READMEs. This skill reads the repository first, selects the smallest documented target, and writes a standardized repro_outputs/ bundle with evidence, deviations, and human decision points.

ai-research-explore

Explorer de nouvelles candidates de recherche en apprentissage profond

Risque moyen 71

Les chercheurs peinent à explorer et classer systématiquement de nouvelles idées d'apprentissage profond avec rigueur scientifique. Cette compétence fournit une exploration de candidates auditables avec validation d'idées, comparaison équitable et workflows d'expériences gouvernés par-dessus current_research.