gtars
Analyser les intervalles génomiques et les pistes de couverture
Également disponible depuis: davila7
Traiter et analyser les données d'intervalles génomiques pour la recherche en bioinformatique. Gtars fournit des outils haute performance pour la détection de chevauchements, l'analyse de couverture et la jetonisation de séquences génomiques pour l'apprentissage automatique.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "gtars". Trouver les chevauchements entre mes pics ChIP-seq et les promoteurs de gènes
Résultat attendu:
- Pics chevauchants : 1 234 régions trouvées
- Distribution des pics : 45% dans les régions promotrices, 30% dans les enhanceurs, 25% intergéniques
- Résultats enregistrés dans peaks_in_promoters.bed
Utilisation de "gtars". Générer une piste de couverture à partir de données ATAC-seq
Résultat attendu:
- Piste de couverture générée : atac_coverage.bw
- Résolution : 10bp
- Total des bases couvertes : 2,1 milliards
- Régions d'accessibilité aux pics identifiées : 150 000
Audit de sécurité
SûrAll 209 static findings are false positives. The static analyzer incorrectly flagged markdown documentation syntax as security risks. No malicious code present. This is a legitimate genomic analysis toolkit.
Facteurs de risque
⚙️ Commandes externes (3)
📁 Accès au système de fichiers (1)
Score de qualité
Ce que vous pouvez construire
Analyse de chevauchement de pics
Identifier les éléments régulateurs chevauchants et annoter les variantes en comparant les pics ChIP-seq.
Visualisation de couverture
Générer des pistes de couverture à partir de données ATAC-seq ou ChIP-seq pour la visualisation dans un navigateur génomique.
Prétraitement ML génomique
Convertir les régions génomiques en jetons discrets pour entraîner des modèles transformer sur les séquences d'ADN.
Essayez ces prompts
Utiliser gtars pour construire un index IGD à partir de mon fichier peaks.bed et interroger les chevauchements avec promoters.bed.
Générer une piste de couverture BigWig à partir de mes fragments ATAC-seq en utilisant gtars uniwig avec une résolution de 10bp.
Créer un TreeTokenizer à partir de mon training_regions.bed et jetoniser les coordonnées génomiques pour l'entrée du modèle ML.
Diviser mes fragments.tsv par les codes-barres cellulaires en utilisant gtars fragsplit et sortie vers des répertoires spécifiques aux clusters.
Bonnes pratiques
- Utiliser le mode mappage mémoire (mmap=True) lors du traitement de grands fichiers génomiques pour de meilleures performances.
- Construire les indexes IGD une seule fois et les réutiliser pour plusieurs requêtes de chevauchement.
- Spécifier le nombre de threads explicitement pour une utilisation prévisible des ressources dans le traitement par lots.
Éviter
- Ne pas traiter des fichiers à l'échelle du gigaoctet sans activer le mode mappage mémoire.
- Éviter d'exécuter plusieurs commandes gtars séquentiellement lorsque le traitement parallèle est disponible.
- Ne pas sauter la validation du format lors de l'intégration avec des pipelines externes.