string-database
Interroger les réseaux d'interactions protéiques de la base de données STRING
Également disponible depuis: davila7
Les chercheurs ont besoin de comprendre les interactions protéine-protéine pour étudier les systèmes biologiques et les mécanismes de maladie. Cette compétence donne un accès direct à la base de données STRING complète de 59M de protéines et 20B+ d'interactions sur 5000+ espèces.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "string-database". Obtenir les partenaires d'interaction pour BRCA1 avec une confiance élevée
Résultat attendu:
- Top 10 des partenaires d'interaction de BRCA1 (confiance > 700) :
- BRCA2 - Protéine de réparation de l'ADN, confiance 990
- RAD51 - Récombinase ADN, confiance 985
- PALB2 - Protéine de liaison BRCA2, confiance 980
- TP53 - Suppresseur de tumeur, confiance 750
- CHEK2 - Kinase de point de contrôle, confiance 720
- Le réseau contient 5 interactions de haute confiance soutenant le rôle de BRCA1 dans la réparation par recombinaison homologue.
Utilisation de "string-database". Effectuer l'enrichissement fonctionnel sur les gènes de réparation de l'ADN
Résultat attendu:
- Termes significatifs des Processus Biologiques GO (FDR < 0.05) :
- Réparation de l'ADN (GO:0006281) - 12 gènes, FDR 1.2e-15
- Réparation des cassures double brin (GO:0006302) - 8 gènes, FDR 3.4e-10
- Arrêt du cycle cellulaire (GO:0007050) - 6 gènes, FDR 8.1e-8
- Voies KEGG : Réplication de l'ADN (mmu03030) - 5 gènes, FDR 0.0012
- Protéines hub principales : TP53, BRCA1, ATM forment un module hautement connecté
Audit de sécurité
SûrThe string-database skill is a legitimate bioinformatics tool for accessing protein-protein interaction data from the STRING database (string-db.org), a trusted ELIXIR resource. All 291 static findings are false positives: backticks in documentation are code formatting, HTTP requests target the official STRING API, file writes are for saving network images, and 'cryptographic' and 'reconnaissance' patterns are misinterpreted scientific terminology.
Facteurs de risque
🌐 Accès réseau (3)
Score de qualité
Ce que vous pouvez construire
Analyser les gènes différentiellement exprimés
Télécharger une liste de protéines provenant d'expériences de RNA-seq ou de protéomique pour identifier les voies enrichies et les réseaux d'interactions.
Étudier la fonction et les interactions des protéines
Investiguer des protéines spécifiques pour découvrir les partenaires d'interaction, visualiser les réseaux et comprendre les rôles biologiques.
Construire et analyser les réseaux biologiques
Construire des réseaux d'interactions complets et tester si les protéines forment des modules fonctionnels significatifs.
Essayez ces prompts
Obtenir le réseau d'interactions protéiques pour TP53 chez l'humain avec une confiance moyenne (400), incluant 5 nœuds supplémentaires, et enregistrer comme image PNG.
Effectuer une analyse d'enrichissement fonctionnel sur ces protéines : TP53, BRCA1, ATM, CHEK2, MDM2. Afficher les processus biologiques GO avec FDR < 0.05.
Obtenir les réseaux d'interactions pour la protéine p53 chez l'humain (9606) et la souris (10090) avec une confiance élevée (700), puis comparer les 10 meilleurs interacteurs.
Analyser cette liste de protéines de réparation de l'ADN : mapper les identifiants, obtenir le réseau d'interactions avec une confiance de 700, tester l'enrichissement PPI, effectuer l'enrichissement GO/KEGG, et générer une image de réseau colorée selon les preuves.
Bonnes pratiques
- Toujours mapper les identifiants de protéines d'abord en utilisant string_map_ids pour des requêtes plus rapides et plus précises
- Utiliser les seuils de confiance appropriés : 400 pour l'analyse standard, 700 pour les interactions de haute confiance
- Inclure le paramètre d'espèce (ID taxon NCBI) pour les réseaux de plus de 10 protéines
Éviter
- Ne pas interroger plus de 100 protéines dans un seul appel - diviser les grandes listes en lots
- Éviter d'utiliser des seuils de confiance très bas (< 150) sans justification biologique
- Ne pas ignorer la spécification d'espèce pour les réseaux multi-protéines
Foire aux questions
Qu'est-ce que la base de données STRING ?
Quelles espèces sont prises en charge ?
Quel seuil de confiance dois-je utiliser ?
Comment citer STRING ?
Puis-je analyser plus de 100 protéines ?
Quelle est la différence entre les réseaux fonctionnels et physiques ?
Détails du développeur
Auteur
K-Dense-AILicence
CC-BY-4.0
Dépôt
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/string-databaseRéf
main
Structure de fichiers