alphafold-database
AlphaFold-Proteinstrukturen nach UniProt-ID abrufen
Auch verfügbar von: davila7
Forscher benötigen effizienten Zugang zu berechneten Proteinstrukturvorhersagen für die Arzneimittelforschung und strukturelle Biologie. Dieser Skill bietet direkten Zugang zu AlphaFold DBs 200M+ KI-vorhergesagten Proteinstrukturen, ermöglicht das Abrufen nach UniProt-ID, das Herunterladen von Koordinatendateien und die Analyse von Konfidenzmetriken.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "alphafold-database". Lade die AlphaFold-Struktur für P00520 herunter und analysiere die Konfidenz
Erwartetes Ergebnis:
- AlphaFold-ID: AF-P00520-F1
- Protein: Tyrosin-Protein-Kinase ABL1 (Mensch)
- Sequenzlänge: 1130 Reste
- pLDDT-Analyse:
- - Sehr hohe Konfidenz (>90): 67% der Reste
- - Hohe Konfidenz (70-90): 18% der Reste
- Struktur gespeichert unter: ./structures/AF-P00520-F1-model_v4.cif
Verwendung von "alphafold-database". Lade das E. coli-Proteom mit Google Cloud herunter
Erwartetes Ergebnis:
- Taxonomie-ID: 83333
- Herunterladen von: gs://public-datasets-deepmind-alphafold-v4/proteomes/
- Übereinstimmende Dateien: 4123
- Herunterladen von proteome-tax_id-83333-*.tar (45 GB gesamt)
- Fortschritt: 45,2 GB / 45,2 GB (100%)
- 4123 Strukturarchive nach ./proteomes/ extrahiert
Sicherheitsaudit
SicherThis is a legitimate scientific skill for accessing the AlphaFold protein structure database. All 244 static findings are false positives. The analyzer misinterpreted markdown code formatting (backticks), standard Python HTTP library usage, and documented public API endpoints as security threats. The skill uses safe Biopython library calls, standard requests to authorized EBI APIs, and subprocess with list-form arguments for Google Cloud access.
Risikofaktoren
🌐 Netzwerkzugriff (2)
⚙️ Externe Befehle (1)
📁 Dateisystemzugriff (1)
Qualitätsbewertung
Was du bauen kannst
Proteinstrukturen für Docking abrufen
Zielproteinstrukturen für computergestützte Docking-Studien herunterladen und Bindestellenkonformationen analysieren.
Vorhersagekonfidenz analysieren
pLDDT- und PAE-Metriken auswerten, um zuverlässige Strukturregionen für die nachgelagerte Analyse zu identifizieren.
Automatisierte Pipelines erstellen
AlphaFold-Zugang in rechnergestützte Arbeitsabläufe für groß angelegte Proteinanalysen integrieren.
Probiere diese Prompts
Lade die AlphaFold-Struktur für UniProt-ID P00520 im mmCIF-Format herunter und zeige die pLDDT-Konfidenzwerte.
Lade die Strukturen für P00520, P12931 und P04637 herunter. Vergleiche ihre durchschnittlichen pLDDT-Werte und identifiziere Bereiche mit hoher Konfidenz.
Lade alle AlphaFold-Vorhersagen für E. coli (Taxonomie-ID 83333) mit Google Cloud Bulk-Zugriff herunter.
Erstelle ein Python-Skript, das eine Liste von UniProt-IDs annimmt, deren Strukturen herunterlädt, CA-Koordinaten extrahiert und Inter-Restdistanzen berechnet.
Bewährte Verfahren
- Biopython für einfachen Einzelprotein-Zugriff verwenden (sauberere API als direkte HTTP-Aufrufe)
- Heruntergeladene Dateien lokal zwischenspeichern, um wiederholte API-Anfragen und Rate-Limits zu vermeiden
- Für Bulk-Downloads über 100 Proteine Google Cloud Storage anstelle der REST-API verwenden
Vermeiden
- Vermeiden von shell=True mit subprocess beim Aufruf von gsutil (Listenform verwenden)
- pLDDT-Werte bei der Interpretation von Strukturen nicht ignorieren (Bereiche mit niedriger Konfidenz können unzuverlässig sein)
- Vermeiden, einzelne Dateien für ganze Proteome herunterzuladen (tar-Archive von Google Cloud verwenden)