geo-database
Zugriff auf NCBI GEO-Genexpressionsdaten
Auch verfügbar von: davila7
Forscher benötigen effizienten Zugang zu Genexpressions-Datensätzen für Analysen. Diese Fähigkeit ermöglicht das Abfragen, Herunterladen und Analysieren von Daten aus der NCBI GEO-Datenbank mit Millionen von Genomik-Proben.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "geo-database". Nach Diabetes-Genexpressionsdatensätzen beim Menschen suchen
Erwartetes Ergebnis:
- 1.247 Datensätze gefunden, die 'diabetes AND Homo sapiens' entsprechen
- Top-Ergebnisse:
- - GSE12345: Typ-2-Diabetes-Genexpression (47 Proben)
- - GSE67890: Studie zur diabetischen Nephropathie (32 Proben)
- - GSE11111: Insulin-Antwort-Zeitverlauf (24 Proben)
Verwendung von "geo-database". GSE12345 herunterladen und Metadaten extrahieren
Erwartetes Ergebnis:
- GSE12345_series_matrix.txt.gz heruntergeladen (145 MB)
- Datensatz-Zusammenfassung:
- - Titel: Transkriptom-Profilierung von diabetischem vs. normalem Nierengewebe
- - Proben: 20 (10 diabetisch, 10 Kontrolle)
- - Plattform: GPL570 (Affymetrix Human Genome U133 Plus 2.0)
- - Organismus: Homo sapiens
- - Einreichungsdatum: 2023-06-15
Sicherheitsaudit
Niedriges RisikoDocumentation-only skill for accessing NCBI GEO database. Static analysis flagged 256 pattern-based issues but all are false positives. The 'backtick execution' findings are markdown code block syntax, not actual shell commands. Network operations are legitimate NCBI API access. FTP downloads target public GEO data repositories. Optional API key usage follows NCBI best practices. No executable code present - only documentation.
Risikofaktoren
🌐 Netzwerkzugriff (3)
⚙️ Externe Befehle (3)
📁 Dateisystemzugriff (1)
Qualitätsbewertung
Was du bauen kannst
Genexpression bei Krankheiten analysieren
Genexpressionsdaten zwischen gesunden und erkrankten Gewebeproben herunterladen und vergleichen, um Biomarker zu identifizieren.
Meta-Analyse über Studien hinweg
Daten aus mehreren GEO-Studien kombinieren, um die statistische Aussagekraft für die Erkennung von Genexpressionsänderungen zu erhöhen.
Prädiktive Modelle erstellen
GEO-Expressionsdaten verwenden, um Modelle des maschinellen Lernens für die Vorhersage des Medikamentenansprechens oder die Patientenstratifizierung zu trainieren.
Probiere diese Prompts
GEO nach menschlichen Brustkrebs-Genexpressionsdatensätzen aus den letzten 5 Jahren durchsuchen. Die Top 5 Ergebnisse mit Probenanzahl und verwendeten Plattformen anzeigen.
Die Expressionsmatrix und Metadaten für GSE12345 herunterladen. Die Dateien in ./data/ speichern und eine Zusammenfassung des Datensatzes mit Anzahl der Proben und Gene anzeigen.
Differentielle Expressionsanalyse auf GSE12345 durchführen, wobei Behandlungs- vs. Kontrollproben verglichen werden. Limma oder t-Test verwenden und die Top 10 der signifikantesten Gene anzeigen.
Diese 3 GEO-Reihen herunterladen und verarbeiten: GSE100001, GSE100002, GSE100003. Expressionsdaten extrahieren und eine Zusammenfassungstabelle mit Studienmetadaten erstellen.
Bewährte Verfahren
- Setzen Sie immer Ihre E-Mail, wenn Sie NCBI E-utilities verwenden (von NCBI-Richtlinie erforderlich)
- Besorgen Sie sich einen kostenlosen API-Schlüssel von NCBI für erhöhte Ratenbeschränkungen (10 Anfragen/s vs. 3 Anfragen/s)
- Lokal heruntergeladene GEO-Dateien zwischenspeichern, um wiederholte Downloads zu vermeiden
Vermeiden
- Nicht die gesamte GEO-Datensammlung herunterladen - bei Zugriffen selektiv sein
- API-Schlüssel nicht in gemeinsamem oder versionskontrolliertem Code fest codieren
- Proben-Metadaten nicht ignorieren bei der Interpretation von Expressionsdaten
Häufig gestellte Fragen
Benötige ich einen API-Schlüssel für den GEO-Zugriff?
Was ist der Unterschied zwischen GSE, GSM und GPL?
Warum fehlen Expressionsdaten für einige Serien?
Wie gehe ich mit sehr großen GEO-Datensätzen um?
Kann ich GEO-Daten für klinische Forschung verwenden?
Welches Dateiformat sollte ich für Expressionsdaten verwenden?
Entwicklerdetails
Autor
K-Dense-AILizenz
MIT
Repository
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/geo-databaseRef
main
Dateistruktur