Fähigkeiten exploratory-data-analysis
📊

exploratory-data-analysis

Sicher 📁 Dateisystemzugriff

Wissenschaftliche Datendateien automatisch analysieren

Auch verfügbar von: davila7

Wissenschaftliche Datendateien gibt es in Hunderten von Formaten. Diese Skill erkennt automatisch den Dateityp, extrahiert Metadaten, bewertet die Datenqualität und generiert umfassende Markdown-Berichte mit formatspezifischen Analyseempfehlungen.

Unterstützt: Claude Codex Code(CC)
🥈 80 Silber
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "exploratory-data-analysis". Analyze data/sample.fastq

Erwartetes Ergebnis:

  • Datei: sample.fastq (24,5 MB)
  • Format: FASTQ (Sequenzdaten mit Qualitätswerten)
  • 10.000 gelesene Sequenzen beprobt: Mittlere Länge 150bp, Mittlere Qualität: 35,2
  • GC-Gehalt: 52,3%
  • Qualitätsbewertung: Hochwertige Daten, geeignet für downstream-Analyse
  • Empfehlungen: Mit Alignment fortfahren; kein Trimmen erforderlich

Verwendung von "exploratory-data-analysis". Explore experiment_results.csv

Erwartetes Ergebnis:

  • Datei: experiment_results.csv (1,2 MB)
  • Format: CSV (tabellarische Daten)
  • Dimensionen: 5.000 Zeilen x 12 Spalten
  • Fehlende Werte: 2,3% in Spalte 'temperature'
  • Statistiken: Mittelwert=45,2, Std=12,8, Bereich=[-5,2, 98,4]
  • Empfehlungen
  • :
  • Fehlende Werte imputieren; auf Ausreißer in Temperaturspalte prüfen

Sicherheitsaudit

Sicher
v4 • 1/17/2026

After thorough evaluation of 1077 static findings, all are false positives. The scanner misinterpreted Markdown code formatting (backticks) as shell commands, bioinformatics format names (SAM) as Windows credentials, and documentation references to file format specifications as weak cryptography. The skill is a legitimate scientific data analysis tool that only reads data files and writes markdown reports. No network access, no command execution, and no sensitive data handling were found.

10
Gescannte Dateien
8,669
Analysierte Zeilen
1
befunde
4
Gesamtzahl Audits

Risikofaktoren

📁 Dateisystemzugriff (1)
Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

82
Architektur
100
Wartbarkeit
85
Inhalt
21
Community
100
Sicherheit
91
Spezifikationskonformität

Was du bauen kannst

Genomische Sequenzierungsdaten untersuchen

Analysieren Sie FASTQ-, BAM- und VCF-Dateien, um Sequenzqualität, Mapping-Raten und Variantenverteilungen zu verstehen.

Molekülstrukturdateien prüfen

Parsen Sie PDB-, SDF- und CIF-Dateien, um Molekülstrukturen, Atomkoordinationen und Bindungsinformationen zu bewerten.

Mikroskopie-Bildmetadaten inspizieren

Extrahieren Sie Dimensionen, Kanäle, Zeitstempel und räumliche Kalibrierung aus TIFF-, ND2- und CZI-Bildgebungsdateien.

Probiere diese Prompts

Grundlegende Analyse
Analysiere diese wissenschaftliche Datendatei unter Pfad: <filepath>
Mit Bericht
Generiere einen umfassenden EDA-Bericht für diese Datei und speichere ihn unter <filepath>
Qualitätsfokus
Führe eine Datenqualitätsbewertung für diese Datei durch und identifiziere Probleme oder Anomalien.
Mehrere Dateien
Analysiere diese mehreren zusammenhängenden Dateien und erstelle einen vergleichenden Zusammenfassungsbericht.

Bewährte Verfahren

  • Geben Sie den vollständigen Dateipfad an, um eine präzise Erkennung zu gewährleisten
  • Geben Sie einen Ausgabe-Dateinamen an, um einen persistenten Markdown-Bericht zu generieren
  • Prüfen Sie die erforderlichen Python-Bibliotheken für spezialisierte Formate vor der Analyse

Vermeiden

  • Bitten Sie die Skill nicht, Quelldateien zu modifizieren oder zurückzuschreiben
  • Erwarten Sie nicht, dass die Skill fortgeschrittene statistische Modellierung durchführt
  • Gehen Sie nicht davon aus, dass die Skill biologische Bedeutungen aus Sequenzen interpretieren kann

Häufig gestellte Fragen

Welche Dateiformate werden unterstützt?
Über 200 Formate einschließlich FASTQ, BAM, VCF, PDB, CIF, TIFF, ND2, CSV, HDF5 und viele mehr.
Werden meine Datendateien modifiziert?
Nein, die Skill liest nur Dateien und generiert neue Markdown-Berichte, ohne die ursprünglichen Daten zu verändern.
Was enthält der generierte Bericht?
Dateimetadaten, Formatinformationen, statistische Zusammenfassungen, Qualitätsmetriken und Empfehlungen für die downstream-Analyse.
Kann sie große Dateien analysieren?
Ja, aber sehr große Dateien können aus Leistungsgründen beprobt werden. Der Bericht vermerkt, wenn Beprobung verwendet wird.
Welche Python-Bibliotheken werden benötigt?
Kernbibliotheken: pandas, numpy. Formatspezifisch: Biopython für Sequenzen, h5py für HDF5, Pillow für Bilder.
Kann sie mehrere Dateien gemeinsam analysieren?
Jede Datei wird separat analysiert. Sie können Vergleiche über zusammenhängende Dateien in derselben Analyseanfrage anfordern.