Fähigkeiten exploratory-data-analysis

📊

exploratory-data-analysis

Name: exploratory-data-analysis
Author: K-Dense-AI

Sicher 📁 Dateisystemzugriff

Wissenschaftliche Datendateien automatisch analysieren

Auch verfügbar von: davila7

Wissenschaftliche Datendateien gibt es in Hunderten von Formaten. Diese Skill erkennt automatisch den Dateityp, extrahiert Metadaten, bewertet die Datenqualität und generiert umfassende Markdown-Berichte mit formatspezifischen Analyseempfehlungen.

Unterstützt: Claude Codex Code(CC)

🥈 81 Silber

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "exploratory-data-analysis". Analyze data/sample.fastq

Erwartetes Ergebnis:

Datei: sample.fastq (24,5 MB)
Format: FASTQ (Sequenzdaten mit Qualitätswerten)
10.000 gelesene Sequenzen beprobt: Mittlere Länge 150bp, Mittlere Qualität: 35,2
GC-Gehalt: 52,3%
Qualitätsbewertung: Hochwertige Daten, geeignet für downstream-Analyse
Empfehlungen: Mit Alignment fortfahren; kein Trimmen erforderlich

Verwendung von "exploratory-data-analysis". Explore experiment_results.csv

Erwartetes Ergebnis:

Datei: experiment_results.csv (1,2 MB)
Format: CSV (tabellarische Daten)
Dimensionen: 5.000 Zeilen x 12 Spalten
Fehlende Werte: 2,3% in Spalte 'temperature'
Statistiken: Mittelwert=45,2, Std=12,8, Bereich=[-5,2, 98,4]
Empfehlungen
:
Fehlende Werte imputieren; auf Ausreißer in Temperaturspalte prüfen

Sicherheitsaudit

Sicher

v4 • 1/17/2026

After thorough evaluation of 1077 static findings, all are false positives. The scanner misinterpreted Markdown code formatting (backticks) as shell commands, bioinformatics format names (SAM) as Windows credentials, and documentation references to file format specifications as weak cryptography. The skill is a legitimate scientific data analysis tool that only reads data files and writes markdown reports. No network access, no command execution, and no sensitive data handling were found.

Gescannte Dateien

8,669

Analysierte Zeilen

befunde

Gesamtzahl Audits

Risikofaktoren

📁 Dateisystemzugriff (1)

scripts/eda_analyzer.py:508

Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

100

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Genomische Sequenzierungsdaten untersuchen

Analysieren Sie FASTQ-, BAM- und VCF-Dateien, um Sequenzqualität, Mapping-Raten und Variantenverteilungen zu verstehen.

Molekülstrukturdateien prüfen

Parsen Sie PDB-, SDF- und CIF-Dateien, um Molekülstrukturen, Atomkoordinationen und Bindungsinformationen zu bewerten.

Mikroskopie-Bildmetadaten inspizieren

Extrahieren Sie Dimensionen, Kanäle, Zeitstempel und räumliche Kalibrierung aus TIFF-, ND2- und CZI-Bildgebungsdateien.

Probiere diese Prompts

Grundlegende Analyse

Analysiere diese wissenschaftliche Datendatei unter Pfad: <filepath>

Mit Bericht

Generiere einen umfassenden EDA-Bericht für diese Datei und speichere ihn unter <filepath>

Qualitätsfokus

Führe eine Datenqualitätsbewertung für diese Datei durch und identifiziere Probleme oder Anomalien.

Mehrere Dateien

Analysiere diese mehreren zusammenhängenden Dateien und erstelle einen vergleichenden Zusammenfassungsbericht.

Bewährte Verfahren

Geben Sie den vollständigen Dateipfad an, um eine präzise Erkennung zu gewährleisten
Geben Sie einen Ausgabe-Dateinamen an, um einen persistenten Markdown-Bericht zu generieren
Prüfen Sie die erforderlichen Python-Bibliotheken für spezialisierte Formate vor der Analyse

Vermeiden

Bitten Sie die Skill nicht, Quelldateien zu modifizieren oder zurückzuschreiben
Erwarten Sie nicht, dass die Skill fortgeschrittene statistische Modellierung durchführt
Gehen Sie nicht davon aus, dass die Skill biologische Bedeutungen aus Sequenzen interpretieren kann

Häufig gestellte Fragen

Welche Dateiformate werden unterstützt?

Über 200 Formate einschließlich FASTQ, BAM, VCF, PDB, CIF, TIFF, ND2, CSV, HDF5 und viele mehr.

Werden meine Datendateien modifiziert?

Nein, die Skill liest nur Dateien und generiert neue Markdown-Berichte, ohne die ursprünglichen Daten zu verändern.

Was enthält der generierte Bericht?

Dateimetadaten, Formatinformationen, statistische Zusammenfassungen, Qualitätsmetriken und Empfehlungen für die downstream-Analyse.

Kann sie große Dateien analysieren?

Ja, aber sehr große Dateien können aus Leistungsgründen beprobt werden. Der Bericht vermerkt, wenn Beprobung verwendet wird.

Welche Python-Bibliotheken werden benötigt?

Kernbibliotheken: pandas, numpy. Formatspezifisch: Biopython für Sequenzen, h5py für HDF5, Pillow für Bilder.

Kann sie mehrere Dateien gemeinsam analysieren?

Jede Datei wird separat analysiert. Sie können Vergleiche über zusammenhängende Dateien in derselben Analyseanfrage anfordern.

Entwicklerdetails

Autor

K-Dense-AI

Lizenz

MIT license

Repository

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/exploratory-data-analysis

Ref

main

Dateistruktur

📁 assets/

📄 report_template.md

📁 references/

📄 bioinformatics_genomics_formats.md

📄 chemistry_molecular_formats.md

📄 general_scientific_formats.md

📄 microscopy_imaging_formats.md

📄 proteomics_metabolomics_formats.md

📄 spectroscopy_analytical_formats.md

📁 scripts/

📄 eda_analyzer.py

📄 SKILL.md