Навыки exploratory-data-analysis
📊

exploratory-data-analysis

Безопасно 📁 Доступ к файловой системе

Автоматический анализ научных файлов данных

Также доступно от: davila7

Научные файлы данных представлены в сотнях форматов. Этот навык автоматически определяет тип файла, извлекает метаданные, оценивает качество данных и генерирует комплексные отчеты в формате markdown с рекомендациями по анализу, специфичными для каждого формата.

Поддерживает: Claude Codex Code(CC)
🥈 80 Серебро
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «exploratory-data-analysis». 分析 data/sample.fastq

Ожидаемый результат:

  • 文件:sample.fastq (24.5 MB)
  • 格式:FASTQ(带质量分数的序列数据)
  • 采样 10,000 条读段:平均长度 150bp,平均质量:35.2
  • GC 含量:52.3%
  • 质量评估:高质量数据,适合下游分析
  • 建议:继续比对;无需修剪

Использование «exploratory-data-analysis». 探索 experiment_results.csv

Ожидаемый результат:

  • 文件:experiment_results.csv (1.2 MB)
  • 格式:CSV(表格数据)
  • 维度:5,000 行 x 12 列
  • 缺失值:'temperature' 列中为 2.3%
  • 统计:均值=45.2,标准差=12.8,范围=[-5.2, 98.4]
  • 建议:填补缺失值;检查温度列中的异常值

Аудит безопасности

Безопасно
v4 • 1/17/2026

After thorough evaluation of 1077 static findings, all are false positives. The scanner misinterpreted Markdown code formatting (backticks) as shell commands, bioinformatics format names (SAM) as Windows credentials, and documentation references to file format specifications as weak cryptography. The skill is a legitimate scientific data analysis tool that only reads data files and writes markdown reports. No network access, no command execution, and no sensitive data handling were found.

10
Просканировано файлов
8,669
Проанализировано строк
1
находки
4
Всего аудитов

Факторы риска

📁 Доступ к файловой системе (1)

Оценка качества

82
Архитектура
100
Сопровождаемость
85
Контент
21
Сообщество
100
Безопасность
91
Соответствие спецификации

Что вы можете построить

Исследование данных геномного секвенирования

Анализируйте файлы FASTQ, BAM и VCF для понимания качества последовательностей, показателей картирования и распределения вариантов.

Изучение файлов молекулярной структуры

解析 PDB, SDF 和 CIF 文件以评估分子结构、原子坐标和键信息。

检查显微镜图像元数据

从 TIFF、ND2 和 CZI 图像文件中提取尺寸、通道、时间戳和空间校准信息。

Попробуйте эти промпты

基础分析
分析此科学数据文件,路径为:<filepath>
含报告
为此文件生成综合 EDA 报告并保存到 <filepath>
质量关注
对该文件执行数据质量评估并识别任何问题或异常。
多文件
分析这些多个相关文件并创建汇总比较报告。

Лучшие практики

  • 请求分析时请提供完整文件路径以进行精确检测
  • 指定输出文件名以生成持久的 markdown 报告
  • 分析前检查专业格式所需的 Python 库

Избегать

  • 不要要求技能修改或写回源数据文件
  • 不要期望技能执行高级统计建模
  • 不要假设技能可以解释序列的生物学意义

Часто задаваемые вопросы

支持哪些文件格式?
支持 200 多种格式,包括 FASTQ、BAM、VCF、PDB、CIF、TIFF、ND2、CSV、HDF5 等等。
这会修改我的数据文件吗?
不,此技能仅读取文件并生成新的 markdown 报告,不会更改原始数据。
生成的报告包含什么内容?
文件元数据、格式详细信息、统计摘要、质量指标以及下游分析建议。
它可以分析大文件吗?
可以,但非常大的文件可能会被采样以提高性能。报告中会注明何时使用了采样。
需要哪些 Python 库?
核心库:pandas,numpy。格式特定:Biopython 用于序列,h5py 用于 HDF5,Pillow 用于图像。
它可以同时分析多个文件吗?
每个文件都是单独分析的。您可以在同一分析请求中请求比较相关文件。