exploratory-data-analysis
Автоматический анализ научных файлов данных
Также доступно от: davila7
Научные файлы данных представлены в сотнях форматов. Этот навык автоматически определяет тип файла, извлекает метаданные, оценивает качество данных и генерирует комплексные отчеты в формате markdown с рекомендациями по анализу, специфичными для каждого формата.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «exploratory-data-analysis». 分析 data/sample.fastq
Ожидаемый результат:
- 文件:sample.fastq (24.5 MB)
- 格式:FASTQ(带质量分数的序列数据)
- 采样 10,000 条读段:平均长度 150bp,平均质量:35.2
- GC 含量:52.3%
- 质量评估:高质量数据,适合下游分析
- 建议:继续比对;无需修剪
Использование «exploratory-data-analysis». 探索 experiment_results.csv
Ожидаемый результат:
- 文件:experiment_results.csv (1.2 MB)
- 格式:CSV(表格数据)
- 维度:5,000 行 x 12 列
- 缺失值:'temperature' 列中为 2.3%
- 统计:均值=45.2,标准差=12.8,范围=[-5.2, 98.4]
- 建议:填补缺失值;检查温度列中的异常值
Аудит безопасности
БезопасноAfter thorough evaluation of 1077 static findings, all are false positives. The scanner misinterpreted Markdown code formatting (backticks) as shell commands, bioinformatics format names (SAM) as Windows credentials, and documentation references to file format specifications as weak cryptography. The skill is a legitimate scientific data analysis tool that only reads data files and writes markdown reports. No network access, no command execution, and no sensitive data handling were found.
Факторы риска
📁 Доступ к файловой системе (1)
Оценка качества
Что вы можете построить
Исследование данных геномного секвенирования
Анализируйте файлы FASTQ, BAM и VCF для понимания качества последовательностей, показателей картирования и распределения вариантов.
Изучение файлов молекулярной структуры
解析 PDB, SDF 和 CIF 文件以评估分子结构、原子坐标和键信息。
检查显微镜图像元数据
从 TIFF、ND2 和 CZI 图像文件中提取尺寸、通道、时间戳和空间校准信息。
Попробуйте эти промпты
分析此科学数据文件,路径为:<filepath>
为此文件生成综合 EDA 报告并保存到 <filepath>
对该文件执行数据质量评估并识别任何问题或异常。
分析这些多个相关文件并创建汇总比较报告。
Лучшие практики
- 请求分析时请提供完整文件路径以进行精确检测
- 指定输出文件名以生成持久的 markdown 报告
- 分析前检查专业格式所需的 Python 库
Избегать
- 不要要求技能修改或写回源数据文件
- 不要期望技能执行高级统计建模
- 不要假设技能可以解释序列的生物学意义
Часто задаваемые вопросы
支持哪些文件格式?
这会修改我的数据文件吗?
生成的报告包含什么内容?
它可以分析大文件吗?
需要哪些 Python 库?
它可以同时分析多个文件吗?
Сведения для разработчиков
Автор
K-Dense-AIЛицензия
MIT license
Репозиторий
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/exploratory-data-analysisСсылка
main
Структура файлов