스킬 exploratory-data-analysis
📊

exploratory-data-analysis

안전 📁 파일 시스템 액세스

과학적 데이터 파일 자동 분석

또한 다음에서 사용할 수 있습니다: davila7

과학적 데이터 파일은 수백 가지 형식으로 이루어져 있습니다. 이 스킬은 파일 유형을 자동으로 감지하고, 메타데이터를 추출하며, 데이터 품질을 평가하고, 형식별 분석 권장 사항이 포함된 종합 마크다운 보고서를 생성합니다.

지원: Claude Codex Code(CC)
🥈 80 실버
1

스킬 ZIP 다운로드

2

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

3

토글을 켜고 사용 시작

테스트해 보기

"exploratory-data-analysis" 사용 중입니다. Analyze data/sample.fastq

예상 결과:

  • File: sample.fastq (24.5 MB)
  • Format: FASTQ (sequence data with quality scores)
  • Sampled 10,000 reads: Mean length 150bp, Mean quality: 35.2
  • GC Content: 52.3%
  • Quality Assessment: High-quality data, suitable for downstream analysis
  • Recommendations: Proceed with alignment; no trimming required

"exploratory-data-analysis" 사용 중입니다. Explore experiment_results.csv

예상 결과:

  • File: experiment_results.csv (1.2 MB)
  • Format: CSV (tabular data)
  • Dimensions: 5,000 rows x 12 columns
  • Missing Values: 2.3% in column 'temperature'
  • Statistics: Mean=45.2, Std=12.8, Range=[-5.2, 98.4]
  • Recommendations: Impute missing values; check for outliers in temperature column

보안 감사

안전
v4 • 1/17/2026

After thorough evaluation of 1077 static findings, all are false positives. The scanner misinterpreted Markdown code formatting (backticks) as shell commands, bioinformatics format names (SAM) as Windows credentials, and documentation references to file format specifications as weak cryptography. The skill is a legitimate scientific data analysis tool that only reads data files and writes markdown reports. No network access, no command execution, and no sensitive data handling were found.

10
스캔된 파일
8,669
분석된 줄 수
1
발견 사항
4
총 감사 수

위험 요인

📁 파일 시스템 액세스 (1)
감사자: claude 감사 이력 보기 →

품질 점수

82
아키텍처
100
유지보수성
85
콘텐츠
21
커뮤니티
100
보안
91
사양 준수

만들 수 있는 것

유전체 시퀀싱 데이터 탐색

FASTQ, BAM, VCF 파일을 분석하여 시퀀스 품질, 매핑 비율 및 변이 분포를 이해합니다.

분자 구조 파일 검사

PDB, SDF, CIF 파일을 구문 분석하여 분자 구조, 원자 좌표 및 결합 정보를 평가합니다.

현미경 이미지 메타데이터 검사

TIFF, ND2, CZI成像 파일에서 차원, 채널, 타임스탬프 및 공간 캘리브레이션을 추출합니다.

이 프롬프트를 사용해 보세요

기본 분석
<filepath> 경로의 과학적 데이터 파일을 분석하세요.
보고서 포함
이 파일에 대한 종합 EDA 보고서를 생성하여 <filepath>에 저장하세요.
품질 중심
이 파일에 대한 데이터 품질 평가를 수행하고 문제나 이상 징후를 식별하세요.
다중 파일
이러한 관련 파일들을 분석하고 요약 비교 보고서를 생성하세요.

모범 사례

  • 정확한 감지를 위해 분석 요청 시 전체 파일 경로 제공
  • 영구적인 마크다운 보고서 생성을 위해 출력 파일명 지정
  • 분석 전에 특수 형식에 필요한 Python 라이브러리 확인

피하기

  • 소스 데이터 파일을 수정하거나 다시 쓰도록 요청하지 마세요
  • 고급 통계 모델링을 수행해 줄 것으로 기대하지 마세요
  • 시퀀스에서 생물학적 의미를 해석할 수 있다고 가정하지 마세요

자주 묻는 질문

어떤 파일 형식이 지원되나요?
FASTQ, BAM, VCF, PDB, CIF, TIFF, ND2, CSV, HDF5 등 200개 이상의 형식을 지원합니다.
데이터 파일을 수정하나요?
아니요, 이 스킬은 파일만 읽고 원본 데이터를 변경하지 않고 새로운 마크다운 보고서만 생성합니다.
생성된 보고서에는 무엇이 포함되나요?
파일 메타데이터, 형식 세부 정보, 통계 요약, 품질 지표 및 하류 분석 권장 사항이 포함됩니다.
큰 파일도 분석할 수 있나요?
네, 하지만非常大的 파일은 성능을 위해 샘플링될 수 있습니다. 보고서에 샘플링이 사용되면 기록됩니다.
어떤 Python 라이브러리가 필요합니까?
핵심 라이브러리: pandas, numpy. 형식별: 시퀀스를 위한 Biopython, HDF5를 위한 h5py, 이미지를 위한 Pillow.
여러 파일을 함께 분석할 수 있나요?
각 파일은 별도로 분석됩니다. 동일한 분석 요청에서 관련 파일 간 비교를 요청할 수 있습니다.