技能 exploratory-data-analysis
📊

exploratory-data-analysis

安全 📁 檔案系統存取

自動分析科學數據檔案

也可從以下取得: davila7

科學數據檔案有數百種格式。此技能可自動偵測檔案類型、提取元數據、評估數據品質,並產生帶有格式特定分析建議的綜合 markdown 報告。

支援: Claude Codex Code(CC)
🥈 80 白銀
1

下載技能 ZIP

2

在 Claude 中上傳

前往 設定 → 功能 → 技能 → 上傳技能

3

開啟並開始使用

測試它

正在使用「exploratory-data-analysis」。 Analyze data/sample.fastq

預期結果:

  • File: sample.fastq (24.5 MB)
  • Format: FASTQ (sequence data with quality scores)
  • Sampled 10,000 reads: Mean length 150bp, Mean quality: 35.2
  • GC Content: 52.3%
  • Quality Assessment: High-quality data, suitable for downstream analysis
  • Recommendations: Proceed with alignment; no trimming required

正在使用「exploratory-data-analysis」。 Explore experiment_results.csv

預期結果:

  • File: experiment_results.csv (1.2 MB)
  • Format: CSV (tabular data)
  • Dimensions: 5,000 rows x 12 columns
  • Missing Values: 2.3% in column 'temperature'
  • Statistics: Mean=45.2, Std=12.8, Range=[-5.2, 98.4]
  • Recommendations: Impute missing values; check for outliers in temperature column

安全審計

安全
v4 • 1/17/2026

After thorough evaluation of 1077 static findings, all are false positives. The scanner misinterpreted Markdown code formatting (backticks) as shell commands, bioinformatics format names (SAM) as Windows credentials, and documentation references to file format specifications as weak cryptography. The skill is a legitimate scientific data analysis tool that only reads data files and writes markdown reports. No network access, no command execution, and no sensitive data handling were found.

10
已掃描檔案
8,669
分析行數
1
發現項
4
審計總數

風險因素

📁 檔案系統存取 (1)
審計者: claude 查看審計歷史 →

品質評分

82
架構
100
可維護性
85
內容
21
社群
100
安全
91
規範符合性

你能建構什麼

探索基因組測序數據

分析 FASTQ、BAM 和 VCF 檔案以了解序列品質、映射率和變異分佈。

檢視分子結構檔案

解析 PDB、SDF 和 CIF 檔案以評估分子結構、原子座標和鍵資訊。

檢查顯微鏡圖像中繼資料

從 TIFF、ND2 和 CZI 成像檔案中提取維度、通道、時間戳和空間校準資訊。

試試這些提示

基本分析
分析此路徑的科學數據檔案:<filepath>
生成報告
為此檔案生成綜合 EDA 報告並儲存至:<filepath>
品質重點
對此檔案執行數據品質評估並識別任何問題或異常。
多檔案
分析這些相關的多個檔案並建立摘要比較報告。

最佳實務

  • 請求分析時提供完整檔案路徑以進行精確偵測
  • 指定輸出檔案名稱以生成持久的 markdown 報告
  • 分析特殊格式前先檢查所需的 Python 函式庫

避免

  • 不要要求技能修改或回寫原始數據檔案
  • 不要期望技能執行高級統計建模
  • 不要假設技能可以解讀序列中的生物學意義

常見問題

支援哪些檔案格式?
支援 200 多種格式,包括 FASTQ、BAM、VCF、PDB、CIF、TIFF、ND2、CSV、HDF5 等。
這會修改我的數據檔案嗎?
不會,此技能只會讀取檔案並生成新的 markdown 報告,不會改變原始數據。
生成的報告包含什麼?
檔案中繼資料、格式詳細資訊、統計摘要、品質指標和下游分析建議。
可以分析大型檔案嗎?
可以,但非常大的檔案可能會被抽樣以確保效能。報告會註明何時使用了抽樣。
需要哪些 Python 函式庫?
核心函式庫:pandas、numpy。格式特定:Biopython 用於序列,h5py 用於 HDF5,Pillow 用於圖像。
可以同時分析多個檔案嗎?
每個檔案都是单独分析的。您可以在同一次分析請求中請求比較相關檔案。