技能 scikit-bio
🧬
處理生物序列、計算多樣性指標,並對微生物組和生態數據進行統計檢驗。本技能提供全面的生物信息學工作流指導,包括序列比對、系統發育分析和排序。
支援: Claude Codex Code(CC)
1
下載技能 ZIP
2
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
3
開啟並開始使用
測試它
正在使用「scikit-bio」。 從我的 OTU 表計算多樣性指標
預期結果:
- 讀取你的 BIOM 表:Table.read('table.biom')
- 計算 alpha 多樣性:alpha_diversity('shannon', counts, ids=sample_ids)
- 計算 beta 多樣性:beta_diversity('braycurtis', counts, ids=sample_ids)
- 運行 PERMANOVA:permanova(distance_matrix, grouping, permutations=999)
正在使用「scikit-bio」。 從我的序列構建系統發育樹
預期結果:
- 從 FASTA 讀取序列:skbio.DNA.read('sequences.fasta')
- 計算距離矩陣:seq1.distance(seq2) 或使用 kmer_distance
- 使用 NJ 構建樹:nj(distance_matrix)
- 計算 Robinson-Foulds 距離:tree.robinson_foulds(other_tree)
安全審計
安全v4 • 1/17/2026
Documentation-only skill with no executable code. All 133 static findings are false positives: detected backticks are markdown code delimiters, C2 keywords are scientific abbreviations (PC1, CCA, RDA for ordination methods), weak crypto flags are biological substitution matrices (BLOSUM62 for protein alignments), and URLs are official documentation links. No command injection, network exfiltration, or malicious patterns exist.
3
已掃描檔案
1,393
分析行數
2
發現項
4
審計總數
風險因素
審計者: claude 查看審計歷史 →
品質評分
41
架構
100
可維護性
87
內容
20
社群
100
安全
83
規範符合性
你能建構什麼
分析微生物組多樣性
從 OTU 表計算 alpha 和 beta 多樣性,並對樣本分組進行 PERMANOVA 檢驗。
構建系統發育樹
從序列比對構建樹,並計算 Robinson-Foulds 距離以進行樹的比較。
處理序列數據
讀取、過濾和轉換生物序列,支持 19 種以上的文件格式,並提供驗證功能。
試試這些提示
基本序列操作
展示如何使用 skbio 讀取 FASTA 文件、計算互補序列,並使用正則表達式模式查找基序。
多樣性分析
指導我從計數矩陣計算 Shannon alpha 多樣性,並計算樣本之間的 Bray-Curtis beta 多樣性。
系統發育分析
幫我使用 Neighbor Joining 從距離矩陣構建系統發育樹,並計算分類單元之間的祖先距離。
統計檢驗
展示如何對距離矩陣運行 PERMANOVA 檢驗,以確定樣本組之間是否存在顯著差異,進行 999 次排列。
最佳實務
- 對於大型序列文件,使用生成器 (skbio.io.read) 以避免記憶體問題
- 與 pandas 和 numpy 整合,進行下游分析和視覺化
- 在進行多樣性計算之前,驗證序列 ID 是否與各檔案匹配
避免
- 不要對計數使用相對頻率 - 先轉換為整數
- 在計算 Robinson-Foulds 距離時,不要混合有根樹和無根樹
- 運行 PERMANOVA 時不要跳過 PERMDISP - 檢查分散假設
常見問題
scikit-bio 支持哪些檔案格式?
FASTA、FASTQ、GenBank、EMBL、Clustal、PHYLIP、Stockholm、Newick、BIOM (HDF5/JSON) 和分隔矩陣。
如何計算系統發育多樣性?
使用 alpha_diversity('faith_pd', counts, tree=tree, otu_ids=feature_ids),配合有根系統發育樹。
alpha 和 beta 多樣性有什麼區別?
Alpha 測量樣本內多樣性 (如 Shannon、Simpson),Beta 測量樣本間差異 (如 Bray-Curtis、UniFrac)。
我可以將 scikit-bio 與 QIIME 2 一起使用嗎?
可以,scikit-bio 讀取和寫入與 QIIME 2 兼容的格式,包括 BIOM 表、樹和距離矩陣。
如何高效處理大型序列檔案?
使用基於生成器的讀取:for seq in skbio.io.read('large.fasta', format='fasta', constructor=skbio.DNA)
生態數據有哪些統計檢驗可用?
PERMANOVA、ANOSIM、PERMDISP、Mantel 檢驗,以及用於環境變量選擇的 Bioenv。