スキル scikit-bio
🧬

scikit-bio

安全 ⚙️ 外部コマンド🌐 ネットワークアクセス

scikit-bioを使用した生物学的データの分析

こちらからも入手できます: davila7

生物学的配列の処理、多様性指標の計算、マイクロバイオームおよび生態学的データに対する統計的検定を実施します。このスキルは、アライメント、系統解析、次元縮約を含むバイオインフォマティクスワークフローに関する包括的なガイダンスを提供します。

対応: Claude Codex Code(CC)
📊 69 十分
1

スキルZIPをダウンロード

2

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

3

オンにして利用開始

テストする

「scikit-bio」を使用しています。 OTUテーブルから多様性指標を計算する

期待される結果:

  • BIOMテーブルの読み込み: Table.read('table.biom')
  • アルファ多様性の計算: alpha_diversity('shannon', counts, ids=sample_ids)
  • ベータ多様性の計算: beta_diversity('braycurtis', counts, ids=sample_ids)
  • PERMANOVAの実行: permanova(distance_matrix, grouping, permutations=999)

「scikit-bio」を使用しています。 配列から系統樹を構築する

期待される結果:

  • FASTAからの配列読み込み: skbio.DNA.read('sequences.fasta')
  • 距離行列の計算: seq1.distance(seq2) または kmer_distance の使用
  • NJツリーの構築: nj(distance_matrix)
  • Robinson-Foulds距離の計算: tree.robinson_foulds(other_tree)

セキュリティ監査

安全
v4 • 1/17/2026

Documentation-only skill with no executable code. All 133 static findings are false positives: detected backticks are markdown code delimiters, C2 keywords are scientific abbreviations (PC1, CCA, RDA for ordination methods), weak crypto flags are biological substitution matrices (BLOSUM62 for protein alignments), and URLs are official documentation links. No command injection, network exfiltration, or malicious patterns exist.

3
スキャンされたファイル
1,393
解析された行数
2
検出結果
4
総監査数
監査者: claude 監査履歴を表示 →

品質スコア

41
アーキテクチャ
100
保守性
87
コンテンツ
20
コミュニティ
100
セキュリティ
83
仕様準拠

作れるもの

マイクロバイオームの多様性分析

OTUテーブルからアルファおよびベータ多様性を計算し、サンプルグループのPERMANOVA検定を実施します。

系統樹の構築

シーケンスアライメントからツリーを構築し、ツリー比較のためのRobinson-Foulds距離を計算します。

シーケンスデータの処理

19以上のファイル形式で生物学的配列を読み込み、フィルタリング、変換、バリデーションを実施します。

これらのプロンプトを試す

基本的なシーケンス操作
skbioでFASTAファイルを読み込み、リバースコンプリメントを計算し、regexパターンを使用してモチーフを見つける方法を示してください。
多様性解析
カウント行列からShannonアルファ多様性を計算し、サンプル間のBray-Curtisベータ多様性を計算するプロセスを案内してください。
系統解析
距離行列からNeighbor Joiningを使用して系統樹を構築し、分類群間の系統距離(patristic distance)を計算する方法を教えてください。
統計的検定
サンプルグループが有意に異なるかどうかを判断するために、距離行列でPERMANOVA検定を実行する方法を示してください。999回のパーミテーションで実施します。

ベストプラクティス

  • 大規模なシーケンスファイルにはジェネレータ(skbio.io.read)を使用してメモリ問題を回避してください
  • 下流の解析と可視化のためにpandasおよびnumpyと統合してください
  • 多様性計算の前にファイルの配列IDが一致しているかをバリデーションしてください

回避

  • カウントに相対頻度を使用しないでください - まず整数に変換してください
  • Robinson-Foulds距離を計算する際にルート付きツリーとルートなしツリーを混合しないでください
  • PERMANOVAを実行する際にPERMDISPをスキップしないでください - 分散の仮定を確認してください

よくある質問

scikit-bioはどのようなファイル形式をサポートしていますか?
FASTA、FASTQ、GenBank、EMBL、Clustal、PHYLIP、Stockholm、Newick、BIOM(HDF5/JSON)、および区切り行列をサポートしています。
系統多様性を計算するにはどうすればよいですか?
alpha_diversity('faith_pd', counts, tree=tree, otu_ids=feature_ids) をルート付き系統樹とともに使用してください。
アルファ多様性とベータ多様性の違いは何ですか?
アルファはサンプル内多様性(例:Shannon、Simpson)、ベータはサンプル間類似性(例:Bray-Curtis、UniFrac)を測定します。
scikit-bioをQIIME 2で使用できますか?
はい、scikit-bioはBIOMテーブル、ツリー、距離行列を含むQIIME 2互換形式の読み書きができます。
大規模なシーケンスファイルを効率的に処理するにはどうすればよいですか?
ジェネレータベースの読み込みを使用してください: for seq in skbio.io.read('large.fasta', format='fasta', constructor=skbio.DNA)
生態学的データに使用できる統計的検定にはどのようなものがありますか?
PERMANOVA、ANOSIM、PERMDISP、Mantel検定、環境変数選択のためのBioenvが利用可能です。

開発者の詳細

作成者

K-Dense-AI

ライセンス

BSD-3-Clause license

参照

main

ファイル構成