研究者は疾患研究や創薬のために大規模なシングルセルゲノミクスデータへのアクセスを必要としています。このスキルはCELLxGENE Censusの6100万細胞へのプログラムによるアクセスを提供し、データセット全体ダウンロードせずに集団規模のクエリを可能にします。
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「cellxgene-census」を使用しています。 COVID-19患者の肺組織におけるすべてのT細胞を見つける
期待される結果:
- 基準に一致する45,230個の細胞を発見:
- 細胞タイプ:CD4陽性T細胞(18,200)、CD8陽性T細胞(12,450)、制御性T細胞(8,230)、NK T細胞(6,350)
- データセット:12のデータセットがデータを貢献
- 上位組織:肺(45,230)、リンパ節(12,100)、脾臓(8,450)
「cellxgene-census」を使用しています。 neuronsで発現している遺伝子は?
期待される結果:
- 245のデータセット全体で210万の神経細胞細胞がクエリで返されました
- 上位発現遺伝子(平均発現):
- - SNAP25:8.4
- - SYP:7.2
- - MAP2:6.8
- - NEUROD1:5.9
- - ELavl3:5.4
セキュリティ監査
低リスクAll 228 static findings are FALSE POSITIVEs. The scanner detected patterns in markdown documentation that are not actual security vulnerabilities. External command detections are backticks in code blocks. C2 keyword detections are the substring 'C2' in 'CELLxGENE'. Cryptographic algorithm detections are documentation patterns. System reconnaissance detections are the word 'reconnaissance' in documentation text. The skill is safe for publication.
リスク要因
🌐 ネットワークアクセス (1)
品質スコア
作れるもの
組織内の細胞タイプの探索
Censusにクエリして、脳や肺など特定の組織に存在するすべての細胞タイプと細胞タイプ頻度を検出します。
遺伝子発現マーカーの解析
マーカー遺伝子を特定するために、CD4、CD8A、FOXP3などの特定遺伝子の発現レベルを細胞タイプおよび疾患を超えてクエリします。
細胞タイプ分類器の訓練
PyTorchでCensusデータを使用して、細胞タイプ分類タスクのための機械学習モデルを訓練します。
これらのプロンプトを試す
CELLxGENE Censusから[TISSUE]組織における[CELL_TYPE]タイプのすべての細胞を見つけます。セル数とメタデータを返してください。
[DISEASE]データセット内のすべての細胞タイプについて[GENE1]、[GENE2]、および[GENE3]の遺伝子発現をクエリします。発現パターンを表示してください。
[TISSUE1]、[TISSUE2]、および[TISSUE3]組織を超えて[CELL_TYPE]細胞を比較します。差次的発現遺伝子は何ですか?
[CELL_TYPE]分類用のCensusからトレーニングデータセットを作成します。[COLUMNS]メタデータと遺伝子発現データを含めます。
ベストプラクティス
- 常にis_primary_data == Trueでフィルターして、結果内の重複セルを避けてください
- 再現性のある研究のためにcensus_versionを明示的に指定してください
- 大規模なデータセットをロードする前にクエリサイズを推定して、メモリ問題を防止してください
回避
- フィルターなしでクエリしないでください - 常に組織、細胞タイプ、または疾患の基準を指定してください
- 一度にすべてのCensusデータをロードしないでください - フィルターと列選択を使用してデータ転送を減らしてください
- is_primary_dataフラグを無視しないでください - 重複セルをカウントするのを防ぎます
よくある質問
CELLxGENE Censusとは?
scanpyやscvi-toolsとの違いは何ですか?
利用可能な生物種は?
効果的にフィルターするには?
クエリがメモリに大きすぎる場合は?
再現性のある結果を確保するには?
開発者の詳細
作成者
K-Dense-AIライセンス
Unknown
リポジトリ
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/cellxgene-census参照
main
ファイル構成