スキル cellxgene-census

🧬

cellxgene-census

Name: cellxgene-census
Author: K-Dense-AI

低リスク 🌐 ネットワークアクセス

CELLxGENE Censusデータのクエリ

こちらからも入手できます: davila7

研究者は疾患研究や創薬のために大規模なシングルセルゲノミクスデータへのアクセスを必要としています。このスキルはCELLxGENE Censusの6100万細胞へのプログラムによるアクセスを提供し、データセット全体ダウンロードせずに集団規模のクエリを可能にします。

対応: Claude Codex Code(CC)

⚠️ 67 貧弱

スキルZIPをダウンロード

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

オンにして利用開始

テストする

「cellxgene-census」を使用しています。 COVID-19患者の肺組織におけるすべてのT細胞を見つける

期待される結果:

基準に一致する45,230個の細胞を発見：
細胞タイプ：CD4陽性T細胞（18,200）、CD8陽性T細胞（12,450）、制御性T細胞（8,230）、NK T細胞（6,350）
データセット：12のデータセットがデータを貢献
上位組織：肺（45,230）、リンパ節（12,100）、脾臓（8,450）

「cellxgene-census」を使用しています。 neuronsで発現している遺伝子は？

期待される結果:

245のデータセット全体で210万の神経細胞細胞がクエリで返されました
上位発現遺伝子（平均発現）：
- SNAP25：8.4
- SYP：7.2
- MAP2：6.8
- NEUROD1：5.9
- ELavl3：5.4

セキュリティ監査

低リスク

v5 • 1/21/2026

All 228 static findings are FALSE POSITIVEs. The scanner detected patterns in markdown documentation that are not actual security vulnerabilities. External command detections are backticks in code blocks. C2 keyword detections are the substring 'C2' in 'CELLxGENE'. Cryptographic algorithm detections are documentation patterns. System reconnaissance detections are the word 'reconnaissance' in documentation text. The skill is safe for publication.

スキャンされたファイル

3,343

解析された行数

検出結果

総監査数

リスク要因

🌐 ネットワークアクセス (1)

SKILL.md:13

監査者: claude 監査履歴を表示 →

品質スコア

アーキテクチャ

保守性

コンテンツ

コミュニティ

セキュリティ

仕様準拠

作れるもの

組織内の細胞タイプの探索

Censusにクエリして、脳や肺など特定の組織に存在するすべての細胞タイプと細胞タイプ頻度を検出します。

遺伝子発現マーカーの解析

マーカー遺伝子を特定するために、CD4、CD8A、FOXP3などの特定遺伝子の発現レベルを細胞タイプおよび疾患を超えてクエリします。

細胞タイプ分類器の訓練

PyTorchでCensusデータを使用して、細胞タイプ分類タスクのための機械学習モデルを訓練します。

これらのプロンプトを試す

基本的な細胞クエリ

CELLxGENE Censusから[TISSUE]組織における[CELL_TYPE]タイプのすべての細胞を見つけます。セル数とメタデータを返してください。

マルチ遺伝子発現解析

[DISEASE]データセット内のすべての細胞タイプについて[GENE1]、[GENE2]、および[GENE3]の遺伝子発現をクエリします。発現パターンを表示してください。

組織間比較

[TISSUE1]、[TISSUE2]、および[TISSUE3]組織を超えて[CELL_TYPE]細胞を比較します。差次的発現遺伝子は何ですか？

機械学習データセットの作成

[CELL_TYPE]分類用のCensusからトレーニングデータセットを作成します。[COLUMNS]メタデータと遺伝子発現データを含めます。

ベストプラクティス

常にis_primary_data == Trueでフィルターして、結果内の重複セルを避けてください
再現性のある研究のためにcensus_versionを明示的に指定してください
大規模なデータセットをロードする前にクエリサイズを推定して、メモリ問題を防止してください

回避

フィルターなしでクエリしないでください - 常に組織、細胞タイプ、または疾患の基準を指定してください
一度にすべてのCensusデータをロードしないでください - フィルターと列選択を使用してデータ転送を減らしてください
is_primary_dataフラグを無視しないでください - 重複セルをカウントするのを防ぎます

よくある質問

CELLxGENE Censusとは？

CELLxGENE Censusは、6100万以上の細胞を含む人間とマウスのシングルセルゲノミクスデータの標準化、バージョン付けされたコレクションです。遺伝子発現行列、メタデータ、エンベディングへのプログラムによるアクセスを提供します。

scanpyやscvi-toolsとの違いは何ですか？

このスキルは外部Censusデータをクエリします。ローカルデータセットを解析する場合はscanpyまたはscvi-toolsを使用してください。Censusはリファレンスアトラス比較と集団規模のクエリに最適です。

利用可能な生物種は？

CensusにはHomo sapiens（人間）とMus musculus（マウス）のデータが含まれています。organism='Homo sapiens'またはorganism='Mus musculus'でクエリしてください。

効果的にフィルターするには？

obs_value_filterを細胞メタデータに、var_value_filterを遺伝子メタデータに使用してください。条件は'and'または'or'で組み合わせてください。複数の値には'in'を使用してください。

クエリがメモリに大きすぎる場合は？

axis_query()メソッドで反復的なバッチ処理を使用してください。これにより、利用可能なRAMを超えるクエリのアウトオブコア処理が可能になります。

再現性のある結果を確保するには？

Censusを開くときに常にcensus_versionパラメータを指定してください（例：census_version='2023-07-25'）。これにより、特定のデータリリースに分析を固定できます。

開発者の詳細

作成者

K-Dense-AI

ライセンス

Unknown

リポジトリ

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/cellxgene-census

参照

main

ファイル構成

📁 references/

📄 census_schema.md

📄 common_patterns.md

📄 SKILL.md