研究人員需要存取大規模單細胞基因體學資料以進行疾病研究和藥物發現。此技能提供對 CELLxGENE Census 中 6100 萬個細胞的程式化存取,能夠進行群體規模的查詢而無需下載整個資料集。
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“cellxgene-census”。 找出 COVID-19 患者肺組織中的所有 T 細胞
预期结果:
- 找到 45,230 個符合條件的細胞:
- 細胞類型: CD4-positive T cell (18,200)、CD8-positive T cell (12,450)、regulatory T cell (8,230)、NK T cell (6,350)
- 資料集: 12 個資料集貢獻資料
- 主要組織: lung (45,230)、lymph node (12,100)、spleen (8,450)
正在使用“cellxgene-census”。 神經元中表現哪些基因?
预期结果:
- 查詢回傳 245 個資料集中的 210 萬個神經元細胞
- 高表現基因(平均表現量):
- - SNAP25: 8.4
- - SYP: 7.2
- - MAP2: 6.8
- - NEUROD1: 5.9
- - ELavl3: 5.4
安全审计
低风险All 228 static findings are FALSE POSITIVEs. The scanner detected patterns in markdown documentation that are not actual security vulnerabilities. External command detections are backticks in code blocks. C2 keyword detections are the substring 'C2' in 'CELLxGENE'. Cryptographic algorithm detections are documentation patterns. System reconnaissance detections are the word 'reconnaissance' in documentation text. The skill is safe for publication.
风险因素
🌐 网络访问 (1)
质量评分
你能构建什么
探索組織中的細胞類型
查詢 Census 以發現特定組織(如大腦或肺部)中存在的所有細胞類型及細胞類型頻率。
分析基因表現標記
查詢特定基因(CD4、CD8A、FOXP3)在不同細胞類型和疾病中的表現水平,以識別標記基因。
訓練細胞類型分類器
使用 Census 資料與 PyTorch 訓練機器學習模型以執行細胞類型分類任務。
试试这些提示
從 CELLxGENE Census 中找出 [TISSUE] 組織中類型為 [CELL_TYPE] 的所有細胞。回傳細胞數量和中繼資料。
查詢 [DISEASE] 資料集中所有細胞類型的 [GENE1]、[GENE2] 和 [GENE3] 基因表現。顯示表現模式。
比較 [TISSUE1]、[TISSUE2] 和 [TISSUE3] 組織中的 [CELL_TYPE] 細胞。哪些基因有差異表現?
從 Census 建立用於 [CELL_TYPE] 分類的訓練資料集。包含 [COLUMNS] 中繼資料和基因表現資料。
最佳实践
- 始終篩選 is_primary_data == True 以避免結果中出現重複細胞
- 明確指定 census_version 以確保研究可重現性
- 在載入大型資料集前先估計查詢大小,以防止記憶體問題
避免
- 不要在沒有篩選條件的情況下查詢 - 始終指定組織、細胞類型或疾病條件
- 不要一次載入所有 Census 資料 - 使用篩選和欄位選擇來減少資料傳輸
- 不要忽略 is_primary_data 旗標 - 它可防止重複計算細胞
常见问题
什麼是 CELLxGENE Census?
這與 scanpy 或 scvi-tools 有何不同?
有哪些生物體可用?
如何有效地篩選查詢?
如果我的查詢對記憶體來說太大怎麼辦?
如何確保結果可重現?
开发者详情
作者
K-Dense-AI许可证
Unknown
仓库
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/cellxgene-census引用
main
文件结构