研究人員需要高效存取群體規模的單細胞數據以進行基因組學研究。此技能提供 AI 驅動的 CZ CELLxGENE Census 存取功能,具備優化的查詢模式和下游分析整合指南。
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"cellxgene-census" 사용 중입니다. 尋找肺組織中的所有免疫細胞類型及其數量
예상 결과:
- B cell: 45,230 cells across 3 datasets
- T cell: 67,890 cells across 5 datasets
- Macrophage: 23,450 cells across 4 datasets
- Dendritic cell: 12,100 cells across 2 datasets
- NK cell: 18,760 cells across 3 datasets
"cellxgene-census" 사용 중입니다. 展示如何查詢 COVID-19 患者 T 細胞中的標記基因
예상 결과:
- Use get_anndata with obs_value_filter for disease and cell type
- Filter by feature_name using var_value_filter for gene selection
- Include is_primary_data == True to avoid duplicate cells
- Retrieve cell_type, tissue_general, and donor_id metadata columns
"cellxgene-census" 사용 중입니다. 如何將 Census 數據與 scanpy 一起用於降維
예상 결과:
- Load data with get_anndata using appropriate filters
- Apply scanpy normalization: sc.pp.normalize_total
- Run log transformation: sc.pp.log1p
- Compute PCA: sc.pp.pca
- Generate UMAP: sc.tl.umap and sc.pl.umap
보안 감사
안전Pure documentation skill containing only markdown files with Python code examples. Static scanner flagged documentation patterns (code block syntax, text strings) as security issues due to misinterpretation. All findings are false positives. No executable code, network calls, file system access, or environment variable access exists.
위험 요인
⚙️ 외부 명령어 (200)
🌐 네트워크 접근 (1)
품질 점수
만들 수 있는 것
探索組織中的細胞類型
使用元數據篩選器和聚合函數查詢組織間的細胞類型分布
建立細胞類型分類器
使用 PyTorch 整合在 Census 數據上訓練機器學習模型以進行生物標記發現
跨數據集分析
使用 scanpy 工作流程整合多個數據集進行群體規模研究
이 프롬프트를 사용해 보세요
Show me the unique cell types in the brain tissue from the Census. Use the cellxgene-census skill to query metadata with is_primary_data == True filter.
Query expression data for CD4, CD8A, and CD19 genes in T cells and B cells from lung tissue. Use cellxgene-census to retrieve AnnData objects.
Create a PyTorch dataloader using cellxgene-census experimental ml module to train a cell type classifier on liver cell data with 80-20 train-test split.
Show me how to use axis_query with out-of-core processing to iterate through brain cell expression data in chunks for memory-efficient analysis.
모범 사례
- 始終包含 is_primary_data == True 篩選器以避免跨數據集重複計算細胞
- 在生產工作流程中明確指定 census_version 以確保分析可重現
- 使用上下文管理器(with 語句)在開啟 Census 時自動清理資源
피하기
- 在沒有篩選器的情況下載入整個 Census 會導致記憶體溢出
- 忽略數據集存在矩陣會導致基因數據遺失
- 使用自由文字篩選器而非本體術語會降低查詢一致性