技能 pydeseq2
🧬

pydeseq2

低风险 📁 文件系统访问⚡ 包含脚本

PyDESeq2로 차등 유전자 발현 분석 수행

也可从以下获取: K-Dense-AI

통계적 엄격성을 갖춘 대량 RNA-seq 카운트 데이터에서 차등 발현 유전자를 식별합니다. PyDESeq2는 정규화, 분산 추정, Wald 검정, FDR 보정 및 출판 수준의 시각화를 포함한 완전한 DESeq2 워크플로우를 제공합니다.

支持: Claude Codex Code(CC)
🥉 72 青铜
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“pydeseq2”。 Analyze my RNA-seq data comparing disease vs healthy samples

预期结果:

  • Analysis Summary:
  • • Total genes tested: 20,000
  • • Significant genes (padj < 0.05): 1,234
  • • Upregulated in disease: 687 genes
  • • Downregulated in disease: 547 genes
  •  
  • Top 5 Most Significant Genes:
  • • GeneA - log2FC: 3.2, padj: 1.2e-15
  • • GeneB - log2FC: -2.8, padj: 4.5e-12
  • • GeneC - log2FC: 2.1, padj: 8.9e-10
  • • GeneD - log2FC: -1.9, padj: 2.1e-8
  • • GeneE - log2FC: 1.7, padj: 5.6e-7

正在使用“pydeseq2”。 Run differential expression with batch correction

预期结果:

  • Design: ~batch + condition
  • Batch effect included in model
  •  
  • Results with batch correction:
  • • Significant genes: 892
  • • Top hits after batch adjustment: GeneX, GeneY, GeneZ
  •  
  • Volcano plot saved to results/volcano_plot.png
  • MA plot saved to results/ma_plot.png

安全审计

低风险
v5 • 1/17/2026

This is a legitimate bioinformatics skill for differential gene expression analysis. All 443 static findings are FALSE POSITIVE. The 'Ruby/shell backtick' detections are Markdown code formatting syntax (documentation). The 'Weak cryptographic algorithm' detections are false triggers on the term 'DES' (DESeq2 is a bioinformatics method, not cryptography). The 'filesystem' operations are legitimate result-saving functionality. No network exfiltration, no malicious code, no command injection patterns.

5
已扫描文件
1,962
分析行数
2
发现项
5
审计总数

风险因素

审计者: claude 查看审计历史 →

质量评分

64
架构
100
可维护性
87
内容
19
社区
90
安全
78
规范符合性

你能构建什么

처리군 대 대조군 비교

실험 조건 간 유전자 발현을 비교하여 하위 기능 분석을 위한 차등 발현 유전자를 식별합니다.

다중 인자 설계

배치 효과, 다중 조건 또는 상호작용 항이 있는 복잡한 실험을 모델링하여 정확한 효과 추정을 수행합니다.

자동화 파이프라인

구성 가능한 매개변수와 자동화된 결과 내보내기를 통해 명령줄에서 표준화된 차등 발현 워크플로우를 실행합니다.

试试这些提示

기본 DEA
Use PyDESeq2 to analyze my RNA-seq data. I have counts.csv with gene counts and metadata.csv with sample conditions. Compare treated vs control samples with design ~condition.
배치 보정
Run PyDESeq2 analysis controlling for batch effects. My design should be ~batch + condition. Export results sorted by adjusted p-value.
다중 비교
Perform pairwise comparisons between multiple treatment groups against a control using PyDESeq2. Generate volcano plots highlighting significant genes.
맞춤형 파이프라인
Create a complete PyDESeq2 pipeline with custom parameters: minimum count threshold of 15, alpha of 0.01, with Cook's distance filtering. Save significant genes and generate visualization plots.

最佳实践

  • 통계적 검정력을 향상시키고 계산 시간을 줄이기 위해 분석 전에 낮은 카운트 유전자 필터링
  • 기술적 변동이 예상되는 경우 설계 공식에 배치 효과 포함
  • 통계적 유의성 보고가 아닌 시각화 및 순위 지정을 위해서만 LFC 축소 사용

避免

  • 유의한 결과로 FDR 보정 값 대신 원시 p-값 보고
  • 방향 오류 또는 샘플 불일치를 감지하는 데이터 검증 단계 건너뛰기
  • 통계 검정 전에 LFC 축소를 적용하여 p-값 분포를 변경하는 행위

常见问题

PyDESeq2는 어떤 데이터 형식을 요구하나요?
카운트 행렬은 샘플 × 유전자 형식이어야 하며 음이 아닌 정수여야 합니다. 메타데이터는 샘플 × 변수 형식이어야 하며 일치하는 샘플 이름이 있어야 합니다.
PyDESeq2와 원본 R DESeq2의 차이점은 무엇인가요?
PyDESeq2는 순수 Python으로 재구현된 버전입니다. Python 데이터 과학 도구와 통합하면서 R DESeq2 v1.34.0 기본 설정과 일치하는 것을 목표로 합니다.
이 스킬로 단일 세포 RNA-seq 데이터를 분석할 수 있나요?
아니요. PyDESeq2는 대량 RNA-seq 카운트 데이터용으로 설계되었습니다. 단일 세포 분석은 특수 처리를 사용하는 DESeq2 또는 다른 도구와 같은 전문화된 방법이 필요합니다.
비교할 그룹을 어떻게 지정하나요?
contrast 매개변수를 사용합니다: [variable, test_level, reference_level]. 예를 들어, [condition, treated, control]은 처리군과 대조군을 비교합니다.
이 스킬을 사용할 때 내 데이터가 안전한가요?
예. 이 스킬은 로컬에서 실행되며 명시적으로 지정한 파일에만 액세스합니다. 외부 서버나 타사 서비스로 데이터가 전송되지 않습니다.
LFC 축소란 무엇이며 언제 사용해야 하나요?
LFC 축소는 apeGLM 추정을 적용하여 배수 변화 추정의 노이즈를 줄입니다. 시각화 및 유전자 순위 지정에 사용하되, 유의성에 대해서는 축소되지 않은 p-값을 보고하세요.