技能 pydeseq2
🧬
PyDESeq2 可對大量 RNA-seq 計數資料進行差異基因表現分析。執行統計檢定、多重比較校正,並為您的基因體學研究產生可直接發表的火山圖和 MA 圖。
支援: Claude Codex Code(CC)
1
下載技能 ZIP
2
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
3
開啟並開始使用
測試它
正在使用「pydeseq2」。 分析我的 RNA-seq 資料並顯示頂部差異表現基因
預期結果:
- 分析完成。發現 847 個顯著基因(padj < 0.05)
- 頂部上調基因:
- - GeneX:log2FC = 4.2,padj = 1.3e-15
- - GeneY:log2FC = 3.8,padj = 2.7e-12
- - GeneZ:log2FC = 3.5,padj = 5.1e-11
- 頂部下調基因:
- - GeneA:log2FC = -3.9,padj = 8.2e-14
- - GeneB:log2FC = -3.1,padj = 3.4e-10
- 結果已儲存至 deseq2_results.csv
安全審計
安全v4 • 1/17/2026
All 429 static findings are false positives. The 'weak cryptographic algorithm' flags incorrectly match 'DES' in 'DESeq2' (a statistical method name, not cryptography). The 'external_commands' flags misinterpret markdown code fences as shell execution. Filesystem access is standard data I/O for bioinformatics workflows. Network access involves only documentation URLs. This is a legitimate scientific computing skill with no malicious code.
5
已掃描檔案
1,961
分析行數
2
發現項
4
審計總數
風險因素
📁 檔案系統存取 (2)
🌐 網路存取 (1)
審計者: claude 查看審計歷史 →
品質評分
64
架構
100
可維護性
83
內容
22
社群
100
安全
78
規範符合性
你能建構什麼
比較處理組與對照組
使用適當的統計檢定和 FDR 校正,在實驗條件之間識別差異表現的基因,以獲得可直接發表的結果。
RNA-seq 論文分析
處理 RNA-seq 計數資料,執行差異表現分析,並為論文或研究論文產生可直接發表的圖表。
批次 RNA-seq 處理
使用內建的命令列腳本,自動化多個條件或時間點的差異表現分析。
試試這些提示
基本 DE 分析
從 counts.csv 和 metadata.csv 載入我的 RNA-seq 資料,然後使用 PyDESeq2 比較處理組與對照組樣本進行差異表現分析
多因子設計
使用設計公式 ~batch + condition 分析我的 RNA-seq 資料以修正批次效應,然後檢定處理組與對照組的差異
產生視覺化圖表
在我的資料上執行 PyDESeq2 分析,並建立火山圖和 MA 圖,標記 padj < 0.05 的顯著基因
進階過濾
載入 RNA-seq 資料,過濾總計數少於 20 的基因,使用多因子設計 ~age + sex + condition,並識別 |log2FC| > 1 且 padj < 0.01 的基因
最佳實務
- 如果基因是列,請務必轉置計數矩陣(使用 .T 取得樣本 × 基因格式)
- 在分析前過濾低計數基因以提高統計效力
- 使用調整後的 p 值(padj)而非原始 p 值來判斷顯著性
- 確保樣本名稱在計數和中繼資料檔案中完全一致
避免
- 千萬不要對多重檢定使用原始 p 值 - 務必使用 FDR 校正後的 padj 值
- 不要在統計檢定前套用 LFC 收縮 - 僅在視覺化時使用
- 避免在每個條件沒有足夠樣本量的情況下使用複雜的多因子設計
- 千萬不要轉置中繼資料 - 只有在需要時才轉置計數矩陣
常見問題
為什麼我會收到索引不符錯誤?
計數和中繼資料檔案中的樣本名稱不相符。請確保兩個檔案使用相同格式的相同樣本識別符。
我應該轉置我的計數矩陣嗎?
如果您的 CSV 檔案中基因是列而樣本是列,請使用 .T 轉置以取得所需的樣本 × 基因格式。
pvalue 和 padj 有什麼區別?
pvalue 是原始統計 p 值;padj 是經 FDR 校正後的值用於多重檢定。使用 padj < 0.05 判斷顯著性。
我應該在什麼時候使用 LFC 收縮?
在統計檢定後套用 LFC 收縮以進行視覺化、基因排名或建立熱圖。勿用於判斷顯著性。
如何在分析中處理批次效應?
在您的設計公式中將批次納入 ~batch + condition。這可在檢測生物差異的同時控制技術變異。
為什麼我的分析中沒有顯著基因?
檢查您的樣本量、效應大小和生物變異性。小型研究或細微效應可能只會產生很少的顯著基因。