技能 pydeseq2

🧬

pydeseq2

Name: pydeseq2
Author: K-Dense-AI

安全 📁 檔案系統存取🌐 網路存取

使用 PyDESeq2 分析 RNA-seq 差異基因表現

也可從以下取得: davila7

PyDESeq2 可對大量 RNA-seq 計數資料進行差異基因表現分析。執行統計檢定、多重比較校正，並為您的基因體學研究產生可直接發表的火山圖和 MA 圖。

支援: Claude Codex Code(CC)

🥉 74 青銅

下載技能 ZIP

在 Claude 中上傳

前往設定 → 功能 → 技能 → 上傳技能

開啟並開始使用

測試它

正在使用「pydeseq2」。分析我的 RNA-seq 資料並顯示頂部差異表現基因

預期結果:

分析完成。發現 847 個顯著基因（padj < 0.05）
頂部上調基因：
- GeneX：log2FC = 4.2，padj = 1.3e-15
- GeneY：log2FC = 3.8，padj = 2.7e-12
- GeneZ：log2FC = 3.5，padj = 5.1e-11
頂部下調基因：
- GeneA：log2FC = -3.9，padj = 8.2e-14
- GeneB：log2FC = -3.1，padj = 3.4e-10
結果已儲存至 deseq2_results.csv

安全審計

安全

v4 • 1/17/2026

All 429 static findings are false positives. The 'weak cryptographic algorithm' flags incorrectly match 'DES' in 'DESeq2' (a statistical method name, not cryptography). The 'external_commands' flags misinterpret markdown code fences as shell execution. Filesystem access is standard data I/O for bioinformatics workflows. Network access involves only documentation URLs. This is a legitimate scientific computing skill with no malicious code.

已掃描檔案

1,961

分析行數

發現項

審計總數

風險因素

📁 檔案系統存取 (2)

scripts/run_deseq2_analysis.py:180-185 SKILL.md:211-213

🌐 網路存取 (1)

SKILL.md:553-556

審計者: claude 查看審計歷史 →

品質評分

架構

100

可維護性

內容

社群

100

安全

規範符合性

你能建構什麼

比較處理組與對照組

使用適當的統計檢定和 FDR 校正，在實驗條件之間識別差異表現的基因，以獲得可直接發表的結果。

RNA-seq 論文分析

處理 RNA-seq 計數資料，執行差異表現分析，並為論文或研究論文產生可直接發表的圖表。

批次 RNA-seq 處理

使用內建的命令列腳本，自動化多個條件或時間點的差異表現分析。

試試這些提示

基本 DE 分析

從 counts.csv 和 metadata.csv 載入我的 RNA-seq 資料，然後使用 PyDESeq2 比較處理組與對照組樣本進行差異表現分析

多因子設計

使用設計公式 ~batch + condition 分析我的 RNA-seq 資料以修正批次效應，然後檢定處理組與對照組的差異

產生視覺化圖表

在我的資料上執行 PyDESeq2 分析，並建立火山圖和 MA 圖，標記 padj < 0.05 的顯著基因

進階過濾

載入 RNA-seq 資料，過濾總計數少於 20 的基因，使用多因子設計 ~age + sex + condition，並識別 |log2FC| > 1 且 padj < 0.01 的基因

最佳實務

如果基因是列，請務必轉置計數矩陣（使用 .T 取得樣本 × 基因格式）
在分析前過濾低計數基因以提高統計效力
使用調整後的 p 值（padj）而非原始 p 值來判斷顯著性
確保樣本名稱在計數和中繼資料檔案中完全一致

避免

千萬不要對多重檢定使用原始 p 值 - 務必使用 FDR 校正後的 padj 值
不要在統計檢定前套用 LFC 收縮 - 僅在視覺化時使用
避免在每個條件沒有足夠樣本量的情況下使用複雜的多因子設計
千萬不要轉置中繼資料 - 只有在需要時才轉置計數矩陣

常見問題

為什麼我會收到索引不符錯誤？

計數和中繼資料檔案中的樣本名稱不相符。請確保兩個檔案使用相同格式的相同樣本識別符。

我應該轉置我的計數矩陣嗎？

如果您的 CSV 檔案中基因是列而樣本是列，請使用 .T 轉置以取得所需的樣本 × 基因格式。

pvalue 和 padj 有什麼區別？

pvalue 是原始統計 p 值；padj 是經 FDR 校正後的值用於多重檢定。使用 padj < 0.05 判斷顯著性。

我應該在什麼時候使用 LFC 收縮？

在統計檢定後套用 LFC 收縮以進行視覺化、基因排名或建立熱圖。勿用於判斷顯著性。

如何在分析中處理批次效應？

在您的設計公式中將批次納入 ~batch + condition。這可在檢測生物差異的同時控制技術變異。

為什麼我的分析中沒有顯著基因？

檢查您的樣本量、效應大小和生物變異性。小型研究或細微效應可能只會產生很少的顯著基因。

開發者詳情

作者

K-Dense-AI

授權

MIT license

儲存庫

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/pydeseq2

引用

main

檔案結構

📁 references/

📄 api_reference.md

📄 workflow_guide.md

📁 scripts/

📄 run_deseq2_analysis.py

📄 SKILL.md