🧬

pydeseq2

Name: pydeseq2
Author: K-Dense-AI

Безопасно 📁 Доступ к файловой системе🌐 Доступ к сети

Анализ дифференциальной экспрессии генов RNA-seq с помощью PyDESeq2

Также доступно от: davila7

PyDESeq2 позволяет проводить анализ дифференциальной экспрессии генов на основе данных подсчетов объемного RNA-seq. Выполняйте статистическое тестирование, коррекцию множественных сравнений и создавайте готовые к публикации вулканные и MA графики для ваших геномных исследований.

Поддерживает: Claude Codex Code(CC)

🥉 74 Бронза

Скачать ZIP навыка

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

Включите и начните использовать

Протестировать

Использование «pydeseq2». Проанализируйте мои данные RNA-seq и покажите топ дифференциально экспрессированных генов

Ожидаемый результат:

Анализ завершен. Найдено 847 значимых генов (padj < 0.05)
Топ повышенно экспрессированных генов:
- GeneX: log2FC = 4.2, padj = 1.3e-15
- GeneY: log2FC = 3.8, padj = 2.7e-12
- GeneZ: log2FC = 3.5, padj = 5.1e-11
Топ пониженно экспрессированных генов:
- GeneA: log2FC = -3.9, padj = 8.2e-14
- GeneB: log2FC = -3.1, padj = 3.4e-10
Результаты сохранены в deseq2_results.csv

Аудит безопасности

Безопасно

v4 • 1/17/2026

All 429 static findings are false positives. The 'weak cryptographic algorithm' flags incorrectly match 'DES' in 'DESeq2' (a statistical method name, not cryptography). The 'external_commands' flags misinterpret markdown code fences as shell execution. Filesystem access is standard data I/O for bioinformatics workflows. Network access involves only documentation URLs. This is a legitimate scientific computing skill with no malicious code.

Просканировано файлов

1,961

Проанализировано строк

находки

Всего аудитов

Факторы риска

📁 Доступ к файловой системе (2)

scripts/run_deseq2_analysis.py:180-185 SKILL.md:211-213

🌐 Доступ к сети (1)

SKILL.md:553-556

Проверено: claude Посмотреть историю аудитов →

Оценка качества

Архитектура

100

Сопровождаемость

Контент

Сообщество

100

Безопасность

Соответствие спецификации

Что вы можете построить

Сравнение обработанных vs контрольных образцов

Определите дифференциально экспрессированные гены между экспериментальными условиями, используя надлежащее статистическое тестирование и коррекцию FDR для получения результатов, готовых к публикации.

Анализ RNA-seq для диссертации

Обработайте данные подсчетов RNA-seq, проведите анализ дифференциальной экспрессии и создайте готовые к публикации фигуры для диссертации или исследовательских статей.

Пакетная обработка RNA-seq

Автоматизируйте анализ дифференциальной экспрессии для нескольких условий или временных точек с помощью прилагаемого скрипта командной строки.

Попробуйте эти промпты

Базовый DE анализ

Загрузите мои данные RNA-seq из counts.csv и metadata.csv, затем выполните анализ дифференциальной экспрессии, сравнивая обработанные и контрольные образцы с использованием PyDESeq2

Многофакторный дизайн

Проанализируйте мои данные RNA-seq с учетом пакетных эффектов, используя формулу дизайна ~batch + condition, затем протестируйте различия между обработкой и контролем

Создание визуализаций

Запустите анализ PyDESeq2 на моих данных и создайте вулканные и MA графики, выделяя значимые гены с padj < 0.05

Расширенная фильтрация

Загрузите данные RNA-seq, отфильтруйте гены с менее чем 20 суммарными подсчетами, используйте многофакторный дизайн ~age + sex + condition, и определите гены с |log2FC| > 1 и padj < 0.01

Лучшие практики

Всегда транспонируйте матрицу подсчетов, если гены являются строками (используйте .T для получения формата образцы × гены)
Фильтруйте гены с низкими подсчетами перед анализом для улучшения статистической мощности
Используйте скорректированные p-значения (padj), а не сырые p-значения для определения значимости
Убедитесь, что имена образцов точно совпадают между файлами подсчетов и метаданных

Избегать

Никогда не используйте сырые p-значения для множественного тестирования — всегда используйте FDR-скорректированные значения padj
Не применяйте сжатие LFC перед статистическим тестированием — используйте после для визуализации только
Избегайте сложных многофакторных дизайнов без достаточного размера выборки на условие
Никогда не транспонируйте метаданные — транспонируйте только матрицу подсчетов при необходимости

Часто задаваемые вопросы

Почему я получаю ошибку несоответствия индексов?

Имена образцов в файлах подсчетов и метаданных не совпадают. Убедитесь, что оба файла используют идентичные идентификаторы образцов в одинаковом формате.

Нужно ли транспонировать мою матрицу подсчетов?

Если в вашем CSV гены являются строками, а образцы — столбцами, транспонируйте с помощью .T, чтобы получить требуемый формат образцы × гены.

В чем разница между pvalue и padj?

pvalue — это сырое статистическое p-значение; padj — это FDR-скорректированное значение для множественного тестирования. Используйте padj < 0.05 для значимости.

Когда следует использовать сжатие LFC?

Применяйте сжатие LFC после статистического тестирования для визуализации, ранжирования генов или создания тепловых карт. Не используйте для определения значимости.

Как обрабатывать пакетные эффекты в моем анализе?

Включите пакет в формулу вашего дизайна как ~batch + condition. Это контролирует техническую вариацию при тестировании биологических различий.

Почему в моем анализе нет значимых генов?

Проверьте размер вашей выборки, размеры эффектов и биологическую вариабельность. Небольшие исследования или тонкие эффекты могут дать мало значимых генов.

Сведения для разработчиков

Автор

K-Dense-AI

Лицензия

MIT license

Репозиторий

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/pydeseq2

Ссылка

main

Структура файлов

📁 references/

📄 api_reference.md

📄 workflow_guide.md

📁 scripts/

📄 run_deseq2_analysis.py

📄 SKILL.md