pydeseq2
Анализ дифференциальной экспрессии генов RNA-seq с помощью PyDESeq2
Также доступно от: davila7
PyDESeq2 позволяет проводить анализ дифференциальной экспрессии генов на основе данных подсчетов объемного RNA-seq. Выполняйте статистическое тестирование, коррекцию множественных сравнений и создавайте готовые к публикации вулканные и MA графики для ваших геномных исследований.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «pydeseq2». Проанализируйте мои данные RNA-seq и покажите топ дифференциально экспрессированных генов
Ожидаемый результат:
- Анализ завершен. Найдено 847 значимых генов (padj < 0.05)
- Топ повышенно экспрессированных генов:
- - GeneX: log2FC = 4.2, padj = 1.3e-15
- - GeneY: log2FC = 3.8, padj = 2.7e-12
- - GeneZ: log2FC = 3.5, padj = 5.1e-11
- Топ пониженно экспрессированных генов:
- - GeneA: log2FC = -3.9, padj = 8.2e-14
- - GeneB: log2FC = -3.1, padj = 3.4e-10
- Результаты сохранены в deseq2_results.csv
Аудит безопасности
БезопасноAll 429 static findings are false positives. The 'weak cryptographic algorithm' flags incorrectly match 'DES' in 'DESeq2' (a statistical method name, not cryptography). The 'external_commands' flags misinterpret markdown code fences as shell execution. Filesystem access is standard data I/O for bioinformatics workflows. Network access involves only documentation URLs. This is a legitimate scientific computing skill with no malicious code.
Факторы риска
📁 Доступ к файловой системе (2)
🌐 Доступ к сети (1)
Оценка качества
Что вы можете построить
Сравнение обработанных vs контрольных образцов
Определите дифференциально экспрессированные гены между экспериментальными условиями, используя надлежащее статистическое тестирование и коррекцию FDR для получения результатов, готовых к публикации.
Анализ RNA-seq для диссертации
Обработайте данные подсчетов RNA-seq, проведите анализ дифференциальной экспрессии и создайте готовые к публикации фигуры для диссертации или исследовательских статей.
Пакетная обработка RNA-seq
Автоматизируйте анализ дифференциальной экспрессии для нескольких условий или временных точек с помощью прилагаемого скрипта командной строки.
Попробуйте эти промпты
Загрузите мои данные RNA-seq из counts.csv и metadata.csv, затем выполните анализ дифференциальной экспрессии, сравнивая обработанные и контрольные образцы с использованием PyDESeq2
Проанализируйте мои данные RNA-seq с учетом пакетных эффектов, используя формулу дизайна ~batch + condition, затем протестируйте различия между обработкой и контролем
Запустите анализ PyDESeq2 на моих данных и создайте вулканные и MA графики, выделяя значимые гены с padj < 0.05
Загрузите данные RNA-seq, отфильтруйте гены с менее чем 20 суммарными подсчетами, используйте многофакторный дизайн ~age + sex + condition, и определите гены с |log2FC| > 1 и padj < 0.01
Лучшие практики
- Всегда транспонируйте матрицу подсчетов, если гены являются строками (используйте .T для получения формата образцы × гены)
- Фильтруйте гены с низкими подсчетами перед анализом для улучшения статистической мощности
- Используйте скорректированные p-значения (padj), а не сырые p-значения для определения значимости
- Убедитесь, что имена образцов точно совпадают между файлами подсчетов и метаданных
Избегать
- Никогда не используйте сырые p-значения для множественного тестирования — всегда используйте FDR-скорректированные значения padj
- Не применяйте сжатие LFC перед статистическим тестированием — используйте после для визуализации только
- Избегайте сложных многофакторных дизайнов без достаточного размера выборки на условие
- Никогда не транспонируйте метаданные — транспонируйте только матрицу подсчетов при необходимости
Часто задаваемые вопросы
Почему я получаю ошибку несоответствия индексов?
Нужно ли транспонировать мою матрицу подсчетов?
В чем разница между pvalue и padj?
Когда следует использовать сжатие LFC?
Как обрабатывать пакетные эффекты в моем анализе?
Почему в моем анализе нет значимых генов?
Сведения для разработчиков
Автор
K-Dense-AIЛицензия
MIT license
Репозиторий
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/pydeseq2Ссылка
main
Структура файлов