gtars
Анализ геномных интервалов и треков покрытия
Также доступно от: K-Dense-AI
Анализ геномных интервалов требует специализированных инструментов для обработки BED-файлов, обнаружения перекрытий и генерации треков покрытия. Gtars предоставляет высокопроизводительные реализации на Rust с привязками Python для вычислительной геномики и рабочих процессов машинного обучения.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «gtars». Найти перекрытия между chip_peaks.bed и promoters.bed с использованием gtars
Ожидаемый результат:
- Найдено 245 пиков, перекрывающихся с регионами промоторов
- Перекрывающиеся пики записаны в peaks_in_promoters.bed
- Средняя длина перекрытия: 432bp
- Топ перекрывающихся хромосом: chr1 (89), chr2 (52), chr3 (38)
Использование «gtars». Сгенерировать трек покрытия BigWig из фрагментов ATAC-seq
Ожидаемый результат:
- Обработано 1.2M фрагментов за 4.2 секунды
- Трек покрытия сохранен в atac_coverage.bw
- Пиковая доступность на chr1:780000-790000 (12.3x обогащение)
Аудит безопасности
БезопасноThis is a legitimate genomic interval analysis toolkit. All 187 static findings are false positives: bash command examples in documentation (misidentified as shell execution), standard cryptographic digests for the GA4GH refget protocol in bioinformatics, memory-mapped file access for efficient large file handling, and system info commands during installation. No malicious code patterns, network exfiltration, credential access, or obfuscation detected.
Факторы риска
⚡ Содержит скрипты (2)
📁 Доступ к файловой системе (2)
⚙️ Внешние команды (2)
Оценка качества
Что вы можете построить
Анализ перекрытия пиков
Идентификация перекрывающихся регуляторных элементов между пиками ChIP-seq и аннотациями генов.
Предобработка геномных данных для ML
Преобразование геномных координат в дискретные токены для трансформерных моделей и глубокого обучения.
Обработка фрагментов
Разделение фрагментов ATAC-seq по клеточным штрих-кодам и выполнение кластерного анализа.
Попробуйте эти промпты
Use gtars to find overlaps between two BED files: chip_peaks.bed and promoters.bed. Show regions that overlap.
Generate a BigWig coverage track from atac_fragments.bed using gtars uniwig with 10bp resolution.
Create a TreeTokenizer from training_regions.bed and tokenize these genomic coordinates for a genomic transformer model.
Split fragments.tsv by clusters.txt and generate coverage tracks for each cluster using gtars.
Лучшие практики
- Создавайте индексы IGD один раз и используйте повторно для последующих запросов для повышения производительности
- Используйте формат BigWig вместо WIG для больших наборов данных, чтобы уменьшить размер файла и обеспечить эффективный произвольный доступ
- Включайте параллельную обработку для файлов с более чем 100 000 регионов
Избегать
- Обработка непроверенных BED-файлов без проверки соответствия названий хромосом вашему референсу
- Выполнение анализа покрытия с разрешением в одно основание на данных всего генома без учета требований к памяти
- Использование токенизаторов без понимания влияния параметра разрешения на последующие ML-модели
Часто задаваемые вопросы
Какая версия Python требуется?
Может ли это работать на Windows?
Сколько памяти требуется?
Безопасны ли мои данные?
Почему мой запрос медленный?
Как это сравнивается с BEDTools?
Сведения для разработчиков
Автор
davila7Лицензия
MIT
Репозиторий
https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/gtarsСсылка
main