🧬

gtars

Безопасно ⚡ Содержит скрипты📁 Доступ к файловой системе⚙️ Внешние команды

Анализ геномных интервалов и треков покрытия

Также доступно от: K-Dense-AI

Анализ геномных интервалов требует специализированных инструментов для обработки BED-файлов, обнаружения перекрытий и генерации треков покрытия. Gtars предоставляет высокопроизводительные реализации на Rust с привязками Python для вычислительной геномики и рабочих процессов машинного обучения.

Поддерживает: Claude Codex Code(CC)
🥉 72 Бронза
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «gtars». Найти перекрытия между chip_peaks.bed и promoters.bed с использованием gtars

Ожидаемый результат:

  • Найдено 245 пиков, перекрывающихся с регионами промоторов
  • Перекрывающиеся пики записаны в peaks_in_promoters.bed
  • Средняя длина перекрытия: 432bp
  • Топ перекрывающихся хромосом: chr1 (89), chr2 (52), chr3 (38)

Использование «gtars». Сгенерировать трек покрытия BigWig из фрагментов ATAC-seq

Ожидаемый результат:

  • Обработано 1.2M фрагментов за 4.2 секунды
  • Трек покрытия сохранен в atac_coverage.bw
  • Пиковая доступность на chr1:780000-790000 (12.3x обогащение)

Аудит безопасности

Безопасно
v5 • 1/17/2026

This is a legitimate genomic interval analysis toolkit. All 187 static findings are false positives: bash command examples in documentation (misidentified as shell execution), standard cryptographic digests for the GA4GH refget protocol in bioinformatics, memory-mapped file access for efficient large file handling, and system info commands during installation. No malicious code patterns, network exfiltration, credential access, or obfuscation detected.

8
Просканировано файлов
1,560
Проанализировано строк
3
находки
5
Всего аудитов

Факторы риска

⚡ Содержит скрипты (2)
📁 Доступ к файловой системе (2)
⚙️ Внешние команды (2)

Оценка качества

45
Архитектура
100
Сопровождаемость
87
Контент
22
Сообщество
100
Безопасность
91
Соответствие спецификации

Что вы можете построить

Анализ перекрытия пиков

Идентификация перекрывающихся регуляторных элементов между пиками ChIP-seq и аннотациями генов.

Предобработка геномных данных для ML

Преобразование геномных координат в дискретные токены для трансформерных моделей и глубокого обучения.

Обработка фрагментов

Разделение фрагментов ATAC-seq по клеточным штрих-кодам и выполнение кластерного анализа.

Попробуйте эти промпты

Базовый запрос перекрытий
Use gtars to find overlaps between two BED files: chip_peaks.bed and promoters.bed. Show regions that overlap.
Генерация покрытия
Generate a BigWig coverage track from atac_fragments.bed using gtars uniwig with 10bp resolution.
Токенизация для ML
Create a TreeTokenizer from training_regions.bed and tokenize these genomic coordinates for a genomic transformer model.
Анализ фрагментов
Split fragments.tsv by clusters.txt and generate coverage tracks for each cluster using gtars.

Лучшие практики

  • Создавайте индексы IGD один раз и используйте повторно для последующих запросов для повышения производительности
  • Используйте формат BigWig вместо WIG для больших наборов данных, чтобы уменьшить размер файла и обеспечить эффективный произвольный доступ
  • Включайте параллельную обработку для файлов с более чем 100 000 регионов

Избегать

  • Обработка непроверенных BED-файлов без проверки соответствия названий хромосом вашему референсу
  • Выполнение анализа покрытия с разрешением в одно основание на данных всего генома без учета требований к памяти
  • Использование токенизаторов без понимания влияния параметра разрешения на последующие ML-модели

Часто задаваемые вопросы

Какая версия Python требуется?
Gtars требует Python 3.8 или выше. Для лучшей производительности рекомендуется Python 3.10+.
Может ли это работать на Windows?
Привязки Python работают на Windows через pip. Инструменты CLI требуют компиляции Rust, что поддерживается на Windows через WSL.
Сколько памяти требуется?
Использование памяти зависит от размера набора данных. Для 1M регионов планируйте 2-4GB RAM. Используйте потоковую обработку для больших файлов.
Безопасны ли мои данные?
Gtars обрабатывает данные локально. Никакие данные не отправляются на внешние серверы. Весь ввод-вывод файлов контролируется пользователем.
Почему мой запрос медленный?
Создайте индекс IGD перед запросами. Включите параллельную обработку с флагом --threads. Используйте режим отображения в память для больших файлов.
Как это сравнивается с BEDTools?
Gtars предлагает производительность на основе Rust с привязками Python. Аналогичное обнаружение перекрытий, но добавляет токенизацию для ML и поддержку BigWig.

Сведения для разработчиков

Автор

davila7

Лицензия

MIT

Ссылка

main

Структура файлов