geniml
Анализ геномных регионов с помощью машинного обучения
Également disponible depuis: K-Dense-AI
Работа с данными геномных интервалов для задач машинного обучения требует специализированных инструментов. Geniml предоставляет методы обучения без учителя для создания эмбеддингов геномных регионов, отдельных клеток и меток метаданных для поиска по схожести, кластеризации и последующего анализа.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "geniml". Помоги мне начать работу с geniml для анализа моих пиков ATAC-seq
Résultat attendu:
- Установка geniml: uv pip install geniml
- Для возможностей ML: uv pip install 'geniml[ml]'
- Базовый рабочий процесс: 1) Построить универсум из пиков, 2) Токенизировать BED-файлы, 3) Обучить Region2Vec, 4) Оценить эмбеддинги
- Ключевые параметры: embedding_dim (50-300), num_shufflings (500-2000), p_value_threshold (1e-9)
- Результат: Эмбеддинги регионов для поиска по схожести, кластеризации и последующего машинного обучения
Utilisation de "geniml". Как использовать BEDspace для поиска с учетом метаданных
Résultat attendu:
- Предобработка: geniml bedspace preprocess --input regions/ --metadata labels.csv --universe universe.bed
- Обучение: geniml bedspace train --input preprocessed.txt --output model/ --dim 100
- Типы поиска: r2l (регион к метке), l2r (метка к региону), r2r (регион к региону)
- Пример запроса: geniml bedspace search -t r2l -d distances.pkl -q query.bed -n 10
Audit de sécurité
SûrDocumentation-only skill containing markdown files for the geniml genomic ML package. All 190 static findings are false positives triggered by CLI examples and URLs in documentation. No executable code exists. All detected patterns are legitimate documentation of genomic analysis tools and methods.
Facteurs de risque
⚙️ Commandes externes (145)
🌐 Accès réseau (6)
⚡ Contient des scripts (1)
📁 Accès au système de fichiers (4)
Score de qualité
Ce que vous pouvez construire
Анализ паттернов регуляции генов
Обучение эмбеддингов на пиках ChIP-seq или ATAC-seq для идентификации регуляторных регионов и сравнения экспериментальных условий.
Аннотация данных хроматина отдельных клеток
Генерация эмбеддингов клеток из данных scATAC-seq для кластеризации, аннотации типов клеток и интеграции с рабочими процессами scanpy.
Создание геномных справочных баз данных
Создание консенсусных универсумов пиков и поисковых геномных баз данных с запросами схожести с учетом метаданных.
Essayez ces prompts
Помоги мне использовать geniml Region2Vec для обучения эмбеддингов на моей коллекции BED-файлов. У меня есть пики в /path/to/bed/files, и мне нужно сначала построить универсум.
Проведи меня через обучение scEmbed для моего набора данных single-cell ATAC-seq. У меня есть объект AnnData с координатами пиков, и я хочу кластеризовать клетки по доступности хроматина.
Покажи мне, как использовать geniml BEDspace для построения поисковой базы данных, где я могу запрашивать регионы по меткам метаданных, таким как тип клетки или ткань.
Разработай полный рабочий процесс geniml, который объединяет построение универсума, обучение Region2Vec, оценку эмбеддингов и визуализацию UMAP для сравнительного геномного анализа.
Bonnes pratiques
- Уделите время построению комплексного файла универсума для надежной токенизации
- Проверьте покрытие токенизации (стремитесь к >80%) перед обучением эмбеддингов
- Используйте несколько метрик оценки (silhouette, Davies-Bouldin) для оценки качества эмбеддингов
- Документируйте параметры и случайные seed для воспроизводимости
Éviter
- Пропуск валидации универсума - плохие универсумы приводят к ненадежным эмбеддингам
- Использование слишком малого количества эпох обучения или неправильной скорости обучения
- Обработка данных без предварительной проверки качества входных данных
- Забывание проверить, что координаты пиков соответствуют сборке генома