🧬

geniml

Sûr ⚙️ Commandes externes🌐 Accès réseau⚡ Contient des scripts📁 Accès au système de fichiers

Анализ геномных регионов с помощью машинного обучения

Également disponible depuis: K-Dense-AI

Работа с данными геномных интервалов для задач машинного обучения требует специализированных инструментов. Geniml предоставляет методы обучения без учителя для создания эмбеддингов геномных регионов, отдельных клеток и меток метаданных для поиска по схожести, кластеризации и последующего анализа.

Prend en charge: Claude Codex Code(CC)
📊 71 Adéquat
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "geniml". Помоги мне начать работу с geniml для анализа моих пиков ATAC-seq

Résultat attendu:

  • Установка geniml: uv pip install geniml
  • Для возможностей ML: uv pip install 'geniml[ml]'
  • Базовый рабочий процесс: 1) Построить универсум из пиков, 2) Токенизировать BED-файлы, 3) Обучить Region2Vec, 4) Оценить эмбеддинги
  • Ключевые параметры: embedding_dim (50-300), num_shufflings (500-2000), p_value_threshold (1e-9)
  • Результат: Эмбеддинги регионов для поиска по схожести, кластеризации и последующего машинного обучения

Utilisation de "geniml". Как использовать BEDspace для поиска с учетом метаданных

Résultat attendu:

  • Предобработка: geniml bedspace preprocess --input regions/ --metadata labels.csv --universe universe.bed
  • Обучение: geniml bedspace train --input preprocessed.txt --output model/ --dim 100
  • Типы поиска: r2l (регион к метке), l2r (метка к региону), r2r (регион к региону)
  • Пример запроса: geniml bedspace search -t r2l -d distances.pkl -q query.bed -n 10

Audit de sécurité

Sûr
v5 • 1/17/2026

Documentation-only skill containing markdown files for the geniml genomic ML package. All 190 static findings are false positives triggered by CLI examples and URLs in documentation. No executable code exists. All detected patterns are legitimate documentation of genomic analysis tools and methods.

7
Fichiers analysés
1,567
Lignes analysées
4
résultats
5
Total des audits

Facteurs de risque

⚙️ Commandes externes (145)
references/bedspace.md:23-30 references/bedspace.md:30-34 references/bedspace.md:34-38 references/bedspace.md:38-44 references/bedspace.md:44-52 references/bedspace.md:52-55 references/bedspace.md:55-56 references/bedspace.md:56-57 references/bedspace.md:57-63 references/bedspace.md:63-69 references/bedspace.md:69-78 references/bedspace.md:78-80 references/bedspace.md:80-83 references/bedspace.md:83-85 references/bedspace.md:85-88 references/bedspace.md:88-90 references/bedspace.md:90-92 references/bedspace.md:92-96 references/bedspace.md:96-108 references/bedspace.md:108-112 references/consensus_peaks.md:21-23 references/consensus_peaks.md:23-29 references/consensus_peaks.md:29-31 references/consensus_peaks.md:31-34 references/consensus_peaks.md:34-35 references/consensus_peaks.md:35-36 references/consensus_peaks.md:36-50 references/consensus_peaks.md:50-57 references/consensus_peaks.md:57-60 references/consensus_peaks.md:60-61 references/consensus_peaks.md:61-62 references/consensus_peaks.md:62-70 references/consensus_peaks.md:70-78 references/consensus_peaks.md:78-81 references/consensus_peaks.md:81-89 references/consensus_peaks.md:89-96 references/consensus_peaks.md:96-99 references/consensus_peaks.md:99-107 references/consensus_peaks.md:107-114 references/consensus_peaks.md:114-117 references/consensus_peaks.md:117-123 references/consensus_peaks.md:123-135 references/consensus_peaks.md:135-158 references/consensus_peaks.md:158-159 references/consensus_peaks.md:159-160 references/consensus_peaks.md:160-176 references/consensus_peaks.md:176-188 references/consensus_peaks.md:188-199 references/consensus_peaks.md:199-203 references/region2vec.md:25-33 references/region2vec.md:33-41 references/region2vec.md:41-53 references/region2vec.md:53-59 references/region2vec.md:59-60 references/region2vec.md:60-61 references/region2vec.md:61-62 references/region2vec.md:62-63 references/region2vec.md:63-67 references/region2vec.md:67-75 references/region2vec.md:75-79 references/region2vec.md:79 references/region2vec.md:79 references/region2vec.md:79 references/scembed.md:19 references/scembed.md:19 references/scembed.md:19 references/scembed.md:19 references/scembed.md:23-38 references/scembed.md:38-44 references/scembed.md:44-52 references/scembed.md:52-63 references/scembed.md:63-86 references/scembed.md:86-92 references/scembed.md:92-103 references/scembed.md:103-109 references/scembed.md:109-123 references/scembed.md:123-131 references/scembed.md:131-132 references/scembed.md:132-133 references/scembed.md:133-134 references/scembed.md:134-135 references/scembed.md:135-136 references/scembed.md:136-147 references/scembed.md:147-155 references/scembed.md:155-161 references/scembed.md:161-177 references/scembed.md:177-189 references/scembed.md:189-194 references/utilities.md:19-30 references/utilities.md:30-34 references/utilities.md:34-43 references/utilities.md:43-69 references/utilities.md:69-79 references/utilities.md:79-83 references/utilities.md:83-90 references/utilities.md:90-95 references/utilities.md:95-97 references/utilities.md:97-101 references/utilities.md:101-103 references/utilities.md:103-107 references/utilities.md:107-109 references/utilities.md:109-137 references/utilities.md:137-149 references/utilities.md:149-161 references/utilities.md:161-173 references/utilities.md:173-201 references/utilities.md:201-210 references/utilities.md:210-213 references/utilities.md:213-219 references/utilities.md:219-228 references/utilities.md:228-231 references/utilities.md:231-237 references/utilities.md:237-247 references/utilities.md:247-260 references/utilities.md:260-270 references/utilities.md:270-298 references/utilities.md:298-306 references/utilities.md:306-310 references/utilities.md:310-326 references/utilities.md:326-341 references/utilities.md:341-352 references/utilities.md:352-356 references/utilities.md:356-364 references/utilities.md:364-369 references/utilities.md:369-383 SKILL.md:16-18 SKILL.md:18-22 SKILL.md:22-24 SKILL.md:24-28 SKILL.md:28-30 SKILL.md:30-47 SKILL.md:47-61 SKILL.md:61-76 SKILL.md:76-95 SKILL.md:95-108 SKILL.md:108-114 SKILL.md:114-140 SKILL.md:140-144 SKILL.md:144-171 SKILL.md:171-175 SKILL.md:175-193 SKILL.md:193-199 SKILL.md:199-217 SKILL.md:217-270 SKILL.md:270-310
🌐 Accès réseau (6)
⚡ Contient des scripts (1)
📁 Accès au système de fichiers (4)

Score de qualité

45
Architecture
100
Maintenabilité
87
Contenu
21
Communauté
100
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

Анализ паттернов регуляции генов

Обучение эмбеддингов на пиках ChIP-seq или ATAC-seq для идентификации регуляторных регионов и сравнения экспериментальных условий.

Аннотация данных хроматина отдельных клеток

Генерация эмбеддингов клеток из данных scATAC-seq для кластеризации, аннотации типов клеток и интеграции с рабочими процессами scanpy.

Создание геномных справочных баз данных

Создание консенсусных универсумов пиков и поисковых геномных баз данных с запросами схожести с учетом метаданных.

Essayez ces prompts

Базовый эмбеддинг регионов
Помоги мне использовать geniml Region2Vec для обучения эмбеддингов на моей коллекции BED-файлов. У меня есть пики в /path/to/bed/files, и мне нужно сначала построить универсум.
Анализ отдельных клеток
Проведи меня через обучение scEmbed для моего набора данных single-cell ATAC-seq. У меня есть объект AnnData с координатами пиков, и я хочу кластеризовать клетки по доступности хроматина.
Запросы по метаданным
Покажи мне, как использовать geniml BEDspace для построения поисковой базы данных, где я могу запрашивать регионы по меткам метаданных, таким как тип клетки или ткань.
Расширенный рабочий процесс
Разработай полный рабочий процесс geniml, который объединяет построение универсума, обучение Region2Vec, оценку эмбеддингов и визуализацию UMAP для сравнительного геномного анализа.

Bonnes pratiques

  • Уделите время построению комплексного файла универсума для надежной токенизации
  • Проверьте покрытие токенизации (стремитесь к >80%) перед обучением эмбеддингов
  • Используйте несколько метрик оценки (silhouette, Davies-Bouldin) для оценки качества эмбеддингов
  • Документируйте параметры и случайные seed для воспроизводимости

Éviter

  • Пропуск валидации универсума - плохие универсумы приводят к ненадежным эмбеддингам
  • Использование слишком малого количества эпох обучения или неправильной скорости обучения
  • Обработка данных без предварительной проверки качества входных данных
  • Забывание проверить, что координаты пиков соответствуют сборке генома

Foire aux questions

Что такое geniml?
Geniml — это Python-пакет для машинного обучения на данных геномных интервалов. Он обучает эмбеддинги из BED-файлов для анализа схожести, кластеризации и последующих предсказаний.
Какие геномы поддерживаются?
Geniml работает с любым геномом, имеющим валидный файл размеров хромосом. Распространенные сборки (hg38, mm10) полностью поддерживаются через внешние инструменты, такие как Gtars.
Могу ли я использовать geniml с scanpy?
Да. Эмбеддинги scEmbed легко интегрируются с рабочими процессами scanpy. Добавьте эмбеддинги в adata.obsm['scembed_X'] и используйте стандартные функции кластеризации и визуализации scanpy.
Безопасны ли мои данные с geniml?
Geniml обрабатывает данные локально. Никакие данные не отправляются на внешние серверы. Все операции выполняются на вашей машине с использованием указанных вами входных файлов.
Почему мои эмбеддинги не сходятся?
Проверьте скорость обучения (попробуйте 0.01-0.05), увеличьте количество эпох и проверьте качество данных. Убедитесь, что ваш файл универсума покрывает ваши регионы, а покрытие токенизации достаточное.
Как geniml сравнивается с другими инструментами?
Geniml специализируется на эмбеддингах геномных интервалов. В отличие от общих инструментов машинного обучения, он включает геном-специфичную токенизацию, построение консенсусных пиков и биологические метрики оценки.

Détails du développeur

Structure de fichiers