💊

pytdc

Безопасно ⚙️ Внешние команды🌐 Доступ к сети

Доступ к наборам данных для разработки лекарств с помощью PyTDC

Также доступно от: davila7

Исследователям в области разработки лекарств необходимы стандартизированные наборы данных для обучения моделей машинного обучения. PyTDC предоставляет курируемые наборы данных ADME, токсичности и взаимодействия лекарств-мишеней с надлежащими разбиениями на обучающую и тестовую выборки и оценочными оракулами.

Поддерживает: Claude Codex Code(CC)
🥉 76 Бронза
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «pytdc». Загрузите набор данных токсичности AMES и покажите мне формат данных

Ожидаемый результат:

  • Набор данных загружен с 7 255 соединениями для прогнозирования мутагенности
  • Столбцы включают Drug_ID, Drug (SMILES) и Y (бинарная метка токсичности)
  • Применено разбиение по скаффолду: 5 078 обучающих, 725 валидационных, 1 452 тестовых молекул

Использование «pytdc». Оцените эту молекулу с помощью оракула GSK3B: CC(C)Cc1ccc(cc1)C(C)C(O)=O

Ожидаемый результат:

  • Оценка связывания GSK3B: 0,0234 (низкий прогнозируемый аффинность)
  • Эта SMILES представляет ибупрофен, не ожидается ингибирование GSK3B
  • Оценки варьируются от 0 до 1, при этом более высокие значения указывают на более сильное прогнозируемое связывание

Аудит безопасности

Безопасно
v4 • 1/17/2026

This skill provides documentation and templates for PyTDC, a legitimate drug discovery dataset library. All 427 static findings are false positives caused by markdown code blocks containing Python examples (detected as shell backticks), scientific terminology (DRD2, GSK3B detected as C2 keywords), and molecular/cryptographic naming overlaps. No actual security risks present.

9
Просканировано файлов
3,184
Проанализировано строк
2
находки
4
Всего аудитов

Факторы риска

⚙️ Внешние команды (339)
EVALUATION_OUTPUT.json:24 references/datasets.md:10 references/datasets.md:11 references/datasets.md:12 references/datasets.md:13 references/datasets.md:14 references/datasets.md:15 references/datasets.md:16 references/datasets.md:19 references/datasets.md:20 references/datasets.md:21 references/datasets.md:24 references/datasets.md:25 references/datasets.md:26 references/datasets.md:27 references/datasets.md:28 references/datasets.md:29 references/datasets.md:30 references/datasets.md:31 references/datasets.md:34 references/datasets.md:35 references/datasets.md:36 references/datasets.md:39 references/datasets.md:40 references/datasets.md:41 references/datasets.md:46 references/datasets.md:47 references/datasets.md:48 references/datasets.md:49 references/datasets.md:50 references/datasets.md:51 references/datasets.md:54 references/datasets.md:55 references/datasets.md:56 references/datasets.md:57 references/datasets.md:58 references/datasets.md:59 references/datasets.md:62 references/datasets.md:63 references/datasets.md:64 references/datasets.md:65 references/datasets.md:66 references/datasets.md:67 references/datasets.md:68 references/datasets.md:69 references/datasets.md:70 references/datasets.md:71 references/datasets.md:72 references/datasets.md:73 references/datasets.md:78 references/datasets.md:79 references/datasets.md:80 references/datasets.md:83 references/datasets.md:84 references/datasets.md:85 references/datasets.md:86 references/datasets.md:87 references/datasets.md:91 references/datasets.md:92 references/datasets.md:93 references/datasets.md:97 references/datasets.md:98 references/datasets.md:102 references/datasets.md:103 references/datasets.md:107 references/datasets.md:108 references/datasets.md:112 references/datasets.md:119 references/datasets.md:120 references/datasets.md:121 references/datasets.md:124 references/datasets.md:125 references/datasets.md:128 references/datasets.md:129 references/datasets.md:133 references/datasets.md:134 references/datasets.md:138 references/datasets.md:139 references/datasets.md:143 references/datasets.md:144 references/datasets.md:148 references/datasets.md:149 references/datasets.md:153 references/datasets.md:154 references/datasets.md:155 references/datasets.md:159 references/datasets.md:160 references/datasets.md:164 references/datasets.md:168 references/datasets.md:172 references/datasets.md:176 references/datasets.md:182 references/datasets.md:183 references/datasets.md:184 references/datasets.md:185 references/datasets.md:189 references/datasets.md:190 references/datasets.md:194 references/datasets.md:195 references/datasets.md:201-209 references/datasets.md:209-215 references/datasets.md:215-224 references/datasets.md:224-230 references/datasets.md:230-239 references/oracles.md:16-27 references/oracles.md:27-40 references/oracles.md:40-43 references/oracles.md:43-49 references/oracles.md:49-52 references/oracles.md:52-58 references/oracles.md:58-61 references/oracles.md:61-67 references/oracles.md:67-70 references/oracles.md:70-76 references/oracles.md:76-79 references/oracles.md:79-85 references/oracles.md:85-88 references/oracles.md:88-93 references/oracles.md:93-96 references/oracles.md:96-101 references/oracles.md:101-104 references/oracles.md:104-109 references/oracles.md:109-112 references/oracles.md:112-117 references/oracles.md:117-120 references/oracles.md:120-131 references/oracles.md:131-134 references/oracles.md:134-140 references/oracles.md:140-143 references/oracles.md:143-151 references/oracles.md:151-154 references/oracles.md:154-160 references/oracles.md:160-163 references/oracles.md:163-169 references/oracles.md:169-172 references/oracles.md:172-181 references/oracles.md:181-184 references/oracles.md:184-189 references/oracles.md:189-192 references/oracles.md:192-197 references/oracles.md:197-200 references/oracles.md:200-205 references/oracles.md:205-208 references/oracles.md:208-213 references/oracles.md:213-216 references/oracles.md:216-221 references/oracles.md:221-224 references/oracles.md:224-231 references/oracles.md:231-234 references/oracles.md:234-240 references/oracles.md:240-243 references/oracles.md:243-249 references/oracles.md:249-252 references/oracles.md:252-261 references/oracles.md:261-280 references/oracles.md:280-295 references/oracles.md:295-300 references/oracles.md:300-305 references/oracles.md:305-327 references/oracles.md:327-330 references/oracles.md:330-350 references/oracles.md:350-354 references/oracles.md:354-366 references/oracles.md:366-380 references/oracles.md:380-394 references/utilities.md:19-34 references/utilities.md:34-41 references/utilities.md:41-43 references/utilities.md:43-57 references/utilities.md:57-59 references/utilities.md:59-76 references/utilities.md:76-80 references/utilities.md:80-85 references/utilities.md:85-87 references/utilities.md:87-92 references/utilities.md:92-94 references/utilities.md:94-101 references/utilities.md:101-103 references/utilities.md:103-112 references/utilities.md:112-118 references/utilities.md:118-124 references/utilities.md:124-126 references/utilities.md:126-136 references/utilities.md:136-144 references/utilities.md:144-151 references/utilities.md:151-154 references/utilities.md:154-166 references/utilities.md:166-169 references/utilities.md:169-181 references/utilities.md:181-184 references/utilities.md:184-195 references/utilities.md:195-198 references/utilities.md:198-209 references/utilities.md:209-212 references/utilities.md:212-219 references/utilities.md:219-222 references/utilities.md:222-231 references/utilities.md:231-234 references/utilities.md:234-243 references/utilities.md:243-246 references/utilities.md:246-255 references/utilities.md:255-258 references/utilities.md:258-267 references/utilities.md:267-270 references/utilities.md:270-282 references/utilities.md:282-285 references/utilities.md:285-295 references/utilities.md:295-298 references/utilities.md:298-300 references/utilities.md:300 references/utilities.md:300 references/utilities.md:300 references/utilities.md:300-306 references/utilities.md:306-321 references/utilities.md:321-331 references/utilities.md:331-345 references/utilities.md:345-354 references/utilities.md:354-357 references/utilities.md:357-363 references/utilities.md:363-379 references/utilities.md:379-382 references/utilities.md:382-383 references/utilities.md:383-384 references/utilities.md:384-385 references/utilities.md:385-386 references/utilities.md:386-387 references/utilities.md:387-391 references/utilities.md:391-397 references/utilities.md:397-405 references/utilities.md:405-412 references/utilities.md:412-418 references/utilities.md:418-426 references/utilities.md:426-437 references/utilities.md:437-442 references/utilities.md:442-448 references/utilities.md:448-456 references/utilities.md:456-462 references/utilities.md:462-470 references/utilities.md:470-476 references/utilities.md:476-486 references/utilities.md:486-498 references/utilities.md:498-503 references/utilities.md:503-506 references/utilities.md:506-511 references/utilities.md:511-514 references/utilities.md:514-520 references/utilities.md:520-526 references/utilities.md:526-535 references/utilities.md:535-541 references/utilities.md:541-548 references/utilities.md:548-552 references/utilities.md:552-564 references/utilities.md:564-568 references/utilities.md:568-580 references/utilities.md:580-586 references/utilities.md:586-615 references/utilities.md:615-619 references/utilities.md:619-637 references/utilities.md:637-641 references/utilities.md:641-661 SKILL.md:30-32 SKILL.md:32-36 SKILL.md:36-38 SKILL.md:38-49 SKILL.md:49-54 SKILL.md:54-57 SKILL.md:57 SKILL.md:57 SKILL.md:57 SKILL.md:57-58 SKILL.md:58-59 SKILL.md:59-63 SKILL.md:63-68 SKILL.md:68-80 SKILL.md:80-84 SKILL.md:84-99 SKILL.md:99-103 SKILL.md:103-116 SKILL.md:116-119 SKILL.md:119-125 SKILL.md:125-128 SKILL.md:128-140 SKILL.md:140 SKILL.md:140-141 SKILL.md:141 SKILL.md:141-142 SKILL.md:142-154 SKILL.md:154-158 SKILL.md:158-172 SKILL.md:172-176 SKILL.md:176-184 SKILL.md:184-187 SKILL.md:187-208 SKILL.md:208-212 SKILL.md:212-216 SKILL.md:216-220 SKILL.md:220-222 SKILL.md:222-228 SKILL.md:228-232 SKILL.md:232-240 SKILL.md:240-243 SKILL.md:243-245 SKILL.md:245 SKILL.md:245-253 SKILL.md:253-268 SKILL.md:268-280 SKILL.md:280-290 SKILL.md:290-300 SKILL.md:300-303 SKILL.md:303-304 SKILL.md:304-305 SKILL.md:305 SKILL.md:305 SKILL.md:305-306 SKILL.md:306-312 SKILL.md:312-322 SKILL.md:322-330 SKILL.md:330-336 SKILL.md:336-347 SKILL.md:347-353 SKILL.md:353-363 SKILL.md:363-365 SKILL.md:365-371 SKILL.md:371-379 SKILL.md:379-383 SKILL.md:383-390 SKILL.md:390-394 SKILL.md:394-402 SKILL.md:402-408 SKILL.md:408-410 SKILL.md:410-426 SKILL.md:426-430 SKILL.md:430-434 SKILL.md:434-442 SKILL.md:442-443 SKILL.md:443-444 SKILL.md:444-448 SKILL.md:448-449 SKILL.md:449-450
🌐 Доступ к сети (15)

Оценка качества

68
Архитектура
100
Сопровождаемость
87
Контент
19
Сообщество
100
Безопасность
83
Соответствие спецификации

Что вы можете построить

Обучение моделей прогнозирования ADME

Загрузите данные проницаемости Caco-2 с разбиением по скаффолду, обучите предикторы молекулярных свойств и оцените с использованием стандартных метрик.

Оценка предикторов токсичности

Получите доступ к наборам данных токсичности hERG, AMES и DILI с протоколами тестирования для проверки моделей прогнозирования безопасности.

Генерация новых кандидатных лекарств

Используйте молекулярные оракулы, такие как GSK3B и DRD2, для направления генеративных моделей к соединениям с желаемой биологической активностью.

Попробуйте эти промпты

Загрузка набора данных ADME
Помогите мне загрузить набор данных Caco2_Wang из TDC с разбиением по скаффолду для обучения предиктора кишечной проницаемости.
Запуск оценочного тестирования
Покажите мне, как оценить мою модель ADME с использованием группы тестирования TDC с требуемым 5-кратным протоколом.
Использование молекулярных оракулов
Я хочу оценить сгенерированные SMILES-строки с использованием оракулов TDC для свойств QED, SA и GSK3B. Покажите мне рабочий процесс.
Моделирование взаимодействия лекарство-мишень
Загрузите набор данных BindingDB_Kd с разбиением по холодным лекарствам, чтобы моя модель обобщалась на неизвестные лекарственные соединения.

Лучшие практики

  • Используйте разбиения по скаффолду вместо случайных для реалистичной оценки модели на новых химических скаффолдах
  • Запускайте оценочные тесты со всеми 5 требуемыми начальными значениями для отчета о среднем и стандартном отклонении производительности
  • Комбинируйте несколько оракулов с взвешенной оценкой для многокритериальной молекулярной оптимизации

Избегать

  • Избегайте случайных разбиений для производственных моделей ADME, поскольку они переоценивают производительность на похожих молекулах
  • Не сообщайте результаты тестирования с одним начальным значением, поскольку они могут не отражать истинную дисперсию модели
  • Не используйте оракулы как истинные метки для обучения, поскольку они сами являются предиктивными моделями

Часто задаваемые вопросы

Какие наборы данных доступны в PyTDC?
PyTDC включает более 60 наборов данных, охватывающих ADME, токсичность, взаимодействия лекарство-мишень, взаимодействия лекарство-лекарство и задачи молекулярной генерации для терапевтического ML.
Что такое разбиение по скаффолду и зачем его использовать?
Разбиения по скаффолду группируют молекулы по химическому скаффолду, поэтому тестовые молекулы имеют другую основную структуру, чем обучающие, что имитирует реальное обобщение.
Как работают молекулярные оракулы?
Оракулы — это предобученные модели, которые оценивают SMILES-строки по свойствам, таким как лекарственноподобие (QED), синтетическая доступность (SA) или связывание с мишенями (GSK3B, DRD2).
Что такое 5-кратный протокол для тестирования?
Тесты TDC требуют оценки с 5 различными начальными случайными значениями для вычисления среднего и стандартного отклонения, обеспечивая надежные сравнения производительности.
Можно ли использовать PyTDC с PyTorch Geometric или DGL?
Да, TDC предоставляет утилиты MolConvert для преобразования SMILES в графы PyG, графы DGL или другие молекулярные представления, такие как отпечатки ECFP.
Что такое разбиение с холодными лекарствами для прогнозирования DTI?
Разбиения с холодными лекарствами обеспечивают, что лекарства в тестовом наборе никогда не появляются в обучающем, измеряя, насколько хорошо модели прогнозируют связывание для совершенно новых лекарственных соединений.

Сведения для разработчиков

Автор

K-Dense-AI

Лицензия

MIT license

Ссылка

main