💊

pytdc

Sûr ⚙️ Commandes externes🌐 Accès réseau

Accéder aux ensembles de données de découverte de médicaments avec PyTDC

Également disponible depuis: davila7

Les chercheurs en découverte de médicaments ont besoin d'ensembles de données standardisés pour former des modèles d'apprentissage automatique. PyTDC fournit des ensembles de données ADME, de toxicité et d'interactions médicament-cible.curés avec des divisions train-test appropriées et des oracles d'évaluation.

Prend en charge: Claude Codex Code(CC)
🥉 76 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "pytdc". Charger l'ensemble de données de toxicité AMES et me montrer le format des données

Résultat attendu:

  • Ensemble de données chargé avec 7 255 composés pour la prédiction de mutagénicité
  • Les colonnes incluent Drug_ID, Drug (SMILES) et Y (étiquette de toxicité binaire)
  • Division par échafaudage appliquée : 5 078 train, 725 validation, 1 452 test molécules

Utilisation de "pytdc". Évaluer cette molécule avec l'oracle GSK3B : CC(C)Cc1ccc(cc1)C(C)C(O)=O

Résultat attendu:

  • Score de liaison GSK3B : 0,0234 (affinité prédite faible)
  • Ce SMILES représente l'ibuprofène, pas attendu pour inhiber GSK3B
  • Les scores vont de 0 à 1, avec des valeurs plus élevées indiquant une liaison prédite plus forte

Audit de sécurité

Sûr
v4 • 1/17/2026

This skill provides documentation and templates for PyTDC, a legitimate drug discovery dataset library. All 427 static findings are false positives caused by markdown code blocks containing Python examples (detected as shell backticks), scientific terminology (DRD2, GSK3B detected as C2 keywords), and molecular/cryptographic naming overlaps. No actual security risks present.

9
Fichiers analysés
3,184
Lignes analysées
2
résultats
4
Total des audits

Facteurs de risque

⚙️ Commandes externes (339)
EVALUATION_OUTPUT.json:24 references/datasets.md:10 references/datasets.md:11 references/datasets.md:12 references/datasets.md:13 references/datasets.md:14 references/datasets.md:15 references/datasets.md:16 references/datasets.md:19 references/datasets.md:20 references/datasets.md:21 references/datasets.md:24 references/datasets.md:25 references/datasets.md:26 references/datasets.md:27 references/datasets.md:28 references/datasets.md:29 references/datasets.md:30 references/datasets.md:31 references/datasets.md:34 references/datasets.md:35 references/datasets.md:36 references/datasets.md:39 references/datasets.md:40 references/datasets.md:41 references/datasets.md:46 references/datasets.md:47 references/datasets.md:48 references/datasets.md:49 references/datasets.md:50 references/datasets.md:51 references/datasets.md:54 references/datasets.md:55 references/datasets.md:56 references/datasets.md:57 references/datasets.md:58 references/datasets.md:59 references/datasets.md:62 references/datasets.md:63 references/datasets.md:64 references/datasets.md:65 references/datasets.md:66 references/datasets.md:67 references/datasets.md:68 references/datasets.md:69 references/datasets.md:70 references/datasets.md:71 references/datasets.md:72 references/datasets.md:73 references/datasets.md:78 references/datasets.md:79 references/datasets.md:80 references/datasets.md:83 references/datasets.md:84 references/datasets.md:85 references/datasets.md:86 references/datasets.md:87 references/datasets.md:91 references/datasets.md:92 references/datasets.md:93 references/datasets.md:97 references/datasets.md:98 references/datasets.md:102 references/datasets.md:103 references/datasets.md:107 references/datasets.md:108 references/datasets.md:112 references/datasets.md:119 references/datasets.md:120 references/datasets.md:121 references/datasets.md:124 references/datasets.md:125 references/datasets.md:128 references/datasets.md:129 references/datasets.md:133 references/datasets.md:134 references/datasets.md:138 references/datasets.md:139 references/datasets.md:143 references/datasets.md:144 references/datasets.md:148 references/datasets.md:149 references/datasets.md:153 references/datasets.md:154 references/datasets.md:155 references/datasets.md:159 references/datasets.md:160 references/datasets.md:164 references/datasets.md:168 references/datasets.md:172 references/datasets.md:176 references/datasets.md:182 references/datasets.md:183 references/datasets.md:184 references/datasets.md:185 references/datasets.md:189 references/datasets.md:190 references/datasets.md:194 references/datasets.md:195 references/datasets.md:201-209 references/datasets.md:209-215 references/datasets.md:215-224 references/datasets.md:224-230 references/datasets.md:230-239 references/oracles.md:16-27 references/oracles.md:27-40 references/oracles.md:40-43 references/oracles.md:43-49 references/oracles.md:49-52 references/oracles.md:52-58 references/oracles.md:58-61 references/oracles.md:61-67 references/oracles.md:67-70 references/oracles.md:70-76 references/oracles.md:76-79 references/oracles.md:79-85 references/oracles.md:85-88 references/oracles.md:88-93 references/oracles.md:93-96 references/oracles.md:96-101 references/oracles.md:101-104 references/oracles.md:104-109 references/oracles.md:109-112 references/oracles.md:112-117 references/oracles.md:117-120 references/oracles.md:120-131 references/oracles.md:131-134 references/oracles.md:134-140 references/oracles.md:140-143 references/oracles.md:143-151 references/oracles.md:151-154 references/oracles.md:154-160 references/oracles.md:160-163 references/oracles.md:163-169 references/oracles.md:169-172 references/oracles.md:172-181 references/oracles.md:181-184 references/oracles.md:184-189 references/oracles.md:189-192 references/oracles.md:192-197 references/oracles.md:197-200 references/oracles.md:200-205 references/oracles.md:205-208 references/oracles.md:208-213 references/oracles.md:213-216 references/oracles.md:216-221 references/oracles.md:221-224 references/oracles.md:224-231 references/oracles.md:231-234 references/oracles.md:234-240 references/oracles.md:240-243 references/oracles.md:243-249 references/oracles.md:249-252 references/oracles.md:252-261 references/oracles.md:261-280 references/oracles.md:280-295 references/oracles.md:295-300 references/oracles.md:300-305 references/oracles.md:305-327 references/oracles.md:327-330 references/oracles.md:330-350 references/oracles.md:350-354 references/oracles.md:354-366 references/oracles.md:366-380 references/oracles.md:380-394 references/utilities.md:19-34 references/utilities.md:34-41 references/utilities.md:41-43 references/utilities.md:43-57 references/utilities.md:57-59 references/utilities.md:59-76 references/utilities.md:76-80 references/utilities.md:80-85 references/utilities.md:85-87 references/utilities.md:87-92 references/utilities.md:92-94 references/utilities.md:94-101 references/utilities.md:101-103 references/utilities.md:103-112 references/utilities.md:112-118 references/utilities.md:118-124 references/utilities.md:124-126 references/utilities.md:126-136 references/utilities.md:136-144 references/utilities.md:144-151 references/utilities.md:151-154 references/utilities.md:154-166 references/utilities.md:166-169 references/utilities.md:169-181 references/utilities.md:181-184 references/utilities.md:184-195 references/utilities.md:195-198 references/utilities.md:198-209 references/utilities.md:209-212 references/utilities.md:212-219 references/utilities.md:219-222 references/utilities.md:222-231 references/utilities.md:231-234 references/utilities.md:234-243 references/utilities.md:243-246 references/utilities.md:246-255 references/utilities.md:255-258 references/utilities.md:258-267 references/utilities.md:267-270 references/utilities.md:270-282 references/utilities.md:282-285 references/utilities.md:285-295 references/utilities.md:295-298 references/utilities.md:298-300 references/utilities.md:300 references/utilities.md:300 references/utilities.md:300 references/utilities.md:300-306 references/utilities.md:306-321 references/utilities.md:321-331 references/utilities.md:331-345 references/utilities.md:345-354 references/utilities.md:354-357 references/utilities.md:357-363 references/utilities.md:363-379 references/utilities.md:379-382 references/utilities.md:382-383 references/utilities.md:383-384 references/utilities.md:384-385 references/utilities.md:385-386 references/utilities.md:386-387 references/utilities.md:387-391 references/utilities.md:391-397 references/utilities.md:397-405 references/utilities.md:405-412 references/utilities.md:412-418 references/utilities.md:418-426 references/utilities.md:426-437 references/utilities.md:437-442 references/utilities.md:442-448 references/utilities.md:448-456 references/utilities.md:456-462 references/utilities.md:462-470 references/utilities.md:470-476 references/utilities.md:476-486 references/utilities.md:486-498 references/utilities.md:498-503 references/utilities.md:503-506 references/utilities.md:506-511 references/utilities.md:511-514 references/utilities.md:514-520 references/utilities.md:520-526 references/utilities.md:526-535 references/utilities.md:535-541 references/utilities.md:541-548 references/utilities.md:548-552 references/utilities.md:552-564 references/utilities.md:564-568 references/utilities.md:568-580 references/utilities.md:580-586 references/utilities.md:586-615 references/utilities.md:615-619 references/utilities.md:619-637 references/utilities.md:637-641 references/utilities.md:641-661 SKILL.md:30-32 SKILL.md:32-36 SKILL.md:36-38 SKILL.md:38-49 SKILL.md:49-54 SKILL.md:54-57 SKILL.md:57 SKILL.md:57 SKILL.md:57 SKILL.md:57-58 SKILL.md:58-59 SKILL.md:59-63 SKILL.md:63-68 SKILL.md:68-80 SKILL.md:80-84 SKILL.md:84-99 SKILL.md:99-103 SKILL.md:103-116 SKILL.md:116-119 SKILL.md:119-125 SKILL.md:125-128 SKILL.md:128-140 SKILL.md:140 SKILL.md:140-141 SKILL.md:141 SKILL.md:141-142 SKILL.md:142-154 SKILL.md:154-158 SKILL.md:158-172 SKILL.md:172-176 SKILL.md:176-184 SKILL.md:184-187 SKILL.md:187-208 SKILL.md:208-212 SKILL.md:212-216 SKILL.md:216-220 SKILL.md:220-222 SKILL.md:222-228 SKILL.md:228-232 SKILL.md:232-240 SKILL.md:240-243 SKILL.md:243-245 SKILL.md:245 SKILL.md:245-253 SKILL.md:253-268 SKILL.md:268-280 SKILL.md:280-290 SKILL.md:290-300 SKILL.md:300-303 SKILL.md:303-304 SKILL.md:304-305 SKILL.md:305 SKILL.md:305 SKILL.md:305-306 SKILL.md:306-312 SKILL.md:312-322 SKILL.md:322-330 SKILL.md:330-336 SKILL.md:336-347 SKILL.md:347-353 SKILL.md:353-363 SKILL.md:363-365 SKILL.md:365-371 SKILL.md:371-379 SKILL.md:379-383 SKILL.md:383-390 SKILL.md:390-394 SKILL.md:394-402 SKILL.md:402-408 SKILL.md:408-410 SKILL.md:410-426 SKILL.md:426-430 SKILL.md:430-434 SKILL.md:434-442 SKILL.md:442-443 SKILL.md:443-444 SKILL.md:444-448 SKILL.md:448-449 SKILL.md:449-450
🌐 Accès réseau (15)

Score de qualité

68
Architecture
100
Maintenabilité
87
Contenu
19
Communauté
100
Sécurité
83
Conformité aux spécifications

Ce que vous pouvez construire

Former des modèles de prédiction ADME

Charger les données de perméabilité Caco-2 avec des divisions par échafaudage, former des prédicteurs de propriétés moléculaires et évaluer avec des métriques standard.

Évaluer les prédicteurs de toxicité

Accéder aux ensembles de données de toxicité hERG, AMES et DILI avec des protocoles de benchmark pour valider les modèles de prédiction de sécurité.

Générer des candidats médicamenteuxNovels

Utiliser des oracles moléculaires comme GSK3B et DRD2 pour guider les modèles génératifs vers des composés avec l'activité biologique souhaitée.

Essayez ces prompts

Charger un ensemble de données ADME
Aidez-moi à charger l'ensemble de données Caco2_Wang de TDC avec une division par échafaudage pour former un prédicteur de perméabilité intestinale.
Exécuter une évaluation de benchmark
Montrez-moi comment évaluer mon modèle ADME en utilisant le groupe de benchmark TDC avec le protocole requis à 5 seeds.
Utiliser des oracles moléculaires
Je veux évaluer les chaînes SMILES générées en utilisant les oracles TDC pour les propriétés QED, SA et GSK3B. Montrez-moi le flux de travail.
Modélisation des interactions médicament-cible
Charger l'ensemble de données BindingDB_Kd avec une division cold-drug pour assurer que mon modèle se généralise aux composés médicamenteux non vus.

Bonnes pratiques

  • Utiliser des divisions par échafaudage au lieu de divisions aléatoires pour une évaluation réaliste du modèle sur des échafaudages chimiques novels
  • Exécuter des évaluations de benchmark avec les 5 seeds requis pour rapporter les performances moyennes et l'écart-type
  • Combiner plusieurs oracles avec un scoring pondéré pour l'optimisation moléculaire multi-objectif

Éviter

  • Éviter les divisions aléatoires pour les modèles ADME de production car elles surestiment les performances sur des molécules similaires
  • Ne pas rapporter les résultats de benchmark à seed unique car ils peuvent ne pas refléter la vraie variance du modèle
  • Éviter d'utiliser les oracles comme étiquettes de vérité terrain pour l'entraînement car ce sont eux-mêmes des modèles prédictifs

Foire aux questions

Quels ensembles de données sont disponibles dans PyTDC ?
PyTDC comprend plus de 60 ensembles de données couvrant l'ADME, la toxicité, les interactions médicament-cible, les interactions médicament-médicament et les tâches de génération moléculaire pour l'apprentissage automatique thérapeutique.
Qu'est-ce qu'une division par échafaudage et pourquoi l'utiliser ?
Les divisions par échafaudage groupent les molécules par échafaudage chimique afin que les molécules de test aient des structures centrales différentes des molécules d'entraînement, simulant une généralisation dans le monde réel.
Comment fonctionnent les oracles moléculaires ?
Les oracles sont des modèles pré-entraînés qui évaluent les chaînes SMILES pour des propriétés comme la drug-likeness (QED), l'accessibilité synthétique (SA) ou la liaison à des cibles (GSK3B, DRD2).
Qu'est-ce que le protocole à 5 seeds pour les benchmarks ?
Les benchmarks TDC nécessitent une évaluation avec 5 seeds aléatoires différents pour calculer la moyenne et l'écart-type, assurant des comparaisons de performances robustes.
Puis-je utiliser PyTDC avec PyTorch Geometric ou DGL ?
Oui, TDC fournit des utilitaires MolConvert pour transformer les SMILES en graphes PyG, des graphes DGL ou d'autres représentations moléculaires comme les empreintes ECFP.
Qu'est-ce qu'une division cold-drug pour la prédiction DTI ?
Les divisions cold-drug garantissent que les médicaments de test n'apparaissent jamais dans l'entraînement, mesurant à quel point les modèles prédisent bien la liaison pour des composés médicamenteux entièrement novels.