スキル pytdc

💊

pytdc

Name: pytdc
Author: K-Dense-AI

安全 ⚙️ 外部コマンド🌐 ネットワークアクセス

PyTDCで創薬データセットにアクセスする

こちらからも入手できます: davila7

創薬研究者は機械学習モデルの訓練に必要な標準化されたデータセットを必要としています。PyTDCは、適切に分割された列車テスト分割と評価オラクルとともに、選別されたADME、毒性、および薬物標的相互作用データセットを提供します。

対応: Claude Codex Code(CC)

🥉 76 ブロンズ

スキルZIPをダウンロード

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

オンにして利用開始

テストする

「pytdc」を使用しています。 AMES毒性データセットをロードし、データフォーマットを見せてください

期待される結果:

変異原性予測のために7,255化合物でデータセットがロードされました
列にはDrug_ID、Drug（SMILES）、およびY（2項毒性ラベル）が含まれます
足場分割が適用されました：5,078訓練、725検証、1,452テスト分子

「pytdc」を使用しています。この分子をGSK3Bオacleで評価してください：CC(C)Cc1ccc(cc1)CC(O)=O

期待される結果:

GSK3B結合スコア：0.0234（予測される親和性が低い）
このSMILESは ibuprofenを表しており、GSK3Bを阻害することは期待されません
スコアは0から1の範囲で、高い値はより強い予測される結合を示します

セキュリティ監査

安全

v4 • 1/17/2026

This skill provides documentation and templates for PyTDC, a legitimate drug discovery dataset library. All 427 static findings are false positives caused by markdown code blocks containing Python examples (detected as shell backticks), scientific terminology (DRD2, GSK3B detected as C2 keywords), and molecular/cryptographic naming overlaps. No actual security risks present.

スキャンされたファイル

3,184

解析された行数

検出結果

総監査数

リスク要因

⚙️ 外部コマンド (339)

🌐 ネットワークアクセス (15)

EVALUATION_OUTPUT.json:42 EVALUATION_OUTPUT.json:42 EVALUATION_OUTPUT.json:42 references/datasets.md:246 references/oracles.md:374 references/oracles.md:398 references/utilities.md:681 references/utilities.md:682 references/utilities.md:683 references/utilities.md:684 scripts/benchmark_evaluation.py:268 skill-report.json:6 SKILL.md:454 SKILL.md:455 SKILL.md:456

監査者: claude 監査履歴を表示 →

品質スコア

アーキテクチャ

100

保守性

コンテンツ

コミュニティ

100

セキュリティ

仕様準拠

作れるもの

ADME予測モデルの訓練

足場分割を伴うCaco-2透過性データをロードし、分子特性予測器を訓練し、标准的なメトリクスで評価します。

毒性予測モデルの評価

hERG、AMES、およびDILI毒性データセットにベンチマークプロトコルでアクセスして、安全性予測モデルを検証します。

新規薬物候補の生成

GSK3BやDRD2などの分子オacleを使用して、生成モデルを望ましい生物学的活性を持つ化合物に誘導します。

これらのプロンプトを試す

ADMEデータセットのロード

腸管透過性予測器の訓練のために、足場分割を伴うTDCからCaco2_Wangデータセットをロードするの手伝いをしてください。

ベンチマーク評価の実行

TDCベンチマークグループを使用して、必要な5-seedプロトコルでADMEモデルを評価する方法を教えてください。

分子オacleの使用

生成されたSMILES文字列をTDCオacleを使用してQED、SA、およびGSK3B特性で評価したいです。ワークフローを教えてください。

薬物標的相互作用モデリング

Cold-drug分割を伴うBindingDB_Kdデータセットをロードして、モデルが見えない薬物化合物に一般化することを保証します。

ベストプラクティス

新規化学足場での現実的なモデル評価のために、足場分割をランダム分割の代わりに使用する
平均と標準偏差のパフォーマンスを報告するために、必要な5つのすべてのシードでベンチマーク評価を実行する
多目的分子最適化のために、複数のオacleを組み合わせた加重スコアリングを使用する

回避

同様の分子でのパフォーマンスを過大評価するため、本番ADMEモデルにはランダム分割を避ける
真のモデル分散を反映しない可能性があるため、単一シードベンチマーク結果を報告しない
それ自体が予測モデルであるため、オacleを訓練用の真実ラベルとして使用することを避ける

よくある質問

PyTDCではどのようなデータセットが利用可能ですか？

PyTDCには、ADME、毒性、薬物標的相互作用、薬物間相互作用、および治療的機械学習のための分子生成タスクをカバーする60以上のデータセットが含まれています。

足場分割とは何ですか？なぜ使用するのですか？

足場分割は、テスト分子が訓練分子とは異なるコア構造を持つように分子を化学的足場でグループ化し、現実世界の一般化をシミュレートします。

分子オacleはどのように機能しますか？

オacleは、薬剤様性（QED）、合成容易性（SA）、または標的結合（GSK3B、DRD2）などの特性についてSMILES文字列をスコア付けする事前訓練されたモデルです。

ベンチマークの5-seedプロトコルとは何ですか？

TDCベンチマークでは、平均と標準偏差を計算するために5つの異なるランダムシードでの評価が必要であり、堅牢なパフォーマンス比較を確保します。

PyTDCをPyTorch GeometricやDGLで使用できますか？

はい、TDCはSMILESをPyGグラフ、DGLグラフ、またはECFPフィンガープリントなどの他の分子表現に変換するMolConvertユーティリティを提供します。

DTI予測のためのCold-drug分割とは何ですか？

Cold-drug分割は、テストセットの薬物が訓練に決して現れないことを保証し、モデルが完全に新しい薬物化合物の結合をどの程度予測できるかを測定します。

開発者の詳細

作成者

K-Dense-AI

ライセンス

MIT license

リポジトリ

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/pytdc

参照

main

ファイル構成

📁 references/

📄 datasets.md

📄 oracles.md

📄 utilities.md

📁 scripts/

📄 benchmark_evaluation.py

📄 load_and_split_data.py

📄 molecular_generation.py

📄 EVALUATION_OUTPUT.json

📄 SKILL.md