創薬研究者は機械学習モデルの訓練に必要な標準化されたデータセットを必要としています。PyTDCは、適切に分割された列車テスト分割と評価オラクルとともに、選別されたADME、毒性、および薬物標的相互作用データセットを提供します。
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「pytdc」を使用しています。 AMES毒性データセットをロードし、データフォーマットを見せてください
期待される結果:
- 変異原性予測のために7,255化合物でデータセットがロードされました
- 列にはDrug_ID、Drug(SMILES)、およびY(2項毒性ラベル)が含まれます
- 足場分割が適用されました:5,078訓練、725検証、1,452テスト分子
「pytdc」を使用しています。 この分子をGSK3Bオacleで評価してください:CC(C)Cc1ccc(cc1)CC(O)=O
期待される結果:
- GSK3B結合スコア:0.0234(予測される親和性が低い)
- このSMILESは ibuprofenを表しており、GSK3Bを阻害することは期待されません
- スコアは0から1の範囲で、高い値はより強い予測される結合を示します
セキュリティ監査
安全This skill provides documentation and templates for PyTDC, a legitimate drug discovery dataset library. All 427 static findings are false positives caused by markdown code blocks containing Python examples (detected as shell backticks), scientific terminology (DRD2, GSK3B detected as C2 keywords), and molecular/cryptographic naming overlaps. No actual security risks present.
リスク要因
⚙️ 外部コマンド (339)
🌐 ネットワークアクセス (15)
品質スコア
作れるもの
ADME予測モデルの訓練
足場分割を伴うCaco-2透過性データをロードし、分子特性予測器を訓練し、标准的なメトリクスで評価します。
毒性予測モデルの評価
hERG、AMES、およびDILI毒性データセットにベンチマークプロトコルでアクセスして、安全性予測モデルを検証します。
新規薬物候補の生成
GSK3BやDRD2などの分子オacleを使用して、生成モデルを望ましい生物学的活性を持つ化合物に誘導します。
これらのプロンプトを試す
腸管透過性予測器の訓練のために、足場分割を伴うTDCからCaco2_Wangデータセットをロードするの手伝いをしてください。
TDCベンチマークグループを使用して、必要な5-seedプロトコルでADMEモデルを評価する方法を教えてください。
生成されたSMILES文字列をTDCオacleを使用してQED、SA、およびGSK3B特性で評価したいです。ワークフローを教えてください。
Cold-drug分割を伴うBindingDB_Kdデータセットをロードして、モデルが見えない薬物化合物に一般化することを保証します。
ベストプラクティス
- 新規化学足場での現実的なモデル評価のために、足場分割をランダム分割の代わりに使用する
- 平均と標準偏差のパフォーマンスを報告するために、必要な5つのすべてのシードでベンチマーク評価を実行する
- 多目的分子最適化のために、複数のオacleを組み合わせた加重スコアリングを使用する
回避
- 同様の分子でのパフォーマンスを過大評価するため、本番ADMEモデルにはランダム分割を避ける
- 真のモデル分散を反映しない可能性があるため、単一シードベンチマーク結果を報告しない
- それ自体が予測モデルであるため、オacleを訓練用の真実ラベルとして使用することを避ける