RDKitへのPython的なインターフェースで化学データを効率的に処理します。DatamolはRDKitエコシステムとの完全な互換性を維持しながら、複雑なケモインフォマティクス操作を簡素化します。
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「datamol」を使用しています。 Standardize these SMILES: OCCO, C(CO)O, ethanol
期待される結果:
- OCCO → CCO (canonical SMILES for ethanol)
- C(CO)O → CCO (same molecule, different representation)
- ethanol → None (invalid SMILES, returns None)
- All valid ethanol representations standardize to the same canonical form
「datamol」を使用しています。 Compute descriptors for caffeine
期待される結果:
- Molecular weight: 194.19 g/mol
- LogP: 0.61
- H-bond donors: 0
- H-bond acceptors: 6
- TPSA: 58.44 Ų
- Number of aromatic atoms: 5
「datamol」を使用しています。 Find similar molecules to aspirin
期待される結果:
- Generated ECFP4 fingerprints for query and library
- Calculated Tanimoto similarity matrix
- Top 5 most similar molecules identified
- Similarity scores range from 0.72 to 0.85
- Visualized aligned structures with activity labels
セキュリティ監査
安全All 593 static findings are false positives. This is a documentation-only skill containing markdown files with Python code examples. The analyzer misinterpreted markdown code formatting (backticks) as shell commands, chemistry terminology as cryptographic patterns, and RDKit method calls as system reconnaissance. No actual security vulnerabilities exist.
リスク要因
⚡ スクリプトを含む (1)
📁 ファイルシステムへのアクセス (1)
品質スコア
作れるもの
化合物ライブラリの解析
分子データセットを処理および標準化し、薬物様特性を計算し、有望な候補を特定します。
分子類似性解析
フィンガープリントを生成し、類似度行列を計算し、バーチャルスクリーニングキャンペーンのために化合物をクラスタリングします。
機械学習のための特徴量エンジニアリング
分子記述値とフィンガープリントを薬物発見における予測モデルの特徴量として抽出します。
これらのプロンプトを試す
Use datamol to convert these SMILES strings to standardized molecules: CCO, c1ccccc1, CC(=O)O. Show the canonical SMILES for each.
Calculate molecular weight, logP, H-bond donors and acceptors for these molecules: aspirin (CC(=O)OC1=CC=CC=C1C(=O)O) and caffeine (CN1C=NC2=C1C(=O)N(C(=O)N2C)C).
Generate ECFP fingerprints for these molecules and cluster them: benzene, toluene, phenol, benzoic acid, aniline. Use Tanimoto similarity with 0.3 cutoff.
Generate 50 conformers for cyclohexane, cluster them by RMSD, and identify the most representative conformers. Calculate SASA for each.
ベストプラクティス
- 外部ソースから分子を入手した場合は常に標準化してから解析を実行してください
- 大きなデータセットでは並列処理(n_jobs=-1)を使用してパフォーマンスを向上させてください
- 分子の解析後にNone値を確認し、無効な入力を適切に処理してください
回避
- 外部の分子データを扱う際に標準化をスキップしないでください
- 1000分子より大きなデータセットには完全なButinaクラスタリングを使用しないでください
- 特定の類似性ニーズを考慮せずにデフォルトのフィンガープリントを使用しないでください