技能 datamol
🧪
透過 Python 介面有效處理化學數據。Datamol 在保持與 RDKit 生態系統完全相容的同時,簡化了複雜的化學資訊學操作。
支援: Claude Codex Code(CC)
1
下載技能 ZIP
2
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
3
開啟並開始使用
測試它
正在使用「datamol」。 標準化這些 SMILES:OCCO、C(CO)O、ethanol
預期結果:
- OCCO → CCO(ethanol 的正規 SMILES)
- C(CO)O → CCO(相同分子,不同表示法)
- ethanol → None(無效 SMILES,返回 None)
- 所有有效的 ethanol 表示法都會標準化為相同的正規形式
正在使用「datamol」。 計算 caffeine 的描述符
預期結果:
- 分子量:194.19 g/mol
- LogP:0.61
- 氫鍵捐贈者:0
- 氫鍵接受者:6
- TPSA:58.44 Ų
- 芳香原子數量:5
正在使用「datamol」。 尋找與 aspirin 相似的分子
預期結果:
- 為查詢和庫產生 ECFP4 指紋
- 計算 Tanimoto 相似性矩陣
- 識別最相似的前 5 個分子
- 相似性分數範圍從 0.72 到 0.85
- 視覺化具有活性標籤的對齊結構
安全審計
安全v4 • 1/17/2026
All 593 static findings are false positives. This is a documentation-only skill containing markdown files with Python code examples. The analyzer misinterpreted markdown code formatting (backticks) as shell commands, chemistry terminology as cryptographic patterns, and RDKit method calls as system reconnaissance. No actual security vulnerabilities exist.
8
已掃描檔案
3,724
分析行數
2
發現項
4
審計總數
風險因素
⚡ 包含腳本 (1)
📁 檔案系統存取 (1)
審計者: claude 查看審計歷史 →
品質評分
45
架構
100
可維護性
87
內容
21
社群
100
安全
83
規範符合性
你能建構什麼
分析化合物庫
處理和標準化分子數據集,計算類藥物性質,並識別有潛力的候選化合物。
分子相似性分析
產生指紋、計算相似性矩陣,並對化合物進行聚類以進行虛擬篩選。
機器學習的特徵工程
提取分子描述符和指紋作為特徵,用於藥物發現中的預測建模。
試試這些提示
基本分子處理
使用 datamol 將這些 SMILES 字串轉換為標準化分子:CCO、c1ccccc1、CC(=O)O。顯示每個分子的正規 SMILES。
計算分子性質
計算這些分子的分子量、logP、氫鍵捐贈者和接受者:aspirin(CC(=O)OC1=CC=CC=C1C(=O)O)和 caffeine(CN1C=NC2=C1C(=O)N(C(=O)N2C)C)。
聚類分子數據集
為這些分子產生 ECFP 指紋並進行聚類:benzene、toluene、phenol、benzoic acid、aniline。使用 Tanimoto 相似性,閾值為 0.3。
3D 構象分析
為 cyclohexane 產生 50 個構象,按 RMSD 進行聚類,並識別最具代表性的構象。計算每個的 SASA。
最佳實務
- 在分析之前,始終對來自外部來源的分子進行標準化處理
- 對於大型數據集,使用平行處理(n_jobs=-1)以提高效能
- 在分子解析後檢查 None 值,以優雅地處理無效輸入
避免
- 處理外部分子數據時不要跳過標準化
- 避免對超過 1000 個分子的數據集使用完整的 Butina 聚類
- 不要在不考慮特定相似性需求的情況下使用預設指紋
常見問題
什麼是 Datamol?
Datamol 是一個 Python 函式庫,提供簡化的 RDKit 介面用於分子化學資訊學操作。
我需要单独安裝 RDKit 嗎?
是的,Datamol 是 RDKit 的包裝器,因此需要同時安裝兩者:'uv pip install datamol rdkit'。
Datamol 可以處理大型分子數據集嗎?
是的,它支援大多數操作的平行處理,可以高效處理數千個分子。
Datamol 支援哪些檔案格式?
SDF、SMILES、CSV、Excel、MOL、Mol2、PDB,以及透過 fsspec(S3、GCS、HTTP)的遠端檔案。
如何視覺化分子?
使用 dm.viz.to_image() 進行基本視覺化,或使用 dm.viz.conformers() 進行 3D 構象視覺化。
Datamol 適合用於機器學習嗎?
是的,它提供分子描述符和指紋,可以用作機器學習模型的特徵。