スキル datamol

🧪

datamol

Name: datamol
Author: K-Dense-AI

安全 ⚡ スクリプトを含む📁 ファイルシステムへのアクセス

Datamolで分子構造を分析する

こちらからも入手できます: davila7

RDKitへのPython的なインターフェースで化学データを効率的に処理します。DatamolはRDKitエコシステムとの完全な互換性を維持しながら、複雑なケモインフォマティクス操作を簡素化します。

対応: Claude Codex Code(CC)

📊 70 十分

スキルZIPをダウンロード

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

オンにして利用開始

テストする

「datamol」を使用しています。 Standardize these SMILES: OCCO, C(CO)O, ethanol

期待される結果:

OCCO → CCO (canonical SMILES for ethanol)
C(CO)O → CCO (same molecule, different representation)
ethanol → None (invalid SMILES, returns None)
All valid ethanol representations standardize to the same canonical form

「datamol」を使用しています。 Compute descriptors for caffeine

期待される結果:

Molecular weight: 194.19 g/mol
LogP: 0.61
H-bond donors: 0
H-bond acceptors: 6
TPSA: 58.44 Å²
Number of aromatic atoms: 5

「datamol」を使用しています。 Find similar molecules to aspirin

期待される結果:

Generated ECFP4 fingerprints for query and library
Calculated Tanimoto similarity matrix
Top 5 most similar molecules identified
Similarity scores range from 0.72 to 0.85
Visualized aligned structures with activity labels

セキュリティ監査

安全

v4 • 1/17/2026

All 593 static findings are false positives. This is a documentation-only skill containing markdown files with Python code examples. The analyzer misinterpreted markdown code formatting (backticks) as shell commands, chemistry terminology as cryptographic patterns, and RDKit method calls as system reconnaissance. No actual security vulnerabilities exist.

スキャンされたファイル

3,724

解析された行数

検出結果

総監査数

リスク要因

⚡ スクリプトを含む (1)

SKILL.md:1-704

📁 ファイルシステムへのアクセス (1)

references/core_api.md:1

監査者: claude 監査履歴を表示 →

品質スコア

アーキテクチャ

100

保守性

コンテンツ

コミュニティ

100

セキュリティ

仕様準拠

作れるもの

化合物ライブラリの解析

分子データセットを処理および標準化し、薬物様特性を計算し、有望な候補を特定します。

分子類似性解析

フィンガープリントを生成し、類似度行列を計算し、バーチャルスクリーニングキャンペーンのために化合物をクラスタリングします。

機械学習のための特徴量エンジニアリング

分子記述値とフィンガープリントを薬物発見における予測モデルの特徴量として抽出します。

これらのプロンプトを試す

基本的な分子処理

Use datamol to convert these SMILES strings to standardized molecules: CCO, c1ccccc1, CC(=O)O. Show the canonical SMILES for each.

分子特性の計算

Calculate molecular weight, logP, H-bond donors and acceptors for these molecules: aspirin (CC(=O)OC1=CC=CC=C1C(=O)O) and caffeine (CN1C=NC2=C1C(=O)N(C(=O)N2C)C).

分子データセットのクラスタリング

Generate ECFP fingerprints for these molecules and cluster them: benzene, toluene, phenol, benzoic acid, aniline. Use Tanimoto similarity with 0.3 cutoff.

3Dコンフォマー解析

Generate 50 conformers for cyclohexane, cluster them by RMSD, and identify the most representative conformers. Calculate SASA for each.

ベストプラクティス

外部ソースから分子を入手した場合は常に標準化してから解析を実行してください
大きなデータセットでは並列処理（n_jobs=-1）を使用してパフォーマンスを向上させてください
分子の解析後にNone値を確認し、無効な入力を適切に処理してください

回避

外部の分子データを扱う際に標準化をスキップしないでください
1000分子より大きなデータセットには完全なButinaクラスタリングを使用しないでください
特定の類似性ニーズを考慮せずにデフォルトのフィンガープリントを使用しないでください

よくある質問

Datamolとは何ですか？

Datamolは、分子のケモインフォマティクス操作のためのRDKitへのシンプル化されたインターフェースを提供するPythonライブラリです。

RDKitを別途インストールする必要がありますか？

はい、DatamolはRDKitのラッパーであるため、両方をインストールする必要があります：'uv pip install datamol rdkit'。

Datamolは大きな分子データセットを処理できますか？

はい、ほとんどの操作で並列処理をサポートしており、何千もの分子を効率的に処理できます。

Datamolはどのようなファイル形式をサポートしていますか？

SDF、SMILES、CSV、Excel、MOL、MOL2、PDB、およびfsspecによるリモートファイル（S3、GCS、HTTP）をサポートします。

分子を可視化するにはどうすればよいですか？

基本的な可視化にはdm.viz.to_image()を、3Dコンフォマー可視化にはdm.viz.conformers()を使用してください。

Datamolは機械学習に適していますか？

はい、機械学習モデルの特徴量として使用できる分子記述値とフィンガープリントを提供します。

開発者の詳細

作成者

K-Dense-AI

ライセンス

Apache-2.0 license

リポジトリ

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/datamol

参照

main

ファイル構成

📁 references/

📄 conformers_module.md

📄 core_api.md

📄 descriptors_viz.md

📄 fragments_scaffolds.md

📄 io_module.md

📄 reactions_data.md

📄 SKILL.md