스킬 datamol

🧪

datamol

Name: datamol
Author: K-Dense-AI

안전 ⚡ 스크립트 포함📁 파일 시스템 액세스

Datamol로 분자 구조 분석

또한 다음에서 사용할 수 있습니다: davila7

RDKit에 대한 Python 인터페이스로 화학 데이터를 효율적으로 처리합니다. Datamol은 RDKit 생태계와의 완전한 호환성을 유지하면서 복잡한 cheminformatics 연산을 단순화합니다.

지원: Claude Codex Code(CC)

📊 70 적절함

스킬 ZIP 다운로드

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

토글을 켜고 사용 시작

테스트해 보기

"datamol" 사용 중입니다. 다음 SMILES를 표준화하세요: OCCO, C(CO)O, ethanol

예상 결과:

OCCO → CCO (에탄올의 정식 SMILES)
C(CO)O → CCO (동일한 분자, 다른 표현)
ethanol → None (잘못된 SMILES, None 반환)
모든 유효한 에탄올 표현이 동일한 정식 형식으로 표준화됨

"datamol" 사용 중입니다. 카페인에 대한 기술자 계산

예상 결과:

분자량: 194.19 g/mol
LogP: 0.61
H-결합 donors: 0
H-결합 acceptors: 6
TPSA: 58.44 Å²
방향성 원자 수: 5

"datamol" 사용 중입니다. 아스피린과 유사한 분자 찾기

예상 결과:

쿼리 및 라이브러리에 대한 ECFP4 지문 생성
Tanimoto 유사성 행렬 계산
가장 유사한 상위 5개 분자 식별
유사성 점수 범위: 0.72 ~ 0.85
활성 레이블과 함께 정렬된 구조 시각화

보안 감사

안전

v4 • 1/17/2026

All 593 static findings are false positives. This is a documentation-only skill containing markdown files with Python code examples. The analyzer misinterpreted markdown code formatting (backticks) as shell commands, chemistry terminology as cryptographic patterns, and RDKit method calls as system reconnaissance. No actual security vulnerabilities exist.

스캔된 파일

3,724

분석된 줄 수

발견 사항

총 감사 수

위험 요인

⚡ 스크립트 포함 (1)

SKILL.md:1-704

📁 파일 시스템 액세스 (1)

references/core_api.md:1

감사자: claude 감사 이력 보기 →

품질 점수

아키텍처

100

유지보수성

콘텐츠

커뮤니티

100

보안

사양 준수

만들 수 있는 것

화합물 라이브러리 분석

분자 데이터셋을 처리하고 표준화하며, 약물 유사성 속성을 계산하고 유망한 후보를 식별합니다.

분자 유사성 분석

지문을 생성하고, 유사성 행렬을 계산하며, 가상 스크리닝 캠페인을 위한 화합물을 클러스터링합니다.

ML을 위한 특성 엔지니어링

약물 발견에서 예측 모델링을 위한 특성으로 분자 기술자와 지문을 추출합니다.

이 프롬프트를 사용해 보세요

기본 분자 처리

datamol을 사용하여 다음 SMILES 문자열을 표준화된 분자로 변환하세요: CCO, c1ccccc1, CC(=O)O. 각각의 정식 SMILES를 표시하세요.

분자 속성 계산

다음 분자에 대한 분자량, logP, H-결합 donors와 acceptors를 계산하세요: 아스피린 (CC(=O)OC1=CC=CC=C1C(=O)O)과 카페인 (CN1C=NC2=C1C(=O)N(C(=O)N2C)C).

분자 데이터셋 클러스터링

다음 분자에 대한 ECFP 지문을 생성하고 클러스터링하세요: 벤젠, 톨루엔, 페놀, 벤조산, 아닐린. 0.3 컷오프로 Tanimoto 유사성을 사용하세요.

3D 구성자 분석

시클로헥세인에 대해 50개의 구성자를 생성하고, RMSD로 클러스터링하며, 가장 대표적인 구성자를 식별하세요. 각 구성자에 대해 SASA를 계산하세요.

모범 사례

항상 외부 소스의 분자를 분석 전에 표준화하세요
대규모 데이터셋에 대해 병렬 처리(n_jobs=-1)를 사용하여 성능을 개선하세요
유효하지 않은 입력을 정상적으로 처리하기 위해 분자 파싱 후 None 값을 확인하세요

피하기

외부 분자 데이터로 작업할 때 표준화를 건너뛰지 마세요
1000개 분자보다 큰 데이터셋에 대한 전체 Butina 클러스터링은 피하세요
특정 유사성 요구 사항을 고려하지 않고 기본 지문을 사용하지 마세요

자주 묻는 질문

Datamol이란 무엇인가요?

Datamol은 분자 cheminformatics 연산을 위한 RDKit의 단순화된 인터페이스를 제공하는 Python 라이브러리입니다.

RDKit을 별도로 설치해야 하나요?

네, Datamol은 RDKit을 감싸는 라이브러리이므로 둘 다 설치해야 합니다: 'uv pip install datamol rdkit'.

Datamol이 대규모 분자 데이터셋을 처리할 수 있나요?

네, 대부분의 연산에 대해 병렬 처리를 지원하며 수천 개의 분자를 효율적으로 처리할 수 있습니다.

Datamol이 지원하는 파일 형식은 무엇인가요?

SDF, SMILES, CSV, Excel, MOL, Mol2, PDB 및 fsspec을 통한 원격 파일(S3, GCS, HTTP).

분자를 시각화하려면 어떻게 해야 하나요?

기본 시각화에는 dm.viz.to_image()를, 3D 구성자 시각화에는 dm.viz.conformers()를 사용하세요.

Datamol이 기계 학습에 적합한가요?

네, ML 모델의 특성으로 사용할 수 있는 분자 기술자와 지문을 제공합니다.

개발자 세부 정보

작성자

K-Dense-AI

라이선스

Apache-2.0 license

리포지토리

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/datamol

참조

main

파일 구조

📁 references/

📄 conformers_module.md

📄 core_api.md

📄 descriptors_viz.md

📄 fragments_scaffolds.md

📄 io_module.md

📄 reactions_data.md

📄 SKILL.md