RDKit에 대한 Python 인터페이스로 화학 데이터를 효율적으로 처리합니다. Datamol은 RDKit 생태계와의 완전한 호환성을 유지하면서 복잡한 cheminformatics 연산을 단순화합니다.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "datamol". 다음 SMILES를 표준화하세요: OCCO, C(CO)O, ethanol
Erwartetes Ergebnis:
- OCCO → CCO (에탄올의 정식 SMILES)
- C(CO)O → CCO (동일한 분자, 다른 표현)
- ethanol → None (잘못된 SMILES, None 반환)
- 모든 유효한 에탄올 표현이 동일한 정식 형식으로 표준화됨
Verwendung von "datamol". 카페인에 대한 기술자 계산
Erwartetes Ergebnis:
- 분자량: 194.19 g/mol
- LogP: 0.61
- H-결합 donors: 0
- H-결합 acceptors: 6
- TPSA: 58.44 Ų
- 방향성 원자 수: 5
Verwendung von "datamol". 아스피린과 유사한 분자 찾기
Erwartetes Ergebnis:
- 쿼리 및 라이브러리에 대한 ECFP4 지문 생성
- Tanimoto 유사성 행렬 계산
- 가장 유사한 상위 5개 분자 식별
- 유사성 점수 범위: 0.72 ~ 0.85
- 활성 레이블과 함께 정렬된 구조 시각화
Sicherheitsaudit
SicherAll 593 static findings are false positives. This is a documentation-only skill containing markdown files with Python code examples. The analyzer misinterpreted markdown code formatting (backticks) as shell commands, chemistry terminology as cryptographic patterns, and RDKit method calls as system reconnaissance. No actual security vulnerabilities exist.
Risikofaktoren
⚡ Enthält Skripte (1)
📁 Dateisystemzugriff (1)
Qualitätsbewertung
Was du bauen kannst
화합물 라이브러리 분석
분자 데이터셋을 처리하고 표준화하며, 약물 유사성 속성을 계산하고 유망한 후보를 식별합니다.
분자 유사성 분석
지문을 생성하고, 유사성 행렬을 계산하며, 가상 스크리닝 캠페인을 위한 화합물을 클러스터링합니다.
ML을 위한 특성 엔지니어링
약물 발견에서 예측 모델링을 위한 특성으로 분자 기술자와 지문을 추출합니다.
Probiere diese Prompts
datamol을 사용하여 다음 SMILES 문자열을 표준화된 분자로 변환하세요: CCO, c1ccccc1, CC(=O)O. 각각의 정식 SMILES를 표시하세요.
다음 분자에 대한 분자량, logP, H-결합 donors와 acceptors를 계산하세요: 아스피린 (CC(=O)OC1=CC=CC=C1C(=O)O)과 카페인 (CN1C=NC2=C1C(=O)N(C(=O)N2C)C).
다음 분자에 대한 ECFP 지문을 생성하고 클러스터링하세요: 벤젠, 톨루엔, 페놀, 벤조산, 아닐린. 0.3 컷오프로 Tanimoto 유사성을 사용하세요.
시클로헥세인에 대해 50개의 구성자를 생성하고, RMSD로 클러스터링하며, 가장 대표적인 구성자를 식별하세요. 각 구성자에 대해 SASA를 계산하세요.
Bewährte Verfahren
- 항상 외부 소스의 분자를 분석 전에 표준화하세요
- 대규모 데이터셋에 대해 병렬 처리(n_jobs=-1)를 사용하여 성능을 개선하세요
- 유효하지 않은 입력을 정상적으로 처리하기 위해 분자 파싱 후 None 값을 확인하세요
Vermeiden
- 외부 분자 데이터로 작업할 때 표준화를 건너뛰지 마세요
- 1000개 분자보다 큰 데이터셋에 대한 전체 Butina 클러스터링은 피하세요
- 특정 유사성 요구 사항을 고려하지 않고 기본 지문을 사용하지 마세요
Häufig gestellte Fragen
Datamol이란 무엇인가요?
RDKit을 별도로 설치해야 하나요?
Datamol이 대규모 분자 데이터셋을 처리할 수 있나요?
Datamol이 지원하는 파일 형식은 무엇인가요?
분자를 시각화하려면 어떻게 해야 하나요?
Datamol이 기계 학습에 적합한가요?
Entwicklerdetails
Autor
K-Dense-AILizenz
Apache-2.0 license
Repository
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/datamolRef
main
Dateistruktur