esm
Gerar e projetar proteínas com ESM
Auch verfügbar von: davila7
A engenharia de proteínas requer a análise e o projeto de novas sequências de proteínas. O ESM fornece modelos de linguagem de proteínas de última geração para gerar sequências, prever estruturas e criar embeddings para análise subsequente. Use o ESM3 para tarefas gerativas em sequência, estrutura e função, ou o ESM C para aprendizado eficiente de representações.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "esm". Gerar uma variante completa de GFP usando ESM3. A sequência deve ter o motivo cromóforo 'SYG' nas posições 65-67.
Erwartetes Ergebnis:
Sequência de variante de GFP gerada (238 aminoácidos) com motivo cromóforo preservado. O modelo produziu uma sequência com estrutura de barril característica de GFP. A sequência pode ser validada por meio de predição de estrutura.
Verwendung von "esm". Extrair embeddings para estas três sequências de proteínas e calcular similaridade par a par.
Erwartetes Ergebnis:
Vetores de embedding (1280 dimensões para ESM C-300M). Similaridades de cosseno par a par: 0,72 entre sequências A e B, 0,45 entre A e C, 0,68 entre B e C.
Sicherheitsaudit
SicherAll 368 static findings are false positives. The scanner incorrectly flagged markdown documentation patterns. The skill provides documentation for legitimate protein language models from EvolutionaryScale. All code examples are standard scientific workflows for protein engineering. Python f-strings with underscores (protein masks), MD5 for cache keys, and ML terminology were misclassified as security issues.
Risikofaktoren
⚡ Enthält Skripte (5)
🌐 Netzwerkzugriff (21)
⚙️ Externe Befehle (188)
📁 Dateisystemzugriff (13)
Qualitätsbewertung
Was du bauen kannst
Projetar novas proteínas fluorescentes
Gerar variantes de GFP com propriedades desejadas usando condicionamento de função do ESM3 para atingir domínios funcionais específicos enquanto explora o espaço de sequências.
Otimizar sequências de enzimas
Usar inverse folding para reprojetar sequências de enzimas que mantêm integridade estrutural enquanto melhoram estabilidade ou atividade para aplicações industriais.
Rastrear variantes de proteínas com embeddings
Gerar embeddings para bibliotecas de proteínas e usar agrupamento para identificar candidatos promissores antes de testes experimentais.
Probiere diese Prompts
Generate a complete protein sequence by filling in the masked positions. The input sequence uses '_' to represent masked residues that need to be generated. Use ESM3 with the sequence track to complete the protein: {partial_sequence}Use ESM3 to predict the 3D structure of this protein sequence. Generate structure coordinates using the structure track. Return the PDB-formatted coordinates: {protein_sequence}Perform inverse folding to design a protein sequence that folds into the target structure provided as PDB. Use ESM3 to generate a sequence that is compatible with the 3D coordinates: {pdb_content}Generate high-quality embeddings for this protein sequence using ESM C. Return the embedding vector for downstream analysis or similarity comparison: {protein_sequence}Bewährte Verfahren
- Começar com modelos abertos menores para prototipagem antes de escalar para modelos maiores da API Forge para qualidade de produção
- Usar geração chain-of-thought para projetos complexos de proteínas iterando por sequência, estrutura e trilhas de função
- Validar sequências geradas com predição de estrutura e seguir as diretrizes do Responsible Biodesign Framework
Vermeiden
- Não pular a validação experimental de proteínas projetadas computacionalmente
- Não usar proteínas geradas diretamente em aplicações clínicas sem testes adequados
- Não ignorar implicações de biossegurança ao projetar proteínas com funções novas