esm
Gerar e projetar proteínas com ESM
Também disponível em: davila7
A engenharia de proteínas requer a análise e o projeto de novas sequências de proteínas. O ESM fornece modelos de linguagem de proteínas de última geração para gerar sequências, prever estruturas e criar embeddings para análise subsequente. Use o ESM3 para tarefas gerativas em sequência, estrutura e função, ou o ESM C para aprendizado eficiente de representações.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "esm". Gerar uma variante completa de GFP usando ESM3. A sequência deve ter o motivo cromóforo 'SYG' nas posições 65-67.
Resultado esperado:
Sequência de variante de GFP gerada (238 aminoácidos) com motivo cromóforo preservado. O modelo produziu uma sequência com estrutura de barril característica de GFP. A sequência pode ser validada por meio de predição de estrutura.
A utilizar "esm". Extrair embeddings para estas três sequências de proteínas e calcular similaridade par a par.
Resultado esperado:
Vetores de embedding (1280 dimensões para ESM C-300M). Similaridades de cosseno par a par: 0,72 entre sequências A e B, 0,45 entre A e C, 0,68 entre B e C.
Auditoria de Segurança
SeguroAll 368 static findings are false positives. The scanner incorrectly flagged markdown documentation patterns. The skill provides documentation for legitimate protein language models from EvolutionaryScale. All code examples are standard scientific workflows for protein engineering. Python f-strings with underscores (protein masks), MD5 for cache keys, and ML terminology were misclassified as security issues.
Fatores de risco
⚡ Contém scripts (5)
🌐 Acesso à rede (21)
⚙️ Comandos externos (188)
📁 Acesso ao sistema de arquivos (13)
Pontuação de qualidade
O Que Você Pode Construir
Projetar novas proteínas fluorescentes
Gerar variantes de GFP com propriedades desejadas usando condicionamento de função do ESM3 para atingir domínios funcionais específicos enquanto explora o espaço de sequências.
Otimizar sequências de enzimas
Usar inverse folding para reprojetar sequências de enzimas que mantêm integridade estrutural enquanto melhoram estabilidade ou atividade para aplicações industriais.
Rastrear variantes de proteínas com embeddings
Gerar embeddings para bibliotecas de proteínas e usar agrupamento para identificar candidatos promissores antes de testes experimentais.
Tente Estes Prompts
Generate a complete protein sequence by filling in the masked positions. The input sequence uses '_' to represent masked residues that need to be generated. Use ESM3 with the sequence track to complete the protein: {partial_sequence}Use ESM3 to predict the 3D structure of this protein sequence. Generate structure coordinates using the structure track. Return the PDB-formatted coordinates: {protein_sequence}Perform inverse folding to design a protein sequence that folds into the target structure provided as PDB. Use ESM3 to generate a sequence that is compatible with the 3D coordinates: {pdb_content}Generate high-quality embeddings for this protein sequence using ESM C. Return the embedding vector for downstream analysis or similarity comparison: {protein_sequence}Melhores Práticas
- Começar com modelos abertos menores para prototipagem antes de escalar para modelos maiores da API Forge para qualidade de produção
- Usar geração chain-of-thought para projetos complexos de proteínas iterando por sequência, estrutura e trilhas de função
- Validar sequências geradas com predição de estrutura e seguir as diretrizes do Responsible Biodesign Framework
Evitar
- Não pular a validação experimental de proteínas projetadas computacionalmente
- Não usar proteínas geradas diretamente em aplicações clínicas sem testes adequados
- Não ignorar implicações de biossegurança ao projetar proteínas com funções novas
Perguntas Frequentes
Qual é a diferença entre os modelos ESM3 e ESM C?
Posso usar o ESM3 localmente ou preciso da API Forge?
Qual é o comprimento máximo de sequências de proteínas para processamento ESM?
O que é inverse folding e quando devo usá-lo?
Como valido proteínas geradas pelo ESM?
O que são trilhas de geração no ESM3?
Detalhes do Desenvolvedor
Estrutura de arquivos