Question 1

Qual é a diferença entre RAG e fine-tuning?

Accepted Answer

RAG recupera documentos relevantes no momento da consulta e os fornece como contexto, permitindo que o modelo acesse informações atualizadas sem retreinamento. Fine-tuning ajusta os pesos do modelo em dados de treinamento, o que é melhor para aprender estilo ou formato, mas não pode adicionar novos conhecimentos após o treinamento.

Question 2

Como escolho entre diferentes arquiteturas de agentes?

Accepted Answer

Use ReAct para raciocínio interativo multi-etapa com uso de ferramentas. Use function calling para integrações de API estruturadas. Use Plan-and-Execute para tarefas complexas que requerem planejamento prévio. Use sistemas multi-agentes quando expertise especializada é necessária para diferentes subtarefas.

Question 3

Qual banco de dados vetorial devo usar para produção?

Accepted Answer

Para serviço gerenciado com alta escala, use Pinecone. Para self-hosted com GraphQL, use Weaviate. para infraestrutura PostgreSQL existente, use pgvector. Para prototipagem, use ChromaDB por simplicidade.

Question 4

Como posso reduzir custos de API de LLM?

Accepted Answer

Implemente caching semântico para consultas similares, use modelos menores para tarefas simples, otimize o comprimento do prompt, defina temperatura apropriada (0 para respostas cacheáveis) e use modelos de fallback quando o principal está limitado por taxa.

Question 5

Que métricas devo acompanhar para aplicações LLM?

Accepted Answer

Acompanhe métricas de performance (latência, tokens por segundo), métricas de qualidade (satisfação do usuário, taxa de conclusão de tarefas), métricas de custo (custo por requisição, taxa de cache hit) e métricas de confiabilidade (taxa de erro, taxa de timeout).

Question 6

Como lidar com alucinações em sistemas RAG?

Accepted Answer

Instrua o modelo a dizer 'eu não sei' quando o contexto é insuficiente, use pontuação de groundedness na avaliação, implemente verificações de qualidade de recuperação e considere adicionar uma etapa de verificação onde o modelo cita fontes para afirmações.

llm-app-patterns

Testar

Auditoria de Segurança

Pontuação de qualidade

O Que Você Pode Construir

Base de Conhecimento RAG

Automação de Tarefas com Agentes

Monitoramento de Produção LLM

Tente Estes Prompts

Melhores Práticas

Evitar

Perguntas Frequentes

Detalhes do Desenvolvedor