Question 1

В чём разница между RAG и fine-tuning?

Accepted Answer

RAG извлекает соответствующие документы во время запроса и предоставляет их как контекст, позволяя модели получать доступ к актуальной информации без переобучения. Fine-tuning корректирует веса модели на обучающих данных, что лучше для изучения стиля или формата, но не может добавить новые знания после обучения.

Question 2

Как выбрать между различными архитектурами агентов?

Accepted Answer

Используйте ReAct для интерактивного многошагового рассуждения с использованием инструментов. Используйте вызов функций для структурированных API-интеграций. Используйте Plan-and-Execute для сложных задач, требующих предварительного планирования. Используйте мультиагентные системы, когда нужна специализированная экспертиза для разных подзадач.

Question 3

Какую векторную базу данных использовать для продакшена?

Accepted Answer

Для управляемого сервиса с высоким масштабом используйте Pinecone. Для self-hosted с GraphQL используйте Weaviate. Для существующей инфраструктуры PostgreSQL используйте pgvector. Для прототипирования используйте ChromaDB для простоты.

Question 4

Как снизить затраты на LLM API?

Accepted Answer

Реализуйте семантическое кэширование для похожих запросов, используйте меньшие модели для простых задач, оптимизируйте длину промта, устанавливайте соответствующую температуру (0 для кэшируемых ответов) и используйте резервные модели, когда основной ограничен по частоте запросов.

Question 5

Какие метрики отслеживать для LLM-приложений?

Accepted Answer

Отслеживайте метрики производительности (задержка, токенов в секунду), метрики качества (удовлетворённость пользователей,完成率 задач), метрики стоимости (стоимость за запрос, процент попаданий кэша) и метрики надёжности (частота ошибок, частота таймаутов).

Question 6

Как обрабатывать галлюцинации в RAG-системах?

Accepted Answer

Инструктируйте модель говорить 'я не знаю', когда контекста недостаточно, используйте оценку обоснованности в оценке, реализуйте проверки качества извлечения и рассмотрите добавление шага верификации, где модель цитирует источники для утверждений.

llm-app-patterns

Протестировать

Аудит безопасности

Оценка качества

Что вы можете построить

База знаний RAG

Автоматизация задач агента

Мониторинг продакшена LLM

Попробуйте эти промпты

Лучшие практики

Избегать

Часто задаваемые вопросы

Сведения для разработчиков