Question 1

Что такое семантическое чанкование?

Accepted Answer

Семантическое чанкование разделяет документы по смыслу, а не по произвольному количеству токенов. Оно использует сходство эмбеддингов для обнаружения смен тем и сохраняет структуру документа, такую как заголовки и абзацы.

Question 2

Когда следует использовать гибридный поиск?

Accepted Answer

Используйте гибридный поиск, когда запросы содержат специфические термины (имена, коды, точные фразы) наряду с семантическими концепциями. Он сочетает BM25 для сопоставления ключевых слов с векторным сходством для семантического понимания.

Question 3

Как мне оценить качество поиска RAG?

Accepted Answer

Используйте метрики вроде hit rate (релевантные документы в top-k), mean reciprocal rank (качество ранжирования) и recall. Создайте тестовый набор запросов с эталонными релевантными документами.

Question 4

Что такое reciprocal rank fusion?

Accepted Answer

Reciprocal Rank Fusion (RRF) объединяет ранжирования из нескольких методов поиска. Он преобразует ранги в оценки по формуле 1/(rank + k) и суммирует их, получая единое ранжирование без нормализации оценок.

Question 5

Как мне работать с длинными документами, превышающими контекстные окна?

Accepted Answer

Используйте иерархический поиск: индексируйте на нескольких уровнях гранулярности (абзац, раздел, документ), сначала извлекайте грубые результаты, затем получайте детализированные чанки из релевантных разделов.

Question 6

Какую модель эмбеддингов мне следует использовать?

Accepted Answer

Выбирайте в зависимости от вашего варианта использования. Модели общего назначения работают в большинстве случаев. Существуют специализированные модели для кода, научных текстов или многоязычного контента. Всегда тестируйте на ваших конкретных данных.

rag-engineer

Протестировать

Аудит безопасности

Критические проблемы (3)

Оценка качества

Что вы можете построить

Построение системы вопрос-ответ для документов

Улучшение точности существующей RAG-системы

Проектирование системы многошагового рассуждения

Попробуйте эти промпты

Лучшие практики

Избегать

Часто задаваемые вопросы

Сведения для разработчиков