Question 1

Что такое феномен lost-in-middle?

Accepted Answer

Феномен lost-in-middle — это когда модели демонстрируют U-образные кривые внимания. Информация в начале и конце контекста получает надёжное внимание, в то время как информация в середине страдает от резко сниженной точности воспроизведения.

Question 2

Как происходит отравление контекста?

Accepted Answer

Отравление контекста происходит, когда галлюцинации, ошибки или некорректная информация попадают в контекст и усиливаются через повторяющиеся ссылки. После отравления контекст создаёт петли обратной связи, которые закрепляют неверные убеждения.

Question 3

Что такое подход Four-Bucket?

Accepted Answer

Подход Four-Bucket включает: Write (сохранение контекста за пределами окна), Select (получение релевантного контекста через retrieval), Compress (сокращение токенов через суммаризацию) и Isolate (разделение контекста между суб-агентами).

Question 4

Всегда ли помогают более крупные окна контекста?

Accepted Answer

Нет. Более крупные контексты могут создавать новые проблемы, включая кривые деградации производительности, непропорциональное увеличение затрат и проблемы когнитивных узких мест, когда модели испытывают трудности с поддержанием качества по многим задачам.

Question 5

Как узнать, отравлен ли мой контекст?

Accepted Answer

Следите за симптомами, включая ухудшение качества результатов по задачам, которые ранее выполнялись успешно, несоответствие инструментов, когда агенты вызывают неправильные инструменты, и галлюцинации, которые сохраняются несмотря на попытки исправления.

Question 6

Какие модели лучше всего обрабатывают длинный контекст?

Accepted Answer

Согласно бенчмаркам, Claude Opus 4.5 показывает деградацию около 100K токенов, GPT-5.2 (thinking mode) около 64K, а Gemini 3 Pro около 500K. Однако бенчмарки варьируются в зависимости от типа задачи.

context-degradation

Протестировать

Аудит безопасности

Проблемы высокого риска (4)

Оценка качества

Что вы можете построить

Отладка сбоев агента

Проектирование устойчивых систем

Оценка выбора контекста

Попробуйте эти промпты

Лучшие практики

Избегать

Часто задаваемые вопросы

Сведения для разработчиков