context-compression
Оптимизация сжатия контекста AI для длительных сессий
Также доступно от: ChakshuGautam,muratcankoylan
AI-агенты тратят токены на повторное получение потерянного контекста после агрессивного сжатия. Этот навык обучает стратегиям структурированного суммирования, которые сохраняют критически важную информацию и снижают расходы на токены до 98%.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «context-compression». Сессия агента с 178 сообщениями об отладке ошибок аутентификации
Ожидаемый результат:
- Структурированная сводка создана с 5 разделами: Намерение сессии, Основная причина, Изменённые файлы, Статус тестов, Следующие шаги
- Коэффициент сжатия: 98.6% (89000 токенов до 1240 токенов)
- Зондовая оценка: 4.2/5 точности сохранения технических деталей
Использование «context-compression». Сравнение трёх стратегий сжатия для кодирующих задач
Ожидаемый результат:
- Итеративное с привязкой: 98.6% сжатие, 3.70 качество - Лучше для отслеживания файлов
- Регенеративное: 98.7% сжатие, 3.44 качество - Хороший баланс
- Непрозрачное: 99.3% сжатие, 3.35 качество - Максимальное сжатие, минимальное качество
Аудит безопасности
БезопасноAll 16 static analysis findings are false positives. The skill contains only markdown documentation (SKILL.md, 271 lines) with no executable code. Detected patterns include markdown code block delimiters misidentified as shell execution, documentation URLs misidentified as network calls, and conceptual references misidentified as cryptographic implementations. No security risks identified.
Оценка качества
Что вы можете построить
Отладка длительных сессий агента
Сохранение контекста на протяжении отладочных сессий с 100+ сообщениями, отслеживание изменений файлов, сообщений об ошибках и принятых решений без потери критически важных технических деталей.
Создание корпоративных кодирующих агентов
Проектирование управления контекстом для агентов, работающих с кодовыми базами объёмом 5M+ токенов, реализация сжатия, сохраняющего сигнатуры функций, определения типов и архитектурные решения.
Оценка качества сжатия
Тестирование различных стратегий сжатия с использованием оценки на основе зондов для измерения точности, отслеживания артефактов и возможности продолжения перед развёртыванием в продакшн.
Попробуйте эти промпты
Помогите мне создать шаблон структурированной сводки для сессий моего кодирующего агента. Мне нужны разделы для отслеживания изменённых файлов, принятых решений и следующих шагов. Мой агент в основном работает с TypeScript и Redis.
Я создаю кодирующий агент, который теряет контекст после 50 сообщений. Разработайте стратегию триггеров сжатия с использованием подхода скользящего окна. Включите критерии того, когда сжимать, и как объединять своды инкрементально.
Создайте фреймворк оценки на основе зондов для моей системы сжатия контекста. Сгенерируйте 20 зондовых вопросов по категориям запоминания, отслеживания артефактов, продолжения и решений для проверки того, что своды сохраняют критически важную информацию.
Разработайте трёхфазный рабочий процесс сжатия для проекта миграции кодовой базы объёмом 5M токенов. Включите сжатие фазы исследований до спецификации, фазы планирования до деталей реализации и стратегии использования примеров артефактов как семян сжатия.
Лучшие практики
- Используйте явные разделы сводок для изменений файлов, решений и следующих шагов для предотвращения бесшумной потери информации
- Запускайте сжатие при 70-80% использовании контекста с инкрементальным объединением вместо полной регенерации
- Тестируйте качество сжатия зондовыми вопросами перед развёртыванием в рабочие процессы продакшна
Избегать
- Оптимизация по токенам на запрос вместо общей стоимости токенов на задачу
- Использование агрессивного непрозрачного сжатия, когда отслеживание файлов критически важно для задачи
- Полная регенерация сводов при каждом сжатии вместо инкрементального объединения
Часто задаваемые вопросы
Какой коэффициент сжатия следует ожидать для сессий кодирующего агента?
Как узнать, что сжатие теряет важную информацию?
Какие разделы следует включить в структурированную сводку для кодирующих задач?
Когда следует сжимать контекст диалога агента?
Может ли сжатие обрабатывать изменения кодовой базы в нескольких файлах?
Является ли итеративное суммирование с привязкой лучше регенеративных подходов?
Сведения для разработчиков
Автор
sickn33Лицензия
MIT
Репозиторий
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/context-compressionСсылка
main
Структура файлов
📄 SKILL.md