📦

prompt-caching

Name: prompt-caching
Author: sickn33

Безопасно

Оптимизация расходов на LLM с помощью кэширования промптов

Сократите расходы на API LLM до 90% благодаря стратегической реализации кэширования промптов, включая встроенное кэширование Anthropic, кэширование ответов и паттерны CAG.

Поддерживает: Claude Codex Code(CC)

🥉 72 Бронза

Скачать ZIP навыка

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

Включите и начните использовать

Протестировать

Использование «prompt-caching». Как снизить расходы на API LLM?

Ожидаемый результат:

Вы можете снизить расходы на API LLM, реализовав кэширование промптов. Основные стратегии: 1) Используйте встроенное кэширование промптов Anthropic для повторяющихся системных промптов — это кэширует префикс промпта, так что вы платите только за новые токены. 2) Реализуйте кэширование ответов для идентичных запросов — сохраняйте хеш промпта и возвращайте кэшированный ответ. 3) Используйте Cache Augmented Generation (CAG) для предварительного кэширования документов вместо выполнения RAG-поиска каждый раз.

Использование «prompt-caching». Почему не работает кэш?

Ожидаемый результат:

Основные причины сбоя кэширования промптов: 1) Использование ненулевой температуры — кэшированные ответы различаются. 2) Частое изменение префиксов промптов — кэш зависит от точного совпадения префикса. 3) Неправильное использование заголовка cache-control. 4) Превышение TTL кэша (обычно 5 минут для Anthropic).

Аудит безопасности

Безопасно

v1 • 2/24/2026

All static findings are false positives. The skill is a markdown documentation file with no executable code. The external_commands detections are markdown backticks used for code formatting. The weak cryptographic algorithm detections are misinterpretations of YAML frontmatter content. No actual security risks present.

Просканировано файлов

Проанализировано строк

находки

Всего аудитов

Проблем безопасности не найдено

Проверено: claude

Оценка качества

Архитектура

100

Сопровождаемость

Контент

Сообщество

100

Безопасность

100

Соответствие спецификации

Что вы можете построить

Снижение расходов на API для production-приложений

Реализуйте кэширование промптов для существенного снижения расходов на API LLM в production-системах с повторяющимся контекстом

Оптимизация длительных диалогов

Используйте кэширование для поддержания контекста разговора без полных затрат на контекст при каждом сообщении

Улучшение задержки ответов

Используйте кэшированные ответы для достижения более быстрого времени отклика на повторяющиеся запросы

Попробуйте эти промпты

Базовая настройка кэширования промптов

Как настроить кэширование промптов с Claude API? Покажите основные этапы реализации.

Стратегия кэширования ответов

Разработайте стратегию кэширования ответов для Q&A-системы, которая обрабатывает похожие пользовательские запросы. Включите проектирование ключей кэша и логику инвалидации.

Руководство по реализации CAG

Объясните Cache Augmented Generation (CAG) и предоставьте паттерн реализации на Python для предварительного кэширования документов.

Лучшие практики инвалидации кэша

Каковы лучшие практики инвалидации кэша в приложениях LLM? Включите стратегии на основе времени и событий.

Лучшие практики

Структурируйте промпты со статическими префиксами, которые остаются согласованными между запросами
Используйте нулевую температуру при кэшировании ответов для точных совпадений
Реализуйте правильную инвалидацию кэша с триггерами на основе времени или событий
Мониторьте процент попаданий в кэш и оптимизируйте структуру префиксов соответствующим образом

Избегать

Кэширование ответов с высокими настройками температуры — результаты будут различаться, и кэшированные данные станут бесполезными
Кэширование без какой-либо стратегии инвалидации — устаревшие данные приводят к неправильным ответам
Безразборное кэширование всего — увеличивает задержку при промахах кэша без соразмерной выгоды

Часто задаваемые вопросы

Что такое кэширование промптов?

Кэширование промптов — это техника, которая сохраняет вычисленное состояние префикса промпта для его повторного использования в нескольких запросах, сокращая количество обрабатываемых токенов и снижая затраты.

Насколько можно сэкономить с помощью кэширования промптов?

Пользователи сообщают о снижении затрат на 50-90% в зависимости от того, какая часть промптов может быть кэширована как стабильные префиксы.

Кэширование промптов работает со всеми моделями Claude?

Кэширование промптов поддерживается моделями Claude, которые поддерживают параметр cache_control. Проверьте документацию Anthropic API для совместимости моделей.

В чем разница между кэшированием промптов и кэшированием ответов?

Кэширование промптов использует встроенную возможность модели кэшировать вычисленные префиксы. Кэширование ответов реализуется вами — сохранение полных ответов для идентичных запросов в вашем собственном хранилище.

Как долго хранится кэш?

Кэш промптов Anthropic обычно хранится 5 минут, но это зависит от версии API. TTL кэширования ответов определяется вашей реализацией.

Можно ли кэшировать ответы с температурой больше 0?

Не следует кэшировать ответы с ненулевой температурой, так как результаты будут различаться, что делает кэшированные данные ненадежными.

Сведения для разработчиков

Автор

sickn33

Лицензия

MIT

Репозиторий

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/prompt-caching

Ссылка

main

Структура файлов

📄 SKILL.md