Habilidades context-optimization

📦

context-optimization

Name: context-optimization
Author: sickn33

Seguro

Otimizar Janelas de Contexto

Também disponível em: Asmayaseen,ChakshuGautam,muratcankoylan

As janelas de contexto limitam o que os modelos de IA podem processar de uma vez. Esta habilidade fornece técnicas para maximizar a capacidade efetiva de contexto através de compactação, mascaramento, otimização de cache KV e particionamento, efetivamente dobrando ou triplicando o que sua IA pode lidar.

Suporta: Claude Codex Code(CC)

🥉 72 Bronze

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "context-optimization". Context utilization at 85%, conversation is becoming slow and expensive

Resultado esperado:

Aplicada compactação: resumidas 20 mensagens anteriores em 3 decisões chave, reduzido contexto em 60%. Mascaramento de observações acionado nas saídas de ferramenta dos turnos 1-5.

A utilizar "context-optimization". Need to process a 50-page document with 32k context window

Resultado esperado:

Documento particionado em 4 seções. Cada uma atribuída a sub-agente isolado. Resultados agregados: todas as seções processadas, resumo final cabe em 8k tokens.

A utilizar "context-optimization". System prompt and tool definitions repeat in every request

Resultado esperado:

Contexto reordenado: system prompt primeiro, depois definições de ferramentas, depois conversação. Atingida taxa de acerto de cache de 75%, reduzindo latência em 40%.

Auditoria de Segurança

Seguro

v1 • 2/24/2026

All 16 static findings are false positives. The skill is a documentation/guide containing code examples for context optimization. Python code snippets were incorrectly flagged as shell commands, and text patterns like 'MD5' in '3+ turns' and skill names were misidentified as security issues. No actual security risks present.

Arquivos analisados

187

Linhas analisadas

achados

Total de auditorias

Nenhum problema de segurança encontrado

Auditado por: claude

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

100

Segurança

Conformidade com especificações

O Que Você Pode Construir

Agentes de IA de Longa Duração

Construa agentes de IA de produção que mantêm contexto por sessões extensas sem atingir limites de tokens

Processamento de Documentos Grandes

Processe documentos maiores que a janela de contexto particionando e agregando resultados

Redução de Custos

Reduza custos de API minimizando o uso de tokens através de estratégias de cache e compressão

Tente Estes Prompts

Verificação Básica de Contexto

Check the current context utilization. If it exceeds 70%, apply compaction by summarizing older messages and preserving key decisions.

Mascaramento de Saída de Ferramenta

For tool outputs from 3+ turns ago that have served their purpose, replace them with compact references containing only key findings.

Ordenação Amigável ao Cache

Reorder context elements to maximize cache hits: place system prompt and tool definitions first, then reusable content, then unique content last.

Particionamento de Sub-Agente

Split the current task into independent subtasks. Assign each to a separate sub-agent with isolated context. Aggregate results after all complete.

Melhores Práticas

Meça antes de otimizar - estabeleça linhas de base de uso de tokens e métricas de desempenho
Aplique compactação antes do mascaramento - sumarização preserva mais sinal que remoção
Projetar para estabilidade de cache - use formatação consistente e evite conteúdo dinâmico em prompts

Evitar

Compressão agressiva - comprimir abaixo de 50% causa perda significativa de qualidade
Mascarar observações críticas - nunca mascare dados necessários para raciocínio atual
Ignorar monitoramento - eficácia da otimização degrada ao longo do tempo sem medição

Perguntas Frequentes

Esta habilidade realmente aumenta a janela de contexto?

Não. Esta habilidade otimiza como você usa o contexto disponível, fazendo-o parecer maior ao remover redundância e comprimir dados.

Qual é a melhor estratégia de otimização para tarefas focadas em conversação?

Compactação com sumarização funciona melhor. Resuma turnos antigos de conversação preservando decisões e compromissos chave.

Quanta redução de tokens posso esperar?

Compactação alcança redução de 50-70% com menos de 5% de perda de qualidade. Mascaramento alcança redução de 60-80% em observações mascaradas.

O cache funciona entre diferentes conversas?

Cache de prefixo só funciona quando prompts têm prefixos idênticos. Mantenha system prompts estáveis para maximizar acertos de cache.

Quando devo usar particionamento de sub-agente?

Particione quando uma tarefa é muito complexa para um contexto, ou quando subtarefas têm requisitos de contexto conflitantes.

Como sei quando acionar a otimização?

Monitore utilização de tokens acima de 80%, degradação de qualidade de resposta, ou latência crescente como gatilhos primários.

Detalhes do Desenvolvedor

Autor

sickn33

Licença

MIT

Repositório

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/context-optimization

Referência

main

Estrutura de arquivos

📄 SKILL.md