Compétences context-optimization

📦

context-optimization

Name: context-optimization
Author: sickn33

Sûr

Optimiser les Fenêtres de Contexte

Également disponible depuis: Asmayaseen,ChakshuGautam,muratcankoylan

Les fenêtres de contexte limitent ce que les modèles d'IA peuvent traiter à la fois. Cette compétence fournit des techniques pour maximiser la capacité de contexte effective grâce à la compaction, au masquage, à l'optimisation du cache KV et au partitionnement, doublant ou triplant efficacement ce que votre IA peut gérer.

Prend en charge: Claude Codex Code(CC)

🥉 72 Bronze

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "context-optimization". Utilisation du contexte à 85%, la conversation devient lente et coûteuse

Résultat attendu:

Compaction appliquée : résumé de 20 messages précédents en 3 décisions clés, réduction du contexte de 60%. Masquage d'observation déclenché sur les sorties d'outils des tours 1-5.

Utilisation de "context-optimization". Besoin de traiter un document de 50 pages avec une fenêtre de contexte de 32k

Résultat attendu:

Document partitionné en 4 sections. Chaque section assignée à un sous-agent isolé. Résultats agrégés : toutes les sections traitées, résumé final tient dans 8k jetons.

Utilisation de "context-optimization". Le prompt système et les définitions d'outils se répètent dans chaque requête

Résultat attendu:

Contexte réorganisé : prompt système en premier, puis définitions d'outils, puis conversation. Taux de hit de cache de 75% atteint, réduisant la latence de 40%.

Audit de sécurité

Sûr

v1 • 2/24/2026

All 16 static findings are false positives. The skill is a documentation/guide containing code examples for context optimization. Python code snippets were incorrectly flagged as shell commands, and text patterns like 'MD5' in '3+ turns' and skill names were misidentified as security issues. No actual security risks present.

Fichiers analysés

187

Lignes analysées

résultats

Total des audits

Aucun problème de sécurité trouvé

Audité par: claude

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

100

Sécurité

Conformité aux spécifications

Ce que vous pouvez construire

Agents IA à Long Terme

Créer des agents IA de production qui maintiennent le contexte sur des sessions prolongées sans atteindre les limites de jetons

Traitement de Grands Documents

Traiter des documents plus grands que la fenêtre de contexte en partitionnant et en agrégeant les résultats

Réduction des Coûts

Réduire les coûts API en minimisant l'utilisation des jetons grâce à des stratégies de mise en cache et de compression

Essayez ces prompts

Vérification de Contexte de Base

Vérifier l'utilisation actuelle du contexte. Si elle dépasse 70%, appliquer la compaction en résumant les messages plus anciens et en préservant les décisions clés.

Masquage des Sorties d'Outils

Pour les sorties d'outils datant de 3 tours ou plus qui ont servi leur objectif, les remplacer par des références compactes contenant uniquement les résultats clés.

Ordre Adapté au Cache

Réordonner les éléments de contexte pour maximiser les hits de cache : placer d'abord le prompt système et les définitions d'outils, puis le contenu réutilisable, et enfin le contenu unique.

Partitionnement par Sous-Agent

Diviser la tâche actuelle en sous-tâches indépendantes. Assigner chacune à un sous-agent séparé avec un contexte isolé. Agréger les résultats après completion.

Bonnes pratiques

Mesurer avant d'optimiser - établir l'utilisation de base des jetons et les métriques de performance
Appliquer la compaction avant le masquage - la résumé préserve plus de signal que la suppression
Concevoir pour la stabilité du cache - utiliser un formatage cohérent et éviter le contenu dynamique dans les prompts

Éviter

Compression agressive - compresser en dessous de 50% cause une perte de qualité significative
Masquer les observations critiques - ne jamais masquer les données nécessaires au raisonnement actuel
Ignorer la surveillance - l'efficacité de l'optimisation se dégrade avec le temps sans mesure

Foire aux questions

Cette compétence augmente-t-elle réellement la fenêtre de contexte ?

Non. Cette compétence optimise la façon dont vous utilisez le contexte disponible, le faisant paraitre plus grand en supprimant les redondances et en compressant les données.

Quelle est la meilleure stratégie d'optimisation pour les tâches axées sur la conversation ?

La compaction avec résumé fonctionne le mieux. Résumer les anciens tours de conversation tout en préservant les décisions et engagements clés.

Quelle réduction de jetons puis-je espérer ?

La compaction atteint une réduction de 50-70% avec moins de 5% de perte de qualité. Le masquage atteint une réduction de 60-80% dans les observations masquées.

La mise en cache fonctionne-t-elle entre différentes conversations ?

La mise en cache de préfixe ne fonctionne que lorsque les prompts ont des préfixes identiques. Garder les prompts système stables pour maximiser les hits de cache.

Quand dois-je utiliser le partitionnement par sous-agent ?

Partitionner quand une tâche est trop complexe pour un contexte, ou quand les sous-tâches ont des exigences de contexte conflictuelles.

Comment savoir quand déclencher l'optimisation ?

Surveiller l'utilisation des jetons au-dessus de 80%, la dégradation de la qualité de réponse, ou l'augmentation de la latence comme déclencheurs principaux.

Détails du développeur

Auteur

sickn33

Licence

MIT

Dépôt

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/context-optimization

Réf

main

Structure de fichiers

📄 SKILL.md