Fähigkeiten context-optimization

📦

context-optimization

Name: context-optimization
Author: muratcankoylan

Sicher ⚙️ Externe Befehle🌐 Netzwerkzugriff

Kontext für längere Gespräche optimieren

Auch verfügbar von: Asmayaseen,sickn33,ChakshuGautam

Begrenzte Kontextfenster schränken komplexe Aufgaben ein und erhöhen die API-Kosten. Diese Technik bietet bewährte Methoden, um die effektive Kontextkapazität durch Komprimierung, Beobachtungsmaskierung, KV-Cache-Optimierung und Kontextpartitionierung zu verdoppeln oder zu verdreifachen.

Unterstützt: Claude Codex Code(CC)

🥉 76 Bronze

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "context-optimization". Optimieren Sie diesen Gesprächskontext. Wir haben 85% unseres 100K Token-Limits verwendet und die Antwortqualität verschlechtert sich.

Erwartetes Ergebnis:

Komprimierung wird ausgelöst: Zusammenfassung der 15 ältesten Gesprächs-Turns
8 Tool-Ausgaben aus früheren Turns werden maskiert
Beibehalten: System-Prompt, aktueller Aufgabenstatus, aktuelle Entscheidungen
Ergebnis: Kontext von 85K auf 32K Tokens reduziert (62% Reduktion)
Geschätzter Qualitätseffekt: Weniger als 3% Verschlechterung

Verwendung von "context-optimization". Entwerfen Sie einen cache-freundlichen System-Prompt für einen Programmierassistenten, der dynamische Elemente wie das aktuelle Datum enthält.

Erwartetes Ergebnis:

Statische und dynamische Inhalte in der Prompt-Struktur trennen
Rollenbeschreibung und Anweisungen cache-bar halten
Datum/Zeit zur Variablensubstitution zur Laufzeit verschieben
Ergebnis: Cache-Trefferrate von 45% auf 88% verbessert
Prompt bleibt semantisch identisch mit dem Original

Verwendung von "context-optimization". Wir haben 12 Tool-Aufrufe in unserem Gesprächsverlauf, jeweils mit ausführlichen JSON-Ausgaben. Wie reduzieren wir die Kontextnutzung?

Erwartetes Ergebnis:

Tool-Ausgaben nach Alter und Relevanz analysieren
9 Tool-Ausgaben aus Sitzungen, die 3+ Turns zurückliegen, maskieren
3 neueste Tool-Ausgaben für aktives Reasoning beibehalten
Jede maskierte Ausgabe durch 50-Zeichen-Referenz ersetzt
Erwartete Token-Reduktion: 40-60% auf den Tool-Ausgabeanteil

Sicherheitsaudit

Sicher

v4 • 1/17/2026

The static analyzer flagged 53 patterns across 4 files (1035 lines). After evaluation, ALL findings are FALSE POSITIVES. The 'Ruby/shell backtick execution' flags are markdown code fence delimiters. The 'weak cryptographic algorithm' flags are benign MD5 use for non-crypto ID generation. The 'system reconnaissance' flags describe standard monitoring patterns. No network calls, file system access, credential handling, or malicious patterns exist. This is purely documentation and Python utility functions for in-memory text processing.

Gescannte Dateien

1,035

Analysierte Zeilen

befunde

Gesamtzahl Audits

Risikofaktoren

⚙️ Externe Befehle (14)

references/optimization_techniques.md:43-70 references/optimization_techniques.md:70-89 references/optimization_techniques.md:89-101 references/optimization_techniques.md:101-111 references/optimization_techniques.md:111-134 references/optimization_techniques.md:134-204 references/optimization_techniques.md:204-222 references/optimization_techniques.md:222-228 references/optimization_techniques.md:228-245 SKILL.md:118-121 SKILL.md:121-124 SKILL.md:124-128 SKILL.md:128-131 SKILL.md:131-136

🌐 Netzwerkzugriff (2)

references/optimization_techniques.md:76 skill-report.json:6

Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

100

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Langlebige Agenten erstellen

Agentensysteme erstellen, die komplexe mehrstufige Aufgaben ohne Kontextüberlauf oder Qualitätsverlust bewältigen.

API-Kosten reduzieren

Token-Nutzung um 50-70% durch intelligente Komprimierung reduzieren bei gleichzeitiger Beibehaltung der Ausgabequalität.

Produktionssysteme skalieren

Kontextmanagement-Muster implementieren, die zuverlässig in Produktionsumgebungen mit vorhersagbarer Leistung funktionieren.

Probiere diese Prompts

Kontextnutzung überprüfen

Überprüfen Sie die aktuelle Kontextauslastung. Wenn sie 70% überschreitet, wenden Sie Komprimierung an, um ältere Nachrichten zusammenzufassen und gleichzeitig wichtige Entscheidungen und den aktuellen Aufgabenstatus zu erhalten.

Tool-Ausgaben maskieren

Maskieren Sie Tool-Ausgaben aus Sitzungen, die 3 oder mehr Turns zurückliegen. Ersetzen Sie ausführliche Ausgaben durch kompakte Referenzen, die nur wichtige Metriken und Erkenntnisse enthalten.

Cache-freundliche Prompts entwerfen

Entwerfen Sie den System-Prompt für maximale KV-Cache-Stabilität. Ersetzen Sie dynamische Inhalte wie Zeitstempel durch stabile Platzhalter.

Komplexe Aufgaben partitionieren

Partitionieren Sie diese komplexe Aufgabe über Sub-Agenten mit isolierten Kontexten. Jeder Sub-Agent bearbeitet eine Teilaufgabe, wobei die Ergebnisse auf Koordinator-Ebene zusammengeführt werden.

Bewährte Verfahren

Messen Sie die aktuelle Kontextnutzung vor der Optimierung, um Basis-Metriken zu etablieren und Optimierungsmöglichkeiten zu identifizieren
Wenden Sie Komprimierung vor der Maskierung an, wenn beide Techniken benötigt werden, um maximale Informationsdichte zu erhalten
Entwerfen Sie Prompts für Cache-Stabilität, indem Sie die Struktur konsistent halten und dynamische Inhalte in Variablen trennen

Vermeiden

Komprimierung von System-Prompts oder kritischen Aufgabenstatusinformationen, die zu irreversiblen Informationsverlust führen würde
Maskieren von Beobachtungen, die noch für aktives Reasoning im aktuellen Gesprächskontext benötigt werden
Wichtige Informationen in der Mitte des Kontexts platzieren, wo die Aufmerksamkeitsverteilung am niedrigsten ist (Lost-in-Middle-Phänomen)
Vorzeitige Optimierung, bevor Kontextlimits die Aufgabenleistung oder -qualität tatsächlich einschränken

Häufig gestellte Fragen

Welche KI-Modelle werden unterstützt?

Funktioniert mit jedem Modell, das Tool-Nutzung oder Function-Calling unterstützt, einschließlich Claude 3/4, GPT-4 und Codex-Modellen. Die Utility-Funktions sind modell-agnostisch.

Was sind die Token-Reduktionsziele?

Komprimierung erreicht 50-70% Token-Reduktion mit unter 5% Qualitätsverlust. Maskierung erreicht 60-80% Reduktion bei maskierten Beobachtungen.

Wie integriere ich dies mit meinem Code?

Importieren Sie die Komprimierungs-Utilitys und rufen Sie diese in Ihrer Nachrichtenbehandlungsschleife auf. Überwachen Sie die Token-Nutzung und lösen Sie die Optimierung aus, wenn Schwellenwerte überschritten werden.

Sind meine Daten sicher?

Ja. Alle Verarbeitungen erfolgen In-Memory innerhalb Ihrer Anwendung. Es werden keine Daten an externe Dienste gesendet oder extern gespeichert.

Warum ist die Antwortqualität nach der Optimierung gesunken?

Überprüfen Sie, ob kritische Informationen versehentlich komprimiert wurden. Stellen Sie sicher, dass System-Prompts, wichtige Entscheidungen und der aktuelle Aufgabenstatus während der Optimierung beibehalten werden.

Wie verhält sich dies zum nativen Kontext von Claude?

Claude hat größere Kontextfenster. Diese Technik hilft Ihnen, jedes Kontextfenster effizienter zu nutzen und Kosten unabhängig von der Fenstergröße zu reduzieren.

Entwicklerdetails

Autor

muratcankoylan

Lizenz

MIT

Repository

https://github.com/muratcankoylan/Agent-Skills-for-Context-Engineering/tree/main/skills/context-optimization

Ref

main

Dateistruktur

📁 references/

📄 optimization_techniques.md

📁 scripts/

📄 compaction.py

📄 SKILL.md