المهارات context-degradation
📦

context-degradation

آمن

اكتشاف تدهور السياق في نماذج اللغة الكبيرة

متاح أيضًا من: Asmayaseen,ChakshuGautam,muratcankoylan

نماذج اللغة تظهر تدهوراً متوقعاً في الأداء مع زيادة طول السياق. تساعدك هذه المهارة على تشخيص أنماط الضياع في المنتصف والتسميم والتشتت والتضارب لبناء أنظمة ذكاء اصطناعي أكثر موثوقية.

يدعم: Claude Codex Code(CC)
⚠️ 65 ضعيف
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "context-degradation". Conversation has 60000 tokens. Agent started producing incorrect summaries after turn 20.

النتيجة المتوقعة:

Analysis: Context degradation detected. The lost-in-middle phenomenon is likely causing the agent to miss key information from the middle of context. Recommendation: Apply compaction to summarize earlier context, or restructure to place critical info at edges.

استخدام "context-degradation". User asks about code from turn 1, but agent refers to wrong implementation from turn 15.

النتيجة المتوقعة:

Analysis: Context clash detected. Multiple implementations exist in context with conflicting details. Recommendation: Use explicit versioning and mark conflicts for clarification before proceeding.

التدقيق الأمني

آمن
v1 • 2/24/2026

Static analysis flagged 20 potential issues including external_commands, network, and weak cryptographic algorithms. All findings are FALSE POSITIVES: the 'external_commands' detections are YAML token count examples with backtick formatting; 'network' is a legitimate GitHub URL in metadata; 'weak cryptographic algorithm' is a pattern matching error triggered by the word 'degradation'; 'system reconnaissance' falsely triggers on 'multi-source retrieval'. This skill is pure educational documentation about LLM context degradation with no executable code.

1
الملفات التي تم فحصها
239
الأسطر التي تم تحليلها
4
النتائج
1
إجمالي عمليات التدقيق

مشكلات عالية المخاطر (4)

False Positive: External Commands Detection
Static scanner detected 'Ruby/shell backtick execution' at lines 169, 176, 179. These are YAML token count examples (turn_20: 60000 tokens) used as documentation, not actual shell commands.
False Positive: Network Security Detection
Static scanner detected 'Hardcoded URL' at line 4. This is a legitimate GitHub source URL in the skill metadata, not a security vulnerability.
False Positive: Weak Cryptographic Algorithm
Static scanner incorrectly flagged 'weak cryptographic algorithm' at 16 locations. Pattern matcher triggers on the word 'degradation' (appears as 'deg' in scanning patterns). No cryptographic code exists in this skill.
False Positive: System Reconnaissance
Static scanner flagged 'System reconnaissance' at line 92. Content discusses 'multi-source retrieval' in the context of information retrieval research, not system reconnaissance.
تم تدقيقه بواسطة: claude

درجة الجودة

38
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
31
المجتمع
65
الأمان
91
الامتثال للمواصفات

ماذا يمكنك بناءه

تصحيح أعطال الوكيل

عندما ينتج وكيل الذكاء الاصطناعي مخرجات غير صحيحة أو غير ذات صلة خلال المحادثات الطويلة، استخدم هذه المهارة لتحديد ما إذا كان تدهور السياق هو السبب الجذري

تصميم أنظمة مرنة

صمم أنظمة تتعامل مع سياقات كبيرة بموثوقية من خلال تطبيق نهج الدلاء الأربعة والأنماط المعمارية الموضحة في هذه المهارة

تقييم خيارات السياق

اتخذ قرارات مستنيرة حول هندسة السياق للأنظمة الإنتاجية من خلال فهم عتبات التدهور واستراتيجيات التخفيف

جرّب هذه الموجهات

فحص التدهور الأساسي
Analyze this conversation for context degradation patterns. The conversation has grown to over 50000 tokens. Look for signs of lost-in-middle, poisoning, distraction, or clash.
تشخيص الضياع في المنتصف
Review the attached context and identify if critical information is buried in the middle. The task requires information from the middle section but outputs are incorrect.
استعادة تسميم السياق
Analyze this context for signs of poisoning. Symptoms include degraded output quality, tool misalignment, and persistent hallucinations despite corrections. What steps can recover?
اختيار النمط المعماري
Given a system that processes 200K+ token contexts with multiple independent tasks, recommend which Four-Bucket strategies (Write, Select, Compress, Isolate) to apply and why.

أفضل الممارسات

  • ضع المعلومات الحرجة في بداية أو نهاية السياق حيث يكون الاهتمام أعلى
  • راقب طول السياق وأداء الارتباط أثناء التطوير
  • نفذ مشغلات الضغط قبل أن يصبح التدهور شديداً

تجنب

  • افتراض أن السياق الأطول يحسن الأداء دائماً
  • تحميل جميع المستندات المسترجعة بدون تصفية الصلة
  • السماح للسياق بالنمو إلى ما لا نهاية بدون تجزئة

الأسئلة المتكررة

ما هو ظاهرة الضياع في المنتصف؟
الضياع في المنتصف هو عندما تظهر النماذج منحنيات انتباه على شكل حرف U. المعلومات في البداية والنهاية تحظى باهتمام موثوق، بينما المعلومات في المنتصف تعاني من انخفاض كبير في دقة الاسترجاع.
كيف يحدث تسميم السياق؟
يحدث تسميم السياق عندما تدخل الهلوسات أو الأخطاء أو المعلومات غير الصحيحة إلى السياق وتتضاعف عبر الإشارات المتكررة. بمجرد تسميم السياق، يخلق حلقات تغذية مرتدة تعزز المعتقدات الخاطئة.
ما هو نهج الدلاء الأربعة؟
يشمل نهج الدلاء الأربعة: الكتابة (حفظ السياق خارج النافذة)، الاختيار (سحب السياق ذي الصلة عبر الاسترجاع)، الضغط (تقليل الرموز عبر التلخيص)، والعزل (تقسيم السياق عبر وكلاء فرعيين).
هل نوافذ السياق الأكبر تساعد دائماً؟
لا. السياقات الأكبر يمكن أن تخلق مشاكل جديدة تشمل منحنيات تدهور الأداء وزيادات غير متناسبة في التكلفة ومشاكل عنق الزجاجة المعرفي حيث تكافح النماذج للحفاظ على الجودة عبر مهام عديدة.
كيف أعرف إذا كان سياقي مسموماً؟
راقب الأعراض بما في ذلك تدهور جودة المخرجات في المهام التي نجحت سابقاً، وعدم محاذاة الأدوات حيث يستدعي الوكلاء أدوات خاطئة، والهلوسات التي تستمر رغم محاولات التصحيح.
أي النماذج تتعامل مع السياق الطويل بشكل أفضل؟
وفقاً للمعايير، يظهر Claude Opus 4.5 تدهوراً حول 100K رمز، وGPT-5.2 (وضع التفكير) حول 64K، وGemini 3 Pro حول 500K. ومع ذلك، تختلف المعايير حسب نوع المهمة.

تفاصيل المطور

بنية الملفات

📄 SKILL.md