المهارات prompt-caching
📦

prompt-caching

آمن

تحسين تكاليف LLM باستخدام التخزين المؤقت للمطالبات

قلل تكاليف LLM API بما يصل إلى 90% من خلال التنفيذ الاستراتيجي للتخزين المؤقت للمطالبات، بما في ذلك التخزين المؤقت الأصلي من Anthropic، والتخزين المؤقت للاستجابات، وأنماط CAG.

يدعم: Claude Codex Code(CC)
🥉 75 برونزي
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "prompt-caching". كيف يمكنني تقليل تكاليف LLM API الخاصة بي؟

النتيجة المتوقعة:

يمكنك تقليل تكاليف LLM API من خلال تنفيذ التخزين المؤقت للمطالبات. الاستراتيجيات الرئيسية هي: 1) استخدام التخزين المؤقت الأصلي لمطالبات Anthropic للمطالبات النظامية المتكررة - هذا يخزن بادئة المطالبة مؤقتاً بحيث تدفع فقط للرموز الجديدة. 2) تنفيذ التخزين المؤقت للاستجابات للاستعلامات المتطابقة - تخزين تجزئة المطالبة وإرجاع الاستجابة المخزنة مؤقتاً. 3) استخدام التوليد المعزز بالتخزين المؤقت (CAG) للتخزين المؤقت المسبق للمستندات بدلاً من إجراء استرجاع RAG في كل مرة.

استخدام "prompt-caching". لماذا لا يعمل التخزين المؤقت الخاص بي؟

النتيجة المتوقعة:

الأسباب الشائعة لفشل التخزين المؤقت للمطالبات: 1) استخدام درجة حرارة غير صفرية - تختلف الاستجابات المخزنة مؤقتاً. 2) تغيير بادئات المطالبات بشكل متكرر - يعتمد التخزين المؤقت على تطابق البادئة الدقيق. 3) عدم استخدام رأس cache-control بشكل صحيح. 4) تجاوز TTL التخزين المؤقت (عادة 5 دقائق لـ Anthropic).

التدقيق الأمني

آمن
v1 • 2/24/2026

All static findings are false positives. The skill is a markdown documentation file with no executable code. The external_commands detections are markdown backticks used for code formatting. The weak cryptographic algorithm detections are misinterpretations of YAML frontmatter content. No actual security risks present.

1
الملفات التي تم فحصها
66
الأسطر التي تم تحليلها
0
النتائج
1
إجمالي عمليات التدقيق
لا توجد مشكلات أمنية
تم تدقيقه بواسطة: claude

درجة الجودة

38
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
50
المجتمع
100
الأمان
100
الامتثال للمواصفات

ماذا يمكنك بناءه

تقليل تكاليف API للتطبيقات الإنتاجية

تنفيذ التخزين المؤقت للمطالبات لتقليل تكاليف LLM API بشكل كبير في الأنظمة الإنتاجية ذات السياق المتكرر

تحسين المحادثات طويلة المدى

استخدام التخزين المؤقت للحفاظ على سياق المحادثة بدون تكبد تكاليف السياق الكامل في كل رسالة

تحسين زمن استجابة الاستجابة

استغلال الاستجابات المخزنة مؤقتاً لتحقيق أوقات استجابة أسرع للاستعلامات المتكررة

جرّب هذه الموجهات

إعداد التخزين المؤقت الأساسي للمطالبات
كيف يمكنني إعداد التخزين المؤقت للمطالبات مع Claude API؟ أظهر لي خطوات التنفيذ الأساسية.
استراتيجية التخزين المؤقت للاستجابات
صمم استراتيجية تخزين مؤقت للاستجابات لنظام أسئلة وأجوبة يتعامل مع استعلامات مستخدم متشابهة. قم بتضمين تصميم مفتاح التخزين المؤقت ومنطق الإبطال.
دليل تنفيذ CAG
اشرح التوليد المعزز بالتخزين المؤقت (CAG) وقدم نمط تنفيذ Python للتخزين المؤقت المسبق للمستندات.
أفضل ممارسات إبطال التخزين المؤقت
ما هي أفضل الممارسات لإبطال التخزين المؤقت في تطبيقات LLM؟ قم بتضمين الاستراتيجيات القائمة على الوقت والأحداث.

أفضل الممارسات

  • هيكلة المطالبات مع بادئات ثابتة تظل متسقة عبر الطلبات
  • استخدام درجة حرارة صفر عند تخزين الاستجابات مؤقتاً للتطابقات الدقيقة
  • تنفيذ إبطال التخزين المؤقت الصحيح مع المشغلات القائمة على الوقت أو الأحداث
  • مراقبة معدلات نجاح التخزين المؤقت وتحسين بنية البادئة وفقاً لذلك

تجنب

  • تخزين الاستجابات مؤقتاً مع إعدادات درجة حرارة عالية - ستختلف المخرجات وتصبح البيانات المخزنة مؤقتاً عديمة الفائدة
  • التخز��ن المؤقت بدون أي استراتيجية إبطال - البيانات القديمة تؤدي إلى استجابات غير صحيحة
  • التخزين المؤقت لكل شيء بشكل عشوائي - يزيد زمن الانتظار عند فشل التخزين المؤقت بدون فائدة متناسبة

الأسئلة المتكررة

ما هو التخزين المؤقت للمطالبات؟
التخزين المؤقت للمطالبات هي تقنية تخزن الحالة المحسوبة لبادئة مطالبة بحيث يمكن إعادة استخدامها عبر طلبات متعددة، مما يقلل من عدد الرموز المعالجة ويخفض التكاليف.
كم يمكنني توفيره باستخدام التخزين المؤقت للمطالبات؟
يبلغ المستخدمون عن تخفيضات في التكاليف تتراوح بين 50-90٪ اعتماداً على مقدار المطالبات التي يمكن تخزينها مؤقتاً كبادئات مستقرة.
هل يعمل التخزين المؤقت للمطالبات مع جميع نماذج Claude؟
التخزين المؤقت للمطالبات مدعوم من نماذج Claude التي تدعم معامل cache_control. راجع وثائق API الخاصة بـ Anthropic لمعرفة توافق النماذج.
ما الفرق بين التخزين المؤقت للمطالبات والتخزين المؤقت للاستجابات؟
التخزين المؤقت للمطالبات يستخدم القدرة الأصلية للنموذج على تخزين البادئات المحسوبة مؤقتاً. التخزين المؤقت للاستجابات يتم تنفيذه من قبلك - عن طريق تخزين الاستجابات الكاملة للاستعلامات المتطابقة في التخزين الخاص بك.
كم من يدوم التخزين المؤقت؟
يستمر التخزين المؤقت لمطالبات Anthropic عادة لمدة 5 دقائق، ولكن هذا يختلف حسب إصدار API. TTL التخزين المؤقت للاستجابات يحدده تنفيذك.
هل يمكنني تخزين الاستجابات مؤقتاً مع درجة حرارة أكبر من 0؟
لا يجب عليك تخزين الاستجابات مؤقتاً مع درجة حرارة غير صفرية لأن المخرجات ستختلف، مما يجعل البيانات المخزنة مؤقتاً غير موثوقة.

تفاصيل المطور

المؤلف

sickn33

الترخيص

MIT

مرجع

main

بنية الملفات

📄 SKILL.md