技能 prompt-caching
📦

prompt-caching

安全

تحسين تكاليف LLM باستخدام التخزين المؤقت للمطالبات

قلل تكاليف LLM API بما يصل إلى 90% من خلال التنفيذ الاستراتيجي للتخزين المؤقت للمطالبات، بما في ذلك التخزين المؤقت الأصلي من Anthropic، والتخزين المؤقت للاستجابات، وأنماط CAG.

支援: Claude Codex Code(CC)
🥉 72 青銅
1

下載技能 ZIP

2

在 Claude 中上傳

前往 設定 → 功能 → 技能 → 上傳技能

3

開啟並開始使用

測試它

正在使用「prompt-caching」。 كيف يمكنني تقليل تكاليف LLM API الخاصة بي؟

預期結果:

يمكنك تقليل تكاليف LLM API من خلال تنفيذ التخزين المؤقت للمطالبات. الاستراتيجيات الرئيسية هي: 1) استخدام التخزين المؤقت الأصلي لمطالبات Anthropic للمطالبات النظامية المتكررة - هذا يخزن بادئة المطالبة مؤقتاً بحيث تدفع فقط للرموز الجديدة. 2) تنفيذ التخزين المؤقت للاستجابات للاستعلامات المتطابقة - تخزين تجزئة المطالبة وإرجاع الاستجابة المخزنة مؤقتاً. 3) استخدام التوليد المعزز بالتخزين المؤقت (CAG) للتخزين المؤقت المسبق للمستندات بدلاً من إجراء استرجاع RAG في كل مرة.

正在使用「prompt-caching」。 لماذا لا يعمل التخزين المؤقت الخاص بي؟

預期結果:

الأسباب الشائعة لفشل التخزين المؤقت للمطالبات: 1) استخدام درجة حرارة غير صفرية - تختلف الاستجابات المخزنة مؤقتاً. 2) تغيير بادئات المطالبات بشكل متكرر - يعتمد التخزين المؤقت على تطابق البادئة الدقيق. 3) عدم استخدام رأس cache-control بشكل صحيح. 4) تجاوز TTL التخزين المؤقت (عادة 5 دقائق لـ Anthropic).

安全審計

安全
v1 • 2/24/2026

All static findings are false positives. The skill is a markdown documentation file with no executable code. The external_commands detections are markdown backticks used for code formatting. The weak cryptographic algorithm detections are misinterpretations of YAML frontmatter content. No actual security risks present.

1
已掃描檔案
66
分析行數
0
發現項
1
審計總數
未發現安全問題
審計者: claude

品質評分

38
架構
100
可維護性
87
內容
32
社群
100
安全
100
規範符合性

你能建構什麼

تقليل تكاليف API للتطبيقات الإنتاجية

تنفيذ التخزين المؤقت للمطالبات لتقليل تكاليف LLM API بشكل كبير في الأنظمة الإنتاجية ذات السياق المتكرر

تحسين المحادثات طويلة المدى

استخدام التخزين المؤقت للحفاظ على سياق المحادثة بدون تكبد تكاليف السياق الكامل في كل رسالة

تحسين زمن استجابة الاستجابة

استغلال الاستجابات المخزنة مؤقتاً لتحقيق أوقات استجابة أسرع للاستعلامات المتكررة

試試這些提示

إعداد التخزين المؤقت الأساسي للمطالبات
كيف يمكنني إعداد التخزين المؤقت للمطالبات مع Claude API؟ أظهر لي خطوات التنفيذ الأساسية.
استراتيجية التخزين المؤقت للاستجابات
صمم استراتيجية تخزين مؤقت للاستجابات لنظام أسئلة وأجوبة يتعامل مع استعلامات مستخدم متشابهة. قم بتضمين تصميم مفتاح التخزين المؤقت ومنطق الإبطال.
دليل تنفيذ CAG
اشرح التوليد المعزز بالتخزين المؤقت (CAG) وقدم نمط تنفيذ Python للتخزين المؤقت المسبق للمستندات.
أفضل ممارسات إبطال التخزين المؤقت
ما هي أفضل الممارسات لإبطال التخزين المؤقت في تطبيقات LLM؟ قم بتضمين الاستراتيجيات القائمة على الوقت والأحداث.

最佳實務

  • هيكلة المطالبات مع بادئات ثابتة تظل متسقة عبر الطلبات
  • استخدام درجة حرارة صفر عند تخزين الاستجابات مؤقتاً للتطابقات الدقيقة
  • تنفيذ إبطال التخزين المؤقت الصحيح مع المشغلات القائمة على الوقت أو الأحداث
  • مراقبة معدلات نجاح التخزين المؤقت وتحسين بنية البادئة وفقاً لذلك

避免

  • تخزين الاستجابات مؤقتاً مع إعدادات درجة حرارة عالية - ستختلف المخرجات وتصبح البيانات المخزنة مؤقتاً عديمة الفائدة
  • التخز��ن المؤقت بدون أي استراتيجية إبطال - البيانات القديمة تؤدي إلى استجابات غير صحيحة
  • التخزين المؤقت لكل شيء بشكل عشوائي - يزيد زمن الانتظار عند فشل التخزين المؤقت بدون فائدة متناسبة

常見問題

ما هو التخزين المؤقت للمطالبات؟
التخزين المؤقت للمطالبات هي تقنية تخزن الحالة المحسوبة لبادئة مطالبة بحيث يمكن إعادة استخدامها عبر طلبات متعددة، مما يقلل من عدد الرموز المعالجة ويخفض التكاليف.
كم يمكنني توفيره باستخدام التخزين المؤقت للمطالبات؟
يبلغ المستخدمون عن تخفيضات في التكاليف تتراوح بين 50-90٪ اعتماداً على مقدار المطالبات التي يمكن تخزينها مؤقتاً كبادئات مستقرة.
هل يعمل التخزين المؤقت للمطالبات مع جميع نماذج Claude؟
التخزين المؤقت للمطالبات مدعوم من نماذج Claude التي تدعم معامل cache_control. راجع وثائق API الخاصة بـ Anthropic لمعرفة توافق النماذج.
ما الفرق بين التخزين المؤقت للمطالبات والتخزين المؤقت للاستجابات؟
التخزين المؤقت للمطالبات يستخدم القدرة الأصلية للنموذج على تخزين البادئات المحسوبة مؤقتاً. التخزين المؤقت للاستجابات يتم تنفيذه من قبلك - عن طريق تخزين الاستجابات الكاملة للاستعلامات المتطابقة في التخزين الخاص بك.
كم من يدوم التخزين المؤقت؟
يستمر التخزين المؤقت لمطالبات Anthropic عادة لمدة 5 دقائق، ولكن هذا يختلف حسب إصدار API. TTL التخزين المؤقت للاستجابات يحدده تنفيذك.
هل يمكنني تخزين الاستجابات مؤقتاً مع درجة حرارة أكبر من 0؟
لا يجب عليك تخزين الاستجابات مؤقتاً مع درجة حرارة غير صفرية لأن المخرجات ستختلف، مما يجعل البيانات المخزنة مؤقتاً غير موثوقة.

開發者詳情

檔案結構

📄 SKILL.md