rag-implementation
إنشاء خط أنابيب RAG قائم على المصادر
تحتاج إلى إجابات دقيقة من المستندات الخاصة والبيانات المتغيرة. تشرح هذه المهارة مكونات RAG وأنماط الاسترجاع لتأسيس الاستجابات مع المصادر.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "rag-implementation". Outline a RAG pipeline for internal policies with citations.
النتيجة المتوقعة:
- Load policy documents from a controlled folder and split into 800 token chunks
- Create embeddings using text-embedding-ada-002 and store them in a vector database
- Use hybrid retrieval combining BM25 and semantic search, then rerank the top 20 results
- Answer with citations that reference source files and section numbers
استخدام "rag-implementation". How do I choose chunk size for technical documentation?
النتيجة المتوقعة:
- Use 500-1000 tokens with 10-20% overlap for most documentation
- Smaller chunks (400 tokens) improve retrieval precision for specific queries
- Larger chunks (1500+ tokens) work better for narrative content requiring context
- Add metadata like source file and section headers to enable filtering
استخدام "rag-implementation". What vector database should I use for a small team?
النتيجة المتوقعة:
- Chroma for local testing and prototypes - simple setup, no infrastructure
- Pinecone for managed service with automatic scaling and minimal ops
- Weaviate for hybrid search needs combining vector and keyword matching
- Consider FAISS for complete offline deployment with no network required
التدقيق الأمني
مخاطر منخفضةThis is a documentation-only skill containing Markdown guides with Python code examples. No executable scripts, network calls, or file access capabilities exist in the skill itself. All static findings are false positives from the scanner misinterpreting documentation patterns as security risks. Code examples demonstrate typical RAG patterns using LangChain APIs. No obfuscation, persistence mechanisms, or malicious patterns detected.
عوامل الخطر
🌐 الوصول إلى الشبكة (3)
⚙️ الأوامر الخارجية (37)
🔑 متغيرات البيئة (1)
درجة الجودة
ماذا يمكنك بناءه
تصميم روبوت محادثة RAG
خطط لخط أنابيب استرجاع يأسس الإجابات مع الاستشهادات من الوثائق الداخلية.
تقييم جودة الاسترجاع
حدد المقاييس وحالات الاختبار لقياس الدقة والتأسيس وجودة الاسترجاع.
اختيار التخزين المتجهي
قارن خيارات قاعدة بيانات المتجهات واختر نهجاً يناسب احتياجات النشر والحجم.
جرّب هذه الموجهات
أنشئ خطة RAG بسيطة لتطبيق سؤال وجواب على المستندات. Include data ingestion, chunking, embeddings, vector store choice, and retrieval chain.
صمم استراتيجية استرجاع هجين باستخدام الكثافة و BM25. حدد قيم k والأوزان ومتى لإعادة الترتيب.
اقترح نهج إعادة ترتيب مع المُرمز المتقاطع أو MMR. اشرح حجم المرشحين ومعايير الاختيار.
صمم خطة تقييم لنظام RAG. Include accuracy, retrieval quality, groundedness metrics, and test case structure.
أفضل الممارسات
- استخدم البيانات الوصفية للتصفية والتصحيح.
- جمع بين البحث الهجين وإعادة الترتيب لأفضل النتائج.
- تتبع مقاييس الاسترجاع أثناء التقييم.
تجنب
- فهرسة المستندات بدون تداخل في التقسيم.
- تجاهل الاستشهادات في الإجابات الموجهة للمستخدم.
- استخدام الاسترجاع الكثيف فقط للاستفسارات الغنية بالكلمات المفتاحية.
الأسئلة المتكررة
ما المنصات التي يدعمها هذا
ما هي الحدود الرئيسية
كيف أقوم بدمجه في تطبيقي
هل يصل إلى بياناتي
ماذا لو كانت جودة الاسترجاع منخفضة
كيف يختلف هذا عن البحث الأساسي
تفاصيل المطور
المؤلف
wshobsonالترخيص
MIT
المستودع
https://github.com/wshobson/agents/tree/main/plugins/llm-application-dev/skills/rag-implementationمرجع
main
بنية الملفات
📄 SKILL.md