المهارات vector-database-engineer
🔍

vector-database-engineer

آمن

بناء أنظمة بحث متجهي قابلة للتوسع

تنفيذ قواعد بيانات متجهية جاهزة للإنتاج والبحث الدلالي. توفر هذه المهارة إرشادات خبراء حول استراتيجيات التضمين، وتحسين الفهرسة، وهندسة RAG لتطبيقات الذكاء الاصطناعي الحديثة.

يدعم: Claude Codex Code(CC)
📊 70 كافٍ
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "vector-database-engineer". كيف يجب تقسيم ملفات PDF المكونة من 500 صفحة للبحث الدلالي؟

النتيجة المتوقعة:

استخدم تقسيم النص بالأحرف بشكل متكرر مع كتل من 1000-1500 حرف وتداخل 200 حرف. يحافظ هذا على السياق مع الحفاظ على الاتساق الدلالي. للمستندات التقنية، ضع في اعتبارك التقسيم الواعي بالهيكل الذي يحترم حدود الأقسام.

استخدام "vector-database-engineer". قارن بين Pinecone مقابل Weaviate للإنتاج

النتيجة المتوقعة:

يقدم Pinecone قابلية توسع مُدارة بدون عبء تشغيلي لكن لديه قفل مورد. يوفر Weaviate مرونة الاستضافة الذاتية مع بحث هجين مدمج لكن يتطلب إدارة البنية التحتية. اختر Pinecone للتطوير السريع، و Weaviate للتحكم في التكاليف عند التوسع.

التدقيق الأمني

آمن
v1 • 2/25/2026

All static analysis findings are false positives. The skill contains only documentation text with no executable code, network requests, or security risks. The 'external_commands' flag was triggered by the word 'open' in a documentation sentence, not actual command execution. This is a legitimate educational skill about vector database engineering.

1
الملفات التي تم فحصها
63
الأسطر التي تم تحليلها
0
النتائج
1
إجمالي عمليات التدقيق
لا توجد مشكلات أمنية
تم تدقيقه بواسطة: claude

درجة الجودة

38
الهندسة المعمارية
100
قابلية الصيانة
85
المحتوى
25
المجتمع
100
الأمان
91
الامتثال للمواصفات

ماذا يمكنك بناءه

بناء قاعدة معرفة RAG

تصميم بحث دلالي عبر الوثائق للإجابة على الأسئلة المدعومة بالذكاء الاصطناعي

تنفيذ محرك توصيات

إنشاء توصيات منتجات قائمة على التشابه باستخدام التضمينات المتجهية

تحسين أداء البحث المتجهي

ضبط استراتيجيات الفهرسة والتقسيم لملايين المتجهات

جرّب هذه الموجهات

اختيار قاعدة بيانات متجهية
ساعدني في الاختيار بين Pinecone و Weaviate و Qdrant لنظام بحث مستندات بمليون متجه
تصميم استراتيجية التضمين
صمم خط أنابيب تضمين للوثائق التقنية. اوصِ بحجم التقسيم والتداخل واختيار النموذج
تكوين فهرس HNSW
كوين معاملات فهرس HNSW لاستدعاء 90% بزمن استجابة أقل من 50 مللي ثانية على 5 ملايين متجه
تنفيذ البحث الهجين
نفذ بحثًا هجينًا يجمع بين التشابه المتجهي مع تصفيات الكلمات الرئيسية لبحث المنتجات

أفضل الممارسات

  • اختبر نماذج التضمين دائمًا على نطاقك المحدد قبل النشر للإنتاج
  • ابدأ باستراتيجيات تقسيم بسيطة قبل التحسين لهياكل المستندات المعقدة
  • راقب انحراف المتجهات وخطط لدورات إعادة تضمين دورية
  • استخدم تصفية البيانات الوصفية لتقليل مساحة البحث قبل الاستعلامات المتجهية

تجنب

  • استخدام أبعاد تضمين أكبر بدون اختبار ما إذا كانت النماذج الأصغر تعمل لحالة الاستخدام الخاصة بك
  • تقسيم المستندات بدون تداخل، مما يفقد السياق بين الأجزاء
  • تخطي اختبار الاستدعاء وقياس زمن الاستجابة فقط
  • تخزين التضمينات بدون النص المصدر أو مراجع البيانات الوصفية

الأسئلة المتكررة

ما الفرق بين فهرسة HNSW و IVF؟
يوفر HNSW (العالم الصغير القابل للتنقل الهرمي) استعلامات أسرع مع استخدام ذاكرة أعلى. يستخدم IVF (الملف المقلوب) ذاكرة أقل لكن بسرعة استعلام أبطأ. استخدم HNSW للتطبيقات في الوقت الفعلي، و IVF للنشر واسع النطاق الحساس للتكلفة.
كيف أختبر أبعاد التضمين؟
الأبعاد الأعلى (1536) تلتقط الفروق الدلالية الدقيقة أكثر لكن تزيد التخزين وزمن الاستجابة. ابدأ بـ 384-768 بعدًا لمعظم حالات الاستخدام. استخدم 1536 فقط إذا كانت لديك علاقات دلالية معقدة وميزانية بنية تحتية كافية.
هل يجب استخدام التصفية المسبقة أم التصفية اللاحقة للبيانات الوصفية؟
التصفية المسبقة تقلل مساحة البحث وتحسن الأداء لكن قد تفوت النتائج ذات الصلة. التصفية اللاحقة تضمن الاستدعاء لكن تهدر الحوسبة على النتائج المصفاة. استخدم التصفية المسبقة للقيود الصارمة، والتصفية اللاحقة للتفضيلات المرنة.
أي قاعدة بيانات متجهية يجب أن أستخدم؟
Pinecone للبساطة المُدارة، Weaviate لميزات البحث الهجين، Qdrant للأداء والتصفية، pgvector إذا كنت تستخدم PostgreSQL بالفعل. اختر بناءً على خبرة فريقك وتفضيلات البنية التحتية.
كيف أتعامل مع انحراف التضمين؟
يحدث انحراف التضمين عندما يتوزع توزيع بياناتك بمرور الوقت. راقب مقاييس جودة البحث شهريًا وجدول إعادة تضمين ربع سنوية للتطبيقات الحرجة. استخدم اختبار A/B لمقارنة التضمينات القديمة والجديدة قبل الترحيل الكامل.
هل يمكنني استخدام هذه المهنة للاستعلام مباشرة عن قاعدة البيانات المتجهية الخاصة بي؟
لا، توفر هذه المهنة إرشادات وتوليد كود لهندسة قواعد البيانات المتجهية وتحسينها. لا تنفذ الاستعلامات أو تتصل بقاعدة البيانات الخاصة بك مباشرة. يجب تنفيذ الكود المقترح في تطبيقك.

تفاصيل المطور

بنية الملفات

📄 SKILL.md