المهارات hybrid-search-implementation
📦

hybrid-search-implementation

آمن

Implementar Búsqueda Híbrida para Sistemas RAG

متاح أيضًا من: wshobson

La búsqueda únicamente vectorial o por palabras clave a menudo omite resultados relevantes. Esta habilidad proporciona patrones probados para combinar ambos enfoques y lograr una precisión de recuperación superior.

يدعم: Claude Codex Code(CC)
🥉 75 برونزي
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "hybrid-search-implementation". Usuario busca 'authentication error 401' en documentación de API

النتيجة المتوقعة:

La búsqueda híbrida devuelve documentos que coinciden tanto con el concepto semántico de fallos de autenticación COMO coincidencias exactas del código de error 401, clasificados por puntuación de relevancia combinada.

استخدام "hybrid-search-implementation". Desarrollador consulta 'how to paginate results' en docs del SDK

النتيجة المتوقعة:

La búsqueda vectorial encuentra patrones de paginación semánticamente relacionados mientras que la búsqueda por palabras clave asegura que se incluyan en los resultados coincidencias exactas de terminología como 'limit', 'offset', 'cursor'.

التدقيق الأمني

آمن
v1 • 2/25/2026

Static analysis flagged 55 patterns but all are false positives. Files are markdown documentation with Python code samples. Backticks are markdown formatting not shell execution. URLs are documentation references not network calls. No cryptographic operations, credential access, or system commands detected. Skill is safe for publication.

2
الملفات التي تم فحصها
603
الأسطر التي تم تحليلها
0
النتائج
1
إجمالي عمليات التدقيق
لا توجد مشكلات أمنية
تم تدقيقه بواسطة: claude

درجة الجودة

38
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
50
المجتمع
100
الأمان
100
الامتثال للمواصفات

ماذا يمكنك بناءه

Desarrollador de Sistemas RAG

Construir sistemas de generación aumentada por recuperación con mejor recall combinando búsqueda semántica vectorial con coincidencia exacta de palabras clave para términos técnicos y códigos de producto.

Constructor de Motores de Búsqueda

Implementar búsqueda empresarial que maneje tanto consultas conceptuales (vía embeddings) como coincidencia precisa de términos (vía BM25) para resultados comprehensivos.

Arquitecto de Base de Conocimientos

Crear búsqueda en documentación que comprenda la intención del usuario semánticamente mientras encuentra coincidencias exactas para códigos de error, nombres de API y números de versión.

جرّب هذه الموجهات

Configuración Básica de Búsqueda Híbrida
Necesito implementar búsqueda híbrida para mi sistema RAG. Muéstrame cómo combinar embeddings vectoriales con búsqueda por palabras clave usando Reciprocal Rank Fusion en Python.
Implementación en PostgreSQL pgvector
Ayúdame a configurar búsqueda híbrida en PostgreSQL usando pgvector para embeddings y búsqueda de texto completa integrada. Necesito creación de esquema SQL y ejemplos de consultas con fusión RRF.
Configuración de Búsqueda Híbrida en Elasticsearch
Muéstrame cómo configurar Elasticsearch para búsqueda híbrida combinando similitud de vectores densos con búsqueda de texto BM25. Incluye mapeo de índice, consultas de búsqueda y configuración RRF para Elasticsearch 8.x.
Pipeline RAG Avanzado con Reranking
Construye un pipeline RAG híbrido completo que recupere candidatos con búsqueda vectorial y por palabras clave, fusione resultados con RRF, luego rerankee los mejores candidatos usando un modelo cross-encoder. Incluye implementación asíncrona en Python con pesos configurables.

أفضل الممارسات

  • Ajusta empíricamente los pesos de fusión en tu conjunto de datos - RRF con k=60 funciona bien como punto de partida pero el balance óptimo depende de tu contenido
  • Siempre incluye reranking con cross-encoder para sistemas en producción - la mejora en calidad justifica la latencia adicional para los candidatos top-k
  • Registra tanto las puntuaciones individuales como las fusionadas durante el desarrollo para entender qué consultas se benefician de cada método de búsqueda

تجنب

  • Usar solo búsqueda vectorial para dominios con requisitos de coincidencia exacta como códigos de producto, mensajes de error o números de versión
  • Obtener demasiados candidatos antes de la fusión lo que incrementa la latencia sin mejorar la calidad de los resultados
  • Asumir que los pesos de fusión fijos funcionan para todos los tipos de consulta sin testing A/B u optimización a nivel de consulta

الأسئلة المتكررة

¿Cuándo debo usar RRF versus fusión lineal?
RRF es más simple y no requiere ajuste - funciona bien desde el inicio. La fusión lineal ofrece más control pero requiere ajuste empírico de pesos en tus datos. Comienza con RRF, cambia a lineal si necesitas control granular.
¿Cuántos candidatos debo recuperar antes de la fusión?
Típicamente 3x tu límite final por método. Para resultados top-10, recupera 30 de cada método de búsqueda. Esto proporciona suficiente superposición para una fusión efectiva sin latencia excesiva.
¿Vale la pena el costo computacional del reranking con cross-encoder?
Sí para RAG en producción. El reranking de 50 candidatos agrega ~100-500ms pero mejora significativamente la relevancia. Aplica reranking solo a los candidatos top-k fusionados, no al conjunto completo de candidatos.
¿Puedo usar búsqueda híbrida con bases de datos vectoriales existentes?
La mayoría de las bases de datos vectoriales ahora soportan búsqueda híbrida de forma nativa. Pinecone, Weaviate, Qdrant y pgvector ofrecen búsqueda híbrida integrada con parámetros de fusión configurables.
¿Qué modelos de embedding funcionan mejor para búsqueda híbrida?
Cualquier modelo de embedding funciona ya que la búsqueda híbrida combina embeddings con búsqueda por palabras clave. OpenAI text-embedding-3, Cohere embed-v3, o modelos open-source como BGE funcionan efectivamente.
¿Cómo manejo consultas que son puramente semánticas o puramente basadas en palabras clave?
Para consultas exactas cortas (códigos de error, IDs), aumenta el peso de palabras clave. Para preguntas en lenguaje natural, aumenta el peso vectorial. Los sistemas avanzados usan clasificación de consultas para establecer pesos dinámicos.

تفاصيل المطور

بنية الملفات