rag-engineer
Construye Sistemas RAG Listos para Producción
Los sistemas RAG a menudo fallan debido a estrategias de fragmentación deficientes y recuperación ingenua. Esta skill proporciona patrones expertos para fragmentación semántica, búsqueda híbrida y optimización de contexto para construir sistemas de recuperación de grado de producción.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "rag-engineer". ¿Cómo debería fragmentar documentos PDF con encabezados y tablas para un sistema RAG?
Resultado esperado:
Usa fragmentación semántica que respete la estructura del documento: (1) Analiza el PDF para extraer encabezados, párrafos y límites de tablas, (2) Fragmenta a nivel de párrafo preservando los metadatos del encabezado, (3) Incluye un 10-20% de superposición entre fragmentos para continuidad del contexto, (4) Almacena metadatos estructurales para filtrado durante la recuperación. Este enfoque mantiene mejor el significado que la fragmentación por tokens fijos.
Usando "rag-engineer". Mi sistema RAG devuelve documentos relevantes pero las respuestas aún son pobres. ¿Cómo depuro esto?
Resultado esperado:
Separa la evaluación de recuperación de la generación: (1) Verifica la precisión de recuperación inspeccionando manualmente los resultados top-k, (2) Mide la tasa de aciertos y MRR en un conjunto de prueba, (3) Si la recuperación se ve bien, el problema está en tu prompt o selección del LLM. Solución común: agrega un paso de reranking entre la recuperación inicial y la generación final.
Auditoría de seguridad
SeguroAll 16 static findings evaluated as false positives. The skill is a legitimate RAG (Retrieval-Augmented Generation) engineering documentation skill. External commands flagged are markdown code fence syntax (backticks) showing JavaScript examples. Cryptographic and reconnaissance warnings match keywords in context of semantic search and data pipelines, not security-relevant code.
Problemas críticos (3)
Puntuación de calidad
Lo que puedes crear
Construir un sistema de preguntas y respuestas sobre documentos
Crear un sistema de preguntas y respuestas potenciado por RAG que recupere con precisión el contexto relevante de grandes colecciones de documentos
Mejorar la precisión de RAG existente
Diagnosticar y corregir problemas de calidad de recuperación en una implementación RAG existente usando fragmentación avanzada y búsqueda híbrida
Diseñar un sistema de razonamiento multicapa
Arquitecturar un sistema que pueda responder preguntas complejas que requieren información de múltiples documentos fuente
Prueba estos prompts
¿Cómo debería fragmentar mis [tipo de documento] para un sistema RAG? ¿Qué estrategias preservan el significado y el contexto?
Diseña un sistema de búsqueda híbrida que combine coincidencia de palabras clave BM25 con similitud vectorial. ¿Cómo fusiono las puntuaciones?
¿Cómo evalúo mi sistema de recuperación separadamente de la generación del LLM? ¿Qué métricas debería rastrear?
Mi contexto recuperado excede la ventana de contexto del LLM. ¿Cómo selecciono los fragmentos más relevantes preservando la coherencia?
Mejores prácticas
- Evalúa siempre la calidad de recuperación separadamente de la generación usando métricas como tasa de aciertos y MRR
- Usa fragmentación semántica que respete la estructura del documento en lugar de recuentos fijos de tokens
- Implementa b��squeda híbrida para combinar comprensión semántica con coincidencia exacta de palabras clave
Evitar
- Usar fragmentación de tamaño fijo sin importar la estructura del contenido - esto rompe oraciones y pierde significado
- Incrustar todo sin filtrado - aumenta el costo y reduce la relevancia
- Saltar la evaluación de recuperación - asumiendo que los problemas de generación son siempre problemas del LLM