Habilidades rag-engineer
📦

rag-engineer

Seguro

Construye Sistemas RAG Listos para Producción

Los sistemas RAG a menudo fallan debido a estrategias de fragmentación deficientes y recuperación ingenua. Esta skill proporciona patrones expertos para fragmentación semántica, búsqueda híbrida y optimización de contexto para construir sistemas de recuperación de grado de producción.

Soporta: Claude Codex Code(CC)
⚠️ 64 Deficiente
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "rag-engineer". ¿Cómo debería fragmentar documentos PDF con encabezados y tablas para un sistema RAG?

Resultado esperado:

Usa fragmentación semántica que respete la estructura del documento: (1) Analiza el PDF para extraer encabezados, párrafos y límites de tablas, (2) Fragmenta a nivel de párrafo preservando los metadatos del encabezado, (3) Incluye un 10-20% de superposición entre fragmentos para continuidad del contexto, (4) Almacena metadatos estructurales para filtrado durante la recuperación. Este enfoque mantiene mejor el significado que la fragmentación por tokens fijos.

Usando "rag-engineer". Mi sistema RAG devuelve documentos relevantes pero las respuestas aún son pobres. ¿Cómo depuro esto?

Resultado esperado:

Separa la evaluación de recuperación de la generación: (1) Verifica la precisión de recuperación inspeccionando manualmente los resultados top-k, (2) Mide la tasa de aciertos y MRR en un conjunto de prueba, (3) Si la recuperación se ve bien, el problema está en tu prompt o selección del LLM. Solución común: agrega un paso de reranking entre la recuperación inicial y la generación final.

Auditoría de seguridad

Seguro
v1 • 2/24/2026

All 16 static findings evaluated as false positives. The skill is a legitimate RAG (Retrieval-Augmented Generation) engineering documentation skill. External commands flagged are markdown code fence syntax (backticks) showing JavaScript examples. Cryptographic and reconnaissance warnings match keywords in context of semantic search and data pipelines, not security-relevant code.

1
Archivos escaneados
95
Líneas analizadas
3
hallazgos
1
Auditorías totales

Problemas críticos (3)

External Commands - False Positive
Markdown code fence syntax (backticks) containing JavaScript code examples. Lines 38-91 contain documentation examples for semantic chunking, hierarchical retrieval, and hybrid search implementations. No actual shell or Ruby execution.
Weak Cryptographic Algorithm - False Positive
Scanner incorrectly matches keywords: 'generation' (in Retrieval-Augmented Generation), 'pipeline' (data pipeline), 'execute' (workflow). No cryptographic code present.
System Reconnaissance - False Positive
Scanner flags 'search' in context of semantic search and hybrid search. This is vector search in RAG systems, not network reconnaissance.
Auditado por: claude

Puntuación de calidad

38
Arquitectura
100
Mantenibilidad
87
Contenido
31
Comunidad
55
Seguridad
100
Cumplimiento de la especificación

Lo que puedes crear

Construir un sistema de preguntas y respuestas sobre documentos

Crear un sistema de preguntas y respuestas potenciado por RAG que recupere con precisión el contexto relevante de grandes colecciones de documentos

Mejorar la precisión de RAG existente

Diagnosticar y corregir problemas de calidad de recuperación en una implementación RAG existente usando fragmentación avanzada y búsqueda híbrida

Diseñar un sistema de razonamiento multicapa

Arquitecturar un sistema que pueda responder preguntas complejas que requieren información de múltiples documentos fuente

Prueba estos prompts

Consulta de Patrón RAG Básico
¿Cómo debería fragmentar mis [tipo de documento] para un sistema RAG? ¿Qué estrategias preservan el significado y el contexto?
Implementación de Búsqueda Híbrida
Diseña un sistema de búsqueda híbrida que combine coincidencia de palabras clave BM25 con similitud vectorial. ¿Cómo fusiono las puntuaciones?
Evaluación de Recuperación
¿Cómo evalúo mi sistema de recuperación separadamente de la generación del LLM? ¿Qué métricas debería rastrear?
Optimización de Ventana de Contexto
Mi contexto recuperado excede la ventana de contexto del LLM. ¿Cómo selecciono los fragmentos más relevantes preservando la coherencia?

Mejores prácticas

  • Evalúa siempre la calidad de recuperación separadamente de la generación usando métricas como tasa de aciertos y MRR
  • Usa fragmentación semántica que respete la estructura del documento en lugar de recuentos fijos de tokens
  • Implementa b��squeda híbrida para combinar comprensión semántica con coincidencia exacta de palabras clave

Evitar

  • Usar fragmentación de tamaño fijo sin importar la estructura del contenido - esto rompe oraciones y pierde significado
  • Incrustar todo sin filtrado - aumenta el costo y reduce la relevancia
  • Saltar la evaluación de recuperación - asumiendo que los problemas de generación son siempre problemas del LLM

Preguntas frecuentes

¿Qué es la fragmentación semántica?
La fragmentación semántica divide documentos por significado en lugar de recuentos de tokens arbitrarios. Usa similitud de embeddings para detectar cambios de tema y preserva la estructura del documento como encabezados y párrafos.
¿Cuándo debo usar búsqueda híbrida?
Usa búsqueda híbrida cuando las consultas contienen términos específicos (nombres, códigos, frases exactas) junto con conceptos semánticos. Combina BM25 para coincidencia de palabras clave con similitud vectorial para comprensión semántica.
¿Cómo evalúo la calidad de recuperación de RAG?
Usa métricas como tasa de aciertos (documentos relevantes en top-k), rango recíproco medio (calidad de clasificación) y recall. Crea un conjunto de prueba de consultas con documentos relevantes de verdad fundamental.
¿Qué es la fusión de rango recíproco?
Reciprocal Rank Fusion (RRF) combina clasificaciones de múltiples métodos de recuperación. Convierte rangos a puntuaciones usando 1/(rango + k) y las suma, dando una clasificación unificada sin normalización de puntuaciones.
¿Cómo manejo documentos largos que exceden las ventanas de contexto?
Usa recuperación jerárquica: indexa en múltiples niveles de granularidad (párrafo, sección, documento), recupera resultados gruesos primero, luego obtiene fragmentos finos de secciones relevantes.
¿Qué modelo de embeddings debo usar?
Elige según tu caso de uso. Los modelos de propósito general funcionan para la mayoría de casos. Existen modelos especializados para código, texto científico o contenido multilingüe. Siempre prueba con tus datos específicos.

Detalles del desarrollador

Estructura de archivos

📄 SKILL.md