📦

rag-engineer

Name: rag-engineer
Author: sickn33

Seguro

Construye Sistemas RAG Listos para Producción

Los sistemas RAG a menudo fallan debido a estrategias de fragmentación deficientes y recuperación ingenua. Esta skill proporciona patrones expertos para fragmentación semántica, búsqueda híbrida y optimización de contexto para construir sistemas de recuperación de grado de producción.

Soporta: Claude Codex Code(CC)

⚠️ 63 Deficiente

Descargar el ZIP de la skill

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

Activa y empieza a usar

Pruébalo

Usando "rag-engineer". ¿Cómo debería fragmentar documentos PDF con encabezados y tablas para un sistema RAG?

Resultado esperado:

Usa fragmentación semántica que respete la estructura del documento: (1) Analiza el PDF para extraer encabezados, párrafos y límites de tablas, (2) Fragmenta a nivel de párrafo preservando los metadatos del encabezado, (3) Incluye un 10-20% de superposición entre fragmentos para continuidad del contexto, (4) Almacena metadatos estructurales para filtrado durante la recuperación. Este enfoque mantiene mejor el significado que la fragmentación por tokens fijos.

Usando "rag-engineer". Mi sistema RAG devuelve documentos relevantes pero las respuestas aún son pobres. ¿Cómo depuro esto?

Resultado esperado:

Separa la evaluación de recuperación de la generación: (1) Verifica la precisión de recuperación inspeccionando manualmente los resultados top-k, (2) Mide la tasa de aciertos y MRR en un conjunto de prueba, (3) Si la recuperación se ve bien, el problema está en tu prompt o selección del LLM. Solución común: agrega un paso de reranking entre la recuperación inicial y la generación final.

Auditoría de seguridad

Seguro

v1 • 2/24/2026

All 16 static findings evaluated as false positives. The skill is a legitimate RAG (Retrieval-Augmented Generation) engineering documentation skill. External commands flagged are markdown code fence syntax (backticks) showing JavaScript examples. Cryptographic and reconnaissance warnings match keywords in context of semantic search and data pipelines, not security-relevant code.

Archivos escaneados

Líneas analizadas

hallazgos

Auditorías totales

Problemas críticos (3)

SKILL.md:38-91

External Commands - False Positive

Markdown code fence syntax (backticks) containing JavaScript code examples. Lines 38-91 contain documentation examples for semantic chunking, hierarchical retrieval, and hybrid search implementations. No actual shell or Ruby execution.

SKILL.md:3 SKILL.md:21 SKILL.md:94

Weak Cryptographic Algorithm - False Positive

Scanner incorrectly matches keywords: 'generation' (in Retrieval-Augmented Generation), 'pipeline' (data pipeline), 'execute' (workflow). No cryptographic code present.

SKILL.md:24 SKILL.md:57 SKILL.md:81 SKILL.md:87

System Reconnaissance - False Positive

Scanner flags 'search' in context of semantic search and hybrid search. This is vector search in RAG systems, not network reconnaissance.

Auditado por: claude

Puntuación de calidad

Arquitectura

100

Mantenibilidad

Contenido

Comunidad

Seguridad

100

Cumplimiento de la especificación

Lo que puedes crear

Construir un sistema de preguntas y respuestas sobre documentos

Crear un sistema de preguntas y respuestas potenciado por RAG que recupere con precisión el contexto relevante de grandes colecciones de documentos

Mejorar la precisión de RAG existente

Diagnosticar y corregir problemas de calidad de recuperación en una implementación RAG existente usando fragmentación avanzada y búsqueda híbrida

Diseñar un sistema de razonamiento multicapa

Arquitecturar un sistema que pueda responder preguntas complejas que requieren información de múltiples documentos fuente

Prueba estos prompts

Consulta de Patrón RAG Básico

¿Cómo debería fragmentar mis [tipo de documento] para un sistema RAG? ¿Qué estrategias preservan el significado y el contexto?

Implementación de Búsqueda Híbrida

Diseña un sistema de búsqueda híbrida que combine coincidencia de palabras clave BM25 con similitud vectorial. ¿Cómo fusiono las puntuaciones?

Evaluación de Recuperación

¿Cómo evalúo mi sistema de recuperación separadamente de la generación del LLM? ¿Qué métricas debería rastrear?

Optimización de Ventana de Contexto

Mi contexto recuperado excede la ventana de contexto del LLM. ¿Cómo selecciono los fragmentos más relevantes preservando la coherencia?

Mejores prácticas

Evalúa siempre la calidad de recuperación separadamente de la generación usando métricas como tasa de aciertos y MRR
Usa fragmentación semántica que respete la estructura del documento en lugar de recuentos fijos de tokens
Implementa b��squeda híbrida para combinar comprensión semántica con coincidencia exacta de palabras clave

Evitar

Usar fragmentación de tamaño fijo sin importar la estructura del contenido - esto rompe oraciones y pierde significado
Incrustar todo sin filtrado - aumenta el costo y reduce la relevancia
Saltar la evaluación de recuperación - asumiendo que los problemas de generación son siempre problemas del LLM

Preguntas frecuentes

¿Qué es la fragmentación semántica?

La fragmentación semántica divide documentos por significado en lugar de recuentos de tokens arbitrarios. Usa similitud de embeddings para detectar cambios de tema y preserva la estructura del documento como encabezados y párrafos.

¿Cuándo debo usar búsqueda híbrida?

Usa búsqueda híbrida cuando las consultas contienen términos específicos (nombres, códigos, frases exactas) junto con conceptos semánticos. Combina BM25 para coincidencia de palabras clave con similitud vectorial para comprensión semántica.

¿Cómo evalúo la calidad de recuperación de RAG?

Usa métricas como tasa de aciertos (documentos relevantes en top-k), rango recíproco medio (calidad de clasificación) y recall. Crea un conjunto de prueba de consultas con documentos relevantes de verdad fundamental.

¿Qué es la fusión de rango recíproco?

Reciprocal Rank Fusion (RRF) combina clasificaciones de múltiples métodos de recuperación. Convierte rangos a puntuaciones usando 1/(rango + k) y las suma, dando una clasificación unificada sin normalización de puntuaciones.

¿Cómo manejo documentos largos que exceden las ventanas de contexto?

Usa recuperación jerárquica: indexa en múltiples niveles de granularidad (párrafo, sección, documento), recupera resultados gruesos primero, luego obtiene fragmentos finos de secciones relevantes.

¿Qué modelo de embeddings debo usar?

Elige según tu caso de uso. Los modelos de propósito general funcionan para la mayoría de casos. Existen modelos especializados para código, texto científico o contenido multilingüe. Siempre prueba con tus datos específicos.

Detalles del desarrollador

Autor

sickn33

Licencia

MIT

Repositorio

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/rag-engineer

Ref.

main

Estructura de archivos

📄 SKILL.md