Habilidades rag-implementation

📚

rag-implementation

Name: rag-implementation
Author: wshobson

Riesgo bajo 🌐 Acceso a red⚙️ Comandos externos🔑 Variables de entorno

Construir un pipeline RAG fundamentado

También disponible en: sickn33

Necesitas respuestas precisas de documentos privados y datos cambiantes. Esta habilidad explica los componentes de RAG y los patrones de recuperación para fundamentar las respuestas con fuentes.

Soporta: Claude Codex Code(CC)

⚠️ 68 Deficiente

Descargar el ZIP de la skill

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

Activa y empieza a usar

Pruébalo

Usando "rag-implementation". Outline a RAG pipeline for internal policies with citations.

Resultado esperado:

Load policy documents from a controlled folder and split into 800 token chunks
Create embeddings using text-embedding-ada-002 and store them in a vector database
Use hybrid retrieval combining BM25 and semantic search, then rerank the top 20 results
Answer with citations that reference source files and section numbers

Usando "rag-implementation". How do I choose chunk size for technical documentation?

Resultado esperado:

Use 500-1000 tokens with 10-20% overlap for most documentation
Smaller chunks (400 tokens) improve retrieval precision for specific queries
Larger chunks (1500+ tokens) work better for narrative content requiring context
Add metadata like source file and section headers to enable filtering

Usando "rag-implementation". What vector database should I use for a small team?

Resultado esperado:

Chroma for local testing and prototypes - simple setup, no infrastructure
Pinecone for managed service with automatic scaling and minimal ops
Weaviate for hybrid search needs combining vector and keyword matching
Consider FAISS for complete offline deployment with no network required

Auditoría de seguridad

Riesgo bajo

v4 • 1/17/2026

This is a documentation-only skill containing Markdown guides with Python code examples. No executable scripts, network calls, or file access capabilities exist in the skill itself. All static findings are false positives from the scanner misinterpreting documentation patterns as security risks. Code examples demonstrate typical RAG patterns using LangChain APIs. No obfuscation, persistence mechanisms, or malicious patterns detected.

Archivos escaneados

604

Líneas analizadas

hallazgos

Auditorías totales

Factores de riesgo

🌐 Acceso a red (3)

skill-report.json:180 skill-report.json:6 SKILL.md:236

⚙️ Comandos externos (37)

🔑 Variables de entorno (1)

SKILL.md:224

Auditado por: claude Ver historial de auditorías →

Puntuación de calidad

Arquitectura

100

Mantenibilidad

Contenido

Comunidad

Seguridad

Cumplimiento de la especificación

Lo que puedes crear

Diseñar un chatbot RAG

Planificar un pipeline de recuperación que fundamenta las respuestas con citas de documentación interna.

Evaluar la calidad de recuperación

Definir métricas y casos de prueba para medir precisión, fundamentación y calidad de recuperación.

Seleccionar almacenamiento vectorial

Comparar opciones de bases de datos vectoriales y elegir un enfoque que se ajuste a las necesidades de escala y despliegue.

Prueba estos prompts

Fundamentos de RAG

Crear un plan RAG simple para una aplicación de Q&A de documentos. Incluir ingesta de datos, chunking, embeddings, elección de almacén vectorial y cadena de recuperación.

Recuperación híbrida

Diseñar una estrategia de recuperación híbrida usando denso y BM25. Especificar valores k, pesos y cuándo hacer reranking.

Plan de reranking

Proponer un enfoque de reranking con cross-encoders o MMR. Explicar tamaño de candidatos y criterios de selección.

Diseño de evaluación

Redactar un plan de evaluación para un sistema RAG. Incluir métricas de precisión, calidad de recuperación, fundamentación y estructura de casos de prueba.

Mejores prácticas

Usar metadatos para filtrado y depuración.
Combinar búsqueda híbrida con reranking para mejores resultados.
Rastrear métricas de recuperación durante la evaluación.

Evitar

Indexar documentos sin overlap de chunks.
Omitir citas en respuestas orientadas al usuario.
Usar solo recuperación densa para consultas con muchas palabras clave.

Preguntas frecuentes

Which platforms does this support

Funciona con Claude, Codex y Claude Code prompts y es agnóstico al framework.

What are the main limits

Proporciona orientación únicamente y no ejecuta código ni gestiona infraestructura.

How do I integrate it into my app

Seguir los pasos del pipeline y mapear cargadores, embeddings y recuperadores a tu stack.

Does it access my data

No. Es una guía de texto y no lee archivos ni envía solicitudes de red.

What if retrieval quality is low

Ajustar tamaño de chunk, modelo de embeddings, filtros y pesos de reranking, luego volver a probar.

How is this different from basic search

Combina recuperación semántica con fundamentación, lo que mejora la relevancia sobre búsqueda por palabras clave.

Detalles del desarrollador

Autor

wshobson

Licencia

MIT

Repositorio

https://github.com/wshobson/agents/tree/main/plugins/llm-application-dev/skills/rag-implementation

Ref.

main

Estructura de archivos

📄 SKILL.md