rag-implementation
Construir un pipeline RAG fundamentado
Necesitas respuestas precisas de documentos privados y datos cambiantes. Esta habilidad explica los componentes de RAG y los patrones de recuperación para fundamentar las respuestas con fuentes.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "rag-implementation". Outline a RAG pipeline for internal policies with citations.
Resultado esperado:
- Load policy documents from a controlled folder and split into 800 token chunks
- Create embeddings using text-embedding-ada-002 and store them in a vector database
- Use hybrid retrieval combining BM25 and semantic search, then rerank the top 20 results
- Answer with citations that reference source files and section numbers
Usando "rag-implementation". How do I choose chunk size for technical documentation?
Resultado esperado:
- Use 500-1000 tokens with 10-20% overlap for most documentation
- Smaller chunks (400 tokens) improve retrieval precision for specific queries
- Larger chunks (1500+ tokens) work better for narrative content requiring context
- Add metadata like source file and section headers to enable filtering
Usando "rag-implementation". What vector database should I use for a small team?
Resultado esperado:
- Chroma for local testing and prototypes - simple setup, no infrastructure
- Pinecone for managed service with automatic scaling and minimal ops
- Weaviate for hybrid search needs combining vector and keyword matching
- Consider FAISS for complete offline deployment with no network required
Auditoría de seguridad
Riesgo bajoThis is a documentation-only skill containing Markdown guides with Python code examples. No executable scripts, network calls, or file access capabilities exist in the skill itself. All static findings are false positives from the scanner misinterpreting documentation patterns as security risks. Code examples demonstrate typical RAG patterns using LangChain APIs. No obfuscation, persistence mechanisms, or malicious patterns detected.
Factores de riesgo
🌐 Acceso a red (3)
⚙️ Comandos externos (37)
🔑 Variables de entorno (1)
Puntuación de calidad
Lo que puedes crear
Diseñar un chatbot RAG
Planificar un pipeline de recuperación que fundamenta las respuestas con citas de documentación interna.
Evaluar la calidad de recuperación
Definir métricas y casos de prueba para medir precisión, fundamentación y calidad de recuperación.
Seleccionar almacenamiento vectorial
Comparar opciones de bases de datos vectoriales y elegir un enfoque que se ajuste a las necesidades de escala y despliegue.
Prueba estos prompts
Crear un plan RAG simple para una aplicación de Q&A de documentos. Incluir ingesta de datos, chunking, embeddings, elección de almacén vectorial y cadena de recuperación.
Diseñar una estrategia de recuperación híbrida usando denso y BM25. Especificar valores k, pesos y cuándo hacer reranking.
Proponer un enfoque de reranking con cross-encoders o MMR. Explicar tamaño de candidatos y criterios de selección.
Redactar un plan de evaluación para un sistema RAG. Incluir métricas de precisión, calidad de recuperación, fundamentación y estructura de casos de prueba.
Mejores prácticas
- Usar metadatos para filtrado y depuración.
- Combinar búsqueda híbrida con reranking para mejores resultados.
- Rastrear métricas de recuperación durante la evaluación.
Evitar
- Indexar documentos sin overlap de chunks.
- Omitir citas en respuestas orientadas al usuario.
- Usar solo recuperación densa para consultas con muchas palabras clave.
Preguntas frecuentes
Which platforms does this support
What are the main limits
How do I integrate it into my app
Does it access my data
What if retrieval quality is low
How is this different from basic search
Detalles del desarrollador
Autor
wshobsonLicencia
MIT
Repositorio
https://github.com/wshobson/agents/tree/main/plugins/llm-application-dev/skills/rag-implementationRef.
main
Estructura de archivos
📄 SKILL.md