技能 rag-implementation
📚

rag-implementation

低風險 🌐 網路存取⚙️ 外部命令🔑 環境變數

Construir un pipeline RAG fundamentado

也可從以下取得: sickn33

Necesitas respuestas precisas de documentos privados y datos cambiantes. Esta habilidad explica los componentes de RAG y los patrones de recuperación para fundamentar las respuestas con fuentes.

支援: Claude Codex Code(CC)
⚠️ 68
1

下載技能 ZIP

2

在 Claude 中上傳

前往 設定 → 功能 → 技能 → 上傳技能

3

開啟並開始使用

測試它

正在使用「rag-implementation」。 Outline a RAG pipeline for internal policies with citations.

預期結果:

  • Load policy documents from a controlled folder and split into 800 token chunks
  • Create embeddings using text-embedding-ada-002 and store them in a vector database
  • Use hybrid retrieval combining BM25 and semantic search, then rerank the top 20 results
  • Answer with citations that reference source files and section numbers

正在使用「rag-implementation」。 How do I choose chunk size for technical documentation?

預期結果:

  • Use 500-1000 tokens with 10-20% overlap for most documentation
  • Smaller chunks (400 tokens) improve retrieval precision for specific queries
  • Larger chunks (1500+ tokens) work better for narrative content requiring context
  • Add metadata like source file and section headers to enable filtering

正在使用「rag-implementation」。 What vector database should I use for a small team?

預期結果:

  • Chroma for local testing and prototypes - simple setup, no infrastructure
  • Pinecone for managed service with automatic scaling and minimal ops
  • Weaviate for hybrid search needs combining vector and keyword matching
  • Consider FAISS for complete offline deployment with no network required

安全審計

低風險
v4 • 1/17/2026

This is a documentation-only skill containing Markdown guides with Python code examples. No executable scripts, network calls, or file access capabilities exist in the skill itself. All static findings are false positives from the scanner misinterpreting documentation patterns as security risks. Code examples demonstrate typical RAG patterns using LangChain APIs. No obfuscation, persistence mechanisms, or malicious patterns detected.

2
已掃描檔案
604
分析行數
3
發現項
4
審計總數
審計者: claude 查看審計歷史 →

品質評分

38
架構
100
可維護性
85
內容
22
社群
90
安全
91
規範符合性

你能建構什麼

Diseñar un chatbot RAG

Planificar un pipeline de recuperación que fundamenta las respuestas con citas de documentación interna.

Evaluar la calidad de recuperación

Definir métricas y casos de prueba para medir precisión, fundamentación y calidad de recuperación.

Seleccionar almacenamiento vectorial

Comparar opciones de bases de datos vectoriales y elegir un enfoque que se ajuste a las necesidades de escala y despliegue.

試試這些提示

Fundamentos de RAG
Crear un plan RAG simple para una aplicación de Q&A de documentos. Incluir ingesta de datos, chunking, embeddings, elección de almacén vectorial y cadena de recuperación.
Recuperación híbrida
Diseñar una estrategia de recuperación híbrida usando denso y BM25. Especificar valores k, pesos y cuándo hacer reranking.
Plan de reranking
Proponer un enfoque de reranking con cross-encoders o MMR. Explicar tamaño de candidatos y criterios de selección.
Diseño de evaluación
Redactar un plan de evaluación para un sistema RAG. Incluir métricas de precisión, calidad de recuperación, fundamentación y estructura de casos de prueba.

最佳實務

  • Usar metadatos para filtrado y depuración.
  • Combinar búsqueda híbrida con reranking para mejores resultados.
  • Rastrear métricas de recuperación durante la evaluación.

避免

  • Indexar documentos sin overlap de chunks.
  • Omitir citas en respuestas orientadas al usuario.
  • Usar solo recuperación densa para consultas con muchas palabras clave.

常見問題

Which platforms does this support
Funciona con Claude, Codex y Claude Code prompts y es agnóstico al framework.
What are the main limits
Proporciona orientación únicamente y no ejecuta código ni gestiona infraestructura.
How do I integrate it into my app
Seguir los pasos del pipeline y mapear cargadores, embeddings y recuperadores a tu stack.
Does it access my data
No. Es una guía de texto y no lee archivos ni envía solicitudes de red.
What if retrieval quality is low
Ajustar tamaño de chunk, modelo de embeddings, filtros y pesos de reranking, luego volver a probar.
How is this different from basic search
Combina recuperación semántica con fundamentación, lo que mejora la relevancia sobre búsqueda por palabras clave.

開發者詳情

檔案結構

📄 SKILL.md