Habilidades embedding-strategies

📦

embedding-strategies

Name: embedding-strategies
Author: wshobson

Riesgo bajo

Optimizar Modelos de Embedding para Búsqueda Semántica

También disponible en: sickn33

Elegir el modelo de embedding y la estrategia de fragmentación correctos es fundamental para la calidad de la recuperación. Esta habilidad proporciona plantillas y mejores prácticas para implementar pipelines de búsqueda vectorial de alta calidad.

Soporta: Claude Codex Code(CC)

⚠️ 68 Deficiente

Descargar el ZIP de la skill

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

Activa y empieza a usar

Pruébalo

Usando "embedding-strategies". Recomienda un modelo de embedding para un sistema de búsqueda de documentos legales. Necesito alta precisión y puedo usar servicios API.

Resultado esperado:

Recomendado: text-embedding-3-large (3072 dimensiones) o voyage-2 (1024 dimensiones)
text-embedding-3-large: Mejor precisión, maneja 8191 tokens, ideal para cláusulas legales largas
voyage-2: Especializado en legal/código, 1024 dimensiones, límite de 4000 tokens
Considera fragmentar documentos legales por encabezados de sección para preservar el contexto de las cláusulas

Usando "embedding-strategies". ¿Cómo debo fragmentar mi documentación técnica para un sistema RAG?

Resultado esperado:

Estrategia: Usa fragmentación semántica por encabezados combinada con división recursiva de caracteres
Tamaño de fragmento recomendado: 512 tokens con 50 tokens de superposición
Preserva ejemplos de código como fragmentos completos
Agrega metadatos de contexto vinculando fragmentos a secciones originales

Auditoría de seguridad

Riesgo bajo

v5 • 1/21/2026

All static findings are false positives. C2 keyword alerts triggered by hash hex strings. Weak crypto alerts from hash substrings. External command alerts from ASCII flow diagrams using arrows. Hardcoded URL alerts are legitimate documentation links. No malicious code, command execution, or data exfiltration patterns found.

Archivos escaneados

818

Líneas analizadas

hallazgos

Auditorías totales

No se encontraron problemas de seguridad

Auditado por: claude Ver historial de auditorías →

Puntuación de calidad

Arquitectura

100

Mantenibilidad

Contenido

Comunidad

Seguridad

Cumplimiento de la especificación

Lo que puedes crear

Construir Sistemas RAG

Implementar generación aumentada por recuperación seleccionando modelos de embedding y estrategias de fragmentación apropiados para su corpus de documentos.

Optimizar Búsqueda Semántica

Mejorar la relevancia de búsqueda eligiendo modelos de embedding adecuados a su tipo de contenido e implementando fragmentación y preprocesamiento apropiados.

Crear Pipelines de Embedding

Construir pipelines escalables que procesen documentos, fragmenten contenido, generen embeddings y preparen registros para bases de datos vectoriales.

Prueba estos prompts

Seleccionar Modelo de Embedding

Necesito elegir un modelo de embedding para mi [use case: code search / multilingual documents / legal contracts]. Mis prioridades son [priority: accuracy / cost / speed]. Tengo [constraints: limit on dimensions / need open source / need API access]. Recomienda 3 modelos con justificación.

Implementar Estrategia de Fragmentación

Ayúdame a implementar fragmentación para mi [data type: technical documentation / conversational data / code]. Necesito manejar [requirement: preserve context / maintain semantic boundaries / limit chunk size]. Proporciona código Python para fragmentación [strategy: token-based / sentence-based / recursive character].

Construir Pipeline de Embedding

Crea un pipeline en Python que [input: processes documents from source / generates embeddings / stores in vector database]. Incluye [feature: batching / progress tracking / metadata handling]. Usa [model: OpenAI embeddings / sentence-transformers].

Evaluar Calidad de Recuperación

Mi recuperación basada en embedding tiene [problem: low recall / inconsistent results / poor precision]. Mi configuración usa [model details]. Analiza las causas potenciales y sugiere mejoras para [metric: precision at k / recall / ndcg].

Mejores prácticas

Ajustar el modelo de embedding al tipo de contenido: código, prosa o multilingüe
Normalizar embeddings para comparaciones confiables de similitud coseno
Usar superposición de tokens al fragmentar para preservar el contexto entre límites

Evitar

Mezclar diferentes modelos de embedding en el mismo índice
Ignorar límites de tokens y truncar contenido a mitad de pensamiento
Omitir el preprocesamiento, permitiendo que el ruido degrade la calidad del embedding

Preguntas frecuentes

¿Con qué modelo de embedding debo comenzar?

Comienza con text-embedding-3-small para uso general. Equilibra costo y calidad. Cambia a text-embedding-3-large si necesitas mayor precisión, o voyage-2 para contenido de código y legal.

¿Cómo elijo el tamaño del fragmento?

512 tokens es un buen punto de partida para la mayoría de los casos de uso. Ajusta según la complejidad de tu contenido y los límites de tokens del modelo. Superpón 50 tokens para mantener el contexto entre fragmentos.

¿Puedo usar modelos de embedding locales?

Sí. Sentence-transformers soporta modelos como BAAI/bge-large-en-v1.5 e intfloat/multilingual-e5-large. Estos se ejecutan localmente y funcionan bien para escenarios de código abierto u offline.

¿Cómo evalúo la calidad de mi embedding?

Usa métricas precision@k, recall@k, MRR y NDCG@k. Prueba con documentos relevantes conocidos y compara los resultados recuperados contra la verdad fundamental.

¿Debo normalizar los embeddings?

Sí. Normaliza los embeddings antes de usar similitud coseno. La mayoría de los modelos de embedding modernos producen vectores normalizados por defecto, pero los modelos locales pueden requerir normalización explícita.

¿Qué preprocesamiento debo aplicar?

Elimina espacios en blanco excesivos, normaliza caracteres unicode y filtra caracteres especiales. Mantén el contenido semánticamente significativo. Puede ser necesaria limpieza específica del dominio para código o datos estructurados.

Detalles del desarrollador

Autor

wshobson

Licencia

MIT

Repositorio

https://github.com/wshobson/agents/tree/main/plugins/llm-application-dev/skills/embedding-strategies

Ref.

main

Estructura de archivos

📄 SKILL.md