Compétences embedding-strategies

📦

embedding-strategies

Name: embedding-strategies
Author: wshobson

Risque faible

Optimiser les modèles d'embedding pour la recherche sémantique

Également disponible depuis: sickn33

Le choix du bon modèle d'embedding et de la stratégie de découpage est crucial pour la qualité de la récupération. Cette compétence fournit des modèles et des bonnes pratiques pour implémenter des pipelines de recherche vectorielle de haute qualité.

Prend en charge: Claude Codex Code(CC)

⚠️ 68 Médiocre

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "embedding-strategies". Recommandez un modèle d'embedding pour un système de recherche de documents juridiques. J'ai besoin d'une grande précision et je peux utiliser des services API.

Résultat attendu:

Recommandé : text-embedding-3-large (3072 dimensions) ou voyage-2 (1024 dimensions)
text-embedding-3-large : Meilleure précision, gère 8191 tokens, idéal pour les longues clauses juridiques
voyage-2 : Spécialisé pour le juridique/code, 1024 dimensions, limite de 4000 tokens
Envisagez de découper les documents juridiques par en-têtes de section pour préserver le contexte des clauses

Utilisation de "embedding-strategies". Comment devrais-je découper ma documentation technique pour un système RAG ?

Résultat attendu:

Stratégie : Utilisez le découpage sémantique par en-têtes combiné avec la division récursive de caractères
Taille de chunk recommandée : 512 tokens avec 50 tokens de chevauchement
Préservez les exemples de code comme chunks complets
Ajoutez des métadonnées de contexte reliant les chunks aux sections d'origine

Audit de sécurité

Risque faible

v5 • 1/21/2026

All static findings are false positives. C2 keyword alerts triggered by hash hex strings. Weak crypto alerts from hash substrings. External command alerts from ASCII flow diagrams using arrows. Hardcoded URL alerts are legitimate documentation links. No malicious code, command execution, or data exfiltration patterns found.

Fichiers analysés

818

Lignes analysées

résultats

Total des audits

Aucun problème de sécurité trouvé

Audité par: claude Voir l’historique des audits →

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

Sécurité

Conformité aux spécifications

Ce que vous pouvez construire

Construire des systèmes RAG

Implémenter la génération augmentée par récupération en sélectionnant les modèles d'embedding et stratégies de découpage appropriés pour votre corpus de documents.

Optimiser la recherche sémantique

Améliorer la pertinence de la recherche en choisissant des modèles d'embedding adaptés à votre type de contenu et en implémentant un découpage et prétraitement appropriés.

Créer des pipelines d'embedding

Construire des pipelines évolutifs qui traitent les documents, découpent le contenu, génèrent des embeddings et préparent les enregistrements pour les bases de données vectorielles.

Essayez ces prompts

Sélectionner un modèle d'embedding

Je dois choisir un modèle d'embedding pour mon [use case: code search / multilingual documents / legal contracts]. Mes priorités sont [priority: accuracy / cost / speed]. J'ai [constraints: limit on dimensions / need open source / need API access]. Recommandez 3 modèles avec justification.

Implémenter une stratégie de découpage

Aidez-moi à implémenter le découpage pour mon [data type: technical documentation / conversational data / code]. Je dois gérer [requirement: preserve context / maintain semantic boundaries / limit chunk size]. Fournissez du code Python pour le découpage [strategy: token-based / sentence-based / recursive character].

Construire un pipeline d'embedding

Créez un pipeline Python qui [input: processes documents from source / generates embeddings / stores in vector database]. Incluez [feature: batching / progress tracking / metadata handling]. Utilisez [model: OpenAI embeddings / sentence-transformers].

Évaluer la qualité de récupération

Ma récupération basée sur les embeddings a [problem: low recall / inconsistent results / poor precision]. Ma configuration utilise [model details]. Analysez les causes potentielles et suggérez des améliorations pour [metric: precision at k / recall / ndcg].

Bonnes pratiques

Adaptez le modèle d'embedding au type de contenu : code, prose ou multilingue
Normalisez les embeddings pour des comparaisons de similarité cosinus fiables
Utilisez le chevauchement de tokens lors du découpage pour préserver le contexte entre les frontières

Éviter

Mélanger différents modèles d'embedding dans le même index
Ignorer les limites de tokens et tronquer le contenu au milieu d'une idée
Sauter le prétraitement, permettant au bruit de dégrader la qualité des embeddings

Foire aux questions

Quel modèle d'embedding devrais-je utiliser pour commencer ?

Commencez avec text-embedding-3-small pour un usage général. Il équilibre coût et qualité. Passez à text-embedding-3-large si vous avez besoin d'une plus grande précision, ou voyage-2 pour le code et le contenu juridique.

Comment choisir la taille des chunks ?

512 tokens est un bon point de départ pour la plupart des cas d'usage. Ajustez en fonction de la complexité de votre contenu et des limites de tokens du modèle. Chevauchez de 50 tokens pour maintenir le contexte entre les chunks.

Puis-je utiliser des modèles d'embedding locaux ?

Oui. Sentence-transformers prend en charge des modèles comme BAAI/bge-large-en-v1.5 et intfloat/multilingual-e5-large. Ceux-ci s'exécutent localement et fonctionnent bien pour les scénarios open-source ou hors ligne.

Comment évaluer la qualité de mes embeddings ?

Utilisez les métriques precision@k, recall@k, MRR et NDCG@k. Testez avec des documents pertinents connus et comparez les résultats récupérés à la vérité terrain.

Devrais-je normaliser les embeddings ?

Oui. Normalisez les embeddings avant d'utiliser la similarité cosinus. La plupart des modèles d'embedding modernes produisent des vecteurs normalisés par défaut, mais les modèles locaux peuvent nécessiter une normalisation explicite.

Quel prétraitement devrais-je appliquer ?

Supprimez les espaces excessifs, normalisez les caractères unicode et filtrez les caractères spéciaux. Gardez le contenu sémantiquement significatif. Un nettoyage spécifique au domaine peut être nécessaire pour le code ou les données structurées.

Détails du développeur

Auteur

wshobson

Licence

MIT

Dépôt

https://github.com/wshobson/agents/tree/main/plugins/llm-application-dev/skills/embedding-strategies

Réf

main

Structure de fichiers

📄 SKILL.md