Compétences embedding-strategies

📦

embedding-strategies

Name: embedding-strategies
Author: sickn33

Sûr

Optimiser les Embeddings pour la Recherche Sémantique

Également disponible depuis: wshobson

Cette compétence aide les développeurs à choisir et à implémenter les bons modèles d'embedding pour la recherche vectorielle, en fournissant des modèles de code pour OpenAI, Sentence Transformers et des pipelines spécifiques à un domaine.

Prend en charge: Claude Codex Code(CC)

📊 71 Adéquat

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "embedding-strategies". Comment choisir entre text-embedding-3-large et text-embedding-3-small ?

Résultat attendu:

text-embedding-3-large : 3072 dimensions, 8191 tokens - Meilleur pour les besoins de haute précision
text-embedding-3-small : 1536 dimensions, 8191 tokens - Option ��conomique
Choisissez large pour des tâches sémantiques complexes, small pour des applications à volume élevé

Utilisation de "embedding-strategies". Quelle est la meilleure stratégie de chunking pour le code ?

Résultat attendu:

Utilisez tree-sitter pour analyser la structure du code
Chunk par fonctions, classes et méthodes
Incluez le contexte environnant pour une meilleure récupération
Considérez les séparateurs spécifiques au langage

Audit de sécurité

Sûr

v1 • 2/24/2026

This skill provides educational content about embedding strategies for RAG applications. All static findings are false positives: code blocks are markdown documentation examples, URLs are legitimate documentation links, and no cryptographic algorithms or system reconnaissance behavior is present. Safe for publication.

Fichiers analysés

494

Lignes analysées

résultats

Total des audits

Aucun problème de sécurité trouvé

Audité par: claude

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

100

Sécurité

100

Conformité aux spécifications

Ce que vous pouvez construire

Créer des Applications RAG

Configurer des pipelines d'embedding pour la génération augmentée par récupération avec un chunking optimal et une sélection de modèle

Comparer les Modèles d'Embedding

Évaluer différents modèles d'embedding basés sur les dimensions, le coût et les performances pour des domaines spécifiques

Optimiser la Recherche Vectorielle

Améliorer la qualité de la recherche sémantique grâce à un prétraitement, un chunking et une configuration d'embedding appropriés

Essayez ces prompts

Configuration de Base des Embeddings

Montrez-moi comment démarrer avec les embeddings OpenAI pour une application RAG. Incluez le traitement par lots et la réduction de dimension.

Modèles d'Embedding Locaux

Comment configurer des modèles d'embedding locaux en utilisant sentence-transformers ? Incluez les modèles BGE et E5 avec un prétraitement approprié.

Stratégie de Chunking

Quelle stratégie de chunking devrais-je utiliser pour la documentation technique ? Incluez les approches basées sur les tokens, les phrases et la sémantique.

Évaluation de la Qualité

Comment évaluer la qualité de mes embeddings pour la récupération ? Montrez les métriques comme la précision, le rappel, MRR et NDCG.

Bonnes pratiques

Adaptez le modèle d'embedding à votre cas d'usage spécifique (code, prose, multilingue)
Normalisez les embeddings lors de l'utilisation de la similarité cosinus pour la récupération
Mettez en cache les embeddings pour éviter de les recalculer pour des requêtes répétées

Éviter

Utiliser le mauvais modèle pour votre domaine (ex: embeddings généraux pour le code)
Ignorer les limites de tokens ce qui entraîne une troncation et une perte d'informations
Mélanger des modèles d'embedding en production ce qui crée des espaces vectoriels incompatibles

Foire aux questions

Quel est le meilleur modèle d'embedding pour RAG ?

text-embedding-3-small offre le meilleur équilibre entre coût et qualité pour la plupart des applications RAG. Utilisez text-embedding-3-large lorsqu'une précision maximale est requise.

Comment gérer les documents longs ?

Divisez les documents en chunks utilisant le chunking basé sur les tokens ou la sémantique. Visez 256-512 tokens par chunk avec chevauchement pour préserver le contexte.

Puis-je utiliser les embeddings hors ligne ?

Oui, utilisez des modèles sentence-transformers comme BGE ou E5. Ils fonctionnent localement mais nécessitent plus de configuration et de ressources de calcul.

Comment réduire les dimensions des embeddings ?

Les modèles text-embedding-3 d'OpenAI prennent en charge la réduction native de dimension. Pour d'autres modèles, utilisez PCA ou Matryoshka Representation Learning.

Quelles métriques devrais-je suivre ?

Suivez la précision@k, le rappel@k, MRR et NDCG pour la qualité de récupération. Surveillez également la latence et le coût par embedding.

Comment gérer le contenu multilingue ?

Utilisez des modèles multilingues comme multilingual-e5-large ou les nouveaux modèles d'OpenAI qui prennent en charge nativement 100+ langues.

Détails du développeur

Auteur

sickn33

Licence

MIT

Dépôt

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/embedding-strategies

Réf

main

Structure de fichiers

📄 SKILL.md