vector-database-engineer
Construire des systèmes de recherche vectorielle évolutifs
Implémenter des bases de données vectorielles prêtes pour la production et la recherche sémantique. Cette compétence fournit des conseils experts sur les stratégies d'embedding, l'optimisation des index et l'architecture RAG pour les applications IA modernes.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "vector-database-engineer". Comment dois-je fragmenter des PDF de 500 pages pour la recherche sémantique ?
Résultat attendu:
Utilisez la division récursive de caractères avec des fragments de 1000-1500 caractères et un chevauchement de 200 caractères. Cela préserve le contexte tout en maintenant la cohérence sémantique. Pour les documents techniques, considerrez une fragmentation consciente de la structure qui respecte les limites de section.
Utilisation de "vector-database-engineer". Comparer Pinecone vs Weaviate pour la production
Résultat attendu:
Pinecone offre une évolutivité gérée avec zero operational overhead mais présente un lock-in fournisseur. Weaviate fournit une flexibilité auto-hébergée avec recherche hybride intégrée mais nécessite une gestion de l'infrastructure. Choisissez Pinecone pour le développement rapide, Weaviate pour le contrôle des coûts à l'échelle.
Audit de sécurité
SûrAll static analysis findings are false positives. The skill contains only documentation text with no executable code, network requests, or security risks. The 'external_commands' flag was triggered by the word 'open' in a documentation sentence, not actual command execution. This is a legitimate educational skill about vector database engineering.
Score de qualité
Ce que vous pouvez construire
Construire une base de connaissances RAG
Concevoir la recherche sémantique sur la documentation pour les réponses aux questions pilotées par l'IA
Implémenter un moteur de recommandation
Créer des recommandations de produits basées sur la similarité utilisant les embeddings vectoriels
Optimiser les performances de la recherche vectorielle
Ajuster les stratégies d'indexation et de fragmentation pour des millions de vecteurs
Essayez ces prompts
Aidez-moi à choisir entre Pinecone, Weaviate et Qdrant pour un système de recherche de documents avec 1 million de vecteurs
Concevoir un pipeline d'embedding pour la documentation technique. Recommander la taille de fragmentation, le chevauchement et la sélection du modèle
Configurer les paramètres de l'index HNSW pour 90% de rappel avec une latence inférieure à 50 ms sur 5 millions de vecteurs
Implémenter la recherche hybride combinant la similarité vectorielle avec les filtres par mots-clés pour la recherche de produits
Bonnes pratiques
- Testez toujours les modèles d'embedding sur votre domaine spécifique avant le déploiement en production
- Commencez par des stratégies de fragmentation simples avant d'optimiser pour des structures documentaires complexes
- Surveillez la dérive des vecteurs et planifiez des cycles de ré-embedding périodiques
- Utilisez le filtrage par métadonnées pour réduire l'espace de recherche avant les requêtes vectorielles
Éviter
- Utiliser des dimensions d'embedding plus grandes sans tester si des modèles plus petits fonctionnent pour votre cas d'utilisation
- Fragmenter les documents sans chevauchement, perdant le contexte entre les segments
- Sauter les tests de rappel et ne mesurer que la latence
- Stocker les embeddings sans leur texte source ou leurs références de métadonnées
Foire aux questions
Quelle est la différence entre l'indexation HNSW et IVF ?
Comment choisir les dimensions d'embedding ?
Dois-je utiliser le pré-filtrage ou le post-filtrage pour les métadonnées ?
Quelle base de données vectorielle dois-je utiliser ?
Comment gérer la dérive des embeddings ?
Puis-je utiliser cette compétence pour interroger directement ma base de données vectorielle ?
Détails du développeur
Auteur
sickn33Licence
MIT
Dépôt
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/vector-database-engineerRéf
main
Structure de fichiers
📄 SKILL.md