向量相似性搜索是语义搜索和RAG系统的核心,但需要仔细选择和调优索引。本技能提供Pinecone、Qdrant、pgvector和Weaviate的即用型模式,支持混合搜索和重排序。
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "similarity-search-patterns". 为100万个产品嵌入设置Qdrant,目标是95%召回率
النتيجة المتوقعة:
- 使用HNSW索引创建集合(m=16,ef_construct=64)
- 启用标量量化(INT8),内存减少4倍
- 推荐搜索参数:ef=128,在~50ms P99下达到95%召回率
استخدام "similarity-search-patterns". 搜索关于'machine learning optimization'的文档的混合搜索
النتيجة المتوقعة:
- 向量搜索检索到20个语义相似的文档
- BM25过滤'optimization'的精确术语匹配
- 重排序结果以0.6/0.4权重结合两种信号
التدقيق الأمني
آمنAll 31 static analysis findings are false positives. The scanner incorrectly flagged Markdown documentation syntax as executable code. Backticks are code fence markers, URLs are documentation links, and API key parameters represent secure credential handling. The skill contains Python code examples for vector database implementations with no security concerns.
درجة الجودة
ماذا يمكنك بناءه
RAG应用构建器
使用高效的向量搜索实现检索增强生成,对文档嵌入进行搜索。支持结合语义和关键词匹配的混合搜索,以实现准确的上下文检索。
推荐引擎开发者
使用向量嵌入构建最近邻推荐系统。利用HNSW索引在数百万条目上实现亚秒级查询,支持可配置的召回阈值。
搜索平台工程师
使用PostgreSQL pgvector或托管服务部署生产级相似性搜索基础设施。实现预过滤和重排序管道以提升企业搜索质量。
جرّب هذه الموجهات
我需要存储和搜索文档嵌入。请帮助我设置一个Pinecone向量索引,使用余弦相似度处理1536维嵌入。包含带元数据过滤的upsert和搜索功能。
创建一个混合搜索函数,结合pgvector的向量相似度和关键词匹配。向量搜索权重设为0.7,全文搜索权重设为0.3。包含带HNSW索引的SQL模式。
我有50个向量搜索结果,但需要更好的排名。展示如何使用交叉编码器模型进行重排序。包含sentence-transformers代码,并解释延迟和精度之间的权衡。
我有1000万个向量,需要P99延迟低于100ms且召回率95%。为Qdrant推荐索引类型和参数。解释我的用例的ef_construct、nprobe和量化设置。
أفضل الممارسات
- 从平面索引开始处理小数据集(少于10万个向量),随着数据增长迁移到HNSW
- 在部署近似索引之前,始终在目标延迟下测量召回率
- 使用元数据预过滤以减少向量比较前的搜索空间
تجنب
- 使用近似最近邻索引而不测量召回率下降
- 在内存受限时不进行量化直接存储原始向量
- 查询时不使用预过滤,导致大型集合进行全索引扫描
الأسئلة المتكررة
我应该为项目选择哪个向量数据库?
余弦相似度和点积之间有什么区别?
如何在不牺牲延迟的情况下提高搜索召回率?
插入后可以更新向量吗?
我应该使用什么嵌入维度?
如何处理多语言搜索?
تفاصيل المطور
المؤلف
sickn33الترخيص
MIT
المستودع
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/similarity-search-patternsمرجع
main
بنية الملفات