Question 1

我应该为项目选择哪个向量数据库？

Accepted Answer

对于快速原型，使用Pinecone（托管服务，无需基础设施）。对于PostgreSQL项目，pgvector增加最小复杂度。对于高性能需求，Qdrant或Weaviate提供高级功能。考虑数据大小、查询延迟要求和现有基础设施。

Question 2

余弦相似度和点积之间有什么区别？

Accepted Answer

余弦相似度仅测量角度（忽略幅度），非常适合归一化嵌入。点积包含幅度效应。对于大多数嵌入模型（OpenAI、Sentence Transformers），余弦相似度是标准选择。

Question 3

如何在不牺牲延迟的情况下提高搜索召回率？

Accepted Answer

逐步增加索引参数（HNSW的ef_search，IVF的nprobe），同时测量P99延迟。使用重排序在高召回率检索后恢复精度。考虑两阶段检索：快速近似搜索，然后对top-K结果进行精确重排序。

Question 4

插入后可以更新向量吗？

Accepted Answer

是的，所有支持的向量数据库都支持upsert操作。使用相同ID重新插入向量会就地更新它。请注意，频繁更新可能需要重建索引以获得最佳性能。

Question 5

我应该使用什么嵌入维度？

Accepted Answer

使用嵌入模型的原生维度（例如，text-embedding-ada-002为1536维，all-MiniLM-L6-v2为384维）。更高维度捕获更多细节但增加存储和计算。将索引度量与嵌入模型的训练目标相匹配。

Question 6

如何处理多语言搜索？

Accepted Answer

使用多语言嵌入模型，如multilingual-e5或LaBSE，它们将不同语言映射到同一向量空间。如果嵌入模型支持，不同语言的查询和文档仍能检索到相关结果。

similarity-search-patterns

测试它