Question 1

HNSW 和 IVF 索引有什么区别？

Accepted Answer

HNSW（分层可导航小世界）提供更快的查询速度但内存使用量更高。IVF（倒排文件）使用更少内存但查询速度较慢。实时应用使用 HNSW，成本敏感的大规模部署使用 IVF。

Question 2

如何选择嵌入维度？

Accepted Answer

更高的维度（1536）可以捕获更多语义细节，但会增加存储和延迟。大多数用例从 384-768 维度开始。仅在存在复杂语义关系和充足基础设施预算时使用 1536。

Question 3

元数据过滤应该使用预过滤还是后过滤？

Accepted Answer

预过滤可以缩小搜索空间并提高性能，但可能会遗漏相关结果。后过滤确保召回率但会在过滤结果上浪费计算。对严格约束使用预过滤，对软偏好使用后过滤。

Question 4

应该使用哪个向量数据库？

Accepted Answer

Pinecone 用于托管简化，Weaviate 用于混合搜索功能，Qdrant 用于性能和过滤，如果您已经使用 PostgreSQL 则使用 pgvector。根据您的团队专业知识和基础设施偏好进行选择。

Question 5

如何处理嵌入漂移？

Accepted Answer

当您的数据分布随时间变化时，会发生嵌入漂移。每月监控搜索质量指标，并为关键应用安排每季度重新嵌入。在完整迁移之前使用 A/B 测试比较新旧嵌入。

Question 6

我可以使用此技能直接查询向量数据库吗？

Accepted Answer

不可以，此技能为向量数据库架构和优化提供指导及代码生成。它不执行查询或直接连接到您的数据库。您必须在应用程序中实现建议的代码。

vector-database-engineer

测试它