Question 1

HNSW 参数的良好起点是什么？

Accepted Answer

从 M=16、efConstruction=100、efSearch=50 开始。这些默认值适用于大多数 100 万以下向量的数据集。只有在针对延迟和召回率目标测量基线性能后才进行调优。

Question 2

量化如何影响搜索质量？

Accepted Answer

INT8 标量量化通常导致 1-3% 的召回率下降，节省 75% 内存。乘积量化可实现 10-20 倍压缩，但可能使召回率下降 5-15%。始终使用您的特定数据集验证召回率影响。

Question 3

什么时候应该使用 IVF 而不是 HNSW？

Accepted Answer

当扩展到超过 1 亿向量或内存严重受限时考虑使用 IVF。对于 1 亿以下的数据集，HNSW 提供更好的召回率和延迟。IVF 需要更多调优，但在极大规模下可以更节省内存。

Question 4

应该多久重新索引一次向量数据库？

Accepted Answer

当召回率下降超过阈值（通常下降 2-5%）、数据分布发生重大变化或扩展基础设施时重新索引。持续监控召回率指标以主动触发重新索引。

Question 5

efConstruction 和 efSearch 之间有什么区别？

Accepted Answer

efConstruction 控制索引构建质量（越高 = 更好的索引，构建越慢）。efSearch 控制查询质量（越高 = 更好的召回率，搜索越慢）。您可以在构建时使用较高的 efConstruction 一次，然后调整 efSearch 以获得延迟 - 召回率权衡。

Question 6

创建索引后可以更改 HNSW 参数吗？

Accepted Answer

efSearch 可以针对每个查询动态更改。但是，M 和 efConstruction 在索引创建时固定。更改这些参数需要使用新参数重新构建索引。

vector-index-tuning

测试它