一种基于图结构的索引，也是实现低延迟相似度检索的首选方案 — 它以较高的内存占用为代价，提供了业界顶尖的检索速度和召回率。

工作原理

HNSW 构建了一个多层图结构，其中每个节点代表一个向量，节点间的边则根据相似度建立连接。

HNSW Example

层级化的多层布局 🪜
- 上层：结构稀疏且节点较少，充当“高速公路”，用于实现快速的长距离导航。
- 下层：结构稠密且包含更多节点，提供细粒度的局部邻域连接。
搜索过程（从粗粒度到细粒度）🔍
1. 从顶层的入口节点开始。
2. 在当前层，以贪心策略走向距离查询向量更近的邻居节点，直到无法再接近为止。
3. 然后在该位置下降一层，并重复同样的贪心搜索的过程。
4. 在最底层，以更精细的搜索策略执行该过程 (使用候选集列表)，以得到更准确的结果。
为什么 HNSW 既快又准 ⚡ 🎯
- 快：上层结构可以快速跳转到目标区域，无需遍历绝大多数节点。
- 准：底层结构稠密，能对局部邻域进行精细化搜索，从而保证高召回率。

何时使用 HNSW 索引？

最佳实践：HNSW 是我们针对大多数生产环境推荐的首选方案。它在速度、准确性和稳定性之间取得了极佳的平衡。

调参建议：先从默认值开始，然后优先调整 ef 来平衡召回率和延迟。只有在必要时，才增加 ef_construction 或 m 来提升精度 — 这会降低索引构建的速度并增加内存使用。

参数	描述	调参指南
`metric_type`	用于比较向量的相似度度量	根据 Embedding 模型的训练方式选择
`m`	每个节点的最大邻居数 — 构建图过程中为每个节点创建的最大双向连接数量	• 更大的 `m` → ✨ 召回率更高，图连通性更好 ⚠️ 内存占用更多，索引和检索的延迟都会增加
`ef_construction`	构建索引时的候选池大小 — 决定了算法在插入新向量时会考察多少个邻居候选项	• 更大的 `ef_construction` → ✨ 图的质量更好，召回率更高 ⚠️ 索引构建时间更长 (不影响查询速度)
`quantize_type`	向量量化方式默认不开启量化	详见量化

参数	描述	调参指南
`ef`	查询时的候选池大小 — 决定了在图遍历过程中每一步会探索多少个潜在邻居	• 更大的 `ef` → ✨ 召回率更高 ⚠️ 查询延迟也会增加 💡 如果发现 `ef=300` 时搜不到想要的结果，不妨试着调到 `500` 或甚至更高，以此来扩大搜索范围。
`radius`	距离(相似度)阈值，用于范围过滤 — 只有满足该阈值的 documents 才会被返回	示例： • 使用内积 `MetricType.IP` 时，设置 `radius=0.6` 仅保留分数 > 0.6 的结果 ✅ 适用于：想要剔除掉低质量匹配的结果 🚫 不适用于：必须返回全部 top-K 个结果，不关心分数质量
`is_linear`	强制使用暴力线性检索 (不使用配置的索引)	🐌 大数据集下非常慢！ ✅ 仅用于：调试、超小数据集或验证索引准确性
`is_using_refiner`	对头部候选结果启用精排 (重新计算精确的相似度分数) — 在开启了量化的场景下有帮助，能挽回精度损失，提高召回质量	✅ 在启用量化的场景下，如需得到更高精度时开启精排 ⚠️ 注意：因为要重新精确计算分数，所以会增加查询延迟