Flat 索引

概念向量索引

Flat 索引

相似性检索的基线

工作原理

通过将查询向量与数据集中的所有向量逐一比对，实现精确相似性检索 (暴力检索)。

何时使用 Flat 索引

✅ 小规模数据集
✅ 原型设计与实验阶段
✅ 作为评估基准
✅ 对召回率要求 100% 且不可妥协的场景

最佳实践：在开发和测试阶段，建议先使用 Flat 索引 — 把它当作你的正确性基准。一旦方案验证通过，再考虑使用近似索引 (如 HNSW) 来获得生产级别的性能。对于数据量极小 (比如30万条向量的规模) 且正确性优于速度的场景，Flat Index 也是一个完全可行的选择。

优势

✨ 完美 Recall 保证 — 能找到真正的最近邻
✨ 零配置 — 简单设置，无需调参
✨ 即时索引 — 构建时间几乎为零

局限

⚠️ 搜索延迟随数据量大小呈线性增长 — 这意味着它难以支撑大规模的工作负载。

🐛 反馈 Bug

向量索引

用于加速相似度检索的专用数据结构 — 以极小的 Recall 损失换取速度和扩展性的质变。

HNSW 索引

一种基于图结构的索引，也是实现低延迟相似度检索的首选方案 — 它以较高的内存占用为代价，提供了业界顶尖的检索速度和召回率。