Zvec Logo

Flat 索引

相似性检索的基线

工作原理

通过将查询向量与数据集中的所有向量逐一比对,实现精确相似性检索 (暴力检索)。

何时使用 Flat 索引

  • ✅ 小规模数据集
  • ✅ 原型设计与实验阶段
  • ✅ 作为评估基准
  • ✅ 对召回率要求 100% 且不可妥协的场景

最佳实践:在开发和测试阶段,建议先使用 Flat 索引 — 把它当作你的正确性基准。一旦方案验证通过,再考虑使用近似索引 (如 HNSW) 来获得生产级别的性能。对于数据量极小 (比如30万条向量的规模) 且正确性优于速度的场景,Flat Index 也是一个完全可行的选择。

优势

  1. 完美 Recall 保证 — 能找到真正的最近邻
  2. 零配置 — 简单设置,无需调参
  3. 即时索引 — 构建时间几乎为零

局限

⚠️ 搜索延迟随数据量大小呈线性增长 — 这意味着它难以支撑大规模的工作负载。

目录