Flat 索引
精确相似度搜索的黄金标准
工作原理
通过将查询向量与数据集中的每一个向量进行比较,执行精确的(暴力)相似度搜索。
何时使用 Flat 索引
- ✅ 小规模数据集
- ✅ 原型开发和实验
- ✅ 评估基准
- ✅ 100% Recall 不可妥协的场景
最佳实践:在开发和测试阶段先使用 Flat 索引 — 它是你的可靠性基准。验证方案后,再考虑使用近似索引(如 HNSW)获得生产级性能。对于正确性优先于速度的小数据集,使用 Flat 索引。
优势
- ✨ 完美 Recall 保证 — 找到真正的最近邻
- ✨ 零配置 — 简单设置,无需调参
- ✨ 即时索引 — 构建时间几乎为零
局限性
⚠️ 搜索延迟随数据集大小线性增长 — 对于大规模工作负载不可行。