Flat 索引
相似性检索的基线
工作原理
通过将查询向量与数据集中的所有向量逐一比对,实现精确相似性检索 (暴力检索)。
何时使用 Flat 索引
- ✅ 小规模数据集
- ✅ 原型设计与实验阶段
- ✅ 作为评估基准
- ✅ 对召回率要求 100% 且不可妥协的场景
最佳实践:在开发和测试阶段,建议先使用 Flat 索引 — 把它当作你的正确性基准。一旦方案验证通过,再考虑使用近似索引 (如 HNSW) 来获得生产级别的性能。对于数据量极小 (比如30万条向量的规模) 且正确性优于速度的场景,Flat Index 也是一个完全可行的选择。
优势
- ✨ 完美 Recall 保证 — 能找到真正的最近邻
- ✨ 零配置 — 简单设置,无需调参
- ✨ 即时索引 — 构建时间几乎为零
局限
⚠️ 搜索延迟随数据量大小呈线性增长 — 这意味着它难以支撑大规模的工作负载。