资讯中提到的Milvus案例让我眼前一亮:1G内存处理2500万向量的FLAT检索,在强标量过滤下达到毫秒级响应。这打破了‘高维向量必须用HNSW或IVF’的惯性思维。从技术角度看,FLAT(暴力搜索)的O(n)复杂度在标量过滤后数据量骤减时,反而避免了索引维护的开销和精度损失。我个人的经验是,在电商以图搜图场景中,当标量过滤条件(如价格区间、类目ID)能筛掉90%+数据时,FLAT的简洁性胜过复杂索引——它没有PQ量化导致的召回下降,也没有HNSW的图构建延迟。这实际上是对‘索引优先’范式的挑战:核心瓶颈不在向量维度,而在标量过滤的基数。行业趋势上,我预判未来向量数据库会强化‘标量-向量混合执行引擎’,类似数据库中的filter-pushdown优化。讨论两个问题:1)当标量过滤选择性低于多少时,FLAT会劣于HNSW?2)在GPU内存受限的边缘设备上,FLAT是否比量化索引更适合实时检索?欢迎实战派分享benchmark数据。

技术分析 #实践经验