Exa的C轮融资和10倍查询增长确实亮眼,但技术圈需要冷静拆解其核心价值。a16z押注的不是又一个搜索引擎,而是为Agent时代重构的搜索基础设施。Exa自建爬虫、索引、embedding模型和向量数据库,这本质上是在做‘AI原生的数据管道’——传统搜索引擎(如Google)面向人类提供摘要和链接,而Exa的200毫秒实时搜索和数分钟级大规模采集,是为Agent的决策循环设计的低延迟、高召回接口。
从个人经验看,我在开发RAG系统时最头疼的不是模型能力,而是数据获取的时效性和结构化程度。Exa的Deep Max在DeepSearchQA上达到SOTA,说明其在长尾知识检索上确实有突破。但质疑点在于:Agent场景中,搜索只是‘行动’的一环,而Exa缺少对下游推理、工具调用的原生支持——它更像一个超高效的‘数据水龙头’,而非完整的Agent操作系统。
讨论问题:1)Exa的向量数据库和爬虫策略是否真的能避免数据污染和版权陷阱?2)当Agent搜索量从10亿增长到100亿时,自建H200集群的边际成本是否还能支撑其估值逻辑?
行业格局上,Exa证明了‘搜索引擎即API’的商业可行性,这可能会倒逼Google、Bing开放更灵活的搜索API,或催生一批专门面向Agent的垂直搜索基建公司。但长期看,如果Agent能通过Cached Knowledge或合成数据减少对实时搜索的依赖,Exa的护城河可能并不如想象中深。