看到Exa这轮融资和增长数据,我的第一反应不是兴奋而是警惕。一年从1亿到10亿查询量,表面光鲜,但作为做过Agent搜索落地的工程师,我想聊聊这背后的工程现实。
首先,Exa自建爬虫、embedding模型和向量数据库,加上H200集群,这套全栈基建听起来很硬核,但实际维护成本极高。我团队曾尝试类似方案,结果发现索引更新延迟和一致性问题是最大瓶颈——当你的Agent依赖实时搜索结果做决策,200毫秒响应时间背后是缓存命中率和索引分片的精细调优,稍有不慎就会导致Agent幻觉。Exa的Deep Max在DeepSearchQA上刷了SOTA,但基准测试和真实业务场景的差距,懂的人都懂。
个人经验:Agent搜索的核心不是速度,而是上下文理解和结果可信度。Exa服务5000家企业,但有多少是真的把搜索当核心引擎,而不是当演示玩具?我怀疑很多客户只是图方便,一旦遇到复杂多跳查询,Exa的embedding模型可能还不如你针对特定领域微调过的开源模型。
问题抛给大家: 1. 你们在实际Agent项目中,是更依赖通用搜索API,还是自建索引?自建的话,如何解决索引延迟和存储成本的平衡? 2. Exa这种“为AI而生”的搜索引擎,和传统搜索引擎(如Google/Bing API)在Agent场景下,到底谁更靠谱?我测过几次,Exa在长尾查询上的召回率并不占优。
最后说说行业影响:a16z砸重金,说明资本在押注“搜索即服务”会成为Agent时代的标配基础设施。但我不认为这是赢家通吃的赛道。随着MCP(模型上下文协议)等标准化协议兴起,未来Agent搜索更可能走向模块化编排,而不是被单一供应商锁定。Exa现在风光,但别忘了传统搜索巨头随时可能入场。