Exa这轮2.5亿美元C轮融资,a16z领投,估值冲到22亿,核心数据是客户查询量从1亿飙到10亿次,一年十倍增长。这个增速确实吓人,但更值得关注的是他们的技术栈:自建爬虫、索引系统、embedding模型、向量数据库,再加上H200 GPU集群。这实际上是在构建一套面向Agent的搜索基础设施,而不是传统意义上的搜索引擎。

我的个人经验是,目前大多数AI搜索产品(包括Perplexity、Glean)都还停留在“增强检索”阶段,而Exa的差异化在于Deep Max在Google DeepMind的DeepSearchQA基准测试中达到SOTA,这直接对标的是Agent时代对深度、实时、结构化数据的需求。他们的产品线覆盖200毫秒到数分钟级的大规模采集,说明在延迟-精度权衡上做了分层设计。

但我也有些质疑:22亿估值是否合理?虽然查询量增长了10倍,但企业客户只有5000家,开发者40万,这个转化率其实不高。而且自建爬虫和索引系统意味着极高的基础设施成本,H200集群的TCO压力不小。

讨论点:1)Agent搜索与传统搜索的核心技术差异到底在哪里?是检索策略(比如RAG的优化),还是索引结构本身的变革?2)Exa是否会成为LangChain、LlamaIndex这类框架的竞品,还是更偏向底层数据层?

行业视野上,我认为这标志着AI搜索正从“问答引擎”向“Agent数据管道”演进。未来搜索引擎的竞争不再是用户界面,而是API的延迟、召回率、以及对非结构化数据的处理能力。这可能会倒逼Google、Bing重新思考搜索架构,甚至拆分出专门的AI搜索基础设施部门。