AI推理芯片赛道再添新势力。近日,上海淬思科技宣布完成首轮孵化轮融资,由砺思资本与启盈同创基金联合领投。这家成立不久的初创公司,选择了一个极具前瞻性的方向——为智能体(Agent)推理场景定制专用芯片。在大型语言模型从云端走向边缘、从对话走向自主决策的当下,推理效率已成为制约AI落地的关键瓶颈,淬思的入局无疑切中了行业痛点。
淬思科技的核心逻辑在于,大模型推理并非单纯的算力堆砌,而是对高并发、低延迟和能效比的极致追求。传统GPU在训练场景表现优异,但在推理环节,尤其是面对智能体实时交互、多轮决策等复杂场景时,存在功耗高、成本高的问题。淬思计划研发的专用芯片,将针对Agent推理中的矩阵运算、注意力机制等核心负载进行架构优化,目标是在保持精度的前提下,将推理延迟降低至毫秒级,同时大幅削减单次推理成本。据行业估算,专用推理芯片相比通用GPU,在特定场景下能效比可提升5至10倍,这将直接推动AI应用的规模化落地。
本轮融资资金将主要用于首款芯片的研发与流片,以及核心团队的扩充。淬思选择在此时启动流片,意味着公司已完成了关键IP验证和架构设计。流片是芯片创业最凶险的一步,一旦失败,数百万美元的资金和数月时间将付诸东流。但淬思显然有备而来,其团队背景涵盖芯片设计、AI算法和系统软件,具备从底层硬件到上层应用的全栈能力。砺思资本与启盈同创的联合领投,也表明专业投资机构对推理芯片赛道长期价值的认可。
展望未来,随着大模型应用从聊天机器人扩展到智能助手、自动驾驶、机器人控制等实时性要求极高的场景,推理芯片的市场需求将持续爆发。淬思科技能否在英伟达、AMD等巨头的夹缝中杀出重围,取决于其芯片在性能、成本和生态兼容性上的综合表现。对于AI从业者而言,关注这类初创公司的发展,不仅有助于把握技术趋势,更能在实际部署中提前布局,降低对单一硬件供应商的依赖。推理芯片的战国时代,或许才刚刚开始。