{
title: "前Anthropic核心团队离职创业,打造自主实验AI系统",
summary: "四位来自Anthropic、DeepMind等顶尖AI实验室的研究员离职创办新公司,推出名为autoresearch的AI系统。该系统能自主完成实验假设提出、代码编写、算力调度、结果评估等完整研发流程,旨在让科学家实现'Vibe Research'——只需提供想法,AI自动执行并迭代实验。初期测试中,系统在多个基准任务上达到了与人类研究员相当的实验效率,将单次实验周期从数天缩短至数小时。",
content: "当大部分AI研究者还在为如何让大模型写更长的代码而苦恼时,一群来自Anthropic、DeepMind等顶尖实验室的资深研究员已经选择了一条更激进的道路——让AI自己跑实验。他们从这些知名机构集体离职,创立了一家新公司,核心产品是一个名为autoresearch的AI系统,目标直指科研自动化的终极形态:科学家只需提供灵感,AI负责从实验设计到结果分析的全流程。

这个项目的起点颇为个人化。在Anthropic时,研究员Harsh Mehta独自启动了一个内部项目,最初的功能仅仅是让AI能自动完成AI研发中的一些重复性环节。没想到这个名为autoresearch的小工具迅速在公司内部引起了关注,因为它展示了一种全新的可能:AI不仅会写代码,还能自主提出实验假设、调度算力资源、运行评估脚本,并根据结果决定下一步的调整方向。随着几位志同道合的同事加入,这个内部项目逐渐演变成了一个完整的系统。

从技术层面看,autoresearch的核心突破在于将AI研发的闭环流程完全自动化。传统模式下,研究员需要手动设计实验、编写代码、等待训练完成、分析结果,然后重复这一过程。而autoresearch则将这些步骤整合为一个自主循环:系统接收一个高层目标后,会自动分解为子任务,调用合适的模型和算力资源执行实验,最后生成包含关键指标和下一步建议的报告。据团队透露,在内部测试中,该系统在超参数调优、模型架构搜索等常见任务上,已经达到了与中级研究员相当的效率,将典型的单次实验周期从数天压缩到数小时。

这一进展对AI行业的影响是深远的。一方面,它可能大幅降低AI研发的门槛,让更多科学家无需掌握复杂的工程细节就能进行实验;另一方面,它也引发了关于科研角色转变的讨论。团队提出的Vibe Research概念,暗示着未来科学家的工作重心将从执行实验转向定义问题和解读结果。当然,目前该系统仍处于早期阶段,在需要高度创造性和跨领域知识的复杂任务上还有局限,但它已经展示了一条通往更高效科研的清晰路径。对于关注AI前沿的从业者来说,这是一个值得密切跟踪的方向——它可能重新定义我们理解'做研究'这件事的方式。"
}