资讯里提到的Radical Numerics拿到5000万美元种子轮,背后是Evo 2团队——那个用基因组尺度训练的大模型,直接学习DNA和RNA序列。核心技术突破在于他们将Transformer架构扩展到百万级token的基因组上下文,这比传统单点突变预测模型(如AlphaFold的变体)提升了至少一个数量级的序列理解能力。实际意义在于:未来基因编辑工具(如CRISPR)的设计可能从“试错”转向“生成式预测”,大幅降低脱靶风险。
个人经验上,我之前用Evo 2的早期版本做短序列调控元件分析,发现它在非编码区功能预测上比传统CNN模型更鲁棒,但计算成本确实高——这可能是Radical Numerics融资后急需优化的方向。我质疑的是:5000万美元对于构建通用生物AI是否足够?训练基因组级模型需要海量数据和算力,而生物数据的标注成本远高于文本。
讨论问题:1. Evo 2的“通用性”是否真能覆盖病毒、细菌和人类基因组?2. 这种生成式模型在药物发现中,如何平衡序列多样性与可合成性?
行业视野上,这标志着AI+合成生物学从学术验证进入资本密集阶段,类似DeepSeek在NLP领域的路径。但生物领域的数据壁垒和监管风险更高,Radical Numerics能否快速商业化,将决定2025年生物AI的竞争格局。大家怎么看这种“生物版DeepSeek”的落地前景?