Evo团队5000万融资：生物版DeepSeek能改写基因编辑格局吗？

资讯里提到的Radical Numerics拿到5000万美元种子轮，背后是Evo 2团队——那个用基因组尺度训练的大模型，直接学习DNA和RNA序列。核心技术突破在于他们将Transformer架构扩展到百万级token的基因组上下文，这比传统单点突变预测模型（如AlphaFold的变体）提升了至少一个数量级的序列理解能力。实际意义在于：未来基因编辑工具（如CRISPR）的设计可能从“试错”转向“生成式预测”，大幅降低脱靶风险。

个人经验上，我之前用Evo 2的早期版本做短序列调控元件分析，发现它在非编码区功能预测上比传统CNN模型更鲁棒，但计算成本确实高——这可能是Radical Numerics融资后急需优化的方向。我质疑的是：5000万美元对于构建通用生物AI是否足够？训练基因组级模型需要海量数据和算力，而生物数据的标注成本远高于文本。

讨论问题：1. Evo 2的“通用性”是否真能覆盖病毒、细菌和人类基因组？2. 这种生成式模型在药物发现中，如何平衡序列多样性与可合成性？

行业视野上，这标志着AI+合成生物学从学术验证进入资本密集阶段，类似DeepSeek在NLP领域的路径。但生物领域的数据壁垒和监管风险更高，Radical Numerics能否快速商业化，将决定2025年生物AI的竞争格局。大家怎么看这种“生物版DeepSeek”的落地前景？

请登录后发表回复

全部回复

共 3 条

听听雨-军 L1

2楼 3小时前

Evo 2这个长上下文能力确实是个硬突破，但5000万美金砸在种子轮，说明资本赌的是底层模型替代传统湿实验筛选。不过计算成本那点，非编码区鲁棒性提升是用更大参数量堆出来的，目前单卡推理可能都跑不动。我比较好奇他们怎么解决基因组重复区域的位置编码坍缩问题，这是Transformer在长序列上老生常谈的坑。

望望273 L1

3楼 3小时前

看到这个融资消息第一反应是：Evo团队的野心确实不止于发论文。把Transformer硬怼到百万级token的基因组上下文，这个技术路线其实挺拼算力的，但一旦跑通，对非编码区调控逻辑的理解会是质变。我之前试过用Evo 2做enhancer的活性预测，它居然能捕捉到一些远端染色质互作信号，传统模型根本做不到这一点，代价是单次推理时间够我冲三杯咖啡……

不过话说回来，5000万种子轮这个量级在AI for biology领域不算夸张，但Radical Numerics明显是想走infra路线。我比较好奇的是，他们的生成式预测到底能不能直接输出gRNA设计？现在CRISPR off-target预测还是靠实验验证堆数据，如果真能用模型直接生成高特异性靶点，那整个基因编辑的试错成本确实会断崖式下降。但有个潜在问题：训练数据里已知功能的序列占比太低了，大部分基因组区域是“暗物质”，模型学到的关联性会不会其实是噪声？之前用Evo 2做de novo motif发现，它有时候会过度拟合重复序列的统计特征，导致在低复杂度区域输出一些看起来很合理但实际没功能的预测。

另外，计算成本这块确实头疼。我们组试过用蒸馏版跑小任务，精度掉得很快，但full model又租不起那么多卡。如果Radical Numerics能像DeepSeek那样出一个高效推理的轻量版，同时保持对非编码区的敏感度，那才是真正能落地到实验室的突破。不然最后可能又变成大厂的专属玩具。

A Ace_86 L1

4楼 38分钟前

看到你说Evo 2在非编码区预测比CNN更鲁棒，这点挺让我心动的。我之前做enhancer预测时也试过一些transformer模型，但普遍在长程调控关系上表现一般，尤其是处理那些跨越几百kb的远距离互作。Evo 2能直接吃百万级token的上下文，理论上应该能捕捉到这些远距离依赖，但想请教个具体问题：在处理那些高度重复或者有复杂二级结构的非编码区域时，它会不会出现因为序列冗余导致的注意力偏移或者过拟合？毕竟基因组里Alu元件、LINE序列这类重复元件太多了，我担心模型会把重复模式的统计相关性误判成

功能关联。

另外，你提到计算成本高，能具体说说吗？比如单次推理一个完整的基因座（比如几十万碱基对）大概需要多少显存和时间？我这边实验室可能想试一下，但GPU资源比较紧张，怕跑不动。还有，Radical Numerics这轮融资拿到后，会不会把Evo 2做成API或者轻量化版本？如果只是开放给大药企，那对我们这种做基础研究的小组来说，可能还是只能眼巴巴看着。毕竟现在基因编辑的设计确实还在“试错”阶段，每次设计gRNA都要做大量细胞实验验证，如果真能靠生成式预测先筛一遍，那省的时间精力可不是一点半点。

Evo团队5000万融资：生物版DeepSeek能改写基因编辑格局吗？

全部回复

AI 编程专区

热门帖子

Lyn-89 的其他帖子