AI 让科研效率提升百倍?我看了 Anthropic 的最新报告后惊了

2026年1月20日

上周读到 Anthropic 发布的一篇科研应用案例(原文见最后),里面提到斯坦福大学的研究团队用 AI 把原本需要数月的基因研究压缩到 20 分钟。我第一反应是:又来吹牛?

但仔细看完麻省理工、斯坦福这些顶尖实验室的具体数据后,我发现这不是 PPT 上的概念,而是已经在真实科研场景中跑通的系统。这些实验室用 Claude 搭建的工具,正在改变科学家的日常工作方式。

以下是三个最有代表性的案例,数据都来自原文的实验验证。

案例 1:Biomni,整合数百个科研工具的万能助手

解决什么问题?生物医学研究者每天要在数百个数据库、软件之间切换,光学习这些工具就要耗费大量时间。真正用来做实验、分析数据的时间反而被压缩了。

具体怎么做?斯坦福大学开发的 Biomni 系统整合了超过 25 个生物学子领域的数百种工具和数据集。研究者用普通英语提需求,AI 自动选择合适工具、设计实验方案、执行分析。

实测数据:

基因组关联研究(GWAS),这是一种寻找与特定疾病或性状相关基因变异的研究方法。传统流程需要:清理数据、控制混杂因素、解读结果,通常耗时数月。Biomni 早期试验中把这个时间压缩到 20 分钟。

但速度快不等于结果准确。团队做了多轮验证:

  • 分子克隆实验设计: AI 生成的方案在盲测中与一位 5 年以上经验的博士后方案完全匹配。
  • 多维数据分析: 分析 30 个人的 450 多个可穿戴设备数据文件,人工需要 3 周,AI 用 35 分钟。
  • 大规模细胞分析: 分析超过 33.6 万个人类胚胎组织细胞的基因活动数据,不仅确认了已知的调控关系,还发现了此前研究者未注意到的新转录因子。

关键机制:

Biomni 不是让 AI 瞎猜,而是可以把专家的方法论编码成“技能包”。比如在罕见病诊断项目中,团队发现 AI 的默认思路和临床医生差异很大,于是他们访谈专家,把诊断步骤逐一记录下来教给 Claude,之后表现就显著提升了。

案例 2:MozzareLLM,让积压的实验数据重见天日

解决什么问题?麻省理工 Cheeseman 实验室使用 CRISPR 技术能快速敲除数千个基因,在数千万个细胞中拍照观察变化。软件可以自动把相似表现的基因归类,但解释这些分组的含义仍然需要人类专家逐个翻阅科学文献。

实验室主任 Cheeseman 能记住约 5000 个基因的功能,但分析一次实验数据仍需数百小时。一次筛选可能产生数百个基因簇,大部分因为没时间而从未被深入研究。

具体怎么做?博士生 Matteo Di Bernardo 开发的 MozzareLLM 系统,完全按照 Cheeseman 的分析思路来工作:识别基因簇共享的生物学过程,标记哪些基因研究充分、哪些研究不足,高亮值得深入跟进的方向,并且提供置信度评级,帮研究者决定是否值得投入更多资源。

实测效果:Cheeseman 的评价最直接:“每次检查 AI 的分析时我都会想,这个我居然没注意到!而且每一个都是我们可以理解和验证的发现。”

Di Bernardo 在构建时测试了多个 AI 模型,Claude 表现明显更好。在一个案例中,它正确识别出了一条 RNA 修饰通路,而其他模型都把这当成随机噪音忽略了。

团队计划将这些 AI 标注过的数据集公开,让其他领域的专家跟进他们实验室没时间深究的发现。比如专门研究线粒体的科学家,可以直接查看线粒体相关的基因簇数据。

案例 3:Lundberg 实验室,从源头改变实验设计

解决什么问题?斯坦福 Lundberg 实验室做的是小规模聚焦筛选,单次成本超过 2 万美元。

因为贵,他们只能选几百个最可能相关的基因来测试。传统做法是团队围坐在 Google 表格前,根据文献、经验、直觉逐个添加候选基因。

具体怎么做?不再依赖“人类已经研究过什么”,而是让 AI 基于分子本身的特性来推荐:

  1. 构建地图: 构建细胞内所有已知分子及其相互关系的完整地图。
  2. 设定目标: 给 Claude 一个目标(比如哪些基因可能影响某个细胞结构)。
  3. 智能导航: 让 AI 在地图上导航,根据蛋白质结合关系、基因编码产物、分子结构相似性等来识别候选基因。

正在进行的验证:为了测试这个方法是否真的更好,他们选了一个研究很少的课题:主纤毛(一种与发育和神经疾病相关的细胞结构)。

实验设计是这样的:先让人类专家用传统方法猜测哪些基因相关,再让 AI 用分子关系图来预测,然后跑全基因组筛选找出真正影响主纤毛的基因,最后对比谁的命中率更高。

三个核心发现

看完这三个案例,我总结了几个共性:

第一,AI 不是替代科学家,而是处理科学家没带宽做的事情。 Cheeseman 实验室那些从未被分析的基因簇数据,不是因为不重要,而是因为人手不够。AI 填补的是这个空缺。

第二,需要“教”AI 专家的思维方式。 Biomni 在罕见病诊断中的经验说明,直接让 AI 发挥往往效果一般,但把专家的分析步骤编码后,表现会显著提升。

第三,模型能力的提升直接影响工具的实用性。 这些实验室都提到,每次 Claude 发布新版本,他们的系统就会变得更好用。两年前 AI 只能写代码、总结论文,现在已经能复制论文里描述的研究工作本身了。

这些案例让我重新思考 AI 在专业领域的价值。

它不是用来写文案、改代码这么简单,而是能把专业工作的时间成本压缩到原来的几十分之一,让那些“想做但没资源做”的工作变得可行。

如果你的工作涉及处理大量专业数据,需要重复应用专家判断,那这个趋势值得认真关注。科研领域的今天,可能就是其他行业的明天。

原文:https://www.anthropic.com/news/accelerating-scientific-research