一个叫Delphi-2M的AI模型横空出世,在科学界炸开了锅。
这玩意儿能预测一个人未来可能得的1000多种病,有时候甚至能提前几十年打招呼。相关的研究成果,2025年9月17日发表在了顶尖期刊《自然》上。
这不是科幻。
拆解一台未来的健康预测机
这台“预测机”的背后,是一群来自欧洲分子生物学实验室(EMBL)、德国癌症研究中心(DKFZ)和哥本哈根大学的顶尖科学家。
他们干了件很有想象力的事。
他们把AI聊天『机器人』️ChatGPT背后的技术,也就是生成式预训练转换器(GPT,Generative Pre-trained Transformer)架构,给“魔改”了一下,让它从一个语言天才,变成了一个精通人体疾病发展规律的医学预言家。
语言模型处理的是单词和句子,这个Delphi-2M处理的是诊断、症状和医疗事件。在它眼里,人的一生就是一篇待写的文章,而各种疾病就是文章里可能出现的词汇和段落。
具体的改造细节有点硬核,但非常关键。
GPT模型里有个叫“位置编码”的东西,用来告诉模型一个词在句子里的位置。但人生不是一页页的书,而是一条连续不断的时间线。所以,研究人员用代表连续年龄的数学函数,替换掉了原来的位置编码。这样一来,模型就能理解一个医疗事件发生在35岁和发生在65岁是完全不同的概念。
他们给模型加了第二个“输出头”。原来的语言模型只会预测下一个词是什么,但改造后的Delphi-2M不仅能预测下一个医疗事件是什么病,还能预测这个病大概多久之后会发生。
他们修改了模型的“注意力掩码”。这保证了模型在做预测时,绝对不会“偷看”未来的信息,它只能根据一个人的过去病史来推断未来。
通过这些改造,Delphi-2M学会了读懂医疗数据这种特殊的“语言”,理解了各种疾病之间盘根错节的联系,以及生活方式这些变量是如何影响故事走向的。
这个模型到底有多大?研究团队发现,对于他们使用的数据集,200万参数左右的规模效果最好。最终确定的一个版本,拥有12层结构,12个注意力头,总参数量是220万个。
所以它叫Delphi-2M,“2M”就是200万参数的意思。
用几十万人的生命历程当教材
要训练出这么一个模型,得有足够分量的教材。
这次的主教材是英国生物银行(UK Biobank),这是目前世界上规模最大、信息最详尽的生物医学数据库之一。里面有大约50万英国中年人的各种表型和健康信息。
研究团队把这些数据分成了几份:
超过40万人的数据用作训练集,让模型去学习疾病发展的普遍规律。
另外10万人的数据用作验证集,用来调试和优化模型。
最后,用将近48万名参与者在两年内的后续记录作为纵向测试集,看看模型的预测到底准不准。
这还不够。
为了证明模型不是只能“看懂”英国人的健康故事,团队还找来了一份覆盖193万丹麦国民、时间跨度长达40年的丹麦疾病登记数据进行外部验证。
结果证明,Delphi-2M在不同的医疗系统和人群中都表现出了很好的泛化能力。
它到底能干什么?
Delphi-2M最厉害的地方,在于它能一口气同时预测1000多种疾病的风险。
具体来说,是1258种不同的疾病(根据国际疾病分类编码ICD-10)外加死亡风险。
它进行预测的依据,包括一个人的过往病史、年龄、性别,以及一些基本的生活方式信息,比如体重指数、抽不抽烟、喝不喝酒。
它给出的不是一个“你一定会得某某病”的死板结论,而是一个随时间变化的风险概率,有点像天气预报说明天有70%的概率下雨。
以前的疾病预测模型,大多是“单线程”的,比如著名的Qrisk模型,专门用来算未来十年得心脏病或中风的风险。这种模型一次只能处理一种病。
Delphi-2M则是“多线程”的,它能把所有疾病放在一个大盘子里通盘考虑,时间跨度最长可以拉到20年。
德国慕尼黑路德维希马克си米利安大学的计算机科学家斯特凡·福伊里格尔(Stefan Feuerriegel)评价说:这个工具一次性建模多种疾病的能力是“惊人的”,它可以生成整个未来的健康轨迹。
根据团队的评估,在五年内的疾病预测上,Delphi-2M的平均准确性指标(AUC)达到了0.76。虽然随着预测时间的拉长,准确率会慢慢下降,但即便在十年这个时间点上,它依然保持着相当高的预测能力。
对于大多数疾病,它的预测准确性跟现有的单一疾病模型比起来,要么不相上下,要么更胜一筹。
它最让人惊艳的特性,是它的“生成”能力。
你可以给模型提供一段某个人到目前为止的健康记录,就像给AI一个开头,然后它就能顺着这个开头,“续写”出一段未来20年可能的健康轨迹。
它会一次次地采样,生成下一个最可能发生的医疗事件,以及距离这个事件发生的时间。通过反复迭代,就能描绘出一幅完整的未来健康蓝图。
这种能力意义重大。比如,研究人员可以利用它生成大量统计上真实、但不涉及任何真实患者隐私的合成健康数据。这些“假数据”可以用来训练其他AI模型,极大地解决了医疗领域的数据隐私难题。
挑战与未来之路
当然,Delphi-2M并非完美。
研究团队坦诚,模型在学习数据的过程中,也把数据里潜藏的偏见学了进来。比如,如果历史数据显示某个群体因为社会经济原因更难获得及时的医疗服务,那么模型在预测时就可能反映出这种不平等。
如何消除这些数据偏见,确保模型的公平性,是未来必须解决的问题。
同时,隐私保护是悬在头顶的达摩克利斯之剑。研究人员强调,他们自始至终使用的都是匿名的患者数据,并且严格遵守相关的隐私法规。
最重要的一点是,研究团队反复申明,Delphi-2M目前还只是一个研究工具,远没有成熟到可以用于临床实践的程度。它应该是医生的助手,而不是替代品。
下面这个表格可以清晰地看出Delphi-2M与传统模型的区别:
德国癌症研究中心的莫里茨·格斯通(Moritz Gerstung)教授说:“这是理解人类健康和疾病进展新方式的开始。像我们这样的生成模型,有一天可能有助于个性化护理和预测医疗需求。”
未来,团队计划给模型“喂”更多的数据,比如基因组学、蛋白质组学这些更深层次的生命信息,把它变得更强大。他们也希望能将模型与可穿戴健康设备结合,实现实时的健康监测和风险预警。
欧洲分子生物学实验室的伊万·伯尼(Ewan Birney)描绘了这样一个场景:“你走进医生的诊所,医生很自然地使用这些工具,然后告诉你,‘这是你未来四个主要的健康风险,这里有两件事,如果你做了,就能真正改变这个局面。’”
Delphi-2M的出现,代表着AI在医疗领域的一次范式转移。它让我们看到,AI不仅能诊断已有的病,还能预见未发的病。它不再是简单地回答“会不会生病”,而是尝试描绘出“人的一生会如何生病”。
如果AI能提前告诉你未来的健康风险,你愿意知道吗?
参考文献:
https://www.nature.com/articles/s41586-025-09529-3
https://github.com/gerstung-lab/Delphi
https://www.nature.com/articles/d41586-025-03026-3
https://www.nature.com/articles/s41586-018-0579-z
https://www.ukbiobank.ac.uk/about-our-data
https://www.nature.com/articles/d41586-025-02993-x
https://www.scientificamerican.com/article/new-ai-tool-predicts-which-of-1-000-diseases-someone-may-develop-in-20-years
END