Nature重磅!首个由AI设计的CRISPR基因编辑器问世,性能超越SpCas9(nature first)

Nature重磅!首个由AI设计的CRISPR基因编辑器问世,性能超越SpCas9(nature first)

自2012年首次被开发为基因编辑工具以来,CRISPR技术被广泛认为是21世纪生命科学领域最具革命性的科学突破之一,因其精准、高效的基因剪切能力而被誉为“上帝的剪刀”,短短8年后,该技术的两位奠基人便斩获了诺贝尔奖。

作为CRISPR技术的核心引擎,CRISPR–Cas系统因其操作简便、编辑精准,迅速成为基因编辑的核心工具,深刻改变了农业育种、生物技术及人类疾病治疗的发展格局。

尽管以SpCas9为代表的CRISPR–Cas系统已在基础研究和临床前开发中取得广泛应用,但其天然形态在非原生环境(如人类细胞)中仍面临诸多挑战,例如活性不足、脱靶效应强、免疫原性高等,严重限制了其进一步临床转化的潜力。传统优化手段如定向进化、结构引导突变等,又受限于进化景观复杂性或对结构信息的依赖,难以突破自然进化的约束。

近年来,人工智能(AI)技术的迅猛发展,特别是生成式模型的兴起,为CRISPR系统的智能化设计提供了全新路径。通过学习海量生物序列中的进化规律,这类模型有望跳脱自然演化的限制,直接生成功能更强、特性更优的新型基因编辑工具,加速推动基因编辑迈向更高维度的创新。

2025年7月30日,AI蛋白质设计公司Profluent在Nature上发表了题为Design of highly functional genome editors by modelling CRISPR–Cas sequences的研究成果。

该研究通过系统挖掘26.2兆碱基的微生物基因组与宏基因组数据,构建了包含超过100万个CRISPR操纵子的CRISPR–CasAtlas数据集,并利用大型语言模型(LMs)对ProGen2模型进行微调,生成了大量具有高多样性与功能潜力的CRISPR–Cas蛋白

值得关注的是,研究团队展示了一种由人工智能从头设计的基因编辑工具——OpenCRISPR-1,并在实验中成功实现了对人类基因组的精准编辑该编辑器在活性、特异性及免疫原性等关键性能指标上均优于或媲美SpCas9,且兼容碱基编辑系统,为CRISPR技术的临床应用开辟了新的方向。

目前,OpenCRISPR-1已完全开源,可免费用于科研与商业用途,有望加速相关领域的技术创新与产业落地。

AI生成高多样性CRISPR–Cas蛋白

研究团队通过系统挖掘26.2兆碱基的微生物基因组和宏基因组,构建了规模庞大的CRISPR–Cas Atlas数据集,涵盖1,246,088个CRISPR操纵子,其多样性显著超过CRISPR CasDB与UniProt等现有数据库。

在70%序列同一性聚类标准下,该数据集中蛋白质簇数量是UniProt的2.7倍,尤其在Cas9与Cas12a等关键蛋白家族上多样性扩展更为显著。

基于该数据集,团队对ProGen2-base语言模型进行微调,成功生成了约400万个CRISPR–Cas蛋白序列。筛选后发现,这些人工序列的整体多样性是天然序列的4.8倍;其中Cas13和Cas12a等天然序列稀缺的家族多样性提升尤为显著,分别为8.4倍和6.2倍。

利用AlphaFold2结构预测工具分析表明,81.65%的生成蛋白平均pLDDT评分高于80,显示出良好的结构可行性,且与天然结构高度相似。

图1. 训练并生成多样化的Cas样蛋白家族

1、高功能性Type II效应蛋白的设计与验证

为了进一步开发Cas9-like基因编辑器,研究人员以CRISPR–Cas Atlas中的238,913个Cas9序列为训练数据,对语言模型进行专向微调,生成了约100万个Cas9类蛋白,其中54.2%被预测为可表达的可行序列(viable),是基础模型的两倍

系统发育分析表明,这些生成蛋白几乎涵盖了94.1%的系统发育多样性,其序列平均与天然蛋白的同一性仅为56.8%,显示出高度创新性。结构预测显示,99.4%的生成蛋白保留了HNH、RuvC及PAM识别等关键结构域,即便部分序列同一性低至30%,仍具备典型Cas9构象。

此外,团队还基于112,212个Type II效应蛋白的crRNA和tracrRNA训练了gRNA预测模型,可生成与天然sgRNA结构相符的指导RNA,并准确预测其与不同Cas9同源体的兼容性

图2. 语言模型生成完整的II型效应系统

2、OpenCRISPR-1展现卓越性能

在HEK293T细胞中,研究人员对209个生成Cas9-like蛋白进行了功能测试,部分蛋白在3个靶位点上的编辑效率等同或优于SpCas9。语言模型生成分数(LM分数)对活性具有良好预测性,在HEK3位点上的AUC达到0.83。

其中,OpenCRISPR-1表现尤为突出,其on-target编辑效率与SpCas9相当,而脱靶编辑下降达95%,且脱靶位点完全为SpCas9的子集,无新增切割模式;在免疫原性方面,OpenCRISPR-1显著低于SpCas9

此外,该蛋白包含REC1与HNH结构域插入,展现出优异的碱基编辑兼容性。与腺嘌呤脱氨酶ABE8.20融合后,在3个靶点实现了35%-60%的A-to-G精准编辑,且无插入/缺失突变(indel)产生。

更进一步,团队设计的sgRNA中,有31条在功能验证中表现优于SpCas9配套的sgRNA,显著增强了系统的编辑效率

图3. 生成Cas样蛋白在人类细胞中发挥基因编辑作用

图4. OpenCRISPR-1在PAM序列、gRNA和碱基编辑中的特性分析

4、在碱基编辑中的应用及拓展研究

除验证OpenCRISPR-1与现有碱基编辑系统的兼容性外,研究团队还利用AI技术开发全新碱基编辑系统,其中包括脱氨酶组件的设计。

研究团队以UniProtKB与BFD数据库中的TadA-like蛋白为基础训练模型,生成了一批腺嘌呤脱氨酶,这些序列与天然脱氨酶的同一性在55%-80%之间,覆盖了已知的工程变体及自然进化序列。

初步筛选发现,部分人工脱氨酶在多个基因位点展现出显著编辑活性。研究人员将最具活性的PF-DEAM-1与PF-DEAM-2分别与SpCas9或OpenCRISPR-1的Nickase版本融合,构建出新型腺嘌呤碱基编辑器。

该编辑器不仅在A-to-G转换效率上可媲美现有ABE8.20系统,且具备更窄的编辑窗口与更少的旁观者编辑,特性类似于早期通过定向进化获得的高保真碱基编辑器

图5. OpenCRISPR-1 的结构分析

本研究展示了人工智能在CRISPR–Cas系统设计中的强大潜力。通过构建超大规模的CRISPR–Cas序列数据集,并结合语言模型生成高多样性蛋白序列,研究团队成功设计出全新基因编辑器OpenCRISPR-1,兼具高活性、低脱靶、低免疫原性和碱基编辑能力。同时,AI辅助设计的脱氨酶也实现了精准有效的编辑功能,进一步拓展了基因编辑工具的设计空间。

这一成果不仅验证了生成式AI在突破自然进化边界方面的可行性,也为CRISPR技术在疾病治疗、农业改良及合成生物学等方向的应用奠定了坚实基础。

随着人工智能在生命科学领域的不断深化,其与生物技术的融合有望催生新一代“智能化”分子工具,不仅推动CRISPR工具的跨越式演进,也将拓展合成生物学与精准治疗的技术边界,进入过去仅靠自然演化难以企及的领域。

参考文献:Ruffolo JA, Nayfach S, Gallagher J, Bhatnagar A, Beazer J, Hussain R, Russ J, Yip J, Hill E, Pacesa M, Meeske AJ, Cameron P, Madani A. Design of highly functional genome editors by modelling CRISPR-Cas sequences. Nature. 2025 Jul 30.

特别声明:[Nature重磅!首个由AI设计的CRISPR基因编辑器问世,性能超越SpCas9(nature first)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

四川重庆等地高温加班到凌晨 酷热挑战持续(四川重庆高铁线路图)

经历了1961年以来最热的7月后,8月初华北南部、黄淮、四川盆地等地依旧高温不断。重庆连续5天最高气温超过40℃,单日高温时间最长达到18小时。从今天开始,全国高温将逐渐减弱并向南移动,北方多地高温会有所缓解,重庆的持续高温也有望中断

四川重庆等地高温加班到凌晨 酷热挑战持续(四川重庆高铁线路图)

张峻豪的逆袭之路:从镁光灯下到书海遨游(张峻豪出现)

三岁,对于许多孩子而言,仍是嬉戏于童年的纯真时光,而张峻豪已踏上了璀璨的舞台。我是大明星的舞台上,他如同小精灵般灵动,以稚嫩却充满力量的表演赢得了观众的喝彩,一跃成为众人瞩目的童星。随后,快乐大本营、央视春…

张峻豪的逆袭之路:从镁光灯下到书海遨游(张峻豪出现)

一站式网络安全等级保护认证证书解决方案(什么是一站式网络营销?)

公开的一些案例更能说明:2023年中国信通院发布过一份网络安全行业白皮书,据报告(中国网络安全产业白皮书2023)显示,约有54%的被调研企业表示“等保整改带来的最大挑战是缺乏专业技术人员和系统梳理能力”,…

一站式网络安全等级保护认证证书解决方案(什么是一站式网络营销?)

普京与美特使谈了3小时说明什么 俄美对话仍在继续(普京与美特使谈至凌晨1点半)

当地时间6日,俄罗斯总统普京在莫斯科会见了美国中东问题特使威特科夫,会谈持续了大约3个小时。俄总统助理乌沙科夫当天表示,此次会谈非常有益且富有建设性,但更具实质性的内容可能要等到威特科夫向特朗普汇报后才会公布

普京与美特使谈了3小时说明什么 俄美对话仍在继续(普京与美特使谈至凌晨1点半)

全新360安全云重磅发布:AI智能体驱动「安全即服务」新未来(360安全云盘是什么意思)

以国家级攻防实战沉淀的安全能力、360安全大脑、360安全大模型为技术底座,360安全云用AI智能体重构安全运营模式,通过标准化、可视化的服务及交付,打造企业级数字化安全与管理的SaaS服务方案。 四大优势…

全新360安全云重磅发布:AI智能体驱动「安全即服务」新未来(360安全云盘是什么意思)