Courtesy Wikimedia Commons
基因组革命已经全面展开。
蒙特戈马里·斯莱克金博士
荣休综合生物学教授
加州大学伯克利分校
博士 费尔南多·拉西莫
拉西莫实验室主任
哥本哈根大学综合生物学副教授
摘要我们回顾了通过测序古人类化石获得的基因组数据的研究,特别强调了古代 DNA🧬(aDNA🧬)可以提供的关于人类及其最近亲缘关系物种的人口历史的独特信息。我们集中在最近几年发表的核基因组序列上。在许多情况下,特别是在北极、美洲和欧洲,aDNA🧬 以单独分析现代基因组无法解决的方式揭示了历史的人口模式。古人类的古代 DNA🧬 揭示了早期现代人、尼安德特人和丹尼索瓦人之间复杂的混血历史,并使我们能够解开复杂的自然选择过程。来自 aDNA🧬 研究的信息远未饱和,我们认为未来的 aDNA🧬 序列将继续改变我们对古人类历史的理解。
简介基因组革命已经全面展开。在首次获得人类基因组序列(1, 2)的时候,几乎无法想象在 15 年内,全世界成千上万的人类基因组会被测序,其中许多基因组的覆盖深度非常高(3)。更难以想象的是,从数百个现代人类化石(4-6)、几具尼安德特人化石(7, 8)以及一种此前未知的尼安德特人姐妹群化石(9, 10)中获得了部分或完整的基因组序列(图 1)。其中一些古代基因组的测序深度非常高,其错误率甚至与现代人类高覆盖度序列相当。
图 1:人类古基因组革命。地图展示了过去 6 年中提供完整基因组(实心圆圈)和中高密度 SNP 捕获数据集(空心圆圈,平均覆盖度>1×)的人类遗骸位置。颜色表示每项古代 DNA🧬 研究的发表年份。请注意,此处的地图未包含引用的研究中覆盖度较低的基因组和 SNP 捕获数据集。时间线以对数时间尺度显示遗骸的年代。本图中的参考文献未在正文中提及的为参考文献 69–77。
现代表型组和古代基因组数据的丰富性极大地提高了对群体遗传学家的要求。当只能通过标记位点(主要是血型、同工酶和微卫星)研究相对较少的位点时,粗略的描述性统计量,如杂合度、费希尔的 Fst 以及各种遗传距离,足以描述群体分化的大致模式。这些经典方法最早是由卢卡·卡瓦利-斯福尔扎及其众多合作者提出的。早在 1964 年,卡瓦利-斯福尔扎等人(11)就基于 5 个位点(主要是血型)的 20 个等位基因,绘制了一张包含 15 个人群的系统发育树,并将其叠加在世界地图上,以暗示过去的迁徙路线。他们的地图与后来基于大量数据的研究结果惊人地一致,唯一的不同是毛利人与美洲原住民之间的联系与目前接受的理论不符,即毛利人源自波利尼西亚人(12)。
目前,遗传学家不仅可以阐明人群之间的广泛关系模式,还可以为与考古学和古人类学相关的历史问题提供详细的答案。特定的人群是在何时、何地以及从何来源产生的?哪些人群之间发生了混血,混血又是在何时发生的?考古记录中的明显变化是由于人群替代还是文化创新?过去的文化是否留下了遗传后代?正如我们将讨论的那样,古 DNA🧬(aDNA🧬)分析在回答这些问题方面取得了成功,但也提出了新的问题。重要的是,aDNA🧬 为遗传学研究提供了时间维度,仅凭现代表型基因组是无法获得的,而如今 aDNA🧬 的全部意义才刚刚开始被探索。
污染多年来阻碍人类古代 DNA🧬 广泛测序的一个主要问题是污染。如果遵循标准实验室操作程序,从活体个体的组织样本中提取和测序的遗传物质将主要由该个体的 DNA🧬 片段(即内源性片段)组成。相比之下,由于古代 DNA🧬 极其稀少且片段化,从化石中提取的遗传物质大多为外源性,通常来自环境微生物或处理化石的人类(13)。后一种 DNA🧬 尤其令人头疼,因为现代人类的 DNA🧬 序列与人类化石中的内源性古代 DNA🧬 非常相似,可能会在后续分析中引入偏差。
尽管早期对古核 DNA🧬(aDNA🧬)的研究中,一些研究存在污染问题(14, 15),但在当代研究中已经开发出了许多实验和计算创新方法,以减轻污染的影响。在过去十年中,研究人员开发了两大类方法来校正其 aDNA🧬 样本中的污染,从而使无法使用的序列得以研究。
首先,现在在严格的洁净室条件下提取 aDNA🧬,包括使用紫外线辐射☢️、表面漂白处理和过滤空气系统,以尽量减少化石提取物中外源 DNA🧬 的比例(13)。此外,在构建 DNA🧬 文库时,科学家会在提取时刻存在的分子上加入独特的接头标签(16),以防止在后续测序步骤中意外添加的分子被误认为是内源分子。
其次,在 DNA🧬 被测序之后,可以使用几种生物信息学工具来去除污染读数或将这些读数的比例估计在 DNA🧬 文库中。一种常见的做法是使用线粒体 DNA🧬(mtDNA🧬)来估计污染率,因为线粒体 DNA🧬 比核 DNA🧬 更为丰富,因此其测序覆盖率远高于核 DNA🧬。对于高度不同的群体(例如尼安德特人),可以使用能够区分两个群体的诊断位点,并评估每个位点上存在多少不一致的读数(17, 18)。对于现代人类群体(例如古代欧洲人),可以检查与共识序列不同的读数,或者不包含与 aDNA🧬 一致的分子特征的读数(19, 20)。还有更复杂的污染率估计方法,这些方法使用更大的数据子集,包括性染色体(21, 22)和整个常染色体基因组(7, 23)。 此外,还可以利用片段末端胞嘧啶脱氨基化模式——aDNA🧬 典型的死后化学损伤——来过滤掉不具备这种特征的测序读段,从而排除那些不太可能是古代的样本(24)。
古老型智人概览
对尼安德特人及其近亲的基因组测序和分析堪称革命性进展。首先,关于尼安德特人与现代人之间是否存在通婚的问题,早在 30 多年前由古人类学家提出,现在已得到了令人信服的答案(7, 8)。此外,还发现了一个尼安德特人的姐妹群体,称为丹尼索瓦人,并确定了其与尼安德特人和现代人的关系(9, 10)。
尼安德特人
一张尼安德特人骨架的大约复原图。中间的肋骨和胸骨(包括剑状软骨)以及部分骨盆来自现代人。/ 图片来源:Ryan Schwark,美国自然历史博物馆,维基媒体共享资源
尽管尼安德特人和现代人在欧洲和西亚至少共存了 10000 年,但一直没有广泛接受的考古证据表明尼安德特人和现代人有过互动或杂交。克里恩斯等人(25)发现,从尼安德特人化石中获得的线粒体 DNA🧬 序列不属于所有现代人线粒体 DNA🧬 序列构成的谱系。这一相互单系的模式在后来对尼安德特人线粒体 DNA🧬 的许多研究中得到了确认(17)。虽然线粒体 DNA🧬 树与假设这两组之间没有混血是一致的,但它并不能提供反对这一假设的决定性证据。事实上,即使有大量混血,相互单系的模式也会以显著的概率出现(26)。在首个尼安德特人基因组测序之前,对现代人样本的分析表明,欧洲和西非的基因组中可能存在较高水平的古老人类祖先成分,这些成分可能源自一个分化的人属群体(27)。
尼安德特人的核古 DNA🧬 解决了这一问题,其分析表明,实际的基因混合情况与遗传学家和古人类学家的预期有所不同。格林等人(7)首次公布了来自克罗地亚维迪扎洞穴三名个体骨骼提取物合并数据的尼安德特人基因组草图(约 1.3 倍覆盖),并清楚地表明污染水平低于 1%。非非洲三个人群(法国人、中国人和巴布亚新几内亚人)的个体基因组与尼安德特人基因组的相似度比两个非洲人群(桑人和约鲁巴人)的个体基因组高 4%。这种模式最合理的解释是,尼安德特人和现今非非洲人群的祖先曾在中东地区有过基因交流,而他们的活动范围在此处有所重叠。这一初步结论后来通过使用更多尼安德特人基因组和早期现代人类的基因组的多项后续研究得到了加强(8, 28, 29)。迄今为止,所有测序的尼安德特人基因组都比非洲人群的基因组与非非洲人群的基因组更为相似(8, 30)。
此外,现代非非洲人群体中尼安德特人基因块的识别确认了杂交事件的发生(31, 32)。最后,从西伯利亚乌斯季-伊希姆 4.5 万年前的现代人类化石中获得的基因组包含的尼安德特人片段比现代人类中发现的要长得多(28)。这一观察结果与杂交事件发生在乌斯季-伊希姆个体生活前 7000 至 13000 年一致,因为杂交片段随时间推移会变得越来越短。类似的现象也在 3.7 万年前的现代欧洲人科斯滕基-14 的基因组中被观察到(33)。
将维宁贾纳尼安德人基因组与更多的现代人类基因组进行比较,发现令人惊讶的事实是,东亚人与尼安德特人的遗传相似度略高于欧洲人与尼安德特人的相似度(10, 34)。这一模式与仅从古人类学角度预期的情况相反,因为在东亚没有发现尼安德特人的化石,而在西亚和中亚仅发现少量化石。最近,Vernot 和 Akey(35)否定了欧洲人和东亚人共同祖先只经历了一次混血的假设,认为要么当尼安德特人向东方扩张时还发生了额外的混血,要么欧洲人的尼安德特人信号被与尼安德特人没有混血的现代人类群体的通婚稀释了。
两年前,在西伯利亚中部阿尔泰山区发现的一具尼安德特人化石中获得了非常高的测序覆盖率(52 倍)的基因组(称为“阿尔泰尼安德特人”)。由于提取、扩增和测序 aDNA🧬 片段的方法改进,序列质量与从现代个体获得的高质量基因组相当(10, 36, 37)。普弗等人(8)使用两阶段顺序马尔可夫共祖方法(38),发现阿尔泰尼安德特人的祖先群体在与现代人类分支分化后具有较小的群体规模。此外,由于存在许多长段同源异配区,该个体的近交系数被推断为 1/8,意味着她的父母可能是同父异母或同母异父的兄弟姐妹、伯父/叔父与侄子/侄女、祖父母与孙子女,或者双表兄弟姐妹。
最近,来自罗马尼亚佩什特拉 cu 奥塞洞穴发现的约 37,000 至 42,000 年前的化石的基因组提供了戏剧性的证据,证明早期现代人与尼安德特人之间发生了混血(29)。该基因组包含三个超过 50 cM 的尼安德特人祖先染色体片段,表明其有一个四到六代之前的尼安德特人祖先。其尼安德特人祖先的比例(6% 至 9%)高于任何现有人类基因组。奥塞基因组与现时欧洲人和现时东亚人共享的等位基因数量相同,表明其所属的人群对现时欧洲人的贡献不大。因此,尽管欧洲显然还发生了额外的混血,但参与混血的人群被现代人类人群所取代,而这些现代人类人群并未参与后来的交配事件。
丹尼索瓦人
发现首个丹尼索瓦人化石的丹尼索瓦洞。/ 图片来源:Xenochka, Wikimedia Commons
2010 年,研究人员发表了在西伯利亚中部南端的丹尼索瓦洞发现的一根小指骨的 1.9 倍基因组序列(9)。这根骨头的形态不足以确定它来自现代人、尼安德特人还是其他什么物种。然而,其线粒体 DNA🧬 序列表明,它与现代人-尼安德特人分支的分化大约发生在 100 万年前(39)。但是,当核 DNA🧬 被测序时,情况有所不同:这根骨头代表的群体是尼安德特人的姐妹群,而这个姐妹群是在现代人的祖先与尼安德特人分化之后才与尼安德特人分化的(9)。这一结论通过从同一化石获得的高覆盖度基因组(30 倍)分析(10)以及高覆盖度的阿尔泰尼安德特人基因组(8)得到了确认。丹尼索瓦人是几乎完全基于基因组学特征的古人类群体,因为化石遗存太稀少,无法提供太多形态学信息。
高覆盖度丹尼索瓦人基因组显示的人口下降模式与阿塔尔尼安人基因组相似。然而,丹尼索瓦人与现代人混血的历史不同。丹尼索瓦人血统在美拉尼西亚人和土著澳大利亚人中被发现,而在其他东亚人中的比例较低。尽管丹尼索瓦人仅在西伯利亚的一个洞穴中被发现,但混血模式表明他们曾经拥有更广泛的地理分布范围。这一结论得到了对丹尼索瓦洞中发现的两颗牙齿部分基因组分析的支持(40)。其中一颗牙齿比最初获得核序列的手指骨化石早近 6 万年,这表明要么丹尼索瓦人在这个气候持续严酷的地区持续存在,要么至少两次进入该地区。此外,丹尼索瓦人的遗传多样性高于尼安德特人。在测序的牙齿中,有一颗牙齿与高覆盖度丹尼索瓦人基因组的差异大于西班牙和西伯利亚尼安德特人基因组之间的差异。
比较高覆盖度的丹尼索瓦人和尼安德特人基因组表明,阿尔泰尼安德特人与非洲基因组的相似度略高于丹尼索瓦人。其他证据也表明,丹尼索瓦人可能从另一个古人类群体进行了杂交,可能是直立人,后者与人类、尼安德特人和丹尼索瓦人的共同祖先分道扬镳可能早在 100 万年前(8)。这个古人类群体的杂交很可能解释了异常的线粒体 DNA🧬 谱系:丹尼索瓦人的线粒体 DNA🧬 很可能源自这个古人类群体。
现代人类的 aDNA🧬北极
2009 年左右环北极沿海地区的人口分布(包括原住民和非原住民)。/ 资料来源:Susie Harder,北极理事会,维基媒体共享资源
最早的人类在 4500 年前开始向新世界北极扩张。考古学家将这一扩张分为三大文化:早期 Paleo-Eskimo、晚期 Paleo-Eskimo 和 Thule。Paleo-Eskimo 群体在其地理范围内拥有相似的技术,并持续到大约 1000 年前,随后被 Thule 取代,而 Thule 是当今因纽特人的直接祖先。第一个古代人类基因组是从一个 Paleo-Eskimo 个体中提取的(6)。它提供了早期从西伯利亚迁徙的 Paleo-Eskimo 与后来产生当今美洲原住民的迁徙不同的证据。
近年来,拉格凡等人(41)从北极地区的古代骨骼中获得了 26 个基因组序列,并发现所有 Paleo-Eskimos 在时间和空间上都具有遗传连续性。他们源自东亚移民,并迅速分散到整个美洲北极地区。考古记录中所见的技术创新的传播并未伴随 Paleo-Eskimos 的遗传变化。这一模式表明,Paleo-Eskimos 流动性强且游牧,导致当地群体之间广泛的基因流动。时间上的相对遗传连续性表明,由于高水平的基因流动,总体有效人口规模较大。
拉格万等人(41)还表明,图勒人源自一次来自东西伯利亚的移民浪潮。图勒人取代了 Paleo-Eskimos,两组之间没有检测到基因交流。帕克(42)认为,缺乏基因交流质疑了 Paleo-Eskimos 和图勒人共存长达 200 年的说法。这样的流动性人群很可能彼此相遇,而且他们之间似乎不太可能有足够强大的文化壁垒完全阻止基因交流。
北美洲和南美洲
克洛维斯矛头。/ 图片来源:Tim Evanson,克利夫兰自然历史博物馆,维基媒体共享资源
北美洲和南美洲的原住民源自不同于 Paleo-Eskimos 和 Thule 的早期移民事件(6, 41)。早在 13000 年前,北美洲就已被与 Clovis 技术相关的人群殖民,而北美洲和南美洲的一些遗址表明可能存在更早的居住。这些观察结果与通过白令陆桥从东西伯利亚移民的说法一致,该陆桥在 22000 至 17000 年前高于海平面(41)。在一些早期的美洲遗址中,发现了与当今澳大利亚和美拉尼西亚人更为相似的头骨,这引发了可能存在一个更早的澳大利亚-美拉尼西亚人移民但未能持续的推测(41)。
距今 2.4 万年的西伯利亚中部马尔塔遗址化石序列对于理解美洲原住民的起源非常重要(43)。马尔塔基因组既与现代西欧人有较远的亲缘关系,又与美洲原住民关系密切,但与现代东亚人没有密切的亲缘关系。拉格哈万等人(43)估计,现代美洲原住民的 14%至 38%的血统源自马尔塔人群,这种混血可能发生在美洲原住民的祖先与东亚人分化之后,美洲原住民各群体彼此分化之前。
拉森森等人首次报道了一位美洲原住民的完整基因组序列(44)。这名个体被称为安兹克-1 号,与克洛维斯文化遗物相关,大约生活在 12600 年前。安兹克-1 号的基因序列与当今美洲原住民更为接近,而不是与任何非美洲群体更为接近,因此,属于该个体的群体要么直接祖先于当今美洲原住民群体,要么与他们的直接祖先关系非常密切。拉森森等人还报道,当今北部美洲原住民群体与中美和南美群体之间存在一个深层分支。
后来,拉斯穆森等人获得了距今 8,340 年至 9,200 年的“肯尼韦克人”个体的低覆盖率(约 1×)的基因组序列(45)。这些遗骸是在华盛顿州发现的。它与现居同一地理区域的原住民群体之间存在亲缘关系,表明它是直接祖先群体的一员。因此,虽然早期的美洲原住民迅速分散到北美洲和南美洲,但美国西北部的群体在该地区生活了数千年。
过去一年发表的两项大规模基因组研究进一步阐明了美洲原住民的历史。Raghavan 等人(46)调查了 31 个现有人类和 23 个古代现代人类的基因组,年龄范围从 200 年到 6000 年。他们得出结论,所有美洲原住民在约 2 万年前与他们的祖先分离,上限为 2.3 万年前。在北美,Raghavan 等人(46)推断,包括阿萨巴斯卡人在内的北部美洲原住民在约 1.3 万年前与南部北美原住民以及中美和南美原住民分离。这一分离时间接近美洲最早有据可查的考古遗址,表明这些谱系的分离发生在美洲,而不是在亚洲移民之前。
然而,拉格凡等人(46)也得出结论,并非只有一波移民。相反,美洲原住民近期从东亚人和澳梅拉尼西亚人那里获得了显著的基因流动,可能通过现今阿留申群岛居民的祖先实现。拉格凡等人(46)没有发现任何现当代美洲原住民群体是早期殖民浪潮遗留的证据。他们也没有发现古头骨具有与澳梅拉尼西亚人相似形态的基因证据,表明这些古头骨是早期移民浪潮的结果。
Skoglund 等人(47)分析了一个包含 21 个现代表土美洲人群体 63 名个体的大量 SNP 数据集,得出了与 Raghavan 等人(46)类似但略有不同的结论。Skoglund 等人(47)发现,虽然一些但不是所有土著美洲人群体都包含明显的澳大利亚-美拉尼西亚血统信号,尤其是在某些南美洲人群中更为明显。此外,他们可以否定土著美洲人群体源自单一随机混合群体的假设。相反,作者提出存在一个中间群体,他们称之为群体 Y,与澳大利亚人和美拉尼西亚人关系密切,并在不同程度上贡献于土著美洲人群体。与 Raghavan 等人(46)的不同之处在于,他们认为群体 Y 向美洲的混血发生在殖民早期。Skoglund 等人(47)和 Raghavan 等人(46)的模型都面临一个问题,即解释为什么南美洲土著人群体中澳大利亚-美拉尼西亚血统的信号比北美洲土著人群体更强。
因此,美洲原住民的起源仍然不清楚。他们并非源自一个跨越白令陆桥的全混血种群,确定与澳大利亚和美拉尼西亚的亲缘关系是如何产生、何时产生以及如何产生将需要分析更多的现代和古代基因组。
西欧亚地区
奥茨冰人木乃伊的重建图。/ 图片来源:120,昆松史前博物馆, Wikimedia Commons
西欧的人口远大于美洲,其历史也更为复杂。在过去 5 年里,该地区出土的古代 DNA🧬(aDNA🧬)基因组数量超过了世界上任何其他地区。最早被测序的古代欧洲基因组来自奥茨人,他是 5300 年前发现于阿尔卑斯山脉的木乃伊。凯勒等人(48)和西科拉等人(49)的研究显示,令人惊讶的是,这名个体与今天的撒丁人有密切的遗传联系。此外,一个 5000 年前的斯堪的纳维亚农民的基因组也与撒丁人有密切的遗传联系,而同一地区的同期狩猎采集者却没有这种联系(50)。斯科伦德等人(50)和西科拉等人(49)提出了欧洲起源的双向混合模型,即最初的欧洲狩猎采集者逐渐与 8000 至 6000 年前从近东迁入的早期农民混合。奥茨人和斯堪的纳维亚农民很可能属于这一扩展的人群,而撒丁人基因组中早期农民血统的独特高比例可以解释他们与这些古代基因组的联系。
Raghavan 等人(43)的研究发现表明,存在一个古代北欧亚洲(ANE)人群,与北美原住民和欧洲人有亲缘关系。在相关研究中,Lazaridis 等人(51)从卢森堡的 Loschbour 附近发现的一位古代西欧狩猎采集者和德国斯图加特附近发现的一位古代中欧农民中获得了高覆盖率的基因组,并提出了一种欧洲起源的三成分混合模型。根据这一模型,Loschbour 个体属于最初的欧洲现代人类居民,称为西欧狩猎采集者(WHG)。这一人群的祖先在新石器时代与来自近东的基底欧亚人群混合,产生了被称为早期欧洲农民(EEF)的人群,他们可能将农业带入了该地区。Loschbour 和Ötzi 个体就属于这一人群。之后,来自 Pontic 草原的第三次移民将 ANE 遗传成分带入了该地区。
在过去一年中,欧亚地区古代 DNA🧬(aDNA🧬)基因组的数量从不到十几个激增到了上百个(4, 5, 52)。来自整个基因组测序数据(5)以及单核苷酸捕获数据(4)的见解帮助细化了先前的理论。例如,Haak 等人(4)表明,来自 Pontic 草原的早期青铜时代人群 Yamnaya 含有约 50%的 ANE(古北欧人)血统。Haak 等人认为,可能源自这一源头的人群在 4500 年前通过大规模向西迁移(“绳纹器文化”)将 ANE 血统带入东欧和中欧,因此可能还带来了马匹和印欧语系语言。此外,Allentoft 等人(5)发现,直到 4500 年前生活在俄罗斯阿尔泰山区的 Afanasievo 文化人群与 Yamnaya 人群有密切的遗传亲缘关系,这可以解释为什么印欧语系语言也在中亚地区被使用。
Haak 等人(4)还检测到在 Yamnaya 迁徙进入欧洲之前(距今 6000 年至 5000 年),WHG 的血统出现了一次复兴,并将早期农民的首次近东迁徙定在距今 8000 年至 9000 年。此外,Jones 等人(53)表明,Yamnaya 血统的另一半来自第四个人群来源:“高加索狩猎采集者”(CHG),他们距今约 45000 年从 WHG 分离,距今约 25000 年从 EEF 分离。目前看来,西欧人群是由四个祖先来源(ANE、EEF、WHG、CHG)的混合体组成。然而,考虑到每次新一批化石被测序都会对欧洲历史的理解产生变化,当前的模型很可能很快会被取代。
其他地理区域
来自世界其他地区化石的核基因组序列要少得多。人类遗骸中的线粒体和 Y 染色体序列以及大洋洲共生物种的基因组分析一般确认了考古学家提出的波利尼西亚扩张模型,但目前几乎没有古代核基因组数据(12)。唯一的例外是从 100 年前的毛发样本中获得的原住民澳大利亚人的基因组(21)。对澳大利亚基因组的分析支持了亚洲东部和东南部两次殖民浪潮的假说。根据这一模型,第一次殖民浪潮可能最早发生在 6.2 万至 7.5 万年前。
在中国东部,Fu 等人(54)从北京附近天龙洞的 4 万年前的现代人中获得了部分核序列。尽管这些序列只覆盖了整个基因组的一部分,但足以表明该个体属于现-day 东亚人和美洲原住民的祖先群体,并且已经与现-day 欧洲人的祖先群体分离。
非洲的古 DNA🧬 资料稀缺。研究表明,一些现居非洲人的基因组携带着与未采样的古人类群体混血的痕迹(55, 56)。因此,从非洲化石中获取 DNA🧬 序列数据可能有助于识别这些群体及其进化历史。遗憾的是,该地区的环境条件使得从化石中提取古 DNA🧬 极为困难,因为生物材料在那里会迅速腐烂。
然而,最近加莱戈·洛雷 nte 等人(57)从非洲获得了第一个古代人类基因组。他们从埃塞俄比亚东南部莫塔洞发现的一具 4500 年前的个体中获得了 12.5 倍覆盖度的基因组。作者得出结论,该个体与当今同一地区的居民在基因上相似,表明直到现在都存在基因连续性。将莫塔基因组与其他当今人群进行比较表明,莫塔人群没有像许多当今的次撒哈拉非洲人群那样从欧洲农民那里接受混血(58)。相反,从接近新石器时代狩猎采集者的群体中,有回流到一些非洲人群,主要是东非人群。虽然加莱戈·洛雷 nte 等人(57)最初声称回流影响了所有非洲人群,包括约鲁巴人和姆布蒂人,但他们在网上勘误中撤回了这一说法(59)。
关于正向选择的推断
大量的古代 DNA🧬 数据也使得我们能够推断出人类选择过程的信息。例如,古代 DNA🧬(aDNA🧬)帮助研究人员找到了现代人在与其他古人群分化后被正向选择的位点,这些位点可能有助于现代人全球扩张(7, 8, 60)。此外,aDNA🧬 还允许研究人员发现从古人群流入现代人群的单倍型,并且这些单倍型在现代人群中被正向选择所青睐,这一过程被称为“适应性 introgression”(31, 32, 61-65)。最后,aDNA🧬 帮助我们理解了促使某些人群适应当地环境的近期选择事件。以下,我们将重点介绍欧亚大陆上一些局部选择的例子,因为目前该地区的古代 DNA🧬 数据最为丰富。
在一项研究中,Allentoft 等人(5)发现与乳糖耐受相关的 LCT 基因变异(rs4988235)的频率上升可能非常近期,因为在青铜时代,这种变异的频率较低,可能通过 Pontic 草原移民被引入欧洲。在另一项研究中,Mathieson 等人(52)寻找与现代各人群预期基因组广泛混合比例显著偏差的区域。如果某个区域受到正向或平衡选择的影响,就会出现这样的异常模式。作者检测到几个异常位点,包括 LCT、SLC45A2、SLC24A5、HERC2 和 HLA 区域。然后,他们使用古代基因组来研究这些选择性过程的时间进程。例如,他们发现与浅肤色相关的 SLC24A5 基因的一个变异在早期新石器时代的欧洲频率上升较快,很可能是因为移民的影响。他们还使用 Berg 和 Coop 开发的方法(66)检测到多基因适应的迹象。 具体来说,作者们发现伊比利亚新石器时代人群和草原新石器时代人群分别存在两个独立的选择性进化的信号,分别导致身高增加和减少。
讨论人类历史的大致轮廓与 Cavalli-Sforza 等人(11)基于我们现在认为微不足道的数据所推测的情况相差不大。然而,在拥有丰富古代 DNA🧬(aDNA🧬)的地区,研究人员以前无法察觉的逐渐详细的替代、迁移和通婚模式正在显现。正如 Pickrell 和 Reich(67)所强调的,我们现在知道,当今的人口是由复杂的混合和人口迁移历史形成的。尽管在少数情况下,长时间内的地方遗传连续性已被记录下来,但这些情况是例外。一般规则是,当今人口的祖先生活在其他地方。
古 DNA🧬 使我们能够回答关于古人类与现代人类关系的长期问题。古人群之间以及古人群与现代人类之间的混血似乎只要他们地理上接近就会发生。因此,他们与现代人类群体并无不同。尽管当今人类的大部分血统可以追溯到大约 10 万年前进入欧亚地区的非洲人群,但古 DNA🧬 使我们也能确定哪些部分的基因组来自在现代人类之前占据欧亚地区的古直立人(68):所有非非洲人群的基因组都携带少量尼安德特人的血统,而有些人群还携带了丹尼索瓦人的额外成分。
由于亚洲的古人类记录相对较少,该地区很可能发现更多的尼安德特人和丹尼索瓦人化石。甚至有可能通过古代 DNA🧬 识别出其他已灭绝的人属物种。
近年来,由于古 DNA🧬 研究,近期的过去也变得更加清晰。西欧和美洲的人群经历了各种扩张、人口替代和不同群体之间的混血事件。现代人类的基因组中保留了这些事件的证据。例如,生活在欧洲的人的基因组中包含了至少三个或四个祖先群体的遗传成分。其他谱系显然是遗传上的死胡同,比如古因纽特人和 Oase 个体所属的人群,并且如果不是因为古 DNA🧬 的研究,我们对这些群体与现代人类的关系将一无所知。
当前基因组发现的时代类似于 16 世纪和 17 世纪欧洲人无拘无束的地理大发现时代。几乎每一个古代核基因组都为人类历史提供了新的见解,并开启了新的探索和研究领域。
目前,任何大陆地区尚未出现饱和迹象。温带和北极地区比热带地区提供了更多的古代 DNA🧬 序列,部分原因是这些地区的条件更有利于古代 DNA🧬 的保存,部分原因是这些地区被更密集地采样。然而,随着最近从埃塞俄比亚莫塔洞中提取到的古代基因组,这一局面似乎正在改变。由于热带地区的序列稀缺,来自非洲和大洋洲等地区的每一个古代 DNA🧬 基因组都将非常珍贵且富有揭示性。在未来,更多的此类基因组将为人类进化和人口转变提供新的启示。
参见注释和参考文献
发表于《美国国家科学院院刊》(PNAS)113 卷 23 期