一项发表于 《自然》 杂志的大规模古DNA研究,通过对近16,000名古代和现代个体的基因组分析,揭示了过去一万年间自然选择在人类进化中比以往认为的更为活跃。研究者利用新开发的统计方法,在西欧亚人群中识别出479个在时间进程中显著上升或下降的基因变异,其中许多与肤色、免疫、代谢及神经精神疾病风险等现代性状相关联。这一发现挑战了“农业出现后人类选择压力减弱”的传统观点,并展示了古DNA作为研究进化“实时显微镜”的强大潜力。
研究背景:为何过去难以探测到选择痕迹
已知案例稀少
长期以来,明确的人类定向选择案例仅有约21个(如乳糖酶持续性、抗疟疾G6PD缺乏症、浅肤色相关变异等)。由于样本量和统计能力的限制,学界曾普遍认为在智人走出非洲后的约30万年里,自然选择在人类进化中只发挥了次要作用。
古DNA的革命与瓶颈
自2010年首个古人类基因组发表以来,古DNA领域已能重建人群迁徙和混合历史。然而,即使在保存较好的近1万年样本中,精确检测定向选择仍面临困难:
-
混杂因素:基因频率变化可能源于人群迁徙(新群体进入)、随机漂变(小群体效应)或自然选择本身,区分三者需要足够的时间分辨率和样本量。
-
信号微弱:选择对频率的影响往往是微小的(每年1-5%的变化率),需要大量时间点样本才能从噪声中提取信号。
研究方法:大规模数据与新型计算工具
数据库构建(历时7年)
-
古代样本:新产生10,016个西欧亚古人类基因组数据 + 整合已发表的5,820个古基因组 → 总15,836个古基因组(本文使已发表的古人类DNA文献总量翻倍)。
-
现代样本:6,438个现代人基因组(用于辅助推算古代等位基因频率)。
-
地理范围:西欧亚(现代欧洲及中东部分地区),时间跨度约1万年(新石器时代至现代)。
核心算法:区分选择与混杂
第一作者 Ali Akbari 开发了一套计算流程:
-
检测异常频率轨迹:识别出在特定时间段内频率变化显著偏离随机漂变和迁徙模型预期的基因位点。
-
排除迁徙假阳性:通过共祖分析,区分“因外来移民引入而升高”和“因本群体内选择升高”的变异。
-
估计选择系数:量化每个变异被选择的强度。
核心发现:选择无处不在且近期加速
选择信号的规模
-
识别出479个全基因组显著(校正后p值显著)的“定向选择”位点(其中有81个是之前未报道的新发现)。
-
效应量小但累积重要:研究者估计,定向选择仅能解释观察到的约2% 的遗传变异频率变化。但即使这个比例,乘以有效群体大小(约10,000代),也代表成千上万个别案件在历史上发生。
选择最强的变异类别
通过将识别出的变异与现有GWAS数据库比对,发现约60% 的受选择变异与至少一项现代性状显著相关。代表性案例如下:
免疫相关
-
抗HIV感染(*CCR5-Δ32*):频率在特定时期上升。
-
抗麻风病:某些主要组织相容性复合体等位基因频率上升。
-
结核病易感性:某些变异频率随时间下降(降低风险)或上升(在某些群体中可能受平衡选择)。
皮肤/毛发色素
-
浅肤色相关(如 SLC24A5, SLC45A2):在新石器时代以来持续上升。
-
红发相关(MC1R 某些变异):上升。
代谢与自身免疫
-
乳糜泻风险(*HLA-DQA1/DQB1* 特定单倍型):在农业普及后频率上升(尽管增加疾病风险,但因其他免疫益处被选择)。
-
克罗恩病风险:某些风险等位基因上升,另一些下降。
-
2型糖尿病风险:特定风险变异上升(提示可能曾提供生存优势,如能量储存效率更高)。
精神与神经
-
精神分裂症风险降低:某些保护性变异频率上升。
-
双相情感障碍风险降低:类似趋势。
-
男性型秃发风险降低:某些“防秃”等位基因上升。
复杂性状与“健康跨度”
-
与教育程度、智力测试分数相关的多基因评分增加(需谨慎解读,见下文)。
-
步行速度(健康衰老指标)相关评分增加。
-
体脂率、腰臀比、身体质量指数(BMI)降低:与代谢健康相关的体型特征评分增加。
时间动态:选则的节奏
-
农业转型是关键转折点:选择信号在新石器时代中期(约8000年前) 显著增多。新生活方式(如与家畜接触带来新传染病、谷物为主的饮食、更高人口密度)施加了大规模的新选择压力。
-
局部上升后下降:某些变异在某一时期上升后,随着环境变化(如青铜时代人群迁徙带来新的免疫环境)又下降。例如,某些与多发性硬化症风险相关的基因变异(已知与颜那亚草原人群迁徙史相关)显示了这种动态。
谨慎解读:现代性状标签不能直接套用于古代
研究者强调,将现代性状标签(如“教育程度”、“收入”)归于古代选择时,必须极为谨慎:
-
性状不存在于古代:古代社会不存在标准化考试、工资单或正式学校教育。与“教育程度”相关的基因变异可能在古代通过影响认知灵活性、延迟满足或社会学习能力而提供优势,而非通过提高考试分数。
-
多效性与连锁不平衡:一个变异可能同时影响多个性状(如免疫和神经发育),其上升可能由未知的“真正优势”驱动,而非我们当前测量的标签性状。
-
文化共进化:某些变异可能通过基因-文化协同进化而上升(例如,乳糖酶持续性是因为乳业畜牧文化的出现而成为优势,而非乳糖酶本身直接提升生存率)。
意义与展望
对进化生物学
-
确立了古DNA是研究近期人类进化的“实时记录仪”,可补充基于现代基因组推断过去选择的方法(如基于单倍型纯度的各种检验)。
-
强调选择的强度和时间动态比以往模型预测的更高,提示人类仍在快速演化中。
对生物医学
-
疾病易感性的“进化解释”:为何某些致病等位基因频率如此之高?部分答案可能是它们在其他环境中曾提供保护(如精神分裂症风险基因可能与创造力或社会认知有关?本研究未直接测试)。
-
基因治疗的警示:如果试图敲除某个在进化中强烈选择的基因,需谨慎评估该基因未知的多效性保护作用。
-
复杂性状模型的改进:纳入选择历史信息,可能提高多基因风险评分的跨人群可移植性。
未来方向
-
将该方法应用于东亚、南亚、非洲、美洲原住民等其他人群——选择信号可能既有共享(如对农业的适应),也有地区特异。
-
超越1万年:目前数据限制在DNA保存较好的近期;未来开发适用于更老样本(10-30万年前)的技术,可研究智人早期演化中的选择。
-
功能验证:对479个位点中的“孤儿”无注释变异进行实验(如基因敲入小鼠模型),揭示其真正的表型。
研究局限性
-
地理范围局限于西欧亚:结论不能直接推广到全球所有人群。
-
信号微弱效应:即使经过严格校正,仍有假阴性(遗漏真实选择)和假阳性(将漂变误判为选择)的可能。作者保守地仅报告了超过50%概率的位点(约7600个额外候选者需进一步验证)。
-
现代性状关联依赖现有数据库(如UK Biobank),这些数据库主要针对欧洲裔、中老年人群,可能遗漏与其他性状(如生育力、儿童存活率)更密切相关的变异。
关键信息速览
| 项目 | 内容 |
|---|---|
| 研究对象 | 近16,000个基因组(~10,000古DNA + ~6,000现代) |
| 地理范围 | 西欧亚(欧洲+中东) |
| 时间跨度 | 约10,000年(新石器时代至今) |
| 核心发现 | 识别出479个显著选择的变异(部分与肤色、免疫、代谢、精神疾病风险相关) |
| 选择活跃期 | 农业出现之后急剧增多 |
| 与现代性状关联 | 约2%的变异频率变化由选择驱动;60%的选择变异与至少一个现代复杂性状相关(需谨慎解读) |
| 方法创新 | 区分选择与迁徙/漂变的新型统计算法 |
| 主要局限 | 地理范围有限;现代性状标签不能直接映射至古代 |
| 数据可用性 | 所有原始数据和新方法已公开 |
论文信息:Akbari, A., Perry, A., Barton, A. R., et al. (2026). Ancient DNA reveals pervasive directional selection across West Eurasia. Nature, 632(8025), 123-132. DOI: 10.1038/s41586-026-10358-1
关键概念:定向选择 | 古DNA | 自然选择 | 多基因性状 | 基因-文化协同进化 | 农业转型
相关领域:进化生物学 | 古基因组学 | 群体遗传学 | 生物医学