对非洲土著人的基因组研究描绘了人类起源和当地适应的复杂图景
非洲是人类最初进化的地方,今天仍然是一个具有显着多样性的地方。一个国际科学团队对来自十几个种族、文化、地理和语言不群的 180 名非洲土著人进行了深入研究,为人类历史和生物学提供了新的见解,并可能为未来的精准医学方法提供信息。
这项工作阐明了人类迁徙的历史和最近的迁徙历史,并提供了适应当地环境的遗传证据,这些证据表现为肤色、心脏和肾脏发育、免疫力和骨骼生长等特征。
这项由宾夕法尼亚大学研究人员领导的研究结果发表在《细胞》杂志上,对了解非洲血统人群常见的健康状况也有影响。而且,由于非洲人群在基因组研究中的代表性不足,这项调查大大扩展了对人类遗传多样性的了解。
调查发现了数百万种新的基因组变异,称为单核苷酸多态性(SNP) - DNA序列的一个“字母”的差异 - 包括许多似乎在健康中发挥作用,为更广泛的人群奠定了基础,以受益于基于个体差异的精准医疗。
“缺乏关于非洲人群基因组变异的知识,特别是在种族多样化的人群中,”宾夕法尼亚大学整合知识大学教授,这项工作的资深作者Sarah Tishkoff说。“我们专注于那些实行更传统生活方式的人群,生活在难以进入的偏远地区,其中一些人以前从未从这个角度进行过研究。
起源和迁移
研究人员获得了180个人的完整基因组序列 - 15个土著人群中的每一个12个。这项研究是第一个对这种遗传多样性的非洲群体组合进行严格的全基因组测序的研究。
“从一位非洲医生科学家的角度来看,我们的工作证明了长期科学合作的重要性,并强调了将更多非洲人群纳入遗传研究的迫切需要,”喀麦隆雅温得第一大学教授、研究合著者阿尔弗雷德·恩贾姆希(Alfred Njamnshi)说。
“如果所有人都来自非洲,正如越来越多的证据表明的那样,人们只是期望将更多的精力和资源投入到研究非洲人的人类遗传学上,以便不仅更好地了解人类遗传学,而且更好地了解人类生理学和病理学,这是更精确的人类医学的基础。
这12个人口实行或直到最近才实行传统生计:农业,畜牧业或狩猎和采集。他们共同包括来自非洲四个不同语系的代表:亚非语系、尼罗-撒哈拉语系、尼日尔-刚果语系和霍桑语系。
研究小组将这些非洲人群的新基因组序列与来自全球人群的其他先前测序的基因组放在一起,制作了一个全球家谱。
“推断非洲人口历史非常具有挑战性,因为历史是如此复杂,”Tishkoff说。“但是,通过我们的模型,基于基因组变异的共同模式,你可以推断种群何时共享一个共同的祖先,即使考虑到基因流动 - 种群迁入和迁出和杂交。
当研究小组允许他们的模型中的基因流动时,他们发现南部非洲讲Khoesan的群体San以及中非热带雨林中的狩猎采集者出现在树的根部。“这是一个非常新颖的结果,”Tishkoff说。以前的分析指出,只有桑人是最古老的人口的后裔。
他们还发现,桑族和中非狩猎采集群体在200多万年前就彼此分裂,也与其他已知的种群分离。
人口祖先模型发现了现已灭绝的“幽灵”种群的证据,该种群可能与当时的其他群体混合在一起。“我们没有来自化石的古代DNA,因为它们在非洲环境中保存不好,但一种解释是可能与古老的种群混合,”Tishkoff说。
这些发现为语言学支持的种群结构理论提供了支持。语言学家一直在争论说Khoesan的群体 - 其语言共享点击辅音,但在其他特征上高度不同 - 是否真正密切相关。根据基因组结果,尽管这些群体在数万年前就分化了,但有证据表明,在过去的10万年里,它们都可能在东非有一个共同的起源,并且共享了最近的基因流动。
“我们建议的是,这些讲点击语的群体可能起源于东非,甚至可能是热带雨林狩猎采集者,尽管他们后来失去了原始语言,并采用了邻近的班图语人口的语言,”Tishkoff说。
“这些团体可能已经朝着不同的方向分裂,哈扎人和桑达维人(来自坦桑尼亚的科伊桑人)留在当地,桑人(来自博茨瓦纳的科伊桑人)向南移动。然而,对现代和古代DNA的分析表明,哈扎人和桑达维人的祖先与桑人的祖先之间存在基因流动,这可能解释了他们语言中的一些相似之处。
新认识的人类遗传多样性
新测序的基因组确定了32万个SNP,其中包括5多万个以前从未被编目的SNP。
“分析的32万个SNP刚刚揭示了在全球以前被边缘化的地区扩展遗传研究的重要性,”坦桑尼亚坎帕拉国际大学的研究合著者Thomas B. Nyambo说。“这是阐明进化趋势及其在定制诊断和治疗中的含义的前进方向。
当研究小组将先前确定的SNP与用于临床研究的广泛使用的数据库中的SNP交叉引用时,他们发现研究中在非洲个体中发现的许多变异已被归类为致病性。
“这并不意味着非洲人群有更多的'致病'变异,”主要研究作者范少华说,他在宾夕法尼亚大学完成了博士后研究,现在在中国复旦大学。“相反,它强调了将种族多样性人群纳入人类遗传研究的强烈需求,特别是因为稀有性是确定临床研究中变异致病性的一个标准。
换句话说,其中一些变异可能被错误地归类为与疾病有关,只是因为它们在其他人群中非常罕见,例如主导这些临床数据库的欧洲人。
“全面评估遗传变异已被用作研究人类疾病的策略,并为识别与疾病易感性和进展相关的新位点提供了巨大的力量,”博茨瓦纳大学的Sununguko Wata Mpoloka说。“在此类研究中包括像博茨瓦纳这样研究不足的土著人口将极大地促进对精准医学的理解,并可能导致针对这些人群的定制药物。
其中一些变体可能确实在健康和疾病中发挥有意义的作用。为了了解这些关联,研究人员不仅将突变与现有数据库和已发表的研究进行了比较,而且还研究了这些变异是否发生在蛋白质的编码区域或可以调节生物学相关途径和过程的基因表达的区域。
他们还寻找一种突变的版本,称为等位基因,在不群中以显着不同的频率发生。这些差异的出现可能是因为等位基因在局部适应不同环境方面发挥作用并且是积极选择的,可能是因为它们赋予携带它们的人一些优势。
从这些分析中出现了几个值得注意的变体。例如,在南部非洲的桑族人群中,研究小组在PDPK1基因附近发现了大量的SNP,其他科学家已经证明该基因在小鼠色素沉着中起作用。
“根据我们实验室先前的研究,我们知道与其他非洲人群相比,桑人的肤色相对较浅,”Tishkoff实验室的博士后研究员,研究合著者Yuanqing Feng说。“因此,我们假设PDPK1附近的SNP可能会影响人类的色素沉着。
为了为这一假设提供机制证据,研究人员测试了其中一种SNPs(在San中很常见)在培养皿中生长的皮肤细胞中的影响。他们发现抑制含有变异的区域改变了PDPK1的表达水平,并降低了实验室培养的皮肤细胞中皮肤色素黑色素的水平。
与健康和功能的其他联系也出现在这项研究中。该团队的分析发现,在中非狩猎采集者中,与骨骼生长相关的基因附近存在大量变异。这些群体以其矮小的身材而闻名,这被认为有利于他们居住的茂密雨林环境。
在东非的牧民群体中,研究小组发现基因附近的变异富集,这些变异在肾脏发育和功能中发挥作用,可能是对生活在干旱条件下的适应。在东非的哈扎狩猎采集者中,他们在基因附近发现了独特的变异富集,这些变异在心脏发育中起作用。
“我的实验室现在正在跟踪其中一些基因,看看我们是否可以了解心肌发育的遗传学,”Tishkoff说。
“如果我们了解这些基因是如何被调节的,这可以给我们一个线索,为什么有些人有心血管疾病的倾向。要了解异常功能,你首先必须了解正常功能,我们推测这些人的生活方式有一些东西 - 例如,必须走很长的距离 - 这可能使心脏发育和功能发生某些变化是有利的。
此外,研究人员还发现了与尼罗-刚果血统的人的血压控制相关的基因变异,这些西非群体与大多数非裔美国人的后裔有着共同的祖先。
“在美国,非洲裔人的高血压和糖尿病发病率很高,这主要是由于社会经济因素,”Tishkoff说。“但可能存在一些遗传风险因素,以及他们生活的环境,影响他们的疾病风险。其中一些在非洲环境中可能是适应性的,但在美国环境中适应不良。
这些新的数据点有朝一日可能有助于为精准医学方法提供信息,这些方法依赖于了解遗传学和其他个体差异如何影响人们的疾病风险、对药物的反应等。
“非洲有大量的基因组变异尚未得到很好的表征,”Tishkoff补充道。“我们希望确保所有人群都从基因组学革命中受益,我们希望促进健康公平,因此我们需要在这些研究中包括更多不同的人群。