【扩展】那些年,华大基因完成的群体基因组学研究

 

近日,华大基因完成的《群体基因组学揭示北极熊近代物种形成和快速适应性演化》论文被美国细胞出版社评为“2014...



近日,华大基因完成的《群体基因组学揭示北极熊近代物种形成和快速适应性演化》论文被美国细胞出版社评为“2014中国年度论文”,那么一起来看一下,除了北极熊,还有哪些重要物种被华大基因用热门的群体基因组学技术研究过呢?

千人基因组计划

doi:10.1038/nature09534

doi:10.1038/nature11632

国际千人基因组计划启动于2008年1月,华大基因、英国Sanger研究所和美国国立人类基因组研究所是此国际项目的主要支持者和共同发起人。该国际协作组已于2010年完成了“千人基因组计划”第一阶段的任务,对于人群携带5%以上的基因变异,绘制出了覆盖度95%的基因多态性图谱。该项目几乎覆盖全人类基因组的遗传多态性图谱,研究成果于2010年10月28日以封面文章形式发表在英国《自然》杂志上。

2012年11月1日,国际协作组的最新研究成果在《自然》上在线发表。此次最新的研究报告中,协作组对来自欧洲、东亚、非洲和美洲14个种族的1,092个个体进行了研究,并结合全基因组测序、外显子目标序列捕获和SNP分型等技术构建了变异图谱。通过开发新的方法对多种不同算法和不同来源的数据进行整合,最终协作组成功的绘制出了高分辨率和高精度的单体型图谱,其中包括3,800万个单核苷酸变异位点,140万个插入/缺失位点以及超过1.4万个大片段缺失。这些数据资源涵盖了不同种族人群基因组中携带1%以上的突变,其中覆盖度达98%以上,为其他人类医学疾病研究提供基础。

熊猫种群演化史及其适应性研究

doi:10.1038/nature08696

doi: 10.1038/ng.2494



大熊猫基因组计划启动于2008年5月,2009年Nature杂志刊登了由华大基因领衔,中国科学院昆明动物研究所,中国科学院动物研究所,成都大熊猫繁育研究基地和中国保护大熊猫研究中心参与的合作研究成果《大熊猫基因组》。该研究的基因组样品是取自北京奥运会的吉祥物动物代表大熊猫“晶晶”,研究团队完成“晶晶”基因组精细图的测序和组装工作。

2012年12月17日,由中国科学院动物研究所、华大基因等单位合作完成的熊猫种群演化史及适应性相关成果在《自然·遗传学》上在线发表。该研究通过基因组学和群体遗传学方法描绘出了熊猫完整的演化史轮廓,并指出人类活动是造成熊猫濒危的主要因素,同时也为其他濒危动物建立了一种较好的评价和保护方法。

在本项研究中,科研人员依据基因组信息确定这六个山系熊猫可划分为秦岭、岷山、邛崃山-大小相岭-凉山三个遗传系,通过构建大熊猫从起源到如今的演化历史,揭示出其间所经历的两次种群扩张、两次瓶颈和两次种群分化现象。此外,研究表明全球气候变化可能导致大熊猫的种群波动,但近期的人类活动则是导致熊猫种群分化和数量的严重下降的主要因素。

此外,研究人员在对熊猫适应性的研究中发现,秦岭熊猫和非秦岭熊猫分别经历了定向选择和平衡选择。比如,相比于非秦岭熊猫,秦岭熊猫感受苦味的味觉基因Tas2r49受到定向选择,从而倾向于食用更多的竹叶,而竹叶比竹子其他部分含有更多的生物碱;同样,其嗅觉受体也表现为类似的正向选择。而在非秦岭种群中,则很少发生这种定向选择,这表明在岷山和邛崃-大小相岭-凉山熊猫之间存在更少的选择过程,这与其较低的种间异质性和遗传差异是一致的。

藏族人基因组研究

doi:10.1038/nature13408



2014年7月3日,来自华大基因、加利福尼亚大学以及华南理工大学等单位的科研人员在《自然》杂志上发表了关于藏族人高原适应性的最新研究成果。

藏族人群对高海拔地区缺氧环境的快速适应机制一直是科学家们关注的热点问题。2010年,华大基因高原项目组在Science杂志发表的一篇文章,曾通过全外显子测序技术首次揭示了低氧诱导因子EPAS1是藏族人群中受到最强自然选择的基因,且与居住在高海拔地区人们的血红蛋白浓度变化密切相关。后续多个独立研究组的成果也证实EPAS1基因的变化是藏族人受到高原环境正向自然选择最显著的标志。

在本研究中,科研人员对40个藏族人和40个汉族人的EPAS1 区域进行了高覆盖度的重测序研究,发现藏族人具有极不寻常的EPAS1 基因单体型结构。通过与来自全世界的多个现代人人群及古人类基因组数据比较,研究人员发现这个受到定向选择的单体型仅以高频率形式存在于现代藏族人和古丹尼索瓦人中,和以非常低的频率存在于汉族人中,而在包括欧洲人、非洲人的其他主要现代人群中频率都为零。

以上两个发现,使研究者确信藏族人中该受选择的单体型源于古丹尼索瓦人或古丹尼索瓦相关人与其基因交流。研究人员推测这个单体型流入到现代人的时间要早于汉族和藏族人群分离的时间,而且在藏族人定居在青藏高原之后受到了明显的定向选择作用,并因此在藏族人中扩散开来并保持下来。与藏族人祖先发生基因交流时,丹尼索瓦人可能已经获得了对高原的适应能力。

水稻基因组研究

doi:10.1126/science.1068037

doi: 10.1038/nbt.2050

doi:10.1186/2047-217X-3-7



2002年4月5日,由华大基因等中国研究机构完成的《水稻(籼稻)基因组的工作框架序列图》发表在Science杂志上。地球上一半以上的人类所赖以生存的粮食作物——水稻的基因序列由我国科学家独立绘制完成,并获得成功解读,此举不仅有利于世界粮食安全,还是同为禾本科的玉米、小麦、大麦、高粱和甘蔗等其他作物的理想研究模型。

2011年12月12日,由中国科学院昆明动物研究所、华大基因、中国科学院研究生院和中国科学院植物研究所等单位主导完成的50个水稻基因组重测序及遗传变异数据库构建等研究成果在《自然-生物技术》上在线发表。本研究首次对栽培稻和野生稻基因组进行了大规模的遗传变异分析,为科学家深入挖掘水稻重要农艺性状基因及促进水稻分子育种改良等研究提供了宝贵的基因资源。

2014年5月28日,3000株水稻基因组测序文章在GigaScience正式发表,且整套水稻基因序列以可引用形式在该杂志的附属开放获取数据库GigaDB中公开。该项目产生的数据是目前已公开水稻序列数据量的四倍。该成果标志着3000株水稻基因组项目第一阶段的完成,主要由中国农业科学院(CAAS)、国际水稻研究所(IRRI)以及华大基因(BGI)合作开展,并获得了比尔及梅琳达·盖茨基金会和中国科技部的资金支持。

“3000株水稻基因组项目”所产出和公开的大量遗传信息将最终被应用到智能育种实践中,为解决这些挑战迈出了重要的一步。不同植株间存在自然变异,而了解这些不同性状发生的遗传机制,将有助于成功培育出可高度适应不同环境的杂交品种。

构建人类泛基因组序列图谱

doi:10.1038/nbt.1596

2009年12月7日,华大基因领衔,华南理工大学主要参与的合作研究成果《构建人类泛基因组序列图谱》发表于Nature Biotechnology上。

此研究使用华大基因自主研发并具有国际领先地位的第二代测序技术大基因组组装工具对炎黄一号基因组(即首个亚洲人个人基因组)进行了进一步的深度测序和拼接,发现了人类基因组中除原先公认的单核甘酸多态性,插入删除多态性和结构性变异以外,还存在着种群特异甚至个体独有的DNA序列和功能基因。

该研究同时也对近两年发表的非洲人基因组和韩国人基因组进行了重新组装,也得到类似结论。这一研究作为全球第一个通过新全基因组组装方法对多个人类个体基因组进行拼接,对人类参考基因组序列进行补充,以充分的分析指出了人类基因组中存在"有或无"型的基因变异,从而首次提出了"人类泛基因组"的概念,即人类群体基因序列的总和,论文树立了新的人类基因组测序标准,并指出了未来医学研究的方向。

“大豆回家”项目

doi:10.1038/ng.715

2010年11月15日,香港中文大学、华大基因、农业部、中国科学院等单位合作的“大豆回家”项目,在大豆基因组研究取得重大突破。研究成果“31个大豆基因组重测序揭示遗传多样性和进化选择模式”在国际著名杂志《自然-遗传学》上在线发表。

研究人员运用新一代测序技术对17株野生大豆和14株栽培大豆进行了全基因组重测序,总共发现了630多万个SNP(单核苷酸多态性位点),建立了高密度的分子标记图谱。

在“重测序”基础上,华大基因的研究人员通过自主研发的SOAP denovo软件,分别对野生大豆和栽培大豆的测序数据进行组装拼接,除得到大量SNP外,还发现了栽培大豆获得或丢失的野生大豆基因。

该研究还得出一个重要结论,即与栽培大豆相比,野生大豆拥有更高水平的遗传多样性。这表明人类的耕种筛选很有可能导致栽培大豆生物多样性的狭窄,对可持续种植带来负面影响。

玉米基因组学研究

doi:10.1038/ng.2313

doi:10.1038/ng.2309



2012年6月4日,由冷泉港实验室、加州大学戴维斯分校、华大基因、康奈尔大学、墨西哥国际玉米和小麦改良中心等全球17所科研机构合作完成的两项玉米基因组学研究成果于国际权威杂志《自然·遗传学》上同期发表。

科研人员对105个野生和栽培玉米品种进行了测序和分析,成功构建了第二代玉米单体型图谱(简称,Maize HapMap 2),建立了精密的群体遗传学评分模型,共鉴定了5500多万个遗传分子标记,同时发现染色体结构变异(SV)在玉米野生种和栽培种的基因组中是普遍存在的,并且推测这些结构变异与很多重要的农艺性状具有密切的关联。此外,在研究影响玉米基因组大小的主要因素时,研究人员发现染色体结(一种密集的DNA结构,chromosomal knobs)的存在或缺失造成了“种内”玉米基因组大小出现很大的差异;而在“种间”进行比较时,他们发现玉米基因组大小的变化则主要与大量的转座子有关。

考古学及遗传学证实玉米大约驯化自10,000多年前,在驯化过程中,玉米经历了一次特殊的表型转变,这使其更加容易满足人类的需求。在由加州大学戴维斯分校和华大基因等单位主导完成的第二篇文章(Comparative population genomics of maize domestication andimprovement)中,研究人员对75个玉米株系(包括野生玉米、美洲各地的传统品种和现代改良玉米品系)进行全基因组重测序,并对玉米驯化进行了全面的评估分析。

研究发现玉米在经过人工驯化之后又产生了新的遗传多样性,并推测这很有可能是由于野生近缘物种的基因渗入所导致的。研究人员发现了数百个具有强烈选择信号的基因,并推测这些基因可能在玉米的驯化过程中发挥着重要的作用。此外,研究数据还表明在玉米的驯化过程中,千百年前古代农民应用的人工驯化方法似乎比现代育种学家所使用的方法发挥了更大的作用。

黄瓜基因组研究

doi:10.1038/ng.2801

2013年11月4日,中国农业科学院基因组中心、华大基因等单位联合对115株黄瓜进行了深度重测序,并构建了包含360多万变异基因的遗传图谱。最新研究成果已于《自然·遗传学》杂志发表。

研究者共发现330多万个单核苷酸多态性位点(SNPs),33万多个小插入和删除(small insertion and deletions)和594个获得/缺失变异(PAVs)。基于这些所得数据,研究人员构建了一个全面的黄瓜遗传变异图谱。

通过比较分析发现,无论是从形态学还是基因组学来看,印度品种比三个品种的差异性都大,且后续SNPs分析也发现,印度品种表现出了更多的基因多样性。这一结果证实了之前关于印度品种是比较古老的黄瓜品种的说法。

野生黄瓜因富含三萜素C而味道苦涩。之前的研究发现,黄瓜的味苦性状是由Bi和Bt这两个基因控制的,其中Bi使得黄瓜没有苦味,而Bt使得黄瓜味道极苦。本研究中,科研人员发现Bi和Bt分别位于6号和5号染色体上。研究者们没有在Bi位点上发现任何选择性区域,但是在Bt上发现了一个长度为442kb富含67个基因的选择性区域。

高粱基因组学研究

doi:10.1186/s12870-014-0253-z

2014年9月26日,由澳大利亚昆士兰大学、华大基因等单位合作的44个高粱重测序项目再获突破,继首篇关于高粱群体遗传学研究的文章发表之后,第二篇文章“The plasticity of NBS resistance genes in sorghum is driven bymultiple evolutionary processes”发表在BMC Plant Biology杂志。该研究通过对高粱基因组中抗病基因的深入分析,揭示了抗病基因的适应性是由多个进化过程驱动的,为粮食作物的抗病育种研究提供了宝贵的遗传资源。

本研究中,研究人员利用同源预测的方法在高粱基因组中鉴定了346个抗病基因(NBS gene),以多态性统计参数(θπ,θw)为基准发现抗病基因的多态性要显著高于其他基因,其中38个基因受到纯化选择,23个基因受到平衡选择,这样的发现为古老的祖先基因趋向于富集在基因组受到选择的区域提供了新的证据。同时发现,NBS编码基因也显著富集在真菌抗病QTL的区域,该类基因的多态性受到生物胁迫抗病QTL类型的影响。此外,研究人员以高粱基因组为参考绘制了高粱、玉米、水稻的共线性区域图谱,为鉴定这三个物种的同源基因提供了有力的帮助。

在此之前,大部分基因组重测序研究都是基于整个基因组的水平描述各种变异的结果,包括SNP, Indel, CNV, PAV等等,而44个高粱重测序的第二篇研究发现则利用群体遗传学的方法,对抗病基因的分子进化历程进行了非常深入的分析,得出抗病基因的适应性是由多个进化过程驱动的结论,为重测序研究的分析与阐释提供了分子进化角度的全新视角。

全球微生物基因组研究

2011年3月22日,华大基因宣布参与全球最大微生物基因组研究项目(Earth Microbiome Project,EMP),并承担核心工作。地球上的微生物要比其他已知星球上的多,而高通量测序技术为探索微生物世界提供可前所未有的机会。与以前的微生物或微生物群体测序相比,EMP的提出将会带来更加巨大的影响。该项目可以获得大约500,000个重测的基因组,一个全球的代谢模型和一个所有信息可视化的数据分析入口,这将可以更好的描述每个生物群落的蛋白质空间结构及环境代谢模型。

鸽子基因组研究

doi: 10.1126/science.1230422

2013年2月1日,由美国犹他大学、华大基因等单位合作完成的鸽子基因组研究成果在《科学》杂志在线发表

为了研究鸽子极其丰富的表型多样性的遗传学基础,研究人员对其中一个家鸽品种进行全基因组测序及组装,并对另外36个家鸽品种以及2只野鸽(恢复野生习性的家鸽)进行了重测序,发现部分家鸽起源于中东地区,而另一些品种可能起源于印度,此外还发现野鸽和赛鸽之间存在一定的亲缘关系。

很多鸟类都有羽冠,羽冠是一种头部的装饰,在鸟类求偶过程中发挥着吸引异性的作用。通过全基因组群体分析,研究人员发现EPhB2(Ephrin受体B2)基因在鸽子的羽冠发育中起着开关基因的作用,该基因正常时,则没有羽冠;而当其携带发生突变的等位基因的纯合子时,则形成羽冠。此外,研究人员还观察到在所有具有羽冠的鸽子中,EPhB2基因及其附近区域的基因突变型都是相同的,这表明该性状在鸽子进化历史中仅出现了一次,然后通过杂交选育扩散到其它不同的品种中,而并非在不同品种中多次独立进化。

猪的环境适应性机制研究

doi:10.1038/ng.3199



2015年1月26日,来自江西农业大学,华大基因和美国加利福尼亚大学的研究人员共同完成的《全基因组重测序揭示猪环境适应性的分子机理及可能的属间杂交现象》在线发表于国际顶级学术期刊《自然·遗传学》。

江西农业大学猪遗传改良与养殖技术国家重点实验室历时4年半,成功构建了覆盖我国24个省市自治区现有68个猪种的中国地方猪种基因组DNA库。在此基础上,挑选出来自我国15个不同地理居群的、代表广泛血缘的12个猪种69头无相关血缘中国地方猪;与华大基因共同针对这69头猪进行了全基因组高覆盖度(25X)的重测序,由此鉴别了4100万个基因组变异位点,其中2100万为新发现的位点。

经数据比对发现,中欧猪种之间存在广泛的基因交流。研究人员进一步采用群体基因组学研究策略,在全基因组范围内系统鉴别了与不同纬度环境适应性有关的219个基因位点,这些位点与毛发生长、皮肤发育、血液循环、能量代谢、肾脏发育、前脑神经元调控等生理功能有关,揭示出中国南方猪和北方猪适应不同温度环境的分子机制。

此外,研究人员在X号染色体发现一个长达14Mb的低重组区,南北方猪在该区域存在两种截然不同且经历了环境适应性自然选择的单倍型。而北方猪单倍型很可能来自另一个已经灭绝的猪属(Suide),该属间杂交事件据推算发生于数十万年前。这是首次在哺乳动物中发现古老属间杂交导致适应性进化的遗传学证据,改变了人们对哺乳动物适应性进化的认识。

如果你对华大基因的科研成果感兴趣,欢迎访问华大基因官网(www.genomics.cn)查看更多信息哦~


    关注 华大基因


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册