2017PAG会议进展丨三代测序在动植物基因组中的大规模应用

 

水稻、小麦、猪、鸡、牛……基因组最新研究进展...





大大提升了节节麦基因组组装质量(点击了解详情)。本次PAG会议中,中国农业科学院作物科学研究所报道了最新的节节麦基因组进展,通过结合DeNovoMagicTM2 Nrgene,Illumina X10,PacBio和10x Genomics数据,组装结果不断提升。研究者还通过Cytogenetic技术, CEGMA, BUSCO分析,与已知的BAC序列比对四种方法评价了组装结果,均表明组装结果有很大提升。

节节麦基因组组装策略和指标
除此,研究团队还介绍了小麦B基因组供体和中国小麦品种Aikang58 (AK58)的研究进展,最后研究者提到,PacBio能显著提升组装中的Contig大小,进一步提升组装指标。
水稻基因组
2016年,华中农业大学与美国亚利桑那大学共同发表了两个高质量水稻(MH63和ZX97)参考基因组(Zhang,
Chen et al. 2016)。

MH63& ZX97基因组组装结果与日本晴 Nipponbare参考基因组对比
在PAG会议中,研究团队报道了明辉63(MH63)和珍汕97(ZX97)基因组项目新的研究进展,并介绍了另外三个经PacBio测序组装的水稻品种N22, IR8 和 Azucena基因组进展。其中,加入一定测序深度的WGS PacBio数据,让组装结果有了很大的提升。

水稻品种MH63, ZX97, N22, IR8和Azucena组装策略和结果汇总

其他代表性动物基因组

鸡基因组
经PacBio测序组装及Hi-C等技术辅助,得到更新鸡基因组版本(暂定为Gallus_gallus-6.0)。组装步骤如下,初步得到基因组版本Galgal6,Conitg N50达到16Mb,经HiC- Scaffolding辅助更新版本Galgal6.0,其中,Contig N50 18.7 Mb。下一步,研究者预计将鸡基因组升级到染色体水平。
鸡基因组Galgal6版本的组装策略
鸡基因组不同组装版本的结果比较
鸡基因组Galgal6.0组装结果
考拉基因组
研究者在报道中对比了考拉基因组采用不同策略的组装结果,基于Koala v4.1的组装结果(57 X PacBio数据加30X Illumina数据),结合BioNano进行Scaffolding, Contig N50由11.5Mb提升至18Mb。研究者下一步目标为获得染色体级别的考拉参考基因组。

不同策略的考拉基因组组装结果
PacBio与BioNano结合组装结果
牛参考基因组


基于PacBio测序技术,在Illumina、Dovetail Genomics Chicago 技术、光学图谱辅助下,得到高质量的初步组装结果,Contig N50 22.6 Mb,Scaffold N50 103.7 Mb。对牛30个组织进行PacBio Iso-Seq测序,改进基因组注释。
牛基因组组装结果
猪基因组
基于PacBio长读长数据对Duroc 2-14和Duroc/Landrace/Yorkshire杂交种测序组装,测序深度60-70X,并经Dovetail’s Hi-Rises Scaffolding,最后组装结果分别为基因组2.39 Gb,Contig N50=58.5 Mb,Scaffold N50=107.6 Mb及基因组2.62 Gb,Contig N50 =6.5 Mb,Scaffold N50=132 Mb。
兰布列羊基因组
兰布列母羊Benz2616经PacBio测序,最初组装得到Contig N50 2.2 Mb,经 Hi-C 数据辅助Scaffolding,可得到染色体级别的scaffolds。

其他代表性植物基因组

异源四倍体咖啡树基因组
第一个发布的咖啡树基因组是二倍体栽培种Coffea canephora (2n=2x=22)(Denoeud et al.2014)。C. arabica是种植更为广泛的咖啡树物种,占世界咖啡产量的70%,为异源四倍体(2n=4x=44),基因组大小约1.3 Gb,是2个二倍体亲本C. canephora (710 Mb) and C. eugenioides (670 Mb)杂交而来(< 0.6 mya)。



此次会议中,研究者报道了C. canephoraC. eugenoidesC. arabica的基因组研究进展。通过>50X PacBio测序组装,Illumina纠错,经亲本C.canephora,C.eugenoides的基因组序列信息,分子标记及光学图谱数据来区分C. arabica的2套亚基因组。

C.arabicaC.canephoraC.eugenoides基因组组装大小分别为1.1Gb,668 Mb,661 Mb,Contig N50 分别为279kb,766 kb和 407kb。

基因组组装结果
籽粒苋基因组


已发布的籽粒苋基因组草图是基于Illumina HiSeq平台,组装结果有3,518 scaffolds,Scaffold N50为371kb (Clouse, Adhikary et al. 2016)。PAG会议中研究者报道籽粒苋基因组的最新研究进展,经~29x的PacBio数据对二代数据进行gap filling,后经Hi-C数据辅助组装,Scaffold N50 24.1Mb。
基于二代数据的组装结果


冰叶日中花基因组
经Illumina 和 PacBio测序,测序深度分别为254X和90X,组装分为3步:PacBio数据组装;Ilumina数据对组装结果polish;BioNano数据进行Scaffolding。最后组装结果中最长Scaffold达24,930,053bp,N50 为7,276,308bp。
向日葵基因组
向日葵预估基因组大小3.6Gb,含有80%的重复序列,基因组非常复杂。研究者通过PacBio测序,测序深度102X,上机407个SMRT Cells,组装基因组3Gb,13,957Contigs,Contig N50=524Kb。

2017年PAG会议上动植物基因组学研究成果颇为丰富,一篇会议分享文章篇幅有限,不足以涵盖其中所有的研究进展,也不可能包罗不同学者感兴趣的研究领域,如各位研究者有兴趣,可以登录

https://pag.confex.com/pag/xxv/meetingapp.cgi/Home/0查看更多精彩内容。

未来组基于PacBio SMRT测序平台,积累大量的大基因组组装经验和创新,解决了超大基因组组装、多倍体组装难题,通过搭建Sequel测序平台和天河2号快速组装平台,将会大幅度缩短项目交付周期。2017年,未来组期待与您一起制定基因组测序计划。

参考文献



1. 编译参考来源于PAG官网

https://pag.confex.com/pag/xxv/meetingapp.cgi/Home/0

2. Clouse, J. W., D. Adhikary, J. T. Page, T. Ramaraj, M.K. Deyholos, J. A. Udall, D. J. Fairbanks, E. N. Jellen and P. J. Maughan(2016). "The Amaranth Genome: Genome, Transcriptome, and Physical MapAssembly." Plant Genome 9(1).

3. Jia, J. (2013). "Aegilops tauschii draft genome sequence reveals a gene repertoirefor wheat adaptation." Nature 496(7443):91-95.

4. Zhang, J., L. L. Chen, F. Xing, D. A. Kudrna, W. Yao,D. Copetti, T. Mu, W. Li, J. M. Song and W. Xie (2016). "Extensivesequence divergence between the reference genomes of two elite indica rice varieties Zhenshan 97 andMinghui 63." Proceedings of theNational Academy of Sciences of the United States of America 113(35).

编译:市场部

图片来源于网络

侵删

未来组基因探路者招募计划
作为中国首家第三代测序服务公司,未来组专注于三代测序技术开发和应用推广,已经成为中国三代测序技术应用的第一品牌。新的一年开始,我们比以往更加期待新的基因探路者的加入,因为有你,未来充满希望。

欲知英雄帖详情,敬请登录未来组招募计划页面(左下角“阅读原文”)


    关注 Nextomics


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册