Hi-C辅助基因组组装

 

Hi-C,将所有基因组都组装到染色体水平...



1、什么是Hi-C组装?

 

Hi-C辅助基因组组装是指在已有二代或三代或光学图谱辅助组装的Draft genome序列和已知染色体数目的前提下,利用Hi-C测序数据将Draftgenome序列进行染色体群组的划分,并确定各序列在染色体上的顺序和方向,使基因组组装组装水平提升到染色体水平的技术。惊呆了吧!哈哈!具体实验技术流程如下图1

图1 Hi-C实验流程图[1]
 


2、Hi-C辅助基因组组装的原理是什么呢?

 

首先那就是细胞核内包含同源染色体在内每条染色体的都占据着一个独特区域,称为染色体疆域(Territory),导致基因组各区段(Locus)在同一染色体上的交互频率高于不同染色体的交互频率(图2)。因而实现了将初步组装的Contigs或Scaffolds分配到各染色体群组中。


图2 基因组三级水平空间结构图[1]
其次就是染色体内部不同Locus的交互频率与Locus之间的线性距离一般近似服从幂次定律(Power Law),因而可以通过交互频率的高低确定每个染色体群组中的不同Contigs或Scaffolds顺序与方向(图3)。

图3 染色体交互信号与基因组线性举例关系图[1]
 


具体组装流程图如下:

图4 LACHESIS组装流程图[2]
3、 应用案例:

2013年发表在nature biotechnology上人、小鼠、果蝇基因组在仅使用二代数据组装了Draft genome序列前提下,然后加入Hi-C成功实现了将Draftgenome序列挂到了染色体。其中人与小鼠染色体挂载率超过了98%,准确性超过99%[2](表1)。



此外在2015年发表在MolecularPlant上的拟南芥(拟南芥变种Landsbergerecta)基因组利用Hi-C成功将99.10%的Draft genome序列挂载到染色体上(图5)。与参考基因组共线性及遗传图一致性均很高。证明了在植物中应用的可靠性。

图5 与拟南芥参考基因组及自身遗传图谱共线性分析图[3]
近期山羊基因组的公布,更加强调了Hi-C应用的可靠性。山羊基因组结合了三代,光学与Hi-C技术成功实现了将基因组挂载到了31条染色体上[4],ContigNG50达到了19.333Mb(表2)
表2山羊组装统计表


4、应用前景

 

Hi-C基于单一株系染色体交互规律的组装方法,具有高覆盖率和高特异性,避免了繁琐的群体构建工作,降低成本、节约了时间,减少了实验误差,在以下方面具有广泛的应用价值。

1、测序基因组的进一步完善。对于初步组装的基因组可以进一步完善,达到染色体水平。

2、高度杂合的植物基因组从头组装和完善。由于每条染色体占据独特的疆域,即使同源染色体仍然是这样,对于区分杂合染色体具有重要的作用。

3、多倍体物种基因组的进一步完善。有报道小麦基因组已应用Hi-C辅助基因组组装[5]。

此外与第三代测序技术和光学图谱相结合,获取高质量的长片段scaffolds,是Hi-C技术发展的重要方向。

目前市面上最辅助组装的有北京百迈客公司,主要做医学的安诺优达也有宣传。

参考文献

1. Lieberman-Aiden, E., et al., Comprehensive mapping of long-rangeinteractions reveals folding principles of the human genome. Science, 2009. 326(5950): p. 289-93.

2. Burton, J.N., et al., Chromosome-scale scaffolding of de novogenome assemblies based on  chromatin interactions. Nat Biotechnol, 2013. 31(12): p. 1119-25.

3. Ting, Jue-Fei, Zheng, et al. DeNovo Plant Genome Assembly Based on Chromatin Interactions: A Case Study of Arabidopsis thaliana[J]. MolecularPlant, 2014,  408(3):489-492.

4. Bickhart D M, Rosen B D, Koren S,et al.Single-moleculesequencing and conformational capture enable de novo mammalian reference genomes[J]. bioRxiv, 2016:064352.

5. Mascher M. Anchoring and Ordering Wheat GenomeAssemblies by Chromosome-Conformation Capture[C]. Plant andAnimal Genome XXIV Conference. Plant and Animal Genome, 2016.
 


    关注 生信人


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册