Nanopore测序技术已进军Gb级别的番茄基因组领域,你还等什么?

 

不要等了,找未来组呗~...





近日,研究者经Oxford Nanopore长读长测序技术完成了对预估基因组大小约为1G的野生番茄(Solanum pennellii)测序组装工作,文章发表于 The Plant Cell。经Nanopore测序技术组装的野生番茄LYC1722基因组,组装指标Contig N50高达2.5Mb,其基因组连续性、基因完整度及其他技术指标高于Illumina组装的番茄LA716基因组结果。结果表明Nanopore长读长测序技术以轻量级的预算已可完成Gb级别基因组的测序组装工作。

还记得国庆前,组学君为大家整理的几篇基于Nanopore测序动植物基因组文章吗?(眨眼就忘的童鞋请点击查看)当时还是预印的番茄基因组文章刚正式发表了,Nanopore测序技术在Gb级别的动植物基因组组装情况如何?请看下文。

研 究 方 法
1. 研究材料:选择自交亲和的Solanum pennellii LYC1722品种

2. Nanopore测序:共上机31个flowcells。

(1)长片段(12-80 kb,15-80 kb)筛选建库,(1D) ONT sequencing library (SQK-LSK108),20 μg DNA/library,29 个ONT MinION flowcell (R9.4)

(2)未经片段筛选建库,24 μg DNA/2 library,2 个ONT MinION flowcell (R9.4)
研 究 结 果
数据下机情况

31个flowcell总产出为134.8G,flowcell产量在1.1-7.3G范围,大部分数据都是测序运行的24h内产生的(Figure 1),其中“Passed filter”为110.96G(基本上是预估基因组1-1.1G的100X测序量),过滤后的平均Q-score为7.44,在文库优化后的产出读长,过滤的平均读长在6,625-15,869bp间,最长read可达153,099bp。
Figure1 番茄Solanumpennelli 31个MinION flowcell测序产量情况
何种基因组组装策略最优?为评估哪种组装策略对Nanopore在植物基因组组装效果更好,研究者经Canu、SMRTdenovo、miniasm及Canu-SMARTdenovo(经Canu校正过程和SMRTdenovo组装)几种组装策略对番茄基因组进行组装,发现Canu-SMARTdenovo组装效果最优:Contig N50 达2.45 Mb,Contig总数量为899,最大的Contig为12.32Mb,另外,每种组装策略对运算条件要求都各异(Table 1)。
Table1 番茄基因组Nanopore不同组装策略结果及纠错后组装结果


研究者提取了番茄基因组Nanopore数据量的40%,60%,80%数据,经miniasm,Canu,SMARTdenovo及Canu-SMARTdenovo进行组装测试,并经二代数据polish,发现Canu-SMARTdenovo组装效果始终最优(Figure 2)。另外,经片段筛分后构建的文库每个flowcell产出20Kb以上的读长占15%,而未筛分片段的文库产出20Kb以上的读长占3%,说明protocol的优化利于后续读长产出。
Figure2 番茄Solanum pennellii不同组装策略结果对比
番茄基因组组装质量如何?

经Nanopore原始数据组装的结果表现出明显的高错误率和高误差率,而经Nanopore-based polisher Racon或Nanopolish对错误率和基因覆盖改善效果不佳,而经Illumina数据对组装结果进一步Pilon polish,发现经Pilon迭代polish能有效降低组装结果的错误率和误差率,基因覆盖完整性提高到85%-96%(Table1, Pilon polished 5X)。同时结合其他番茄品种基因组及拟南芥基因组进行基因间比较发现,相对番茄Solanum pennellii LA716,番茄Solanum pennellii LYC1772基因组组装的完整性更完善。

此次番茄基因组Nanopore测序工作得到了高质量的番茄基因组,研究者最后粗略估算了下成本,对于这种中等大小的植物基因组(


    关注 Nextomics


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册