Nature methods丨基于Nanopore的direct RNA测序方法测评,你要不要来试试?

 

不经反转、无须扩增的RNA直接测序,够不够吸引力?...




本周一,Nature Methods在线发表Oxford Nanopore direct RNA测序技术测评文章,结果表明,【不经反转、无须扩增的RNA直接测序】能获得全长的链特异性RNA,无测序偏好性,并同时记录碱基修饰,为后续研究基因结构和基因表达,提供新技术新方法。


- direct RNA建库测序-

提取样本RNA(该实验样本为酵母Saccharomyces cerevisiae),在建库时先后加上poly(T) 接头和测序接头,于Oxford Nanopore测序仪上机测序(该研究中试剂版本:R9.4,测序机型:MinION。未来组以更新款GridION X5机型搭建测序平台,通量更高、base calling更快)



 
Fig.1 direct RNA测序的建库示意图
- 测序“raw data”展示-



Fig.2 展示的是一段带接头序列的~1500-nt的转录本通过测序纳米孔时记录下的电流变化。可以看出测序的顺序是:接头序列→poly(A)→转录本主体。随后对电流变化进行算法识别,重构转录本序列。

当一条转录本完全经过后,纳米孔又重归开放状态,可以迎接下一条RNA的到来。

Fig.2 RNA分子经过纳米孔时记录下来的电流变化
- 对direct RNA测序进行测评-



-1. 与参考转录组数据比对-

构建3个数据集:direct RNA在Nanopore测序;反转成cDNA用Nanopore测序;反转成cDNA用Illumina测序。

将测序reads比对到酵母参考转录组,比对情况如下:
-2. 三个数据集之间两两比对-

随后,对三个数据集对同一条转录本的reads支持情况进行了比较,结果显示相关度很高。

 Fig.3 支持每条转录本所对应的reads数量,两两间比对
   (n = 6,531 transcripts,每条转录本至少有一个数据集中的read支持)
-3. 对参考基因组覆盖度的评估-

将direct RNA 和 Illumina cDNA测序reads比对到参考基因组上,计算reads对基因的比对情况和覆盖度(Fig.4),direct RNA比对上的reads数量为2,045,748 (63.43%);Illumina RNA-seq reads比上的数量为708,592,030 (98.22%)。direct RNA 和 Illumina cDNA测序reads在对基因的覆盖方面,相关度很高(Spearman’s rho = 0.73,Fig.5)。



 Fig.4 direct RNA和Illumina cDNA测序,比对到参考基因组的覆盖度
   外圈:参考基因组;中圈:direct RNA;内圈:Illumina




Fig.5 direct RNA和Illumina cDNA测序,支持每个基因所对应的reads数相关性比较

n = 6,692 genes)
-4. 对基因识别准确度的评估-

该研究以酵母中的两个同工酶GAPDH基因为例,它们位于基因组不同的位置,编码同一个酶的不同形式,其编码序列有95.8%是完全相同的,仅有42个不同位点的碱基差异。基于以往二代测序是很难将短reads准确地mapping回参考基因组的。而在direct RNA测序中,该区域每条reads能覆盖这42个差异碱基中的大部分,即便有少量位点读取错误,也不影响将reads准确地mapping到对应的基因(Fig.6)。



  Fig.6 direct RNA测序reads mapping到两个同工酶GAPDH基因的结果
-5. 实验可重复性的评估-

另外还对同一个样本构建了5个不同的文库分别上机测序,技术学重复结果相关性高(Spearman’s rho = 0.94–0.96; n = 6,713 transcripts),表明文库构建和上机测序实验重复性好。
-6. 测序偏好性的评估-

文章利用外源标准ERCC样品(The External RNA Control Consortium)评估预期和实际的测序读长及测序丰度,结果显示高度的一致性,Spearman’s rho = 0.93, P = 1.9 × 10−40, n = 92 ERCC transcripts(Fig.7a),说明direct RNA测序对转录本的长度没有偏好性。Fig.7b、c评估了对ERCC RNA的覆盖完整度,大部分reads对转录本的覆盖完整度都接近1.0,说明direct RNA测序大部分reads都是测的转录本全长。从Fig.7c还可以看出,direct RNA获得的是链特异性的RNA序列,这对进一步准确获得基因结构及基因表达信息有重要的意义。



Fig.7 测序外源标准ERCC RNA样品,评估direct RNA测序偏好性
-7. 碱基修饰直接识别-

Direct RNA测序能在读取RNA碱基序列的同时获得碱基修饰信息。Fig.8以两种常见的碱基修饰m6A和5-mc为例,展示了经过修饰的碱基与未经过修饰的碱基,在经过测序纳米孔时引起的电流变化有什么区别。

Fig.8 碱基修饰对电流变化趋势的影响示意图
(a) m
6
A; (b)5-mc


不经反转、无须扩增的RNA直接测序能获得全长的链特异性RNA,无测序偏好性,并同时记录碱基修饰,为后续研究基因结构和基因表达,提供新技术新方法。
未来组作为国内最大的、唯一一家通过官方认证的Nanopore测序服务供应商,将于近期开始提供direct RNA测序服务,新技术到底带来什么新机遇?诚邀您一起探索!
文献内容博大精深,更多详情请点击文末阅读原文。 ▼

参考文献:Garalde D R, Snell E A, Jachimowicz D, et al. Highlyparallel direct RNA sequencing on an array of nanopores.Nature Methods,2018.

   延伸阅读

未来已来,Oxford Nanopore全球最大测序中心落户中国

人转录组direct RNA测序数据首发

和组学君一起来“尝鲜”—Nanopore Top News!

来自Nanopore测序的2个线虫基因组,解析复杂的染色体重排

图片来源于网络|侵删




    关注 Nextomics


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册