神经发育与智力障碍特异性lncRNA鉴定

 

生物信息学数据挖掘对于lncRNA研究至关重要,怎么样有效结合数据库信息与实验数据呢?...



与疾病发生相关的特异性非编码RNA鉴定方法多样,怎么样结合生物信息学数据和实验数据挖掘与疾病特异性的非编码RNA筛选呢?今天,小编和大家分享一篇最近发表子《Scientific Reports》上的研究,来了解下怎么样筛选与神经发育和智力障碍相关的特异性lncRNA分子。

研究背景

智力障碍(ID)是由于遗传和环境因素影响的认知障碍疾病,主要由大脑神经发育障碍引起。通过全基因组芯片和外显子测序筛选等技术,目前已经发现了很多与ID相关的基因。但是,现有的结果却不能对大部分的ID病人发病原因作出解释。作为RNA转录产物的重要组成部分,现有研究发现,长链非编码RNA在发育和疾病过程中扮演了重要的角色。是否有lncRNA与ID的发生密切相关?本研究通过生物信息学挖掘和实验数据分析,筛选了与神经发育和ID发生相关的特异性lncRNA分子。

研究结果


1

生物信息学筛选ID和神经发育相关lncRNA

为了筛选与ID和神经发育相关的lncRNA,研究人员利用已有H3K4me3,REST binding,和DNAse 1 hypersensitivity对神经细胞 ChIP-seq的数据,从RefSeq和LNCipedia数据库中进行筛选,发现有12696个基因有REST binding motif,7003个含有H3K4me3 mark的启动子结合区,15144个含有DNAse 1 hypersensitivity的启动子区基因;11348个lncRNA转录本含有REST binding motif,4188个lncRNA含有H3K4me3 mark的启动子结合区,17023个含有DNAse 1 hypersensitivity的启动子结合区。同时,结合已有GWAS hits位点,只有H3K4me3 富集的基因与ID相关。因此,H3K4me3 mark的过滤,找到了与ID和神经发育相关的特异性lncRNA。



在很多情况下,lncRNA通过调控附近mRNA起生物学功能(cis)。因此,研究人员把4188个含有H3K4me3 mark的启动子结合区的lncRNA筛选cis靶基因,有3222个能找到。对靶基因进行GO分析,发现神经系统发育功能显著富集。此外,这4188个lncRNA中,有53个含有已知对CNS失常病人GWAS 发现位点。因此,研究人员对这53个lncRNA进行了深入分析。

靶基因分析显示,53个lncRNA中有44个含有靶基因。28个和mRNA有共同启动子,12个来源于mRNA反义链。

2



基因芯片筛选神经组织特异性lncRNA

第一部分通过生物信息学分析,从已有数据库中筛选了与ID相关的lncRNA。为了更进一步的拿到可靠数据,研究人员对15个人的组织:心脏,肾上腺,胸,肾,肺,大肠,肝样本及8个不同的脑组织样本进行检测。找到2636个与H3K4me3相关的lncRNA(30/52个与GWAS位点重合)。芯片数据RankProduct分析显示,有1290个神经组织特异性上调mRNA和790个下调mRNA。上调基因中有124个是ID相关基因,65个含有GWAS发现的hits。有731个上调lncRNA和237个下调lncRNA,4个含有GWAS发现的位点(lnc-RP11-210M15.2.1-1:3, lnc-AC073043.2.1-1:1, lnc-APOB-8:1 & lnc-MYO10-1:1)。另外,上述30个lncRNA中,只有3个在不同脑区域差异性表达。值得注意的是,从信号分布情况也可以明显发现,lncRNA的表达丰度明显低于mRNA。

3

lncRNA生物学功能挖掘

为了更深入的挖掘这30个lncRNA的生物学功能,研究人员通过相关性关联分析,然后把关联到的mRNA进行GSEA富集。结果显示,有19个lncRNA富集功能到突触传导,神经系统发育或者神经形成。其中,有5个lncRNA与神经细胞突起基因负相关,暗示着这些lncRNA可能抑制相关mRNA的表达。另外,有3个lncRNA相关的mRNA主要参与线粒体能量代谢过程。



同时,和mRNA相关性最大的9个lncRNA,都是一些和ID相关的mRNA。这30个lncRNA中,有25个都存在cis靶基因,10个是bidirectional transcription,4个为antisense。

结论与点评

该研究通过对lncRNA数据库,已有神经发育相关ChIP数据和GWAS发现位点信息,结合自己不同组织芯片结果,找到了与ID和神经发育相关的lncRNA,并对这些lncRNA的潜在生物学功能进行了挖掘。不难发现,该研究重点在于数据挖掘,虽然没有找到某一个具体功能的lncRNA,也没有对lncRNA的具体作用方式进行验证,但是还是能发表影响因子还可以的文章,该研究适合想从数据挖掘角度出发去研究的研究人员参考。

【温馨提示】本文为微信号:基因芯片知识屋(bio-microarry)原创文章,如需转载请注明来源:基因芯片知识屋。




    关注 基因芯片知识屋


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册