SCI图形中的白富美——环形图

 

美艳程度,5颗星!...



随着illuminaX10测序仪对非人物种的重测序开放,测序价格进一步跳楼。曾几何时,重测序这种高大上的东西(2010年那阵子,完成一只小鼠的全基因组重测序都需要几十万),如今已经可以走进寻常实验室人家。全基因组重测序的玩法也愈加丰富,进化关系、选择压力、基因定位… …在这些五花八门的分析策略背后,也包含着格式各样的图形。

在你决定好好玩转重测序前,基迪奥生物重测序图形专题,和你唠一唠重测序都可以做哪些漂亮的图形,以及这些图形对应什么样的分析、有什么样的意义?

今天是第一期,主角是环形图~


1.环形图

包容一切的环形图(circos)

美观度:☆ ☆ ☆ ☆ ☆

实用性:☆ ☆
名称的由来

下面的圈图,大家肯定都见识过。因为这类图形都是圆圈的形式,所以你可以把它称作“圈图”。不过它还有一个更专业的名称:circos图。之所以被称为circos图,是因为这类图形都出自一个绘图软件之手:circos。



Circo是由加拿大的一位生物信息科学家 Martin Krzywinski 所开发,他同时是一位专业摄影师(又是一个牛逼的同行啊)。最初他主要从事Linux系统管理等工作。

Circos使用Perl语言开发,所以可以安装在任何支持Perl的操作系统上如linux, mac os, windows 等;Circos主要使用Perl的GD库来绘图,可输出PNG位图或SVG矢量图;Circos采用文本配置文件的方式来指定输入输出文件以及图形样式和绘图规则等。

Circos是一个Perl语言开发的自由可视化软件,使用GPL协议分发,以绘制输出圈图(原型风格的图)为最大特色。最初主要用于基因组序列相关数据的可视化(这才是它的老本行)。

目前已应用于多个领域,例如影视作品中的人物关系分析,物流公司的订单来源和流向分析等,大多数关系型数据都可以尝试用circos来可视化(有点跑题了)。如果你登录Circos的官网(地址:http://circos.ca/),也会看到开发者在官网赤裸裸地炫耀他们的成绩。的确,他们绘制的图形出现在基因组学相关的所有主流期刊,以及《纽约时报》等其他领域的杂志期刊。



这个图形是什么意思?

Circos图总体来说,图形中有两个区域(外圈区和中心区)。

a) 外圈区域

这个看起来被切成若干块的多层蛋糕,包含了circos图中的主要信息。在这里,每一个切块都是一条染色体。而图中每一层(分别用a、b、c… … 编号代表),都代表染色体中的某类信息。

在这个部分,在内容呈现上你要考虑两个问题:

  1. 选择呈现什么信息,可以完全由你自己选择;
  2. 选择呈现方式,例如可以选择折线图、条形图、气泡图、热图等。


例如,在某篇高粱重测序文章中,a、e、f、g使用的是热图,呈现基因密度、SNP密度等这些信息在染色体上的变化,而b、c、d使用的折线图,代表选择压力分析的三种数值(π值,Tajima’D,Fst)在野生高粱群体和栽培高粱群体中的波动变化。



b)中心区

中心区域信息比较单一,反映的是染色体不同区域的共线性关系。也就是将染色体之间的同源序列使用连线连接在一起。



circos用在什么地方?

所有涉及到全基因组测序类的数据(包含de novo测序和重测序),都可以用cicos图来呈现任何你所关心的全基因组水平的数据信息,例如,基因密度,GC比例,SNP密度,CNV密度、基因组多样性、关联分析结果的显著性等结果都可以用circos呈现等。

但我认为cicros图,是一种看起来漂亮但实用性不大的花瓶。因为在这么小的区间里,挤了这么多数据,最后只有一个后果——哪个都看不清楚。

因此,我建议这个图形更多用于呈现基因密度、CG比例,SNP密度等这些无关紧要的数据,让文章图表看起来更高端一点。而其他的一些核心结果,还是建议用专门的图形来展示,以便让文章结论更加清晰。例如,对于选择压力分析、全基因关联分析等还是建议使用麦哈顿图(后续文章会介绍哒~)来呈现。

circos图一般怎么画?

绘制circos图有四种方法:

I)去circos官网下载绘图包,也是目前使用最广的策略。这个包使用的命令行模式,而且是依赖于perl语言的软件包。这个包使用较为复杂,所以建议了解perl语言的用户使用。

II)官网好像也提供在线版本的circos绘图,但对文件大小有限制。所以,对我们二代数据这样的大文件绘图来说,在线绘图好像没有什么用。

网址:http://mkweb.bcgsc.ca/tableviewer/

III实际上,circos的perl版本使用还是过于复杂。所以有人开发了基于R语言的circos 包,例如Rcircos。当画出来的图形貌似没有perl版本的画的漂亮,不过也凑合着够用。

网址:https://cran.r-project.org/web/packages/RCircos/index.html



IV)其实作为一个从事生物学研究的科研人员,把大量时间花费在钻研如何绘制circos其实并不值得,有这个时间不如多看几篇paper,多发几篇文章。未来的世界越来越倾向于分工和协作,所以专业的事情可以交给专业的公司。绘制circos图形这样专业的事情,不如外包给基迪奥这样的专业的生物信息公司
好了,今天的circos图形介绍就说到这里。下期重测序图形专题内容预告:群体结构三剑客——PCA、树和structure堆叠图,周老师约定你哟~





    关注 基迪奥生物


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册