OmicShare再添新工具 高级三维PCA图

 

二维和三维PCA图任君选择!...



敲锣打鼓、奔走相告,自上次推出新工具高级散点图后,OmicShare Tools云工具平台又推出新工具啦!这次推出的新工具是高级三维PCA图。

关于PCA图的介绍和用途,我们之前也分享过一篇文章(戳这里查看~)。PCA分析应用十分广泛,在重测序、RNA-seq、16S测序等多个地方都会用到,可用于检测样本重复性的好坏、检测样本间的关系、推断亚群间的进化关系。但是PCA分析和绘制的方法并不简单,要花时间学习R语言等分析与绘图工具!

不想被虐?那就赶紧使用免费在线分析云工具(www.omicshare.com/tools/)的高级三维PCA图工具吧!再加上原有的二维PCA图工具,大家就可以随意玩转PCA图、分析数据了!

下面举个例子来跟大家讲讲如何使用高级三维PCA图工具。

我有四组样本,每组两个生物学重复,做了RNA-seq,得到基因的表达量后,我想知道这四组样本之间的关系,以及重复样本间的重复性好不好。(PCA分析就能解决我的问题!)
· 步骤 ·
01
进入工具页面
网址:www.omicshare.com/tools

找到“高级三维PCA图”工具,进入工具界面如下。



第一次使用的童鞋,请务必先仔细看看“案例演示”里面的说明,明白各种输入要求和格式要求后再使用工具~~
02
整理作图数据


上传矩阵表格文件:可参考示例文件,一般第一行为样本名,第一列为基因名。可以是我们结题报告给出来的基因表达量总表,有其他注释信息等不要紧,我们接下来选择用来做主成分分析的列就可以了。

下面是我的数据表格,第2~9列为基因表达量(FPKM),后面是read count数和基因注释信息,我用的是FPKM值来分析。



输入列的ID文件:输入用来做主成分分析的列,在这个例子中也就是样本名称。如果不填,即默认用所有的列来分析的,那么就会出错,所以大家一定要填写。这里可以添加分组信息,即同一组内的样本用相同的颜色或符号标识。添加分组信息后对图形的结果解读更好,建议大家加入。下面是我的列ID文件:
输入行的ID文件:输入用来做主成分分析的行,在这个例子中也就是基因名称。通常我们都会用所有的基因来做主成分分析的,因此这里就不需要输入了。
03
提交任务、查看结果


上传好数据表格和列ID文件后,提交任务,就等着收菜啦!任务也是超高速完成的有木有!

高级三维PCA图的结果文件包含两张三维PCA图,一张是点上面有样品名的,另一张是点上面没有样品名的。图片包含了pdf格式和png格式,方便用户选择适合的来使用,也是很贴心的哈!

有样品名的结果图
无样品名的结果图
从图中可以看出,PC1对总体方差解释的百分比最高,达到81.3%,因此我们可以主要看各组样本在PC1主成分上的距离。我们发现WT2组两个样本(蓝色点)在PC1上距离较远,说明WT2组两个样本的重复性不好。一般情况下,我们可以把离群的样本剔除掉,不用于下游的分析,但因为只有两个生物学重复,所以我们并不知道到底哪个样本是离群的。所以还是那句老话,建议做3个生物学重复啊啊啊!

用同样的数据去画二维PCA图(用OS Tools的“二维PCA图”工具),结果也是一样的,同样可看出WT2组两个样本相距较远。二维和三维PCA图的结果,大家都可以放在文章中哒!



另外,大家想增加什么新工具,可以点击“阅读原文”去留言,我们将会考虑最多人提出和支持的工具,作为我们下一步开发的优先选择。还在犹豫什么,赶紧回帖与支持吧!




点击“阅读原文”告诉我们你想要什么新工具

↓↓↓


    关注 基迪奥生物


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册