代谢组与表型、基因型关联研究牛饲料效率遗传机制

 

多组学贯穿分析案例~...



代谢组不仅在植物、医学、微生物研究上有广泛应用,在畜牧业也同样有着广泛的应用。目前已在畜禽生长发育 、抗疾病抗环境胁迫、营养健康、提高产量、食品安全等方面发挥着重要的作用。今天我们来解读一篇发表在《PLOS ONE》上的文章,看看代谢组如何与表型、基因型关联起来分析牛饲料效率的遗传机制。



研究背景与目的

饲料效率(feed efficiency)是影响选择育种和畜牧业生产的一个重要因素,是一个由多条生物信号通路和多个基因控制的复杂性状,之前的研究已经报道了一些饲料效率表型具有遗传力。

NCAPG基因是与哺乳动物生长发育调控相关的基因,而I442M(rs109570900)位点则被报道与牛出生前后生长发育相关,并且在青春期初期效应最高。然而NCAPG I442M在青春期初期对饲料效率的遗传效应还没有相关的研究报道。

因此本文的研究目的是评估NCAPG I442M位点是否对饲料效率产生影响,并且寻找与控制饲料效率相关的基因和代谢通路。

实验材料

由夏洛来牛和德国霍斯坦奶牛杂交得到的237头F2代公牛。

实验方法

表型测定:

在出生后6-9个月测定剩余采食量(RFI)、饲料转化率(FCR)、日常能量摄入(dEI)等指标,这些都是评估饲料效率的常用指标。

代谢物检测:

在出生后240天采集血液,分离血浆,进行221个代谢物(包括酰基肉碱、氨基酸、溶血磷脂酰胆碱、磷脂酰胆碱、鞘磷脂、生物胺、糖类等)的靶向检测。

基因分型:

  1. 首先,对237头公牛进行NCAPG I442M(rs109570900)和GDF8 Q204X(rs110344317)两个位点的基因分型。GDF8 Q204X是一个影响哺乳动物生长的基因,对这个基因位点进行分型是为了对比。
  2. 然后,对其中的176头公牛进行Illumina Bovine SNP50 v2(50k)chips基因型分析,来进行后续的GWAS分析。
文章总体研究思路



研究结果

1. NCAPG I442M和GDF8 Q204X位点的关联分析

首先,为了研究NCAPG I442M位点分离是否影响饲料效率,对NCAPG I442M和GDF8 Q204X位点,与表型RFI, FCR, dEI, 每日增重(ADG)、血浆精氨酸和肉毒碱(C0)浓度进行关联分析。结果显示,除了肉毒碱浓度,NCAPG I442M位点与其他五个指标都显著相关。442M等位基因显著降低了RFI和FCR,同时显著提高了动物的能量摄入、体重增加和血浆精氨酸浓度水平(Table 2)。



2. 全基因组关联分析(GWAS)

然后,在全基因组水平,将通过芯片得到的44507个高质量SNP分别与RFI, FCR, dEI和221个代谢物进行GWAS分析。结果显示,GWAS结果与前面的NCAPG I442M关联分析结果一致,NCAPG I442M是RFI表型的曼哈顿图上最显著的SNP位点(虽然下图中没有标出来)。



3. 基因网络构建,寻找饲料效率相关候选基因

由于复杂性状可能由几十上百个微效基因控制,GWAS分析方法往往检测能力不足,无法从假阳性结果中鉴定出真正的候选基因位点。为了找出参与调控饲料效率的基因以及基因间的相互作用关系,本文采用了将单个性状的GWAS分析结果整合到一个整体的基因-基因相互作用网络中的方法。之前我们也总结过GWAS分析应用于微效基因挖掘的方法以及相关文献解读(戳这里查看~)。下面我们来看看该文章是如何进行基因网络构建并寻找与饲料效率相关的候选基因的:

1)采用多维度的方法对性状表型进行评估

上文已提到,文中测定了剩余采食量(RFI)、饲料转化率(FCR)、日常能量摄入(dEI)、每日增重(ADG)四个表型和221个代谢物,多种指标测定可以提高GWAS分析结果的精度。但由于代谢物数目太多太冗余不利于分析,因此按照以下标准进行筛选:a. 代谢物间相关性低;b. 与蛋白质转运、脂质代谢相关。最终选择了11个代谢物进行后续的分析,这些代谢物如下表所示:



2)利用association weight matrix (AWM)方法找出候选基因

AWM方法简单来说就是利用相关性的方法寻找在大部分表型GWAS结果中都显著(p≤0.05)的SNP位点。

具体做法是先确定一个与性状最相关的表型(key trait),本文中剩余采食量(RFI)被选作为key trait。其余的表型则为supportive trait。

然后按照下面的顺序筛选出SNP位点:

  1. 获得在key trait的GWAS结果中显著(p≤0.05)的SNP位点(称为显著SNP集合);
  2. 计算上述显著SNP集合中,每个SNP都与n个supportive trait 相关(p≤0.05),取n的平均值,称为Ap;
  3. 如果其他SNP位点在key trait中不显著,但在多于Ap个supportive trait中都显著相关,则这样的SNP位点也加入到显著SNP集合中。
3)partial correlation information theory (PCIT)方法计算gene-gene association,构建基因网络

PCIT方法是基于SNP加性效应计算两两基因间的相关性,如果一个基因内有多个SNP,那么只保留与最多个表型相关的那个SNP。

在第二步中,不但获得了候选SNP位点与各个性状的相关显著性(P value),而且还获得了每个SNP对各个性状的加性效应值。利用每个SNP位点在各个性状的加性效应值,也可以计算SNP间的相关性(基于加性效应的相关性)。

最后利用基因间的相关性构建出了基因-基因相关性网络(下图),该网络包含955个基因和10927对关系(|PC|>0.8),10个hub基因连通性大于80,包括LIMK2, SRGAP1, ANKRD40, UGCGL2, PARK2, FYN, FAM48A, RIMS3, AGPS和SESTD1。



4)网络中基因的功能分析

最后,利用cytoscape插件Network Analyzer、DAVID、IPA进行GO和pathway富集分析。

IPA分析结果显示,网络中的基因显著富集于100条信号通路,这些信号通路与细胞功能与维持相关。其中最显著的pathway是蛋白激酶A信号通路和“Cellular effects of Sildenafil”信号通路(fig 4)。



“Cellular effects of Sildenafil”信号通路中的16个组分是由网络中的基因编码的(fig 5)。



另外,IPA还鉴定出314个上游转录调控因子显著调控网络中的基因。其中,TP53和TGFB1基因是对饲料效率具有最显著调控作用的两个上游基因,说明了这两个转录因子和生长因子在影响饲料效率上具有重要的调控作用。
文章小结:

  1. 饲料效率的遗传差异与细胞功能和维持等生物过程相关;
  2. TP53和TGFB1基因是对饲料效率具有最显著调控作用的两个上游基因,说明这两个转录因子和生长因子在影响饲料效率上具有重要的调控作用;
  3. NCAPG I442M和GDF8 Q204X位点与剩余采食量和饲料效率密切相关。


结论

这篇文章联合了表型、代谢型、基因型来研究饲料效率的遗传机制,寻找潜在调控饲料效率的基因以及基因间的相互作用关系。这篇文章不仅在联合表型、代谢组和基因组的mGWAS研究方法上是一个很好的参考,并且提供了微效多基因控制的性状如何研究的思路,建议大家下载下来认真解读哈。

另外,在畜牧业的研究中,代谢组不仅可以与基因组联合分析,还可以与转录组、蛋白组、16S等其他组学进行关联分析,在畜禽生长发育 、抗疾病抗环境胁迫、营养健康、提高产量、食品安全方面都有广泛的应用。想了解更多的同学,请密切关注我们近期的代谢组宣讲。

参考文献:

【1】Widmann P, Reverter A, Weikard R, et al. Systems biology analysis merging phenotype, metabolomic and genomic data identifies Non-SMC Condensin I Complex, Subunit G (NCAPG) and cellular maintenance processes as major contributors to genetic variability in bovine feed efficiency.[J]. Plos One, 2015, 10(4):e0124574.


    关注 基迪奥生物


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册