你与候选基因差了一个Bin map

 

今天来把这节课补上~...





重测序图谱有个很特别的东西就是Bin map,为什么同样是遗传图谱,基于SSR或者是简化技术开发的SNP就很少见到Bin map,而重测序技术却能构建Bin map呢?

首先,我们来了解一下bin的含义:

bin map

重组断点图谱,是指利用高通量测序技术在低测序深度下获得群体内个体的SNP信息,将一定物理距离(如100k)的染色体看成是一个重组事件的最小单位bin (Recombination bin),该bin内可以简并大量SNP信息,然后判断每个bin来源于父母本哪一方,并以此构建以SNP信息为基础、bin为最小重组单位的群体遗传连锁图谱。

Bin map(红绿颜色分别代表来自不同亲本)


知道了Bin的概念,篇首的问题就很明了了,重测序技术能够在全基因组范围内检测SNP和其它类型的变异信息,检测到的变异信息远远超过重组时间的数目,大量的SNP可能是共分离的关系,通过bin的方式将连续不重组的SNP聚合到一个单元内,每一个单元即为一个bin。

那么反应快的同学就有一个问题了,我们获得的QTL定位结果是基于遗传距离还是基于Bin的物理位置呢?

能想到这个问题的童鞋图谱君为你手动点赞。在最开始进行QTL定位的时候,很多物种是没有参考基因组的,遗传距离的出现为定位的精细度提供了一个很好的量化指标,而现在大量物种的基因组序列不断被攻克,特别是对中小基因组的物种,我们通过重测序的方法进行QTL定位直接获得候选区间的序列信息,比如100kb,这时候遗产距离的概念就得到一个弱化。

Bin map构建流程
目前Bin map在水稻、大豆等中小基因组物种中得到了非常广泛的应用,其中比较经典的一篇是中科院韩斌老师对于Bin map的深度解析:

基于二代测序技术对150个水稻RIL群体株系进行了0.02X测序,拼接全部测序结果后与亲本序列信息进行比对,基于滑动窗口(Sliding window)方法,即定义一个包含多个被测序的已知SNP位点的窗口,对窗口中所有SNP的基因型进行统计分析,从而根据SNP的基因型比率确定窗口所在区段的基因型,由此,对150个RIL株系测序数据进行基因分型,共得到1,493,461个SNP,RIL中SNP的平均密度为25个SNPs/Mb,并确定了 5074个重组断点,最终构建了包含2334个bin,平均距离为0.66 cM,覆盖基因组长度为1539.5 cM,结合表型数据成功将水稻“绿色革命”矮杆株高基因sdl定位到了第1染色体的100 kb区域范围内。

随着测序成本的大幅下降,目前基于Bin map进行QTL定位的文章数不胜数,亮点各不相同,篇篇都是精华,感兴趣的同学可以回复单位+邮箱,图谱君手上的经典干货吐血献上。



长按识别指纹加关注
为您的科研保驾护航


    关注 百迈客基因科技


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册