群体遗传进化分析笔记(三) 关于群体选择消除分析的一些概念知识
文章目录
选择清除分析(select sweep)是我们研究群体进化过程中哪些突变有利哪些突变受筛选的一种有效的分析方式,帮助我们筛选一些群体突变基因。总之,当一个有利突变发生后,这个突变基因的适合度越高,就越容易被选择固定。当这个基因被快速固定之后,与此基因座连锁的染色体区域,由于搭车效应也被固定下来,大片紧密连锁的染色体区域因此失去多态性,这种由于搭车效应引起多态性下降的现象,遗传上称为选择清除。
选择(selection)是物种进化的强大动力,选择就 是有条件的筛选。在动植物群体的研究当中,根据 选择作用力的来源分可为自然选择和人工选择。
自然选择:生物在生存斗争中适者生存、不适者被淘汰的现象,最初由达尔文提出。适应性进化研究 人工选择:人工选择是指针对特定性状进行育种, 使这些性状的表现逐渐强化,而人们不需要的性状 则可能逐渐消失的过程。动植物驯化机制研究。
选择对于物种分子水平上的影响
根据被选择等位基因或单倍型频率的变化方向,选择又可以被分为正向选择 (positive selection)、负向选择(negative selection)和平衡选择(balancing selection)。
正向选择是选择中最常见的一种形式,当群体中出现新的有利突变时,具有该突变的个体将 比其它个体留下更多的子代,而突变最终在整个群体中扩散。目前,绝大多数的选择信号检 验方法都是针对正选择
负向选择是指群体中的某种表型性状不再适应目前环境或育种需求时,与该性状相关联的等 位基因频率将会降低或甚至淘汰的过程,因此也被称为净化选择(purifying selection)
平衡选择:当一个基因座上,两个等位基因均表现出相同的适应性时,群体中的这些位点将 始终在选择的作用下保持一定的遗传多态、处于一定的动态平衡
选择对物种分子水平的影响主要有这些:引起选择清除(select sweep)、引起遗传多样性降低、引起连锁不平衡增加、 引起搭便车效应(hitchhiking effort)、 引起等位基因频率变化
正选择检验方法
正向选择检验过程中主要有基于群体多样性的方法比如π/ θ π 、Fst,ROD等;还有基于位点频谱SFS变化的方法比如CLR,XPCLR, ZHp,Tajima’s D这些,而基于LD的方法(XPEHH)可以很有效的分割野生种群和驯化种群。
基于多样性降低筛选受选择的区域
Fst 和 pi/π/ θ π作为三个重要选择参数,其计算公式和概念如下:
π/ θ π:衡量特定群体多态性高低的参数,是指在同 一群体中随机挑选的两条DNA序列在各个核苷酸位点 上核苷酸差异的均值。受人工选择的群体,遗传多样性相对单一,θπ值较小; 野生群体遗传多样性大,θπ值比较大。
群体间遗传分化指数(Fst):是种群分化和遗传距 离的一种衡量方法。Fst介于0~1之间,越接近1表示 两个群体之间分化程度越大。
ROD:the reduction of diversity,基于野生群体和驯化群体间核酸多样性 π/ θ π差异作为选择信号:
基于位点频谱(SFS)变化 筛选受选择的区域
位点频谱SFS(Site Frequency Spectrum):等位基因频率差异。从下图中可以看到,灰色的圆圈代表群体的中性突变位点, 黑色的则是有益位点。从1-6整个过程我 们可以看到,有益位点在群体中频率越来 越高,同时其相邻位点的多态性也变得保 守。由于染色体重组使得先前仅携带中性 突变位点的个体体也获得了有益位点。6 图中的灰色区域就是SFS由低到高的区域。
检验方法:复合似然比检验 CLR ( composite likelihood ratio test )
XP-CLR:基于群体等位基因频率谱分析,英文全称cross-population composite likelihood ratio test,译为跨群体的复合似然比 检验,是从CLR分析的基础上发展而来,是探测群 体间的多等位基因频率差异的方法。CLR只是探测给定群体内的SFS,无法计算群体间 的,所以就有了XP-CLR。群体间选择清除好处在 于有个与研究性状相反的参照群体,可以「降低假 阳性且更容易找到与目标性状相关的受选择区域」。通过计算群体中多位点频率的高低,确定基因组受选择区域。
tajima’sD 检验筛选候选区域
中性检验:以中性进化学说作为零假设,通过统计检验的方法检测一个群体的遗传参数是否符合中性 进化模型,如果不符合表明有选择效应的存在。
Tajima’s D:一种最常用的中性检验,通过比较群体多样性的两个估计值π 和θw的差异检测正选择 信号
π:基于群体中任意两个个体序列的差异位点数的平均值计算的。 受中等频率等位基因影响大
θW:基于群体中全部个体序列中差异位点个数计算的值。 受低频等位基因影响大
群体多样性π 与θw 计算原理
θW:基于群体中全部个体序列中差异位点个 数计算的值。 受低频等位基因影响大
π:基于群体中任意两个个体序列的差异位 点数的平均值计算的。 受中等频率等位基因影响大
可以看出,上面两个参数都是由基因频率计算而来,而基因频率又与序列中位点出现的次数和序列长度有关,因此有以下公式:
基于LD增加的筛选
XP-EHH: Cross-Population Extended Haplotype Homozygosity (XPEHH):群体间扩展单倍 型纯合度法(XP-EHH)是在原有 EHH 方法上提出的一种新的基于连锁不平衡计算两个群 体间近期发生选择信号的方法。XP-EHH 值用来检测在一个群体中为纯合而在另一个群体 中为多态的处于选择固定阶段的位点,值越大,受选择程度越高。
总结
本篇主要记录了在学习组学大讲堂课程《群体遗传进化学》中对于选择清除分析的内容,大部分是对课程上ppt的记录,但是总体结构和一些知识的串接还是自己想了想怎么理解,个人想法是,筛选的理论基础还是来自于基因频率的各项假说和对于筛选参数计算公式的推演,在此基础上得出每个群体筛选出来的基因才能证明是在漫长进化历史当中受选择的有利基因或者发生突变的位点。对此,我有一点理解,基因的区间按道理来说比SNP位点要长,是不是说就是基因的突变其实就是SNP位点不断发生突变从而积累从而发生的区间的改变,从而影响了整个基因在基因组分布上的频率。
文章作者 craftor18
上次更新 2023-02-12