heritability,翻译为遗传力, 用来描述表型变异中遗传变异的比例。众所周知,表型(P)由基因型(G)和环境因素(E)共同控制, 即
P = G + E
遗传力就是基因G所占的比例,具体的,通过方差来描述遗传变异和表型变异,则遗传力的公式如下
分子为一组样本基因型的方差,分母为表型的方差。方差表征的是一组样本的离散程度,所以遗传力是一个针对群体的概念,通过该公式计算出来的遗传力也称之为广义遗传力。
除了广义遗传力外,还有其他几种遗传力的定义。首先是与之相对的—狭义遗传力。表型往往是由多个基因共同控制的,在衡量多个基因的共同作用时,常使用加性模型,同时还会考虑显隐性等遗传模式,相互作用等因素,对应的公式如下
然而这样的公式过于复杂,在实际情况下很难去精确计算,为了简化计算,只考虑加性模型,即
此时得到的遗传力就是狭义遗传力,当然无论是广义遗传力还是狭义遗传力,它们更多的是考虑遗传效应,没有将遗传变异与表型的关联信息考虑进去。
随着GWAS的大规模应用,我们可以方便快速的得到SNP位点与表型的关联信息。在此基础上,科学家提出了SNP heritability的概念,即SNP遗传力,公式如下
用SNP位点来表征样本的遗传变异,在描述SNP位点和表型的关联性时,采用加性模型,将表型y看做是多个位点效应相加的结果
则SNP遗传力可以用以下公式进行表示
需要注意的是,这里的SNP位点是属于一个集合的,是部分位点,而具体是哪些位点取决于两个因素:第一个是检测到的SNP位点数量,芯片,NGS不同平台检测到的位点数不同;第二个是估算SNP遗传力的算法。目前有以下两种算法
后续在详细介绍。在SNP遗传力的基础上,又衍生出了以下概念
类似PRS, 用筛选过的与表型关联的SNP来计算遗传力。上述几种遗传力的关系如下
这个从对应的公式也可以看出,考虑的因素逐级递减。量化遗传力的大小,可以更加方便的探究遗传因素,环境因子与表型之间的关系。
·end·
生物信息入门
只差这一个
公众号