计算Fst,Pi,Tajimi'D based on SNP vcf file
标签:
bioinformatics |
分类:bioinformatics |
Fst:
Fst(Fixation index)通常用来衡量population之间的geneticdistance。1说明两个population是完全独立的。0说明两个population之间自由interbreeding。Fst值越大,说明geneticdistance越远。值越低,说明大多数的genetic variation是发生在同一个population的。
Tajimi'D:
Tajimi's D是一种统计检验。它主要用来区分一个DNAsequence是random还是non-randon进化的,是不是directionalselection。T=0说明没有进行选择,T>0说明sudden populationcontraction,而<0则说明population expansion after a recentbottleneck。
Pi主要用来衡量每个site的nucleotide divergency。
这几个参数同样可以通过vcftools来计算:
vcftools:
vcftools --vcf test.vcf --window-pi3000 --out Tenera
vcftools --vcf test.vcf --TajimaD3000 --out Tenera
vcftools --vcf test.vcf --weir-fst-pop A2.txt --weir-fst-popA134567.txt --fst-window-size 3000 --outA2.all.Fst
通过一些参数的设置,我们可以删选出positive selection的区域,从而进行关联分析,找到可能起作用的gene。