欢迎关注”生信修炼手册”!
Beagle是基因型填充常用的软件之一,最新版本为V5.1, 在准确率和运行速度上都有了很大提升,对应的文章链接如下
https://www.cell.com/ajhg/pdfExtended/S0002-9297(18)30242-8
软件的官网如下
https://faculty.washington.edu/browning/beagle/beagle.html
相比同类软件,该软件有两个显著的优势,第一个就是内存消耗小,第二个运行速度快。对于数据量如此大的reference panel数据,提出了一种新的数据存储格式bref3。文章中比较了不同格式消耗的内存大小,结果如下
可以看到,bref3格式的内存消耗最小。关于运行时间的比较结果如下
可以看到Beagle 5.0版本的运行时间最短。该软件采用java语言进行开发,安装简单,直接下载jar文件即可。基本用法如下
java \-jar beagle.24Aug19.3e8.jar \
ref=chr1.1kg.phase3.v5a.b37.bref3 \
map=plink.GRCh38.map \
gt=input.chr1.vcf.gz \
out=out.chr1.gt
ref参数指定reference panel的数据,支持vcf和bref3两种格式,官网提供了1000G的数据供下载,链接如下
http://bochet.gcc.biostat.washington.edu/beagle/1000_Genomes_phase3_v5a/
map参数指定参考基因组的连锁图谱,是一个可选参数,官网提供了human对应的连锁图谱,链接如下
http://bochet.gcc.biostat.washington.edu/beagle/genetic_maps/
gt参数指定需要填充的study样本的分型结果,格式为VCF, out参数指定输出结果的前缀,填充后的分型结果格式为VCF, 更多细节请参考官方说明文档,链接如下
https://faculty.washington.edu/browning/beagle/beagle_5.1_12Aug19.pdf
Beagle拥有最快的运行速度和最小的硬件资源消耗,当需要快速进行基因型填充时,该软件是最佳选择。
·end·