当前位置 : 主页 > 编程语言 > java >

使用Beagle进行基因型填充

来源:互联网 收集:自由互联 发布时间:2022-06-23
欢迎关注”生信修炼手册”! Beagle是基因型填充常用的软件之一,最新版本为V5.1, 在准确率和运行速度上都有了很大提升,对应的文章链接如下 ​​https://www.cell.com/ajhg/pdfExtended/S0002-9


欢迎关注”生信修炼手册”!

Beagle是基因型填充常用的软件之一,最新版本为V5.1, 在准确率和运行速度上都有了很大提升,对应的文章链接如下

​​https://www.cell.com/ajhg/pdfExtended/S0002-9297(18)30242-8​​

软件的官网如下

​​https://faculty.washington.edu/browning/beagle/beagle.html​​

相比同类软件,该软件有两个显著的优势,第一个就是内存消耗小,第二个运行速度快。对于数据量如此大的reference panel数据,提出了一种新的数据存储格式​​bref3​​。文章中比较了不同格式消耗的内存大小,结果如下

使用Beagle进行基因型填充_ios

可以看到,bref3格式的内存消耗最小。关于运行时间的比较结果如下

使用Beagle进行基因型填充_ios_02

可以看到Beagle 5.0版本的运行时间最短。该软件采用java语言进行开发,安装简单,直接下载jar文件即可。基本用法如下

java \
-jar beagle.24Aug19.3e8.jar \
ref=chr1.1kg.phase3.v5a.b37.bref3 \
map=plink.GRCh38.map \
gt=input.chr1.vcf.gz \
out=out.chr1.gt

​​ref​​参数指定reference panel的数据,支持vcf和bref3两种格式,官网提供了1000G的数据供下载,链接如下

​​http://bochet.gcc.biostat.washington.edu/beagle/1000_Genomes_phase3_v5a/​​

使用Beagle进行基因型填充_ios_03

​​map​​参数指定参考基因组的连锁图谱,是一个可选参数,官网提供了human对应的连锁图谱,链接如下

​​http://bochet.gcc.biostat.washington.edu/beagle/genetic_maps/​​

使用Beagle进行基因型填充_官网_04

​​gt​​​参数指定需要填充的study样本的分型结果,格式为VCF, ​​out​​参数指定输出结果的前缀,填充后的分型结果格式为VCF, 更多细节请参考官方说明文档,链接如下

​​https://faculty.washington.edu/browning/beagle/beagle_5.1_12Aug19.pdf​​

Beagle拥有最快的运行速度和最小的硬件资源消耗,当需要快速进行基因型填充时,该软件是最佳选择。

·end·

使用Beagle进行基因型填充_ios_05

网友评论