当前位置 : 主页 > 编程语言 > java >

GWAMA:GWAS meta-analysis的又一利器

来源:互联网 收集:自由互联 发布时间:2022-06-23
​ meta-analysis对多个独立研究的成果进行综合评估,该技术在医学,心理学等领域早已广泛使用。虽然该技术的理论基础早已成熟,但是在GWAS分析领域,还是有很多困难需要去克服 GW

meta-analysis对多个独立研究的成果进行综合评估,该技术在医学,心理学等领域早已广泛使用。虽然该技术的理论基础早已成熟,但是在GWAS分析领域,还是有很多困难需要去克服

  • GWAS分析SNP位点的数量很大,特别是基因型填充技术的出现,SNP位点数量达到了百万,千万的规模,对于软件而言,运行速度和内存消耗也是巨大挑战
  • 不同study结果的存储格式不尽相同,需要统一的格式转换,特别是链的方向问题,需要调整成一个统一的ref allele
  • GWAS分析结果的准确性问题,群体分层等因素都需要被校正
  • 为了有效的进行分析,我们需要使用成熟软件,本文要介绍的GWAMA就是一款很不错的软件,其运行效率特别高,适合针对大数量的SNP位点进行分析,对应的文章发表在BMC Bioinformatics上,链接如下

    ​​https://bmcbioinformatics.biomedcentral.com/track/pdf/10.1186/1471-2105-11-288​​

    官方网址如下

    ​​https://www.geenivaramu.ee/en/tools/gwama​​

    安装过程如下

    GWAMA:GWAS meta-analysis的又一利器_数据库

    采用C++进行开发,下载源代码解压,编译即可。官网也提供了配套的测试数据,可以用于测试该软件

    GWAMA:GWAS meta-analysis的又一利器_数据_02

    该软件的基本用法如下

    GWAMA:GWAS meta-analysis的又一利器_数据分析_03

    只需要一个输入文件,默认文件名称为gwama.in, 内容示意如下

    GWAMA:GWAS meta-analysis的又一利器_数据_04

    每一行代表一个study的gwas分析结果,对应的文件格式如下

    GWAMA:GWAS meta-analysis的又一利器_数据分析_05

    ​​MARKERNAME​​​代表SNP位点的名称,​​STRAND​​​代表链的方向,​​IMPUTED​​​代表该位点是否是填充得到的,​​EA​​​代表tested allele, ​​NEA​​​代表other allele, 对于连续型的性状,要求输入​​BETA​​​和​​SE​​​两列,对于二分类的性状,要求输入​​OR​​​, ​​OR_95L​​​, ​​OR_95U​​3列,代表odd ratio以及95%置信区间。

    默认输出结果保存在​​gwama.out​​文件中,列数较多,为了方便展示,我这里截取了部分并进行了转置,内容如下

    GWAMA:GWAS meta-analysis的又一利器_数据_06

    另外该软件还支持针对性别进行校正,更多用法请查看官方文档。

    ·end·


    GWAMA:GWAS meta-analysis的又一利器_数据分析_07

    生物信息入门

    只差这一个

    公众号

    上一篇:GWAS样本量不够怎么办,meta分析了解一下
    下一篇:没有了
    网友评论