当前位置 : 主页 > 编程语言 > java >

ArrayExpress数库简介

来源:互联网 收集:自由互联 发布时间:2022-06-23
和GEO数据库类似,ArrayExpress是属于EBI旗下的公共数据库,用于存放芯片和高通量测序的相关数据,网址如下 ​​https://www.ebi.ac.uk/arrayexpress/​​ 数据来源于下图所示的两个部分 第一部

和GEO数据库类似,ArrayExpress是属于EBI旗下的公共数据库,用于存放芯片和高通量测序的相关数据,网址如下

​​https://www.ebi.ac.uk/arrayexpress/​​

数据来源于下图所示的两个部分

ArrayExpress数库简介_数据库

第一部分是由科研工作者提交的数据,第二部分是从GEO数据库自动导入的数据,在该数据库中,数据以实验experiments为单位,每个实验对应一个唯一的编号,如下图所示

ArrayExpress数库简介_上传_02

第一列的​​Accession​​​代表每个实验设计对应的编号,​​Assays​​​表示该实验对应的样本总数,​​Raw​​代表原始数据。当前版本数据量如下

ArrayExpress数库简介_数据库_03

通过该数据库,我们可以

  • 检索数据,根据关键字,编号等查找感兴趣的数据集
  • 下载数据,基于公共数据进行分析挖掘
  • 提交数据,上传自己的数据到该数据库中
  • 点击每个实验编号,可以显示详细信息,示意如下

    ArrayExpress数库简介_数据库_04

    红框标记的部分是通常会关注的3个部分,第一部分展示该实验包含的样本的详细信息,点击之后可以查看样本相关的metadata, 示意如下

    ArrayExpress数库简介_数据_05

    第二部分用于下载数据,第三部分用于将该结果导入到其他软件,比如GenomeSpace中进行分析和查看。

    除了下载和分析公共数据集,也可以上传自己的数据到该数据库。除了宏基因组/宏转录组, 转录组组装的相关结果数据,其他绝大部分数据都是可以上传到该数据库的,比如SNP分型,基因表达谱,chip_seq, atac_seq, 甲基化测序等结果都可以。

    该数据库还配套了对应的API和R包,可以批量化,流程化地检索和下载数据,在没有数据的情况下,也可以基于ArrayExpress的公共数据进行深入挖掘。

    ·end·

    ArrayExpress数库简介_上传_06

    【文章原创作者:韩国服务器租用 http://www.558idc.com/lg.html 复制请保留原URL】
    上一篇:肿瘤驱动基因的协同和互斥模式
    下一篇:没有了
    网友评论