GDC Legacy Archive是一个用于存储和共享遗传信息的在线数据库。该数据库包含了全球癌症基因组图谱计划(The Cancer Genome Atlas, TCGA)的原始数据,这些数据对于癌症研究非常重要。本文将介绍如何通过GDC Legacy Archive下载TCGA原始数据。

1. 访问GDC Legacy Archive

要下载TCGA原始数据,首先需要访问GDC Legacy Archive的网站。可以在任意现代浏览器中输入网址直接进入GDC Legacy Archive的页面。

2. 选择数据类型和项目

GDC Legacy Archive存储了大量的TCGA数据,包括基因表达、基因变异等多种数据类型。在页面中的“Data”菜单中,可以选择所需的数据类型,如“Gene Expression”, “Mutation”, “Copy Number Variation”等。

在选择完数据类型后,还需要选择具体的项目。可以在右侧的“Filters”中,根据研究案例、癌症类型、样本分组等条件进行筛选,以找到自己感兴趣的数据。

选择完数据类型和项目后,可以点击页面右上方的“Add All Files to Cart”按钮,将选择的数据添加到购物车中。

3. 下载数据

在购物车中可以查看已添加的数据,并可以进行进一步的筛选和组织。选择完所需的数据后,点击页面右上方的“Download”按钮。

在下载页面中,可以选择数据的文件格式(如BAM、VCF等),以及选择要下载的数据文件。同时,还可以选择数据的筛选条件,如限定某个特定的样本类型,或者特定的数据文件大小等。

选择完相关参数后,点击页面底部的“Submit”按钮,即可开始下载TCGA原始数据。

以上就是通过GDC Legacy Archive下载TCGA原始数据的步骤。通过访问GDC Legacy Archive网站,选择数据类型和项目,然后将数据添加到购物车,并选择格式和筛选条件,最后点击下载按钮即可获得所需的数据。使用这些数据可以进行进一步的癌症研究和分析。