一、什么是 GDC Legacy Archive

GDC Legacy Archive(GDC 档案)是由美国国家癌症研究所(NCI)和美国国立卫生研究院(NIH)共同建立的一个免费的、可供全球研究者使用的癌症数据库。GDC 档案收集了来自世界各地的癌症研究,包括癌症基因组学、转录组学、外显子组学、表观遗传学、免疫组学和组织学等数据。

二、TCGA 原始数据的下载

要从 GDC Legacy Archive 下载 TCGA 原始数据,首先需要访问 GDC Legacy Archive 网站(https://gdc.cancer.gov/),然后点击“数据”链接,进入 GDC 数据库页面。在这里,您可以搜索、浏览和过滤可用的癌症数据集,以及您可以下载的数据类型。

三、下载 TCGA 原始数据的步骤

1、在 GDC 数据库页面中,搜索“TCGA”,找到“The Cancer Genome Atlas(TCGA)”,点击进入 TCGA 数据集页面。

2、在 TCGA 数据集页面中,您可以看到 TCGA 数据集中可用的癌症研究,包括癌症基因组学、转录组学、外显子组学、表观遗传学、免疫组学和组织学等数据。

3、选择您要下载的癌症数据集,点击“下载”按钮,进入下载页面。

4、在下载页面中,您可以看到要下载的数据集的详细信息,包括数据集的大小、文件格式等。

5、最后,点击“下载数据”按钮,即可开始下载 TCGA 原始数据。