一、什么是GDC Legacy Archive

GDC Legacy Archive(GDC档案)是由美国国家癌症研究所(NCI)和美国国立卫生研究院(NIH)共同建立的一个免费的、可供全球研究者使用的癌症数据库。GDC档案收集了来自世界各地的癌症研究,包括癌症基因组学、转录组学、外显子组学、表观遗传学、免疫组学和组织学等数据。

二、TCGA原始数据的下载

要从GDC Legacy Archive下载TCGA原始数据,首先需要访问GDC Legacy Archive网站(https://gdc.cancer.gov/),然后点击“数据”链接,进入GDC数据库页面。在这里,您可以搜索、浏览和过滤可用的癌症数据集,以及您可以下载的数据类型。

三、下载TCGA原始数据的步骤

1、在GDC数据库页面中,搜索“TCGA”,找到“The Cancer Genome Atlas(TCGA)”,点击进入TCGA数据集页面。

2、在TCGA数据集页面中,您可以看到TCGA数据集中可用的癌症研究,包括癌症基因组学、转录组学、外显子组学、表观遗传学、免疫组学和组织学等数据。

3、选择您要下载的癌症数据集,点击“下载”按钮,进入下载页面。

4、在下载页面中,您可以看到要下载的数据集的详细信息,包括数据集的大小、文件格式等。

5、最后,点击“下载数据”按钮,即可开始下载TCGA原始数据。