返回数据库导航

Database Tutorial

GDC / TCGA肿瘤组学Database Tutorial

下载 TCGA 表达矩阵

做肿瘤差异表达、生存分析或免疫浸润分析前,获取 TCGA RNA-seq 数据。

数据库
GDC / TCGA
资源类型
肿瘤组学
地区
USA
推荐等级
5/5

Quick Steps

教程步骤速览

先快速看完整操作路径,再进入下方详细教程。

  1. STEP 1

    进入 GDC Portal,选择 Program = TCGA 和目标癌种项目。

  2. STEP 2

    在 Data Category 中选择 Transcriptome Profiling。

  3. STEP 3

    选择 HTSeq Counts 或 STAR Counts 后加入 Cart,并下载 manifest。

Example Query

示例查询

复制这个关键词或编号,可以快速进入数据库检索练习。

TCGA-LUAD + Transcriptome Profiling + STAR Counts

Tutorial

数据库使用教程

按教程完成检索、筛选、下载和结果确认。

下载 TCGA 表达矩阵

适用场景

当你要做肿瘤差异表达、生存分析、分型比较、免疫浸润或候选基因验证时,可以从 GDC 下载 TCGA RNA-seq 数据。

Portal 操作步骤

  1. 打开 GDC Repository。
  2. Program 选择 TCGA
  3. Project 选择癌种,例如 TCGA-LUAD
  4. Data Category 选择 Transcriptome Profiling
  5. Data Type 选择 Gene Expression Quantification
  6. Workflow Type 选择 STAR - Counts
  7. Add to Cart,下载 Manifest。

GDC Client 下载

gdc-client download -m gdc_manifest.txt -d gdc_download

下游整理思路

  1. 合并每个样本的 gene count 文件。
  2. 区分 primary tumor 和 solid tissue normal。
  3. 用 DESeq2 或 edgeR 做差异分析。
  4. 结合临床表做生存或分期关联。

注意事项

  • TCGA barcode 前 12 位代表 patient,前 16 位区分样本类型。
  • Tumor/Normal 比较必须检查样本类型代码。
  • 不同 GDC workflow 版本不要混用。