← 返回数据库导航数据库 GEO 资源类型 转录组表达 地区 USA 推荐等级 5/5
Database Tutorial
GEO转录组表达Database Tutorial
下载 GEO 表达矩阵
快速获取论文已整理好的表达矩阵,用于差异分析、WGCNA 或验证候选基因。
Quick Steps
教程步骤速览
先快速看完整操作路径,再进入下方详细教程。
- STEP 1
用 GSE 编号进入 GEO Series 页面。
- STEP 2
查看 Supplementary files 是否包含表达矩阵或 count matrix。
- STEP 3
下载 matrix 后检查样本分组、探针注释和基因 ID 类型。
Example Query
示例查询
复制这个关键词或编号,可以快速进入数据库检索练习。
GSE + expression matrix + sample metadata
Tutorial
数据库使用教程
按教程完成检索、筛选、下载和结果确认。
下载 GEO 表达矩阵
适用场景
当你想快速复用公开表达数据做差异分析、WGCNA、免疫浸润或候选基因验证时,优先查看 GEO 是否提供整理好的表达矩阵。
操作步骤
- 打开 GEO,输入 GSE 编号。
- 在 Series 页面查看实验设计、样本分组和平台信息。
- 找到 Supplementary files,下载 count matrix、TPM matrix 或 normalized matrix。
- 下载 sample metadata,整理 group、batch、treatment 等字段。
- 检查表达矩阵是 raw counts、TPM 还是芯片 normalized intensity。
R 读取示例
expr <- read.delim("GSE_expression_matrix.tsv", row.names = 1, check.names = FALSE)
meta <- read.delim("GSE_sample_metadata.tsv")
dim(expr)
head(meta)
判断能否用于 DESeq2
| 数据类型 | 能否直接用于 DESeq2 |
|---|---|
| raw counts | 可以 |
| TPM/FPKM | 不建议 |
| normalized microarray | 不可以,用 limma |
常见问题
- GEO 矩阵列名与样本表不一致时,先建立 GSM 到 sample name 的映射。
- 芯片数据需要探针注释,不要直接把 probe ID 当 gene symbol。
- 如果只有 SRA 链接,没有矩阵,需要走 SRA/ENA 下载 FASTQ 重新分析。