← 返回分析流程中心创建时间 2026/6/3 分析难度 中级 推荐场景 转录组分析 预计耗时 1-3 天
Pipeline Detail
RNA-Seq转录组基础与表达变化
lncRNA/circRNA/miRNA 非编码 RNA 分析
整合 lncRNA、circRNA 和 miRNA 的非编码 RNA 分析流程,覆盖数据类型判断、表达定量、差异分析、靶基因预测、ceRNA 网络和可视化解释。
Metadata
流程元数据
先看应用场景、输入输出和工具依赖,再进入正文命令细节。
Difficulty
中级
Scenario
转录组分析
Estimated Time
1-3 天
Tools
DESeq2STARStringTieCIRI2miRDeep2
Inputs
FASTQBAMGTF
Workflow DAG
流程图
用步骤节点快速理解这个分析从原始数据到结果报告的流转关系。
STEP 1
→非编码 RNA 类型判断
STEP 2
→数据质控与接头过滤
STEP 3
→lncRNA 鉴定/定量
STEP 4
→circRNA back-splice 检测
STEP 5
→miRNA 定量与 novel miRNA
STEP 6
→差异表达分析
STEP 7
→靶基因/宿主基因预测
STEP 8
→ceRNA/调控网络
STEP 9
富集与报告
Protocol
流程文档
正文保留 Markdown 排版、代码语言标识和表格样式,适合边学边复现。
lncRNA/circRNA/miRNA 非编码 RNA 分析
一、适用场景
非编码 RNA 分析关注不直接编码蛋白、但具有调控作用的 RNA 分子。不同 RNA 类型的数据来源、建库方式和分析工具不同,必须先判断样本属于哪种测序类型。
| 类型 | 数据特点 | 常见目标 |
|---|---|---|
| lncRNA-seq | 通常来自 rRNA depletion 或 strand-specific RNA-seq | 新 lncRNA 鉴定、差异表达、靶基因预测 |
| circRNA-seq | 常配合 rRNA depletion,有时 RNase R 处理 | back-splice junction 检测、差异 circRNA |
| miRNA-seq | small RNA,reads 很短,接头占比高 | known/novel miRNA 定量、靶基因预测 |
二、整体流程图
flowchart TD
A[样本与建库类型] --> B[FASTQ QC 和 adapter trimming]
B --> C{RNA 类型}
C --> D[lncRNA: STAR/StringTie/FEELnc]
C --> E[circRNA: CIRI2/find_circ/CIRCexplorer2]
C --> F[miRNA: miRDeep2/miRge/sRNAbench]
D --> G[差异 lncRNA]
E --> H[差异 circRNA]
F --> I[差异 miRNA]
G --> J[顺式/反式靶基因]
H --> K[宿主基因与 miRNA sponge]
I --> L[miRNA target genes]
J --> M[ceRNA/调控网络]
K --> M
L --> M
M --> N[富集分析与报告]
三、lncRNA 分析路线
1. 比对和转录本组装
STAR --runThreadN 16 --genomeDir ref/star_index --readFilesIn sample_R1.fq.gz sample_R2.fq.gz --readFilesCommand zcat --outSAMtype BAM SortedByCoordinate --outFileNamePrefix star/sample_
stringtie star/sample_Aligned.sortedByCoord.out.bam -G ref/genes.gtf -o stringtie/sample.gtf -p 12
2. 合并转录本并筛选候选 lncRNA
stringtie --merge -G ref/genes.gtf -o stringtie/merged.gtf stringtie/gtf_list.txt
gffcompare -r ref/genes.gtf -o stringtie/merged_compare stringtie/merged.gtf
筛选原则:
| 条件 | 建议 |
|---|---|
| transcript length | >= 200 nt |
| exon number | 通常 >= 2 更可靠 |
| coding potential | CPC2、CNCI、PLEK、CPAT 判定为 non-coding |
| 与已知蛋白编码重叠 | 根据 class code 过滤 |
四、circRNA 分析路线
circRNA 的核心证据是 back-splice junction。
bwa mem -T 19 ref/genome.fa sample_R1.fq.gz sample_R2.fq.gz > sample.sam
CIRI2.pl -I sample.sam -O circRNA/sample.ciri.txt -F ref/genome.fa -A ref/genes.gtf
也可以使用 STAR chimeric 输出:
STAR --runThreadN 16 --genomeDir ref/star_index --readFilesIn sample_R1.fq.gz sample_R2.fq.gz --readFilesCommand zcat --chimSegmentMin 10 --chimJunctionOverhangMin 10 --outSAMtype BAM SortedByCoordinate --outFileNamePrefix star_chim/sample_
circRNA 过滤建议:
- back-splice junction reads
>= 2或更高。 - 至少在多个样本中出现。
- 去除线粒体、低复杂度区域和明显重复区域。
- 重要候选建议做 divergent primer 验证。
五、miRNA 分析路线
small RNA 数据接头非常明显,必须先 trimming。
cutadapt -a TGGAATTCTCGGGTGCCAAGG -m 18 -M 30 -o clean/sample.clean.fq.gz raw/sample.fq.gz
miRDeep2 示例:
mapper.pl clean/sample.clean.fq.gz -e -h -j -l 18 -m -p ref/bowtie_index -s mirdeep/sample_collapsed.fa -t mirdeep/sample_vs_genome.arf
miRDeep2.pl mirdeep/sample_collapsed.fa ref/genome.fa mirdeep/sample_vs_genome.arf mature_ref.fa mature_other.fa hairpin_ref.fa -t hsa
六、差异表达分析
非编码 RNA 差异分析仍然可以使用 DESeq2。
library(DESeq2)
count_data <- read.csv("noncoding_counts.csv", row.names = 1, check.names = FALSE)
sample_info <- read.csv("sample_info.csv", row.names = 1)
dds <- DESeqDataSetFromMatrix(
countData = round(as.matrix(count_data)),
colData = sample_info,
design = ~ condition
)
dds <- dds[rowSums(counts(dds) >= 5) >= 3, ]
dds <- DESeq(dds)
res <- results(dds, contrast = c("condition", "Treat", "Ctrl"))
write.csv(as.data.frame(res), "noncoding_DESeq2_results.csv")
七、靶基因和 ceRNA 网络
| RNA 类型 | 靶标策略 |
|---|---|
| lncRNA | cis: 上下游 10-100 kb 蛋白编码基因;trans: 表达相关或数据库预测 |
| circRNA | 宿主基因、miRNA binding site、circRNA-miRNA-mRNA |
| miRNA | TargetScan、miRanda、RNAhybrid、miRTarBase |
ceRNA 网络示意:
circRNA_001 ↑
|
| sponge
v
miR-21 ↓
|
| repression relieved
v
TargetGeneA ↑
解释:如果 circRNA 上调、miRNA 下调、靶 mRNA 上调,并且三者存在预测结合关系,可以构建候选 ceRNA 调控轴。
八、主要交付物
- lncRNA/circRNA/miRNA 表达矩阵
- 差异非编码 RNA 表
- novel lncRNA / novel miRNA 候选表
- circRNA back-splice junction 支持表
- miRNA target gene 表
- lncRNA cis/trans target 表
- circRNA-miRNA-mRNA 或 lncRNA-miRNA-mRNA 网络
- GO/KEGG 富集分析
- 关键调控轴图和报告