返回分析流程中心

Pipeline Detail

RNA-Seq转录组基础与表达变化

lncRNA/circRNA/miRNA 非编码 RNA 分析

整合 lncRNA、circRNA 和 miRNA 的非编码 RNA 分析流程,覆盖数据类型判断、表达定量、差异分析、靶基因预测、ceRNA 网络和可视化解释。

创建时间
2026/6/3
分析难度
中级
推荐场景
转录组分析
预计耗时
1-3 天

Metadata

流程元数据

先看应用场景、输入输出和工具依赖,再进入正文命令细节。

Difficulty

中级

Scenario

转录组分析

Estimated Time

1-3 天

Tools

DESeq2STARStringTieCIRI2miRDeep2

Inputs

FASTQBAMGTF

Workflow DAG

流程图

用步骤节点快速理解这个分析从原始数据到结果报告的流转关系。

STEP 1

非编码 RNA 类型判断

STEP 2

数据质控与接头过滤

STEP 3

lncRNA 鉴定/定量

STEP 4

circRNA back-splice 检测

STEP 5

miRNA 定量与 novel miRNA

STEP 6

差异表达分析

STEP 7

靶基因/宿主基因预测

STEP 8

ceRNA/调控网络

STEP 9

富集与报告

Protocol

流程文档

正文保留 Markdown 排版、代码语言标识和表格样式,适合边学边复现。

lncRNA/circRNA/miRNA 非编码 RNA 分析

一、适用场景

非编码 RNA 分析关注不直接编码蛋白、但具有调控作用的 RNA 分子。不同 RNA 类型的数据来源、建库方式和分析工具不同,必须先判断样本属于哪种测序类型。

类型数据特点常见目标
lncRNA-seq通常来自 rRNA depletion 或 strand-specific RNA-seq新 lncRNA 鉴定、差异表达、靶基因预测
circRNA-seq常配合 rRNA depletion,有时 RNase R 处理back-splice junction 检测、差异 circRNA
miRNA-seqsmall RNA,reads 很短,接头占比高known/novel miRNA 定量、靶基因预测

二、整体流程图

flowchart TD
    A[样本与建库类型] --> B[FASTQ QC 和 adapter trimming]
    B --> C{RNA 类型}
    C --> D[lncRNA: STAR/StringTie/FEELnc]
    C --> E[circRNA: CIRI2/find_circ/CIRCexplorer2]
    C --> F[miRNA: miRDeep2/miRge/sRNAbench]
    D --> G[差异 lncRNA]
    E --> H[差异 circRNA]
    F --> I[差异 miRNA]
    G --> J[顺式/反式靶基因]
    H --> K[宿主基因与 miRNA sponge]
    I --> L[miRNA target genes]
    J --> M[ceRNA/调控网络]
    K --> M
    L --> M
    M --> N[富集分析与报告]

三、lncRNA 分析路线

1. 比对和转录本组装

STAR   --runThreadN 16   --genomeDir ref/star_index   --readFilesIn sample_R1.fq.gz sample_R2.fq.gz   --readFilesCommand zcat   --outSAMtype BAM SortedByCoordinate   --outFileNamePrefix star/sample_

stringtie star/sample_Aligned.sortedByCoord.out.bam   -G ref/genes.gtf   -o stringtie/sample.gtf   -p 12

2. 合并转录本并筛选候选 lncRNA

stringtie --merge   -G ref/genes.gtf   -o stringtie/merged.gtf   stringtie/gtf_list.txt

gffcompare   -r ref/genes.gtf   -o stringtie/merged_compare   stringtie/merged.gtf

筛选原则:

条件建议
transcript length>= 200 nt
exon number通常 >= 2 更可靠
coding potentialCPC2、CNCI、PLEK、CPAT 判定为 non-coding
与已知蛋白编码重叠根据 class code 过滤

四、circRNA 分析路线

circRNA 的核心证据是 back-splice junction。

bwa mem -T 19 ref/genome.fa sample_R1.fq.gz sample_R2.fq.gz > sample.sam

CIRI2.pl   -I sample.sam   -O circRNA/sample.ciri.txt   -F ref/genome.fa   -A ref/genes.gtf

也可以使用 STAR chimeric 输出:

STAR   --runThreadN 16   --genomeDir ref/star_index   --readFilesIn sample_R1.fq.gz sample_R2.fq.gz   --readFilesCommand zcat   --chimSegmentMin 10   --chimJunctionOverhangMin 10   --outSAMtype BAM SortedByCoordinate   --outFileNamePrefix star_chim/sample_

circRNA 过滤建议:

  • back-splice junction reads >= 2 或更高。
  • 至少在多个样本中出现。
  • 去除线粒体、低复杂度区域和明显重复区域。
  • 重要候选建议做 divergent primer 验证。

五、miRNA 分析路线

small RNA 数据接头非常明显,必须先 trimming。

cutadapt   -a TGGAATTCTCGGGTGCCAAGG   -m 18   -M 30   -o clean/sample.clean.fq.gz   raw/sample.fq.gz

miRDeep2 示例:

mapper.pl clean/sample.clean.fq.gz   -e -h -j -l 18 -m   -p ref/bowtie_index   -s mirdeep/sample_collapsed.fa   -t mirdeep/sample_vs_genome.arf

miRDeep2.pl   mirdeep/sample_collapsed.fa   ref/genome.fa   mirdeep/sample_vs_genome.arf   mature_ref.fa   mature_other.fa   hairpin_ref.fa   -t hsa

六、差异表达分析

非编码 RNA 差异分析仍然可以使用 DESeq2。

library(DESeq2)

count_data <- read.csv("noncoding_counts.csv", row.names = 1, check.names = FALSE)
sample_info <- read.csv("sample_info.csv", row.names = 1)

dds <- DESeqDataSetFromMatrix(
  countData = round(as.matrix(count_data)),
  colData = sample_info,
  design = ~ condition
)

dds <- dds[rowSums(counts(dds) >= 5) >= 3, ]
dds <- DESeq(dds)

res <- results(dds, contrast = c("condition", "Treat", "Ctrl"))
write.csv(as.data.frame(res), "noncoding_DESeq2_results.csv")

七、靶基因和 ceRNA 网络

RNA 类型靶标策略
lncRNAcis: 上下游 10-100 kb 蛋白编码基因;trans: 表达相关或数据库预测
circRNA宿主基因、miRNA binding site、circRNA-miRNA-mRNA
miRNATargetScan、miRanda、RNAhybrid、miRTarBase

ceRNA 网络示意:

circRNA_001 ↑
    |
    | sponge
    v
miR-21 ↓
    |
    | repression relieved
    v
TargetGeneA ↑

解释:如果 circRNA 上调、miRNA 下调、靶 mRNA 上调,并且三者存在预测结合关系,可以构建候选 ceRNA 调控轴。

八、主要交付物

  • lncRNA/circRNA/miRNA 表达矩阵
  • 差异非编码 RNA 表
  • novel lncRNA / novel miRNA 候选表
  • circRNA back-splice junction 支持表
  • miRNA target gene 表
  • lncRNA cis/trans target 表
  • circRNA-miRNA-mRNA 或 lncRNA-miRNA-mRNA 网络
  • GO/KEGG 富集分析
  • 关键调控轴图和报告