返回软件与算法

Software & Algorithm Detail

表达定量Quantification命令行软件

Salmon

无需传统比对的转录本定量工具,常与 tximport 和 DESeq2 构成快速 RNA-seq 流程。

资源类型
命令行软件
方法分类
表达定量
原始分类
Quantification
创建时间
2026/6/3

Benchmark

性能基准测试

当前图表用于比较不同数据规模下的时间消耗和内存消耗。

性能基准测试

12 threads / 64GB RAM / selective alignment

Benchmark

Documentation

软件原理、用法与参数

统一使用 Markdown 文档渲染,保留命令行代码块、参数表和示例说明。

Salmon 转录本定量

工具定位

Salmon 是快速 transcript-level quantification 工具,常用于 Salmon -> tximport -> DESeq2 流程。它不需要传统 genome BAM,适合大批量样本快速定量。

适用场景

  • 适合:bulk RNA-seq 快速定量、转录本层面 TPM、gene-level DEG 上游输入。
  • 不适合:必须检查 read coverage、剪接位点、融合基因或 IGV 可视化的项目。

输入与输出

类型文件说明
输入transcripts.fa转录本序列
输入sample_R1.fq.gz, sample_R2.fq.gz双端 FASTQ
输出quant.sfTPM、NumReads、EffectiveLength
输出aux_info/运行信息和偏倚模型

安装方式

mamba create -n salmon-rnaseq -c bioconda -c conda-forge salmon fastqc multiqc
conda activate salmon-rnaseq
salmon --version

推荐项目目录

project_salmon/
├── 00_rawdata/
├── 01_reference/
│   └── transcripts.fa
├── 02_salmon_index/
├── 03_quant/
└── scripts/

最小可运行示例

salmon index \
  -t 01_reference/transcripts.fa \
  -i 02_salmon_index \
  -k 31

salmon quant \
  -i 02_salmon_index \
  -l A \
  -1 00_rawdata/sample_R1.fq.gz \
  -2 00_rawdata/sample_R2.fq.gz \
  -p 12 \
  --validateMappings \
  -o 03_quant/sample

常用参数表

参数含义推荐值注意事项
-t转录本 FASTAEnsembl/GENCODE transcriptome与 tx2gene 注释保持一致
-i索引目录02_salmon_index同一参考只建一次
-kk-mer 长度31reads 很短时可适当降低
-l文库类型A自动推断,正式项目仍建议记录
--validateMappingsselective alignment建议开启提高定量准确性
--gcBiasGC 偏倚校正可开启样本偏倚明显时有帮助
--seqBias序列偏倚校正可开启常用于正式 RNA-seq 项目
-p线程数8-16大队列可并行样本

结果解读

  • TPM:适合样本内或展示表达量,不建议直接用于 DESeq2 差异检验。
  • NumReads:可通过 tximport 汇总到 gene 层面,作为 DESeq2 输入。
  • EffectiveLength:反映转录本有效长度,受 bias correction 影响。

常见错误

问题可能原因解决办法
mapping rate 低transcriptome 版本或物种错误检查 FASTQ 来源和 transcript FASTA
tximport 基因 ID 对不上tx2gene 表不匹配从同一 GTF 生成 tx2gene
DEG 与 STAR 流程差异大isoform 汇总策略不同检查 tximport 参数和过滤策略

关联流程

  • Salmon + tximport + DESeq2
  • Bulk RNA-seq 标准差异表达分析增强版