← 返回软件与算法资源类型 命令行软件 方法分类 变异检测 原始分类 Variant Calling 创建时间 2026/6/3
Software & Algorithm Detail
变异检测Variant Calling命令行软件
GATK HaplotypeCaller
GATK 体系中用于 germline SNV/Indel 检测的核心工具,常见于 WGS/WES 流程。
Benchmark
性能基准测试
当前图表用于比较不同数据规模下的时间消耗和内存消耗。
性能基准测试
GATK 4 / 32 threads / GRCh38 resource bundle
Documentation
软件原理、用法与参数
统一使用 Markdown 文档渲染,保留命令行代码块、参数表和示例说明。
GATK HaplotypeCaller
工具定位
HaplotypeCaller 是标准 germline variant calling 的核心模块,适合单样本或 GVCF 联合分析流程。
核心思想
在活跃区域局部重组装 haplotype,再对 reads 与候选 haplotype 进行概率建模并输出变异。
输入与输出
| 数据对象 | 说明 |
|---|---|
| BQSR 后 BAM | 上游分析输入 |
| 参考基因组 FASTA | 上游分析输入 |
| GVCF | 下游解读结果 |
| cohort VCF | 下游解读结果 |
示例命令
gatk HaplotypeCaller -R GRCh38.fa -I sample.bam -O sample.g.vcf.gz -ERC GVCF
gatk GenotypeGVCFs -R GRCh38.fa -V cohort.g.vcf.gz -O cohort.vcf.gz
解读要点
- GATK 参考资源、known-sites 和基因组版本必须一致。
- 队列项目建议使用 GVCF joint genotyping。
- 硬过滤或 VQSR 阈值要按项目规模和物种资源选择。