RNA-seq的标准化方法罗列
RNA-seq数据标准化是为了消除实验中不可避免的技术偏差和样本间的生物学变异,以确保基因表达数据的可比性。以下是一些常见的RNA-seq数据标准化方法:
1.RPKM/FPKM (Reads/Fragments Per Kilobase of transcript per Million mapped reads):
考虑了转录本长度和测序深度的影响。
2.TPM (Transcripts Per Million):
类似于FPKM,但在标准化转录本丰度前先进行了长度标准化。
3.CPM (Counts Per Million):
对每个样本的读数计数进行标准化,以每百万映射读数为单位。
4.TMM (Trimmed Mean of M-values):
通过edgeR包计算,用于校正样本间的组成效应。
5.Quantile normalization:
将所有样本的表达分布调整为相同,使它们具有相同的统计特性。
6.DESeq/DESeq2:
使用负二项分布模型对读数计数进行标准化,计算基因表达变化。
7.Upper Quartile normalization:
通过调整样本的上四分位数来标准化计数。
8.Z-score normalization:
计算每个基因在所有样本中的标准分数(z-score)。
9.GC-content normalization:
考虑GC含量对测序覆盖度的影响进行校正。
10.Batch effects normalization:
如Combat等方法,用于校正实验批次效应。
不同的标准化方法适用于不同的数据集和分析目标,选择适当的方法对于获得准确和可重复的结果至关重要。
百泰派克生物科技——生物制品表征,多组学生物质谱检测优质服务商
相关服务:
How to order?