单细胞转录组数据的counts,TPM,log-TPM的概率分布都是怎样的?
- Counts是指在每个基因上观察到的RNA分子的数量。它是通过对测序数据进行基因定量得到的。
- 在单细胞转录组数据中,counts的概率分布通常是离散的,因为它是整数值。每个基因的counts值可以从0开始一直到非常高的数字。
- 在一个细胞中,每个基因的counts值可以表示该基因在该细胞中的表达水平。而在整个单细胞数据集中,每个基因的counts值的分布可以反映基因在整个细胞群体中的表达模式。
- TPM是一种归一化的表达方式,它将每个基因的表达量除以总的转录本数,并乘以一个标准化因子,通常是1,000,000。
- TPM的概率分布是连续的,因为它是一个相对表达量的度量,可以取任意实数值。
- TPM的优点是可以比较不同基因在同一样本中的表达水平,以及在不同样本之间的表达差异,而不受基因长度和测序深度的影响。
- Log-TPM是对TPM进行对数变换得到的表达方式,常用于降低表达量的偏斜性和增加低表达基因的可比性。
- Log-TPM的概率分布也是连续的,因为它是对TPM进行变换得到的。
- Log-TPM的优点是可以更好地适应正态分布的假设,使得后续的统计分析更加可靠。
1.Counts(计数):
2.TPM(每百万转录本数):
3.Log-TPM(TPM的对数):
counts的概率分布是离散的,TPM和log-TPM的概率分布是连续的。在单细胞转录组数据分析中,我们可以根据具体的研究目的和分析方法选择合适的表达方式。
百泰派克生物科技——生物制品表征,多组学生物质谱检测优质服务商
相关服务:
提交需求
How to order?