单细胞转录组数据的counts,TPM,log-TPM的概率分布都是怎样的?

    1.Counts(计数):

    • Counts是指在每个基因上观察到的RNA分子的数量。它是通过对测序数据进行基因定量得到的。
    • 在单细胞转录组数据中,counts的概率分布通常是离散的,因为它是整数值。每个基因的counts值可以从0开始一直到非常高的数字。
    • 在一个细胞中,每个基因的counts值可以表示该基因在该细胞中的表达水平。而在整个单细胞数据集中,每个基因的counts值的分布可以反映基因在整个细胞群体中的表达模式。

    2.TPM(每百万转录本数):

    • TPM是一种归一化的表达方式,它将每个基因的表达量除以总的转录本数,并乘以一个标准化因子,通常是1,000,000。
    • TPM的概率分布是连续的,因为它是一个相对表达量的度量,可以取任意实数值。
    • TPM的优点是可以比较不同基因在同一样本中的表达水平,以及在不同样本之间的表达差异,而不受基因长度和测序深度的影响。

    3.Log-TPM(TPM的对数):

    • Log-TPM是对TPM进行对数变换得到的表达方式,常用于降低表达量的偏斜性和增加低表达基因的可比性。
    • Log-TPM的概率分布也是连续的,因为它是对TPM进行变换得到的。
    • Log-TPM的优点是可以更好地适应正态分布的假设,使得后续的统计分析更加可靠。

    counts的概率分布是离散的,TPM和log-TPM的概率分布是连续的。在单细胞转录组数据分析中,我们可以根据具体的研究目的和分析方法选择合适的表达方式。


    百泰派克生物科技——生物制品表征,多组学生物质谱检测优质服务商


    相关服务: 

    多组学整合分析

    转录组学和蛋白质组学整合分析

    转录组学与代谢组学整合分析

    转录组学与脂质组学整合分析

    蛋白质组学与代谢组学整合分析

    代谢组与16S rDNA测序整合分析

    脂质组学与蛋白质组学整合分析

    翻译后修饰蛋白质组与代谢组整合分析

    蛋白质组学

    代谢组学

    脂质组学

提交需求
姓名 *
联系类型 *
联系方式 *
项目描述
咨询项目 *

 

How to order?


/assets/images/icon/icon-rc2.png

客服咨询

/assets/images/icon/icon-message.png

提交需求

https://file.biotech-pack.com/static/btpk/assets/images/icon/icon-wx-2.png

https://file.biotech-pack.com/pro//bt-btpk/20241231/config/1874015350579343360-WX-20241231.jpg

联系销售人员

/assets/images/icon/icon-tag-sale.png

促销活动

/assets/images/icon/icon-return.png