关于转录组测序双端测序的问题,转录组测序时,pair end 双端测序时,用FPKM计算为什么小于等于RPKM的2倍?
RPKM(Reads Per Kilobase of transcript, per Million mapped reads)和FPKM(Fragments Per Kilobase of transcript, per Million mapped reads)都是转录组数据分析中用于标准化基因表达水平的度量单位。它们考虑了每个基因的长度和测序深度,以便在不同的样本之间进行比较。
1.RPKM 是用于单端测序数据的标准化方法。它考虑了基因长度和总的测序读段数,以便在不同样本间进行公平比较。
2.FPKM 通常用于双端测序,考虑的是“片段”而不是“读段”。在双端测序中,一对读段被认为是一个“片段”,即使它们是从同一DNA片段的两端测得的。
尽管这两种方法在技术上有所不同,但它们在数学上是等价的,因为它们都是通过考虑基因长度和总测序读段(或片段)数来标准化基因表达的。因此,在单端测序的情况下,RPKM的值将等于FPKM的值,因为每个读段都被视为一个独立的单位。
在双端测序的情况下,每对读段被视为一个“片段”,因此理论上,如果每个片段产生一对读段,你可能预期FPKM值会是RPKM值的两倍。然而,FPKM值小于或等于RPKM值的两倍的原因包括:
1.片段计数:
在FPKM的计算中,一对读段(即一个片段)无论是否完全比对到参考基因组,都只计为一个片段,而不是两个独立的读段。
2.读段比对的复杂性:
并非所有读段都能成功比对到参考基因组,有些可能因为质量问题或其它原因(如序列多样性、测序错误等)而未被计入。
因此,FPKM值不一定是RPKM值的两倍,而是取决于成功比对的片段数和这些片段如何分布于特定基因的长度。在处理高质量的、成功比对的双端读段时,FPKM值通常会接近RPKM值的两倍,但不会超过,因为它们都是对相同基础数据的标准化表示。
百泰派克生物科技——生物制品表征,多组学生物质谱检测优质服务商
相关服务:
How to order?