RNA-Seq数据分析——原始数据质量控制(QC)
RNA-Seq原始数据质量控制(QC)是非常重要的一个环节,由于各种原因,例如测序平台、实验操作等,原始测序数据可能存在不少问题,如低质量读段、接头序列、污染序列等。为了确保后续分析的准确性,需要先进行质量控制。
一、常用工具:
常用的质量控制工具有FastQC、MultiQC等,这些工具能提供测序数据的基本统计信息和质量报告。
二、QC主要步骤:
1.基本统计:
统计读段数量、平均长度等。
2.质量评分:
评估测序读段的质量分布,通常使用Phred质量分数。
3.接头和污染序列检测:
查找和去除可能的接头序列和其他非目标序列。
4.GC含量分布:
检查GC含量的分布,以判断潜在的偏见或污染。
5.重复序列分析:
评估重复读段的比例,高重复率可能意味着PCR偏见。
6.去除低质量读段:
基于设定的质量阈值去除低质量的读段。
7.后续步骤:
完成质量控制后,通常会进行比对、定量和差异表达分析等后续步骤。
百泰派克生物科技——生物制品表征,多组学生物质谱检测优质服务商
相关服务:
提交需求
How to order?