根据研究目的和测序技术的特点,测序数据可以分为DNA、RNA、表观组和长读长数据,每类数据都有其特定应用。现代测序技术(如Illumina、PacBio、Oxford Nanopore等)让这些数据在基础研究和临床应用中发挥了巨大作用。 1. DNA测序数据(1)全基因组测序(Whole Genome Sequencing, WGS)
(2)全外显子测序(Whole Exome Sequencing, WES)
(3)靶向区域测序(Targeted Sequencing)
(4)宏基因组测序(Metagenomics)
2. RNA测序数据(1)转录组测序(RNA-Seq)
(2)单细胞RNA测序(Single-cell RNA-Seq, scRNA-Seq)
(3)小RNA测序(Small RNA-Seq)
3. 表观基因组测序数据(1)甲基化测序(Bisulfite Sequencing, BS-Seq)
(2)染色质可及性测序(ATAC-Seq/ChIP-Seq)
4. 长读长与三代测序数据(1)PacBio数据
(2)Oxford Nanopore数据
5. 宏转录组和宏表观组测序
在测序实验中,不同平台和流程会使用特定的接头序列(adapter sequences)。这些接头连接在核酸片段两端,确保样品能在各类测序平台上进行扩增和测序。以下是常见的测序接头类型及其在主要平台上的应用: 1. Illumina接头序列Illumina平台使用的接头包括P5和P7序列,它们可连接到测序芯片上的引物,并且还可能嵌入**索引序列(barcode)**以区分不同样本。
2. PacBio接头序列PacBio测序使用SMRTbell接头,这种接头连接到DNA片段两端,将其环化,使之成为一个闭合环,便于PacBio的单分子实时(SMRT)测序。
3. Oxford Nanopore接头序列Oxford Nanopore的测序技术需要在样本片段两端添加特定接头,以便将DNA/RNA分子加载到纳米孔上。
4. 其他平台的接头BGI/MGI测序
Ion Torrent
5. 常见接头污染与清理测序数据中的接头污染是指原始数据中残留的接头序列没有被去除。为了保证分析质量,必须使用数据清理工具去除这些接头,如:
去除测序数据中的接头序列(adapter trimming)是数据分析的第一步,确保后续结果准确。未去除的接头序列会干扰下游分析,如比对、变异检测等。下面介绍常用工具、步骤及相关参数。 1. 常用工具以下是常用的接头去除工具,每个工具都有其特点和优势: (1) Cutadapt
(2) Trimmomatic
(3) Fastp
2. 基本工作流程
3. 如何验证接头去除效果
4. 常见问题与解决方案
|