一、 Panel基本信息 Panel名称:SJPedPanel 研发单位:St. Jude Children’s Research Hospital(SJCRH) 预期用途:专为儿童泛癌设计,可检测低频突变,可用于癌症复发监测 检测范围:357个基因的5009个区域,7590个SNP位点(可达1个SNP/1Mb) 检测项目:SNV,Indel,SV,CNV, LOH,ITD 检测方法:捕获测序,PE150 检测平台:NGS测序平台 二、 Panel创新点 创新点1:panel检测的位点是儿童癌症特异的,所选的基因和区域是基于前期WES,WGS(中位深度高达3000X),RNA-seq以及更多的功能性验证获得 创新点2:7590个SNP位点,可以保证每个人可以有3000个杂合SNP位点,使得检测LOH的分辨率达1Mb 创新点3:使用自主研发的SequencErr 和SVindelGenotyper方法有效降低了测序错误率,使得Panel可检低至0.2%的突变 创新点4:Panel采用统计检验方法消除系统偏好,优于GATK推荐的Panle of Normal方法消除系统噪音 创新点5:使用标准细胞系对Panel的均一性进行了评价,可稳健地掌握每个区域的稳定性 三、 Panel可参考价值 3.1 为什么要设计针对儿童的Panel? 目前市场上已有的panel大多针对成人且检测外显子为主。最近一项涵盖1,699例儿童癌症的泛癌症研究表明,成人癌症与儿童癌症之间存在显著差异,其中儿童癌症的142个驱动基因中有55%在成人泛癌症研究中未发现[1]。此外,除了受影响基因不同外,成人癌症和儿童癌症的基因变异类型也存在差异,儿童癌症中 62% 的驱动变异是拷贝数变异 (CNV) 或结构变异 (SV),其断点通常不属于外显子区域。因此,针对儿童需要设计相应的基因Panel,从而可全面检测出儿童癌症相关的驱动突变。 SJPedPanel的357个基因的5009个区域选择前期耗费的资金可观,所以区域可参考的价值也可想而知。此外,该Panel的研究文献[2]提供了这些区域的详细的基因坐标,大家可以下载进行参考。 3.2检测性能提高方法的参考价值 SJPedPanel采用SequencErr方法降低了测序仪产生的错误。此外使用reference panel对检测范围内的每个位置拟合了背景噪音数据的分布,并通过统计检验后的FDR值判断真实突变的真伪。 1)SequencErr-评估、校准和监测测序仪的准确度的方法 对于双端测序,一条序列会被检测2次,一个测序读段叫正向读段(forward strand read),另一个叫反向读段(reverse strand read),SequencErr认为这2条reads之间重叠区域中的不一致的碱基为测序仪判断错误的碱基,然后通过采用一些过滤方法来去掉有问题的reads,从而提高测序仪的测序准确率。SequencErr 相对于流行的质量控制方法FastQC可以更直接找出测序仪判断错误的碱基,并且比常用的其他矫正错误的软件 Lighter 和 Musket可再降低错误率10倍。 图1:测序错误矫正软件性能对比 2)消除系统偏导至的假阳 对于给定的变异,使用野生型样本(即在原始分析中诊断时未检测到突变)统计该位点处的背景错误率。即合并所有野生型样本在该位点处的reads(tb条),然后统计支持该变异的reads总数(mb条),将mb/tb作为背景错误率(Vb),从而构建Vb*tb作为均值的二项分布。类似地,对于突变阳性样本,统计支持该变异的reads总数(mf)和覆盖该位点的所有reads数(tf)。然后,我们使用二项分布计算了在tf个读段中随机观察到 ≥ mf 个突变reads的概率。如果错误发现率控制的Q值<0.05,则该样本被称为突变阳性。 可惜的是相关文献中并没有提供所覆盖位点处统计的背景错误率。所以大家也只能参考一下方法。不过,目前市场上illumina dragen针对体细胞突变检测项目提供了可以参考的背景错误率,见下图2。大家可以自行下载并参考。此外,也可以自己作类似的背景错误率,会更能针对性地降低假率。 图2:Prebuilt Systematic Noise BED Files 3)均一性评价 对于捕获测序,大家最关注的问题就是均一性,即希望自己设计的区域都有reads覆盖,且覆盖得均匀。均一性对于判断拷贝数变异极其重要。大家喜欢用Fold80评价。但Fold80只能知道整个target区域的整体上的均一性,不能评价哪些区域测得稳定,哪些区域测得不好。在SJPedPanel的性能评价文献中,使用了标准正常细胞系COLO829BL (ATCC No. CRL1980)进行了评价。该类样本容易获取,可到ATCC进行购买,且评价结果较可信。此外,评价均一性的方法也值得借鉴。由于高度均匀的捕获数据能够确保大多数碱基/区域具有相似的深度(因此直方图的标准差非常小),可使用变异系数(CV,定义为直方图的σ/μ)作为评价均一性的统计量。其中,σ和μ分别是标准差和平均值的估计值,是通过从直方图两端修剪掉2.5%的极值得到的(图3)。 图3:Capture uniformity per base (A and B) and per region (C and D) of the panel. 参考文献: 1. Ma X, Liu Y, Liu Y, Alexandrov LB, Edmonson MN, Gawad C, et al. Pancancer genome and transcriptome analyses of 1,699 paediatric leukaemias and solid tumours. Nature 2018;555:371–76. 2. Kolekar P, Balagopal V, Ma X, et al. SJPedPanel: A pan-cancer gene panel for childhood malignancies. Clin Cancer Res. 2024 Sep 13;30(18):4100-4114. |