号主按:隆地熊在2016年9月19日写了一篇给小白们的图文消息后一直处于失踪状态。原本号主我在国庆期间打算求助警察叔叔,但碍于贪玩本性就搁浅了。加上本号主我与隆地熊非亲非故,根本不上心去寻找。然而,事情就是那么突然,隆地熊今天发来了新的图文消息。这不沉寂了两个星期的万花筒,又开始熊出没了。
上回说到如何寻找保守序列,经过隆地熊我一番罗嗦,七七八八也该知道了些。当然,要想做到炉火纯青,各位小白还得勤加练习。本回隆地熊我就要进入正题了,不然对不起这图文题目。在做PCR引物设计前,首先得了解引物设计的基本原则。根据网上资料汇总(主要来自生物谷、生物秀、小木虫、百度文库等,特此一并感谢,具体不再详细注明,如有异议,请联系号主更改或删除,隆地熊我不负任何责任,坑死你个懒鬼号主)和个人心得,现一并总结如下。
PCR引物设计基本原则: 1. 设计PCR引物前要明白三个设计初衷: (1)引物要跟模板紧密结合; (2)引物与引物之间不能有稳定的二聚体或发夹结构存在 (3)引物不能在别的非目的位点引起DNA聚合反应(即错配)。 为实现这三个初衷,设计引物需要考虑很多因素,如引物长度(primerlength)、产物长度(productlength)、序列Tm值(meltingtemperature)、ΔG值(internalstability)、引物二聚体及发夹结构(duplexformation and hairpin)、错误引发位点(falsepriming site)、引物及产物GC 含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。
2. 以使用Oligo 软件分析设计引物为例(个人认为Oligo软件是最为专业的PCR引物设计软件),进行PCR引物设计时应遵循的基本原则有: 引物的长度一般为15-30bp,常用的是18-27bp,但不能大于38,因为过长会导至其延伸温度大于74℃,即Taq 酶的最适延伸温度。 引物3’端的序列要比5’端重要。引物3’端的碱基一般不用A(3’端碱基序列最好是G、C、CG、GC),因为A在错误引发位点的引发效率相对比较高。另外引物间3’端的互补、二聚体或发夹结构也可能导至PCR反应失败。5’端序列对PCR 影响不大,因此常用来引进修饰位点或标记物。 引物的GC含量一般为40-60%,以45-55%为宜,过高或过低都不利于引发反应。有一些模板本身的GC 含量偏低或偏高,导至引物的GC含量不能在上述范围内,这时应尽量使上下游引物的GC 含量以及Tm 值保持接近(上下游引物的GC含量不能相差太大),以有利于退火温度的选择。如果G-C比例超出,则在引物的5’端增加多个A或T;而如果A-T比例过高,则同样在5’端增加多个G或C。完全没有必要复杂地去计算产物和引物的解链温度,PCR引物的GC/AT比率应当等于或高于所要放大的模板的GC/AT比。 引物所对应模板序列的Tm 值最好在72℃左右。(Tm 值曲线以选取72℃附近为佳,5’到3’的下降形状也有利于引物引发聚合反应),至少要在55-80℃之间。 ΔG值(自由能)反映了引物与模板结合的强弱程度。一般情况下,引物的ΔG值最好呈正弦曲线形状,即5’端和中间ΔG值较高,而3’端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。3′末端双链的ΔG是0~ -2kcal/mol时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在-6时只有40%、到-8时少于20%、而-10时接近于0。 可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,如此可保证不出现非目的产物的假带。但对于特定的模板序列,还应结合比较其在正确位点的引发效率。如果两者相差很大,比如在正确位点的引发效率为450以上,而在错误位点的引发效率为130,并且不好找其他更合适的引物,那么这对引物也是可以接受的。 Frq 曲线为Oligo6新引进的一个指标,揭示了序列片断存在的重复机率大小。选取引物时,宜选用Frq 值相对较低的片断。 引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带而且会降低引物浓度从而导至PCR 正常反应不能进行,与二聚体相关的一个参数是碱基的分布,3’端的连续GGG或CCC 会导至错误引发。二聚体形成的能值越高越稳定,越不符合要求。与二聚体相同,发夹结构的能值越低越好。虽然有些带有发夹环,其ΔG为-3 kcal/mol的自身互补引物也可以得到不错的结果,但是如果它的3′末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在5′末端对反应就没有多大的影响了。 以公式(4×G/C + 2×A/T-5)计算Tm值,即退火温度。选择较低Tm值的引物的退火温度为反应的退火温度。4-6℃的差别似乎对PCR产量影响不大。最好,保证每个引物的Tm值相匹配,且在70-75℃范围内。 要知道,更重要的因素是模板与稳定性较小的引物之间解链温度的差异。差异越小,PCR的效率越高。因为DNA的解链温度也取决于它的长度,所以有的研究者喜欢设计很长,而不求它很稳定的引物。可是,引物太长就难以避免形成二聚体和自身互补,因此,一般还是不用为好。如果期待的产物长度等于或小于500 bp,选用短的(16~18 mer)的引物;若产物长5 kb,则用24 mer的引物。有人用20~23 mer引物得到40 kb的产物。 在DNA测序和PCR中最好用5′末端稳定(如GC含量较多),而3′末端不太稳定(如AT含量较多)的引物,这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其3′末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在3′末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发DNA合成,所以不会产生假产物。因此,为了有效地引发反应,引物的5′末端和中央部分必须与靶DNA也形成双链。与此相反,带有稳定的、GC丰富的3′末端的寡核苷酸不需要其所有的核苷酸序列都与靶序列配对,只凭借其3′末端与靶序列任何位点的牢固配合就可以引发反应,产生非专一产物。无论如何,寡核苷酸3′末端最后5个核苷酸的稳定性小于-9kcal/mol的,通常就是专一性的探针或引物。寡核苷酸3′末端越不稳定,假引发的可能性越低。 如果用3′末端低稳定性的引物,反应的最适退火温度范围会不寻常的宽。这就可以不经过事先的最佳化实验就能在最佳条件下进行反应。 引物的唯一性:为了放大单个的、专一性DNA片段,选用的引物序列就应当是唯一的,即在模板中没有重复序列。如果用哺乳动物基因组序列作为模板,可以用Alu序列或其他短重复元件来核对想用的引物的互补性。由此也可知,应当避免使用同寡聚物(如-AAAAAA-)和二核苷酸重复(如-ATATAT-)。 引物和产物的Tm值不要相差太大,20摄氏度范围内较好。定下引物的Tm值范围之后即可定下引物的长度范围。 对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。值得一提的是,各种模板的引物设计难度不一。有的模板本身条件较差,比如GC含量偏高或偏低,导至找不到各种指标都十分合适的引物;有时PCR产物要作为克隆对象插入到载体中表达,因此PCR引物设计的可选择度很低。遇到这种情况只能退而求其次,尽量去满足条件,这时,使用自动搜索引物及正确地评价引物可使研究人员对实验心中有数。在设计克隆PCR引物时,引物两端一般都添加酶切点,必然存在发夹结构,而且能值不会太低,这种PCR需要灵活调控退火温度以达到最好效果,对引物的发夹结构的检测就不应要求太高。
上述十四条原则值得你细细评味,如果都能理会并用于实践的话,设计高手就一定会是你。能设计出一对效果非常好的PCR引物,仍然是能找到好工作的。比如说罗氏的PCR诊断试剂盒,少则数千,多则上万,靠的是什么?明白人一看就知道是引物。乖乖,你买任何一种病原诊断试剂盒,能看得到引物序列吗?不能,所以嘛,小白们,这就是未来的价值所在哦。好好去钻研吧。
好了,这期文字太多,就不上手把手演示了,还请期待下回。
来源: 分子诊断万花筒 作者:隆地熊
|