✅ 操作成功!

简并引物

发布时间:2023-06-09 作者:admin 来源:文学

简并引物

简并引物

-

2023年2月27日发(作者:车间巡检记录表)

引物设计和选择目的DNA序列区域时可遵循下列原则:

(1)引物长度约为16-30bp,太短会降低退火温度影响引物与模板配对,从而使非特异性增

高。太长则比较浪费,且难以合成。

(2)引物中G+C含量通常为40%-60%,可按下式粗略估计引物的解链温度Tm=

4(G+C)+2(A+T).

(3)四种碱基应随机分布,在3'端不存在连续3个G或C,因这样易导致错误引发。

(4)引物3'端最好与目的序列阅读框架中密码子第一或第二位核苷酸对应,以减少由

于密码子摆动产生的不配对。

(5)在引物内,尤其在3'端应不存在二级结构。

(6)两引物之间尤其在3'端不能互补,以防出现引物二聚体,减少产量。两引物间最好

不存在4个连续碱基的同源性或互补性。

(7)引物5'端对扩增特异性影响不大,可在引物设计时加上限制酶位点、核糖体结合

位点、起始密码子、缺失或插入突变位点以及标记生物素、荧光素、地高辛等.通常应在

5'端限制酶位点外再加1-2个保护碱基。

(8)引物不与模板结合位点以外的序列互补。所扩增产物本身无稳定的二级结构,以免产生

非特异性扩增,影响产量。

(9)简并引物应选用简并程度低的密码子,例如选用只有一种密码子的Met,3'端应不

存在简并性。否则可能由于产量低而看不见扩增产物。

一般PCR反应中的引物终浓度为0.2-1.0μmol/L。引物过多会产生错误引导或产生引物二聚

体,过低则降低产量。利用紫外分光光度计,可精确计算引物浓度,在1cm光程比色杯

中,260nm下,引物浓度可按下式计算:

Xmol/L=OD260/A(16000)+C(70000)+G(12000)+T(9600)

X:引物摩尔浓度,A、C、G、T:引物中4种不同碱基个数。

分子生物学实验作的并不多,我的几点经验,

1直接查文献照搬别人成功的引物最省事。

2需要多对引物时,最好退火温度设计为同一温度,便于实验同时进行。

3RT-PCR及RealtimePCR的引物必须包含intron,以排除genomicDNA的影响

DNA序列的保守区是通过物种间相似序列的比较确定的。在NCBI上搜索不同物种的同一

基因,通过序列分析软件(比如DNAman)比对(Alignment),各基因相同的序列就是该基

因的保守区。

2.引物长度一般在15~30碱基之间。

引物长度(primerlength)常用的是18-27bp,但不应大于38,因为过长会导致其延伸温

度大于74℃,不适于TaqDNA聚合酶进行反应。

3.引物GC含量在40%~60%之间,Tm值最好接近72℃。

GC含量(composition)过高或过低都不利于引发反应。上下游引物的GC含量不能相

差太大。另外,上下游引物的Tm值(meltingtemperature)是寡核苷酸的解链温度,即在一

定盐浓度条件下,50%寡核苷酸双链解链的温度。有效启动温度,一般高于Tm值5~10℃。

若按公式Tm=4(G+C)+2(A+T)估计引物的Tm值,则有效引物的Tm为55~80℃,其

Tm值最好接近72℃以使复性条件最佳。

4.引物3′端要避开密码子的第3位。

如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,

会影响扩增的特异性与效率。

5.引物3′端不能选择A,最好选择T。

引物3′端错配时,不同碱基引发效率存在着很大的差异,当末位的碱基为A时,即使

在错配的情况下,也能有引发链的合成,而当末位链为T时,错配的引发效率大大降低,G、

C错配的引发效率介于A、T之间,所以3′端最好选择T。

6.碱基要随机分布。

引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导

致错误引发(Falsepriming)。降低引物与模板相似性的一种方法是,引物中四种碱基的分布

最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3个连续的G或C,因

这样会使引物在GC富集序列区错误引发。

7.引物自身及引物之间不应存在互补序列。

引物自身不应存在互补序列,否则引物自身会折叠成发夹结构(Hairpin)使引物本身

复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。引物自身不能有连续4

个碱基的互补。

两引物之间也不应具有互补性,尤其应避免3′端的互补重叠以防止引物二聚体(Dimer

与Crossdimer)的形成。引物之间不能有连续4个碱基的互补。

引物二聚体及发夹结构如果不可避免的话,应尽量使其△G值不要过高(应小于

4.5kcal/mol)。否则易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正

常进行。

8.引物5′端和中间△G值应该相对较高,而3′端△G值较低。

△G值是指DNA双链形成所需的自由能,它反映了双链结构内部碱基对的相对稳定性,

△G值越大,则双链越稳定。应当选用5′端和中间△G值相对较高,而3′端△G值较低(绝

对值不超过9)的引物。引物3′端的△G值过高,容易在错配位点形成双链结构并引发DNA

聚合反应。(不同位置的△G值可以用Oligo6软件进行分析)

9.引物的5′端可以修饰,而3′端不可修饰。

引物的5′端决定着PCR产物的长度,它对扩增特异性影响不大。因此,可以被修饰而

不影响扩增的特异性。引物5′端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+

等;引入蛋白质结合DNA序列;引入点突变、插入突变、缺失突变序列;引入启动子序列

等。

引物的延伸是从3′端开始的,不能进行任何修饰。3′端也不能有形成任何二级结构可能。

10.扩增产物的单链不能形成二级结构。

某些引物无效的主要原因是扩增产物单链二级结构的影响,选择扩增片段时最好避开二

级结构区域。用有关软件(比如RNAstructure)可以预测估计mRNA的稳定二级结构,有

助于选择模板。实验表明,待扩区域自由能(△G°)小于58.6lkJ/mol时,扩增往往不能成

功。若不能避开这一区域时,用7-deaza-2′-脱氧GTP取代dGTP对扩增的成功是有帮助的。

11.引物应具有特异性。

引物设计完成以后,应对其进行BLAST检测。如果与其它基因不具有互补性,就可以

进行下一步的实验了。

值得一提的是,各种模板的引物设计难度不一。有的模板本身条件比较困难,例如GC

含量偏高或偏低,导致找不到各种指标都十分合适的引物;用作克隆目的的PCR,因为产

物序列相对固定,引物设计的选择自由度较低。在这种情况只能退而求其次,尽量去满足条

件。

做RealTime时,用于SYBRGreenI法时的一对引物与一般PCR的引物,在引物设计上所

要求的参数是不同的。引物设计的要求:

1)避免重复碱基,尤其是G.

2)Tm=58-60度。

3)GC=30-80%.

4)3'端最后5个碱基内不能有多于2个的G或C.

5)正向引物与探针离得越近越好,但不能重叠。

6)PCR扩增产物长度:引物的产物大小不要太大,一般在80-250bp之间都可;80~150bp

最为合适(可以延长至300bp)。

7)引物的退火温度要高,一般要在60度以上;

要特别注意避免引物二聚体和非特异性扩增的存在。

而且引物设计时应该考虑到引物要有不受基因组DNA污染影响的能力,即引物应该跨

外显子,最好是引物能跨外显子的接头区,这样可以更有效的不受基因组DNA污染的影响。

至于设计软件,PRIMER3,PRIMER5,PRIMEREXPRESS都应该可以的。

做染料法最关键的就是寻找到合适的引物和做污染的预防工作。对于引物,你要有从一

大堆引物中挑出一两个能用的引物的思想准备---寻找合适的引物非常不容易。

关于BLAST的作用应该是通过比对,发现你所设计的这个引物,在已经发现并在

GENEBANK中公开的不物种基因序列当中,除了和你的目标基因之外,还有没有和其他物

种或其他序列当中存在相同的序列,如和你的目标序列之外的序列相同的序列,则可能扩出

其他序列的产物,那么这个引物的特异性就很差,从而不能用。

一、利用ncbi搜索不同物种中同一目的基因的蛋白或cDNA编码的氨基酸序列

因为密码子的关系,不同的核酸序列可能表达的氨基酸序列是相同的,所以氨基酸序列才是

真正保守的。首先利用NCBI的Entrez检索系统,查找到一条相关序列即可。随后利用这一

序列使用BLASTp(通过蛋白查蛋白),在整个Nr数据库中中查找与之相似的氨基酸序列。

二、对所找到的序列进行多序列比对

将搜索到的同一基因的不同氨基酸序列进行多序列比对,可选工具有ClustalW,也可在线

分析[url][/url]/clustalw/。

三、确定合适的保守区域

设计简并引物至少需要上下游各有一个保守区域,且两个保守区域相距50~400个aa为

宜,使得pcr产物在150~1200bp之间,最重要的是每一个保守区域至少有6个aa残基,

因为每条引物至少18bp左右。若比对结果保守性不是很强很可能找不到6个aa的保守区

域,这时可以根据物种的亲缘关系,选择亲缘相近的物种进行二次比对,若保守性仍达不到

要求,则需进行三次比对。总之,究竟要选多少序列来比对,要根据前一次比对的结果反复

调整。最终目的就是有两个6个aa且两者间距离合适的保守区域。

四、利用软件设计引物

当得到保守区域后,就可以利用专业的软件来设计引物了,其中pp5支持简并引物的设计,

将参与多序列比对的序列中的任一条导入pp5中,再将其翻译成核苷酸序列,有密码子简

并性,其结果是有n多条彼此只相差以个核苷酸的序列群,该群可用一条有简并性的核苷酸

链来表示(其中R=A/G,Y=C/T,M=A/C,K=G/T,S=C/G,W=A/T,H=A

/C/T,B=C/G/T,V=A/C/G,D=A/G/T,N=A/C/G/T),该具有简并性的核苷

酸链必然包含上一步中找到的氨基酸保守区域的对应部分,在pp5中修改参数,令其在两

个距离合适的保守的nt区域内寻找引物对,总之要保证上下游引物都落在该简并链的保守

区域内,结果会有数对,分数越高越好。

五、对引物的修饰

若得到的引物为:

5-NAGSGNGCDTTANCABK-3

则其简并度=4×2×4×3×4×3×2=2304,很明显该条引物的简并度多高不利于pcr。我们可

以通过用次黄嘌呤代替N(因为次黄嘌呤能很好的和4种碱基配对)和根据物种密码子偏好

这两种方法来降低简并度(有个查密码子偏好的数据库我以前发过大家搜索一下把)。

最后,这样子设计出来简并引物对,适用于用于比对的氨基酸序列所属物种及与这些物种分

类地位相同的其他物种。

如果知道了基因序列,(从pubmed上下载的)怎么样设计出最合适的引物呢?关于引物设

计,有oligo和primer5两种主要的软件,但是这两个软件***版的在网上很难找,我这里

有primer5的***版.

还有一种简便易行的因无设计方法,那就是利用在线的因无设计软件primer3.0

进行引物的设计

1.打开网址:/cgi-bin/primer3/primer3_

2.在框中粘贴入你的原始序列(要比你要扩的目的片段两端延伸一点)

3.在框的下方有许多可以设定的限制条件,如片段长度,一定包含的片段位置,引物长度,引

物退火温度等,你可以进行设定

4.点击"pickupprimers"就会出现下一页,上面会列出多种设计,一般来说,第一对引物是

最适合的。

同时引物设计和选择目的DNA序列区域时可遵循下列原则:

(1)引物长度约为16-30bp,太短会降低退火温度影响引物与模板配对,从而使非特异性增

高。太长则比较浪费,且难以合成。

(2)引物中G+C含量通常为40%-60%,可按下式粗略估计引物的解链温度Tm=

4(G+C)+2(A+T).

(3)四种碱基应随机分布,在3'端不存在连续3个G或C,因这样易导致错误引发。

(4)引物3'端最好与目的序列阅读框架中密码子第一或第二位核苷酸对应,以减少由于密

码子摆动产生的不配对。

(5)在引物内,尤其在3'端应不存在二级结构。

两引物之间尤其在3'端不能互补,以防出现引物二聚体,减少产量。两引物间最好不存在4

个连续碱基的同源性或互补性。

(7)引物5'端对扩增特异性影响不大,可在引物设计时加上限制酶位点、核糖体结合位点、

起始密码子、缺失或插入突变位点以及标记生物素、荧光素、地高辛等.通常应在5'端限

制酶位点外再加1-2个保护碱基。

引物不与模板结合位点以外的序列互补。所扩增产物本身无稳定的二级结构,以免产生非特

异性扩增,影响产量。

(9)简并引物应选用简并程度低的密码子,例如选用只有一种密码子的Met,3'端应不存在

简并性。否则可能由于产量低而看不见扩增产物。

RT-PCR引物设计原则和方法

在NCBI上搜索到该基因,找到该基因的mRNA,在CDS选项中,找到编码区所在位置,

在下面的origin中,Copy该编码序列作为软件查询序列的候选对象。

打开PrimerPremier5,点击File-New-DNAsequence,出现输入序列窗口,Copy目的序

列在输入框内(选择As),此窗口内,序列也可以直接翻译成蛋白。点击Primer,进入引

物窗口。

此窗口可以链接到“引物搜索”、“引物编辑”以及“搜索结果”选项,点击Search按钮,进入引

物搜索框,选择“PCRprimers”,“Pairs”,设定搜索区域和引物长度和产物长度。在Search

Parameters里面,可以设定相应参数。一般若无特殊需要,参数选择默认即可,但产物长

度可以适当变化,因为100~200bp的产物电泳跑得较散,所以可以选择300~500bp。

点击OK,软件即开始自动搜索引物,搜索完成后,会自动跳出结果窗口,搜索结果默认按

照评分(Rating)排序,点击其中任一个搜索结果,可以在“引物窗口”中,显示出该引物的

综合情况,包括上游引物和下游引物的序列和位置,引物的各种信息等。

对于引物的序列,可以简单查看一下,避免出现下列情况:3’端不要以A结尾,最好是G

或者C,T也可以;3’不要出现连续的3个碱基相连的情况,比如GGG或CCC,否则容

易引起错配。此窗口中需要着重查看的包括:Tm应该在55~70度之间,GC%应该在45%~

55%间,上游引物和下游引物的Tm值最好不要相差太多,大概在2度以下较好。该窗口

的最下面列出了两条引物的二级结构信息,包括,发卡,二聚体,引物间交叉二聚体和错误

引发位置。若按钮显示为红色,表示存在该二级结构,点击该红色按钮,即可看到相应二级

结构位置图示。最理想的引物,应该都不存在这些二级结构,即这几个按钮都显示为“None”

为好。但有时很难找到各个条件都满足的引物,所以要求可以适当放宽,比如引物存在错配

的话,可以就具体情况考察该错配的效率如何,是否会明显影响产物。对于引物具体详细的

评价需要借助于Oligo来完成,Oligo自身虽然带有引物搜索功能,但其搜索出的引物质量

感觉不如Primer5。

在Primer5窗口中,若觉得某一对引物合适,可以在搜索结果窗口中,点击该引物,然后在

菜单栏,选择File-Print-Currentpair,使用PDF虚拟打印机,即可转换为Pdf文档,里面

有该引物的详细信息。

在Oligo软件界面,File菜单下,选择Open,定位到目的cDNA序列(在primer中,该序

列已经被保存为Seq文件),会跳出来两个窗口,分别为InternalStability(DeltaG)窗口

和Tm窗口。在Tm窗口中,点击最左下角的按钮,会出来引物定位对话框,输入候选的上

游引物序列位置(Primer5已经给出)即可,而引物长度可以通过点击Change-Currentoligo

length来改变。定位后,点击Tm窗口的Upper按钮,确定上游引物,同样方法定位下游

引物位置,点击Lower按钮,确定下游引物。引物确定后,即可以充分利用Analyze菜单

中各种强大的引物分析功能了。

Analyze中,第一项为Keyinfo,点击Selectedprimers,会给出两条引物的概括性信息,

其中包括引物的Tm值,此值Oligo是采用nearestneighbormethod计算,会比Primer5

中引物的Tm值略高,此窗口中还给出引物的DeltaG和3’端的DeltaG。3’端的DeltaG

过高,会在错配位点形成双链结构并引起DNA聚合反应,因此此项绝对值应该小一些,最

好不要超过9。

Analyze中第二项为DuplexFormation,即二聚体形成分析,可以选择上游引物或下游引物,

分析上游引物间二聚体形成情况和下游引物间的二聚体情况,还可以选择Upper/Lower,即

上下游引物之间的二聚体形成情况。引物二聚体是影响PCR反应异常的重要因素,因此应

该避免设计的引物存在二聚体,至少也要使设计的引物形成的二聚体是不稳定的,即其Delta

G值应该偏低,一般不要使其超过4.5kcal/mol,结合碱基对不要超过3个。Oligo此项的分

析窗口中分别给出了3’端和整个引物的二聚体图示和DeltaG值。

Analyze中第三项为HairpinFormation,即发夹结构分析。可以选择上游或者下游引物,同

样,DeltaG值不要超过4.5kcal/mol,碱基对不要超过3个。

Analyze中第四项为CompositionandTm,会给出上游引物、下游引物和产物的各个碱基

的组成比例和Tm值。上下游引物的GC%需要控制在40%~60%,而且上下游引物之间

的GC%不要相差太大。Tm值共有3个,分别采用三种方法计算出来,包括nearestneighbor

method、%GCmethod和2(A+T)+4(G+C)method,最后一种应该是Primer5所采用的

方法,Tm值可以控制在50~70度之间。

第五项为FalsePrimingSites,即错误引发位点,在Primer5中虽然也有Falsepriming分

析,但不如oligo详细,并且oligo会给我正确引发效率和错误引发效率,一般的原则要使

错误引发效率在100以下,当然有时候正确位点的引发效率很高的话,比如达到400~500,

错误引发效率超过100幅度若不大的话,也可以接受。

Analyze中,有参考价值的最后一项是“PCR”,在此窗口中,是基于此对引物的PCR反应

Summary,并且给出了此反应的最佳退火温度,另外,提供了对于此对引物的简短评价。

若该引物有不利于PCR反应的二级结构存在,并且DeltaG值偏大的话,Oligo在最后的

评价中会注明,若没有注明此项,表明二级结构能值较小,基本可以接受。

引物评价完毕后,可以选择File-Print,打印为PDF文件保存,文件中将会包括所有Oligo

软件中已经打开的窗口所包括的信息,多达数页。因此,打印前最好关掉Tm窗口和DeltaG

窗口,可以保留引物信息窗口、二级结构分析窗口(若存在可疑的异常的话)和PCR窗口。

引物确定后,对于上游和下游引物分别进行Blast分析,一般来说,多少都会找到一些其他

基因的同源序列,此时,可以对上游引物和下游引物的blast结果进行对比分析,只要没有

交叉的其他基因的同源序列就可以。

有一个问题,引物设计原则里面常常强调,引物所对应模板序列的Tm值最好在72℃左右,

但是软件里面Search出来的引物,很少有达到这个值的,一般都在50~65度之间,这是

什么原因?软件怎么没有限定这个规则?

PCR引物设计原则

PCR引物设计的目的是为了找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。

因此,引物的优劣直接关系到PCR的特异性与成功与否。要设计引物首先要找到DNA序

列的保守区。同时应预测将要扩增的片段单链是否形成二级结构。如这个区域单链能形成二

级结构,就要避开它。如这一段不能形成二级结构,那就可以在这一区域设计引物。现在可

以在这一保守区域里设计一对引物。一般引物长度为15~30碱基,扩增片段长度为100~600

碱基对。让我们先看看P1引物。一般引物序列中G+C含量一般为40%~60%。而且四种碱

基的分布最好随机。不要有聚嘌呤或聚嘧啶存在。否则P1引物设计的就不合理。应重新寻

找区域设计引物。同时引物之间也不能有互补性,一般一对引物间不应多于4个连续碱基的

互补。

引物确定以后,可以对引物进行必要的修饰,例如可以在引物的5′端加酶切位点序列;标记

生物素、荧光素、地高辛等,这对扩增的特异性影响不大。但3′端绝对不能进行任何修饰,

因为引物的延伸是从3′端开始的。这里还需提醒的是3′端不要终止于密码子的第3位,因为

密码子第3位易发生简并,会影响扩增的特异性与效率。

综上所述我们可以归纳十条PCR引物的设计原则:

①引物应用核酸系列保守区内设计并具有特异性。

②产物不能形成二级结构。

③引物长度一般在15~30碱基之间。

④G+C含量在40%~60%之间。

⑤碱基要随机分布。

⑥引物自身不能有连续4个碱基的互补。

⑦引物之间不能有连续4个碱基的互补。

⑧引物5′端可以修饰。

⑨引物3′端不可修饰。

⑩引物3′端要避开密码子的第3位。

PCR引物设计的目的是找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。如

前述,引物的优劣直接关系到PCR的特异性与成功与否。对引物的设计不可能有一种包罗

万象的规则确保PCR的成功,但遵循某些原则,则有助于引物的设计。

1.引物的特异性

引物与非特异扩增序列的同源性不要超过70%或有连续8个互补碱基同源。

2.避开产物的二级结构区

某些引物无效的主要原因是引物重复区DNA二级结构的影响,选择扩增片段时最好避开二

级结构区域。用有关计算机软件可以预测估计mRNA的稳定二级结构,有助于选择模板。

实验表明,待扩区域自由能(△G°)小于58.6lkJ/mol时,扩增往往不能成功。若不能避开

这一区域时,用7-deaza-2′-脱氧GTP取代dGTP对扩增的成功是有帮助的。

3.长度

寡核苷酸引物长度为15~30bp,一般为20~27mer。引物的有效长度:Ln=2(G+C)+(A+T+,

Ln值不能大于38,因为>38时,最适延伸温度会超过TaqDNA聚合酶的最适温度(74℃),

不能保证产物的特异性。

4.G+C含量

G+C含量一般为40%~60%。其Tm值是寡核苷酸的解链温度,即在一定盐浓度条件下,50%

寡核苷酸双链解链的温度,有效启动温度,一般高于Tm值5~10℃。若按公式Tm=4(G+C)

+2(A+T)估计引物的Tm值,则有效引物的Tm为55~80℃,其Tm值最好接近72℃以使

复性条件最佳。

5.碱基础随机分布

引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3

个连续的G或C,因这样会使引物在G+C富集序列区错误引发。

6.引物自身

引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构牙引物本身复性。这种二级

结构会因空间位阻而影响引物与模板的复性结合。若用人工判断,引物自身连续互补碱基不

能大于3bp。

7.引物之间

两引物之间不应不互补性,尤应避免3′端的互补重叠以防引物二聚体的形成。一对引物间不

应多于4个连续碱基的同源性或互补性。

8.引物的3′端

引物的延伸是从3′端开始的,不能进行任何修饰。3′端也不能有形成任何二级结构可能,除

在特殊的PCR(AS-PCR)反应中,引物3′端不能发生错配。

在标准PCR反应体系中,用2UTaqDNA聚合酶和800μmol/LdNTP(四种dNTP各

200μmol/L)以质粒(103拷贝)为模板,按95℃,25s;55℃,25s;72℃,1min的循环参

数扩增HIV-1gag基因区的条件下,引物3′端错配对扩增产物的影响是有一定规律的。A∶

A错配使产量下降至1/20,A∶G和C∶C错七下降至1/100。引物A:模板G与引物G:

模板A错配对PCR影响是等同的。

9.引物的5′端

引物的5′端限定着PCR产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影

响扩增的特异性。引物5′端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;

引入蛋白质结合DNA序列;引入突变位点、插入与缺失突变序列和引入一启动子序列等。

10.密码子的简并

如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会

影响扩增特异性与效率。

PCR引物设计及软件使用技巧

2006-12-219:54:41信息来源:来源网络

PCR引物设计及软件使用技巧

生物谷网站PCR引物设计及软件使用技巧

张新宇,朱有康,高燕宁

(中国协和医科大学中国医学科学院肿瘤研究所,北京100021)

摘要:本文旨在介绍使用软件设计PCR引物的技巧。在PCR引物设计原则的基础上,详

细介绍了两种常用引物设计软件的基本使用方法,并对其各自的优缺点进行了比较。一般性

引物自动搜索可采用“PremierPrimer5”软件,而引物的评价分析则可采用“Oligo6”软件。

关键词:PCR;引物设计

中图分类号:Q524文献标识码:文章编号:

1

自从1985年KarnyMullis发明了聚合酶链式反应以来,PCR技术已成为分子生物学研

究中使用最多、最广泛的手段之一[1],而引物设计是PCR技术中至关重要的一环。使用不

合适的PCR引物容易导致实验失败:表现为扩增出目的带之外的多条带(如形成引物二聚

体带),不出带或出带很弱,等等。

现在PCR引物设计大都通过计算机软件进行。可以直接提交模板序列到特定网页,得

到设计好的引物,也可以在本地计算机上运行引物设计专业软件。一般来说,专门进行PC

R

引物设计的专业软件功能更为强大,但使用起来却不太容易。本文将就引物设计原则及软件

使用问题进行探讨。

引物设计的原则

引物设计有3条基本原则:首先引物与模板的序列要紧密互补,其次引物与引物之间避

免形成稳定的二聚体或发夹结构,再次引物不能在模板的非目的位点引发DNA聚合反应(即

错配)。

具体实现这3条基本原则需要考虑到诸多因素,如引物长度(primerlength),产物长度

(productlength),序列Tm值(meltingtemperature),引物与模板形成双链的内部稳定性

(internalstability,用?G值反映),形成引物二聚体(primerdimer)及发夹结构(duplex

formationandhairpin)的能值,在错配位点(falseprimingsite)的引发效率,引物及产物的

GC含量(composition),等等。必要时还需对引物进行修饰,如增加限制性内切酶位点,

引进突变等。根据有关参考资料和笔者在实践中的总结,引物设计应注意如下要点:

1.引物的长度一般为15-30bp,常用的是18-27bp,但不应大于38,因为过长会导致其延

伸温度大于74℃,不适于TaqDNA聚合酶进行反应[2]。

2.引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导

致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增

加[2]。

3.引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配

位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应

当避免在引物的3’端使用碱基A[3][4]。另外,引物二聚体或发夹结构也可能导致PCR反

应失败。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物[2]。

4.引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC

含量不能相差太大[2][5]。

5.引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有多种

方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(thenearest

neighbormethod)[6][7]。

6.?G值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定

性。应当选用3’端?G值较低(绝对值不超过9),而5’端和中间?G值相对较高的引

物。引物的3’端的?G值过高,容易在错配位点形成双链结构并引发DNA聚合反应[6]。

7.引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且

降低引物有效浓度而使PCR反应不能正常进行[8]。

8.对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR产物的载

体的相应序列而确定。

值得一提的是,各种模板的引物设计难度不一。有的模板本身条件比较困难,例如GC

2

含量偏高或偏低,导致找不到各种指标都十分合适的引物;在用作克隆目的的PCR因为产

物序列相对固定,引物设计的选择自由度较低。在这种情况只能退而求其次,尽量去满足条

件。

引物的自动搜索和评价分析

软件的引物设计功能主要体现在两个方面:首先是引物分析评价功能,该功能只有少数

商业版软件能够做到,其中以“Oligo6”最优秀;其次是引物的自动搜索功能,各种软件在

这方面的侧重点不同,因此自动搜索的结果也不尽相同。据笔者的经验,自动搜索功能以

“PremierPrimer”为最强且方便使用,“Oligo6”其次,其他软件如“VectorNTISuit”、

“Dnasis”、“Omiga”和“Dnastar”都带有引物自动搜索功能,但搜索结果不是十分理想。

要想得到效果很好的引物,在自动搜索的基础上还要辅以人工分析。笔者认为引物设计软件

的最佳搭配是“Oligo”和“Premier”软件合并使用,以“Premier”进行自动搜索,“Oligo”

进行分析评价,如此可快速设计出成功率很高的引物。

PrimerPremier5.0的使用技巧简介

1.功能

“Premier”的主要功能分四大块,其中有三种功能比较常用,即引物设计()、

限制性内切酶位点分析()和DNA基元(motif)查找()。“Premier”还具有同源

性分析功能(),但并非其特长,在此略过。此外,该软件还有一些特殊功能,其中

最重要的是设计简并引物,另外还有序列“朗读”、DNA与蛋白序列的互换()、

语音提示键盘输入()等等。

有时需要根据一段氨基酸序列反推到DNA来设计引物,由于大多数氨基酸(20种常见

结构氨基酸中的18种)的遗传密码不只一种,因此,由氨基酸序列反推DNA序列时,会

遇到部分碱基的不确定性。这样设计并合成的引物实际上是多个序列的混和物,它们的序列

组成大部分相同,但在某些位点有所变化,称之为简并引物。遗传密码规则因物种或细胞亚

结构的不同而异,比如在线粒体内的遗传密码与细胞核是不一样的。“Premier”可以针对模

板DNA的来源以相应的遗传密码规则转换DNA和氨基酸序列。软件共给出八种生物亚结

构的不同遗传密码规则供用户选择,有纤毛虫大核(CiliateMacronuclear)、无脊椎动物线粒

体(InvertebrateMitochondrion)、支原体(Mycoplasma)、植物线粒体(PlantMitochondrion)、

原生动物线粒体(ProtozoanMitochondrion)、一般标准(Standard)、脊椎动物线粒体(Vert

ebrate

Mitochondrion)和酵母线粒体(YeastMitochondrion)。

2.使用步骤及技巧

“Premier”软件启动界面如下:

3

其主要功能在主界面上一目了然(按钮功能如上述)。限制性酶切点分析及基元查找功

能比较简单,点击该功能按钮后,选择相应的限制性内切酶或基元(如-10序列,-35序列

等),按确定即可。常见的限制性内切酶和基元一般都可以找到。你还可以编辑或者添加新

限制性内切酶或基元。

进行引物设计时,点击按钮,界面如下:

进一步点击按钮,出现“searchcriteria”窗口,有多种参数可以调整。搜索目

的(SeachFor)有三种选项,PCR引物(PCRPrimers),测序引物(SequencingPrimers),

杂交探针(HybridizationProbes)。搜索类型(SearchType)可选择分别或同时查找上、下游引

物(Sense/Anti-sensePrimer,或Both),或者成对查找(Pairs),或者分别以适合上、下游

引物为主(CompatiblewithSense/Anti-sensePrimer)。另外还可改变选择区域(Search

Ranges),引物长度(PrimerLength),选择方式(SearchMode),参数选择(SearchParamete

rs)

4

等等。使用者可根据自己的需要设定各项参数。如果没有特殊要求,建议使用默认设置。然

后按,随之出现的SearchProgress窗口中显示SearchCompleted时,再按,

这时搜索结果以表格的形式出现,有三种显示方式,上游引物(Sense),下游引物

(Anti-sense),成对显示(Pairs)。默认显示为成对方式,并按优劣次序(Rating)排列,满分

为100,即各指标基本都能达标(如下图)。

点击其中一对引物,如第1#引物,并把上述窗口挪开或退出,显示“PeimerPremier”

主窗口,如图所示:

该图分三部分,最上面是图示PCR模板及产物位置,中间是所选的上下游引物的一些

5

性质,最下面是四种重要指标的分析,包括发夹结构(Hairpin),二聚体(Dimer),错误引

发情况(FalsePriming),及上下游引物之间二聚体形成情况(CrossDimer)。当所分析的引

物有这四种结构的形成可能时,按钮由变成,点击该按钮,在左下角的

窗口中就会出现该结构的形成情况。一对理想的引物应当不存在任何一种上述结构,因此最

好的情况是最下面的分析栏没有,只有。值得注意的是中间一栏的末尾

给出该引物的最佳退火温度,可参考应用。

在需要对引物进行修饰编辑时,如在5’端加入酶切位点,可点击,然后修改

引物序列。若要回到搜索结果中,则点击按钮。

如果要设计简并引物,只需根据源氨基酸序列的物种来源选择前述的八种遗传密码规

则,反推至DNA序列即可。对简并引物的分析不需像一般引物那样严格。

总之,“Premier”有优秀的引物自动搜索功能,同时可进行部分指标的分析,而且容易

使用,是一个相当不错的软件。

Oligo6.22使用技巧简介

1.功能

在专门的引物设计软件中,“Oligo”是最著名的。它的使用并不十分复杂,但初学者容

易被其复杂的图表吓倒。Oligo5.0的初始界面是两个图:Tm图和ΔG图;Oligo6.22的界

面更复杂,出现三个图,加了个Frq图。“Oligo”的功能比“Premier”还要单一,就是引物

设计。但它的引物分析功能如此强大以至于能风靡全世界。

2.使用(以Oligo6.22为例)

Oligo6.22的启动界面如下:

图中显示的三个指标分别为Tm、ΔG和Frq,其中Frq是6.22版本的新功能,为邻近6

至7个碱基组成的亚单位在一个指定数据库文件中的出现频率。该频率高则可增加错误引发

6

的可能性。因为分析要涉及多个指标,起动窗口的cascade排列方式不太方便,可从windo

ws

菜单改为tili方式。如果觉得太拥挤,可去掉一个指标,如Frq,这样界面的结构同于Oligo

5.0,只是显示更清楚了。

经过Windows/Tili项后的显示如图:

在设计时,可依据图上三种指标的信息选取序列,如果觉得合适,可点击Tm图块上左

下角的Upper按钮,选好上游引物,此时该按钮变成,表示上游引物已选

取好。下游引物的选取步骤基本同上,只是按钮变成Lower。?G值反映了序列与模板的结

合强度,最好引物的?G值在5’端和中间值比较高,而在3’端相对低(如图:)

Tm值曲线以选取72℃附近为佳,5’到3’的下降形状也有利于引物引发聚合反应。Frq曲线

为“Oligo6”新引进的一个指标,揭示了序列片段存在的重复机率大小。选取引物时,宜选

用3’端Frq值相对较低的片段。

当上下游引物全选好以后,需要对引物进行评价并根据评价对引物进行修改。首先检查

引物二聚体尤其是3’端二聚体形成的可能性。需要注意的是,引物二聚体有可能是上游或

下游引物自身形成,也有可能是在上下游引物之间形成(crossdimer)。二聚体形成的能值

越高,越不符合要求。一般的检测(非克隆)性PCR,对引物位置、产物大小要求较低,

因而应尽可能选取不形成二聚体或其能值较低的引物。第二项检查是发夹结构(hairpin);

与二聚体相同,发夹结构的能值越低越好。一般来说,这两项结构的能值以不超过4.5为好。

当然,在设计克隆目的的PCR引物时,引物两端一般都添加酶切位点,必然存在发夹结构,

而且能值不会太低。这种PCR需要通过灵活调控退火温度以达到最好效果,对引物的发夹

结构的检测就不应要求太高。第三项检查为GC含量,以45-55%为宜。有一些模板本身的

GC含量偏低或偏高,导致引物的GC含量不能被控制在上述范围内,这时应尽量使上下游

引物的GC含量以及Tm值保持接近,以有利于退火温度的选择。如果PCR的模板不是基

因组DNA,而是一个特定模板序列,那么最好还进行Falseprimingsite的检测。这项检查

可以看出引物在非目的位点引发PCR反应的可能性。如果引物在错配位点的引发效率比较

高,就可能出假阳性的PCR结果。一般在错配引发效率以不超过100为好,但对于特定的

7

8

模板序列,还应结合比较其在正确位点的引发效率。如果两者相差很大,比如在正确位点的

引发效率为450以上,而在错误位点的引发效率为130,那么这对引物也是可以接受的。

当我们结束以上四项检测,按Alt+P键弹出PCR窗口,其中总结性地显示该引物的位

置、产物大小、Tm值等参数,最有用的是还给出了推荐的最佳退火温度和简单的评价。

由于“Oligo”软件的引物自动搜索功能与“PrimerPremier5”的相类似,并且似乎并

不比后者更好用,在此不再赘述。其实,使用软件自动搜索引物就是让计算机按照人的要求

去寻找最佳引物,如果参数设置得当将大大提高工作效率。

除了本地引物设计软件之外,现在还有一些网上引物设计软件,如由WhiteheadInstitute

开发的“Primer3”等(本网站

210.72.11.60已引进并调试好该软件,欢迎使用)。该

软件的独特之处在于,对全基因组PCR的引物设计;可以将设计好的引物对后台核酸数据

库进行比对,发现并排除可引发错配的引物。因此建议经常做全基因组PCR的用户试用。

参考文献(References):

[1]H.A.艾得希主编,田丁等译.PCR技术——DNA扩增的原理与应用.北京:北京医科大学中国

和医科大学联合出版社,1991.

[2]林万明著.PCR技术操作与应用指南.北京:人民军医出版社,1993.

[3]朱平主编.PCR基因扩增实验操作手册.北京:中国科学技术出版社,1992

[4]郑仲承.寡核苷酸的优化设计,生命的化学,2001,21(3):254-256.

[5]bes.1992.

[6]Oligo软件帮助文件().

[7]Martin,F.H.,Castro,M.M.,andTinoco,iringinvolvingdeoxyinisine,implicationsfor

cAcidsRes,1985,13:8927-8938.

[8]Rychlik,ads,terprogramforchoosingoptimaloligonucleotidesforfilter

hybridization,cAcidsRes,1989,17:

8543-8551.生物谷网站

👁️ 阅读量:0