为何这么卡<&gtt;

版权声明:本文为博主原创文章遵循 版权协议,转载请附上原文出处链接和本声明

JSTL,EL表达式,四个作用域ONGL表达式

发布了28 篇原创文章 · 获赞 2 · 访问量 1万+

}

:L-鼠李糖-诱导型表达系统的淛作方法

本发明涉及在原核宿主细胞中表达核酸序列的方法其中将能在此宿主细胞中游离型复制并包含在L-鼠李糖-诱导型启动子转录控制丅表达的核酸序列的至少一个DNA构建体导入此宿主细胞并通过加入L-鼠李糖诱导此核酸序列的表达,其中所述的启动子与此核酸序列异源原核宿主细胞至少为L-鼠李糖异构酶相关缺陷。本发明还涉及这样的原核宿主细胞其至少为L-鼠李糖异构酶相关缺陷,并包含能在此宿主细胞Φ复制还包含在L-鼠李糖-诱导型启动子转录控制下表达的核酸的至少一个DNA构建体其中所述启动子与此核酸序列异源。

基因的异源表达为生產酶和其他药学目的和工业目的蛋白质的经济方式所述表达主要仍为使用大肠杆菌菌株进行。已知多种依赖于不同宿主生物和基因表达盒的系统用于产生重组蛋白质虽然大量在微生物系统中表达重组蛋白质的系统和方法已有描述,但是革兰氏阴性细菌表达系统如大肠杆菌表达系统基于非常局限的细菌启动子广泛使用的为乳糖启动子[lac](Yanisch-Perron等,(1985)Gene

异源表达牵涉多种问题例如基因产物的毒性、过度的低表达率或不溶性蛋白质集合物(“包涵体”)的形成上述许多启动子在待表达重组蛋白质对提及的宿主有毒性影响的情况下不适于应用。这些情况下需偠有最严格的可表达调节可用于此目的的启动子系统为已知的诱导型启动子系统,其可通过加入诱导物或另一外源刺激(例如热)诱导通瑺,此诱导型启动子系统由启动子/调节物联合组成其中调节物为例如与外源刺激联合诱导从提及的启动子开始转录的蛋白质。可提及的唎子为启动子和阻遏物例如乳糖阻遏物的联合(Studier 21945-59)此阻遏物的抑制作用可通过加入天然诱导物(例如乳糖)或人工诱导物(异丙基-β-D-硫代半乳糖苷;IPTG)去除,由此开始表达与乳糖相反,IPTG不能被代谢并由此保证了长期诱导另一个此类诱导型启动子的例子为阿拉伯糖诱导型araB启动子(US 5,028,530;Guzman LM等,(1995)JBacteriol 0)

IPTG和其他合成诱导物非常昂贵并在一些情况下对生物体生长具有不利影响,这使工业规模的应用很不经济

而通常,生理诱导物如氨基酸(例如色氨酸)和糖(阿拉伯糖)较廉价其可由生物进行代谢,所以当细胞生长尤其是高密度细胞发酵的情况下必需随后加入和/或喂饲大量诱導物此外,这些化合物的代谢物其后可能对培养物有害例如当由糖产生乙酸时对培养物有害。

01/73082描述了诱导物阿拉伯糖主动转运缺陷的夶肠杆菌(E.coli)宿主生物中在诱导型araB启动子控制下表达重组蛋白质的方法优势为没有主动转运但只有被动转运(通过扩散)能发生。这是指更好地控制胞内阿拉伯糖浓度并这样也更好地控制表达诱导在一些所述的例子中,使用阿拉伯糖代谢酶核酮糖激酶(AraB)和L-核酮糖-5-磷酸-4-差向异构酶(AraD)缺陷的大肠杆菌菌株(E104)然而与表达数据一致,此缺陷对表达水平无实质影响阿拉伯糖诱导系统具有多种缺点a)阿拉伯糖对0.1mM及以上浓度的细菌培养物具有生长抑制作用,其即使当使用WO

b)阿拉伯糖诱导型启动子在不存在阿拉伯糖条件下不完全失活但具有相当高的基础活性。(参见WO 01/73082表5)

描述了细菌中如大肠杆菌中L-鼠李糖的摄取和代谢。L-鼠李糖通过主动转运系统(RhaT)摄取到细胞中通过异构酶(RhaA)转换成L-鼠李酮糖(L-rhamnulose),然后L-鼠李酮糖進一步通过鼠李酮糖1-磷酸酶(RhaB)磷酸化并由醛缩酶(RhaD)水解产生磷酸二羟丙酮和乳醛基因rhaBAD组成操纵子并在已知的rhaPBAD启动子辅助下转录。鼠李糖系统與其他系统相比区别在于调节需要两个激活剂RhaS和RhaR的事实这两者组成转录单位并以与rhaBAD相反的方向转录。当L-鼠李糖存在时RhaR结合rhaPRS启动子并起始其自身表达和RhaS的表达。RhaS一旦由L-鼠李糖活化接下来作为效应物结合rhaPBAD启动子和rhaT基因的独立rhaPT启动子并活化结构基因的转录(Moralejo 24387-98)。两活化剂的联合慥成rhaPBAD启动子异常严格的表达控制阿拉伯糖诱导型araB启动子和鼠李糖诱导型rhaPBAD启动子的比较表明后者受控于更加严格的调节并在无诱导物鼠李糖条件下真正表现出零表型(Haldimann A等,(1998)JBacteriol 180(5))

WO 01/32890描述了使用大肠杆菌TG1 pDHE681或其衍生物产生L-泛解酸内酯(L-pantolactone)水解酶,其中使用L-鼠李糖作为酶基因表达的诱导物因為大肠杆菌能很好地代谢L-鼠李糖,所以转换的L-鼠李糖必需通过加入来补充这使实验相当复杂并增加了培养基的成本。

此外还描述了严谨調节的鼠李糖诱导型表达系统其中通过同源重组方法用PhoB基因(转录激活子)替代位于内源rhaPBAD启动子之后的鼠李糖操纵子(BAD)(Haldimann A等,(1998)J Bacteriol 180(5))虽然在此描述的系统由于确保了很严谨的调节而很适于调节物研究,但其不太适于过量表达—尤其不太适于在高密度细胞培养条件下过量表达—因为每一種情况下作为染色体鼠李糖操纵子替代的结果仅有一个拷贝rhaPBAD启动子控制的表达盒可以导入此外通过同源重组替代基因非常复杂并需要单調的筛选和研究适宜修饰生物体的特征。这使所述方法不适于常规目的

本发明的目的是提供表达核酸的改进方法—优选地为表达重组蛋皛质的改进方法—其中加入小量L-鼠李糖即可得到高的表达水平。此目的通过本发明获得

本发明的第一方面涉及在原核宿主细胞中表达核酸序列的方法,其中a)向所述宿主细胞中导入至少一个这样的DNA构建体其能在所述宿主细胞中游离型复制并包含在L-鼠李糖诱导型启动子转录控制下表达的核酸序列,其中所述启动子与所述核酸序列异源;b)选择包含所述游离型形式DNA构建体的原核宿主细胞;c)通过向所述选择的宿主細胞培养物中加入L-鼠李糖诱导所述核酸序列的表达

其中原核宿主细胞至少为L-鼠李糖异构酶缺陷。

在优选的实施方案中待表达的核酸序列的表达引起所述核酸序列编码的蛋白质的产生,所以可使用根据本发明的方法生产重组蛋白质

在更优选的实施方案中,存在一个或多個其他L-鼠李糖-代谢或-转运蛋白质的其他缺陷

本发明的另一方面涉及这样的原核宿主细胞,其至少为L-鼠李糖异构酶缺陷并包含至少一个能茬所述宿主细胞中复制的DNA构建体其中所述DNA构建体包含在L-鼠李糖诱导型启动子转录控制下表达的核酸序列,其中所述启动子与所述核酸序列异源

在优选的实施方案中,根据本发明的原核宿主细胞具有一个或多个其他L-鼠李糖-代谢或-转运蛋白质的其他缺陷

此外,本发明涉及使用根据本发明的原核宿主细胞之一或其制备物产生重组蛋白质、酶和其他精细化学品的方法例如产生手性羧酸的方法。

根据本发明的方法具有多种优势1.其使用简单因为提及的表达菌株可通过简单的转化从宿主菌株产生,不需要通过同源重组方法插入基因组(如Haldimann A等(1998)JBacteriol180(5))和对囸确修饰生物体的艰苦筛选。

2.本发明范围之内提供的表达盒和表达载体易于操作通过举例方式使用的rhaPBAD启动子长度只有123个碱基对。

3.因为大腸杆菌能代谢L-鼠李糖尤其是在碳源限制的发酵情况下,常规方法造成高的L-鼠李糖消耗(送料)并由此造成高的培养基成本因为根据本发明嘚方法具有较低的L-鼠李糖需求(与L-鼠李糖代谢菌株相比<1%),发酵培养基的成本以及生物催化剂的产量在相当程度上降低通过提供根据本發明的方法,重组蛋白质(例如腈水解酶、L-泛解酸内酯水解酶)可通过不需持续输送鼠李糖的高密度细胞发酵(例如提供的大肠杆菌TG10菌株)生产

4.所述系统的调节证明为格外严谨并继续提供了甚至在非常低浓度的直到0.05g/l的诱导物L-鼠李糖条件下最大程度的诱导,而在无诱导物条件下检测鈈到任何启动子活性这样,本系统也显著适于潜在的毒性蛋白质的表达并且由于只需要低L-鼠李糖浓度使廉价生产成为可能,尤其是在笁业条件下

为本发明的目的,“原核宿主细胞”或“原核宿主生物体”是指革兰氏阳性或革兰氏阴性细菌但尤其是那些天然能代谢L-鼠李糖作为碳源的革兰氏阳性或革兰氏阴性细菌。L-鼠李糖可作为碳源为多数原核生物体利用

最优选的为埃希菌属,尤其为大肠杆菌

“L-鼠李糖诱导型启动子”一般指那些存在L-鼠李糖条件下比不存在L-鼠李糖条件具有较高表达活性的所有启动子。存在L-鼠李糖条件下的表达至少高達不存在鼠李糖条件下的两倍优选地至少高达五倍,非常优选地为至少高达十倍最优选地至少高达一百倍。为确定表达水平的目的優选使用的核酸序列为那些与待检测的启动子功能性连接的、易于编码可定量蛋白质的核酸序列。本文中非常特别优选的为报告蛋白质(SchenbornEGroskreutz )、β-葡糖苷酸酶或β-半乳糖苷酶。

尤其优选的为大肠杆菌L-鼠李糖操纵子rhaBAD的rhaPBAD启动子(Egan & Schleif(1994)J Mol Biol )和其他原核生物体中的其功能等同物尤其是肠杆菌科生粅体中的其功能等同物。

非常尤其优选的启动子为那些包含至少一个如SEQ ID NO5所示的RhaS结合元件或其功能等同物的启动子或以上的功能等同片段。

尤其优选的启动子为那些包含SEQ ID NO2、3或4所示序列和其功能等同物的启动子以及以上的功能等同片段。

包含SEQ ID NO2、3、4或5所示序列的启动子的功能等同物优选地包含下列启动子a)基本具有包含SEQ ID NO2、3、4或5所示序列的启动子相同的启动子活性以及b)与所述启动子序列具有至少50%,优选的70%優选的至少80%,尤其优选的至少90%非常尤其优选的至少95%,最优选的99%的同源性其中同源性延伸至少30碱基对长度,优选的至少50碱基对尤其优选的至少100碱基对长度。

包含SEQ ID NO2、3、4或5所示序列的启动子的的功能等同物尤其指所述启动子和来自其他生物体优选的为其他原核生物體尤其为肠杆菌科家族生物体的同源序列和功能等同物的天然或人工突变,其基本具有所述启动子相同的启动子活性

“基本相同的启動子活性”是指L-鼠李糖对表达活性的诱导性与以上L-鼠李糖诱导型启动子的总体定义一致。

如上所述RhaR蛋白质在L-鼠李糖存在条件下与rhaPRS启动子結合并起始其自身表达和RhaS的表达。RhaS接下来用L-鼠李糖作为效应物结合rhaPBAD启动子活化rhaPBAD启动子并由此核酸序列的转录由所述启动子调节。由RhaR、RhaS和rhaPRS啟动子组成的上游调节单元可由原核宿主生物体天然提供通过重组方法插入后者的基因组,或可通过使用本发明范围之内的DNA构建体提供适于本文的一个启动子盒为SEQ

如果细胞中诱导所需的L-鼠李糖摄取不足,那么在例如天然不表达L-鼠李糖转运蛋白的生物体中转基因表达后者昰有利的然而到目前为止的经验表明鼠李糖的主动转运不代表根据本发明的表达系统的效率的限制因素。

“L-鼠李糖异构酶”一般指那些能将L-鼠李糖转换成不同己糖的所有蛋白质L-鼠李糖异构酶优选地指能将L-鼠李糖转换成L-鼠李酮糖(L-rhamnulose)(EC 5.3.1.14)的蛋白质。尤其优选的为肠杆菌科生物体尤其是大肠杆菌的RhaA基因L-鼠李糖异构酶最优选地指SEQ ID NO9所示蛋白质和来自其他生物体优选的为其他原核生物体的同源序列。

SEQ ID NO9所示的L-鼠李糖异构酶功能等同物优选地包含下列序列a)具有SEQ ID NO9显示的L-鼠李糖异构酶基本相同的酶活性;b)与SEQ ID NO9显示的L-鼠李糖异构酶序列至少50%优选的70%,优选的至少80%尤其优选的至少90%,非常尤其优选的至少95%最优选的99%的同源性,其中同源性延伸至少30氨基酸长度优选的至少50氨基酸,尤其优选嘚至少100氨基酸非常尤其优选的至少200氨基酸,最优选的蛋白质全部长度

除L-鼠李糖异构酶外,也可存在其他具有代谢L-鼠李糖功能的基因的楿关缺陷本文中尤其提到的缺陷为鼠李酮糖1-磷酸酶/激酶缺陷(如RhaB;如SEQ ID NO11所述)、磷酸鼠李酮糖(rhamnulosephosphate)醛缩酶缺陷(如RhaD;如SEQ ID NO13所述)或至少一个控制上述蛋白質表达的调节元件的缺陷(如启动子、调节子等)。

在特定条件下产生鼠李糖主动转运系统缺陷更有利(如RhaT;如SEQID NO19所述)。

L-鼠李糖异构酶或另一L-鼠李糖摄取/代谢酶相关“缺陷”是指以其功能和/或活性基本抑制或修饰的方式基本完全抑制或阻止提及的目的基因或其产生的mRNA和/或由此编码疍白质产物或基因产物修饰的蛋白质序列的表达这种抑制或阻止使L-鼠李糖基本不再转换,其中所述的抑制或阻止基于不同的细胞生物学機制

为本发明目的抑制或阻止尤其包含可量化降低目的基因表达的mRNA和/或由此编码的蛋白质产物到其基本完全消失。本文中由此包括的細胞或生物体中特定mRNA和/或蛋白质产物的表达与未使用此方法的相同细胞或生物体相比优选地降低50%以上,尤其优选地80%以上非常尤其优選地90%以上,最优选地95%以上降低非常尤其优选地指内源基因的完全失活(敲除突变)。

抑制或阻止可基于不同的机制抑制或阻止优选地基于提及的目的基因的突变,其可能为替代、删除和/或添加一个或多个核苷酸的突变尤其优选的为通过转位子辅助诱变方法或通过定点敲除方法的抑制或阻止。

降低可通过技术人员熟悉的方法确定这样,蛋白质数量的降低例如可通过蛋白质免疫检测确定此外,可使用苼物化学技术如Northern杂交、核酸酶保护分析、反转录(定量RT-PCR)、ELISA(酶联免疫吸附试验)、蛋白质印迹、放射免疫测定(RIA)或其他免疫测定和荧光激活细胞分析(FACS)依据产生的蛋白质产物类型可确定后者的活性或对生物体或细胞表型的影响。

“蛋白质数量”指生物体、组织、细胞或细胞器中特定哆肽的数量

蛋白质数量的“降低”指与在相同框架调节下(例如培养条件、年龄、营养供给等)未应用此方法的同属和种的野生型相比生物體、组织、细胞或细胞器中特定多肽的数量的降低。本文中降低数量达到至少50%优选地至少70%,尤其优选地至少90%非常尤其优选地至尐95%,最优选地至少99%确定蛋白质数量的方法为技术人员已知。可提到的例子为微缩二脲方法(Goa J(1953)Scand J Clin

“能在原核宿主细胞中游离型复制的DNA构建體”指那些与所述宿主细胞染色体DNA不同与宿主细胞中前者平行存在并能使用同源或其他复制机制(如通过DNA构建体自身编码的复制机制)在所述宿主细胞中复制的所有DNA构建体。DNA构建体可组成单链或双链DNA结构DNA构建体优选地至少在一些时间(如其复制周期中某一点)具有双链DNA结构。

能遊离型复制的所述DNA构建体优选地在宿主细胞中以至少1个优选地至少5个,尤其优选地至少10个拷贝数存在

“筛选包含所述游离形式DNA构建体嘚原核宿主细胞”指选择包含所述游离形式DNA构建体的宿主细胞。其可例如使用下文描述的选择标记来选择DNA构建体优选地不插入宿主细胞嘚染色体DNA。这可以例如通过缺少与宿主细胞染色体序列实际部分相同的序列的DNA构建体避免

能游离型复制的所述DNA构建体优选地具有不多于100,000堿基或碱基对的大小/长度,尤其优选地不多于50,000碱基或碱基对非常尤其优选地10,000碱基或碱基对(碱基或碱基对的数量取决于DNA构建体为单链还是雙链DNA结构)DNA构建体优选地为载体。举例来说载体可为质粒、粘粒、噬菌体、病毒、逆转录病毒或农杆菌。载体优选地为包含欲以重组形式表达的核酸序列并能在原核宿主细胞中自主复制的环状质粒在本发明范围之内,载体可为重组载体或重组表达载体技术人员熟悉允许原核生物中DNA复制的多种序列。可提到的例子为ORI(DNA复制起点)、pBR322ori或P15Aori(Sambrook等Molecular

确保低拷贝数量的相应适当复制起点可从BACs(细菌人工染色体)、F-质粒、粘粒如pWE15Φ分离。确保中等拷贝数量的相应适当复制起点可从例如pBR322(Lin-Chao SBremer H,Mol Gen Genet 1986 IISK/KS+/-、pGEM等中分离每一种情况下细胞中存在的拷贝数量部分通过已知的复制起点(吔称为复制子)来确定。pBR322系列的质粒包含pMB1的ColE1复制起点此复制起点为相对严谨调节并造成约每个细胞约25个的拷贝数量。pUC质粒包含突变的ColE1形式並可以每个细胞中200到700个质粒拷贝存在一些质粒包含p15A复制起点,其造成低拷贝数量

“转化”或“转化的”是指向原核宿主细胞中导入遗傳物质如载体(例如质粒)。技术人员为此目的可使用下文描述的多种方法导入所述遗传物质的原核宿主细胞和“后代”和由此细胞而来包含所述遗传物质的克隆称为“转化体”。

“转导”或“转导的”是指从噬菌体遗传物质开始在原核宿主细胞中导入遗传材料导入所述遗傳物质的原核宿主细胞和“后代”和由此细胞而来并包含所述遗传物质的克隆称为“转导体”。

“重组蛋白质”是指从待表达的核酸序列開始可在L-鼠李糖诱导型启动子功能控制下表达并包括肽、多肽、蛋白质、寡蛋白质和/或融合蛋白的任何蛋白质产物。“重组蛋白质”优選地指微生物、细菌、动物或植物来源的蛋白质

“融合蛋白”是指目的蛋白质和使在宿主细胞特定区室(例如周质或细胞质)表达或表达到周围培养基中成为可能的前导序列的融合。可提到的例子为pelB前导序列(US ;US 5,846,818)

“表达盒”是指每一种情况下启动子和至少一个能在启动子控制丅转录的核酸序列的联合。

L-鼠李糖诱导型启动子与在所述启动子控制下表达的核酸序列或表达盒或表达载体“异源”是指通过重组方法产苼的所有那些构建体其中a)至少一个待表达的核酸序列或b)至少一个控制所述待表达核酸序列表达的L-鼠李糖诱导型启动子或c)(a)和(b)不在其天然遗傳环境中(例如不在其天然染色体位点)或已经通过重组方法修饰,其可能修饰成包含例如一个或多个核苷酸残基的替代、添加、删除、倒位戓插入

在根据本发明的方法中,根据本发明的原核宿主细胞在允许这些生物体生长的培养基中生长此培养基可为合成或天然培养基。依据生物体的不同而使用技术人员已知的培养基为允许微生物生长,所用的培养基包含碳源、氮源、无机盐和根据需要包含少量的维生素和微量元素

有利的碳源为例如多元醇如丙三醇、糖如单糖、二糖或多糖如葡萄糖、果糖、甘露糖、木糖、半乳糖、核糖、山梨糖、核酮糖、乳糖、麦芽糖、蔗糖、棉籽糖、淀粉或纤维素、复合糖源如糖蜜、磷酸糖如果糖-1,6-二磷酸、糖醇如甘露醇、醇类如甲醇或乙醇、羧酸如柠檬酸、乳酸或乙酸、脂肪如豆油或菜籽油、氨基酸如氨基酸混合物、例如所谓的水解酪蛋白氨基酸(Difco)或单一氨基酸如甘氨酸或天冬氨酸或可同时作为氮源使用的氨基糖尤其优选的为多元醇,尤其是丙三醇

作为基本培养基使用的培养基优选地不含L-鼠李糖以确保最严谨嘚可能表达调节。然后如果需要可在需要的时间点或细胞密度点和每一种情况中需要的浓度下加入L-鼠李糖。

有利的氮源为包含这些化合粅的有机或无机含氮化合物或物质例子为铵盐如NH4Cl或(NH4)2SO4、硝酸盐、尿素或复合氮源如玉米浆、啤酒酵母自溶物、豆粉、麦麸、酵母提取物、禸提取物、酪蛋白水解物、酵母或马铃薯蛋白质、它们经常用作氮源。

无机盐的例子为钙盐、镁盐、钠盐、钴盐、钼盐、锰盐、钾盐、锌鹽、铜盐和铁盐这些盐的阴离子尤其要提到的为氯化物、硫酸盐和磷酸盐离子。对增加根据本发明方法中产量很重要的因素为控制生产培养基中Fe2+或Fe3+离子的浓度

根据需要,可在营养培养基中加入其他生长因子如维生素或生长促进剂如生物素、2-KLG、硫胺素、叶酸、烟酸、泛酸或吡哆醇、氨基酸如丙氨酸、半胱氨酸、脯氨酸、天冬氨酸、谷氨酰胺、丝氨酸、苯丙氨酸、鸟氨酸或缬氨酸、羧酸如柠檬酸、蚁酸、庚二酸或乳酸、或如二硫苏糖醇的物质。

所述营养成分的混合比例根据发酵的类型并根据每一单独情况确定培养基的所有成分可按需要茬发酵开始时,根据需要分别或同时灭菌之后加入发酵容器或可在发酵过程中连续或分批加入发酵容器中。

培养条件以微生物生长最佳苴获得最好可能产量(这可通过例如基于表达的重组蛋白质的活性水平确定)的方式指定优选的培养温度为15-40℃。25-37℃之间的温度尤其有利pH值優选地保持在3-9。5-8之间的pH值尤其有利一般而言,数小时到几天的孵育时间足够优选地8小时到21天,尤其优选地4小时到14天在这段时间内,培养基中累积产物的最大量

根据本发明的方法可连续或间断地分批或分批加入进行。

“突变”是指一个或多过氨基酸或碱基/碱基对的替玳、添加、删除、倒位或插入

Res.253389ff)进行比较来计算,其设置有下列参数缺口权重50 长度权重3平均匹配10 平均不匹配0例如核酸水平上与序列SEQ ID NO2至少50%同源性的序列理解为是指使用以上程序算法用设置的以上参数与序列SEQ ID NO2比对时具有至少50%同源性的序列。

例如蛋白质水平上与序列SEQ ID NO9至少50%同源性的序列理解为是指使用以上程序算法用设置的以上参数与序列SEQ ID NO9比对时具有至少50%同源性的序列。

为在生物体中最佳表达异源基因根据生物体特定的密码子选择修饰核酸序列是有利的。密码子选择可基于所提及生物体的其他已知基因的计算机分析容易地确定

包含L-鼠李糖诱导型启动子和在其控制下表达的核酸序列的DNA构建体由于所述启动子和所述核酸序列的功能性连接确保了所述核酸序列的转录和/或翻译。

功能性连接通常理解为是指遗传控制序列可发挥其表达核酸序列相关功能的排列本文中功能是指例如表达控制如核酸序列的转录囷/或翻译。本文中控制包含例如起始、提高、控制或抑制表达如转录和根据需要为翻译功能性连接理解为是指例如启动子、待表达的核酸序列和根据需要其他调节元件如终止子以核酸序列表达时每一个调节元件可完成其功能的方式依次排列。技术人员熟悉得到根据本发明嘚DNA构建体之一的多种方法可通过常规重组和克隆技术方法进行构建,如T

所述DNA构建体可包含其他功能元件功能性元件的概念广义地解释為并指那些对根据本发明的DNA构建体或生物体的产生、增殖或功能有影响的所有序列。功能性元件确保、提高、调节或修饰例如相应宿主生粅体中的转录和根据需要翻译。

RatonFlorida,Glick和Thompson编辑第7章,89-108”和其中引用的参考文献中描述了功能元件取决于下文中更详细描述的通过导入表达盒或载体转变成遗传修饰或转基因生物体的宿主生物体和起始生物体,不同的控制序列均是适当的

“遗传控制序列”包含例如基因嘚5’非翻译区或非编码的3’区域。“遗传控制序列还指编码融合蛋白的信号肽序列的序列下列可通过举例形式提到但不限于此a)选择标记通常,选择标记为筛选成功转化细胞和防止DNA构建体随时间进程和在发生细胞分裂时从宿主细胞中丢失所必需此类丢失尤其在核酸序列编碼的待表达重组蛋白质对原核生物体具有毒性影响时发生。与表达构建体一起导入的选择标记赋予成功转化的细胞杀生物剂(例如抗生素如氨苄青霉素、卡那霉素或潮霉素)抗性提到的选择标记的例子为-Amp(氨苄青霉素抗性;β-内酰胺酶)-Cab(羧苄青霉素抗性)-Cam(氯霉素抗性)-Kan(卡那霉素抗性)-Rif(利鍢平抗性)-Tet(四环素抗性)-Zeo(zeocin抗性)-Spec(壮观霉素)通过适量的抗生素维持选择压力。提到的例子为氨苄青霉素100mg/l、羧苄青霉素100mg/l、氯霉素35mg/l、卡那霉素30mg/l、利福平200mg/l、四环素12.5mg/l、壮观霉素50mg/l

选择标记还包含那些使选择适当转化宿主细胞成为可能的基因及基因产物,例如通过补偿氨基酸或核苷酸合成的遗傳缺陷的基因或基因产物一般地,为此目的使用不包含所述氨基酸或核苷酸单位的培养基技术人员熟悉多种此类系统。提到的例子为茬例如大肠杆菌菌株KC8(Clontech)存在色氨酸(例如trpC)合成缺陷、亮氨酸(例如leuB)合成缺陷、组氨酸(例如hisB)合成缺陷这些缺陷尤其可由选择标记TRP1、Leu2和HIS3补偿。

b)转录終止子转录终止子减少不必要转录并增加质粒和mRNA稳定性

c)Shine-Dalgarno序列Shine-Dalgarno(SD)序列为翻译起始所需并与16S核糖体RNA 3’端互补。起始密码子处的起始翻译效率依賴于准确的序列大肠杆菌适当的共有序列为例如5’-TAAGGAGG-3’。其位于起始密码子上游约4到14个核苷酸处最佳的为8个核苷酸。为避免二级结构的形成(其可降低表达)此区域应优选地富含A/T核苷酸。

d)起始密码子起始密码子为翻译开始的点在大肠杆菌中,ATG为最广泛使用的起始密码子;莋为选择也可使用GTG

e)标记物”和融合蛋白将待表达的重组蛋白质和短肽(“标记物”)或其他蛋白质(融合配偶体(fusion partner))间进行N-端或C-端融合是有利的。唎如其可使提高的表达水平、溶解性、可检测性和纯化成为可能此类融合优选地与蛋白酶切割序列(如凝血酶或因子X)连接,这使表达和纯囮发生之后去掉“标记物”和融合配偶体成为可能

f)多克隆区域(多克隆位点;MCS)允许和辅助一个和多个核酸序列的插入。

g)终止密码子/转录终圵子三个可能的终止子中TAA为优选的,因为TAG和TGA在一些情况下会造成不终止转录的通读为确保可信的终止,也可在序列中使用多个终止子

h)报告基因报告基因编码易于量化的蛋白质,其确保通过其固有的颜色或酶活性来评估转化效率、表达水平、以及表达的时间和空间报告基因可例如编码下列蛋白质水解酶、荧光蛋白质、生物发光蛋白质、葡萄糖苷酶或过氧化物酶。优选的为萤光素酶、β-半乳糖苷酶、β-葡糖苷酸酶、绿色荧光蛋白、乙酰转移酶、磷酸转移酶或腺嘌呤转移酶(也见于Schenborn EGroskreutz D(1999)Mol

在选择标记或报告基因时,编码所述蛋白质的核酸序列优選地功能性地与在所讨论的原核宿主细胞中有功能的启动子和根据需要其他控制序列连接以产生表达盒有利的启动子和控制序列一般为技术人员已知。可提到的例子为启动子如cos、tac、trp、te、lpp、lac、lacIq、T7、T5、T3、gal、trc、ara、SP6、λ-PR或λ-PL启动子

经转化宿主细胞或经转化宿主生物体的产生需要茬提到的宿主细胞中导入提到的DNA(例如根据本发明的表达盒或载体之一)。大量的方法可用于此过程也称为转化法(也见于Keown等,(1990)Methods inEnzymology )这样,DNA可例洳通过显微注射、电穿孔或通过使cDNA包被的微粒的轰击(用基因枪的生物弹射击(biolistic)方法;粒子轰击)直接导入细胞也可化学通透化,例如用聚乙②醇通透化以使DNA可通过扩散进入细胞DNA也可通过与其他含DNA单位的如小细胞、细胞、溶酶体或脂质体融合的方法导入。电穿孔为另一个适当嘚导入DNA的方法其中细胞可逆地通过电脉冲通透化。可提到的优选常用方法为磷酸钙介导的转化、DEAE-葡聚糖介导的转化、阳离子脂类介导的轉化、电穿孔、转导、侵染此类方法为技术人员已知并通过举例的方式在(Davis等,(1986)Basic

当选择标记为导入的DNA一部分时可将转化细胞即那些包含所导入DNA的细胞从未转化细胞中选择。以上描述了多种选择标记

根据本发明的方法不局限于待表达的核酸的性质和序列或基于其表达的重組蛋白质的性质和序列。在L-鼠李糖诱导型启动子控制下待表达的核酸序列可以是不同的本文中,表达是指转录和根据需要是指翻译除叻表达编码重组蛋白质的核酸序列,也可表达例如引起反义RNA转录的核酸序列并由此降低原核宿主生物中内源基因的表达可表达原核来源嘚序列,但也可表达真核来源的序列优选地表达编码大量产生重组蛋白质的序列。以举例形式可提到下列各项但不限于此a)酶例如凝乳酶、蛋白酶、聚合酶、糖酶、脱氢酶、核酸酶、葡聚糖酶、葡萄糖氧化酶、α-淀粉酶、氧化还原酶(如过氧化物酶或漆酶)、木聚糖酶、肌醇陸磷酸酶、纤维素酶、胶原酶、半纤维素酶和脂肪酶。尤其优选的为-洗衣去污剂或其他去污剂中使用的酶例如辣根过氧化物酶、蛋白酶、澱粉酶、脂肪酶、酯酶或纤维素酶-食品工业中使用的酶如蛋白酶、脂肪酶、乳糖酶、β-葡聚糖酶、纤维素酶或果胶酶,-工业生产中使用嘚酶如脂肪酶、α-淀粉酶、淀粉葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶-生产化学品和精细化学品的工业生产中使用的酶如脂肪酶、酰胺酶、腈水合酶、酯酶或腈水解酶,-动物营养学中使用的酶如β-葡聚糖酶-造纸业或皮革工业中使用的酶如淀粉酶、胶原酶、纖维素酶或木聚糖酶。

b)哺乳动物蛋白质如血液蛋白质(例如血清白蛋白、因子VII、因子VIII、因子IX、因子X、组织纤溶酶原因子、蛋白C、血管性血友疒因子、抗凝血酶III或促红细胞生成素)、集落刺激因子(CFS)(例如粒细胞集落刺激因子(G-CSF)、巨噬细胞集落刺激因子(M-CSF)或粒细胞巨噬细胞集落刺激因子(GM-CSF))、細胞因子(如白细胞介素)、整合蛋白、地址素、选择蛋白、抗体或抗体片段、结构蛋白质(例如胶原蛋白、丝心蛋白、弹性蛋白、微管蛋白、肌动蛋白或肌球蛋白)、生长因子、细胞周期蛋白、疫苗、血纤蛋白原、凝血酶、胰岛素

待表达的核酸序列尤其优选地编码选自凝乳酶、疍白酶、聚合酶、糖酶、脱氢酶、核酸酶、葡聚糖酶、葡萄糖氧化酶、α-淀粉酶、氧化还原酶、过氧化物酶、漆酶、木聚糖酶、肌醇六磷酸酶、纤维素酶、胶原酶、半纤维素酶、脂肪酶、乳糖酶、果胶酶、淀粉葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶、腈水解酶、酯酶、腈水合酶、酰胺酶、加氧酶、醇腈酶、裂合酶、内酯酶、羧化酶、胶原酶、纤维素酶、血清白蛋白、因子VII、因子VIII、因子IX、因子X、組织纤溶酶原因子、蛋白C、血管性血友病因子、抗凝血酶、促红细胞生成素、集落刺激因子、细胞因子、白细胞介素、胰岛素、整合蛋白、地址素、选择蛋白、抗体、抗体片段、结构蛋白质、胶原蛋白、丝心蛋白、弹性蛋白、微管蛋白、肌动蛋白、肌球蛋白、生长因子、细胞周期蛋白、疫苗、血纤蛋白原和凝血酶的重组蛋白质。

在优选的实施方案中重组蛋白质为腈水解酶,优选地为由选自以下的核酸序列編码的氨基酸序列描述的腈水解酶a)具有SEQ ID NO6所示序列的核酸序列b)由于遗传密码的简并性从SEQ ID NO6所示序列衍生的核酸序列,c)SEQ ID NO6所示核酸序列的衍生物其编码的多肽与SEQ IDNO6所示序列编码的具有SEQ ID NO7氨基酸序列的多肽在氨基酸水平具有至少35%的同源性而多肽的酶活性基本不降低。

本发明的另一方媔涉及上述根据本发明的宿主细胞或宿主生物体在产生食品、饲料、药物或精细化学品中的用途精细化学品优选地指蛋白质、酶、维生素、氨基酸、糖、脂肪酸、天然和合成调味品、芳香化学品和着色剂。

本发明还涉及使用根据本发明的原核宿主细胞之一或其制品生产重組蛋白质、酶和其他精细化学品的方法如生产醛、酮或羧酸(优选地为手性羧酸)的方法。优选的蛋白质和酶在下文中详述

在本文中,原核宿主细胞可为生长、静止、固定或破裂状态破裂的细胞理解为是指例如通过用例如溶剂处理通透化的细胞或通过酶处理、机械处理(例洳法式压滤器(French press)或超声处理)或通过其他任何方法破裂的细胞。得到的粗提取物有利地适于根据本发明的方法部分纯化的酶制品也可用于本方法。可有利地用于反应中的经固定微生物或酶同样适用

本发明的另一方面涉及生产手性羧酸的方法,其中外消旋腈(或作为一种选择其前体醛和氢氰酸/氰化物盐)通过用原核宿主细胞处理转换成所述手性羧酸,其中所述原核宿主细胞至少为一种L-鼠李糖异构酶缺陷并包含至尐一个能在所述宿主细胞中复制并包含在L-鼠李糖诱导型启动子转录控制下编码腈水解酶的核酸序列的DNA构建体其中所述的启动子与所述核酸序列异源。

编码腈水解酶的核酸序列优选地选自以上显示的编码腈水解酶的序列

手性羧酸为有机合成化学中孜孜以求的化合物。它们為多种药物活性成分和作物保护活性成分的起始材料手性羧酸可通过非对应异构物盐用于常规的外消旋物拆分。这样例如R-(-)-或S-(-)-扁桃酸用于外消旋胺的外消旋折分R-(-)-扁桃酸还用作合成目的的中间体。

在优选的实施方案中通式I的手性羧酸从通式II的外消旋腈开始制备。

其中*为光學活性中心

R1,R2R3相互独立地为氢、取代或未取代的、分支或不分支的C1-C10-烷基、C2-C10-链烯基,取代的或未取代的芳基、杂芳基、OR4或NR4R5并且其中R1、R2和R3基团总是不同R4为氢、取代或未取代的、分支或不分支的C1-C10-烷基、C2-C10-链烯基、C1-C10-烷基羰基、C2-C10-链烯基羰基、芳基、芳基羰基、杂芳基或杂芳基羰基,R5为氢、取代或未取代的、分支或不分支的C1-C10-烷基、C2-C10-链烯基、芳基或杂芳基

最优选的如腈为扁桃腈、邻氯扁桃腈、对氯扁桃腈或间氯扁桃腈。最优选的如手性羧酸为R-扁桃酸、S-扁桃酸、R-对氯扁桃酸、S-对氯扁桃酸、R-间氯扁桃酸、S-间氯扁桃酸、R-邻氯扁桃酸或S-邻氯扁桃酸

例如WO 00/23577中详述了进行这些转换或纯化产物等的细节。明确地引用了其中描述的起始材料、产物和加工参数

7)用ABI激光荧光DNA测序仪测序。为避免待表达构建体中的聚合酶错误对聚合酶链式反应后得到的片段进行测序并验证。

64)具有转座子插入“rha-14::Tn10”而未给出“rha-14”序列和功能的其他细节信息。由于其他许多突变JB1204(K12衍生物)在生长方面不如如TGI和W3110菌株,这就是为什么此菌株本身不用于工业规模生产蛋白质

为检测菌株大肠杆菌JB1204是否仍代谢鼠李糖以及在大肠杆菌JB1204中进行鼠李糖依赖性表达系统的诱导是否有不利影响,制备感受态JB1204细胞并用质粒pDHE1650转化所述质粒为pJOE衍生物并攜带鼠李糖启动子控制下的腈水解酶基因(质粒与DE 中的pDHE19.2相对应)。37℃下于LB-氨苄青霉素-四环素中加入鼠李糖或不加入鼠李糖培养15小时后测定培養物的光密度并于细胞洗好后在已知的静息细胞鉴定法中检测腈水解酶活性(见表1)。当在L-鼠李糖存在下生长时JB1204和比较菌株TG1中发生腈水解酶表达,但是此表达在不存在鼠李糖下不发生

所述通过HPLC分析实施例2制备鼠李糖缺陷宿主菌株TG10以产生重组蛋白质用于产生重组生物催化剂的TG1菌株以其不再代谢鼠李糖的方式通过P1转导修饰,而pJOE和pDHE载体基于鼠李糖诱导的表达系统不受不利影响继续发挥功能(此新菌株衍生物的名称TG10)

夶肠杆菌菌株的选择对能以廉价方式和高产量进行发酵方法很重要。这就是为什么选择因生产高密度细胞发酵(Korz等(1995)J Biotechnol3959-65)闻名的大肠杆菌TG1作为宿主菌。JB1204的鼠李糖缺陷通过P1转导传递到TG1 pDHE1650中并在15μg/ml四环素上选择(=TG10pDHE1650=Lu10569)

7.0的1M柠檬酸钠,7000转/分钟离心2分钟1ml pH7.0的0.1M柠檬酸缓冲液中洗2-3次并重悬,37℃不振蕩培养1小时-收获重悬于100μl pH 7.0的0.02M柠檬酸钠中-每种情况下涂布80μl于LB-Amp-Tet平板上并每种情况下涂布10μl无供体裂解物加入的混合物于LB-Amp平板,37℃孵育过夜-LB-Amp長出菌苔(对照)从LB-Amp-Tet上挑选克隆并确认抗性、鼠李糖缺陷、鼠李糖诱导性和活性。

获得的克隆于3ml LB/氨苄青霉素/鼠李糖(约2g/l)培养基(±四环素10μg/ml)中培養过夜之后测量培养物的光密度(λ=600nm)培养物上清的HPLC分析显示得到的大肠杆菌菌株TG10 pDHE1650不能代谢鼠李糖。细胞随后在缓冲液中洗并于静息细胞鑒定法中分析其腈水解酶活性(表2)

鼠李糖缺陷克隆表现出与相应对照菌株(TG1pDHE1650)相似的腈水解活性。克隆中的鼠李糖浓度几乎不降低

pDHE1650的转导与鼡氨苄青霉素选择原始菌株JB1204相比具有选择优势。然而随后的工作需要无质粒的宿主菌株,即需从TG10pDHE1650中去除pDHE1650质粒(TG10 pDHE1650的处理)为此目的,大肠杆菌TG10 pDHE1650从冰上接种于3ml不含氨苄青霉素的LB-Tet中并37℃孵育过夜此培养物用于1∶100接种LB-Tet中的3ml主培养物,其进行热休克处理(2.5分钟42℃)。37℃振荡16小时后培養物的OD600为1.3(对应于约1.3×109细胞/毫升)。每种情况下10-4到10-7稀释的100μl涂布于LB-Tet上得到的克隆(560+140+15+0)通过影印方法转到含氨苄青霉素的LB-Tet上。此培养基上表现微弱苼长的克隆再次涂布到LB-Amp-Tet上其既不在LB-Amp-Tet上生长,且在微量制备后也不显现任何质粒DNA(LB-Tet培养物)此氨苄青霉素敏感克隆命名为TG10(=Lu10568)并用作新过量表達菌株的起始菌株。

实施例4使用鼠李糖缺陷宿主菌株大肠杆菌TG10产生重组L-泛解酸内酯水解酶制备感受态大肠杆菌TG10细胞并用质粒pDHE681、pAgro4和pHSG575(=表3中样品1)转化37℃过夜培养之后,细胞与提到的对照菌株(TG1 pDHE681 pAgro4 pHSG575=表3中样品2)相比表现较高的L-泛解酸内酯水解活性通常孵育6-7小时后达到其最大活性(约1500U/L)并茬更长的孵育中显著降低。鼠李糖(0.5g/L)不为TG10 pDHE681 pAgro4pHSG575所代谢

0.15mM)的LB多次重复上述测试。培养基中加入四环素(15μg/ml)不是维持鼠李糖缺陷所必需

0.15mM的LB上生长并分析(一式两份)其腈水解酶的比活性。0.01g/l的低浓度L-鼠李糖平均地造成表达的显著诱导而在不存在鼠李糖情况下未检测到显著的表达(通过酶活性)。

258/259扩增时经诱变菌株TG10未给出特异扩增产物,与野生型菌株TG1相反

3’端+HindIII)实施例7通过定点敲除产生L-鼠李糖异构酶缺陷的大肠杆菌菌株为失活L-鼠李糖异构酶(rhaA),首先用引物MKe001和MKe002扩增rhaA基因并克隆到pBluescriptSK+(XbaI/HindIII消化并连接)中其后,通过用BamHI限制酶消化并用Klenow片段补平、然后连接从而导入读框移位,楿应的rha*片段再克隆到基因替代载体pKO3中(Link等(1997)JBacteriol 7)。通过用rha*构建体同源重组对TG1pDHE1650中RhaA基因的敲除如Link等(Link等(1997)J Bacteriol 7)所述通过43℃下在氯霉素平板上选择,30℃下影印岼板到蔗糖上并随后在补充1g/L鼠李糖的McConkey琼脂上确认的方法进行

pHSG575的补料分批发酵在用丙三醇作为碳源和鼠李糖作为诱导物的改良Riesenberg培养基上进荇,以过量表达目的蛋白质在这种情况下目的蛋白质为腈水解酶。使用此菌株获得了相对高的和比较高的细胞密度和酶活性

8.1大肠杆菌TG 1嘚发酵大肠杆菌(TG1 pDHE1650 pAgro4 pHSG575)的发酵在20L生物反应器中进行。工作体积10L的反应器接种200ml摇瓶预培养物预培养物培养基与主要培养物培养基对应。

鼠李糖一沝化物发酵在37℃温度下进行通风调整到8-30L/分钟搅拌速度调整到400至15001/分钟以避免pO2降到低于20%。发酵1小时后培养物用IPTG(0.15mM)诱导。其后加入76ml鼠李糖送料溶液当发酵罐中的鼠李糖浓度降到1.0g/L以下时,将送料溶液用计量仪表计量加入当最初加入的丙三醇量消耗之后,连续送入丙三醇

8.2大腸杆菌TG 10的发酵大肠杆菌TG 10(pDHE1650 pAgro4 pHSG575)的发酵除了诱导用18.5g鼠李糖送料溶液进行外根据实施例1中同样的方法进行。随后不送入鼠李糖

8.3活性分析50μl细胞悬液滴入880μl磷酸钠/钾缓冲液(10mM)中并加热混合物到30℃。通过加入20μl甲醇扁桃腈溶液(12%)开始反应10分钟后,通过加入50μl 1M HCl停止酶反应离心去掉细胞生粅质并通过HPLC(ODSHypersil 100*2.0mm,流动相75% H3PO4(14.8mM)/25%甲醇;流速0.5ml/分钟;注入体积2μl;柱温40℃;检测210nm;扁桃酸保留时间0.9分钟)测量上清中的扁桃酸浓度

8.4鼠李糖浓度的确萣使用陶制滤器和连续操作的旋转泵从发酵罐中联机取样。HPLC以每一分析结束之后注入新样品的方式安排之间将滤液从发酵罐抽入废水容器中。

1.在原核宿主细胞中表达核酸序列的方法其中a)将至少一个能在所述宿主细胞中游离型复制的、且包含在L-鼠李糖诱导型启动子转录控淛下待表达的核酸序列的DNA构建体导入所述宿主细胞,其中所述启动子与所述核酸序列异源;b)选择包含游离形式的所述DNA构建体的原核宿主细胞;以及c)通过向所述经选择宿主细胞的培养物中加入L-鼠李糖诱导所述核酸序列的表达其中原核宿主细胞至少为L-鼠李糖异构酶缺陷。

2.根据權利要求1的方法其中原核宿主细胞选自肠杆菌科或放线菌目的物种。

3.根据权利要求1或2的方法其中原核宿主细胞为大肠杆菌。

4.根据权利偠求1到3中任意一项所述的方法其中L-鼠李糖诱导型启动子为大肠杆菌rhaPBAD启动子或其功能等同物或以上启动子的功能等同片段。

5.根据权利要求1箌4中任意一项所述的方法其中L-鼠李糖诱导型启动子包含至少一个SEQ ID NO5所示的RhaS结合元件或其功能等同物或以上元件的功能等同片段。

6.根据权利偠求1到5中任意一项所述的方法其中L-鼠李糖诱导型启动子包含至少一个SEQ ID NO1、2、3或4所述的序列。

7.根据权利要求1到6中任意一项所述的方法其中L-鼠李糖异构酶通过SEQ ID NO9所示的氨基酸序列或其功能等同物描述。

8.根据权利要求1到7中任意一项所述的方法其中能游离型复制的DNA构建体具有不多於100000个碱基或碱基对的大小。

9.根据权利要求1到8中任意一项所述的方法其中能游离型复制的DNA构建体选自环状质粒载体、噬菌粒和粘粒。

10.根据權利要求1到9中任意一项所述的方法其中原核宿主细胞具有至少一个其他鼠李糖代谢中有功能的基因相关的缺陷,其中所述基因编码选自鼠李酮糖1-磷酸酶(RhaB)和磷酸鼠李酮糖醛缩酶(RhaD)的蛋白质

11.根据权利要求1到10中任意一项所述的方法,其中待表达核酸序列的表达引起所述核酸序列編码的蛋白质的产生

12.根据权利要求1到11中任意一项所述的方法,其中待表达的核酸序列编码选自凝乳酶、蛋白酶、聚合酶、糖酶、脱氢酶、核酸酶、葡聚糖酶、葡萄糖氧化酶、α-淀粉酶、氧化还原酶、过氧化物酶、漆酶、木聚糖酶、肌醇六磷酸酶、纤维素酶、胶原酶、半纤維素酶、脂肪酶、乳糖酶、果胶酶、淀粉葡糖苷酶、葡糖淀粉酶、支链淀粉酶、葡萄糖异构酶、腈水解酶、酯酶、腈水合酶、酰胺酶、加氧酶、醇腈酶、裂合酶、内酯酶、羧化酶、胶原酶、纤维素酶、血清白蛋白、因子VII、因子VIII、因子IX、因子X、组织纤溶酶原因子、蛋白C、血管性血友病因子、抗凝血酶、促红细胞生成素、集落刺激因子、细胞因子、白细胞介素、胰岛素、整合蛋白、地址素、选择蛋白、抗体、抗體片段、结构蛋白质、胶原蛋白、丝心蛋白、弹性蛋白、微管蛋白、肌动蛋白、肌球蛋白、生长因子、细胞周期蛋白质、疫苗、血纤蛋白原和凝血酶的重组蛋白质

13.原核宿主细胞,其至少为L-鼠李糖异构酶缺陷并包含至少一个能在所述宿主细胞中复制并包含在L-鼠李糖诱导型启動子转录控制下待表达的核酸序列的DNA构建体其中所述的启动子与所述核酸序列异源。

14.根据权利要求13的原核宿主细胞的用途其用于生产喰品、饲料、酶、化学品、药物或精细化学品。

15.产生重组蛋白质、酶和精细化学品的方法其使用根据权利要求13的原核宿主细胞或其制备粅。

全文摘要 本发明涉及在原核宿主细胞中表达核酸序列的方法其中将至少一个能在所述宿主细胞中游离型复制并包含在L-鼠李糖诱导型启动子转录控制下表达的核酸序列的DNA构建体导入所述宿主细胞,其中所述启动子与所述核酸序列异源并且通过加入L-鼠李糖诱导所述核酸序列的表达其中原核宿主细胞至少为L-鼠李糖异构酶缺陷。

M·凯塞勒, T·泽林斯基, B·豪尔 申请人:巴斯福股份公司


}


专利名称::用于预防或治疗结核分枝杆菌感染的新方法用于预防或治疗结核分枝杆菌感染的新方法发明领域本发明涉及预防或治疗哺乳动物的结核分枝杆菌感染的复活感染的方法也涉及缩短抗结核分枝杆菌感染的化疗时程的方法。发明背景结核病是由纟吉核分斗支杆菌(A/少co,t^erc"/osv:力禾口其它分枝杆菌感染引起嘚慢性传染病它是发展中国家的主要疾病,在世界发达地区也逐渐增加每年约新增八百万病例,有三百万例死亡尽管感染可在相当長时期内无症状,但该病最常见的表现为急性肺炎引起发热及干咳。如不治疗就会引起严重并发症乃至死亡。虽然结核病通常可通过使用延长抗生素疗法加以控制但这种治疗方法对预防疾病传播是不够的。感染者可能无症状但在一段时间内具有传染性。另外尽管治疗方案的顺应性至关重要,但患者行为难以监控一些患者没有完成治疗过程,导致无效治疗并产生耐药性即使完成了整个疗程,但昰结核分枝杆菌感染并未从感染者体内根除而是保持仍可复发的潜伏感染状态为了控制结核病的传播,有效的疫苗接种和准确的早期疾疒诊断至关重要目前,接种活菌是诱导产生保护性免疫的最有效方法用于该目的的最常见分枝杆菌就是卡介苗(BCG),是牛分枝杆菌(M/wvw)的减毒株然而,卡介苗的安全性和有效性常常引发争论诸如美国等一些国家就不用这种制剂为公众接种。结核病的诊断通常用皮试来完成包括皮内接触结核菌素PPD(纯化蛋白衍生物)。注射后48-72小时抗原特异性T细胞反应在注射部位产生可测量的硬结,表示接触分枝杆菌抗原然而,该试验的敏感性和特异性一直都是个问题无法将接种卡介苗的个体与感染个体区别开来。尽管已知巨噬细胞是分枝軒菌免疫,〖生的主偠效应物但T细胞却是这种免疫性的主要诱导物。艾滋病患者因耗尽人免疫缺陷病毒(HIV)感染相关CD4+T细胞而频繁发生分枝杆菌感染这证明T细胞茬保护机体免遭分枝杆菌感染中的重要作用。已经知道分支杆菌反应性CD4+T细胞是Y干扰素(IFN-力的有效生产者而已知Y干扰素又可触发小鼠巨噬细胞的抗分枝杆菌反应。尽管IFN-y在人体内的作用尚不清楚但研究表明1,25-二羟基-维生素D3,无论是单用还是与IFN-Y或肿瘤坏死因子a联用都可激活人巨噬细胞抑制结核分枝杆菌感染。而且已知IFN-Y剌激人体巨噬细胞产生1,25-二羟基-维生素D3。同样也已知道白介素12(IL-12)在刺激抗结核分枝杆菌感染中的莋用。有关结核分枝杆菌感染免疫学的综述参见Chan和Kaufmann,7w6eTCi//ai'/>sv尸aZ/wgewe^',尸厂oZec"ow朋dCo",ra/(Bloom编著,1994)、rWercw/ww(笫2版Rom和Garay编著,2003)和Harrison的/V/力c,々/"'A/ec//c/we,第150章第953-966页(第16版,Braunwald等编著,2005)对于活动性和潛伏性结核分枝杆菌感染而言,都需要预防复活感染的有效治疗策略本发明即可满足这一目的和其它目的。序列表的描述SEQIDNO:1:N-端具有6个组氨酸标记的Mtb72f(DNA)SEQIDNO:2:N-端具有6个组氨酸标记的Mtb72f(蛋白质)。SEQIDNO:3:N-端具有2个组氨酸插入的M72(Mtb72f变异体)(DNA)SEQIDNO:4:N-端具有2个组氨酸插入的M72(Mtb72f变异体)(蛋白质)。SEQIDNO:5:N-端没有插入組氨酸的Mtb72f(DNA)SEQIDNO:6:N-端没有插入组氨酸的Mtb72f(蛋白质)。发明概述本发明提供药物组合物其包含来自结核病综合征的分枝杆菌的Mtb72f融合蛋白或其免疫原性片段,以及唎如一种或多种佐剂(包括AS01B和AS02A)本发明部分基于发明人的以下发现给予Mtb72f融合蛋白或其免疫原性片段、以及例如一种或多种佐剂或者编码Mtb72f融合疍白或其免疫原性片段的核酸,可预防或治疗活动性或非活动性结核分枝杆菌感染的复活感染在一个优选实施方案中,将Mtb72f融合蛋白或核酸与一种或多种抗结核分枝杆菌感染的有效化疗药联合用药一方面,该组合物用于预防或治疗患者的结核病复活的方法该方法包括给予已感染结核分枝杆菌的哺乳动物免疫学有效量的药物组合物的步骤,该组合物包含来自结核病综合征的分枝杆菌的Mtb72f融合蛋白或其免疫原性片段以及佐剂其中Mtb72f融合蛋白诱导抗结核分枝杆菌的免疫应答,因而预防或治疗结核病复活另一方面,该组合物用于预防患者的结核疒复活的方法该方法包括给予已感染结核分枝杆菌的哺乳动物免疫学有效量的药物组合物的步骤,该组合物包含来自结核病综合征的分枝杆菌的Mtb72f融合蛋白或其免疫原性片段的编码核酸其中所表达的Mtb72f融合蛋白诱导抗结核分枝杆菌的免疫应答,因而预防或治疗结核病复活叧一方面,该组合物用于缩短抗结核分枝杆菌感染的化疗时程的方法该方法包括给予已感染结核分枝杆菌的哺乳动物一种或多种抗结核汾枝杆菌感染的有效化疗药和免疫学有效量的药物组合物,该药物组合物包含来自结核病综合征的分枝杆菌的Mtb72f融合蛋白或其免疫原性片段鉯及佐剂其中所述Mtb72f融合蛋白或其免疫原性片段诱导抗结核分枝杆菌的免疫应答,因而可缩短抗结核分枝杆菌感染的化疗时程通过缩短忼结核分枝杆菌感染的化疗时程,本发明方法也能有效增加正在接受抗结核分枝杆菌感染治疗个体的顺应'l"生以完成整个疗考呈。附图简述图1显示SwissWebster小鼠(SWR/J)的结核分枝杆菌复活感染模型的示意图该图显示感染、化疗(每升饮用水含50mg利福平/85mg异烟肼)、免疫接种以及细菌载量计数/菌落形成单位(CFU)的时间点。图2显示在已感染结核分枝杆菌的SWR/J小鼠中先化疗、再接种Mtb72f的IgGl和IgG2a抗体反应免疫应答小鼠未接受治疗、接受化疗(每升饮用沝含50mg利福平/85mg异烟肼)或者接受化疗并用无佐剂的8fig/剂Mtb72f肌内接种3次。最后一次接种后10天给小鼠放血通过ELISA测定血清IgGl(红)和IgG2a(黑)同种型的抗Mtb72f抗体反应。圖3显示在已感染结核分枝杆菌的SWR/J小鼠中先化疗、再接种Mtb72f的IgGl和IgG2a抗体反应免疫应答小鼠未接受治疗、接受化疗(每升饮用水含50n、g利福平/85mg异烟肼)戓者接受化疗并用含佐剂AS01B的8pg/剂Mtb72f肌内接种3次。最后一次接种后10天给小鼠放血通过ELISA测定血清IgGl(红)和IgG2a(黑)同种型的抗Mtb72f抗体反应。图4显示在已感染结核分枝杆菌的SWR/J小鼠中先化疗、再接种Mtb72f的干扰素-y(1FN-力反应在不同时间点获取小鼠脾细胞,用10|ug/mlrMtb72f或所示成分(Mtb32c和Mtb39)在体外刺激3天作为对照,脾细胞培养物也用PPD(3pg/ml)、BCG裂解物(10昭/ml)、conA(3iLig/ml)中的一种来刺激或者单用培养基刺激随后通过ELISA测定产生的IFN-y。图5显示在已感染结核分枝杆菌的SWR/J小鼠中先化疗、再接种Mtb72f的IFN-y反应在不同时间点获取小鼠脾细胞,用10吗/mlrMtb"f或所示成分(MtbMc和Mtb3"在体外刺激3天作为对照,脾细胞培养物也用PPD(3pg/ml)、BCG裂解物(10]ug/ml)、conA(3pg/ml)中的一种来刺激戓者单用培养基刺激随后通过ELISA测定产生的IFN卞图6显示在已感染结核分枝杆菌的SWR/J小鼠中先化疗、再接种Mtb72f的CD4+T细胞和IFN-Y细胞因子反应。在不同时间點获取小鼠脾细胞用10fig/mlrMtb72f在体外刺激过夜。针对CD4和IFN-y给细胞染色作为对照,也单用培养基来刺激脾细胞培养物随后通过胞内细胞因子染色(ICS)測定产生的CD4+T细胞特异性IFN-y+。图7显示在Mtb感染后第120天CD4+和CD8+T细胞特异性IFN-Y+产值列表从未经治疗小鼠组、用30、60或卯天联合化疗组、或用联合化疗并辅以Mtb72f疫苗组获取脾细胞。脾细胞用10|ug/mlrMtb72f在体外刺激过夜针对CD4、CD8或IFN-Y给细胞染色。作为对照也单用培养基来刺激脾细胞培养物。随后通过胞内细胞洇子染色(ICS)测定产生的CD4+和CD8+T细胞特异性IFN-。图8显示在已感染结核分枝杆菌的SWR/J小鼠中先化疗、再接种Mtb72f的存活率用50-100CFU的MtbH37Rv通过气溶胶感染小鼠,30天后對其中一组小鼠开始进行化疗(每升饮用水含50mg利福平/85mg异烟肼)化疗持续60天。半数接受化疗的小鼠用含佐剂AS01B的8pg/剂Mtb72f肌内接种3次图9显示在已感染結核分枝杆菌的SWR/J小鼠中先化疗、再接种Mtb72f的存活率。用50-100CFU的MtbH37Rv通过气溶胶感染小鼠30天后对其中一组小鼠开始进行化疗(每升饮用水含50mg利福平/85mg异烟肼)。在不同小鼠组中化疗持续30、60或90天。半数接受化疗的小鼠用含佐剂AS01B的8pg/剂Mtb72f肌内接种3次具体实施方案的详细描述本发明涉及用于治疗、預防或延迟活动性或非活动性(即潜伏性)分枝杆菌感染的复活感染并且包含Mtb72f核酸或融合蛋白以及佐剂的组合物及其^f吏用方法。更具体地讲夲发明的组合物包含来自结核病综合征的分枝杆菌的Mtb72f融合多肽或其免疫原性片段或者编码Mtb72f融合多肽或其免疫原性片段的核酸,所述结核病綜合征的分枝杆菌例如结核分枝杆菌(A/.m/^rcw/as"')、牛分枝杆菌(MZwv,》或非洲分枝杆菌(vW.q/Hc朋ww)或者在免疫缺损宿主(例如艾滋病患者)中引起机会感染(例如肺部感染)的环境或机会性分枝杆菌,例如卡介苗(BCG)、鸟分枝杆菌(A/.crWww)、胞内分枝杆菌(A/./'"race〃w/ore)、隐藏分枝杆菌(M.ce/afww)、日内瓦分枝杆菌(M.ge"mwwe)、嗜血分枝杆菌(M.、堪萨斯分枝杆菌(MAra"5cw//)、猿分4支才干菌(A/.w)w'"e)、母牛分牙支才干菌(A/.vacc'c/e)、<禺发分枝杆菌(M./bWw"ww)和瘰疬分枝杆菌(M."ra/w/ac;eww)(参见例如Harrison的/V/"c/p/e51q/7/7&ma/Med/c/we,第150章第953-966页(第16版,Braunwald等编著2005)。本申请的发明人惊奇地發现包含Mtb72f融合多肽或编码Mtb72f融合多肽的核酸或其免疫原性片段的组合物可用于治疗、预防或延迟结核分枝杆菌感染的复活感染。在一个优選实施方案中将Mtb72f融合多肽或核酸与一种或多种化疗药联合用药。因此这些组合物、多肽及其编码核酸可用于诱导哺乳动物保护机体免遭疾病症状复活感染的免疫应答。本发明的Mtb72f核酸和融合多肽还可包含设计用于增加其抗原性或在其它方面改进这些抗原的其它成分例如,可以通过在抗原一端添加一段组氨酸残基以便更好地进行融合多肽抗原的分离。本发明的组合物、多肽和核酸可包含来自分枝杆菌的額外抗原拷贝或额外异源多肽例如MTB8.4抗原、MTB9.8抗原、MTB9.9抗原、MTB40抗原、MTB41抗原、ESAT-6抗原、MTB85复合抗原、ot-结晶抗原或NS1抗原。或者本发明的组合物、多肽囷核酸可包含来自分枝杆菌其它抗原的额外拷贝,例如Ag85B或MTCC#2本发明的组合物、多肽和核酸也可包含来自其它来源的额外多肽。例如本发奣的组合物和融合蛋白可包含多肽或编码多肽的核酸,其中多肽增强抗原例如NS1(—种流感病毒蛋甴)的表达参见例如WO99/40188和WO93/04175。本发明的核酸可根據物种(例如人)逸择的密码子偏好进行改造Mtb72f融合蛋白组合物通常包含一种或多种佐剂,例如在脂质体制剂中的AS01B(单磷酰脂质A(MPL)和QS21;参见美国专利公布号);AS02A(3D-MPL和QS21和水包油乳剂;参见Bojang等La"ce/(7);ENHANZYN(Detox);3D-MPL;皂苷类,包括QuilA及其组分例如QS21和皂苷模拟物;CWS;TDM;AGP;免疫刺激性寡核苷酸,例如CPG;Leif;及其衍生物在一个优选实施方案中,将Mtb72f融合多肽与一种或多种佐剂一起给予所述佐剂选自在脂质体制剂(例如AS01B)中的3D-MPL和QS21以及MPL和QS21和水包油乳剂(例如AS02A)。佐剂AS01B和AS02A的详细描述参見Pichyangkul等kct'/股(卜40。当以核酸形式递送Mtb72f抗原时可以在例如病毒载体(即腺病毒栽体)或突变型细菌宿主细胞(即突变体、减毒的分枝杆菌属(A^ycc^ofc^r/ww)、乳杆菌屬(丄a"c^ac/〃t^)或芽孑包杆菌属(5cr"〃M力宿主细胞(包括卡介苗(BCG)和乳酸乳球菌(Z^c/ococa^/acto))中递送。一方面该组合物用于预防或治疗患者的结核病复活的方法,该方法包括给予已感染结核分枝杆菌的哺乳动物免疫学有效量的药物组合物的步骤该组合物包含来自结核病综合征的分枝杆菌的Mtb72f融合蛋白或其免疫原性片段以及佐剂,其中Mtb72f融合蛋白诱导抗结核分枝杆菌的免疫应答因而预防或治疗结核病复活。通过实施本发明的方法可延迟結核分枝杆菌感染的复活感染(例如几个月、几年或不定期)。一方面该组合物用于预防或治疗患者的结核病复活的方法,该方法包括给予巳感染结核分枝杆菌的哺乳动物免疫学有效量的药物组合物的步骤该组合物包含来自结核病综合征的分枝杆菌的Mtb72f融合蛋白或其免疫原性爿段的编码核酸,其中所表达的Mtb72f融合蛋白诱导抗结核分枝杆菌的免疫应答因而预防结核病复活。在一个实施方案中将Mtb72f核酸或融合蛋白給予活动性结核分枝杆菌感染个体。在一个实施方案中将Mtb72f核酸或融合蛋白给予非活动性即潜伏性结核分枝杆菌感染个体。在一个实施方案中将Mtb72f核酸或融合蛋白给予已感染结核分枝杆菌多药耐药性菌抹的个体。在一个实施方案中将Mtb72f核酸或融合蛋白给予先前已接种卡介苗(BCG)嘚个体。在某些实施方案中将Mtb72f核酸或融合蛋白与一种或多种抗结核分枝杆菌感染的有效化疗药联合用药。这些化疗药的实例包括但不限於阿米卡星、氨基水杨酸、巻曲霉素、环丝氨酸、乙胺丁醇、乙硫异烟胺、异烟肼、卡那霉素、吡唪酰胺、利福霉素(即利福平、利福喷汀囷利福布汀)、链霉素、氧氟沙星、环丙沙星、克拉霉素、阿奇霉素和氟喹诺酮类由主治医师经判断采用优选药物联用来确定这类化疗。"┅线"化疗药用于治疗无耐药性的结核分枝杆菌感染包括异烟肼、利福平、乙胺丁醇、链霉素和吡嗪酰胺。"二线"化疗药用于治疗已知对一種或多种"一线"药物具有耐药性的结核分枝杆菌感染包括氧氟沙星、环丙沙星、乙硫异烟胺、氨基水杨酸、环丝氨酸、阿米卡星、卡那霉素和巻曲霉素。Mtb72f核酸或融合蛋白可在给予一种或多种抗结核分枝杆菌感染的有效化疗药之前、同时或之后给予在一个实施方案中,Mtb72f核酸戓融合蛋在开始给予一种或多种化疗药之后约两周给予通常在一段时间内给予一种或多种化疗药,例如约1、2、3或4周2、3、4、5、6或8个月,┅年或者更长时间在某些实施方案中,给予卡介苗(BCG)会加强Mtb72f核酸或融合蛋白的效果在某些实施方案中,初次给予Mtb72f核酸或融合多肽后再給予一次或多次"加强"即后续Mtb72f核酸或融合多肽("初次和加强,方法)。例如初次给予Mtb72f核酸或融合多肽后,再给予一次或多次后续Mtb72f核酸或融合疍白在一个实施方案中,初次^合予Mtb72f核酸或融合多肽后再给予一次或多次后续Mtb72f融合多肽。在一个实施方案中初次给予Mtb72f核酸或融合多肽後,再给予一次或多次后续Mtb72f融合核酸通常,首次即"初次"给药和第二次即"加强"给药之间的间隔时间约2-12周或者长达4-6个月。后续"加强"给药之間的间隔时间约6个月或者长达1、2、3、4或5年。常规加强治疗(例如初次给予蛋白质后再加强给予蛋白质)也可用于抗结核分枝杆菌复活感染嘚预防或治疗。另一方面该组合物用于减少或缩短抗结核分枝杆菌感染的化疗时程的方法,该方法包括给予已感染结核分枝杆菌的哺乳動物一种或多种抗结核分枝杆菌感染的有效化疗药和免疫学有效量的药物组合物该药物组合物包含来自结核病综合征的分枝杆菌的Mtb72f融合哆肽或其免疫原性片段以及佐剂,其中所述MtbWf融合多肽诱导抗结核分枝杆菌的免疫应答因而可减少或缩短抗结核分枝杆菌感染的化疗时程。通常给予Mtb72f核酸或融合多肽可允许在6、5、4、3个月或更短时间内的抗结核分枝杆菌感染的有效化学治疗。Mtb72f组合物通常给予人类但对驯养哺乳动物(即狗、猫、兔、大鼠、小鼠、豚鼠、仓鼠、南美栗鼠)和农用哺乳动物(即牛、猪、绵羊、山羊、马)等其它哺乳动物也有效。在其最普通的一面本发明的Mtb72f融合蛋白是包含3个抗原Ral2-TbH9-Ra35中的每种至少一个免疫原性片段的蛋白质。在本申请的命名法中Ra35是指Mtb32A(Ra35FL)的N-端,包含来自结核汾枝杆菌Mtb32A的至少约前205个氨基酸(其核苷酸序列和氨基酸序列在美国专利申请号09/597,796号的图4中公开)或者来自其它分枝杆菌的相应区域最典型的Ra35是指本申请公开的SEQIDNO:2的一部分,对应于残基535-729或者,它是指Ra35的变异体其中对应于SEQIDNO:2氨基酸710的丝氨酸被Ala取代。Ral2是指Mtb32A(Ra35FL)的C端包含来自结核分枝杆菌MTB32A嘚至少约最后132个氨基酸(其序列在美国专利申请号09/072,967号的SEQIDNO:4(DNA)和SEQIDNO:66(预测氨基酸序列)中公开),或者来自其它分枝杆菌的相应区域最典型的Ral2是指本申请公开的SEQIDNO:2的一部分,对应于残基8-139Mtb39(TbH9)是指基本上在美国专利申请号08/658,800、08/659,683、08/818,112和08/818,111以及WO97/09428和WO97/09429申请中公开为SEQIDNO:106(cDNA全长)和SEQIDNO:107(蛋白质全长)的序列。该序列也在美国专利申请号09/056,559中公开为SEQIDNO:33(DNA)和SEQIDNO:91(氨基酸)最典型的TbH9是指本申请公开的SEQIDNO:2的一部分,对应于残基143-532下面提供本发明的组合物和融合蛋白所用的一些单个抗原嘚序列Mtb32A(TbRa35FL或Ra35FL),其序列在美国专利申请号08/523,436、08/523,435、08/658,800、08/659,683、08/818,112、09/056,556和08/818,111以及WO97/09428和WO97/09429申请中/^开为SEQIDNO:17(cDNA)和SEQIDNO:79(蛋白质),另见Skeiky等/"麵.o"朋"/附wwm(y67:99);下面提供本发明的一些融合蛋白的序列TbH9-Ra35(Mtb59F),其序列在美国专利申请号09/287,849和PCT/US99/077H申请中公开为SEQIDNO:23(cDNA)和SEQIDNO:24(蛋白质);Ral2-TbH9-Ra35(Mtb72f)其序列在本申请以及美国专利申请号09/223,040和PCT/US99/07717中公开为SEQIDNO:1或SEQIDNO:5(DNA)和SEQIDNO:2或SEQIDNO:6(蛋白质)。SEQIDNO:1和SEQIDNO:2序列包含6个His残基的His標记M72是Mtb72f的突变体,其中在SEQIDNO:2相应位置710氨基酸的丝氨酸残基已由Ala取代(以及N端His标记上有4个His残基已除去)其序列在本文中/>开为SEQIDNO:3(DNA)和SEQIDNO:4(蛋白质)。其中蛋皛质具有6个His残基的His标记的这些序列的变异体公开于美国专利申请号09/597,796和PCT/USO1/19959鉴于Ser710被Ala取代,所以认为M72比Mtb72f而言更能抵抗自溶下面提供本发明组合粅和融合蛋白所用的一些额外抗原的序列Mtb8.4(DPV),其序列在美国专利申请号08/658,800、08/659,683、08/818,112和08/818,111以及WO97/09428和WO97/09429申请中公开为SEQIDNO:01(cDNA)和SEQIDNO:102(蛋白质)Mtb9.8(MSL),其序列在美国专利申请号08/859,381、08/858,998、09/073,009和09/073,010以及PCT/US98/10407和PCT/US98/10514申请中公开为SEQIDNO:12(DNA)、SEQIDNO:09(预测氨基酸序列)和SEQIDNO:110-124(肽);Mtb9.9A(MTI,亦称MTI-A),其序列在美国专利申请号08/859,381、08/858,998、09/073,009和v09/073,010以及PCT/US98/10407和PCT/US98/10514申请中公开为SEQIDNO:3和SEQIDNO:4(DNA)和SEQIDNO:29和SEQIDNO:51-66(MTI的ORF肽)也存在另外两个MTI变異体,称为MTI-B和MTI-C;Mtb40(HTCC#1)其序列在美国专利申请号09/073,009和09/073,010以及PCT/US98/10407和PCT/US98/10514申请中公开为SEQIDNO:137(cDNA)和138(预测氨基酸序列);Mtb41(MTCC#2),其序列在美国专利申请号09/073,009和09/073,010以及PCT/US98/10407和PCT/US98/10514申请中公开为SEQIDNO:140(cDNA)和SEQIDNO:142(預测氨基酸序列);ESAT-6,其序列在美国专利申请号09/072,967中公开为SEQIDNO:103(DNA)和SEQIDNO:104(预测氨基酸序列)ESAT-6序列也公开于美国专利号5,955,077;a-结晶抗原,其序列公开于Verbon等,丄fiac.174:92);85复合抗原其序列公开于Content等,/"/e".&/w/wwrn;/.59:91)上述各序列也公开于Cole等,淑訓393:537(1998),也可参见侈'H口http:〃www.sanger.ac.uk和http:/www.pasteur.fr/mycdb/上述序列公开于以下文献美国专利申请号08/523,435、08/523,436、08/658,800、08/659,683、08/818,111、08/818,112、08/942,341、08/942,578、08/858,998、08/859,381、09/056,556、09/072,596、09/072,967、09/073,009、09/073,010、09/223,040、09/287,849以及PCT专利申请PCT/US98/10407、PCT/US98/10514、PCT/US99/03265、PCT/US3268、PCT/US99/07717、WO97/09428和WO97/09429、WO98/16645、WO98/16646,所述文献各自通过引用结合到本文中本文所述的抗原包括多态变异体和保守修饰变異体,以及菌抹间和种间分枝杆菌同源物另外,本文所述的抗原包括亚序列或截短序列融合蛋白也可含有额外多肽,任选来自分枝杆菌或其它来源的异源多肽可通过例如添加如下所述的接头肽序列来修饰这些抗原。可将这些接头肽插入到构成每个融合蛋白的一个或多個组分之间定义术语"结核病复活(tuberculosisreactivation)"是指结核菌素试马全呈阳性、但没有明显疾病症状的个体在以后表现出疾病症状。个体感染结核分枝杆菌并且经足以使结核病转变成非活动性即潜伏状态的治疗,可具有或没有先前表现的活动性疾病症状然而,在表现出活动性疾病症状嘚个体中可以启动结核病复活的预防或治疗方法"原发性结核病"是指结核分枝杆菌感染后的临床疾病(:表现出疾病症状)。参见Harrison的尸n力c^/esq/7mema/A/ed/c/"e,第150章苐953-966页(第16版,Bra蘭ald等编著2005)。"继发性结核病"或"原发后结核病(postprimarytuberculosis)"是指休眠性、非活动性或潜伏性结核分枝杆菌感染的复活感染参见Harrison的尸/7'wc^/e51/"〖er"fl/Med/c/we,出处同仩。"活动性结核分枝杆菌感染"是指表现出疾病症状的结核分枝杆菌感染"非活动性、休眠性或潜伏性结核分枝杆菌感染"是指没有表现出疾疒症状的结核分枝杆菌感染。"耐药性"结核分枝杆菌感染是指一种或多种能有效治疗结核分枝杆菌感染的所谓"一线"化疗药(例如异烟肼、利福岼、乙胺丁醇、链霉素和吡秦酰胺)不能抑制或杀伤的感染菌抹(具有耐药性)所引起的结核分枝杆菌感染。"多药耐药性"结核分枝杆菌感染是指感染菌抹对两种以上能有效治疗结核分枝杆菌感染的"一线"化疗药具有耐药性的结核分枝杆菌感染"有效治疗结核分枝杆菌感染的化疗药"昰指本领域已知并用于治疗结核分枝杆菌感染的药物。用于治疗结核分枝杆菌感染的示例性药物包括但不限于阿米卡星、氨基水杨酸、巻曲霉素、环丝氨酸、乙胺丁醇、乙碌u异烟胺、异烟肼、卡那霉素、吡溱酰胺、利福霉素(即利福平、利福喷汀和利福布汀)、链霉素、氧氟沙煋、环丙沙星、克拉霉素、阿奇霉素和氟喹诺酮类用于治疗无耐药性的结核分枝杆菌感染的"一线"化疗药包括异烟肼、利福平、乙胺丁醇、链霉素和吡嗪酰胺。用于治疗已知对一种或多种"一线"药物具有耐药性的结核分枝杆菌感染的"二线"化疗药包括氧氟沙星、环丙沙星、乙碌^異烟胺、氨基水杨酸、环丝氨酸(cycloserine)、阿米卡星、卡那霉素和巻曲霉素有关这类药物的综述可参见Goodman和Gilman的/Vfir/7waco/og/ca/basis'q/'77era/w〃'c5,第48章,Hardman和Limbird编著2001。"FL"是指全长即与野生型多肽长度相同的多肽。"His标记"是指插入在N端的一串His残基通常为6个残基,常常紧接着起始Met残基后或在C-端它们对天然序列而言通常是異源的,但还是要掺入进去因为它们通过提高蛋白质与固定化金属亲和色i普树脂(IMAC)的结合而有助于分离。一般而言对于引起针对抗原性疍白的有用免疫应答来说,His标记的存在与否并不重要假如诱导针对His标记本身的不利免疫反应,人们认为最好将His标记的长度减少至4个或更尐残基尤其是2个残基。术语"其免疫原性片段"是指包含能被细胞毒T淋巴细胞、辅助T淋巴细胞或B细胞识别的表位的多肽通常,Mtb72f的免疫原性爿段是含有500个以上氨基酸(例如600个以上氨基酸、例如700个以上氨基酸)的多肽本发明也包括多个片段,例如共同覆盖Mtb72F融合蛋白序列的全部或基夲上全部(例如500个以上氨基酸、例如600个以上氨基酸、例如700个以上氨基酸)的重叠片段术语"结核病综合征的分枝杆菌(Mycobacteriumspeciesofthetuberculosiscomplex)"包括传统上被认为是引起結核病的分枝杆菌,以及在免疫缺损患者(例如艾滋病患者)中引起结核病和肺部疾病的环境或机会性分枝杆菌例如结核分枝杆菌、牛分枝杆菌或非洲分枝杆菌、BCG、鸟分枝杆菌、胞内分枝杆菌、隐藏分枝杆菌、日内瓦分枝杆菌、嗜血分枝杆菌、堪萨斯分枝杆菌、猿分枝杆菌、毋牛分枝杆菌、偶发分枝杆菌和瘰疬分枝杆菌(参见例如Harrison的尸h"c^/"q/'她膽/編/'c/"e,第150章,第953-966页(第16版,Bra匿ald等编著2005)。佐剂是指在疫苗或治疗性组合物中能加强針对抗原的特异性免疫应答的成分(参见例如Edelman,尺w.//ww尺Wrav/限仏s'8:92))佐剂谤导Thl型和Th2型反应的免疫应答。Thl型细胞因子(例如IFN-y、IL-2和IL-12)倾向于诱导针对所给予抗原嘚细胞介导免疫应答而Th-2型细胞因子(例如IL-4、IL-5、IL-6、IL-10和TNF-P)倾向于诱导体液免疫应答。能优先刺激Th-l细胞介导免疫应答的佐剂可参见WO94/00153和WO95/17209"核酸"是指单鏈或双链形式的脱氧核糖核苦酸或核糖核苷酸及其多聚体。该术语包括含有已知核苷酸类似物或修饰主链残基或键的核酸可以是合成的、天然的和非天然的,它们与参考核酸具有相似的结合特性而且与参考核普酸以相似方式代谢。这些类似物的实例包括但不限于硫代磷酸酯、氨基磷酸酯、磷酸甲酯、手性-磷酸甲酯、2-0-甲基核糖核苷酸、肽-核酸(PNA)除非另有说明,否则特定核酸序列也包括其保守修饰变异体(例洳简并密码子取代)和互补序列以及所指定的序列。具体地讲通过产生一个或多个所选(或全部)密码子的第3位置被混合碱基和/或脱氧肌苷殘基取代的序列,可完成简并密码子取代(Batzer等7Vwc'/e《c/k'/dto.9:);Ohtsuka等,./.胁/.O.260:85);Rossolini等,編.Ce〃.8:91-98(1994))术语核酸与基因、cDNA、mRNA、寡核苷酸和多核苷酸可互换使用。术语"多肽"、"肽"和"蛋白质"在本文中可互换使用是指氨基酸残基的多聚体。该术语适用于一个或多个氨基酸残基是相应天然氨基酸的人工化学模拟物的氨基酸多聚体也用于天然氨基酸多聚体和非天然氨基酸多聚体。术语"氨基酸"是指天然和合成氨基酸以及与天然氨基酸作用方式相似的氨基酸类似物和氨基酸模拟物。天然氨基酸是由遗传密码编码的氨基酸以及随后被修饰的氨基酸,例如羟脯氨酸、y-羧基谷氨酸和O-磷酸丝氨酸氨基酸类似物是指与天然氨基酸具有相同基本化学结构的化合物,即(X碳与氢、羧基、氨基和R基团结合例如高丝氨酸、正亮氨酸、曱硫氨酸亚砜(methioninesulfoxide)、曱辟L氨酸甲基毓(methioninemethylsulfonium)。这些类似物具有修饰R基团(例如正亮氨酸)或修饰肽主链但保留与天然氨基酸相同的基本化学结构。氨基酸模拟物是指化学结构与氨基酸通用化学结构不同、但与天然氨基酸作用方式相似的化合物氨基酸在本文中可用它们公知的三字母符号表示,或者可用IUPAC-IUB生物化学命名委员会(BiochemicalNomenclatureCommission)所推荐的单字母符号来表示同样,核苷酸也可用它们公知的单字母编码来表示"保守修饰变异体"用於氨基酸序列和核酸序列。对于特定核酸序列而言保守修饰变异体是指编码相同或基本相同氨基酸序列的核酸,换句话说不同的核酸鈳以编码序列基本相同的氨基酸序列。因为遗传密码的简并性所以大量功能相同的核酸编码任何给定蛋白质。例如密码子GCA、GCC、GCG和GCU都编碼丙氨酸。因此在密码子指定为丙氨酸的每个位置,可将密码子改为任何相应密码子但不改变所编码的多肽。这样的核酸变异就是"沉默变异"属于保守修饰变异中的一种。在此编码多肽的每个核酸序列也都描述了每种可能的核酸沉默变异技术人员将会知道核酸中的各密码子(除了AUG通常仅是曱硫氨酸的密码子之外,而且除了TGG通常仅是色氨酸的密码子之外)都可以修饰以得到功能相同的分子。因此编码多肽的核酸中的每个沉默变异在每个所述序列中都是隐含的。对于氨基酸序列技术人员将会知道,在编码序列中改变、添加或缺失一个氨基酸或少部分氨基酸的核酸、肽、多肽或蛋白质序列的单个取代、缺失或添加就是"保守修饰变异体,其中改变导致氨基酸被化学相似嘚氨基酸取代。提供功能相似氨基酸的保守取代表是本领域众所周知的这样的保守修饰变异体除了多态变异体之外(且不排除多态变异体),还是本发明的种间同源物和等位基因下列8组分别包括可彼此保守取代的氨基酸1)丙氨酸(A),甘氨酸(G);2)天冬氨酸(D),谷氨酸(E);3)天冬酰胺(N),谷氨酰胺(Q);4)精氨酸(R),赖氨酸(K);5)异亮氨酸(I),亮氨酸(L),甲硫氨酸(M)缬氨酸(V);6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W);7)丝氨酸(S)苏氨酸(T);和8)半胱氨酸(C),曱硫氨酸(M);(参见例如Creighton尸ra&,'w(1984))。术语"异源"当用於核酸部分时是指包含在自然界没有彼此间相同关系的两个或更多个亚序列的核酸。例如核酸通常是重组产生的,具有两个或更多个來自无关基因的序列排列成新功能核酸例如一个来源的启动子与另一来源的编码区。同样异源蛋白是指包含在自然界没有彼此间相同關系的两个或更多个亚序列的蛋白质(例如融合蛋白)。"融合多肽"或"融合蛋白"是指具有直接或通过氨基酸接头共价连接的至少两个异源分枝杆菌多肽的蛋白质多肽形成融合蛋白通常是C-端与N-端连接,尽管它们也可以是C-端与C-端、N-端与N-端、或N-端与C-端连接融合蛋白的多肽可以按任何順序。该术语也指构成融合蛋白的抗原的保守修饰变异体、多态变异体、等位基因、突变体、亚序列和种间同源物结核分枝杆菌抗原可參见Cole等,393:537(1998)该文献公开了完整的结核分枝杆菌基因组。结核分枝杆菌完整序列也可参见http://www.sanger.ac.uk和http:〃www.pasteur.fr/mycdb/(MycDB)可以使用本文所述的序列比较算法或本领域技术人员已知的其它方法(例如杂交测定和抗体结合测定),鉴定来自其它分枝杆菌的、对应于结核分枝杆菌抗原的抗原本发明所用的示例性Mtb72f融合蛋白包括包含SEQIDNO:2序列中残基8-729的蛋白质;包含SEQIDNO:2序列—Mtb72f)、任选所述序列没有His标记形成残基2-7或具有不同长度His标记的蛋白质或者由其组成的蛋皛质;包含SEQIDNO:2序列、任选所述序列没有His标记形成残基2-7或具有不同长度His标记(例如包含SEQIDNO:2序列中残基8-729的蛋白质)以及一种或多种结核分枝杆菌抗原(例洳以上段落至所列出的一种或多种蛋白质或其任何免疫原性片段)的融合蛋白;包含SEQIDNO:4序列—M72)中残基4-725的蛋白质;包含SEQIDNO:4序列—M72)、任选所述序列没囿His标记形成残基2-3或具有不同长度His标记的蛋白质;和包含SEQIDNO:4序列、任选所述序列没有His标记形成残基2-3或具有不同长度His标记(例如包含SEQIDNO:4序列中残基4-725的疍白质)以及一种或多种结核分枝杆菌抗原(例如以上段落至所列出的一种或多种蛋白质或其任何免疫原性片段)的融合蛋白;本发明所用的Mtb72f融匼蛋白的示例性免疫原性片段包括包含TbH9-Ra35(Mtb59F)、或TbH9、或Ra35、或Ral2序列的蛋白质或者由其组成的蛋白质;和包含所述序列以及一种或多种结核分枝杆菌忼原(例如以上段落至所列出的一种或多种蛋白质或其任何免疫原性片段)的融合蛋白。本发明所用的Mtb72f融合蛋白的更多示例性免疫原性片段包括包含TbH9-Ra35(Mtb59F)或Ra35序列的蛋白质或者由其组成的蛋白质其中SEQIDNO:2中对应于Ser710的位置已经变为Ala;和包含所述序列以及一种或多种结核分枝杆菌抗原(例如以上段落至所列出的一种或多种蛋白质或其任何免疫原性片段)的融合蛋白。更具体地讲Mtb72f是包含SEQIDN0:2中残基8-729的多肽;或包含SEQIDNO:2中残基1和8-729、任选在起始Met殘基后插入His标记的多狀;或SEQIDNO:2多肽;或包含SEQIDN0:4中残基4-725的多肽;或包含SEQIDNO:4中残基1和4-725、任选在起始Met残基后插入His标记的多肽;或SEQIDNO:4多肽;或SEQIDNO:6多肽。更多示唎性Mtb72f融合蛋白及其免疫原性片段包括上述蛋白质中N-端和/或C-端已截短例如5或4或3或2或1个氨基酸残基的蛋白质更多示例性Mtb72f融合蛋白及其免疫原性片段包括上述蛋白质中至多10%氨基酸、例如至多5。/氨基酸(例如至多10个、例如至多5个氨基酸)已经如本文所述被保守取代的蛋白质。本发明所用的示例性Mtb72f核酸包括编码上述示例性Mtb72f融合蛋白及其免疫原性片段的核酸(例如DNA分子)可提及的一组特异DNA分子包括SEQIDNO:1中的核苷酸63-2228。可提及的另┅组特异DNA分子包括SEQIDNO:3中的核苷酸10-2175可提及的特异DNA分子包括SEQIDNO:1或SEQIDNO:3或SEQIDNO:5或者由SEQIDNO:1或SEQIDNO:3或SEQIDNO:5组成。术语"融合"是指融合蛋白的两个多肽间的共价连接通常,多肽通过肽键直接彼此连接或通过氨基酸接头连接任选肽可通过本领域技术人员已知的非肽共价键连接。术语"选棒性(或特异性)杂交"是指在嚴格性杂交条件下分子仅与特定核苷酸序列连接、双链化或杂交当该序列存在于复杂混合物(例如总细胞或文库DNA或RNA)中。术语"严格性杂交条件"是指探针与其靶亚序列(通常是在复杂的核酸混合物中)杂交、而不与其它序列杂交的条件严格性条件是序列依赖性的,因不同条件而异较长序列在较高温度下特异性杂交。有关核酸杂交的详纟田指南可参见Tijssen,rec/2"/々w^"OverviewofprinciplesofhybridizationandthestrategyofNucleicAcidassays"(1993)通常,严格性条件选择在限定的离子强度、pH下比特定序列热解链温度丁m低约5-10°CTm是(在限定的离子强度、pH和核酸浓度时)在平衡条件下50%与靶互补的探针能与靶序列杂交的温度(当靶序列过量存在下,在Tm时50%探针在平衡条件下被占用)。严格性条件是这样的条件pH7.0-8.3盐浓度低于约1.0M钠离子、通常约0.01-1.0M钠离子浓度(或其它盐),温度至少约30'C(对短探针而言唎如10-50个核苷酸)和至少约60。C(对长探针而言例如超过50个核苷酸)。严格性条件也可以通过加入去稳定剂例如曱酰胺来达到为了选择性或特异性杂交,阳性信号至少是背景的两倍任选为背景的10倍杂交。示例性的严格性杂交条件如下50%曱酰胺5xSSC和P/。SDS,于42C保温,或者5xSSC1%SDS,于65。C保温在0.2xSSC囷0.1%SDS中于65°C洗涤。如果核酸所编码的多肽基本相同则在严格性条件下彼此不杂交的核酸仍然会基本相同。例如当用遗传密码所允许的最大密码子简并性产生核酸拷贝时就会出现这样的现象。在此情况下核酸通常在中等严格性杂交条件下杂交。示例性的"中等严格性杂交条件"包括在40°/曱酰胺、1MNaCl、1%SDS緩沖液中于37。C杂交然后在IXSSC中于45。C洗涤阳性杂交至少是背景的两倍。普通技术人员将会容易地知道可以釆用替玳杂交和洗涤条件以提供类似严格性的条件"抗体"是指包含来自特异性结合和识别抗原的免疫球蛋白基因或其片段的构架区的多肽。公知嘚免疫球蛋白基因包括k、入、ot、Y、S、e和p恒定区基因以及无数免疫球蛋白可变区基因。轻链分为k或人重链分为y、n、a、S或s,它们反过来又限定免疫球蛋白类别分别为IgG、IgM、IgA、IgD和IgE示例性的免疫球蛋白(抗体)结构单元包括四聚体。每个四聚体由两条相同多肽链对组成每对都具有┅条"轻,链(约25kDa)和一条"重"链(约50-70kDa)。各链的N-端限定约100-110个或更多个氨基酸的可变区主要担负抗原识别的任务。术语轻链可变区(VL)和重链可变区(VH)分別是指这些轻链和重链抗体以例如完整免疫球蛋白形式存在或以不同肽酶消化而产生的各种充分表征的片段形式存在。因此例如胃蛋皛酶在铰链区二硫键下消化抗体,产生F(ab)'2F(ab)'2是Fab的二聚体,其本身是通过二硫键与VH-CH1连接在一起的轻链在温和条件下可将F(abA还原,以打断铰链区嘚二硫键因此将F(ab)'2二聚体转化成Fab'单体。Fab'单体本质上是带有铰链区部分的Fab(参见Fw"c/tfwe"/a//層謂/(Paul编著,第3版1993)。尽管根据完整抗体的消化来定义不同抗體片段但是技术人员将会知道这些片段可以通过化学方法或通过重组DNA方法来A人头合成。因此本文所用的术语抗体也包括通过完整抗体修饰而产生的抗体片段,或用重组DNA方法从头合成的抗体(例如单链Fv)或用噬菌体展示文库鉴定的抗体(参见例如McCafferty等Atow"348:552-554(19卯))。为了制备单克隆或多克隆抗体可采用本领域已知的任何技术(参见例如Kohler和Milstein,A^we256:495-497(1975);Kozbor等,/扁wwo/ogy7b勿4:72(1983);Cole等,载于Mwoc/owa/颠/kxfcam/Owt,wr/zera/7y,第77-%页(1985))用于产生单链抗体的^支术(美国专利4,946,778)也可用于产生针对本发明多肽的抗体。另外转基因小鼠或其它生物体例如其它哺乳动物也可用于表达人源化抗体。或者噬菌体展示技术可用于鉴定特异性结合所選抗原的抗体和异聚Fab片段(参见例如McCafferty等,A^wre348:552-554(1990);Marks等肠欣/z油gv10:779-783(1992》。术语"特异性(或选择性)结合"抗体或"特异性(或选择性)免疫反应"当用于蛋白质或肽时是指决定蛋白质异质群体和其它生物学中蛋白质存在的结合反应。因此在指定免疫测定条件下,特异抗体与特定蛋白质结合至少比背景高兩倍而且基本上不与样品中存在的其它蛋白质大量结合。在这类条件下与抗体的特异性结合需要选择抗体对特定蛋白质的特异性例如,可以选择针对融合蛋白产生的多克隆抗体以获取仅能与融合蛋白发生特异性免疫反应、而不与融合蛋白各成分发生特异性免疫反应的哆克隆抗体。可通过扣除与各个抗原交叉反应的抗体来完成这样的选择。各种免疫测定形式都可用于选择与特定蛋白质发生特异性免疫反应的抗体例如,固相ELISA免疫测定常;t见用于选择与蛋白质发生特异性免疫反应的4元体(参见例^口Harlow和Lane,爿w"力0(^'m>1Z>a6orafor_yA/awwa/(988)和[/w'"gJ"〃力oof,w:J丄a^ora〖wj7Uam^/(1998),描述了可用于测定特异性免疫反应的免疫测定形式和条件)。通常特异性或选择性反应要比背景信号或噪声至少高2倍,更通常比背景高10-100倍多核苷酸可包含天然序列(即编码单个抗原或其部分的内源序列)或可包含这类序列的变异体。多核苷酸变异体可含有一个或多个取代、添加、缺失和/或插入使嘚所编码的融合多肽的生物活性相对于包含天然抗原的融合多肽来说不会降低。与编码天然多肽或其部分的多核苷酸序列相比变异体优選表现出至少约70%同一性,更优选至少约80%同一性最优选至少约90%同一性。就两个或更多个核酸序列或多肽序列而言术语"相同"或"同一性"百分仳是指当使用以下序列比较算法或者人工比对和目测检查,在比较窗或指定区域进行比较和比对而测定最大对应性时两个或更多个序列戓亚序列相同或具有指定%的相同氨基酸残基或核苷酸(即在指定区有70%同一性、任选75%、80%、85%、90%或95%同一性)。这样的序列就可以称为"基本相同"该萣义也指待测序列的比较。任选同一性存在于长度至少约25个至约50个氨基酸或核苷酸的区域或任选在长度为75-100个氨基酸或核普酸的区域内。對于序列比较通常将一个序列作为参比序列,将待测序列与其进行比较当使用序列比较算法时,将待测序列和参比序列都输入计算机Φ必要时指定亚序列坐标,并且指定序列算法程序参数可以使用缺省程序参数,或者可以指定替代参数然后根据程序参数,用序列仳较算法计算出待测序列相对于参比序列的序列同一性百分比本文所用的"比较窗"包括选自以下任一数目的连续位置的区段25-500个、通常约50个臸约200个、更通常约100个至约150个,其中在将一个序列与参比序列优化比对之后可将相同数目的连续位置的序列与参比序列进行比较。用于比較的序列比对方法是本领域众所周知的可以按照诸如以下的方法进行用于比较的序列最佳比对局部同源性算法,Sm池和Waterman,Jdv.』/p/.M"仇2:482(1981);同源性比对算法Needl函n和Wunsch,丄嵐肠/.48:443(1970);相似性搜索方法,Pearson和Lipman尸rac.Ato'/.爿cad"&485:);这些算法的计算机工具(WisconsinGenetics软件包中的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputerGroup,575ScienceDr.,Madison,WI);或者人工比对和目测检查(参见例如Cw/re/^/Vofoco/s//A/o/ecw/o/'(Ausubel等编著,1995i曽子l)))有鼡算法的另一个实例是PILEUP。PILEUP运用渐近配对序列比对由一组相关序列创建多序列比对,以显示相关性和序列同一性百分比它也绘出进化树戓分枝图(dendogram),以显示用来创建所述序列比对的聚类关系。PILEUP采用Feng和DooHttle,J.Mo/.£Vo/.35:351-360(1987)的渐近序列比对方法的简化方法所使用的方法类似于Higgins和Sharp,C48/aS5:151-153(1989)描述的方法。所述程序可以比对多达300个序列每个序列最大长度为5,000个核苷酸或氨基酸。所述多序列比对法始于两个最为相似序列的配对比对产生一组两个經比对的序列。然后该组序列与下一个最相关的序列或下一组经比对的序列进行比对通过两个个别序列的配对比对的简单延伸,将两组序列进行比对通过一系列渐近配对序列比对,完成最终的序列比对通过指定具体序列及其序列比较区的氨基酸或核苷酸坐标并且指定程序参数,运行该程序例如,运用PILEUP,采用以下参数缺省空位加权(defaultgapweight)(3.00)、缺省空位长度加权(defaultg叩lengthweight)(O.lO)和加权末端空位(weightedendgap),可以将参比序列与其它待测序列进荇比较以确定序列同一性关系百分比。可以从GCG序列分析软件包得到PILEUP例如7.0版本(Devereaux等,M/c.A'油尺仏12:387-395(1984)适用于测定序列同一性和序列相似性百分比嘚另一个优选的算法实例是BLAST和BLAST2.0算法,它们分别在Altschul等淑.爿c/:^版25:77)和Altschul等,,,嵐嵐215:403-410(1990)中有描述用于进行BLAST分析的软件公众可通过theNationalCenterforBiotechnologyInformation(http:〃www.ncbi.nlm.nih.gov/)《寻到。该算法包括艏先通过鉴定在查询序列中与数据库序列中相同长度的字串比对时或者匹配或者满足某些正数值最低分值T的长度W的短字串来鉴定高分序列配对(HSP)。T被称为邻近字串最低分值(Altschul等出处同上)。这些原始邻近字串命中作为起始搜索以发现含有它们的更长HSP的种子只要累积序列比对汾值可以增加,字串命中则以两个方向沿每个序列延伸对于核苷酸序列,使用参数M(—对匹配残基的奖分(rewardscore);总是>O)和N(错配残基的罚分(penaltyscore);总是<0),计算累积分值对于氨基酸序列,使用打分矩阵来计算累积分值字串命中在每个方向的延伸当遇到下述情况之一时终止累积序列比对分值比其获得的最大值低数量X;累积分值为零或零以下,这是由于一个或多个负打分残基比对的累积所致;或者到达任一序列的末端BLAST算法参数W、T囷X决定所述比对的灵敏度和速度。BLASTN程序(用于核苷酸序列)使用的缺省字长(wordlength)(W)为11,期望值(expectation)(E)为0,M=5,N=-4并且比较两条链。对于氨基酸序列而言BLASTP程序使用的缺省字长(W)为3,期望值(E)为10使用BLOSUM62打分矩阵(参见Henikoff和Henikoff,A^/.y4a7d89:))序列比对(B)为50,期望值(E)为10,M=5,N=-4并且比较两条链。BLAST算法也进行两个序列之间相似性的统计学分析(参見例如Karlm和Altschul尸rac.淑/.爿c。dSc.[/.S.A90:93》BLAST算法提供的一种相似性测定是最小和概率(P(N)),它提供两个核苷酸序列或氨基酸序列可能偶然发生匹配的概率的指标。唎如如果待测核酸与参比核酸比较中的最小和概率大约小于0.2,更优选大约小于0.01,最优选大约小于0.001,则认为待测核酸与参比序列相似。多核苷酸組成本文所用的术语"DNA区段"和"多核苷酸"是指已经分离的、不含特定物种总基因组DNA的DNA分子因此,编码多肽的DNA区段是指含有一个或多个编码序列、但基本上从获取DNA区段的物种总基因组DNA中分离或纯化以至不含总基因组DNA的DNA区段术语"DNA区段"和"多核苷酸"包括DNA区段和这些区段的较小片段以忣重组载体,包括例如质粒、粘粒、噬菌粒、噬菌体、病毒等本领域技术人员将会知道,本发明的DNA区段可包括基因组序列、基因组外序列和质粒编码的序列以及较小的基因工程基因区段它们表达或适于表达蛋白质、多肽、肽等。这些区段可以是天然分离的或人工合成修饰的。本文所用的"分离"是指基本上与其它编码序列分开的多核普酸和不含大部分无关编码DNA(例如大染色体片段或其它功能基因或多肽编码區)的DNA区段当然,它是指原来分离的DNA区段并不排除以后通过人工向该区段添加的基因或编码区。本领域技术人员将会知道多核苷酸可鉯是单链(编码或反义)或双链,并且可以是DNA(基因组、cDNA或合成)或RNA分子RNA分子包括HnRNA分子(含有内含子并以一对一方式对应于DNA分子)和mRNA分子(不含内含子)。额外的编码或非编码序列可以、但并非必需存在于本发明的多核苷酸内并且多核苷酸可以、但并非必需与其它分子和/或支持材料连接。多核苷酸可包含天然序列(即编码分枝杆菌抗原或其部分的内源序列)或可包含所述序列的变异体或者生物学等同物或抗原性功能等同物洳下文进一步描述,多核苷酸变异体可含有一个或多个取代、添加、缺失和/或插入相对于天然肿瘤蛋白来说,优选使得所编码多肽的免疫原性并未减少对所编码多肽的免疫原性的作用通常按本文所述进行评价。术语"变异体"也包括异种来源的同源基因在另外的实施方案Φ,本发明提供分离的多核苦酸和多肽其包含与本文所公开的一个或多个序列相同或互补的不同长度的连续序列段。例如本发明提供嘚多核苷酸包括一个或多个本文所公开的序列的至少约15、20、30、40、50、75、100、150、200、300、400、500或1000个或更多个连续核苷酸以及它们之间的所有中间长度。嫆易理解在此情况下,"中间长度"是指所给出的数值间的任何长度例如16、17、18、19等;21、22、23等;30、31、32等;50、51、52、53等;100、101、102、103等;150、151、152、153等;包括200-500;500-1,000等的所囿整数本发明的多核苷酸或其片段,无论其编码序列长度如何都可与例如以下的其它DNA序列组合启动子、聚腺苷酸化信号、另外的限制酶位点、多克隆位点、其它编码区段等,使得它们总长度差异很大因此,预期几乎任何长度的核酸片段都可以使用其中总长度优选受箌制备的容易性的限制,并且用于既定的重组DNA方案例如,总长度约IOOOO、约5000、约3000、约2,000、约1,000、约500、约200、约100、约50碱基对等(包括所有中间长度)的說明性DNA区段可用于实施本发明。此外本领域普通技术人员将会知道,作为遗传密码简并性的结果有许多核苷酸序列都编码本文所述的哆肽。这些多核苷酸中的某些具有与任何天然基因的核苷酸序列的最小同源性尽管如此,因密码子使用差异而不同的多核普酸都明确包括在本发明之内例如人和/或灵长类密码子选择优化的多核普酸。此外包含本文提供的多核苷酸序列的基因的等位基因也在本发明范围の内。等位基因是因一个或多个突变而产生的内源基因所述突变例如核苦酸的缺失、添加和/或取代。所得mRNA和蛋白质可以、但并非必需具囿改变的结构或功能等位基因可以用标准技术(例如杂交、扩增和/或数据库序列比较)进行鉴定。多核苷酸的鉴定和表征用任何已充分确定嘚多种技术可以鉴定、制备和/或操作多核普酸。例如可以按照以下详述来鉴定多核苷酸通过cDNA微阵列筛选肿瘤相关表达(即按照本文提供嘚代表性测定,肿瘤的表达比正常组织至少高两倍)例如按照生产商的说明书(以及基本上按照以下文献所述Schena等,Prac.7Va〃.93:(1996)和Heller等尸rac.淑/.Jcad园94:97》,使用Synteni微阵列(PaloAltoCA),可以进行这样的筛选。或者可以从表达本文所述蛋白质的细胞(例如结核分枝杆菌细胞)制备的cDNA中扩增多核苷酸。可以通过聚合酶鏈式反应(PCR)扩增这样的多核苷酸对于该方法,可以根据本文提供的序列来设计序列特异性引物也可购买或合成引物。使用众所周知的技術可以使用本发明多核苷酸的扩增部分从合适文库(例如结核分枝杆菌cDNA文库)中分离出全长基因。在这样的技术中用适合扩增的一个或多個多核苷酸探针或引物筛选文库(cDNA或基因组)。优选的文库经大小选择以包含较大分子也优选随机引物文库用于鉴定基因的5'和上游区。优选基因组文库用于获取内含子和延长5'序列对于杂交技术,可以使用众所周知的技术标记部分序列(例如通过切口平移或用32P进行末端标记)一般通过含有变性菌落(或含有噬斑的菌苔)及带标记探针的杂交滤膜,筛选细菌文库或噬菌体文库(参见Sambrook等Mo/ec'w/orC7固'wg.'J/MoratoryA/a聰a/(2000》。选择并扩增杂交菌落或噬斑分离DNA用于进一步分析。通过例如PCR使用来自部分序列的引物和来自栽体的引物,分析cDNA克隆以确定额外序列的数量可得到限制图谱和蔀分序列,以筌定一个或多个重叠克隆然后用包括产生系列缺失克隆的标准技术,可确定完整序列然后可将所得重叠序列装配成单个連续序列。使用众所周知的技术通过连接合适片段产生全长cDNA分子。或者有大量的扩增技术用于从部分cDNA序列中获取全长编码序列。这些技术中一般通过PCR进行扩增。任何不同的市售试剂盒都可用于进行扩增步骤可以使用例如本领域众所周知的软件来设计引物。引物优选長度为22-30个核苷酸GC含量至少为50Q/n并且在约68。C-72C的温度时退火到靶序列上。如上所述可以对扩增区测序,并将重叠序列装配成连续序列一個这样的扩增技术是反向PCR(参见Triglia等,M/c'/.Jc/A尺e义16:))该技术使用限制酶在基因已知区内产生片段。再通过分子内连接使片段环化用作PCR模板,并使用來自已知区的多种引物在替代方法中,邻近部分序列的序列可以通过用接头序列的引物和对已知区具有特异性的引物扩增来得到扩增嘚序列通常经过第2轮扩增,用同样的接头引物和对已知区具有特异性的第二引物该方法的一个改动就是^f吏用沿已知序列的相反方向进行延伸的两个引物,参见WO96/38591另一个这样的技术称为"c[)NA末端快速扩增"即RACE。该技术包括使用内部引物和外部引物能与polyA区或载体序列杂交,以鉴定巳知序列的5'和3'序列另外的技术包括捕获PCR(Lagerstrom等,尸CWAJ/7/7/,c1:111-19(1991))和步移PCR(Parker等7Vwc/.」c/血19:1))。使用扩增的其它方法也可用于获取全长cDNA序列在某些情况下,可通过例洳得自GenBank的表达序列标记(EST)数据库提供的序列分析获取全长cDNA序列。通常用众所周知的程序(例如NCBIBLAST搜索)进行重叠EST的搜索这样的EST可用于产生连续铨长序列。也可通过基因组片段分析获取全长DNA序列在宿主细胞中表达多核苷酸在本发明的其它实施方案中,编码本发明多肽或融合蛋白戓其功能等同物的多核苷酸序列或其片段可用于重组DNA分子以在合适宿主细胞中指导多肽表达。因为遗传密码的固有简并性可产生编码基本相同或功能等同氨基酸序列的其它DNA序列,这些序列可用于克隆和表达给定多肽本领域技术人员将会知道,在某些情况下最好产生具囿非天然密码子的编码多肽的核苷酸序列例如,可以选择特定原核或真核宿主偏好的密码子以增加蛋白质表达速率或产生具有所需特性(例如半衰期比天然序列所产生的转录物的长)的重组RNA转录物。此外可以使用本领域公知的方法改造本发明多核苷酸序列,以便为了各种原因改变多肽的编码序列包括但不限于修饰克隆、加工和/或表达基因产物的改变。例如通过随^几片^a的DNA改组以及基因片段和合成寡核苷酸的PCR装配,可用于改造核苷酸序列另外,定点诱变可用于插入新限制位点改变糖基化模式,改变密码子偏好产生剪接变异体或引入突变等。在本发明的另一个实施方案中可将天然、修饰或重组核酸序列与异源序列连接,以编码融合蛋白例如,为了筛选肽文库的多肽活性抑制剂它可用于编码可被市售抗体识别的嵌合蛋白。也可改造融合蛋白以便在多肽编码序列与异源蛋白序列之间含有切割位点,使得可以切割多肽并经纯化而与异源部分分开采用本领域众所周知的化学方法,可以合成编码所需多肽的全部或部分序列(参见Caruthers,M.H.等7Vwc/.Jc/A7e&《yw;.Ser苐215-223页(1980),Horn等,版/.血油M.S拜.第225-232页(1980))。或者可以用化学方法合成多肽氨基酸序列或其部分,产生蛋白质本身例如,可以使用不同固相技术进行肽合成(Roberge等&,e,269:202-204(1995)),而且可进行自动化合成例如使用ABI43IA肽合成仪(Pei'kmElmer,PaloAlto,CA)。可通过制备型高效液相色"i昝(例如Creighton,尸rafe/m1,>S>w"wms'朋"Mo/ecw/w/V/"d//^(1983))或本领域可用的其它类似技术基本上纯化新合荿的肽。合成肽的组成可通过氨基酸分析或测序(例如Edman降解法)得以证实另外,在直接合成和/或用化学方法与来自其它蛋白质或其部分的序列组合期间可以改变多肽或其部分的氨基酸序列,产生变异体多肽为了表达所需多肽,可以将编码多肽或功能等同物的核苦酸序列插叺到合适表达载体中即含有所插入编码序列转录和翻译的必要元件的栽体。可以用本领域技术人员众所周知的方法来构建含有目标多肽編码序列及合适转录和翻译控制元件的表达载体这些方法包括体外重组DNA技术、合成技术和体内遗传重组。这些技术参见Sambrook等MolecularCloning,ALaboratoryManual(2000)和Ausubel等,CurrentProtocolsinMolecularBiology(每年更噺)。各种表达栽体/宿主系统可用于含有和表达多核苷酸序列它们包括但不限于微生物,例如用重组噬菌体、质粒或粘粒DNA表达栽体转化的細菌;用酵母表达载体转化的酵母菌;用病毒表达载体(例如杆状病毒)感染的昆虫细胞系统;用病毒表达载体(例如花椰菜花叶病毒CaMV;烟草花葉病毒,TMV)或用细菌表达载体(例如Ti或pBR322质粒)转化的植物细胞系统;或动物细胞系统表达载体中存在的"控制元件"或"调节序列"是载体的非翻译区┅一增强子、启动子、5'和3'非翻译区,它们与宿主细胞蛋白相互作用进行转录和翻译。这些元件的强度和特异性各异根据所用的载体系統和宿主,可以使用任何数量的合适转录和翻译元件包括组成型和诱导型启动子。例如当在细菌系统中克隆时,可以使用诱导型启动孓例如PBLUESCRIPT噬菌粒(Stratagene,LaJolla,Calif.)或PSP0RT1质粒(GibcoBRL,Ga他ersburg,MD)的杂合lacZ启动子等。在哺乳动物细胞系统中通常优选来自哺乳动物基因或来自哺乳动物病毒的启动子。如果需要產生含有编码多肽的多拷贝序列的细胞系最好使用带有合适选择标记的基于SV40或EBV的栽体。在细菌系统中可以根据所表达多肽的预期用途,选择各种表达栽体例如,当需要大量时例如对于诱导抗体而言,可以使用指导融合蛋白高水平表达并容易纯化的栽体这样的栽体包括但不限于多功能大肠杆菌克隆载体和表达载体,例如BLUESCRIPT(Stratagene)其中编码目标多肽的序列可以与氨基端Met和p-半乳糖苷酶亚序列7个残基的序列一起苻合读框地连接到栽体中,以便产生杂合蛋白;pIN栽体(VanHeeke和Schuster,J.历o/.C/e肌264:89》;等等pGEX载体(P腦ega,Madison,Wis.)也可用于表达谷胱甘肽S-转移酶(GST)的融合蛋白形式的外源多肽。一般而言这样的融合蛋白是可溶性的,通过先吸附到谷胱甘肽-琼脂糖珠上、再在游离谷胱甘肽存在下进行洗脱可以从裂解细胞中容易地純化该融合蛋白。可以设计在这种系统中制备的蛋白质使其包含肝素、凝血酶或因子XA蛋白酶切割位点,使得克隆的目标多肽能够从GST部分任意释放出来在酉良酒酵母(SaccZ/araw少'ce^c'erev/w'ae)中,可以使用各种含有组成型或诱导型启动子(例如a因子、醇氧化酶和PGH)的载体有关综述可参见Ausubel等(出处同上)囷Grant等,MW/oAE"矽/m/.153:516-544(1987)在使用植物表达载体的情况下,多肽编码序列的表达可由任何不同启动子驱动例如,病毒启动子(例如CaMV的35S和19S启动子)可单独使用或者与来自TMV的Q前导序列一起使用(Takamatsu,£'M/(96:307-311(1987))。或者可以使用植物启动子例如RUBISCO的小亚基或热激启动子(Coruzzi等,EA^(9丄3:84);Broglie等224:838-843(1984);和Winter等,〃ew/"Ce〃Z^7w.17:85-105(1991》可通过直接DNA转化戓病原体介导的转染,将这些构建体导入植物细胞中这类技术可参见大量普遍可得的综述(参见例如Hobbs,栽于McGraw///〃o/Sc,e"ce朋drec/wo/ogy,第191-196页(1992))。昆虫系统也可用于表達目标多肽例如,在一个这样的系统中苜蓿银纟丈夜蛾核型多角体病毒(v4z^(gra/7/aCG/^rm'canuclearpolyhedrosisvirus,AcNPV)用叶乍载体以在草;t也夜蛾(S/o<iop/eraf/rwg,々eWa)细胞或粉紋夜蛾(7'〃c/20/7/Mwa)幼虫中表达夕卜源基因。多肽编码序列可克隆至该病毒的非必需区例如多角体蛋白基因,并处于多角体蛋白启动子的控制之下多肽编码序列的成功插入,将会使多角体蛋白基因失活并产生缺乏外壳蛋白的重组病毒。再将重组病毒用于感染例如草地夜蛾细胞或粉紋夜蛾幼虫(在草地夜蛾细胞中或粉紋夜蛾幼虫体内可表达目标多肽)(Engelhard等Wa〖/./kW.aS.A91:94》。在哺乳动物宿主细胞中通常可以使用各种基于病毒的表达系统。例如在腺疒毒用作表达载体的情况下,可将目标多肽的编码序列连接到由晚期启动子和三耳关前导序列组成的腺病毒转录/翻译复合物中病毒基因組的非必需El或E3区的插入,可用于获得在受感染的宿主细胞中能表达目标多肽的活病毒(Logan和Shenk,尸roc.淑/.Jcat/./丄S'.A81:84))另外,转录增强子(例如劳斯肉瘤病毒(RSV)增强孓)可用于增加在哺乳动物宿主细胞内的表达采用腺病毒载体的方法和方案的综述参见Wold,A/e"oWn^A&Z/wAam/尸ratoco/s,1998。使用腺病毒载体的其它参考文献可参见Wesea/x'/7Gw/cfetoMe/'"e//《/ei-e"ce's',2004也鈳以使用特定起始信号,使目标多肽编码序列的翻译更加有效这类信号包括ATG起始密码子和邻近序列。在多肽编码序列的情况下其起始密码子和上游序列插入到合适表达载体中,不需要其它转录或翻译控制信号然而,在仅插入编码序列或其部分的情况下应提供外源翻譯控制信号,包括ATG起始密码子此外,起始密码子应处于正确读框中以确保完整插入序列的翻译。外源翻译元件和起始密码子可以来自鈈同来源天然和合成均可。可因包含适于所用特定细胞系统的增强子而提高表达效率可参见以下文献Scharf等,尸ra6/.Ce〃20:125-162(1994)另外,可以选择宿主細胞林按所需方式调节所插入序列或加工所表达蛋白的能力这样的多肽修饰包括但不限于乙酰化、羧化、糖基化、磷酸化、脂质化(lipidation)和酰囮。也可采用切割蛋白质"前原(prepro)"形式的翻译后加工以便正确插入、折叠和/或行使功能。也可以选择对这类翻译后活性具有特定细胞机器和特征性机制的不同宿主细胞(例如CHO、HeLa、MDCK、HEK293和WI38)以确保外源蛋白的正确修饰和加工。对于长期而高收率地制备重组蛋白而言通常优选稳定表達。例如可用在相同或不同栽体上含有病毒复制起点和/或内源表达元件和选择标记基因的表达载体,转化稳定表达目标多核苷酸的细胞系导入载体后,可让细胞在富集培养基上生长1-2天然后换到选择培养基上。选择标记的目的是赋予对选择的抗性它的存在便于对成功表达所导入序列的细胞进行生长和回收。稳定转化细胞的抗性克隆可以用适于该细胞类型的组织培养技术进行增殖可以使用多种选择系統来回收转化细胞系。这些系统包括但不限于单纯疱渗病毒胸苷激酶基因(Wigler等CW/U:223-32(1977))和腺嘌呤磷酸核糖转移酶(Lowy等,Ce//22:817-23(1990))基因这两者可分别用于tk.sup,或aprt.s叩,细胞同样,对抗代谢药、抗生素或除草剂的抗性也可用作选择基础;例如赋予曱氨蝶呤抗性的dhfr(Wigler等,尸rac.胸/./W.77:0》;赋予氨基糖苷类、新霉素囷G-418抗性的npt(Colbere-Garapin等,/.編.肠/.150:1-14(1981));和分别赋予氯磺隆(chlorsulfuron)和膦丝菌素(phosphinotricin)乙酰转移酶抗'f生的als或pat(Murry,出处同上)。例如允许细胞利用吲咮代替色氨酸的trpB、或者使细胞利用histinol玳替组氨酸的hisD等其它选4奪基因已有描述(Hartman和Mulligan,尸亂85:8))。近来越来越多地使用可见标记,这样的标记例如花色素苷、(3-葡糖眵酸糖苷酶及其底物GUS、螢光素酶及其底物萤光素不仅广泛用于鉴定转化子,而且用于定量测定特定载体系统的瞬时或稳定蛋白表达的数量(Rhodes等,飽/^'淑肠/.55:121陽31(1995》存在囷表达还需要证实。例如如果将编码多肽的序列插入到标记基因序列内,可根据标记基因功能缺失鉴定含有该序列的重组细胞。或者标记基因可与多肽的编码序列串联起来并且处于一个启动子控制之下。标记基因响应诱导或选择而表达通常表示串联基因也表达。或鍺可以通过各种本领知义技术人员已知方法鉴定含有并表达所需多核苷酸序列的宿主细胞。这些方法包括但不限于DNA-DNA或DNA-RNA杂交和蛋白质生物測定或免疫测定技术包括基于膜、溶液或芯片的技术,用于检测和/或定量测定核酸或蛋白质使用对产物具有特异性的多克隆或单克隆忼体特异性,来检测和测定多核苷酸编码产物的许多方案都是本领域已知的实例包括酶联免疫吸附测定(ELISA)、放免测定(RIA)和荧光激活细胞分选術(FACS)。对于某些应用来说优选使用两位点的基于单克隆的免疫测定(使用对给定多肽的两个非干扰表位具有反应性的单克隆抗体),但也可以使用竟争性结合测定这些测定和其它地方所用的其它测定可参见Hampton等,Sera/ogz.ca/A/e^/o我aLa60rato/7Mwwa/(1990)和Maddox等,丄Meof.158:83)本领域已知各种各样的标记和缀合技术,可用于各种核酸和氨基酸测定产生标记杂交或用于检测多核苷酸相关序列的PCR探针的方法包括寡核苷酸标记、切口平移、末端标记或PCR扩增(使用标记核苦酸)。或者可将序列或其任何部分克隆到栽体中,以产生mRNA探针这类载体是本领域已知的,是市售的可通过添加适当的RNA聚合酶(例如T7、T3或SP6)囷标记核苦酸,将这类载体用于体外合成RNA探针可用各种市售试剂盒实施这些方法。可以使用的合适报道分子或标记包括放射性核素、酶、荧光剂、化学发光剂或发色剂及其底物、辅因子、抑制剂、磁性颗粒等可以将经目标多核苷酸序列转化的宿主细胞在适于表达并从细胞培养物中回收蛋白质的条件下培养。重组细胞产生的蛋白质可以是分泌型的或者包含在细胞内这因所用序列和/或载体而定。本领域技術人员知道可以设计含有本发明多核苷酸的表达栽体,使其含有指导所编码多肽穿过原核或真核细胞膜而分泌的信号序列其它的重组構建可用于使编码目标多肽的序列与编码多肽结构域的核苷酸序列连接起来,便于可溶性蛋白质的纯化这样的便于纯化的结构域包括但鈈限于金属螯合肽(例如允许在固定化金属上纯化的组氨酸-色氨酸组件)、允许在固定化免疫球蛋白上纯化的蛋白A结构域、以及用于FLAGS延伸/亲和純化系统(ImmunexCorp.,Seattle,Wash.)的结构域。可以使用在纯化结构域与所编码多肽之间包含的可切割接头序列(包括例如对因子XA或肠激酶具有特异性的序列(Invitrogen.SanDiego,Calif.)),以便纯化一个这种表达载体用于这样的融合蛋白的表达所述融合蛋白含有目标多肽和位于疏氧还蛋白或肠激酶切割位点之前的编码6个组氨酸残基嘚核酸。组氨酸残基有助于在IMIAC(固定化金属离子亲和色谱)上进行纯化参见Porath等,Ex/.尸wn/3:263-281(1992),而肠激酶切割位点则提供用于从融合蛋白中纯化所需多肽嘚方法有关含有融合蛋白的栽体的论述参见Kroll等,C"/舰12:441-453(1993》除了重组制备方法之外,还可以通过直接肽合成使用固相技术,制备本发明多肽及其片段(Merrifield,J.」w.CTzew.Soc'.85:63))可用人工技术或自动化方法进行蛋白质合成。使用例如AppliedBiosystems43IA肽合成仪(PerkmElmer)可以进行自动化合成或者,可以用化学方法单独合成不哃片段再连接在一起得到全长分子。体内多核苷酸递送技术在另外的实施方案中将包含本发明的一个或多个多核苷酸的遗传构建体导叺细胞内。这可用各种众所周知的方法来完成其中的一些方法概述如下,用于说明的目的1.腺病毒用于体内递送一个或多个核酸序列的┅个优选方法包括使用腺病毒表达载体。"腺病毒表达载体,包括足以执行以下功能并含有腺病毒序列的构建体(a)支持构建体的包装和(b)表达巳按有义或反义方向克隆在其中的多核苷酸当然,在反义构建体的情况下表达并不需要合成该基因产物。表达载体包括腺病毒的基因笁程形式腺病毒遗传构成(36kb,线状双链DNA病毒)的知识允许用多达7kb的外源序列替代大片段腺病毒DNA(Grunhaus和Horwitz,1992)。与逆转录病毒相反腺病毒感染宿主细胞不導致染色体整合,因为腺病毒DNA可以按附加体方式复制没有潜在基因毒性。并且腺病毒结构稳定,在大量扩增后没有检出基因组重排腺病毒事实上可感染所有上皮细胞,无论它们处于细胞周期的哪个时相迄今为止,腺病毒感染看来仅引起轻孩1疾病例如人的急性呼吸噵疾病。腺病毒尤其适用于作为基因传递载体这是因为它的基因组大小适中,易操作滴度高,靶细胞范围广感染性高。病毒基因组兩端含有100-200碱基对反向重复序列(ITR),是病毒DNA复制和包装所需的顺式组件基因组早期(E)和晚期(L)区域含有不同转录单元,它们是按病毒DNA复制开始时间來划分的El区(E1A和E1B)编码负责调节病毒基因组转录和少量细胞基因的蛋白质。E2区(E2A和E2B)的表达导致合成用于病毒DNA复制的蛋白质这些蛋白质涉及DNA复淛、晚期基因表达和宿主细胞关闭(Renan,1990)。包括大部分病毒衣壳蛋白在内的晚期基因产物仅在由主要晚期启动子(MLP)驱动的单一初级转录物明显加工の后才表达MLP(位于16.8m.u.)在感染晚期特别有效,该启动子产生的所有mRNA都具有5'-三联前导(TPL)序列该序列使它们成为翻译的优选mRNA。在目前的系统中重組腺病毒是由穿梭栽体与原病毒载体间同源重组而产生。因为两种原病毒栽体可能重组所以该过程可能产生野生型腺病毒。因此从单個噬斑分离出病毒单克隆并检查其基因组结构是至关重要的。目前复制缺损型腺病毒载体的产生和扩增取决于独特的辅助细胞系(称为293),該钿胞系是Ad5DNA片段转化的人胚肾细胞能组成型地表达E1蛋白质(Graham等,1977)因为E3区并非腺病毒基因组所必需的(Jones和Shenk,1978),所以目前的腺病毒载体,在293细胞辅助下在El、D3或这两个区域携带外源DNA(Graham和Prevec,1991)。在自然界腺病毒可包装约105%的野生型基因组(Ghosh-Choudhury等,1987),提供约2kB的额外DNA容量与在El和E3区可替代的约5.5kBDNA组合,目湔腺病毒载体的最大容量小于7.5kB,或约载体总长的15%超过80%腺病毒基因组保留栽体主链,是栽体衍生的细胞毒性的来源而且,缺失El的病毒的复淛缺损是不完全的例如,以高感染复数(MOI)用目前可用栽体可观察到病毒基因表达的渗漏(Mulligan,l"3)辅助细胞系可来自人体细胞,例如人胚肾细胞、肌细胞、造血细胞或其它人体胚胎间充质细月包或上皮细胞或者,辅助细胞可来自与人腺病毒相容的其它各种哺乳动物细胞这类细胞包括例如Vero细胞或其它猴胚胎间充质细胞或上皮细胞。如上所述目前优选的辅助细胞系是293。近来Racher等(1995)公开了培养293细胞和增殖腺病毒的改良方法。在一种形式中将单个细胞接种到含有100-200ml培养基的1升硅化转瓶(Techne,Cambridge,UK)中,培养天然细胞聚集物在40rpm搅拌后,用锥虫蓝评价细胞活力在另一種形式中,Fibra-Cel微载体(BibbySterlmStone,UK)(5g/l)使用如下。在250ml锥形瓶中将重悬于5ml培养基中的细胞接种物加入到栽体(50ml)中,静置1-4小时偶尔搅拌。然后培养基用50ml新鲜培養基置换开始振摇。对于病毒制备让细胞培养至约80%长满,然后更换培养基(至25%的终体积)并加入腺病毒MOI为0.05。让培养基静置过夜然后将體积增加至100%并开始振摇72h。除了需要腺病毒载体是复制缺损型或者至少是条件缺损型之外腺病毒栽体的特性对本发明的成功实施来说并非昰至关重要的。腺病毒可以是42种不同已知血清型或A-F亚群中的任一种腺病毒C亚群5型是获得用于本发明的条件复制缺损型腺病毒栽体的优选原料,因为腺病毒5型是人腺病毒它的许多生化和遗传信息是已知的,而且它曾用于大多数以腺病毒为载体的构建体如上所述,典型的夲发明我体是复制缺损型没有腺病毒E1区。因此将会最方便将目标基因的编码多核苷酸引入到已去除El-编码序列的位置上。然而腺病毒序列内构建体的插入位置对本发明而言并非至关重要。目标基因的编码多核苦酸也可插入到E3置换型栽体中的缺失的E3区(参见Karlsson等(1986))或E4区(其中辅助細胞系或辅助病毒补充E4的缺损)腺病毒容易培养和操作,体外和体内均具有广泛宿主范围该类病毒可以高滴度获取,例如109-10"噬斑形成单位/ml而且是高感染性的。腺病毒生命周期不需要整合到宿主细胞基因组中腺病毒栽体所递送的外源基因是附加体,因此对宿主细胞的基因蝳性较低在野生型腺病毒接种研究中,未报道副作用(Couch等1963;Top等,1971)证明它作为体内基因转移栽体具有安全性和治疗潜力。腺病毒栽体已用於真核基因表达(Levrero等1991;Gomez-Foix等,1992)和疫苗开发(Grunhaus和Horwitz,1992;Graham和Prevec,1992)近来,动物研究表明重组腺病毒可用于基因治疗(Stratford-Perricaudet和Perricaudet,1991;Stratford-Perricaudet等1990;Rich等,1993)将重组腺病毒给予不同组织的研究包括气管滴注(Rosenfeld等,1991;Rosenfeld等,992)、肌注(Ragot等1993)、外周静脉内注射(Herz和Gerard,1993)和立体定位接种到脑部(LeGalLaSalle等,1993)。腺病毒栽体可来源于人腺病毒或者,它们可来源于黑猩猩等其它物种的腺病毒其优点是病毒载体不被许多人类受试者体内循环的针对人腺病毒的抗体所中和(参见例如TatsisN等(2005:)GeneTher.Decl;[待发表〗)。2.逆转录病蝳逆转录病毒是一类单链RNA病毒特征是在感染细胞中通过逆转录过程能将其RNA转变成双链DNA(Coffin,1990)。所得DNA再稳定整合在细胞染色体中成为原病毒指導病毒蛋白质合成。整合使病毒基因序列保留在受体细胞及其后代中逆转录病毒基因组含有gag、pol和env三种基因,它们分别编码衣壳蛋白、聚匼酶和包膜组分在gag基因上游发现的序列含有将基因组包装在病毒粒子中的信号。两个长末端重复(LTR)序列存在于病毒基因组的5'和3'端它们含囿强启动子和增强子序列,也是整合到宿主细胞基因组中所需要的(Coffin,1990)为了构建逆转录病毒栽体,将编码一种或多种目标寡核苷酸或多核苷酸序列的核酸插入到病毒基因组内某些病毒序列的位置上以产生复制缺损型病毒。为了产生病毒粒子构建含有gag、pol和env基因、但不含LTR和包裝组分的包装细胞系(Mann等,1983)当将含有cDNA、以及逆转录病毒LTR和包装序列的重组质粒导入该细胞系(通过例如磷酸钙沉淀)时,包装序列允许将重组質粒的RNA转录物包装到病毒颗粒中随后再将它们分泌到培养基中(Nicolas和Rubenstein,1988;Temin,1986;Mann等,1983)。然后收集含有重组逆转录病毒的培养基任选浓缩,用于基因转移逆转录病毒载体能够感染各种各样的细胞类型。然而整合和稳定表达则需要宿主细胞分裂(Paskind等,1975)目前,通过使乳糖残基经化学方法添加到病毒包膜上而对逆转录病毒进行化学修饰开发了允许逆转录病毒载体特异性打靶的新方法。该修饰通过唾液酸糖蛋白受体可允许特異性感染肝细胞设计了重组逆转录病毒打靶的另一种不同方法,该方法中使用针对逆转录病毒包膜蛋白和特异性细胞受体的生物素化抗體经使用链霉抗生物素,该抗体通过生物素组分进行偶联(Roux等1989)。Roux等人使用针对I类和II类主要组织相容性复合体抗原的抗体证明了携带这些表面抗原的各种人体细胞在体外可被亲嗜性病毒感染(Roux等,1989)3.腺伴随病毒AAV(Ridgeway,1988;Hermonat和Muzycska,1984)是parovirus,是作为腺病毒贮液的污染物而发现的它是与任何疾病无關的普遍存在的病毒(美国人口中有85%都存在抗体)。它也属于依赖病毒因为它的复制依赖于腺病毒等辅助病毒的存在。已经分离出5个血清型其中已充分表征了AAV-2。AAV具有单链线状DNA包裹在衣壳蛋白VP1、VP2和VP3中,形成直径20-24nm的二十面体病毒4立子(Muzyczka和McLaughlin,1988)AAVDNA长度约为4.7千碱基,含有两个可读框侧接两个ITR。AAV基因组中有两个主要基因rep和oz/"/基因编码负责病毒复制的蛋白质,而"v编码衣壳蛋白VPl-3每个ITR构成T-形发夹结构。这些末端重复序列是AAV仅囿的、用于染色体整合的主要顺式组分因此,AAV可用作载体其中所有病毒编码序列都被除去并用递送基因盒替代。根据图语位置鉴定並命名了p5、pl9和p40三个病毒启动子。从p5和p19转录导致产生rep蛋白而从p40转录产生衣壳蛋白(Hermonat和Muzyczka,1984)。有若干因素促使研究人员研究使用rAAV作为表达载体的可荇性一个因素就是对递送基因以整合到宿主染色体的需求令人惊奇的少。需要具有145bpITR,它们仅占AAV基因组的6%这在栽体中留下装配4.5kbDNA插入序列的涳间。尽管这样的携带容量可阻止AAV递送大基因但是这完全适合递送本发明的反义构建体。因为AAV具有安全性所以也是递送载体的良好选擇。有相当复杂的拯救机制为了动员rAAV,不仅需要野生型腺病毒而且需要AAV基因同样,AAV不是病原体与任何疾病无关。除去病毒编码序列可尽量减少针对病毒基因表达的免疫反应因此,rAAV不会引起炎症反应4.作为表达构建体的其它病毒栽体其它病毒载体可用作本发明的表达构建體,用于将寡核苷酸或多核苷酸序列递送给宿主细胞可以使用来自痘苗病毒(Ridgeway,1988;Co叩ar等,1988)、慢病毒、脊髓灰质炎病毒和疱渗病毒等病毒的载体它们给各种哺乳动物细胞带来一些有吸引力的特性(Friedmann,1989;Ridgeway,1988;Co叩ar等,1988;Horwich等,1990)随着目前对缺陷型乙肝病毒的识别,获得了有关不同病毒序列的结构-功能關系的新知识体外研究表明,病毒能保留辅助-依赖包装和逆转录的能力尽管其基因组缺失高达80%(Horwich等,1990)这表明基因组的大部分都可以被外源遗传物质替换。嗜肝性和持久性(整合)对于定向肝脏的基因转移而言是特别有吸引力的特性Chang等(1991)将氯霉素乙酰转移酶(CAT)基因导入鸭乙肝病蝳基因组,替代聚合酶编码序列、表面编码序列和前表面编码序列它与野生型病毒共转染到禽类肝癌细胞系中。用含有高滴度重组病毒嘚培养基来感染原代小鸭肝细胞转染后至少24天检测到稳定的CAT基因表达(Chang等,1991)5.非病毒栽体为了实现本发明寡核苷酸或多核苷酸序列的表达,可将表达构建体递送到细胞中这样的递送可按照转化细胞系的实验室方法在体外完成,或者在某些疾病状态的治疗中在体内或离体完荿这样的递送如上所述,一个优选的递送机制是通过病毒感染其中表达构建体包裹在感染性病毒颗粒之内。一旦将表达构建体递送到細胞中编码所需寡核苷酸或多核苷酸序列的核酸可在不同位置定位和表达。在某些实施方案中编码构建体的核酸可稳定整合到细月包基因组中。这样的整合可以通过同源重组(基因置换)在特定位置上以特定方向或者可以整合在随机的非特异性位置上(基因增强)。在再一个實施方案中核酸可以稳定保留在细胞中,作为单独的附加体DNA区段这类核酸区段或"附加体,编码序列足以允许独立保留和复制或者与宿主细胞周期同步。表达构建体如何递送给细胞以及核酸保留在细胞的何处,取决于所用表达构建体的类型在本发明的某些实施方案Φ,包含一个或多个寡核苷酸或多核苷酸序列的表达构建体可仅由^^果的重组DNA或质粒组成构建体的转移可通过任何上述方法(经物理或化学方法透过细胞膜)来进行。这尤其适用于体外转移但也可用于体内使用。Dubensky等(1984)成功地将多瘤病毒DNA以磷酸钙沉淀形式注入成年小鼠和新生小鼠肝脏和脾脏表现出活性病毒复制和急性感染。Benvenisty和Reshef(1986)也证明将磷酸4丐沉淀的质粒直接进行腹膜内注射导致所转移基因的表达。预期也可用類似方法将目标基因的编码DNA转移至体内并表达基因产物将棵DNA表达构建体转入细胞的本发明的另一个实施方案涉及粒子轰击。该方法依赖於使包被DNA的微弹加速到高速并让其刺穿细胞膜、进入细胞而不杀死细胞的能力(Klein等1987)。已经开发了用于小颗粒加速的一些装置一个这样的裝置依靠高压放电产生电流,这样的电流又提供原动力(Yang等1990)。所用的微弹由钨珠或金珠等生物惰性物质组成已经对包括大鼠和小鼠的肝、皮肤和肌肉组织在内的所选器官进行体内轰击(Yang等,1990;Zelenin等991)。这可能需要经手术暴露组织或细胞以去掉枪和靶器官之间的中间组织,即离體治疗此外,特定基因的编码DNA可通过该方法递送这也包括在本发明中。多肽组合物在其它方面本发明提供多肽组合物。通常本发奣多肽应为来自各种哺乳动物的分离的多肽(或其表位、变异体或活性片段)。优选的多肽是由本文所公开的多核苷酸序列来编码或由在中等严格性条件下与本文所公开的多核苷酸序列杂交的序列来编码。或者多肽可定义为包括来自本文所公开的氨基酸序列的连续氨基酸序列的多肽,或者包括本文所公开的完整氨基酸序列的多肽通常用例如以下文献及其引用文献中概述的众所周知技术鉴定免疫原性部分Paul,Fw"由wewto//www"o/ogy,苐3版,243-247(1993)这类技术包括筛选能与抗原特异性抗体、抗血清和/或T-细胞系或克隆发生反应的多肽。如果本文所用的抗血清和抗体与抗原特异性結合(即它们在ELISA或其它免疫测定中与目标蛋白发生反应而与无关蛋白没有可检测的反应),则它们就是"抗原特异性"的可以按本文所述,使鼡众所周知的技术制备这样的抗血清和抗体分枝杆菌蛋白的免疫原性部分是与所述抗血清和/或T细胞在基本上不高于全长多肽反应性的水岼上发生反应的部分(例如在ELISA和/或T细胞反应测定中)。在所述测定中这样的免疫原性部分可以类似于或高于全长多肽反应的水平发生反应。這样的筛选通常用本领域普通技术人员熟知的方法来进行例如参见Harlow和Lane,/^"力oti/'w../4La6ora《oA7M7"wa/(1988)和爿w"力rWw^丄t^orato^A/a肌a/(1998)。例如可将多肽固定在固相支持物上,与患者血清接触以便让血清内抗体与固定化多肽结合。然后除去未结合血清用例如1251-标记的蛋白A检测结合抗体。多肽可用各种众所周知的技术来淛备如上所述,可以用本领域普通技术人员已知的各种表达栽体中的任一种从DNA序列制备由DNA序列编码的重组多肽。可在经含编码重组多肽的DNA分子的表达载体转化或转染的任何合适宿主细胞中进行表达合适宿主细胞包括原核细胞、酵母细胞和高等真核细胞,例如哺乳动物細胞和植物细胞优选使用的宿主细胞是大肠杆菌、酵母菌或哺乳动物细胞系,例如COS或CHO可以先用巿售滤器浓缩合适宿主/栽体系统的培养基上清液,其中含有合适宿主/栽体系统所分泌的重组多肽或多肽浓缩后,将浓缩物用于合适的纯化基质例如亲和基质或离子交换树脂。最后使用一个或多个反相HPLC步骤,进一步纯化重组多肽也可通过合成方法,使用本领域普通技术人员熟知的技术产生约100个以下氨基酸、通常约50个以下氨基酸的本发明多肽、其免疫原性片段和其它变异体。例如可以用任何市售固相技术合成这样的多肽,所述技术例如Merrifield凅相合成方法其中将氨基酸序贯添加到逐渐加长的氨基酸链上。参见Merrifield,J.J附.Oze附.&;c.85:63)多肽的自动化合成仪器是市售的,供应商是例i口PerkinElmer/AppliedBioSystemsDivision(FosterCity,CA),可以按照生產商的说明书进行操作在某些具体的实施方案中,多肽可以是包含本文所述的多种多肽的融合蛋白或者是包含至少一个本文所述多肽囷无关序列(例如已知肿瘤蛋白)的融合蛋白。融合配偶体可以是例如有助于提供T辅助细胞表位(免疫融合配偶体)、优选由人识别的T辅助细胞表位或者与天然重组蛋白收率相比,可有助于更高收率地表达蛋白质(表达增强子)某些优选的融合配偶体同时是免疫原性融合配偶体和表達增强型融合配偶体。可以选择其它融合配偶体以增加蛋白质溶解度或者使该蛋白质能够靶向所需胞内区室。再一些融合配偶体包含便於蛋白质纯化的亲和标记以重组蛋白的形式表达融合蛋白,允许在表达系统中比非融合蛋白产生的水平高简而言之,编码多肽组分的DNA序列可以分别装配再连接到合适表达载体中。将编码一种多肽组分的DNA序列的3'端通过或不通过肽接头,与编码第二种多肽组分的DNA序列的5'端连接使得该序列的读框同相(inphase)。这允许翻译成同时保留两种多肽组分的生物活性的单一融合蛋白可以使用肽接头序列来间隔开第一和苐二多肽组分,其间距足以保证各多肽折叠成其二级和三级结构使用本领域众所周知的标准技术将这种肽接头序列掺入到融合蛋白中。鈳以根据以下因素选择合适的肽接头序列(l)它们能采用柔性延伸构象;(2)它们不能采用会影响第一和第二多肽功能性表位的第二结构;和(3)缺乏鈳与多肽功能性表位反应的疏水性或带电荷残基优选的肽接头序列含有Gly、Asn和Ser残基。其它近中性氨基酸(例如Thr和Ala)也可用于Maratea等G匿40:39-46(1985);Murphy等,Prac.編.JcW.园83:86);美國专利号4,935,233和美国专利号4,751,180接头序列的长度通常为1个至约50个氨基酸。当第一和第二多肽具有可用于间隔开功能性结构域并能防止空间位阻的非必需N-端氨基酸区时则不需要接头序列。连接的DNA序列与合适的转录或翻译调节元件操作性连接负责DNA表达的调节元件仅位于编码第一多肽的DNA序列的5'。同样结束翻译和转录终止信号所需的终止密码子仅存在于编码第二多肽的DNA序列的3'。也提供融合蛋白这类蛋白质包含如本攵所述的多肽以及无关的免疫原性蛋白。优选的免疫原.性蛋白能诱导记忆应答这类蛋白质的实例包括破伤风蛋白、结核病蛋白和肝炎蛋皛(参见例如Stoute等,脸wA/ec/.336:86-91(1997))在优选实施方案中,免疫融合配偶体来源于蛋白D,—种革兰氏阴性菌嗜血流感杆菌B(//aew(9/7/7iM'/"//wewz"5)的表面蛋白(WO91/18926)优选蛋白D衍生物包含约朂初第3个蛋白(例如N-端的前100-H0个氨基酸),并且蛋白D衍生物可以被脂质化在某些优选实施方案中,脂蛋白D融合配偶体的前109个残基包含在N-端以提供具有额外外源T细胞表位的多肽并提高在大肠杆菌中的表达水平(因此起到表达增强子的作用)。脂质尾确保将抗原优化呈递给抗原呈递细胞其它融合配偶体包含来自流感病毒的非结构蛋白NS1(血凝素)。通常使用N-端81个氨基酸虽然也可以使用包括T辅助细胞表位在内的不同片段。茬另一个实施方案中免疫融合配偶体是称为LYTA的蛋白质或其部分(优选C-端部分)。LYTA来自肺炎链球菌(S"e/7tococci/7Mewwo"/ae)能合成N-乙酰基-L-丙氨酸酰胺酶,称为酰胺酶LYTA(甴LytA基因编码;43:265-292(1986))LYTA是一种特异性降解肽聚糖主链某些键的自溶素。LYTA蛋白C-端结构域负责针对胆碱或某些胆碱类似物例如DEAE的亲和性该特性已经鼡于开发大肠杆菌C-LYTA表达质粒,用于表达融合蛋白在氨基端含有C-LYTA片段的杂合蛋白的纯化方法已有描述(参见5Wec/wo/ogy10:795-798(1992))。在一个优选的实施方案中可將LYTA的重复部分掺入到融合蛋白中。在C-端区自残基178开始发现重复部分特别优选的重复部分包括残基188-305。一般而言本文所述的多肽(包括融合疍白)和多核苷酸是分离的。"分离的"多肽或多核苷酸是从其原有环境中分离出来的多肽或多核苷酸例如,当天然存在的蛋白质从天然系统Φ共同存在的某些或所有材料中分离出来时就称之为分离的。优选这类多肽的纯度为至少约90%,更优选至少约95%最优选至少约99%。当多核苷酸唎如克隆到并非其天然环境组成部分的载体中时就称之为分离的。T细胞另一方面免疫治疗组合物也可以包含对分枝杆菌抗原具有特异性的T细胞。通常用标准方法在体外或离体制备这类细胞例如,可以使用市售细胞分离系统(例如IsolexSystem,得自NexellTherapeutics,Inc.(Irvine,CA);另见美国专利号5,240,856;美国专利号5,215,926;WO89/06280;WO91/16116和WO92/07243)从患鍺的骨髓、外周血或者部分骨髓或外周血中分离出T细胞。或者T细胞可来自相关或无关的人、非人类哺乳动物的细胞系或培养物。可}

我要回帖

更多关于 &amp;lt;&amp;gt 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信