技术摘要:
本发明涉及具有葡糖淀粉酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用所述多肽的方法。
背景技术:
葡糖淀粉酶(1,4-α-D-葡聚糖葡糖水解酶,EC 3.2.1.3)是一种催化D-葡萄糖从淀 粉或相关的寡糖和多糖分子的非还原端释放的酶。葡糖淀粉酶由数种丝状真菌和酵母产 生,其中来自曲霉属(Aspergillus)的那些在商业上最为重要。 商业上,使用葡糖淀粉酶将已经由部分α-淀粉酶部分水解的淀粉材料转化为葡萄 糖。然后可使用发酵生物将葡萄糖直接或间接转化为发酵产物。商业性发酵产物的实例包 括醇(例如,乙醇、甲醇、丁醇、1,3-丙二醇);有机酸(例如柠檬酸、乙酸、衣康酸、乳酸、葡糖 酸、葡糖酸盐、乳酸、琥珀酸、2,5-二酮-D-葡糖酸);酮(例如丙酮);氨基酸(例如谷氨酸);气 体(例如H2和CO2)和更复杂的化合物,包括例如抗生素(例如青霉素和四环素);酶;维生素 (例如核黄素,B12,β-胡萝卜素);激素,和其他难以合成产生的化合物。发酵工艺亦常用于可 饮用的醇类(例如啤酒和葡萄酒),乳类产品(例如,酸奶和奶酪的产生)工业。 终产物亦可为糖浆。举例而言,终产物可为葡萄糖,但亦可例如通过葡糖异构酶转 化为果糖或基本上由等量葡萄糖和果糖构成的混合物。该混合物,或进一步富集果糖的混 合物,是在全世界得到商业化的最常用的高果糖玉米糖浆(HFCS)。 本发明的目的是提供具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸,且 其在发酵产物产生工艺如醇产生工艺中提供高收率,包括从未糊化的生(或未烹制)淀粉的 一步乙醇发酵工艺。 Uniprot:B0CVJ1公开了来自双色蜡蘑(Laccaria bicolor)的多肽,而WO 2006/ 069289描述了来自瓣环栓菌(Trametes cingulata)的葡糖淀粉酶。 4 CN 111593035 A 说 明 书 2/37 页
技术实现要素:
鉴定并表征了由真菌粘褶菌属(Gloeophyllum)产生,并具有葡糖淀粉酶活性的多 肽。更具体而言,所述粘褶菌属菌种选自下组:冷杉粘褶菌(G .abietinum)、篱边粘褶菌 (G.sepiarium)和密粘褶菌(G.trabeum)。 相应地,在第一个方面,本发明涉及具有葡糖淀粉酶活性的分离的多肽,其选自下 组:(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽具有优选至少82%,更优选至少83%,更优选至少84%,更优选至少85%, 更优选至少86%,更优选至少87%,更优选至少88%,更优选至少89%,更优选至少90%,更 优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选 至少95%,如至少96%,至少97%,至少98%,至少99%或甚至100%同一性;(b)多肽,其包 含氨基酸序列,所述氨基酸序列与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8, SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14的氨基酸19至474或SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471所示的催化域具有优选至少82%,更优选至少83%,更优选至少 84%,更优选至少85%,更优选至少86%,更优选至少87%,更优选至少88%,更优选至少 89%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至 少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少98%,至少99%或甚至 100%同一性;(c)多肽,其由多核苷酸编码,所述多核苷酸在优选至少中-高严格条件下,并 且最优选至少高严格条件下与以下杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成 熟多肽编码序列,(ii)包含SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的 基因组DNA序列,或(iii)(i)或(ii)的全长互补链;(d)多肽,其由多核苷酸编码,所述多核 苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多 肽编码序列具有优选至少82%,更优选至少83%,更优选至少84%,更优选至少85%,更优 选至少86%,更优选至少87%,更优选至少88%,更优选至少89%,更优选至少90%,更优选 至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少 95%,如至少96%,至少97%,至少98%,至少99%或甚至100%同一性;和(e)变体,其包含 取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO: 6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO: 18的成熟多肽。 在第二个方面,本发明涉及分离的多核苷酸,其包含编码第一个方面的多肽的核 苷酸序列。 在进一步的方面,本发明涉及包含第二个方面的多核苷酸的核酸构建体,重组表 达载体,重组宿主细胞,转基因植物,植物部分或植物细胞。 仍在进一步的方面,本发明涉及产生所述多肽的方法,所述多肽的用途,和包含α- 淀粉酶和所述多肽的组合物。 本发明还涉及以下项目: 5 CN 111593035 A 说 明 书 3/37 页 项目1.一种具有葡糖淀粉酶活性的分离的多肽,其选自下组: (a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽具有优选至少82%,更优选至少83%,更优选至少84%,更优选至少 85%,更优选至少86%,更优选至少87%,更优选至少88%,更优选至少89%,更优选至少 90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至 最优选至少95%,如至少95%,至少97%,至少98%,至少99%或甚至100%同一性; (b)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14的氨基酸19至474或者 SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471所示的催化域具有优选至少82%,更优选 至少83%,更优选至少84%,更优选至少85%,更优选至少86%,更优选至少87%,更优选至 少88%,更优选至少89%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选 至少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少98%, 至少99%或甚至100%同一性; (c)多肽,其由多核苷酸编码,所述多核苷酸在优选至少中-高严格条件下,和最优 选至少高严格条件下与以下杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多 肽编码序列,(ii)包含SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO: 9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的基 因组DNA序列,或(iii)(i)或(ii)的全长互补链; (d)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与 SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列具有优选至少82%,更优选 至少83%,更优选至少84%,更优选至少85%,更优选至少86%,更优选至少87%,更优选至 少88%,更优选至少89%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选 至少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少98%, 至少99%或甚至100%同一性;和 (e)变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2, SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14, SEQ ID NO:16或SEQ ID NO:18的成熟多肽。 项目2.项目1的多肽,其包含或组成为SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO: 6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO: 18的氨基酸序列;SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO: 10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽;或它们具有 葡糖淀粉酶活性的片段。 项目3.项目1或2的多肽,其由多核苷酸编码,所述多核苷酸包含或组成为SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO: 13,SEQ ID NO:15或SEQ ID NO:17的核苷酸序列;或它们编码具有葡糖淀粉酶活性的片段 的亚序列。 6 CN 111593035 A 说 明 书 4/37 页 项目4.项目1-3任一项的多肽,其由DSM 23222中包含的质粒中含有的多核苷酸编 码。 项目5.项目1-4任一项的多肽,其中所述成熟多肽是SEQ ID NO:2,SEQ ID NO:4, SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸18至 573或SEQ ID NO:16或SEQ ID NO:18的氨基酸18至576。 项目6.一种具有糖结合活性的分离的多肽,其包含糖结合模块,所述模块与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸480至573或者SEQ ID NO:16或SEQ ID NO:18的氨基酸483至576所示的糖结 合域具有优选至少80%,更优选至少81%,更优选至少82%,更优选至少83%,更优选至少 84%,更优选至少85%,更优选至少86%,更优选至少87%,更优选至少88%,更优选至少 89%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至 少94%,并且甚至最优选至少95%,如至少95%,至少97%,至少98%,至少99%或甚至 100%同一性。 项目7.一种杂合酶,其包含催化域和项目6的糖结合域。 项目8 .项目7的杂合酶,其中所述催化域具有选自下组的酶活性:α-淀粉酶, amylopullulanase,β-淀粉酶,CGT酶,葡糖淀粉酶,异淀粉酶,产麦芽糖淀粉酶和支链淀粉 酶。 项目9.一种分离的多核苷酸,其包含编码项目1-8任一项的多肽的核苷酸序列。 项目10.一种核酸构建体,其包含可操作连接的项目9的多核苷酸和一种或多种 (几种)调控序列,所述调控序列指导所述多肽在表达宿主中的表达。 项目11.一种重组表达载体,其包含项目10的核酸构建体。 项目12.一种重组宿主细胞,其包含项目10的核酸构建体。 项目13.一种产生项目1-8任一项的多肽的方法,包括:(a)在有助于所述多肽产生 的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的核苷酸序 列;和(b)回收所述多肽。 项目14.一种产生项目1-8任一项的多肽的方法,包括:(a)在有助于所述多肽产生 的条件下培养转基因植物或植物细胞,所述植物或植物细胞包含编码所述多肽的多核苷酸 序列;和(b)回收所述多肽。 项目15.一种转基因植物、植物部分或植物细胞,其用编码项目1-8任一项的多肽 的多核苷酸转化。 项目16.项目1-8任一项的多肽在产生糖浆和/或发酵产物中的用途。 项目17.项目16的方法,其中所述起始材料为糊化的或未糊化的含淀粉材料。 项目18.项目1-8任一项的多肽用于酿造的用途。 项目19.一种组合物,其包含α-淀粉酶和项目1-8任一项的多肽。 项目20.一种从含淀粉材料产生发酵产物的工艺,包括下述步骤: (a)液化含淀粉材料; (b)糖化经液化的材料;和 (c)用发酵生物发酵; 其中步骤(b)使用至少一种项目1-5任一项的葡糖淀粉酶进行。 7 CN 111593035 A 说 明 书 5/37 页 项目21.一种从含淀粉材料产生发酵产物的工艺,包括下述步骤: (a)在所述含淀粉材料的起始糊化温度以下的温度糖化含淀粉材料;和 (b)用发酵生物发酵; 其中步骤(a)使用至少一种项目1-5任一项的葡糖淀粉酶进行。 定义 葡糖淀粉酶:术语葡糖淀粉酶(1,4-α-D-葡聚糖葡糖水解酶,EC3.2.1.3)定义为催 化D-葡萄糖从淀粉或相关的寡糖和多糖分子的非还原端释放的酶。就本发明而言,葡糖淀 粉酶活性根据下文“材料和方法”部分描述的步骤来确定。 本发明的多肽具有SEQ ID NO:2或其同源序列,SEQ ID NO:4或其同源序列,SEQ ID NO:6或其同源序列,SEQ ID NO:8或其同源序列,SEQ ID NO:10或其同源序列,SEQ ID NO:12或其同源序列,SEQ ID NO:14或其同源序列,SEQ ID NO:16或其同源序列,或者SEQ ID NO:18或其同源序列的成熟多肽的葡糖淀粉酶活性的至少20%,优选至少40%,优选至 少45%,更优选至少50%,更优选至少55%,更优选至少60%,更优选至少65%,更优选至少 70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至 少95%,并且甚至最优选至少100%。 分离的多肽:术语“分离的多肽”用于本文中指从来源分离的多肽。在一个优选的 方面,如通过SDS-PAGE测定的,所述多肽为至少1%纯,优选至少5%纯,更优选至少10%纯, 更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,并且 最优选至少90%纯。 基本上纯的多肽:术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备 物含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%, 更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天 然或重组结合的(associated)其它多肽材料。因此,优选所述基本上纯的多肽按存在于制 备物中的全部多肽材料的重量计是至少92%纯,优选至少94%纯,更优选至少95%纯,更优 选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至 少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。本发明的多肽优选是基本上纯 的形式,即所述多肽制备物基本上(essentially)不含与其天然或重组结合的其它多肽材 料。例如,这能够通过如下实现:通过公知的重组方法或通过经典纯化方法制备多肽。 成熟多肽:术语“成熟多肽”意指以其在翻译和任何翻译后修饰(如N-末端加工、C- 末端截短、糖基化、磷酸化等)之后的最终形式存在的多肽。在一个方面,基于预测SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO: 14,SEQ ID NO:16和SEQ ID NO:18的氨基酸1至17是信号肽的SignalP程序(Nielsen等, 1997,Protein Engineering 10:1-6),所述成熟多肽是SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14的氨基酸18至573或SEQ ID NO:16或SEQ ID NO:18的氨基酸18至576。由SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6, SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸19至474(特别是19至 471)或者SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471限定的序列为催化域。由SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸480至573或者SEQ ID NO:16或SEQ ID NO:18的氨基酸483至576限定的序列 8 CN 111593035 A 说 明 书 6/37 页 为淀粉结合域。 成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为编码具有葡糖淀粉 酶活性的成熟多肽的核苷酸序列。优选地,所述成熟多肽编码序列是SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13的核苷酸52 至1719,或者SEQ ID NO:15或SEQ ID NO:17的核苷酸52至1728。 同一性:两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“同一性”来 描述。 就本发明而言,两个氨基酸序列之间的同一性程度是使用如EMBOSS程序包 (EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,Trends in Genetics 16:276-277) (优选版本3 .0 .0或更新的版本)的Needle程序中执行的 Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来测定的。使 用的可选参数是:缺口产生罚分为10,缺口延伸罚分为0.5,和EBLOSUM62(BLOSUM62的 EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用–nobrief选项获得)用 作百分比同一性并且是如下计算的: (相同的残基x 100)/(比对的长度-比对中的缺口总数) 就本发明而言,两个脱氧核糖核苷酸序列之间的同一性程度使用如EMBOSS程序包 (EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,见上) (优选版本3.0.0或更新的版本)的Needle程序中执行的Needleman-Wunsch算法(Needleman 和Wunsch,1970,见上)测定。使用的可选参数是:缺口产生罚分为10,缺口延伸罚分为0.5, 和EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出 (使用–nobrief选项获得)用作百分比同一性并且是如下计算的: (相同的脱氧核糖核苷酸x 100)/(比对的长度-比对中的缺口总数) 同源序列:术语“同源序列”在本文中定义为与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码部分或SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,或SEQ ID NO:18的成熟多肽分别 具有至少82%,优选至少83%,更优选至少84%,更优选至少85%,更优选至少86%,更优选 至少87%,更优选至少88%,更优选至少89%,更优选至少90%,更优选至少91%,更优选至 少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至 少97%,至少98%或甚至至少99%同一性%的核苷酸序列/多肽序列。 多肽片段:术语“多肽片段”在本文定义为从SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽或其同源序列的氨基和/或羧基末端缺失了一个或多个(几个)氨基酸的 多肽;其中所述片段具有葡糖淀粉酶活性。优选地,片段含有SEQ ID NO:2,SEQ ID NO:4, SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或 SEQ ID NO:18的成熟多肽或其同源序列的至少500个氨基酸残基,更优选至少450个氨基酸 残基,并且最优选至少400个氨基酸。具体的片段为SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO: 6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸19至474或者SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471限定的序列,其包含本发明多肽的催化域。 9 CN 111593035 A 说 明 书 7/37 页 亚序列:术语“亚序列(subsequence)”在本文中定义为从SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO: 15或SEQ ID NO:17的成熟多肽编码序列的5'和/或3'端缺失了一个或多个(几个)核苷酸的 核苷酸序列;或其同源序列;其中所述亚序列编码具有葡糖淀粉酶活性的多肽片段。优选 地,亚序列含有SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列或其同源序 列的至少1500个核苷酸,更优选至少1400个核苷酸,并且最优选至少1200个核苷酸。 等位变体(allelic variant):术语“等位变体”在本文中表示占据相同染色体基 因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致 种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的 氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。 分离的多核苷酸:术语“分离的多核苷酸”用于本文中指从来源分离的多核苷酸。 优选地,如通过琼脂糖电泳测定的,所述多核苷酸为至少1%纯,优选至少5%纯,更优选至 少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少 80%纯,并且最优选至少90%纯。 基本上纯的多核苷酸:术语“基本上纯的多核苷酸”用于本文指多核苷酸制备物, 其不含其它外来的或不期望的核苷酸,并且处于适合于在遗传工程蛋白质生产体系中使用 的形式。因此,基本上纯的多核苷酸含有按重量计至多10%,优选至多8%,更优选至多6%, 更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并 且甚至最优选至多0.5%的与其天然或重组结合的其它多核苷酸材料。然而,基本上纯的多 核苷酸可以包括天然存在的5’和3’非翻译区,如启动子和终止子。优选基本上纯的多核苷 酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优 选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最 优选至少99.5%纯的。本发明的多核苷酸优选为基本上纯的形式,即所述多核苷酸制备物 基本上(essentially)不含与其天然或重组结合的其它多核苷酸材料。所述多核苷酸可以 是基因组、cDNA、RNA、半合成、合成来源的,或它们的任何组合。 编码序列:术语“编码序列”在用于本文时意指直接指定其蛋白产物的氨基酸序列 的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可 供选择的起始密码子如GTG和TTG开始,并且以终止密码子如TAA、TAG和TGA结束。编码序列 可以是DNA、cDNA、合成的或重组的核苷酸序列。 cDNA:术语“cDNA”在本文中定义为能够通过反转录从得自真核细胞的成熟的、已 剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起 始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟 的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自mRNA 的cDNA没有任何内含子序列。 核酸构建体:术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分 子分离自天然存在的基因,或将所述核酸分子以本来不存在于(not otherwise exist)自 然界中的方式修饰以含有核酸的区段或所述核酸分子是合成的。当所述核酸构建体含有表 达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。 10 CN 111593035 A 说 明 书 8/37 页 调控序列(control sequence):术语“调控序列”在本文定义为包括对编码本发明 多肽的多核苷酸表达是必需的所有组分。各个调控序列对于编码所述多肽的核苷酸序列可 以是天然的或外源的,或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包 括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少 的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和目的为引入特异 性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列 编码区的连接。 可操作地连接:术语“可操作地连接”在本文表示这样的构型,其中将调控序列置 于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽编码序列的表达。 表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修 饰、翻译、翻译后修饰和分泌。 表达载体:术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本 发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。 宿主细胞:如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型 对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的 (susceptible)。 修饰:术语“修饰”在本文中意指对由SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6, SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18 的成熟多肽组成的多肽或其同源序列的任何化学修饰,以及对编码这样的多肽的DNA的遗 传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入,以及一个或多 个(几个)氨基酸侧链的置换。 变体:当用于本文时,术语“变体”意指具有葡糖淀粉酶活性的多肽包含改变,即在 一个或多个(几个)位置取代、插入和/或缺失一个或多个(几个)氨基酸残基。取代意指用不 同的氨基酸替代占据某位置的氨基酸;缺失指去除占据某位置的氨基酸;而插入意指邻接 占据某位置的氨基酸添加1-3个氨基酸。 发明详述 具有葡糖淀粉酶活性的多肽 在第一个方面,本发明涉及包含下述氨基酸序列的分离的多肽,所述氨基酸序列 与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12, SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽具有优选至少82%,更优选至少 83%,更优选至少84%,更优选至少85%,更优选至少86%,更优选至少87%,更优选至少 88%,更优选至少89%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至 少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少98%,至 少99%或甚至100%同一性的同一性程度,所述多肽具有葡糖淀粉酶活性(下文中的“同源 多肽”)。优选地,所述同源多肽具有的氨基酸序列与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更 优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。 本发明的多肽优选包含SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8, 11 CN 111593035 A 说 明 书 9/37 页 SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的氨基酸序列 或其等位变体;或它们的具有葡糖淀粉酶活性的片段。优选地,多肽包含SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽或其等位变体;或它们的具有葡糖淀粉酶活性的片段。在 另一优选的方面,多肽由SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的氨基酸序列或其等 位变体,或它们的具有葡糖淀粉酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO: 2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14, SEQ ID NO:16或SEQ ID NO:18的氨基酸序列组成。 在第二个方面,本发明涉及具有葡糖淀粉酶活性的分离的多肽,其由多核苷酸编 码,所述多核苷酸在优选非常低严格条件、更优选低严格条件、更优选中严格条件、更优选 中-高严格条件、甚至更优选高严格条件、和最优选非常高严格条件下与下列杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列,(ii)包含SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO: 15或SEQ ID NO:17的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或 (iv)(i)、(ii)或(iii)的全长互补链(J .Sambrook,E.F .Fritsch和T.Maniatis,1989, Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor,New York)。SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的成熟多肽编码序列的亚序列 含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可以编码 具有葡糖淀粉酶活性的多肽片段。优选地,所述互补链是SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的全长互补链。 SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的核苷酸序列或其亚序列;以及SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的氨基酸序列或其片段,可用于设计核酸探针,以根 据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有葡糖淀粉酶活性的多肽 的DNA。具体而言,可将这些探针用于根据标准的Southern印迹方法与感兴趣的属或种的基 因组或cDNA杂交,以鉴定并从其中分离相应的基因。这些探针可明显短于完整序列,但长度 上应为至少14个,优选至少25个,更优选至少35个,并且最优选至少70个核苷酸。然而,优选 所述核酸探针长度上是至少100个核苷酸。例如,所述核酸探针长度上可以是至少200个核 苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可 以使用更长的探针,例如,长度是优选至少600个核苷酸,更优选至少700个核苷酸,甚至更 优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使 用。通常将探针标记以探测相应的基因(例如,用33P、32P、3H、35S、生物素或抗生物素蛋白 12 CN 111593035 A 说 明 书 10/37 页 (avidin)标记)。将这些探针包含于本发明中。 因而,可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上 述探针杂交并且编码具有葡糖淀粉酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电 泳,或通过其它分离技术分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的 DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于 其上。为了鉴定与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9, SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17或其亚序列同源的克隆或 DNA,将所述载体材料优选用在Sounthern印迹中。 就本发明而言,杂交表示核苷酸序列在非常低至非常高的严格条件下与标记的核 酸探针杂交,所述核酸探针对应于SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7, SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编 码序列;包含SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的基因组DNA序 列;其全长互补链;或其亚序列。可使用例如X射线片(X-ray film)检测在这些条件下与核 酸探针杂交的分子。 优选地,核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另一优选的方面,核酸 探针是编码SEQ ID NO:2的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探 针是SEQ ID NO:1。在另一优选的方面,核酸探针是包含在大肠杆菌(E.coli)菌株DSM23222 中的质粒中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有葡糖淀粉酶活性的多 肽。在另一优选的方面,核酸探针是包含在大肠杆菌DSM 23222中的质粒中含有的成熟多肽 编码区。 优选地,所述核酸探针是SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9, SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列。在另一 个优选的方面,所述核酸探针是编码SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO: 10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的多肽或其亚序列的多核 苷酸序列。在另一个优选的方面,所述核酸探针是SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO: 7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17。 对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42 ℃,在5X SSPE、0.3%SDS、200μg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严 紧性为25%的甲酰胺、对于中和中-高严紧性为35%的甲酰胺、或对于高和非常高严紧性为 50%的甲酰胺,根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。 对于长度为至少100个核苷酸的长探针,使用2X SSC、0.2%SDS优选在45℃(非常 低严紧性),更优选在50℃(低严紧性),更优选在55℃(中严紧性),更优选在60℃(中-高严 紧性),甚至更优选在65℃(高严紧性),并且最优选在70℃(非常高严紧性)将载体材料最终 洗涤三次,每次15分钟。 对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严格条件定义为在比使 用根据Bolton和McCarthy计算法(1962,Proceedings of the National Academy of Sciences USA 48:1390)计算得出的Tm低大约5℃至大约10℃,在0.9M NaCl,0.09M Tris- HCl pH7 .6,6mM EDTA,0 .5%NP-40,1X Denhardt溶液,1mM焦磷酸钠(sodium 13 CN 111593035 A 说 明 书 11/37 页 pyrophosphate),1mM磷酸二氢钠(sodium monobasic phosphate),0.1mM ATP和0.2mg每ml 的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小 时。 对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6X SSC 加0.1%SDS中洗涤一次15分钟,并用6X SSC在比计算得出的Tm低5℃至10℃的温度洗涤两 次,每次15分钟。 在第三个方面,本发明涉及由多核苷酸编码的具有葡糖淀粉酶活性的分离的多 肽,所述多核苷酸包含或组成为与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7, SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编 码序列具有至少82%,更优选至少83%,更优选至少84%,更优选至少85%,更优选至少 86%,更优选至少87%,更优选至少88%,更优选至少89%,更优选至少90%,更优选至少 91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%, 如至少96%,至少97%,至少98%,至少99%同一性程度的核苷酸序列,其编码活性多肽。参 见本文多核苷酸部分。 本发明还涉及人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(或 几个)氨基酸的SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽;或其同源序列。优选 地,氨基酸改变对性质是较不重要的(of a minor nature),即保守的氨基酸取代或插入, 其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或 羧基末端延伸,如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变 净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(poly-histidine tract)、抗原 表位(antigenic epitope)或结合域(binding domain)。 保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性 氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮 氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨 酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基 酸取代是本领域已知的,并且由例如H.Neurath和R .L .Hill,1979,于The Proteins, Academic Press,New York中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/ Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、 Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。 除了20个基本氨基酸,非基本氨基酸(如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异 丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨 基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸” 在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天 然氨基酸能够以化学方法合成,并且优选是商业上可得到的,包括六氢吡啶羧酸 (pipecolic acid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲 基脯氨酸,和3,3-二甲基脯氨酸。 可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如, 氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适pH等。 14 CN 111593035 A 说 明 书 12/37 页 能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和 Wells,1989,Science 244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将 单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的葡糖淀粉酶活性以鉴 定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem .271: 4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通 过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基 酸的突变来测定。参见例如de Vos等,1992,Science 255:306-312;Smith等,1992, J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBS Lett.309:59-64。必需氨基酸的身份 (identity)也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。 能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法, 例如那些由Reidhaar-Olson和Sauer,1988,Science 241:53-57;Bowie和Sauer,1989, Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或WO 95/22625公开的那些方法来 进行并测试单个或多个氨基酸取代、缺失、和/或插入。能够使用的其它方法包括易错PCR、 噬菌体展示(例如,Lowman等,1991,Biochem.30:10832-10837;美国专利5,223,409号;WO 92/06204)和区域定向的诱变(Derbyshire等,1986,Gene 46:145;Ner等,1988,DNA 7: 127)。 诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的 克隆的、诱变的多肽的活性(Ness等,1999,Nature Biotechnology 17:893-896)。能够从宿 主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方 法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多 肽。 成熟多肽,如SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO: 10,SEQ ID NO:12或SEQ ID NO:14的氨基酸18至573或者SEQ ID NO:16或SEQ ID NO:18的 氨基酸18至576,或催化域,如EQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸19至474或者SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471中的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优 选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。 具有葡糖淀粉酶活性的多肽的来源 本发明的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来 源有关的术语“获得自”,意思是核苷酸序列编码的多肽由所述来源产生,或由其中插入了 来自所述来源的核苷酸序列的菌株产生。优选地,获得自给定来源的多肽是胞外分泌的。 本发明具有葡糖淀粉酶活性的多肽亦可为细菌多肽,或酵母多肽,或更优选丝状 真菌多肽,如具有葡糖淀粉酶活性的枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢 属(Alternaria)、Artomyces、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、 Botryospaeria、拟蜡菌属(Ceriporiopsis)、Chaetomidium、金孢子菌属(Chrysosporium)、 Claviceps、Cochliobolus、Coprinopsis、Coptotermes、Corynascus、Cryphonectria、隐球 菌属(Cryptococcus)、Diplodia、Exidia、Filibasidium、镰孢属(Fusarium)、赤霉属 (Gibberella)、粘褶菌属(Gloeophyllum)、Holomastigotoides、腐质霉属(Humicola)、耙菌 属(Irpex)、Lentinula、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属 15 CN 111593035 A 说 明 书 13/37 页 (Me ri pil us)、毛霉属(Muco r)、毁丝霉属(Mycelio ph tho ra)、新考玛脂霉属 (Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属 (Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘 菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属 (Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、热子囊菌属 (Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属 (Trichoderma)、Trichophaea、轮枝孢属(Verticillium)、Volvariella或Xylaria多肽。 在一个更优选的方面,所述多肽是具有葡糖淀粉酶活性的粘褶菌属菌种多肽,如 篱边粘褶菌(Gloeophyllum sepiarium)、密粘褶菌(Gloeophyllum trabeum)或冷杉粘褶菌 (Gloeophyllum abietinum)多肽。可理解的是对于前述的种,本发明包含完全和不完全阶 段(perfect and imperfect states),和其它分类学的等同物(equivalent),例如无性型 (anamorph),而无论它们已知的种名。本领域的技术人员会容易地识别适合的等同物的身 份(identity)。 这些种的菌株在许多培养物保藏机构对于公众能够容易地取得,所述保藏机构如 美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生 物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业 研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。 此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分 离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域 内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。 一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的 技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上)。 本发明的多肽还包括融合多肽或可切割的融合多肽,其中将另外的多肽融合到所 述多肽或其片段的N末端或C末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合于 本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知 的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使所述融合多肽的表达在 相同启动子和终止子的控制下。 融合多肽还可以包括切割位点。一旦分泌了融合多肽,就切割所述位点,从融合蛋 白释放具有葡糖淀粉酶活性的多肽。切割位点的实例包括,但不限于,编码二肽Lys-Arg的 Kex2位点(Martin等,2003,J.Ind .Microbiol.Biotechnol.3:568-76;Svetina等,2000, J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63: 3488-3493;Ward等,1995,Biotechnology 13:498-503;和Contreras等,1991, Biotechnology 9:378-381);Ile-(Glu或Asp)-Gly-Arg位点,其在精氨酸残基后通过因子 Xa蛋白酶切割(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位点,其在赖 氨酸后通过肠激酶切割(Collins-Racie等,1995,Biotechnology 13:982-987);His-Tyr- Glu位点或His-Tyr-Asp位点,其通过Genenase I切割(Carter等,1989,Proteins: Structure,Function,and Genetics 6:240-248);Leu-Val-Pro-Arg-Gly-Ser位点,其在 16 CN 111593035 A 说 明 书 14/37 页 Arg后通过凝血酶切割(Stevens,2003,Drug Discovery World 4:35-48);Glu-Asn-Leu- Tyr-Phe-Gln-Gly位点,其在Gln后通过TEV蛋白酶切割(Stevens,2003,见上);和Leu-Glu- Val-Leu-Phe-Gln-Gly-Pro位点,其在Gln后通过遗传工程形式的人鼻病毒3C蛋白酶切割 (Stevens,2003,见上)。 多核苷酸 本发明还涉及分离的多核苷酸,其包含编码本发明具有葡糖淀粉酶活性的多肽的 核苷酸序列,或由该核苷酸序列组成。 优选地,核苷酸序列包含或组成为SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17。在另 一优选的方面,核苷酸序列包含或组成为大肠杆菌DSM 23222中所含质粒中含有的序列。在 另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:1的成熟多肽编码序列。在另一更优 选的方面,核苷酸序列包含或组成为大肠杆菌DSM 23222中所含质粒中含有的成熟多肽编 码序列。本发明还涵盖编码如下多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:2, SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14, SEQ ID NO:16或SEQ ID NO:18的氨基酸序列或其成熟多肽;由于遗传密码的简并性,所述 核苷酸序列不同于SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9, SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17或其成熟多肽编码序列。本发 明还涉及SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的亚序列,所述亚序列编码具有葡糖 淀粉酶活性的SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的片段。 本发明还涉及突变的多核苷酸,其在SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5, SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17 的成熟多肽编码序列中包含至少一个突变或由具有至少一个突变的SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO: 15或SEQ ID NO:17的成熟多肽编码序列组成,其中突变的核苷酸序列编码SEQ ID NO:2, SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14, SEQ ID NO:16或SEQ ID NO:18的成熟多肽。 用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,且包括从基因组 DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库 的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆本发 明的多核苷酸。参见,例如,Innis等,1990,PCR:A Guide to Methods and Application, Academic Press,New York。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活 化转录(ligated activated transcription;LAT)和基于核苷酸序列的扩增(NASBA)。可以 从青霉属菌株,或另外的或相关的生物体克隆所述多核苷酸,并且因此可以是例如所述核 苷酸序列的多肽编码区的等位基因变体或种变体(species variant)。 本发明还涉及分离的多核苷酸,其包含或组成为下述核苷酸序列,所述核苷酸序 列与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11, SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列具有优选至少82%,更 17 CN 111593035 A 说 明 书 15/37 页 优选至少83%,更优选至少84%,更优选至少85%,更优选至少86%,更优选至少87%,更优 选至少88%,更优选至少89%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更 优选至少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少 98%,至少99%或甚至100%同一性的同一性程度,所述多核苷酸编码活性多肽。 修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为 必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些 工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适pH等方 面不同的人工变体。可以在作为SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7, SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编 码序列存在的核苷酸序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建 变体序列:所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列,但是符合意欲 产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸 取代的概述,参见,例如,Ford等,1991,Protein Expression and Purification 2:95- 107。 对于本领域技术人员显而易见的是,这些取代能够在对于分子功能重要的区域之 外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的 并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,如定位诱变或丙氨 酸分区诱变法(参见,例如,Cunningham和Wells,1989,见上)来鉴定。在后一技术中,将突变 引入到分子中的每个荷正电的残基处,并且测试所得突变分子的葡糖淀粉酶活性,以鉴定 对于所述分子的活性关键的氨基酸残基。底物-酶相互作用的位点也能够通过分析三维结 构测定,通过如核磁共振分析、晶体学或光亲和标记这样的技术来测定(参见,例如,de Vos 等,1992,见上;Smith等,1992,见上;Wlodaver等,1992,见上)。 本发明还涉及编码本发明多肽的分离的多核苷酸,所述分离的多核苷酸在非常低 严格条件下,优选低严格条件,更优选中严格条件,更优选中-高严格条件,甚至更优选高严 格条件,并且最优选非常高的严格条件下,与以下杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列,(ii)包含SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多 肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链,或它们的等位变体和亚序 列(Sambrook等,1989,同上),如本文所定义的。优选地,互补链是SEQ ID NO:1,SEQ ID NO: 3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15 或SEQ ID NO:17的成熟多肽编码序列的全长互补链。 本发明还涉及通过如下获得的分离的多核苷酸:(a)在非常低、低、中、中-高、高或 非常高严格条件下,将DNA的群体与以下杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO: 5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO: 17的成熟多肽编码序列,(ii)包含SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7, SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编 码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;和(b)分离杂交的多核苷酸,其 编码具有葡糖淀粉酶活性的多肽。优选地,所述互补链是SEQ ID NO:1,SEQ ID NO:3,SEQ 18 CN 111593035 A 说 明 书 16/37 页 ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的全长互补链。 杂合酶 本发明还涉及杂合酶,其包含具有酶活性(例如淀粉降解酶活性,如α-淀粉酶, amylopullulanase,β-淀粉酶,CGT酶,葡糖淀粉酶,异淀粉酶,产麦芽糖淀粉酶或支链淀粉 酶(pullulanase)活性)的催化域,和糖结合模块(CBM)。该杂合酶可进一步包含接头。 所述杂合体可通过将编码催化域的第一DNA序列和编码糖结合模块的第二DNA序 列融合来产生,或该杂合体可基于对合适的CBM、接头和催化域的氨基酸序列的知识作为完 全合成基因来产生。 术语“杂合酶”(亦称作“融合蛋白”,“杂合体”,“杂合多肽”或“杂合蛋白”)在本文 中用于表征本发明的杂合多肽,其包含具有酶活性(例如淀粉降解酶活性,如α-淀粉酶, amylopullulanase,β-淀粉酶,CGT酶,葡糖淀粉酶,异淀粉酶,产麦芽糖淀粉酶或支链淀粉 酶活性)的催化域和糖结合模块,其中所述催化域和所述糖结合模块来自不同来源。术语 “来源”包括但不限于包含合适的催化模块和/或合适的CBM和/或合适的接头的亲本酶或其 变体,例如淀粉酶或葡糖淀粉酶,或其他催化活性。然而,CBM亦可来源于不具有催化活性的 多肽。催化域和糖结合模块可来源于相同的微生物菌株,来源于相同物种中的菌株,来源于 紧密联系的物种或较疏联系的生物。优选地,杂合体催化域和糖结合模块来源于不同来源, 例如来自相同菌株和/或菌种的不同酶,或例如来自不同菌种中的菌株。 在一个方面,杂合酶包含本发明的CBM(亦称作糖结合域或CBD)和催化域。在具体 实施方案中,催化域是葡糖淀粉酶催化域。 核酸构建体 本发明还涉及包含本发明的分离的多核苷酸的核酸构建体,所述分离的多核苷酸 与一个或多个(几个)调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调 控序列相容的条件下指导编码序列的表达。 可以用许多方式操作编码本发明多肽的分离的多核苷酸以供多肽的表达。依赖于 表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用 重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。 调控序列可以是适当的启动子序列,其是由用于表达编码本发明多肽的多核苷酸 的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子 可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的和杂合 的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。 用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例 是从下列酶的基因获得的启动子:黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、米曲霉 TAKA淀粉酶、泡盛曲霉或黑曲霉葡糖淀粉酶(glaA)、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异 构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/ 56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、曼赫根 毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、曼赫根毛霉脂肪酶、里氏木霉β-葡糖苷酶、里 氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉 内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡 19 CN 111593035 A 说 明 书 17/37 页 聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启 动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和 它们的突变的、截短的和杂合的启动子。 在酵母宿主中,有用的启动子从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、 酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、 酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激 酶。对于酵母宿主细胞有用的其它启动子由Romanos等,1992,Yeast 8:423-488描述。 调控序列也可以是合适的转录终止子序列,其是由宿主细胞识别以终止转录的序 列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选 宿主细胞中有功能的任何终止子用在本发明中。 对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:构巢曲霉邻氨基苯甲 酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋 白酶。 对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒 酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞有用的其它终 止子由Romanos等,1992,见上描述。 调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译 区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中 有功能的任何前导序列用在本发明中。 对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶 和构巢曲霉丙糖磷酸异构酶。 对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶 (ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷 酸脱氢酶(ADH2/GAP)。 调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3’末端可操作地连接的 序列,并且在转录时,宿主细胞将其识别为向转录的mRNA添加聚腺苷残基的信号。可以将在 所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。 对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:构巢曲霉邻 氨基苯甲酸合酶、黑曲霉α-葡糖苷酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋 白酶样蛋白酶。 对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Molecular Cellular Biology 15:5983-5990描述。 调控序列还可以是信号肽编码序列,其编码与多肽的氨基末端相连的氨基酸序 列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信 号肽编码序列,该信号肽编码序列与编码分泌多肽的编码序列区段一起天然地连接在翻译 阅读框中。或者,编码序列5’端可含有对于所述编码序列为外源的信号肽编码序列。外源信 号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者,外源信号肽 编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而,指导表达的多肽 进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码序列可在本发明中 20 CN 111593035 A 说 明 书 18/37 页 使用。 对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽 编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素 酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。 同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。 调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或 关闭的那些系统。原核系统中的调节系统包括lac、tac、xyl和trp操纵基因系统。在酵母中, 可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖 淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许 基因扩增的序列。在真核系统中,这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩 增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这 些情况下,编码多肽的核苷酸序列与调节序列可操作地连接。 表达载体 本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子 和转录和翻译终止信号。本文所述的多种核酸和调控序列可以结合在一起以产生重组表达 载体,所述表达载体可以包括一个或多个(几个)方便的限制位点以允许在这些位点插入或 取代编码多肽的核苷酸序列。可供选择的是,可以通过在适当的用于表达的载体中插入包 含所述序列的核苷酸序列或核酸构建体来表达本发明的多核苷酸序列。在制备表达载体的 过程中,将编码序列置于载体中,从而将该编码序列与适当的表达用调控序列可操作地连 接。 重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步 骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿 主细胞的相容性。载体可以是线状或闭合环状质粒。 载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独 立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。 载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细 胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单 独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整 DNA(total DNA),或可以使用转座子(transposon)。 本发明的载体优选地含有一个或多个(几个)选择性标记,其允许简单选择经转 化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的 抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。 用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨 酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移 酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶) (orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲 酸合酶(anthranilate synthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲 霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。 本发明的载体优选含有元件,其允许载体整合入宿主细胞基因组或允许载体在细 21 CN 111593035 A 说 明 书 19/37 页 胞中独立于基因组自主复制。 为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过 同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸 序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精 确位置整合的可能性,整合元件应优选含有足够数量的核酸,如100至10,000碱基对,优选 400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度同一 性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列 同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同 源重组整合到宿主细胞的基因组中。 为了自主复制,载体可以还包含复制起点,其使载体能够在所述的宿主细胞中自 主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发 挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体体内复制的核苷 酸序列。 在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene 98: 61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。分离AMA1 基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。 可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。 多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞 基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂 (selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,从而也含有 多核苷酸的额外拷贝的细胞。 用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知 的(参见,例如,Sambrook等,1989,见上)。 宿主细胞 本发明还涉及重组宿主细胞,其包含本发明的分离的多核苷酸,将所述重组宿主 细胞有利地用于多肽的重组产生。将包含本发明的多核苷酸的载体引入宿主细胞从而将所 述载体作为染色体整合体或作为自复制的染色体外载体保持,如前文所述。术语“宿主细 胞”包含亲本细胞的任何子代,其因为在复制过程中发生的突变而与该亲本细胞不同。宿主 细胞的选择在很大程度上会依赖于编码多肽的基因及其来源。 宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如,原核或真 核细胞。 原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包 括但不限于,芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、地 芽孢杆菌属(Geobacillus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、海洋芽 孢杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)和 链霉菌属(Streptomyces)。革兰氏阴性细菌包括但不限于,大肠杆菌、弯曲杆菌属 (Campylobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属 (Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、假单胞菌属 (Pseudomonas)、沙门氏菌属(Salmonella)和脲原体属(Ureaplasma)。 22 CN 111593035 A 说 明 书 20/37 页 宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。 优选地,宿主细胞是真菌细胞。“真菌”用在本文包括以下门:子囊菌门 (Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门 (Zygomycota)(如由Hawksworth等,于Ainsworth and Bisby’s Dictionary of The Fungi,第八版,1995,CAB International,University Press,Cambridge,UK中所定义)以 及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子 真菌(mitosporic fungi)(Hawksworth等,1995,见上)。 在一个更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵 母(a s c o s p o r o g e n o u s y e a s t) (内孢霉目 (End o m y c e ta l e s) )、产担子酵母 (basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti) (芽孢纲 (Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,会将酵母定义 为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,和Davenport, R.R.编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。 在一个甚至更加优选的方面,酵母宿主细胞是假丝酵母属(Candida)、汉逊酵母属 (Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属 (Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)细胞。 在一个最优选的方面 ,酵母宿主细胞是卡尔酵母 (S a c c h a r o m y c e s carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces o v i f o r m i s) 细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维酵母 (Kluyveromyces lactis)细胞。在另一个最优选的方面,酵母宿主细胞是解脂西洋蓍霉 (Yarrowia lipolytica)细胞。 在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门 (Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。 丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚 糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需 氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而 碳分解代谢可以是发酵的。 在一个甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属(Acremonium)、曲霉 属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、Ceriporiopsis、 金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属 (Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属 (Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属 (Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属 (Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属 (Piromyces)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、 嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属 (Trametes)或木霉属(Trichoderma)细胞。 23 CN 111593035 A 说 明 书 21/37 页 在一个最优选的方面,丝状真菌宿主细胞是泡盛曲霉(Aspergillus awamori)、臭 曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)或米曲霉 (Aspergillus oryzae)细胞。在另一个最优选方面,丝状真菌宿主细胞是杆孢状镰孢 (Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、 禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢 (Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、 粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides) 或镶片镰孢细胞(Fusarium venenatum)。在另一个最优选的方面,丝状真菌宿主细胞是黑 刺烟管菌(Bjerkandera adusta)、Ceriporiopsis aneirina、Ceriporiopsis caregiea、 Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、 Ceriporiopsis subrufa、Ceriporiopsis subvermispora、Chrysosporium inops、嗜角质 金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、 Chrysosporium merdarium、毡金孢子菌(Chrysosporium pannicola)、Chrysosporium queenslandicum、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium zonatum、灰 盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉 (Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉 (Penicillium purpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、辐射射脉菌 (Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳(Thielavia terrestris)、Trametes versicolor、Trametes villosa、哈茨木霉(Trichoderma ha rzia num)、康宁木霉(Trichod e rma koning ii)、长枝木霉(Trichod e rma longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)细 胞。 可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本 身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 0238 023和 Yelton等,1984,Proceedings of the National Academy of Sciences USA 81:1470- 1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene 78:147-156和 WO96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker和Guarente,于 Abelson,J.N .和Simon,M.I .编,Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology,194,182-187,Academic Press,Inc.,New York;Ito等,1983, Journal of Bacteriology153:163;和Hinnen等,1978,Proceedings of the National Academy of Sciences USA 75:1920。 产生方法 本发明还涉及产生本发明多肽的方法,其包括:(a)在有助于产生多肽的条件下培 养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。优选地,所述细胞是 24 CN 111593035 A 说 明 书 22/37 页 粘褶菌属的。在一个更优选的方面,所述细胞是篱边粘褶菌(Gloeophyllum sepiarium)、密 粘褶菌(Gloeophyllum trabeum)或冷杉粘褶菌(Gloeophyllum abietinum)。 本发明还涉及产生本发明的多肽的方法,其包括:(a)在有助于产生多肽的条件下 培养如本文所述的重组宿主细胞;和(b)回收所述多肽。 本发明还涉及产生本发明的多肽的方法,包括:(a)在有助于产生多肽的条件下培 养重组宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQ ID NO:1,SEQ ID NO: 3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15 或SEQ ID NO:17的成熟多肽编码序列中具有至少一个突变,其中所述突变核苷酸序列编码 多肽,所述多肽包含或组成为SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽,和(b) 回收所述多肽。 在本发明的产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培 养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下 进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料 分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所 述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据 公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养 基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中,其能够从细胞裂 解物(lysate)回收。 可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法 可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzyme assay)可 用于测定如本文所述的多肽的活性。 所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养 培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。 本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述 方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例 如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参 见,例如,Protein Purification,J.-C .Janson和Lars Ryden编,VCH Publishers,New York,1989)。 植物 本发明还涉及植物,例如,转基因植物、植物部分或植物细胞,其包含分离的多核 苷酸,所述多核苷酸编码本发明具有葡糖淀粉酶活性的多肽,从而以可回收的量表达和产 生所述多肽。多肽可从植物或植物部分回收。或者,同样可以将含有该重组多肽的植物或植 物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性 质(rheological properties),或用于破坏抗营养因子。 转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物 的实例是草(grasses),如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属 (Poa));饲用牧草(forage grass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草 (temperate grass),如Agrostis(翦股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻 25 CN 111593035 A 说 明 书 23/37 页 (rice)、高粱和玉蜀黍(maize)(玉米)。 双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃 薯,糖甜菜(sugar beet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植 物(十字花科(family Brassicaceae)),如花椰菜(cauliflower),油菜籽(rape seed)和紧 密相关的模型生物体拟南芥(Arabidopsis thaliana)。 植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实 (fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮 (epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vascular tissue)、分 生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外 体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细 胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为 是植物部分。同样地,植物部分,如为了促进本发明的应用而分离的具体组织和细胞也被认 为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seed coat)。 同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的子代。 表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言 之,通过如下方法构建所述植物或植物细胞:将编码本发明多肽的一个或多个(几个)表达 构建体并入植物宿主基因组或叶绿体基因组,并且将所得的修饰植物或植物细胞繁殖为转 基因植物或植物细胞。 表达构建体便利地是包含编码本发明多肽的多核苷酸的核酸构建体,所述多核苷 酸与在选择的植物或植物部分中表达该核苷酸序列所需的适当的调节序列可操作地连接。 此外,表达构建体可以包含对于鉴定在其中整合了该表达构建体的宿主细胞有用的选择性 标记和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。 调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举 例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码本发明多肽的基因的表 达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶 向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,Plant Physiology 86:506所述。 对于组成性表达,可以使用35S-CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck 等,1980,Cell 21:285-294,Christensen等,1992,Plant Mo.Biol.18:675-689;Zhang等, 1991,Plant Cell 3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storage sink tissue)例如种子、马铃薯块茎和果实的启动子(Edwards&Coruzzi,1990, Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolic sink tissue)例如分生组织 的启动子(Ito等,1994,Plant Mol.Biol.24:863-878),种子特异性启动子诸如来自稻的谷 蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu 等,1998,Plant and Cell Physiology 39:885-889),来自豆球蛋白(legumin)B4和蚕豆 (Vicia faba)的未知种子蛋白基因的蚕豆启动子(Conrad等,1998,Journal of Plant Physiology 152:708-711)、来自种子油体蛋白(oil body protein)的启动子(Chen等, 1998,Plant and Cell Physiology 39:935-941),来自欧洲油菜(Brassica napus)的贮藏 蛋白napA启动子,或本技术领域公知的任何其它种子特异性的启动子,例如,在WO 91/ 26 CN 111593035 A 说 明 书 24/37 页 14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子 (Kyozuka等,1993,Plant Physiology 102:991-1000),小球藻病毒(chlorella virus)腺 嘌呤甲基转移酶(adenine methyltransferase)基因启动子(Mitra和Higgins,1994,Plant Molecular Biology 26:85-93),或来自稻的aldP基因启动子(Kagaya等,1995,Molecular and General Genetics 248:668-674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等, 1993,Plant Molecular Biology 22:573-588)。同样地,所述启动子可通过非生物的处理 诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的 物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(plant hormones)如乙烯、脱落酸 (abscisic acid)和赤霉酸(gibberellic acid),和重金属。 启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如,启动 子增强子元件可以是内含子,其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu 等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。 选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。 将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土 壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒 子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science 244:1293;Potrykus,1990,Bio/ Technology8:535;Shimamoto等,1989,Nature 338:274)。 目前,根癌土壤杆菌(Agrobacterium tumefaciens)介导的基因转移(gene transfer),是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort, 1992,Plant Molecular Biology 19:15-38),而且它也可以用于转化单子叶植物,虽然对 于这些植物常常使用其它的转化方法。目前,产生转基因单子叶植物的优选的方法,是用粒 子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryonic calli)或发育中的 胚(developing embryos)(Christou,1992,Plant Journal2:275-281;Shimamoto,1994, Current Opinion Biotechnology 5:158-162;Vasil等,1992,Bio/Technology 10:667- 674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omirulleh等,1993, Plant Molecular Biology 21:415-428所描述的。 转化之后,根据本领域熟知的方法选择并入了表达构建体的转化体并且再生成为 完整植株。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选 择基因:例如,使用带有两种独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性 地切除选择基因。 本发明还涉及产生本发明多肽的方法,其包括:(a)在有助于产生多肽的条件下培 养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码本发明具有葡糖淀粉酶活性 的多肽;和(b)回收所述多肽。 组合物 本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富含此种多肽。术 语“富含”表明组合物的葡糖淀粉酶活性例如以至少1.1的富集因子增加。 所述组合物可包含本发明的多肽作为主要酶组分,例如,单组分组合物。或者,所 述组合物可包含多种酶活性,如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多 糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡 27 CN 111593035 A 说 明 书 25/37 页 糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、 氧化酶、果胶水解酶、肽谷氨酰胺酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核 酸酶、转谷氨酰胺酶或木聚糖酶。其他酶可由例如属于下述属的微生物产生:曲霉属,优选 棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选 杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰 孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或 镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉,康宁木 霉,长枝木霉,里氏木霉或绿色木霉。 多肽组合物可依照本领域中已知的方法制备,并可为液体或干组合物形式。举例 而言,所述多肽组合物可为颗粒或微颗粒的形式。待包含于组合物中的多肽可依照本领域 已知方法稳定化。 下文给出了本发明多肽组合物优选用途的实例。本发明的多肽组合物的剂量和其 他使用组合物的条件可根据本领域已知方法确定。 葡糖淀粉酶和酸性α-淀粉酶的组合 根据本发明的该方面,本发明的葡糖淀粉酶可以与α-淀粉酶组合,优选与酸性α- 淀粉酶以0.3至5.0AFAU/AGU的比例组合。更优选地,酸性α-淀粉酶活性和葡糖淀粉酶活性 之间的比例为至少0.35,至少0.40,至少0.50,至少0.60,至少0.7,至少0.8,至少0.9,至少 1.0,至少1.1,至少1.2,至少1.3,至少1.4,至少1.5,至少1.6,至少1.7,至少1.8,至少1.85, 或甚至至少1.9AFAU/AGU。然而,酸性α-淀粉酶活性和葡糖淀粉酶活性之间的比例应优选为 少于4.5,少于4.0,少于3.5,少于3.0,少于2.5,或甚至少于2.25AFAU/AGU。以AUU/AGI计,酸 性α-淀粉酶和葡糖淀粉酶的活性优选以0.4至6.5AUU/AGI之间的比例存在。更优选地,酸性 α-淀粉酶活性和葡糖淀粉酶活性之间的比例为至少0.45,至少0.50,至少0.60,至少0.7,至 少0.8,至少0.9,至少1.0,至少1.1,至少1.2,至少1.3,至少1.4,至少1.5,至少1.6,至少 1.7,至少1.8,至少1.9,至少2.0,至少2.1,至少2.2,至少2.3,至少2.4,或甚至至少2.5AUU/ AGI。然而,酸性α-淀粉酶活性和葡糖淀粉酶活性之间的比例优选少于6.0,少于5.5,少于 4.5,少于4.0,少于3.5,或甚至少于3.0AUU/AGI。 [0200] 上述组合物适用于下文提及的供产生糖浆和发酵产物如乙醇的淀粉转化工艺。 [0201] 下文给出了本发明多肽组合物优选用途的实例。本发明的多肽组合物的剂量和其 他使用组合物的条件可根据本领域已知方法确定。 [0202] 用途 [0203] 本发明还涉及使用本发明具有葡糖淀粉酶活性的多肽的工艺/方法。 [0204] 根据本发明的用途包括将淀粉淀粉转化为例如糖浆和发酵产物,包括乙醇和饮 料。其中可使用本发明的葡糖淀粉酶的工艺的实例包括描述于WO 92/20777,WO 03/ 066816,WO 03/066826,WO2004/080923和WO 2004/081193的那些,其均通过提述并入本文。 [0205] 发酵产物的产生 [0206] 自经糊化的含淀粉材料中产生发酵产物的工艺 [0207] 在此方面,本发明涉及自含淀粉材料产生发酵产物(特别是乙醇)的工艺,所述工 艺包括液化步骤,以及顺序或同时进行的糖化和发酵步骤。 [0208] 本发明涉及自含淀粉材料产生发酵产物的工艺,包括下述步骤: 28 CN 111593035 A 说 明 书 26/37 页 [0209] (a)液化含淀粉材料,优选使用α-淀粉酶; [0210] (b)使用本发明的葡糖淀粉酶糖化步骤(a)中获得的经液化的材料;和 [0211] (c)使用发酵生物发酵经糖化的材料。 [0212] 发酵产物,如特别是乙醇,可任选地在发酵后回收,例如,通过蒸馏进行。合适的含 淀粉的起始材料列于下面“含淀粉材料”部分。涵盖的酶列于下面“酶”部分。液化优选在α- 淀粉酶存在的条件下进行。发酵优选在酵母,优选酵母属菌株存在下。合适的发酵生物列于 下文“发酵生物”部分。在优选的实施方案中,步骤(b)和(c)顺序或同时进行(即,作为SSF工 艺)。 [0213] 在一个特定的实施方案中,本发明的工艺在步骤(a)之前还包括下述步骤: [0214] x)减小含淀粉材料的粒度,优选通过磨制;和 [0215] y)形成包含含淀粉材料和水的浆料。 [0216] 含水浆料可含有10-40wt%,优选25-35wt%的含淀粉材料。将浆料加热到糊化温 度以上,并可添加α-淀粉酶,优选细菌和/或酸性真菌α-淀粉酶以起始液化(稀化 (thinning))。在一个实施方案中,在进行本发明步骤(a)中的α-淀粉酶处理前,浆料可经喷 射蒸煮(jet-cooked)以进一步使浆料糊化。 [0217] 更具体而言,液化过程可作为三步热浆工艺来进行。将浆料加热至60-95℃,优选 80-85℃,并添加α-淀粉酶以起始液化(稀化)。然后可将浆料在95-140℃,优选105-125℃的 温度喷射蒸煮1-15分钟,优选3-10分钟,特别是约5分钟。使浆料冷却至60-95℃并添加更多 的α-淀粉酶以完成水解(二次液化)。液化工艺通常在pH 4.5至6.5,特别是在pH 5至6进行。 磨制和液化的全谷物称作醪液(mash)。 [0218] 步骤(b)中的糖化可使用本领域众所周知的条件进行。举例而言,完全的糖化工艺 可持续约24至约72小时,然而,通常仅在30-65℃,通常约60℃的温度进行通常40-90分钟的 预糖化,然后是在同时发酵和糖化工艺(SSF工艺)中在发酵过程中的完全糖化。糖化通常在 30-65℃,通常约60℃的温度,在约pH 4-5的pH,通常在约pH 4.5进行。 [0219] 发酵产物,特别是乙醇生产中最广泛使用的工艺为同时糖化和发酵(SSF)工艺,其 中对糖化没有保持阶段,意思是发酵生物(如酵母)和酶可一起添加。SSF通常在25℃至40 ℃,如29℃至35℃,如30℃至34℃,优选约32℃的温度进行。根据本发明,可在发酵过程中向 上或向下调整温度。 [0220] 根据本发明,发酵步骤(c)包括但不限于用于产生醇类(例如,乙醇、甲醇、丁醇); 有机酸(例如,柠檬酸、乙酸、衣康酸、乳酸、葡糖酸);酮类(例如,丙酮);氨基酸(例如,谷氨 酸);气体(例如,H2和CO2);抗生素(例如,青霉素和四环素);酶;维生素(例如,核黄素、B12、 β-胡萝卜素);以及激素的发酵工艺。优选的发酵工艺包括醇发酵工艺,如本领域公知。优选 的发酵工艺为厌氧发酵工艺,如本领域公知。 [0221] 自未糊化的含淀粉材料产生发酵产物的方法 [0222] 在此方面,本发明涉及自含淀粉材料产生发酵产物,而无含淀粉材料的糊化(即无 烹制的含淀粉材料)的工艺。在一个实施方案中,在发酵和糖化过程中仅使用本发明的葡糖 淀粉酶。根据本发明,可产生期望的发酵产物,如乙醇,而不液化含有含淀粉材料的含水浆 料。在一个实施方案中,本发明的方法包括在糊化温度以下,在本发明的葡糖淀粉酶的存在 下对(经磨制的)含淀粉材料,例如粒状淀粉进行糖化以产生糖类,所述糖类可由合适的发 29 CN 111593035 A 说 明 书 27/37 页 酵生物发酵成期望的发酵产物。 [0223] 因此,在此方面,本发明涉及用于自含淀粉材料产生发酵产物的工艺,包括: [0224] (a)在所述含淀粉材料的起始糊化温度以下的温度用本发明的、优选具有SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸18至573或者SEQ ID NO:16或SEQ ID NO:18的氨基酸18至576的成熟葡糖淀 粉酶或与其具有至少82%同一性的葡糖淀粉酶,来糖化含淀粉材料; [0225] (b)使用发酵生物进行发酵。 [0226] 本发明的工艺的步骤(a)或(b)可顺序或同时进行。在一个实施方案中,在步骤(a) 之前制备包含水和含淀粉材料的浆料。 [0227] 所述发酵工艺可进行1至250小时,优选25至190小时,更优选30至180小时,更优选 40至170小时,甚至更优选50至160小时,还更优选60至150小时,甚至还更优选70至140小 时,并且最优选80至130小时的期间。 [0228] 术语“起始糊化温度”意指淀粉发生糊化的最低温度。在水中加热的淀粉在50℃至 75℃开始糊化;糊化的准确温度取决于特定的淀粉,并可方便的由本领域技术人员确定。从 而,起始糊化温度可根据植物物种,植物物种的特定品种以及生长条件而改变。在本发明的 上下文中,给定含淀粉材料的起始糊化温度为使用由Gorinstein和Lii Starch/ 44 (12):461-466(1992)描述的方法5%的淀粉颗粒丧失双折射的温度。 [0229] 在步骤(a)之前,可制备含淀粉材料,如粒状淀粉的浆料,其具有10-55wt%含淀粉 材料的干固体,优选25-40wt%干固体,更优选30-35%干固体。浆料可包含水分和/或工艺 水(process water),例如釜馏物(逆流(backset))、洗涤水(scrubber water)、蒸发器冷凝 液或馏出物、来自蒸馏的侧线汽提器水(side-stripper water)或其他发酵产物设备 (plant)的工艺水。由于本发明的方法在糊化温度以下进行,因此不发生显著的粘度增加, 如果需要,可使用高水平的釜馏物。在一个实施方案中,含水浆料包含约1至约70vol%釜馏 物,优选15-60vol%釜馏物,特别为约30至50vol%釜馏物。 [0230] 可通过优选以干磨或湿磨将其粒度减小到0.05至3.0mm,优选0.1至0.5mm来制备 含淀粉材料。在进行本发明的工艺后,含淀粉材料的至少85%,至少86%,至少87%,至少 88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%, 至少97%,至少98%,或者优选至少99%的干固体转化为可溶的淀粉水解物。 [0231] 本发明的工艺在低于起始糊化温度的温度进行。优选地,步骤(a)进行的温度为30 至75℃,优选45至60℃。 [0232] 在一个优选实施方案中,步骤(a)和步骤(b)作为顺序或同时糖化和发酵工艺进 行。在此种优选的实施方案中,该工艺通常在25至40℃,如29至35℃,如30℃至34℃,如约32 ℃的温度进行。根据本发明在发酵过程可向上或向下调整温度。 [0233] 在一个实施方案中,进行同时糖化和发酵从而使得糖水平,如葡萄糖水平保持在 低水平,如6wt%以下,优选约3wt%以下,优选约2wt%以下,更优选约1wt%以下,甚至更优 选约0.5%以下或甚至更优选0.25wt%以下,如约0.1wt%以下。所述低水平的糖可通过简 单的使用经调整量的酶和发酵生物来实现。本领域技术人员可方便地确定使用的酶和发酵 生物的量。酶和发酵生物的使用量也可经选择以保持麦芽糖在发酵液中的低浓度。举例而 言,麦芽糖水平可保持为约0.5wt%以下,或约0.2wt%以下。 30 CN 111593035 A 说 明 书 28/37 页 [0234] 本发明的方法可在pH 3至7,优选pH 3.5至6,或更优选pH 4至5的范围进行。 [0235] 含淀粉材料 [0236] 根据本发明,可使用任何合适的含淀粉的起始材料,包括粒状淀粉。所述起始材料 通常基于期望的发酵产物而选择。适用于本发明工艺的含淀粉的起始材料的实例包括块 茎、根、茎、全谷粒、玉米、玉米穗轴、小麦、大麦、黑麦、买罗高粱、西米、木薯、树薯、高粱、稻、 豌豆(pea)、豆(bean)或甘薯,或它们的组合,或谷类,含糖原材料如糖蜜,果物材料,甘蔗或 甜菜,马铃薯,以及含纤维素材料,如木质或植物残余物,或其组合。涵盖蜡质和非蜡质两者 类型的玉米和大麦。 [0237] 术语“粒状淀粉”意指未烹制的生淀粉,即,以其天然形式存在于谷类、块茎或谷粒 中的淀粉。淀粉在植物细胞中作为微小的不溶于水的颗粒形成。当置于冷水中时,淀粉颗粒 可吸收少量液体并膨胀(swell)。在高至50℃至75℃的温度,膨胀可为可逆的。然而,在更高 温度开始称为“糊化”的不可逆膨胀。待加工的粒状淀粉可为高度精制的淀粉质量,优选至 少90%,至少95%,至少97%或至少99.5%纯,或者其可为更加粗制的含淀粉材料,其含有 包括非淀粉部分(例如胚残余物和纤维)的经磨制的全谷粒。原材料(如全谷粒)经磨制以打 开其结构并允许进一步的加工。根据本发明优选两种磨制工艺,湿磨和干磨。在干磨中,将 整粒磨碎并使用。湿磨给出胚和粗粉(淀粉颗粒和蛋白质)的良好分离,并通常用于使用淀 粉水解物产生糖浆的场合。干磨和湿磨在淀粉加工领域都是众所周知的,并等同地涵盖于 本发明的工艺中。 [0238] 所述含淀粉材料优选通过干磨或湿磨减小粒度以暴露更多表面区域。在一个实施 方案中,粒度为约0.05至3.0mm,优选0.1至0.5mm,或使得至少30%,优选至少50%,更优选 至少70%,甚至更加优选至少90%的含淀粉材料可穿过具有0.05至3.0mm筛网,优选0.1至 0.5mm筛网的筛。 [0239] 发酵产物 [0240] 术语“发酵产物”意指使用发酵生物通过包括发酵步骤的工艺生成的产物。根据本 发明所包括的发酵产物包括醇类(例如,乙醇、甲醇、丁醇);有机酸(例如,柠檬酸、乙酸、衣 康酸、乳酸、葡糖酸);酮类(例如,丙酮);氨基酸(例如,谷氨酸);气体(例如,H2和CO2);抗生 素(例如,青霉素和四环素);酶;维生素(例如,核黄素、B12、β-胡萝卜素);以及激素。在一个 优选实施方案中,所述发酵产物是乙醇,例如,燃料乙醇;饮用乙醇(即,可饮用的中性酒); 或工业乙醇或用于可饮用醇类工业(例如,啤酒和葡萄酒)、乳制品工业(例如,发酵的乳制 品)、皮革工业和烟草工业的产物。优选的啤酒类型包括爱儿啤酒(ale)、烈性啤酒(stout)、 钵尔透黑啤酒(porters)、陈贮啤酒(lagers)、苦味酒(bitters)、麦芽酒(malt liquors)、 发泡酒(happoushu)、高醇啤酒(high-alcohol beer)、低醇啤酒(low-alcohol beer)、低热 量啤酒(low-calorie beer)或清淡啤酒(light beer)。使用的优选发酵工艺包括醇发酵工 艺,如本领域公知。优选的发酵工艺为厌氧发酵工艺,如本领域公知。 [0241] 发酵生物 [0242] “发酵生物”指任何适用于发酵工艺并能够产生所需的发酵产物的生物,包括细菌 和真菌生物。特别合适的发酵生物能够将糖如葡萄糖或麦芽糖直接或间接发酵(即转化)为 所需的发酵产物。发酵生物的实例包括真菌生物,如酵母。优选的酵母包括酵母属菌种的菌 株,特别是酿酒酵母。商业上可获得的酵母包括例如Red StarTM/Lesaffre Ethanol Red(可 31 CN 111593035 A 说 明 书 29/37 页 从Red Star/Lesaffre ,USA获得)FALI(可从Burns Philp Food Inc .,USA的分支机构 Fleischmann’s Yeast获得),SUPERSTART(可从Alltech获得),GERT STRAND(可从Gert Strand AB,Sweden获得)和FERMIOL(可从DSM Specialties获得)。 [0243] 酶 [0244] 葡糖淀粉酶 [0245] 葡糖淀粉酶优选为本发明的葡糖淀粉酶。然而如上所述,本发明的葡糖淀粉酶亦 可与其他葡糖淀粉酶组合。术语“葡糖淀粉酶”(1,4-α-D-葡聚糖葡糖水解酶,EC 3.2.1.3) 是催化D-葡萄糖从淀粉或相关的寡糖和多糖分子的非还原端释放的酶。 [0246] 葡糖淀粉酶可以以0.001至10AGU/g DS,优选0.01至5AGU/g DS,如大约0.1,0.3, 0.5,1或2AGU/g DS,特别是0.1至0.5AGU/g DS或0.02-20AGU/g DS,优选0.1-10AGU/g DS的 量添加。 [0247] α-淀粉酶 [0248] 根据本发明α-淀粉酶可为任何来源的。优选真菌或细菌来源的α-淀粉酶。 [0249] 在一个优选实施方案中,所述α-淀粉酶是酸性α-淀粉酶,例如真菌酸性α-淀粉酶 或细菌酸性α-淀粉酶。术语“酸性α-淀粉酶”意指以有效量添加、在pH范围3至7,优选3.5至 6,或更优选4至5具有最优活性的α-淀粉酶(EC 3.2.1.1)。 [0250] 细菌α-淀粉酶 [0251] 根据本发明,细菌α-淀粉酶优选来源于芽孢杆菌属。 [0252] 在一个优选实施方案中,所述芽孢杆菌属α-淀粉酶来源于地衣芽孢杆菌、解淀粉 芽孢杆菌、枯草芽孢杆菌或嗜热脂肪芽孢杆菌的菌株,但亦可来源于其他芽孢杆菌菌种。涵 盖的α-淀粉酶的具体实例包括示于WO 99/19467中SEQ ID NO:4的地衣芽孢杆菌α-淀粉酶 (BLA),示于WO 99/19467中SEQ ID NO:5的解淀粉芽孢杆菌α-淀粉酶(BAN),和示于WO 99/ 19467中SEQ ID NO:3的嗜热脂肪芽孢杆菌α-淀粉酶(BSG)。在一个本发明的实施方案中,所 述α-淀粉酶为分别与WO 99/19467中示为SEQ ID NO:1、2、3、4或5的任何序列具有至少 60%,优选至少70%,更优选至少80%,甚至更优选至少90%,如至少95%,至少96%,至少 97%,至少98%或至少99%同一性的同一性程度的酶。 [0253] 所述芽孢杆菌属α-淀粉酶亦可为变体和/或杂合体,特别是任何WO 96/23873、WO 96/23874、WO 97/41213、WO 99/19467、WO 00/60059和WO 02/10355(所有文献通过提述并 入本文)中所描述的α-淀粉酶。具体而言,涵盖的α-淀粉酶变体公开于美国专利号6,093 , 562、6,187,576和6,297,038(通过提述并入本文),并包括在位置179至182具有一个或两个 氨基酸缺失的嗜热脂肪芽孢杆菌α-淀粉酶(BSGα-淀粉酶)变体,所述缺失优选为WO 96/ 23873中公开的双会从缺失(参见,例如第20页第1-10行,通过提述并入本文),优选与WO 99/19467中公开的示于SEQ ID NO:3的野生型BSGα-淀粉酶氨基酸序列相比对应于delta (181-182),或氨基酸179和180的缺失,其中使用WO 99/19467(通过提述并入本文)中的SEQ ID NO:3为准进行编号。甚至更优选的是与WO 99/19467中公开的示于SEQ ID NO:3的野生 型BSGα-淀粉酶氨基酸序列相比具有对应于delta(181-182)的双重缺失,并进一步包含 N193F取代(亦表示为I181* G182* N193F)的芽孢杆菌α-淀粉酶,特别是嗜热脂肪芽孢杆菌 α-淀粉酶。 [0254] 所述α-淀粉酶亦可为产麦芽糖α-淀粉酶。“产麦芽糖α-淀粉酶”(葡聚糖1,4-α-麦 32 CN 111593035 A 说 明 书 30/37 页 芽水解酶,EC 3.2.1.133)能够将直链淀粉和支链淀粉(amylopectin)水解为α-构型的麦芽 糖。一种来自嗜热脂肪芽孢杆菌菌株NCIB 11837的产麦芽糖α-淀粉酶商业上可从 Novozymes A/S,Denmark获得。产麦芽糖α-淀粉酶描述于美国专利4,598,048、4,604,355和 6,162,628,其通过提述并入本文。 [0255] 细菌杂合α-淀粉酶 [0256] 具体涵盖的杂合α-淀粉酶包含地衣芽孢杆菌α-淀粉酶(示为WO 99/19467中的SEQ ID NO:4)的445个C端氨基酸残基和来源于解淀粉芽孢杆菌(示为WO 99/19467中的SEQ ID NO:3)的37个N端氨基酸残基,并具有一个或多个,特别是所有的下述取代: [0257] G48A T49I G107A H156Y A181T N190F I201F A209V Q264S(使用地衣芽孢杆菌 编号)。亦优选具有一个或多个下述突变(或其他芽孢杆菌属α-淀粉酶骨架中的对应突变) 的变体:H154Y、A181T、N190F、A209V和Q264S,和/或位置176和179之间两个残基的缺失,特 别是缺失E178和G179(使用WO 99/19467的SEQ ID NO:5的编号)。 [0258] 细菌α-淀粉酶亦可以如本领域公知的量添加。当以KNU单位(描述于下文“材料和 方法”部分)测量时,α-淀粉酶活性优选以0.5-5,000NU/g的DS的量,1-500NU/g的DS的量,或 更优选以5-1,000NU/g的DS如10-100NU/g DS的量存在。 [0259] 真菌α-淀粉酶 [0260] 真菌酸性α-淀粉酶包括来源于曲霉属菌株的酸性α-淀粉酶,如川地曲霉、黑曲霉 或米曲霉α-淀粉酶。 [0261] 优选的酸性真菌α-淀粉酶是Fungamyl样α-淀粉酶,其优选来源于米曲霉的菌株。 在本公开中,术语“Fungamyl样α-淀粉酶”指与示于WO 96/23874的SEQ ID NO:10的氨基酸 序列的成熟部分呈现高同一性,即高于70%,高于75%,高于80%,高于85%,高于90%,高 于95%,高于96%,高于97%,高于98%,高于99%或甚至100%同一性的α-淀粉酶。 [0262] 另一种优选的酸性α-淀粉酶来源于黑曲霉菌株。在一个优选实施方案中,所述酸 性真菌α-淀粉酶是来自黑曲霉、作为“AMYA_ASPNG”以初级登录号P56271公开于Swiss- prot/TeEMBL数据库并更具体描述于WO 89/01969(实施例3)的α-淀粉酶。所述酸性黑曲霉 酸性α-淀粉酶在WO 2004/080923(Novozymes)(通过提述并入本文)亦显示于SEQ ID NO:1。 还涵盖了所述酸性真菌淀粉酶与WO 2004/080923中的SEQ ID NO:1具有至少70%同一性, 如至少80%或甚至至少90%同一性,如至少95%,至少96%,至少97%,至少98%,或至少 99%同一性的变体。合适的商业上可获得的来源于黑曲霉的酸性真菌α-淀粉酶为SP288(可 从Novozymes A/S,Denmark获得)。 [0263] 在一个优选实施方案中,所述α-淀粉酶来源于川地曲霉,并公开于Kaneko等 , 1996,J.Ferment.Bioeng.81:292-298“, Molecular-cloning and determination of the nucleotide-sequence of a gene encoding an acid-stable alpha-amylase from Aspergillus kawachii";并进一步作为EMBL:#AB008370公开。 [0264] 所述真菌酸性α-淀粉酶亦可为包含糖结合模块(CBM)和α-淀粉酶催化域的野生型 酶(即,非杂合体),或其变体。在一个实施方案中,所述野生型酸性α-淀粉酶来源于川地曲 霉的菌株。 [0265] 真菌杂合α-淀粉酶 [0266] 在一个优选实施方案中,所述真菌酸性α-淀粉酶是杂合α-淀粉酶。真菌杂合α-淀 33 CN 111593035 A 说 明 书 31/37 页 粉酶的优选实例包括WO 2005/003311或美国申请公开号2005/0054071(Novozymes)或美国 申请号60/638,614(Novozymes)中公开的那些,其通过提述并入本文。杂合α-淀粉酶可包含 α-淀粉酶催化域(CD)和糖结合域/模块(CBM)和任选的接头。 [0267] 涵盖的杂合的α-淀粉酶的具体实例包括美国申请号60/638,614中公开的那些,其 包括具有催化域JA118和罗耳阿太菌(Athelia rolfsii)SBD的Fungamyl变体(美国申请号 60/638,614中的SEQ ID NO:100),具有罗耳阿太菌AMG接头和SBD的微小根毛霉α-淀粉酶 (美国申请号60/638,614中的SEQ ID NO:101),和具有罗耳阿太菌葡糖淀粉酶接头和SBD的 巨多孔菌α-淀粉酶(美国申请号60/638,614中的SEQ ID NO:102)。 [0268] 涵盖的杂合的α-淀粉酶的其他具体实例包括公开于美国申请公开号2005/ 0054071中的那些,包括公开于第15页表3中的那些,如具有川地曲霉接头和淀粉结合域的 黑曲霉α-淀粉酶。 [0269] 商业性α-淀粉酶产品 [0270] 优选的包含α-淀粉酶的商业性组合物包括来自DSM(Gist Brocades)的MYCOLASE, BANTM,TERMAMYLTM SC,FUNGAMYLTM,LIQUOZYMETM X和SANTM SUPER,SANTM EXTRA L(Novozymes A/S)和CLARASETM L-40,000,DEX-LOTM,SPEZYMETM FRED,SPEZYMETM AA,SPEZYMETM Ethyl, GC358,GC980,SPEZYMETM RSL,以及SPEZYMETM DELTA AA(Genencor Int.),以及以商品名 SP288出售的酸性真菌α-淀粉酶(可从Novozymes A/S,Denmark获得)。 [0271] 根据本发明,酸性α-淀粉酶可以以0.1至10AFAU/g DS,优选0.10至5AFAU/g DS,特 别是0.3至2AFAU/g DS的量添加。 [0272] 糖浆的产生 [0273] 本发明还提供了使用本发明的葡糖淀粉酶从含淀粉材料产生糖浆如葡萄糖等的 工艺。合适的起始材料例示于上文的“含淀粉材料”部分。一般而言,所述工艺包括在α-淀粉 酶的存在下部分水解含淀粉材料(液化),然后进一步在本发明的葡糖淀粉酶存在下糖化从 淀粉或相关的寡糖或多糖分子的非还原端释放的葡萄糖的步骤。 [0274] 可如上所述进行液化和糖化以供发酵产物的产生。 [0275] 本发明的葡糖淀粉酶亦可以固定化的形式使用。对于产生特种糖浆,如麦芽糖糖 浆,以及进一步对于涉及果糖糖浆如高果糖糖浆(HFS)的产生的寡糖萃余液流而言,这是合 适并常用的。 [0276] 因此本发明的该方面涉及从含淀粉材料产生糖浆的方法,包括: [0277] (a)在α-淀粉酶存在下液化含淀粉材料,和 [0278] (b)使用本发明的葡糖淀粉酶糖化在步骤(a)中获得的材料。 [0279] 可从步骤(b)中获得的糖化的材料回收糖浆。 [0280] 对于合适条件的细节可见于上文。 [0281] 酿造 [0282] 本发明的葡糖淀粉酶亦可用于酿造工艺。本发明的葡糖淀粉酶以本领域技术人员 容易地确定的有效量添加。 [0283] 本文中所述和要求保护的发明的范围并不受本文中公开的具体实施方案所限,因 为这些实施方案旨在说明本发明的多个方面。旨在将任何等同的实施方案包含于本发明的 范围之内。事实上,根据前述的描述,除了本文中显示和描述的之外,本发明的多种修饰对 34 CN 111593035 A 说 明 书 32/37 页 于本领域技术人员会是显而易见的。亦旨在将此类修饰包含于所附权利要求的范围之内。 在出现冲突时,以包括定义在内的本公开为准。 [0284] 本文中引用了多个参考文献,其公开以全文提述的方式并入本文。本发明进一步 通过下述实施例描述,其不应视作对本发明的范围的限制。 [0285] 材料和方法 [0286] 酵母:可从Red Star/Lesaffre,USA获得的RED STARTM [0287] 培养基和试剂: [0288] 用作缓冲液和底物的化学品为至少试剂级的商品。 [0289] PDA:39g/L Potato Dextrose Agar,20g/L琼脂,50ml/L甘油 [0290] 方法 [0291] 除非另行指明,DNA操作和转化使用Sambrook等(1989)Molecular cloning:A laboratory manual,Cold Spring Harbor lab.,Cold Spring Harbor,NY;Ausubel,F.M. 等(eds .)"Current protocols in Molecular Biology",John Wiley and Sons ,1995; Harwood ,C.R.,和Cutting,S.M.(eds.)"Molecular Biological Methods for Bacillus" .John Wiley and Sons,1990中所述的分子生物学标准方法进行。 [0292] 葡糖淀粉酶活性 [0293] 葡糖淀粉酶活性可用AGI单位或葡糖淀粉酶单位(AGU)测定。 [0294] 葡糖淀粉酶活性(AGI) [0295] 葡糖淀粉酶(等价于淀粉葡糖苷酶)将淀粉转化为葡萄糖。葡萄糖的量在本文中通 过供活性确定的葡萄糖氧化酶方法来确定。该方法描述于“Approved methods of the American Association of Cereal Chemists”.Vol .1-2AACC ,from American Association of Cereal Chemists,(2000);ISBN:1-891127-12-8的部分76-11Starch— Glucoamylase Method with Subsequent Measurement。 [0296] 一个葡糖淀粉酶单位(AGI)为在方法的标准条件下每分钟产生1微摩尔葡萄糖的 酶的量。 [0297] 标准条件/反应条件 [0298] [0299] 所述淀粉应为Litner淀粉,其为在实验室中用作色度指示剂的低粘度淀粉(thin- boiling)。Linter淀粉是通过对天然淀粉进行稀盐酸处理使其保留与碘反应呈蓝色的能力 而获得的。 [0300] 葡糖淀粉酶活性(AGU) [0301] Novo Glucoamylase Unit(AGU)定义为在37℃,pH4.3,底物:麦芽糖23.2mM,缓冲 35 CN 111593035 A 说 明 书 33/37 页 液:乙酸盐0.1M,反应时间5分钟的标准条件下每分钟水解1微摩尔麦芽糖的酶量。 [0302] 可使用自动分析系统。将变旋酶添加到葡萄糖脱氢酶试剂中,使得任何存在的α- D-葡萄糖转化为β-D-葡萄糖。葡萄糖脱氢酶特异性地与β-D-葡萄糖在上述反应中反应,形 成NADH,其使用光度计在340nm处测定作为起始葡萄糖浓度的量度。 [0303] [0304] [0305] [0306] 更详细描述此分析方法的文件夹(EB-SM-0131 .02/01)可根据要求由Novozymes A/S,Denmark得到,其通过提述并入本文。 [0307] α-淀粉酶活性(KNU) [0308] α-淀粉酶活性可使用马铃薯淀粉作为底物来确定。该方法基于酶对于改性马铃薯 淀粉的分解,并通过将淀粉/酶溶液的样本与碘溶液混合来跟踪反应。起初,形成了蓝黑色 (blackish blue),但在淀粉分解过程中,蓝色越来越淡,并逐渐变为红棕色(reddish- brown),将其和有色玻璃标准(colored glass standard)进行比较。 [0309] 一个千Novoα-淀粉酶单位(KNU)定义为在标准条件下(即,在37℃ /-0 .05; 0.0003M Ca2 ;以及pH 5.6)糊精化5260mg的淀粉干底物Merck Amylum Solubile所需的酶 量。 [0310] 更详细描述该分析方法的文件夹EB-SM-0009.02/01可根据要求由Novozymes A/ S,Denmark得到,其通过提述并入本文。 [0311] 酸性α-淀粉酶活性 [0312] 当根据本发明使用时,任何酸性α-淀粉酶的活性可以用AFAU(酸性真菌α-淀粉酶 单位)测量。或者,酸性α-淀粉酶的活性可用AAU(酸性α-淀粉酶单位)测量。 36 CN 111593035 A 说 明 书 34/37 页 [0313] 酸性α-淀粉酶单位(AAU) [0314] 酸性α-淀粉酶活性可用AAU(酸性α-淀粉酶单位)测量,其为绝对方法。一个酸性淀 粉酶单位(AAU)为在标准化条件下每小时将1g的淀粉(100%的干物质)转化为在与已知强 度的碘溶液反应之后在620nm具有与一种色度参照相同的发射(transmission)的产物的 量。 [0315] 标准条件/反应条件: [0316] [0317] 所述淀粉应为Litner淀粉,其为在实验室中用作色度指示剂的低粘度淀粉。 Linter淀粉是通过对天然淀粉进行稀盐酸处理使其保留与碘反应呈蓝色的能力而获得的。 更多细节可见于EP 0140410 B2,其通过提述并入本文。 [0318] 酸性α-淀粉酶活性(AFAU) [0319] 酸性α-淀粉酶活性可以AFAU(酸性真菌α-淀粉酶单位)进行测量,其相对于酶标准 物来确定。1 AFAU定义为在下面提及的标准条件下每小时降解5.260mg淀粉干物质的酶量。 [0320] 酸性α-淀粉酶,其为内切α-淀粉酶(1,4-α-D-葡聚糖-葡糖水解酶,E.C.3.2.1.1) 水解淀粉分子内部区域中的α-1,4-葡糖苷键以形成具有不同链长的寡糖和糊精。与碘形成 的颜色的强度与淀粉浓度成正比。使用反向比色法(reverse colorimetry)在规定的分析 条件下测定淀粉浓度的降低作为淀粉酶活性。 [0321] [0322] 标准条件/反应条件 37 CN 111593035 A 说 明 书 35/37 页 [0323] [0324] 更详细描述该分析方法的文件夹EB-SM-0259.02/01可根据要求由Novozymes A/ S,Denmark得到,其通过提述并入本文。 [0325] 实施例1: [0326] 用篱边粘褶菌AMG的同时糖化和发酵(SSF) [0327] 在不同酶剂量测量了粘褶菌属菌种葡糖淀粉酶的SSF性能。发酵在下述条件下运 行: [0328] 底物:将磨碎的玉米用逆流制浆,并将其干物质调整至大约32%(w/w)。然后将其 在85℃和pH 5.8液化。液化的醪液具有13.4的DE。 [0329] 温度:32℃ [0330] 起始pH:5.0 [0331] 酶剂量:在黑曲霉中以30、40、55和70微克酶蛋白/g DS产生粘褶菌属菌种AMG。将 酶与在相同剂量给药的商业性埃默森踝节菌(Talaromyces emersonii)AMG的纯化样品相 比较。埃默森踝节菌AMG的最高剂量等价于0.56AGU/g DS的产业上有意义的量。使用过量的 商业性AMG和α-淀粉酶制备针对最大可获得的糖化的对照。 [0332] 发酵 [0333] 向对于SSF的底物添加1000ppm尿素作为氮源和3ppm青霉素以控制细菌,用H2SO4将 pH调整至5.0。将5g醪液的等分试样转移至在顶部钻孔以供CO2释放的15ml离心管。添加酶 和酵母,并将试管置于水浴中,在32℃无搅拌放置54小时。 [0334] 在HPLC中分析样品以供确定在发酵过程中产生的乙醇。结果示于下表: [0335] 38 CN 111593035 A 说 明 书 36/37 页 [0336] [0337] [0338] 实施例2: [0339] 比较粘褶菌属菌种AMG的比活性与瓣环栓菌AMG [0340] 比活性通过将葡糖淀粉酶AGU活性(根据如上所述的方法)除以来自每种制备物的 酶蛋白(AA分析)来计算。下表显示对于不同粘褶菌属菌种AMG相对于瓣环栓菌AMG的结果。 [0341] [0342] 生物材料的保藏 39 CN 111593035 A 说 明 书 37/37 页 [0343] 下述的生物材料已经依据布达佩斯条约的条款保藏于德意志微生物和细胞培养 保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSM) , Mascheroder Weg 1 B,D-38124Braunschweig,Germany,并给予下述的登录号: [0344] 保藏物:具有包含序列D7279(SEQ ID NO:1)的质粒的大肠杆菌菌株NN059223 [0345] 登录号:DSM 23222 [0346] 保藏日期:2010年1月13日 [0347] 所述菌株于下述条件下保藏:确保在本专利申请未决期间,依据该外国专利法律 的授权的人能够获得所述培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交 了该申请的副本,或其后续文本的国家,依据该外国专利法律可以获得所述保藏物。然而, 应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予 的专利权的侵犯。 40 CN 111593035 A 序 列 表 1/55 页 41 CN 111593035 A 序 列 表 2/55 页 42 CN 111593035 A 序 列 表 3/55 页 43 CN 111593035 A 序 列 表 4/55 页 44 CN 111593035 A 序 列 表 5/55 页 45 CN 111593035 A 序 列 表 6/55 页 46 CN 111593035 A 序 列 表 7/55 页 47 CN 111593035 A 序 列 表 8/55 页 48 CN 111593035 A 序 列 表 9/55 页 49 CN 111593035 A 序 列 表 10/55 页 50 CN 111593035 A 序 列 表 11/55 页 51 CN 111593035 A 序 列 表 12/55 页 52 CN 111593035 A 序 列 表 13/55 页 53 CN 111593035 A 序 列 表 14/55 页 54 CN 111593035 A 序 列 表 15/55 页 55 CN 111593035 A 序 列 表 16/55 页 56 CN 111593035 A 序 列 表 17/55 页 57 CN 111593035 A 序 列 表 18/55 页 58 CN 111593035 A 序 列 表 19/55 页 59 CN 111593035 A 序 列 表 20/55 页 60 CN 111593035 A 序 列 表 21/55 页 61 CN 111593035 A 序 列 表 22/55 页 62 CN 111593035 A 序 列 表 23/55 页 63 CN 111593035 A 序 列 表 24/55 页 64 CN 111593035 A 序 列 表 25/55 页 65 CN 111593035 A 序 列 表 26/55 页 66 CN 111593035 A 序 列 表 27/55 页 67 CN 111593035 A 序 列 表 28/55 页 68 CN 111593035 A 序 列 表 29/55 页 69 CN 111593035 A 序 列 表 30/55 页 70 CN 111593035 A 序 列 表 31/55 页 71 CN 111593035 A 序 列 表 32/55 页 72 CN 111593035 A 序 列 表 33/55 页 73 CN 111593035 A 序 列 表 34/55 页 74 CN 111593035 A 序 列 表 35/55 页 75 CN 111593035 A 序 列 表 36/55 页 76 CN 111593035 A 序 列 表 37/55 页 77 CN 111593035 A 序 列 表 38/55 页 78 CN 111593035 A 序 列 表 39/55 页 79 CN 111593035 A 序 列 表 40/55 页 80 CN 111593035 A 序 列 表 41/55 页 81 CN 111593035 A 序 列 表 42/55 页 82 CN 111593035 A 序 列 表 43/55 页 83 CN 111593035 A 序 列 表 44/55 页 84 CN 111593035 A 序 列 表 45/55 页 85 CN 111593035 A 序 列 表 46/55 页 86 CN 111593035 A 序 列 表 47/55 页 87 CN 111593035 A 序 列 表 48/55 页 88 CN 111593035 A 序 列 表 49/55 页 89 CN 111593035 A 序 列 表 50/55 页 90 CN 111593035 A 序 列 表 51/55 页 91 CN 111593035 A 序 列 表 52/55 页 92 CN 111593035 A 序 列 表 53/55 页 93 CN 111593035 A 序 列 表 54/55 页 94 CN 111593035 A 序 列 表 55/55 页 95
本发明涉及具有葡糖淀粉酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用所述多肽的方法。
背景技术:
葡糖淀粉酶(1,4-α-D-葡聚糖葡糖水解酶,EC 3.2.1.3)是一种催化D-葡萄糖从淀 粉或相关的寡糖和多糖分子的非还原端释放的酶。葡糖淀粉酶由数种丝状真菌和酵母产 生,其中来自曲霉属(Aspergillus)的那些在商业上最为重要。 商业上,使用葡糖淀粉酶将已经由部分α-淀粉酶部分水解的淀粉材料转化为葡萄 糖。然后可使用发酵生物将葡萄糖直接或间接转化为发酵产物。商业性发酵产物的实例包 括醇(例如,乙醇、甲醇、丁醇、1,3-丙二醇);有机酸(例如柠檬酸、乙酸、衣康酸、乳酸、葡糖 酸、葡糖酸盐、乳酸、琥珀酸、2,5-二酮-D-葡糖酸);酮(例如丙酮);氨基酸(例如谷氨酸);气 体(例如H2和CO2)和更复杂的化合物,包括例如抗生素(例如青霉素和四环素);酶;维生素 (例如核黄素,B12,β-胡萝卜素);激素,和其他难以合成产生的化合物。发酵工艺亦常用于可 饮用的醇类(例如啤酒和葡萄酒),乳类产品(例如,酸奶和奶酪的产生)工业。 终产物亦可为糖浆。举例而言,终产物可为葡萄糖,但亦可例如通过葡糖异构酶转 化为果糖或基本上由等量葡萄糖和果糖构成的混合物。该混合物,或进一步富集果糖的混 合物,是在全世界得到商业化的最常用的高果糖玉米糖浆(HFCS)。 本发明的目的是提供具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸,且 其在发酵产物产生工艺如醇产生工艺中提供高收率,包括从未糊化的生(或未烹制)淀粉的 一步乙醇发酵工艺。 Uniprot:B0CVJ1公开了来自双色蜡蘑(Laccaria bicolor)的多肽,而WO 2006/ 069289描述了来自瓣环栓菌(Trametes cingulata)的葡糖淀粉酶。 4 CN 111593035 A 说 明 书 2/37 页
技术实现要素:
鉴定并表征了由真菌粘褶菌属(Gloeophyllum)产生,并具有葡糖淀粉酶活性的多 肽。更具体而言,所述粘褶菌属菌种选自下组:冷杉粘褶菌(G .abietinum)、篱边粘褶菌 (G.sepiarium)和密粘褶菌(G.trabeum)。 相应地,在第一个方面,本发明涉及具有葡糖淀粉酶活性的分离的多肽,其选自下 组:(a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽具有优选至少82%,更优选至少83%,更优选至少84%,更优选至少85%, 更优选至少86%,更优选至少87%,更优选至少88%,更优选至少89%,更优选至少90%,更 优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选 至少95%,如至少96%,至少97%,至少98%,至少99%或甚至100%同一性;(b)多肽,其包 含氨基酸序列,所述氨基酸序列与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8, SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14的氨基酸19至474或SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471所示的催化域具有优选至少82%,更优选至少83%,更优选至少 84%,更优选至少85%,更优选至少86%,更优选至少87%,更优选至少88%,更优选至少 89%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至 少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少98%,至少99%或甚至 100%同一性;(c)多肽,其由多核苷酸编码,所述多核苷酸在优选至少中-高严格条件下,并 且最优选至少高严格条件下与以下杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成 熟多肽编码序列,(ii)包含SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的 基因组DNA序列,或(iii)(i)或(ii)的全长互补链;(d)多肽,其由多核苷酸编码,所述多核 苷酸包含核苷酸序列,所述核苷酸序列与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多 肽编码序列具有优选至少82%,更优选至少83%,更优选至少84%,更优选至少85%,更优 选至少86%,更优选至少87%,更优选至少88%,更优选至少89%,更优选至少90%,更优选 至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少 95%,如至少96%,至少97%,至少98%,至少99%或甚至100%同一性;和(e)变体,其包含 取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO: 6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO: 18的成熟多肽。 在第二个方面,本发明涉及分离的多核苷酸,其包含编码第一个方面的多肽的核 苷酸序列。 在进一步的方面,本发明涉及包含第二个方面的多核苷酸的核酸构建体,重组表 达载体,重组宿主细胞,转基因植物,植物部分或植物细胞。 仍在进一步的方面,本发明涉及产生所述多肽的方法,所述多肽的用途,和包含α- 淀粉酶和所述多肽的组合物。 本发明还涉及以下项目: 5 CN 111593035 A 说 明 书 3/37 页 项目1.一种具有葡糖淀粉酶活性的分离的多肽,其选自下组: (a)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽具有优选至少82%,更优选至少83%,更优选至少84%,更优选至少 85%,更优选至少86%,更优选至少87%,更优选至少88%,更优选至少89%,更优选至少 90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至 最优选至少95%,如至少95%,至少97%,至少98%,至少99%或甚至100%同一性; (b)多肽,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14的氨基酸19至474或者 SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471所示的催化域具有优选至少82%,更优选 至少83%,更优选至少84%,更优选至少85%,更优选至少86%,更优选至少87%,更优选至 少88%,更优选至少89%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选 至少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少98%, 至少99%或甚至100%同一性; (c)多肽,其由多核苷酸编码,所述多核苷酸在优选至少中-高严格条件下,和最优 选至少高严格条件下与以下杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多 肽编码序列,(ii)包含SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO: 9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的基 因组DNA序列,或(iii)(i)或(ii)的全长互补链; (d)多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与 SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列具有优选至少82%,更优选 至少83%,更优选至少84%,更优选至少85%,更优选至少86%,更优选至少87%,更优选至 少88%,更优选至少89%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选 至少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少98%, 至少99%或甚至100%同一性;和 (e)变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2, SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14, SEQ ID NO:16或SEQ ID NO:18的成熟多肽。 项目2.项目1的多肽,其包含或组成为SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO: 6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO: 18的氨基酸序列;SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO: 10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽;或它们具有 葡糖淀粉酶活性的片段。 项目3.项目1或2的多肽,其由多核苷酸编码,所述多核苷酸包含或组成为SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO: 13,SEQ ID NO:15或SEQ ID NO:17的核苷酸序列;或它们编码具有葡糖淀粉酶活性的片段 的亚序列。 6 CN 111593035 A 说 明 书 4/37 页 项目4.项目1-3任一项的多肽,其由DSM 23222中包含的质粒中含有的多核苷酸编 码。 项目5.项目1-4任一项的多肽,其中所述成熟多肽是SEQ ID NO:2,SEQ ID NO:4, SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸18至 573或SEQ ID NO:16或SEQ ID NO:18的氨基酸18至576。 项目6.一种具有糖结合活性的分离的多肽,其包含糖结合模块,所述模块与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸480至573或者SEQ ID NO:16或SEQ ID NO:18的氨基酸483至576所示的糖结 合域具有优选至少80%,更优选至少81%,更优选至少82%,更优选至少83%,更优选至少 84%,更优选至少85%,更优选至少86%,更优选至少87%,更优选至少88%,更优选至少 89%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至 少94%,并且甚至最优选至少95%,如至少95%,至少97%,至少98%,至少99%或甚至 100%同一性。 项目7.一种杂合酶,其包含催化域和项目6的糖结合域。 项目8 .项目7的杂合酶,其中所述催化域具有选自下组的酶活性:α-淀粉酶, amylopullulanase,β-淀粉酶,CGT酶,葡糖淀粉酶,异淀粉酶,产麦芽糖淀粉酶和支链淀粉 酶。 项目9.一种分离的多核苷酸,其包含编码项目1-8任一项的多肽的核苷酸序列。 项目10.一种核酸构建体,其包含可操作连接的项目9的多核苷酸和一种或多种 (几种)调控序列,所述调控序列指导所述多肽在表达宿主中的表达。 项目11.一种重组表达载体,其包含项目10的核酸构建体。 项目12.一种重组宿主细胞,其包含项目10的核酸构建体。 项目13.一种产生项目1-8任一项的多肽的方法,包括:(a)在有助于所述多肽产生 的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的核苷酸序 列;和(b)回收所述多肽。 项目14.一种产生项目1-8任一项的多肽的方法,包括:(a)在有助于所述多肽产生 的条件下培养转基因植物或植物细胞,所述植物或植物细胞包含编码所述多肽的多核苷酸 序列;和(b)回收所述多肽。 项目15.一种转基因植物、植物部分或植物细胞,其用编码项目1-8任一项的多肽 的多核苷酸转化。 项目16.项目1-8任一项的多肽在产生糖浆和/或发酵产物中的用途。 项目17.项目16的方法,其中所述起始材料为糊化的或未糊化的含淀粉材料。 项目18.项目1-8任一项的多肽用于酿造的用途。 项目19.一种组合物,其包含α-淀粉酶和项目1-8任一项的多肽。 项目20.一种从含淀粉材料产生发酵产物的工艺,包括下述步骤: (a)液化含淀粉材料; (b)糖化经液化的材料;和 (c)用发酵生物发酵; 其中步骤(b)使用至少一种项目1-5任一项的葡糖淀粉酶进行。 7 CN 111593035 A 说 明 书 5/37 页 项目21.一种从含淀粉材料产生发酵产物的工艺,包括下述步骤: (a)在所述含淀粉材料的起始糊化温度以下的温度糖化含淀粉材料;和 (b)用发酵生物发酵; 其中步骤(a)使用至少一种项目1-5任一项的葡糖淀粉酶进行。 定义 葡糖淀粉酶:术语葡糖淀粉酶(1,4-α-D-葡聚糖葡糖水解酶,EC3.2.1.3)定义为催 化D-葡萄糖从淀粉或相关的寡糖和多糖分子的非还原端释放的酶。就本发明而言,葡糖淀 粉酶活性根据下文“材料和方法”部分描述的步骤来确定。 本发明的多肽具有SEQ ID NO:2或其同源序列,SEQ ID NO:4或其同源序列,SEQ ID NO:6或其同源序列,SEQ ID NO:8或其同源序列,SEQ ID NO:10或其同源序列,SEQ ID NO:12或其同源序列,SEQ ID NO:14或其同源序列,SEQ ID NO:16或其同源序列,或者SEQ ID NO:18或其同源序列的成熟多肽的葡糖淀粉酶活性的至少20%,优选至少40%,优选至 少45%,更优选至少50%,更优选至少55%,更优选至少60%,更优选至少65%,更优选至少 70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至 少95%,并且甚至最优选至少100%。 分离的多肽:术语“分离的多肽”用于本文中指从来源分离的多肽。在一个优选的 方面,如通过SDS-PAGE测定的,所述多肽为至少1%纯,优选至少5%纯,更优选至少10%纯, 更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,并且 最优选至少90%纯。 基本上纯的多肽:术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备 物含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%, 更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天 然或重组结合的(associated)其它多肽材料。因此,优选所述基本上纯的多肽按存在于制 备物中的全部多肽材料的重量计是至少92%纯,优选至少94%纯,更优选至少95%纯,更优 选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至 少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。本发明的多肽优选是基本上纯 的形式,即所述多肽制备物基本上(essentially)不含与其天然或重组结合的其它多肽材 料。例如,这能够通过如下实现:通过公知的重组方法或通过经典纯化方法制备多肽。 成熟多肽:术语“成熟多肽”意指以其在翻译和任何翻译后修饰(如N-末端加工、C- 末端截短、糖基化、磷酸化等)之后的最终形式存在的多肽。在一个方面,基于预测SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO: 14,SEQ ID NO:16和SEQ ID NO:18的氨基酸1至17是信号肽的SignalP程序(Nielsen等, 1997,Protein Engineering 10:1-6),所述成熟多肽是SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14的氨基酸18至573或SEQ ID NO:16或SEQ ID NO:18的氨基酸18至576。由SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6, SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸19至474(特别是19至 471)或者SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471限定的序列为催化域。由SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸480至573或者SEQ ID NO:16或SEQ ID NO:18的氨基酸483至576限定的序列 8 CN 111593035 A 说 明 书 6/37 页 为淀粉结合域。 成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为编码具有葡糖淀粉 酶活性的成熟多肽的核苷酸序列。优选地,所述成熟多肽编码序列是SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13的核苷酸52 至1719,或者SEQ ID NO:15或SEQ ID NO:17的核苷酸52至1728。 同一性:两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“同一性”来 描述。 就本发明而言,两个氨基酸序列之间的同一性程度是使用如EMBOSS程序包 (EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,Trends in Genetics 16:276-277) (优选版本3 .0 .0或更新的版本)的Needle程序中执行的 Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来测定的。使 用的可选参数是:缺口产生罚分为10,缺口延伸罚分为0.5,和EBLOSUM62(BLOSUM62的 EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用–nobrief选项获得)用 作百分比同一性并且是如下计算的: (相同的残基x 100)/(比对的长度-比对中的缺口总数) 就本发明而言,两个脱氧核糖核苷酸序列之间的同一性程度使用如EMBOSS程序包 (EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,见上) (优选版本3.0.0或更新的版本)的Needle程序中执行的Needleman-Wunsch算法(Needleman 和Wunsch,1970,见上)测定。使用的可选参数是:缺口产生罚分为10,缺口延伸罚分为0.5, 和EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出 (使用–nobrief选项获得)用作百分比同一性并且是如下计算的: (相同的脱氧核糖核苷酸x 100)/(比对的长度-比对中的缺口总数) 同源序列:术语“同源序列”在本文中定义为与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码部分或SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,或SEQ ID NO:18的成熟多肽分别 具有至少82%,优选至少83%,更优选至少84%,更优选至少85%,更优选至少86%,更优选 至少87%,更优选至少88%,更优选至少89%,更优选至少90%,更优选至少91%,更优选至 少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至 少97%,至少98%或甚至至少99%同一性%的核苷酸序列/多肽序列。 多肽片段:术语“多肽片段”在本文定义为从SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽或其同源序列的氨基和/或羧基末端缺失了一个或多个(几个)氨基酸的 多肽;其中所述片段具有葡糖淀粉酶活性。优选地,片段含有SEQ ID NO:2,SEQ ID NO:4, SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或 SEQ ID NO:18的成熟多肽或其同源序列的至少500个氨基酸残基,更优选至少450个氨基酸 残基,并且最优选至少400个氨基酸。具体的片段为SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO: 6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸19至474或者SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471限定的序列,其包含本发明多肽的催化域。 9 CN 111593035 A 说 明 书 7/37 页 亚序列:术语“亚序列(subsequence)”在本文中定义为从SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO: 15或SEQ ID NO:17的成熟多肽编码序列的5'和/或3'端缺失了一个或多个(几个)核苷酸的 核苷酸序列;或其同源序列;其中所述亚序列编码具有葡糖淀粉酶活性的多肽片段。优选 地,亚序列含有SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列或其同源序 列的至少1500个核苷酸,更优选至少1400个核苷酸,并且最优选至少1200个核苷酸。 等位变体(allelic variant):术语“等位变体”在本文中表示占据相同染色体基 因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致 种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的 氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。 分离的多核苷酸:术语“分离的多核苷酸”用于本文中指从来源分离的多核苷酸。 优选地,如通过琼脂糖电泳测定的,所述多核苷酸为至少1%纯,优选至少5%纯,更优选至 少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少 80%纯,并且最优选至少90%纯。 基本上纯的多核苷酸:术语“基本上纯的多核苷酸”用于本文指多核苷酸制备物, 其不含其它外来的或不期望的核苷酸,并且处于适合于在遗传工程蛋白质生产体系中使用 的形式。因此,基本上纯的多核苷酸含有按重量计至多10%,优选至多8%,更优选至多6%, 更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并 且甚至最优选至多0.5%的与其天然或重组结合的其它多核苷酸材料。然而,基本上纯的多 核苷酸可以包括天然存在的5’和3’非翻译区,如启动子和终止子。优选基本上纯的多核苷 酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优 选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最 优选至少99.5%纯的。本发明的多核苷酸优选为基本上纯的形式,即所述多核苷酸制备物 基本上(essentially)不含与其天然或重组结合的其它多核苷酸材料。所述多核苷酸可以 是基因组、cDNA、RNA、半合成、合成来源的,或它们的任何组合。 编码序列:术语“编码序列”在用于本文时意指直接指定其蛋白产物的氨基酸序列 的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可 供选择的起始密码子如GTG和TTG开始,并且以终止密码子如TAA、TAG和TGA结束。编码序列 可以是DNA、cDNA、合成的或重组的核苷酸序列。 cDNA:术语“cDNA”在本文中定义为能够通过反转录从得自真核细胞的成熟的、已 剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起 始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟 的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自mRNA 的cDNA没有任何内含子序列。 核酸构建体:术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分 子分离自天然存在的基因,或将所述核酸分子以本来不存在于(not otherwise exist)自 然界中的方式修饰以含有核酸的区段或所述核酸分子是合成的。当所述核酸构建体含有表 达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。 10 CN 111593035 A 说 明 书 8/37 页 调控序列(control sequence):术语“调控序列”在本文定义为包括对编码本发明 多肽的多核苷酸表达是必需的所有组分。各个调控序列对于编码所述多肽的核苷酸序列可 以是天然的或外源的,或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包 括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少 的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和目的为引入特异 性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列 编码区的连接。 可操作地连接:术语“可操作地连接”在本文表示这样的构型,其中将调控序列置 于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽编码序列的表达。 表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修 饰、翻译、翻译后修饰和分泌。 表达载体:术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本 发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。 宿主细胞:如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型 对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的 (susceptible)。 修饰:术语“修饰”在本文中意指对由SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6, SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18 的成熟多肽组成的多肽或其同源序列的任何化学修饰,以及对编码这样的多肽的DNA的遗 传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入,以及一个或多 个(几个)氨基酸侧链的置换。 变体:当用于本文时,术语“变体”意指具有葡糖淀粉酶活性的多肽包含改变,即在 一个或多个(几个)位置取代、插入和/或缺失一个或多个(几个)氨基酸残基。取代意指用不 同的氨基酸替代占据某位置的氨基酸;缺失指去除占据某位置的氨基酸;而插入意指邻接 占据某位置的氨基酸添加1-3个氨基酸。 发明详述 具有葡糖淀粉酶活性的多肽 在第一个方面,本发明涉及包含下述氨基酸序列的分离的多肽,所述氨基酸序列 与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12, SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽具有优选至少82%,更优选至少 83%,更优选至少84%,更优选至少85%,更优选至少86%,更优选至少87%,更优选至少 88%,更优选至少89%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至 少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少98%,至 少99%或甚至100%同一性的同一性程度,所述多肽具有葡糖淀粉酶活性(下文中的“同源 多肽”)。优选地,所述同源多肽具有的氨基酸序列与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更 优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。 本发明的多肽优选包含SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8, 11 CN 111593035 A 说 明 书 9/37 页 SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的氨基酸序列 或其等位变体;或它们的具有葡糖淀粉酶活性的片段。优选地,多肽包含SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽或其等位变体;或它们的具有葡糖淀粉酶活性的片段。在 另一优选的方面,多肽由SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的氨基酸序列或其等 位变体,或它们的具有葡糖淀粉酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO: 2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14, SEQ ID NO:16或SEQ ID NO:18的氨基酸序列组成。 在第二个方面,本发明涉及具有葡糖淀粉酶活性的分离的多肽,其由多核苷酸编 码,所述多核苷酸在优选非常低严格条件、更优选低严格条件、更优选中严格条件、更优选 中-高严格条件、甚至更优选高严格条件、和最优选非常高严格条件下与下列杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列,(ii)包含SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO: 15或SEQ ID NO:17的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或 (iv)(i)、(ii)或(iii)的全长互补链(J .Sambrook,E.F .Fritsch和T.Maniatis,1989, Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor,New York)。SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的成熟多肽编码序列的亚序列 含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可以编码 具有葡糖淀粉酶活性的多肽片段。优选地,所述互补链是SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的全长互补链。 SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的核苷酸序列或其亚序列;以及SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的氨基酸序列或其片段,可用于设计核酸探针,以根 据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有葡糖淀粉酶活性的多肽 的DNA。具体而言,可将这些探针用于根据标准的Southern印迹方法与感兴趣的属或种的基 因组或cDNA杂交,以鉴定并从其中分离相应的基因。这些探针可明显短于完整序列,但长度 上应为至少14个,优选至少25个,更优选至少35个,并且最优选至少70个核苷酸。然而,优选 所述核酸探针长度上是至少100个核苷酸。例如,所述核酸探针长度上可以是至少200个核 苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可 以使用更长的探针,例如,长度是优选至少600个核苷酸,更优选至少700个核苷酸,甚至更 优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使 用。通常将探针标记以探测相应的基因(例如,用33P、32P、3H、35S、生物素或抗生物素蛋白 12 CN 111593035 A 说 明 书 10/37 页 (avidin)标记)。将这些探针包含于本发明中。 因而,可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上 述探针杂交并且编码具有葡糖淀粉酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电 泳,或通过其它分离技术分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的 DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于 其上。为了鉴定与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9, SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17或其亚序列同源的克隆或 DNA,将所述载体材料优选用在Sounthern印迹中。 就本发明而言,杂交表示核苷酸序列在非常低至非常高的严格条件下与标记的核 酸探针杂交,所述核酸探针对应于SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7, SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编 码序列;包含SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的基因组DNA序 列;其全长互补链;或其亚序列。可使用例如X射线片(X-ray film)检测在这些条件下与核 酸探针杂交的分子。 优选地,核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另一优选的方面,核酸 探针是编码SEQ ID NO:2的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探 针是SEQ ID NO:1。在另一优选的方面,核酸探针是包含在大肠杆菌(E.coli)菌株DSM23222 中的质粒中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有葡糖淀粉酶活性的多 肽。在另一优选的方面,核酸探针是包含在大肠杆菌DSM 23222中的质粒中含有的成熟多肽 编码区。 优选地,所述核酸探针是SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9, SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列。在另一 个优选的方面,所述核酸探针是编码SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO: 10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的多肽或其亚序列的多核 苷酸序列。在另一个优选的方面,所述核酸探针是SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO: 7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17。 对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42 ℃,在5X SSPE、0.3%SDS、200μg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严 紧性为25%的甲酰胺、对于中和中-高严紧性为35%的甲酰胺、或对于高和非常高严紧性为 50%的甲酰胺,根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。 对于长度为至少100个核苷酸的长探针,使用2X SSC、0.2%SDS优选在45℃(非常 低严紧性),更优选在50℃(低严紧性),更优选在55℃(中严紧性),更优选在60℃(中-高严 紧性),甚至更优选在65℃(高严紧性),并且最优选在70℃(非常高严紧性)将载体材料最终 洗涤三次,每次15分钟。 对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严格条件定义为在比使 用根据Bolton和McCarthy计算法(1962,Proceedings of the National Academy of Sciences USA 48:1390)计算得出的Tm低大约5℃至大约10℃,在0.9M NaCl,0.09M Tris- HCl pH7 .6,6mM EDTA,0 .5%NP-40,1X Denhardt溶液,1mM焦磷酸钠(sodium 13 CN 111593035 A 说 明 书 11/37 页 pyrophosphate),1mM磷酸二氢钠(sodium monobasic phosphate),0.1mM ATP和0.2mg每ml 的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小 时。 对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6X SSC 加0.1%SDS中洗涤一次15分钟,并用6X SSC在比计算得出的Tm低5℃至10℃的温度洗涤两 次,每次15分钟。 在第三个方面,本发明涉及由多核苷酸编码的具有葡糖淀粉酶活性的分离的多 肽,所述多核苷酸包含或组成为与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7, SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编 码序列具有至少82%,更优选至少83%,更优选至少84%,更优选至少85%,更优选至少 86%,更优选至少87%,更优选至少88%,更优选至少89%,更优选至少90%,更优选至少 91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%, 如至少96%,至少97%,至少98%,至少99%同一性程度的核苷酸序列,其编码活性多肽。参 见本文多核苷酸部分。 本发明还涉及人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(或 几个)氨基酸的SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽;或其同源序列。优选 地,氨基酸改变对性质是较不重要的(of a minor nature),即保守的氨基酸取代或插入, 其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或 羧基末端延伸,如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变 净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(poly-histidine tract)、抗原 表位(antigenic epitope)或结合域(binding domain)。 保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性 氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮 氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨 酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基 酸取代是本领域已知的,并且由例如H.Neurath和R .L .Hill,1979,于The Proteins, Academic Press,New York中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/ Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、 Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。 除了20个基本氨基酸,非基本氨基酸(如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异 丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨 基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸” 在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天 然氨基酸能够以化学方法合成,并且优选是商业上可得到的,包括六氢吡啶羧酸 (pipecolic acid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲 基脯氨酸,和3,3-二甲基脯氨酸。 可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如, 氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适pH等。 14 CN 111593035 A 说 明 书 12/37 页 能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和 Wells,1989,Science 244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将 单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的葡糖淀粉酶活性以鉴 定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem .271: 4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通 过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基 酸的突变来测定。参见例如de Vos等,1992,Science 255:306-312;Smith等,1992, J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBS Lett.309:59-64。必需氨基酸的身份 (identity)也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。 能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法, 例如那些由Reidhaar-Olson和Sauer,1988,Science 241:53-57;Bowie和Sauer,1989, Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或WO 95/22625公开的那些方法来 进行并测试单个或多个氨基酸取代、缺失、和/或插入。能够使用的其它方法包括易错PCR、 噬菌体展示(例如,Lowman等,1991,Biochem.30:10832-10837;美国专利5,223,409号;WO 92/06204)和区域定向的诱变(Derbyshire等,1986,Gene 46:145;Ner等,1988,DNA 7: 127)。 诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的 克隆的、诱变的多肽的活性(Ness等,1999,Nature Biotechnology 17:893-896)。能够从宿 主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方 法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多 肽。 成熟多肽,如SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO: 10,SEQ ID NO:12或SEQ ID NO:14的氨基酸18至573或者SEQ ID NO:16或SEQ ID NO:18的 氨基酸18至576,或催化域,如EQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸19至474或者SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471中的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优 选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。 具有葡糖淀粉酶活性的多肽的来源 本发明的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来 源有关的术语“获得自”,意思是核苷酸序列编码的多肽由所述来源产生,或由其中插入了 来自所述来源的核苷酸序列的菌株产生。优选地,获得自给定来源的多肽是胞外分泌的。 本发明具有葡糖淀粉酶活性的多肽亦可为细菌多肽,或酵母多肽,或更优选丝状 真菌多肽,如具有葡糖淀粉酶活性的枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢 属(Alternaria)、Artomyces、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、 Botryospaeria、拟蜡菌属(Ceriporiopsis)、Chaetomidium、金孢子菌属(Chrysosporium)、 Claviceps、Cochliobolus、Coprinopsis、Coptotermes、Corynascus、Cryphonectria、隐球 菌属(Cryptococcus)、Diplodia、Exidia、Filibasidium、镰孢属(Fusarium)、赤霉属 (Gibberella)、粘褶菌属(Gloeophyllum)、Holomastigotoides、腐质霉属(Humicola)、耙菌 属(Irpex)、Lentinula、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属 15 CN 111593035 A 说 明 书 13/37 页 (Me ri pil us)、毛霉属(Muco r)、毁丝霉属(Mycelio ph tho ra)、新考玛脂霉属 (Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属 (Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘 菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属 (Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、热子囊菌属 (Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属 (Trichoderma)、Trichophaea、轮枝孢属(Verticillium)、Volvariella或Xylaria多肽。 在一个更优选的方面,所述多肽是具有葡糖淀粉酶活性的粘褶菌属菌种多肽,如 篱边粘褶菌(Gloeophyllum sepiarium)、密粘褶菌(Gloeophyllum trabeum)或冷杉粘褶菌 (Gloeophyllum abietinum)多肽。可理解的是对于前述的种,本发明包含完全和不完全阶 段(perfect and imperfect states),和其它分类学的等同物(equivalent),例如无性型 (anamorph),而无论它们已知的种名。本领域的技术人员会容易地识别适合的等同物的身 份(identity)。 这些种的菌株在许多培养物保藏机构对于公众能够容易地取得,所述保藏机构如 美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生 物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业 研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。 此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分 离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域 内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。 一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的 技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上)。 本发明的多肽还包括融合多肽或可切割的融合多肽,其中将另外的多肽融合到所 述多肽或其片段的N末端或C末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合于 本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知 的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使所述融合多肽的表达在 相同启动子和终止子的控制下。 融合多肽还可以包括切割位点。一旦分泌了融合多肽,就切割所述位点,从融合蛋 白释放具有葡糖淀粉酶活性的多肽。切割位点的实例包括,但不限于,编码二肽Lys-Arg的 Kex2位点(Martin等,2003,J.Ind .Microbiol.Biotechnol.3:568-76;Svetina等,2000, J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63: 3488-3493;Ward等,1995,Biotechnology 13:498-503;和Contreras等,1991, Biotechnology 9:378-381);Ile-(Glu或Asp)-Gly-Arg位点,其在精氨酸残基后通过因子 Xa蛋白酶切割(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位点,其在赖 氨酸后通过肠激酶切割(Collins-Racie等,1995,Biotechnology 13:982-987);His-Tyr- Glu位点或His-Tyr-Asp位点,其通过Genenase I切割(Carter等,1989,Proteins: Structure,Function,and Genetics 6:240-248);Leu-Val-Pro-Arg-Gly-Ser位点,其在 16 CN 111593035 A 说 明 书 14/37 页 Arg后通过凝血酶切割(Stevens,2003,Drug Discovery World 4:35-48);Glu-Asn-Leu- Tyr-Phe-Gln-Gly位点,其在Gln后通过TEV蛋白酶切割(Stevens,2003,见上);和Leu-Glu- Val-Leu-Phe-Gln-Gly-Pro位点,其在Gln后通过遗传工程形式的人鼻病毒3C蛋白酶切割 (Stevens,2003,见上)。 多核苷酸 本发明还涉及分离的多核苷酸,其包含编码本发明具有葡糖淀粉酶活性的多肽的 核苷酸序列,或由该核苷酸序列组成。 优选地,核苷酸序列包含或组成为SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17。在另 一优选的方面,核苷酸序列包含或组成为大肠杆菌DSM 23222中所含质粒中含有的序列。在 另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:1的成熟多肽编码序列。在另一更优 选的方面,核苷酸序列包含或组成为大肠杆菌DSM 23222中所含质粒中含有的成熟多肽编 码序列。本发明还涵盖编码如下多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:2, SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14, SEQ ID NO:16或SEQ ID NO:18的氨基酸序列或其成熟多肽;由于遗传密码的简并性,所述 核苷酸序列不同于SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9, SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17或其成熟多肽编码序列。本发 明还涉及SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的亚序列,所述亚序列编码具有葡糖 淀粉酶活性的SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的片段。 本发明还涉及突变的多核苷酸,其在SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5, SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17 的成熟多肽编码序列中包含至少一个突变或由具有至少一个突变的SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO: 15或SEQ ID NO:17的成熟多肽编码序列组成,其中突变的核苷酸序列编码SEQ ID NO:2, SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14, SEQ ID NO:16或SEQ ID NO:18的成熟多肽。 用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,且包括从基因组 DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库 的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆本发 明的多核苷酸。参见,例如,Innis等,1990,PCR:A Guide to Methods and Application, Academic Press,New York。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活 化转录(ligated activated transcription;LAT)和基于核苷酸序列的扩增(NASBA)。可以 从青霉属菌株,或另外的或相关的生物体克隆所述多核苷酸,并且因此可以是例如所述核 苷酸序列的多肽编码区的等位基因变体或种变体(species variant)。 本发明还涉及分离的多核苷酸,其包含或组成为下述核苷酸序列,所述核苷酸序 列与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11, SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列具有优选至少82%,更 17 CN 111593035 A 说 明 书 15/37 页 优选至少83%,更优选至少84%,更优选至少85%,更优选至少86%,更优选至少87%,更优 选至少88%,更优选至少89%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更 优选至少93%,最优选至少94%,并且甚至最优选至少95%,如至少96%,至少97%,至少 98%,至少99%或甚至100%同一性的同一性程度,所述多核苷酸编码活性多肽。 修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为 必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些 工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适pH等方 面不同的人工变体。可以在作为SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7, SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编 码序列存在的核苷酸序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建 变体序列:所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列,但是符合意欲 产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸 取代的概述,参见,例如,Ford等,1991,Protein Expression and Purification 2:95- 107。 对于本领域技术人员显而易见的是,这些取代能够在对于分子功能重要的区域之 外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的 并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,如定位诱变或丙氨 酸分区诱变法(参见,例如,Cunningham和Wells,1989,见上)来鉴定。在后一技术中,将突变 引入到分子中的每个荷正电的残基处,并且测试所得突变分子的葡糖淀粉酶活性,以鉴定 对于所述分子的活性关键的氨基酸残基。底物-酶相互作用的位点也能够通过分析三维结 构测定,通过如核磁共振分析、晶体学或光亲和标记这样的技术来测定(参见,例如,de Vos 等,1992,见上;Smith等,1992,见上;Wlodaver等,1992,见上)。 本发明还涉及编码本发明多肽的分离的多核苷酸,所述分离的多核苷酸在非常低 严格条件下,优选低严格条件,更优选中严格条件,更优选中-高严格条件,甚至更优选高严 格条件,并且最优选非常高的严格条件下,与以下杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列,(ii)包含SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多 肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链,或它们的等位变体和亚序 列(Sambrook等,1989,同上),如本文所定义的。优选地,互补链是SEQ ID NO:1,SEQ ID NO: 3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15 或SEQ ID NO:17的成熟多肽编码序列的全长互补链。 本发明还涉及通过如下获得的分离的多核苷酸:(a)在非常低、低、中、中-高、高或 非常高严格条件下,将DNA的群体与以下杂交:(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO: 5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO: 17的成熟多肽编码序列,(ii)包含SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7, SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编 码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;和(b)分离杂交的多核苷酸,其 编码具有葡糖淀粉酶活性的多肽。优选地,所述互补链是SEQ ID NO:1,SEQ ID NO:3,SEQ 18 CN 111593035 A 说 明 书 16/37 页 ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的全长互补链。 杂合酶 本发明还涉及杂合酶,其包含具有酶活性(例如淀粉降解酶活性,如α-淀粉酶, amylopullulanase,β-淀粉酶,CGT酶,葡糖淀粉酶,异淀粉酶,产麦芽糖淀粉酶或支链淀粉 酶(pullulanase)活性)的催化域,和糖结合模块(CBM)。该杂合酶可进一步包含接头。 所述杂合体可通过将编码催化域的第一DNA序列和编码糖结合模块的第二DNA序 列融合来产生,或该杂合体可基于对合适的CBM、接头和催化域的氨基酸序列的知识作为完 全合成基因来产生。 术语“杂合酶”(亦称作“融合蛋白”,“杂合体”,“杂合多肽”或“杂合蛋白”)在本文 中用于表征本发明的杂合多肽,其包含具有酶活性(例如淀粉降解酶活性,如α-淀粉酶, amylopullulanase,β-淀粉酶,CGT酶,葡糖淀粉酶,异淀粉酶,产麦芽糖淀粉酶或支链淀粉 酶活性)的催化域和糖结合模块,其中所述催化域和所述糖结合模块来自不同来源。术语 “来源”包括但不限于包含合适的催化模块和/或合适的CBM和/或合适的接头的亲本酶或其 变体,例如淀粉酶或葡糖淀粉酶,或其他催化活性。然而,CBM亦可来源于不具有催化活性的 多肽。催化域和糖结合模块可来源于相同的微生物菌株,来源于相同物种中的菌株,来源于 紧密联系的物种或较疏联系的生物。优选地,杂合体催化域和糖结合模块来源于不同来源, 例如来自相同菌株和/或菌种的不同酶,或例如来自不同菌种中的菌株。 在一个方面,杂合酶包含本发明的CBM(亦称作糖结合域或CBD)和催化域。在具体 实施方案中,催化域是葡糖淀粉酶催化域。 核酸构建体 本发明还涉及包含本发明的分离的多核苷酸的核酸构建体,所述分离的多核苷酸 与一个或多个(几个)调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调 控序列相容的条件下指导编码序列的表达。 可以用许多方式操作编码本发明多肽的分离的多核苷酸以供多肽的表达。依赖于 表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用 重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。 调控序列可以是适当的启动子序列,其是由用于表达编码本发明多肽的多核苷酸 的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子 可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的和杂合 的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。 用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例 是从下列酶的基因获得的启动子:黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、米曲霉 TAKA淀粉酶、泡盛曲霉或黑曲霉葡糖淀粉酶(glaA)、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异 构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/ 56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、曼赫根 毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、曼赫根毛霉脂肪酶、里氏木霉β-葡糖苷酶、里 氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉 内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡 19 CN 111593035 A 说 明 书 17/37 页 聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启 动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和 它们的突变的、截短的和杂合的启动子。 在酵母宿主中,有用的启动子从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、 酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、 酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激 酶。对于酵母宿主细胞有用的其它启动子由Romanos等,1992,Yeast 8:423-488描述。 调控序列也可以是合适的转录终止子序列,其是由宿主细胞识别以终止转录的序 列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选 宿主细胞中有功能的任何终止子用在本发明中。 对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:构巢曲霉邻氨基苯甲 酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋 白酶。 对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒 酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞有用的其它终 止子由Romanos等,1992,见上描述。 调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译 区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中 有功能的任何前导序列用在本发明中。 对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶 和构巢曲霉丙糖磷酸异构酶。 对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶 (ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷 酸脱氢酶(ADH2/GAP)。 调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3’末端可操作地连接的 序列,并且在转录时,宿主细胞将其识别为向转录的mRNA添加聚腺苷残基的信号。可以将在 所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。 对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:构巢曲霉邻 氨基苯甲酸合酶、黑曲霉α-葡糖苷酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋 白酶样蛋白酶。 对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Molecular Cellular Biology 15:5983-5990描述。 调控序列还可以是信号肽编码序列,其编码与多肽的氨基末端相连的氨基酸序 列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信 号肽编码序列,该信号肽编码序列与编码分泌多肽的编码序列区段一起天然地连接在翻译 阅读框中。或者,编码序列5’端可含有对于所述编码序列为外源的信号肽编码序列。外源信 号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者,外源信号肽 编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而,指导表达的多肽 进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码序列可在本发明中 20 CN 111593035 A 说 明 书 18/37 页 使用。 对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽 编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素 酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。 同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。 调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或 关闭的那些系统。原核系统中的调节系统包括lac、tac、xyl和trp操纵基因系统。在酵母中, 可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖 淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许 基因扩增的序列。在真核系统中,这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩 增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这 些情况下,编码多肽的核苷酸序列与调节序列可操作地连接。 表达载体 本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子 和转录和翻译终止信号。本文所述的多种核酸和调控序列可以结合在一起以产生重组表达 载体,所述表达载体可以包括一个或多个(几个)方便的限制位点以允许在这些位点插入或 取代编码多肽的核苷酸序列。可供选择的是,可以通过在适当的用于表达的载体中插入包 含所述序列的核苷酸序列或核酸构建体来表达本发明的多核苷酸序列。在制备表达载体的 过程中,将编码序列置于载体中,从而将该编码序列与适当的表达用调控序列可操作地连 接。 重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步 骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿 主细胞的相容性。载体可以是线状或闭合环状质粒。 载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独 立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。 载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细 胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单 独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整 DNA(total DNA),或可以使用转座子(transposon)。 本发明的载体优选地含有一个或多个(几个)选择性标记,其允许简单选择经转 化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的 抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。 用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨 酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移 酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶) (orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲 酸合酶(anthranilate synthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲 霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。 本发明的载体优选含有元件,其允许载体整合入宿主细胞基因组或允许载体在细 21 CN 111593035 A 说 明 书 19/37 页 胞中独立于基因组自主复制。 为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过 同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸 序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精 确位置整合的可能性,整合元件应优选含有足够数量的核酸,如100至10,000碱基对,优选 400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度同一 性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列 同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同 源重组整合到宿主细胞的基因组中。 为了自主复制,载体可以还包含复制起点,其使载体能够在所述的宿主细胞中自 主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发 挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体体内复制的核苷 酸序列。 在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene 98: 61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。分离AMA1 基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。 可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。 多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞 基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂 (selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,从而也含有 多核苷酸的额外拷贝的细胞。 用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知 的(参见,例如,Sambrook等,1989,见上)。 宿主细胞 本发明还涉及重组宿主细胞,其包含本发明的分离的多核苷酸,将所述重组宿主 细胞有利地用于多肽的重组产生。将包含本发明的多核苷酸的载体引入宿主细胞从而将所 述载体作为染色体整合体或作为自复制的染色体外载体保持,如前文所述。术语“宿主细 胞”包含亲本细胞的任何子代,其因为在复制过程中发生的突变而与该亲本细胞不同。宿主 细胞的选择在很大程度上会依赖于编码多肽的基因及其来源。 宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如,原核或真 核细胞。 原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包 括但不限于,芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、地 芽孢杆菌属(Geobacillus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、海洋芽 孢杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)和 链霉菌属(Streptomyces)。革兰氏阴性细菌包括但不限于,大肠杆菌、弯曲杆菌属 (Campylobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属 (Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、假单胞菌属 (Pseudomonas)、沙门氏菌属(Salmonella)和脲原体属(Ureaplasma)。 22 CN 111593035 A 说 明 书 20/37 页 宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。 优选地,宿主细胞是真菌细胞。“真菌”用在本文包括以下门:子囊菌门 (Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门 (Zygomycota)(如由Hawksworth等,于Ainsworth and Bisby’s Dictionary of The Fungi,第八版,1995,CAB International,University Press,Cambridge,UK中所定义)以 及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子 真菌(mitosporic fungi)(Hawksworth等,1995,见上)。 在一个更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵 母(a s c o s p o r o g e n o u s y e a s t) (内孢霉目 (End o m y c e ta l e s) )、产担子酵母 (basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti) (芽孢纲 (Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,会将酵母定义 为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,和Davenport, R.R.编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。 在一个甚至更加优选的方面,酵母宿主细胞是假丝酵母属(Candida)、汉逊酵母属 (Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属 (Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)细胞。 在一个最优选的方面 ,酵母宿主细胞是卡尔酵母 (S a c c h a r o m y c e s carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces o v i f o r m i s) 细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维酵母 (Kluyveromyces lactis)细胞。在另一个最优选的方面,酵母宿主细胞是解脂西洋蓍霉 (Yarrowia lipolytica)细胞。 在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门 (Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。 丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚 糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需 氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而 碳分解代谢可以是发酵的。 在一个甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属(Acremonium)、曲霉 属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、Ceriporiopsis、 金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属 (Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属 (Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属 (Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属 (Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属 (Piromyces)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、 嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属 (Trametes)或木霉属(Trichoderma)细胞。 23 CN 111593035 A 说 明 书 21/37 页 在一个最优选的方面,丝状真菌宿主细胞是泡盛曲霉(Aspergillus awamori)、臭 曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)或米曲霉 (Aspergillus oryzae)细胞。在另一个最优选方面,丝状真菌宿主细胞是杆孢状镰孢 (Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、 禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢 (Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、 粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides) 或镶片镰孢细胞(Fusarium venenatum)。在另一个最优选的方面,丝状真菌宿主细胞是黑 刺烟管菌(Bjerkandera adusta)、Ceriporiopsis aneirina、Ceriporiopsis caregiea、 Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、 Ceriporiopsis subrufa、Ceriporiopsis subvermispora、Chrysosporium inops、嗜角质 金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、 Chrysosporium merdarium、毡金孢子菌(Chrysosporium pannicola)、Chrysosporium queenslandicum、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium zonatum、灰 盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉 (Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉 (Penicillium purpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、辐射射脉菌 (Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳(Thielavia terrestris)、Trametes versicolor、Trametes villosa、哈茨木霉(Trichoderma ha rzia num)、康宁木霉(Trichod e rma koning ii)、长枝木霉(Trichod e rma longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)细 胞。 可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本 身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 0238 023和 Yelton等,1984,Proceedings of the National Academy of Sciences USA 81:1470- 1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene 78:147-156和 WO96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker和Guarente,于 Abelson,J.N .和Simon,M.I .编,Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology,194,182-187,Academic Press,Inc.,New York;Ito等,1983, Journal of Bacteriology153:163;和Hinnen等,1978,Proceedings of the National Academy of Sciences USA 75:1920。 产生方法 本发明还涉及产生本发明多肽的方法,其包括:(a)在有助于产生多肽的条件下培 养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。优选地,所述细胞是 24 CN 111593035 A 说 明 书 22/37 页 粘褶菌属的。在一个更优选的方面,所述细胞是篱边粘褶菌(Gloeophyllum sepiarium)、密 粘褶菌(Gloeophyllum trabeum)或冷杉粘褶菌(Gloeophyllum abietinum)。 本发明还涉及产生本发明的多肽的方法,其包括:(a)在有助于产生多肽的条件下 培养如本文所述的重组宿主细胞;和(b)回收所述多肽。 本发明还涉及产生本发明的多肽的方法,包括:(a)在有助于产生多肽的条件下培 养重组宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQ ID NO:1,SEQ ID NO: 3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15 或SEQ ID NO:17的成熟多肽编码序列中具有至少一个突变,其中所述突变核苷酸序列编码 多肽,所述多肽包含或组成为SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16或SEQ ID NO:18的成熟多肽,和(b) 回收所述多肽。 在本发明的产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培 养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下 进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料 分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所 述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据 公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养 基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中,其能够从细胞裂 解物(lysate)回收。 可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法 可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzyme assay)可 用于测定如本文所述的多肽的活性。 所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养 培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。 本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述 方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例 如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参 见,例如,Protein Purification,J.-C .Janson和Lars Ryden编,VCH Publishers,New York,1989)。 植物 本发明还涉及植物,例如,转基因植物、植物部分或植物细胞,其包含分离的多核 苷酸,所述多核苷酸编码本发明具有葡糖淀粉酶活性的多肽,从而以可回收的量表达和产 生所述多肽。多肽可从植物或植物部分回收。或者,同样可以将含有该重组多肽的植物或植 物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性 质(rheological properties),或用于破坏抗营养因子。 转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物 的实例是草(grasses),如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属 (Poa));饲用牧草(forage grass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草 (temperate grass),如Agrostis(翦股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻 25 CN 111593035 A 说 明 书 23/37 页 (rice)、高粱和玉蜀黍(maize)(玉米)。 双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃 薯,糖甜菜(sugar beet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植 物(十字花科(family Brassicaceae)),如花椰菜(cauliflower),油菜籽(rape seed)和紧 密相关的模型生物体拟南芥(Arabidopsis thaliana)。 植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实 (fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮 (epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vascular tissue)、分 生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外 体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细 胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为 是植物部分。同样地,植物部分,如为了促进本发明的应用而分离的具体组织和细胞也被认 为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seed coat)。 同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的子代。 表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言 之,通过如下方法构建所述植物或植物细胞:将编码本发明多肽的一个或多个(几个)表达 构建体并入植物宿主基因组或叶绿体基因组,并且将所得的修饰植物或植物细胞繁殖为转 基因植物或植物细胞。 表达构建体便利地是包含编码本发明多肽的多核苷酸的核酸构建体,所述多核苷 酸与在选择的植物或植物部分中表达该核苷酸序列所需的适当的调节序列可操作地连接。 此外,表达构建体可以包含对于鉴定在其中整合了该表达构建体的宿主细胞有用的选择性 标记和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。 调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举 例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码本发明多肽的基因的表 达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶 向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,Plant Physiology 86:506所述。 对于组成性表达,可以使用35S-CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck 等,1980,Cell 21:285-294,Christensen等,1992,Plant Mo.Biol.18:675-689;Zhang等, 1991,Plant Cell 3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storage sink tissue)例如种子、马铃薯块茎和果实的启动子(Edwards&Coruzzi,1990, Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolic sink tissue)例如分生组织 的启动子(Ito等,1994,Plant Mol.Biol.24:863-878),种子特异性启动子诸如来自稻的谷 蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu 等,1998,Plant and Cell Physiology 39:885-889),来自豆球蛋白(legumin)B4和蚕豆 (Vicia faba)的未知种子蛋白基因的蚕豆启动子(Conrad等,1998,Journal of Plant Physiology 152:708-711)、来自种子油体蛋白(oil body protein)的启动子(Chen等, 1998,Plant and Cell Physiology 39:935-941),来自欧洲油菜(Brassica napus)的贮藏 蛋白napA启动子,或本技术领域公知的任何其它种子特异性的启动子,例如,在WO 91/ 26 CN 111593035 A 说 明 书 24/37 页 14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子 (Kyozuka等,1993,Plant Physiology 102:991-1000),小球藻病毒(chlorella virus)腺 嘌呤甲基转移酶(adenine methyltransferase)基因启动子(Mitra和Higgins,1994,Plant Molecular Biology 26:85-93),或来自稻的aldP基因启动子(Kagaya等,1995,Molecular and General Genetics 248:668-674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等, 1993,Plant Molecular Biology 22:573-588)。同样地,所述启动子可通过非生物的处理 诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的 物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(plant hormones)如乙烯、脱落酸 (abscisic acid)和赤霉酸(gibberellic acid),和重金属。 启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如,启动 子增强子元件可以是内含子,其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu 等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。 选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。 将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土 壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒 子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science 244:1293;Potrykus,1990,Bio/ Technology8:535;Shimamoto等,1989,Nature 338:274)。 目前,根癌土壤杆菌(Agrobacterium tumefaciens)介导的基因转移(gene transfer),是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort, 1992,Plant Molecular Biology 19:15-38),而且它也可以用于转化单子叶植物,虽然对 于这些植物常常使用其它的转化方法。目前,产生转基因单子叶植物的优选的方法,是用粒 子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryonic calli)或发育中的 胚(developing embryos)(Christou,1992,Plant Journal2:275-281;Shimamoto,1994, Current Opinion Biotechnology 5:158-162;Vasil等,1992,Bio/Technology 10:667- 674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omirulleh等,1993, Plant Molecular Biology 21:415-428所描述的。 转化之后,根据本领域熟知的方法选择并入了表达构建体的转化体并且再生成为 完整植株。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选 择基因:例如,使用带有两种独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性 地切除选择基因。 本发明还涉及产生本发明多肽的方法,其包括:(a)在有助于产生多肽的条件下培 养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码本发明具有葡糖淀粉酶活性 的多肽;和(b)回收所述多肽。 组合物 本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富含此种多肽。术 语“富含”表明组合物的葡糖淀粉酶活性例如以至少1.1的富集因子增加。 所述组合物可包含本发明的多肽作为主要酶组分,例如,单组分组合物。或者,所 述组合物可包含多种酶活性,如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多 糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡 27 CN 111593035 A 说 明 书 25/37 页 糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、 氧化酶、果胶水解酶、肽谷氨酰胺酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核 酸酶、转谷氨酰胺酶或木聚糖酶。其他酶可由例如属于下述属的微生物产生:曲霉属,优选 棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选 杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰 孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或 镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉,康宁木 霉,长枝木霉,里氏木霉或绿色木霉。 多肽组合物可依照本领域中已知的方法制备,并可为液体或干组合物形式。举例 而言,所述多肽组合物可为颗粒或微颗粒的形式。待包含于组合物中的多肽可依照本领域 已知方法稳定化。 下文给出了本发明多肽组合物优选用途的实例。本发明的多肽组合物的剂量和其 他使用组合物的条件可根据本领域已知方法确定。 葡糖淀粉酶和酸性α-淀粉酶的组合 根据本发明的该方面,本发明的葡糖淀粉酶可以与α-淀粉酶组合,优选与酸性α- 淀粉酶以0.3至5.0AFAU/AGU的比例组合。更优选地,酸性α-淀粉酶活性和葡糖淀粉酶活性 之间的比例为至少0.35,至少0.40,至少0.50,至少0.60,至少0.7,至少0.8,至少0.9,至少 1.0,至少1.1,至少1.2,至少1.3,至少1.4,至少1.5,至少1.6,至少1.7,至少1.8,至少1.85, 或甚至至少1.9AFAU/AGU。然而,酸性α-淀粉酶活性和葡糖淀粉酶活性之间的比例应优选为 少于4.5,少于4.0,少于3.5,少于3.0,少于2.5,或甚至少于2.25AFAU/AGU。以AUU/AGI计,酸 性α-淀粉酶和葡糖淀粉酶的活性优选以0.4至6.5AUU/AGI之间的比例存在。更优选地,酸性 α-淀粉酶活性和葡糖淀粉酶活性之间的比例为至少0.45,至少0.50,至少0.60,至少0.7,至 少0.8,至少0.9,至少1.0,至少1.1,至少1.2,至少1.3,至少1.4,至少1.5,至少1.6,至少 1.7,至少1.8,至少1.9,至少2.0,至少2.1,至少2.2,至少2.3,至少2.4,或甚至至少2.5AUU/ AGI。然而,酸性α-淀粉酶活性和葡糖淀粉酶活性之间的比例优选少于6.0,少于5.5,少于 4.5,少于4.0,少于3.5,或甚至少于3.0AUU/AGI。 [0200] 上述组合物适用于下文提及的供产生糖浆和发酵产物如乙醇的淀粉转化工艺。 [0201] 下文给出了本发明多肽组合物优选用途的实例。本发明的多肽组合物的剂量和其 他使用组合物的条件可根据本领域已知方法确定。 [0202] 用途 [0203] 本发明还涉及使用本发明具有葡糖淀粉酶活性的多肽的工艺/方法。 [0204] 根据本发明的用途包括将淀粉淀粉转化为例如糖浆和发酵产物,包括乙醇和饮 料。其中可使用本发明的葡糖淀粉酶的工艺的实例包括描述于WO 92/20777,WO 03/ 066816,WO 03/066826,WO2004/080923和WO 2004/081193的那些,其均通过提述并入本文。 [0205] 发酵产物的产生 [0206] 自经糊化的含淀粉材料中产生发酵产物的工艺 [0207] 在此方面,本发明涉及自含淀粉材料产生发酵产物(特别是乙醇)的工艺,所述工 艺包括液化步骤,以及顺序或同时进行的糖化和发酵步骤。 [0208] 本发明涉及自含淀粉材料产生发酵产物的工艺,包括下述步骤: 28 CN 111593035 A 说 明 书 26/37 页 [0209] (a)液化含淀粉材料,优选使用α-淀粉酶; [0210] (b)使用本发明的葡糖淀粉酶糖化步骤(a)中获得的经液化的材料;和 [0211] (c)使用发酵生物发酵经糖化的材料。 [0212] 发酵产物,如特别是乙醇,可任选地在发酵后回收,例如,通过蒸馏进行。合适的含 淀粉的起始材料列于下面“含淀粉材料”部分。涵盖的酶列于下面“酶”部分。液化优选在α- 淀粉酶存在的条件下进行。发酵优选在酵母,优选酵母属菌株存在下。合适的发酵生物列于 下文“发酵生物”部分。在优选的实施方案中,步骤(b)和(c)顺序或同时进行(即,作为SSF工 艺)。 [0213] 在一个特定的实施方案中,本发明的工艺在步骤(a)之前还包括下述步骤: [0214] x)减小含淀粉材料的粒度,优选通过磨制;和 [0215] y)形成包含含淀粉材料和水的浆料。 [0216] 含水浆料可含有10-40wt%,优选25-35wt%的含淀粉材料。将浆料加热到糊化温 度以上,并可添加α-淀粉酶,优选细菌和/或酸性真菌α-淀粉酶以起始液化(稀化 (thinning))。在一个实施方案中,在进行本发明步骤(a)中的α-淀粉酶处理前,浆料可经喷 射蒸煮(jet-cooked)以进一步使浆料糊化。 [0217] 更具体而言,液化过程可作为三步热浆工艺来进行。将浆料加热至60-95℃,优选 80-85℃,并添加α-淀粉酶以起始液化(稀化)。然后可将浆料在95-140℃,优选105-125℃的 温度喷射蒸煮1-15分钟,优选3-10分钟,特别是约5分钟。使浆料冷却至60-95℃并添加更多 的α-淀粉酶以完成水解(二次液化)。液化工艺通常在pH 4.5至6.5,特别是在pH 5至6进行。 磨制和液化的全谷物称作醪液(mash)。 [0218] 步骤(b)中的糖化可使用本领域众所周知的条件进行。举例而言,完全的糖化工艺 可持续约24至约72小时,然而,通常仅在30-65℃,通常约60℃的温度进行通常40-90分钟的 预糖化,然后是在同时发酵和糖化工艺(SSF工艺)中在发酵过程中的完全糖化。糖化通常在 30-65℃,通常约60℃的温度,在约pH 4-5的pH,通常在约pH 4.5进行。 [0219] 发酵产物,特别是乙醇生产中最广泛使用的工艺为同时糖化和发酵(SSF)工艺,其 中对糖化没有保持阶段,意思是发酵生物(如酵母)和酶可一起添加。SSF通常在25℃至40 ℃,如29℃至35℃,如30℃至34℃,优选约32℃的温度进行。根据本发明,可在发酵过程中向 上或向下调整温度。 [0220] 根据本发明,发酵步骤(c)包括但不限于用于产生醇类(例如,乙醇、甲醇、丁醇); 有机酸(例如,柠檬酸、乙酸、衣康酸、乳酸、葡糖酸);酮类(例如,丙酮);氨基酸(例如,谷氨 酸);气体(例如,H2和CO2);抗生素(例如,青霉素和四环素);酶;维生素(例如,核黄素、B12、 β-胡萝卜素);以及激素的发酵工艺。优选的发酵工艺包括醇发酵工艺,如本领域公知。优选 的发酵工艺为厌氧发酵工艺,如本领域公知。 [0221] 自未糊化的含淀粉材料产生发酵产物的方法 [0222] 在此方面,本发明涉及自含淀粉材料产生发酵产物,而无含淀粉材料的糊化(即无 烹制的含淀粉材料)的工艺。在一个实施方案中,在发酵和糖化过程中仅使用本发明的葡糖 淀粉酶。根据本发明,可产生期望的发酵产物,如乙醇,而不液化含有含淀粉材料的含水浆 料。在一个实施方案中,本发明的方法包括在糊化温度以下,在本发明的葡糖淀粉酶的存在 下对(经磨制的)含淀粉材料,例如粒状淀粉进行糖化以产生糖类,所述糖类可由合适的发 29 CN 111593035 A 说 明 书 27/37 页 酵生物发酵成期望的发酵产物。 [0223] 因此,在此方面,本发明涉及用于自含淀粉材料产生发酵产物的工艺,包括: [0224] (a)在所述含淀粉材料的起始糊化温度以下的温度用本发明的、优选具有SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12或SEQ ID NO:14的氨基酸18至573或者SEQ ID NO:16或SEQ ID NO:18的氨基酸18至576的成熟葡糖淀 粉酶或与其具有至少82%同一性的葡糖淀粉酶,来糖化含淀粉材料; [0225] (b)使用发酵生物进行发酵。 [0226] 本发明的工艺的步骤(a)或(b)可顺序或同时进行。在一个实施方案中,在步骤(a) 之前制备包含水和含淀粉材料的浆料。 [0227] 所述发酵工艺可进行1至250小时,优选25至190小时,更优选30至180小时,更优选 40至170小时,甚至更优选50至160小时,还更优选60至150小时,甚至还更优选70至140小 时,并且最优选80至130小时的期间。 [0228] 术语“起始糊化温度”意指淀粉发生糊化的最低温度。在水中加热的淀粉在50℃至 75℃开始糊化;糊化的准确温度取决于特定的淀粉,并可方便的由本领域技术人员确定。从 而,起始糊化温度可根据植物物种,植物物种的特定品种以及生长条件而改变。在本发明的 上下文中,给定含淀粉材料的起始糊化温度为使用由Gorinstein和Lii Starch/ 44 (12):461-466(1992)描述的方法5%的淀粉颗粒丧失双折射的温度。 [0229] 在步骤(a)之前,可制备含淀粉材料,如粒状淀粉的浆料,其具有10-55wt%含淀粉 材料的干固体,优选25-40wt%干固体,更优选30-35%干固体。浆料可包含水分和/或工艺 水(process water),例如釜馏物(逆流(backset))、洗涤水(scrubber water)、蒸发器冷凝 液或馏出物、来自蒸馏的侧线汽提器水(side-stripper water)或其他发酵产物设备 (plant)的工艺水。由于本发明的方法在糊化温度以下进行,因此不发生显著的粘度增加, 如果需要,可使用高水平的釜馏物。在一个实施方案中,含水浆料包含约1至约70vol%釜馏 物,优选15-60vol%釜馏物,特别为约30至50vol%釜馏物。 [0230] 可通过优选以干磨或湿磨将其粒度减小到0.05至3.0mm,优选0.1至0.5mm来制备 含淀粉材料。在进行本发明的工艺后,含淀粉材料的至少85%,至少86%,至少87%,至少 88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%, 至少97%,至少98%,或者优选至少99%的干固体转化为可溶的淀粉水解物。 [0231] 本发明的工艺在低于起始糊化温度的温度进行。优选地,步骤(a)进行的温度为30 至75℃,优选45至60℃。 [0232] 在一个优选实施方案中,步骤(a)和步骤(b)作为顺序或同时糖化和发酵工艺进 行。在此种优选的实施方案中,该工艺通常在25至40℃,如29至35℃,如30℃至34℃,如约32 ℃的温度进行。根据本发明在发酵过程可向上或向下调整温度。 [0233] 在一个实施方案中,进行同时糖化和发酵从而使得糖水平,如葡萄糖水平保持在 低水平,如6wt%以下,优选约3wt%以下,优选约2wt%以下,更优选约1wt%以下,甚至更优 选约0.5%以下或甚至更优选0.25wt%以下,如约0.1wt%以下。所述低水平的糖可通过简 单的使用经调整量的酶和发酵生物来实现。本领域技术人员可方便地确定使用的酶和发酵 生物的量。酶和发酵生物的使用量也可经选择以保持麦芽糖在发酵液中的低浓度。举例而 言,麦芽糖水平可保持为约0.5wt%以下,或约0.2wt%以下。 30 CN 111593035 A 说 明 书 28/37 页 [0234] 本发明的方法可在pH 3至7,优选pH 3.5至6,或更优选pH 4至5的范围进行。 [0235] 含淀粉材料 [0236] 根据本发明,可使用任何合适的含淀粉的起始材料,包括粒状淀粉。所述起始材料 通常基于期望的发酵产物而选择。适用于本发明工艺的含淀粉的起始材料的实例包括块 茎、根、茎、全谷粒、玉米、玉米穗轴、小麦、大麦、黑麦、买罗高粱、西米、木薯、树薯、高粱、稻、 豌豆(pea)、豆(bean)或甘薯,或它们的组合,或谷类,含糖原材料如糖蜜,果物材料,甘蔗或 甜菜,马铃薯,以及含纤维素材料,如木质或植物残余物,或其组合。涵盖蜡质和非蜡质两者 类型的玉米和大麦。 [0237] 术语“粒状淀粉”意指未烹制的生淀粉,即,以其天然形式存在于谷类、块茎或谷粒 中的淀粉。淀粉在植物细胞中作为微小的不溶于水的颗粒形成。当置于冷水中时,淀粉颗粒 可吸收少量液体并膨胀(swell)。在高至50℃至75℃的温度,膨胀可为可逆的。然而,在更高 温度开始称为“糊化”的不可逆膨胀。待加工的粒状淀粉可为高度精制的淀粉质量,优选至 少90%,至少95%,至少97%或至少99.5%纯,或者其可为更加粗制的含淀粉材料,其含有 包括非淀粉部分(例如胚残余物和纤维)的经磨制的全谷粒。原材料(如全谷粒)经磨制以打 开其结构并允许进一步的加工。根据本发明优选两种磨制工艺,湿磨和干磨。在干磨中,将 整粒磨碎并使用。湿磨给出胚和粗粉(淀粉颗粒和蛋白质)的良好分离,并通常用于使用淀 粉水解物产生糖浆的场合。干磨和湿磨在淀粉加工领域都是众所周知的,并等同地涵盖于 本发明的工艺中。 [0238] 所述含淀粉材料优选通过干磨或湿磨减小粒度以暴露更多表面区域。在一个实施 方案中,粒度为约0.05至3.0mm,优选0.1至0.5mm,或使得至少30%,优选至少50%,更优选 至少70%,甚至更加优选至少90%的含淀粉材料可穿过具有0.05至3.0mm筛网,优选0.1至 0.5mm筛网的筛。 [0239] 发酵产物 [0240] 术语“发酵产物”意指使用发酵生物通过包括发酵步骤的工艺生成的产物。根据本 发明所包括的发酵产物包括醇类(例如,乙醇、甲醇、丁醇);有机酸(例如,柠檬酸、乙酸、衣 康酸、乳酸、葡糖酸);酮类(例如,丙酮);氨基酸(例如,谷氨酸);气体(例如,H2和CO2);抗生 素(例如,青霉素和四环素);酶;维生素(例如,核黄素、B12、β-胡萝卜素);以及激素。在一个 优选实施方案中,所述发酵产物是乙醇,例如,燃料乙醇;饮用乙醇(即,可饮用的中性酒); 或工业乙醇或用于可饮用醇类工业(例如,啤酒和葡萄酒)、乳制品工业(例如,发酵的乳制 品)、皮革工业和烟草工业的产物。优选的啤酒类型包括爱儿啤酒(ale)、烈性啤酒(stout)、 钵尔透黑啤酒(porters)、陈贮啤酒(lagers)、苦味酒(bitters)、麦芽酒(malt liquors)、 发泡酒(happoushu)、高醇啤酒(high-alcohol beer)、低醇啤酒(low-alcohol beer)、低热 量啤酒(low-calorie beer)或清淡啤酒(light beer)。使用的优选发酵工艺包括醇发酵工 艺,如本领域公知。优选的发酵工艺为厌氧发酵工艺,如本领域公知。 [0241] 发酵生物 [0242] “发酵生物”指任何适用于发酵工艺并能够产生所需的发酵产物的生物,包括细菌 和真菌生物。特别合适的发酵生物能够将糖如葡萄糖或麦芽糖直接或间接发酵(即转化)为 所需的发酵产物。发酵生物的实例包括真菌生物,如酵母。优选的酵母包括酵母属菌种的菌 株,特别是酿酒酵母。商业上可获得的酵母包括例如Red StarTM/Lesaffre Ethanol Red(可 31 CN 111593035 A 说 明 书 29/37 页 从Red Star/Lesaffre ,USA获得)FALI(可从Burns Philp Food Inc .,USA的分支机构 Fleischmann’s Yeast获得),SUPERSTART(可从Alltech获得),GERT STRAND(可从Gert Strand AB,Sweden获得)和FERMIOL(可从DSM Specialties获得)。 [0243] 酶 [0244] 葡糖淀粉酶 [0245] 葡糖淀粉酶优选为本发明的葡糖淀粉酶。然而如上所述,本发明的葡糖淀粉酶亦 可与其他葡糖淀粉酶组合。术语“葡糖淀粉酶”(1,4-α-D-葡聚糖葡糖水解酶,EC 3.2.1.3) 是催化D-葡萄糖从淀粉或相关的寡糖和多糖分子的非还原端释放的酶。 [0246] 葡糖淀粉酶可以以0.001至10AGU/g DS,优选0.01至5AGU/g DS,如大约0.1,0.3, 0.5,1或2AGU/g DS,特别是0.1至0.5AGU/g DS或0.02-20AGU/g DS,优选0.1-10AGU/g DS的 量添加。 [0247] α-淀粉酶 [0248] 根据本发明α-淀粉酶可为任何来源的。优选真菌或细菌来源的α-淀粉酶。 [0249] 在一个优选实施方案中,所述α-淀粉酶是酸性α-淀粉酶,例如真菌酸性α-淀粉酶 或细菌酸性α-淀粉酶。术语“酸性α-淀粉酶”意指以有效量添加、在pH范围3至7,优选3.5至 6,或更优选4至5具有最优活性的α-淀粉酶(EC 3.2.1.1)。 [0250] 细菌α-淀粉酶 [0251] 根据本发明,细菌α-淀粉酶优选来源于芽孢杆菌属。 [0252] 在一个优选实施方案中,所述芽孢杆菌属α-淀粉酶来源于地衣芽孢杆菌、解淀粉 芽孢杆菌、枯草芽孢杆菌或嗜热脂肪芽孢杆菌的菌株,但亦可来源于其他芽孢杆菌菌种。涵 盖的α-淀粉酶的具体实例包括示于WO 99/19467中SEQ ID NO:4的地衣芽孢杆菌α-淀粉酶 (BLA),示于WO 99/19467中SEQ ID NO:5的解淀粉芽孢杆菌α-淀粉酶(BAN),和示于WO 99/ 19467中SEQ ID NO:3的嗜热脂肪芽孢杆菌α-淀粉酶(BSG)。在一个本发明的实施方案中,所 述α-淀粉酶为分别与WO 99/19467中示为SEQ ID NO:1、2、3、4或5的任何序列具有至少 60%,优选至少70%,更优选至少80%,甚至更优选至少90%,如至少95%,至少96%,至少 97%,至少98%或至少99%同一性的同一性程度的酶。 [0253] 所述芽孢杆菌属α-淀粉酶亦可为变体和/或杂合体,特别是任何WO 96/23873、WO 96/23874、WO 97/41213、WO 99/19467、WO 00/60059和WO 02/10355(所有文献通过提述并 入本文)中所描述的α-淀粉酶。具体而言,涵盖的α-淀粉酶变体公开于美国专利号6,093 , 562、6,187,576和6,297,038(通过提述并入本文),并包括在位置179至182具有一个或两个 氨基酸缺失的嗜热脂肪芽孢杆菌α-淀粉酶(BSGα-淀粉酶)变体,所述缺失优选为WO 96/ 23873中公开的双会从缺失(参见,例如第20页第1-10行,通过提述并入本文),优选与WO 99/19467中公开的示于SEQ ID NO:3的野生型BSGα-淀粉酶氨基酸序列相比对应于delta (181-182),或氨基酸179和180的缺失,其中使用WO 99/19467(通过提述并入本文)中的SEQ ID NO:3为准进行编号。甚至更优选的是与WO 99/19467中公开的示于SEQ ID NO:3的野生 型BSGα-淀粉酶氨基酸序列相比具有对应于delta(181-182)的双重缺失,并进一步包含 N193F取代(亦表示为I181* G182* N193F)的芽孢杆菌α-淀粉酶,特别是嗜热脂肪芽孢杆菌 α-淀粉酶。 [0254] 所述α-淀粉酶亦可为产麦芽糖α-淀粉酶。“产麦芽糖α-淀粉酶”(葡聚糖1,4-α-麦 32 CN 111593035 A 说 明 书 30/37 页 芽水解酶,EC 3.2.1.133)能够将直链淀粉和支链淀粉(amylopectin)水解为α-构型的麦芽 糖。一种来自嗜热脂肪芽孢杆菌菌株NCIB 11837的产麦芽糖α-淀粉酶商业上可从 Novozymes A/S,Denmark获得。产麦芽糖α-淀粉酶描述于美国专利4,598,048、4,604,355和 6,162,628,其通过提述并入本文。 [0255] 细菌杂合α-淀粉酶 [0256] 具体涵盖的杂合α-淀粉酶包含地衣芽孢杆菌α-淀粉酶(示为WO 99/19467中的SEQ ID NO:4)的445个C端氨基酸残基和来源于解淀粉芽孢杆菌(示为WO 99/19467中的SEQ ID NO:3)的37个N端氨基酸残基,并具有一个或多个,特别是所有的下述取代: [0257] G48A T49I G107A H156Y A181T N190F I201F A209V Q264S(使用地衣芽孢杆菌 编号)。亦优选具有一个或多个下述突变(或其他芽孢杆菌属α-淀粉酶骨架中的对应突变) 的变体:H154Y、A181T、N190F、A209V和Q264S,和/或位置176和179之间两个残基的缺失,特 别是缺失E178和G179(使用WO 99/19467的SEQ ID NO:5的编号)。 [0258] 细菌α-淀粉酶亦可以如本领域公知的量添加。当以KNU单位(描述于下文“材料和 方法”部分)测量时,α-淀粉酶活性优选以0.5-5,000NU/g的DS的量,1-500NU/g的DS的量,或 更优选以5-1,000NU/g的DS如10-100NU/g DS的量存在。 [0259] 真菌α-淀粉酶 [0260] 真菌酸性α-淀粉酶包括来源于曲霉属菌株的酸性α-淀粉酶,如川地曲霉、黑曲霉 或米曲霉α-淀粉酶。 [0261] 优选的酸性真菌α-淀粉酶是Fungamyl样α-淀粉酶,其优选来源于米曲霉的菌株。 在本公开中,术语“Fungamyl样α-淀粉酶”指与示于WO 96/23874的SEQ ID NO:10的氨基酸 序列的成熟部分呈现高同一性,即高于70%,高于75%,高于80%,高于85%,高于90%,高 于95%,高于96%,高于97%,高于98%,高于99%或甚至100%同一性的α-淀粉酶。 [0262] 另一种优选的酸性α-淀粉酶来源于黑曲霉菌株。在一个优选实施方案中,所述酸 性真菌α-淀粉酶是来自黑曲霉、作为“AMYA_ASPNG”以初级登录号P56271公开于Swiss- prot/TeEMBL数据库并更具体描述于WO 89/01969(实施例3)的α-淀粉酶。所述酸性黑曲霉 酸性α-淀粉酶在WO 2004/080923(Novozymes)(通过提述并入本文)亦显示于SEQ ID NO:1。 还涵盖了所述酸性真菌淀粉酶与WO 2004/080923中的SEQ ID NO:1具有至少70%同一性, 如至少80%或甚至至少90%同一性,如至少95%,至少96%,至少97%,至少98%,或至少 99%同一性的变体。合适的商业上可获得的来源于黑曲霉的酸性真菌α-淀粉酶为SP288(可 从Novozymes A/S,Denmark获得)。 [0263] 在一个优选实施方案中,所述α-淀粉酶来源于川地曲霉,并公开于Kaneko等 , 1996,J.Ferment.Bioeng.81:292-298“, Molecular-cloning and determination of the nucleotide-sequence of a gene encoding an acid-stable alpha-amylase from Aspergillus kawachii";并进一步作为EMBL:#AB008370公开。 [0264] 所述真菌酸性α-淀粉酶亦可为包含糖结合模块(CBM)和α-淀粉酶催化域的野生型 酶(即,非杂合体),或其变体。在一个实施方案中,所述野生型酸性α-淀粉酶来源于川地曲 霉的菌株。 [0265] 真菌杂合α-淀粉酶 [0266] 在一个优选实施方案中,所述真菌酸性α-淀粉酶是杂合α-淀粉酶。真菌杂合α-淀 33 CN 111593035 A 说 明 书 31/37 页 粉酶的优选实例包括WO 2005/003311或美国申请公开号2005/0054071(Novozymes)或美国 申请号60/638,614(Novozymes)中公开的那些,其通过提述并入本文。杂合α-淀粉酶可包含 α-淀粉酶催化域(CD)和糖结合域/模块(CBM)和任选的接头。 [0267] 涵盖的杂合的α-淀粉酶的具体实例包括美国申请号60/638,614中公开的那些,其 包括具有催化域JA118和罗耳阿太菌(Athelia rolfsii)SBD的Fungamyl变体(美国申请号 60/638,614中的SEQ ID NO:100),具有罗耳阿太菌AMG接头和SBD的微小根毛霉α-淀粉酶 (美国申请号60/638,614中的SEQ ID NO:101),和具有罗耳阿太菌葡糖淀粉酶接头和SBD的 巨多孔菌α-淀粉酶(美国申请号60/638,614中的SEQ ID NO:102)。 [0268] 涵盖的杂合的α-淀粉酶的其他具体实例包括公开于美国申请公开号2005/ 0054071中的那些,包括公开于第15页表3中的那些,如具有川地曲霉接头和淀粉结合域的 黑曲霉α-淀粉酶。 [0269] 商业性α-淀粉酶产品 [0270] 优选的包含α-淀粉酶的商业性组合物包括来自DSM(Gist Brocades)的MYCOLASE, BANTM,TERMAMYLTM SC,FUNGAMYLTM,LIQUOZYMETM X和SANTM SUPER,SANTM EXTRA L(Novozymes A/S)和CLARASETM L-40,000,DEX-LOTM,SPEZYMETM FRED,SPEZYMETM AA,SPEZYMETM Ethyl, GC358,GC980,SPEZYMETM RSL,以及SPEZYMETM DELTA AA(Genencor Int.),以及以商品名 SP288出售的酸性真菌α-淀粉酶(可从Novozymes A/S,Denmark获得)。 [0271] 根据本发明,酸性α-淀粉酶可以以0.1至10AFAU/g DS,优选0.10至5AFAU/g DS,特 别是0.3至2AFAU/g DS的量添加。 [0272] 糖浆的产生 [0273] 本发明还提供了使用本发明的葡糖淀粉酶从含淀粉材料产生糖浆如葡萄糖等的 工艺。合适的起始材料例示于上文的“含淀粉材料”部分。一般而言,所述工艺包括在α-淀粉 酶的存在下部分水解含淀粉材料(液化),然后进一步在本发明的葡糖淀粉酶存在下糖化从 淀粉或相关的寡糖或多糖分子的非还原端释放的葡萄糖的步骤。 [0274] 可如上所述进行液化和糖化以供发酵产物的产生。 [0275] 本发明的葡糖淀粉酶亦可以固定化的形式使用。对于产生特种糖浆,如麦芽糖糖 浆,以及进一步对于涉及果糖糖浆如高果糖糖浆(HFS)的产生的寡糖萃余液流而言,这是合 适并常用的。 [0276] 因此本发明的该方面涉及从含淀粉材料产生糖浆的方法,包括: [0277] (a)在α-淀粉酶存在下液化含淀粉材料,和 [0278] (b)使用本发明的葡糖淀粉酶糖化在步骤(a)中获得的材料。 [0279] 可从步骤(b)中获得的糖化的材料回收糖浆。 [0280] 对于合适条件的细节可见于上文。 [0281] 酿造 [0282] 本发明的葡糖淀粉酶亦可用于酿造工艺。本发明的葡糖淀粉酶以本领域技术人员 容易地确定的有效量添加。 [0283] 本文中所述和要求保护的发明的范围并不受本文中公开的具体实施方案所限,因 为这些实施方案旨在说明本发明的多个方面。旨在将任何等同的实施方案包含于本发明的 范围之内。事实上,根据前述的描述,除了本文中显示和描述的之外,本发明的多种修饰对 34 CN 111593035 A 说 明 书 32/37 页 于本领域技术人员会是显而易见的。亦旨在将此类修饰包含于所附权利要求的范围之内。 在出现冲突时,以包括定义在内的本公开为准。 [0284] 本文中引用了多个参考文献,其公开以全文提述的方式并入本文。本发明进一步 通过下述实施例描述,其不应视作对本发明的范围的限制。 [0285] 材料和方法 [0286] 酵母:可从Red Star/Lesaffre,USA获得的RED STARTM [0287] 培养基和试剂: [0288] 用作缓冲液和底物的化学品为至少试剂级的商品。 [0289] PDA:39g/L Potato Dextrose Agar,20g/L琼脂,50ml/L甘油 [0290] 方法 [0291] 除非另行指明,DNA操作和转化使用Sambrook等(1989)Molecular cloning:A laboratory manual,Cold Spring Harbor lab.,Cold Spring Harbor,NY;Ausubel,F.M. 等(eds .)"Current protocols in Molecular Biology",John Wiley and Sons ,1995; Harwood ,C.R.,和Cutting,S.M.(eds.)"Molecular Biological Methods for Bacillus" .John Wiley and Sons,1990中所述的分子生物学标准方法进行。 [0292] 葡糖淀粉酶活性 [0293] 葡糖淀粉酶活性可用AGI单位或葡糖淀粉酶单位(AGU)测定。 [0294] 葡糖淀粉酶活性(AGI) [0295] 葡糖淀粉酶(等价于淀粉葡糖苷酶)将淀粉转化为葡萄糖。葡萄糖的量在本文中通 过供活性确定的葡萄糖氧化酶方法来确定。该方法描述于“Approved methods of the American Association of Cereal Chemists”.Vol .1-2AACC ,from American Association of Cereal Chemists,(2000);ISBN:1-891127-12-8的部分76-11Starch— Glucoamylase Method with Subsequent Measurement。 [0296] 一个葡糖淀粉酶单位(AGI)为在方法的标准条件下每分钟产生1微摩尔葡萄糖的 酶的量。 [0297] 标准条件/反应条件 [0298] [0299] 所述淀粉应为Litner淀粉,其为在实验室中用作色度指示剂的低粘度淀粉(thin- boiling)。Linter淀粉是通过对天然淀粉进行稀盐酸处理使其保留与碘反应呈蓝色的能力 而获得的。 [0300] 葡糖淀粉酶活性(AGU) [0301] Novo Glucoamylase Unit(AGU)定义为在37℃,pH4.3,底物:麦芽糖23.2mM,缓冲 35 CN 111593035 A 说 明 书 33/37 页 液:乙酸盐0.1M,反应时间5分钟的标准条件下每分钟水解1微摩尔麦芽糖的酶量。 [0302] 可使用自动分析系统。将变旋酶添加到葡萄糖脱氢酶试剂中,使得任何存在的α- D-葡萄糖转化为β-D-葡萄糖。葡萄糖脱氢酶特异性地与β-D-葡萄糖在上述反应中反应,形 成NADH,其使用光度计在340nm处测定作为起始葡萄糖浓度的量度。 [0303] [0304] [0305] [0306] 更详细描述此分析方法的文件夹(EB-SM-0131 .02/01)可根据要求由Novozymes A/S,Denmark得到,其通过提述并入本文。 [0307] α-淀粉酶活性(KNU) [0308] α-淀粉酶活性可使用马铃薯淀粉作为底物来确定。该方法基于酶对于改性马铃薯 淀粉的分解,并通过将淀粉/酶溶液的样本与碘溶液混合来跟踪反应。起初,形成了蓝黑色 (blackish blue),但在淀粉分解过程中,蓝色越来越淡,并逐渐变为红棕色(reddish- brown),将其和有色玻璃标准(colored glass standard)进行比较。 [0309] 一个千Novoα-淀粉酶单位(KNU)定义为在标准条件下(即,在37℃ /-0 .05; 0.0003M Ca2 ;以及pH 5.6)糊精化5260mg的淀粉干底物Merck Amylum Solubile所需的酶 量。 [0310] 更详细描述该分析方法的文件夹EB-SM-0009.02/01可根据要求由Novozymes A/ S,Denmark得到,其通过提述并入本文。 [0311] 酸性α-淀粉酶活性 [0312] 当根据本发明使用时,任何酸性α-淀粉酶的活性可以用AFAU(酸性真菌α-淀粉酶 单位)测量。或者,酸性α-淀粉酶的活性可用AAU(酸性α-淀粉酶单位)测量。 36 CN 111593035 A 说 明 书 34/37 页 [0313] 酸性α-淀粉酶单位(AAU) [0314] 酸性α-淀粉酶活性可用AAU(酸性α-淀粉酶单位)测量,其为绝对方法。一个酸性淀 粉酶单位(AAU)为在标准化条件下每小时将1g的淀粉(100%的干物质)转化为在与已知强 度的碘溶液反应之后在620nm具有与一种色度参照相同的发射(transmission)的产物的 量。 [0315] 标准条件/反应条件: [0316] [0317] 所述淀粉应为Litner淀粉,其为在实验室中用作色度指示剂的低粘度淀粉。 Linter淀粉是通过对天然淀粉进行稀盐酸处理使其保留与碘反应呈蓝色的能力而获得的。 更多细节可见于EP 0140410 B2,其通过提述并入本文。 [0318] 酸性α-淀粉酶活性(AFAU) [0319] 酸性α-淀粉酶活性可以AFAU(酸性真菌α-淀粉酶单位)进行测量,其相对于酶标准 物来确定。1 AFAU定义为在下面提及的标准条件下每小时降解5.260mg淀粉干物质的酶量。 [0320] 酸性α-淀粉酶,其为内切α-淀粉酶(1,4-α-D-葡聚糖-葡糖水解酶,E.C.3.2.1.1) 水解淀粉分子内部区域中的α-1,4-葡糖苷键以形成具有不同链长的寡糖和糊精。与碘形成 的颜色的强度与淀粉浓度成正比。使用反向比色法(reverse colorimetry)在规定的分析 条件下测定淀粉浓度的降低作为淀粉酶活性。 [0321] [0322] 标准条件/反应条件 37 CN 111593035 A 说 明 书 35/37 页 [0323] [0324] 更详细描述该分析方法的文件夹EB-SM-0259.02/01可根据要求由Novozymes A/ S,Denmark得到,其通过提述并入本文。 [0325] 实施例1: [0326] 用篱边粘褶菌AMG的同时糖化和发酵(SSF) [0327] 在不同酶剂量测量了粘褶菌属菌种葡糖淀粉酶的SSF性能。发酵在下述条件下运 行: [0328] 底物:将磨碎的玉米用逆流制浆,并将其干物质调整至大约32%(w/w)。然后将其 在85℃和pH 5.8液化。液化的醪液具有13.4的DE。 [0329] 温度:32℃ [0330] 起始pH:5.0 [0331] 酶剂量:在黑曲霉中以30、40、55和70微克酶蛋白/g DS产生粘褶菌属菌种AMG。将 酶与在相同剂量给药的商业性埃默森踝节菌(Talaromyces emersonii)AMG的纯化样品相 比较。埃默森踝节菌AMG的最高剂量等价于0.56AGU/g DS的产业上有意义的量。使用过量的 商业性AMG和α-淀粉酶制备针对最大可获得的糖化的对照。 [0332] 发酵 [0333] 向对于SSF的底物添加1000ppm尿素作为氮源和3ppm青霉素以控制细菌,用H2SO4将 pH调整至5.0。将5g醪液的等分试样转移至在顶部钻孔以供CO2释放的15ml离心管。添加酶 和酵母,并将试管置于水浴中,在32℃无搅拌放置54小时。 [0334] 在HPLC中分析样品以供确定在发酵过程中产生的乙醇。结果示于下表: [0335] 38 CN 111593035 A 说 明 书 36/37 页 [0336] [0337] [0338] 实施例2: [0339] 比较粘褶菌属菌种AMG的比活性与瓣环栓菌AMG [0340] 比活性通过将葡糖淀粉酶AGU活性(根据如上所述的方法)除以来自每种制备物的 酶蛋白(AA分析)来计算。下表显示对于不同粘褶菌属菌种AMG相对于瓣环栓菌AMG的结果。 [0341] [0342] 生物材料的保藏 39 CN 111593035 A 说 明 书 37/37 页 [0343] 下述的生物材料已经依据布达佩斯条约的条款保藏于德意志微生物和细胞培养 保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSM) , Mascheroder Weg 1 B,D-38124Braunschweig,Germany,并给予下述的登录号: [0344] 保藏物:具有包含序列D7279(SEQ ID NO:1)的质粒的大肠杆菌菌株NN059223 [0345] 登录号:DSM 23222 [0346] 保藏日期:2010年1月13日 [0347] 所述菌株于下述条件下保藏:确保在本专利申请未决期间,依据该外国专利法律 的授权的人能够获得所述培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交 了该申请的副本,或其后续文本的国家,依据该外国专利法律可以获得所述保藏物。然而, 应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予 的专利权的侵犯。 40 CN 111593035 A 序 列 表 1/55 页 41 CN 111593035 A 序 列 表 2/55 页 42 CN 111593035 A 序 列 表 3/55 页 43 CN 111593035 A 序 列 表 4/55 页 44 CN 111593035 A 序 列 表 5/55 页 45 CN 111593035 A 序 列 表 6/55 页 46 CN 111593035 A 序 列 表 7/55 页 47 CN 111593035 A 序 列 表 8/55 页 48 CN 111593035 A 序 列 表 9/55 页 49 CN 111593035 A 序 列 表 10/55 页 50 CN 111593035 A 序 列 表 11/55 页 51 CN 111593035 A 序 列 表 12/55 页 52 CN 111593035 A 序 列 表 13/55 页 53 CN 111593035 A 序 列 表 14/55 页 54 CN 111593035 A 序 列 表 15/55 页 55 CN 111593035 A 序 列 表 16/55 页 56 CN 111593035 A 序 列 表 17/55 页 57 CN 111593035 A 序 列 表 18/55 页 58 CN 111593035 A 序 列 表 19/55 页 59 CN 111593035 A 序 列 表 20/55 页 60 CN 111593035 A 序 列 表 21/55 页 61 CN 111593035 A 序 列 表 22/55 页 62 CN 111593035 A 序 列 表 23/55 页 63 CN 111593035 A 序 列 表 24/55 页 64 CN 111593035 A 序 列 表 25/55 页 65 CN 111593035 A 序 列 表 26/55 页 66 CN 111593035 A 序 列 表 27/55 页 67 CN 111593035 A 序 列 表 28/55 页 68 CN 111593035 A 序 列 表 29/55 页 69 CN 111593035 A 序 列 表 30/55 页 70 CN 111593035 A 序 列 表 31/55 页 71 CN 111593035 A 序 列 表 32/55 页 72 CN 111593035 A 序 列 表 33/55 页 73 CN 111593035 A 序 列 表 34/55 页 74 CN 111593035 A 序 列 表 35/55 页 75 CN 111593035 A 序 列 表 36/55 页 76 CN 111593035 A 序 列 表 37/55 页 77 CN 111593035 A 序 列 表 38/55 页 78 CN 111593035 A 序 列 表 39/55 页 79 CN 111593035 A 序 列 表 40/55 页 80 CN 111593035 A 序 列 表 41/55 页 81 CN 111593035 A 序 列 表 42/55 页 82 CN 111593035 A 序 列 表 43/55 页 83 CN 111593035 A 序 列 表 44/55 页 84 CN 111593035 A 序 列 表 45/55 页 85 CN 111593035 A 序 列 表 46/55 页 86 CN 111593035 A 序 列 表 47/55 页 87 CN 111593035 A 序 列 表 48/55 页 88 CN 111593035 A 序 列 表 49/55 页 89 CN 111593035 A 序 列 表 50/55 页 90 CN 111593035 A 序 列 表 51/55 页 91 CN 111593035 A 序 列 表 52/55 页 92 CN 111593035 A 序 列 表 53/55 页 93 CN 111593035 A 序 列 表 54/55 页 94 CN 111593035 A 序 列 表 55/55 页 95