logo好方法网

一种获取ADAR蛋白细胞内高效结合的底物序列的方法及底物序列和应用


技术摘要:
本发明公开了一种获取ADAR蛋白细胞内高效结合的底物序列的方法及底物序列和应用。所述方法包括如下步骤:S1.细胞准备及蛋白与RNA交联反应;S2.免疫共沉淀及双链RNA消化,连接,和逆转录;S3.cDNA环化、建库和高通量测序;S4.ADAR底物拼装;S5.高效结合底物的评估。本发  全部
背景技术:
基因突变是许多疾病及癌症发生的关键诱因,目前已经有3000多个基因特定位点 的突变与疾病的发生有关联,随着二代测序技术发展,不论是遗传获得性的基因突变还是 后天生长发育过程中某些体细胞的基因突变都可以通过二代测序技术获得突变位点信息, 并且通过关联分析找到与疾病发生直接相关的突变位点。但目前各种肿瘤在不同的人群中 会有不同的突变位点及突变类型,这样开发不同的靶向药物具有一定的难度,而基因疗法 可直接对基因的突变位点进行修复。CRISPR(Clustered  regμLarly  interspaced  short  palindromic  repeats)最早发现于细菌免疫系统中,结合cas蛋白抵抗外源病毒的入侵。目 前CRISPR/Cas技术已经广泛应用到生物医学及农业学研究中。CRISPR/Cas技术可以在真核 细胞基因组水平引入正确编码的全长基因拷贝,也可以沉默产生突变的基因的表达、对突 变位点进行定点修复。在2014年已经有第一例报道成功利用CRISPR技术对地中海贫血症进 行临床治疗。地中海贫血症由HBB基因突变引起的血红蛋白水平降低造成。该研究团队将患 者皮肤成纤维细胞诱导分化成多能干细胞并用CRISPR/Cas9技术修复突变位点,并将修复 后的干细胞诱导成红细胞前体细胞并重新移植到患者体内达到治疗目的。但CRISPR/Cas系 统也有其不可避免的缺点,该系统需要同时表达Cas蛋白及导向RNA(gRNA)及提供同源修复 DNA序列,且在多篇研究报道中都检测出其在DNA水平或RNA水平有明显的脱靶效应, CRISPR/Cas蛋白切割基因组DNA造成DSB(double-strand  break),脱靶会造成基因组的不 稳定性以及不可预测的细胞命运。此外,CRISPR/Cas系统还可能会引发细胞固有免疫反应, 例如,金黄色葡萄球菌来源的Cas9蛋白会诱导血液中的T细胞产生炎症反应进而引起组织 坏死。CRISPR/Cas系统的严重缺陷造成其临床应用的局限性,故开发更加安全有效的基因 疗法是目前具有巨大临床价值的研究。 A-to-I(腺苷到肌苷)RNA编辑是ADAR蛋白家族介导的且在后生动物中广泛存在的 一种RNA修饰方式。A碱基发生脱氨基反应转变成I碱基,继而在细胞内被识别成G碱基,故 ADAR蛋白可以在RNA水平逆转基因组上的G到A的突变。目前已知的报道中约20,000种G-to- A的突变都与疾病的发生发展有关联。相比CRISPR/Cas系统的基因组编辑方法,ADAR介导的 RNA水平的可逆的编辑不会影响基因组序列,且可通过改变RNA序列使得突变的蛋白序列得 到修复。最新的研究表明利用ADAR2的一段双链RNA底物序列作为ADAR1蛋白招募序列,结合 一段特定位点的互补靶向序列构建出adRNA(ADAR  guide  RNA)可对內源基因特定位点的A 进行编辑。该方法的优势在于其不需表达其他外源蛋白,仅需要将adRNA片段导入到细胞内 便可招募细胞內源的ADAR1蛋白发挥编辑功能,该方法不会引起脱靶效应也不会引起细胞 3 CN 111593093 A 说 明 书 2/24 页 固有免疫反应。但该方法目前的局限性编辑效率不够高。为了提高adRNA介导的A-to-I编辑 效率,最终达到临床治疗的目的,则需要在全基因组水平找出ADAR的高亲和力底物,从而合 成更高效的adRNA。但由于ADAR作用的双链RNA底物研究的空缺,使得利用ADAR蛋白结合 adRNA修复与疾病相关的G-to-A突变方法难以得到广泛的临床应用。同时,目前用于研究蛋 白与RNA相互作用的方法,例如hiCLIP和CLASH等,获取的嵌合体比例少且实验耗时长,均无 法有效用于ADAR蛋白作用底物信息的获取。
技术实现要素:
本发明的目的在于克服现有技术中存在的上述缺陷和不足,提供一种获取ADAR蛋 白细胞内高效结合的底物序列的方法。 本发明的另一目的在于提供上述方法获得的底物序列。 本发明的再一目的在于提供上述方法和底物序列的应用。 本发明的上述目的是通过以下技术方案给予实现的: 一种获取ADAR蛋白细胞内高效结合的底物序列的方法,包括如下步骤: S1.在细胞中过表达ADAR蛋白,再交联蛋白质和RNA; S2 .裂解细胞,免疫共沉淀蛋白与RNA交联复合体,消化未被蛋白保护的RNA,用 TSAP酶对消化后的RNA进行去磷酸化处理,接着用T4  PNK对RNA的5’末端做磷酸化修饰,进 行RNA分子间连接,然后对连接后的RNA末端加接头,纯化120kb~200kb大小范围的蛋白及 RNA复合体并提取RNA后进行逆转录反应得cDNA; S3 .以步骤S2获得的cDNA为模板做环化反应,纯化后再线性化并进行两轮PCR扩 增,第二轮PCR时在扩增产物两端分别接上测序文库3'接头和5'接头,对构建好的文库进行 高通量测序; S4.将高通量测序获取的序列信息去接头、质控、基因组对比,将读长比对到转录 组,丢弃比对上的读长,保留未比对上的读长并记录为U1;把U1读长比对到基因组并丢弃连 续比对上的读长,保留未比对上的读长并记录为U2;把U2读长比对到基因组,把唯一且不连 续的比对上的读长记录为嵌合体读长并记录为U3;把U3读长比对到基因组上,并且根据比 对结果对U3进行重新组合;把重组之后的读长比对到基因组上,并提取嵌合体读长;再对上 述结果进行整合,获得完整的嵌合体读长集;再以嵌合体两条臂读长为中心取交集后再分 别与非嵌合体读长取交集,重组后的双臂读长再进行结构预测截取出双链RNA底物序列,分 别以左臂L和右臂R为标记注释其序列信息组装出ADAR蛋白的作用底物序列。 本发明开发了一种获取ADAR蛋白细胞内高效结合的底物序列的方法,又称为 irCLASH(infrared  cross-linking,ligation,and  sequencing  of  hybrids),本发明从实 验及生物信息学的角度填补现有ADAR蛋白结合底物研究存在的空缺;通过实验技术及后续 的双链RNA底物的生物信息学组装方法,获取高亲和力的ADAR双链RNA底物。主要为在步骤 S2实验上,通过TSAP酶和T4  PNK的组合使用,提高RNA分子间的连接效率,进而提高后续嵌 合体读长的得率;同时在步骤S4数据处理时考虑双链RNA在连接的过程中会发生两种连接 情况:即第一条链的3’端连接到第二条链的5’端和第一条链的5’端连接到第二条链的3’ 端,在比对到基因组步骤中增加了一轮数据处理,从而可以从未比对到基因组的序列中回 收一定量的嵌合体读长,显著提高嵌合体读长的得率;再通过自行开发的底物拼接方法,最 4 CN 111593093 A 说 明 书 3/24 页 终获得了ADAR蛋白在细胞内高效结合的底物序列。同时步骤S3选择对cDNA进行环化代替直 接在cDNA  5’末端加接头,此方法显著降低了实验操作的复杂度及实验耗时。 优选地,本发明上述方法还包括后续的高效结合底物的评估,为利用生物信息学 软件bpRNA结合转录组的RNA编辑位点编辑水平高低解析利用上述方法获取的ADAR对底物 结合及编辑的偏好性,将有助于后续对靶向位点编辑的序列设计。 优选地,步骤S1为在细胞中过表达携带外源蛋白标签的ADAR蛋白;从而更易被抗 体识别,提高抗体在免疫共沉淀RNA时的特异性。 更优选地,所述外源蛋白标签为3×FLAG标签。以提高抗体在免疫共沉淀RNA时的 特异性,很大程度上也提高了后续组装的ADAR底物的特异性及准确性。 具体地,所述ADAR蛋白为ADAR1、ADAR2或ADAR3蛋白; 优选地,所述ADAR蛋白为ADAR1。 优选地,步骤S1所述交联为紫外交联。 优选地,步骤S2所述消化为利用RNA酶进行消化。 优选地,步骤S2所述RNA分子间连接为采用T4  RNA  ligase  I连接。 优选地,步骤S2所述接头为iR800染料标记的接头,免除了放射性标记接头可能引 起的信号衰减问题及降低对实验环境的要求。 本发明还提供由上述任一所述方法获得的ADAR蛋白高效结合的底物序列,每段底 物序列包括左臂(L)和右臂(R),其核苷酸序列依次如SEQ  ID  NO:1~SEQ  ID  NO:100所示; 所述底物核苷酸序列在细胞内可形成能够招募ADAR蛋白的双链RNA。 本发明上述方法可获得ADAR蛋白在细胞内高效结合的底物序列,而所述底物核苷 酸序列能够在细胞内可形成能够招募ADAR蛋白的双链RNA,同时再结合一段特定位点的互 补靶向序列便可构建出adRNA,可对特定位点的A进行编辑,实现定点靶向RNA编辑。 因此,本发明请求保护上述任一所述方法或上述任一所述ADAR蛋白高效结合的底 物序列在定点靶向RNA编辑中的应用,具体是在ADAR介导的定点靶向RNA编辑中的应用 以及上述任一所述方法或上述任一所述ADAR蛋白高效结合的底物序列在制备RNA 基因治疗药物中的应用,具体是在ADAR介导的RNA基因治疗药物中的应用。 与现有技术相比,本发明具有以下有益效果: (1)本发明首次开发了一种获取ADAR蛋白细胞内高效结合的底物序列的方法 irCLASH,本发明从实验及生物信息学的角度填补现有ADAR结合底物研究存在的空缺,可获 得大量的ADAR蛋白高效结合底物序列。 (2)本发明方法与现有其他研究蛋白与RNA相互作用的方法相比,可显著提高嵌合 体读长的得率,可最大限度提高了ADAR蛋白作用底物的构建数量,同时缩短实验耗时、简化 了实验操作。 (3)本发明获得了大量的高亲和力的ADAR蛋白双链RNA底物,且具有与目前已报道 的其他底物相当的定点编辑能力,为ADAR介导的靶向RNA编辑提供更多可供选择的ADAR蛋 白招募序列。 附图说明 图1为本发明开发的irCLASH实验方法整体流程。 5 CN 111593093 A 说 明 书 4/24 页 图2为本发明开发的irCLASH实验测序文库数据分析流程。 图3为本发明开发的irCLASH实验耗时与其他发表的方法对比,结果显示本发明的 方法大大的缩短了实验耗时。 图4为本发明开发的irCLASH实验及数据分析方法得到的嵌合体读长比例与目前 发表的其他蛋白的同类方法的比较,结果表明本发明的方法可显著提高嵌合体读长的得 率,这有助于充分解析dsRBP底物的特性。 图5为发明在数据处理上提高在嵌合体读长比例的方法,即通过此步的数据处理 可回收一定比例的嵌合体读长。目前已发表的同类方法都忽略了此部分数据。 图6为本发明开发的ADAR1双链RNA底物构建方法。该方法的核心是以嵌合体两条 臂读长为中心取交集后再分别与非嵌合体读长取交集,重组后的双臂读长再进行结构预测 截取出双链RNA底物序列,分别以左臂(L)和右臂(R)为标记注释其序列信息。 图7为从本发明构建的ADAR1底物图谱中抽取的随机高亲和力的底物,截取其中的 部分序列构建ADAR1介导的靶向定点RNA编辑。 图8为本发明开发的底物应用到ADAR1介导的靶向定点RNA编辑,结果表明,本发明 构建的底物能够达到与目前已报道的其他底物相当的定点编辑能力。
下载此资料需消耗2积分,
分享到:
收藏