logo好方法网

纳米孔SBS信号的标准化和基线移位移除


技术摘要:
一种使用测序单元(300)的方法包括:跨测序单元之上施加交流电压(328),同时对核酸测序(332),从测序单元获取多个信号值(P(ti)),同时将标签分子(338)样式匹配到测序单元的纳米孔(316)中,以及获取与多个获取的信号值(P(ti))的相应值相互关联的多个相互关联的  全部
背景技术:
具有在内径方面约为一纳米的孔大小的纳米孔膜器件在快速核苷酸测序方面显 示出前景。当电势施加在浸入导电流体中的纳米孔之上时,归因于离子在纳米孔之上的传 导,可以存在小的离子电流。电流的大小对孔大小以及哪个分子在纳米孔中是敏感的。该分 子可以是附接到特定核苷酸的特定标签,由此允许在核酸的特定位置处的核苷酸检测。可 以测量包括纳米孔的电路中的电压(例如,在积分电容器处),作为测量分子电阻的方式,由 此允许检测哪个分子在纳米孔中。 基于纳米孔的测序芯片可以被用于DNA测序。基于纳米孔的测序芯片可以并入被 配置为阵列的大量传感器单元。例如,一百万个单元的阵列可以包括1000行乘1000列的单 元。 由于制造可变性,被测量的电压可能因不同芯片以及因同一芯片的不同单元而不 同。因此,可能难以确定正确的分子,该正确的分子可以是或可以对应于细胞中特定核酸或 其他聚合物中的正确核苷酸。此外,所测量的电压中其他时间依赖的非理想性也会导致不 准确性。并且,因为这些电路采用生物化学电路元件,例如,脂质双分子层、纳米孔等,所以 电特性中的可变性可以比针对传统半导体电路的高得多。 因此,期望信号标准化技术来改进测序过程的准确性和稳定性。
技术实现要素:
各种实施例提供了与处理来自基于多单元纳米孔的测序芯片的单元的输出信号 有关的技术和系统。可以通过采用本文中公开的各种实施例来构建改进的基于多单元纳米 孔的测序芯片。例如,实施例可以包括用于实行测序信号处理的系统和方法,其可以补偿可 以由例如零点电压波动/漂移、增益漂移和基线移位引起的测序信号中的非理想性。 根据一个实施例,可以通过使用改进的信号处理技术来补偿测序信号中的非理想 性,该改进的信号处理技术可以更有效地补偿测序信号中诸如基线移位引发的误差之类的 影响。该技术可以包括:通过将每个亮模式信号值与对应的相互关联的信号值相关联,根据 一维亮模式信号值来生成二维信号值,即,二维数据点。二维数据点然后可以被用来确定一 个或多个二维变换,该一个或多个二维变换可以减少亮模式数据中的方差。该技术还可以 包括:将二维变换应用于新获取的亮模式信号值,以减少新获取的亮模式信号值中的方差。 根据另一个实施例,可以通过改进的信号处理系统和方法来补偿测序信号中的非 理想性,该系统和方法采用暗模式信号作为从亮模式信号中减去的基线。暗模式信号是在 AC信号的“暗模式”时期期间获取的,当暗模式信号被施加到测序单元时,标签被施加的电 场推出纳米孔的圆筒。例如,为了补偿单元的零点电压中的波动,可以通过从亮模式开放通 5 CN 111615629 A 说 明 书 2/36 页 道信号值和亮模式匹配样式(threaded)信号值二者中减去暗模式信号值来计算零点补偿 信号值。零点补偿信号值可以被用作对其他中间处理阶段的输入,该其他中间处理阶段例 如是采用如下所述的运行(running)直方图和/或二维处理方法的阶段。即使零点电压本身 的值是未知的,该技术也可以针对由诸如在单元的零点电压中的变化和/或漂移之类的现 象所引发的误差来校正测序信号。 根据另一个实施例,可以使用改进的信号处理技术来确定标准化因子的改进的估 计。该技术可以使用运行/移动直方图来基于在任何时刻处的历史测量结果的集合确定在 该时刻处的开放通道孔状态(例如,孔中没有标签)。历史数据对直方图的贡献可以通过根 据历史数据的经时(age)对其进行加权/折现(discount)来控制。用于在对利用孔中的标签 所测量的信号进行标准化时使用的标准化因子可以被确定为与运行/移动直方图中的最大 峰值相关联的测序信号值。 以上技术可以独立地使用或以任何组合或次序使用,以改进基于纳米孔的测序单 元的测序信号。以上技术中的一个或多个也可以在逐单元的基础上应用,以改进基于多单 元纳米孔的测序芯片的测序信号。 其他实施例涉及与本文中描述的方法相关联的系统和计算机可读介质。 参照以下详细描述和附图,可以得到对本发明实施例的性质和优点的更好理解。 附图说明 图1是具有纳米孔单元的阵列的纳米孔传感器芯片的实施例的俯视图。 图2图示了可以被用来表征多核苷酸或多肽的纳米孔传感器芯片中的纳米孔单元 的实施例。 图3图示了使用基于纳米孔的合成测序(纳米-SBS)技术实行核苷酸测序的纳米孔 单元的实施例。 图4图示了纳米孔单元中的电路的实施例。 图5示出了在AC循环的亮时期和暗时期期间从纳米孔单元捕获的示例数据点。 图6A-6B图示了根据一些实施例的理想化ADC信号的标准化概念。 图7示出了根据某些实施例的遭受增益漂移影响的理想化信号。 图8示出了根据某些实施例的展现基线移位的理想化信号。 图9示出了在近似5秒的过程之内从纳米孔单元测量到的原始测序信号的样本数 据的一个示例。 图10示出了图示了根据某些实施例的用于处理测序信号以移除非零和变化的V0 的影响的方法1000的流程图。 图11示出了根据某些实施例的已经仅使用逐点开放通道标准化例程来标准化的 数据的示例,该逐点开放通道标准化例程使用开放通道值来标准化所测量的亮模式信号。 图12A-12C示出了根据某些实施例的通过在暗-亮平面中旋转进行的偏移移位校 正。 图13A-13B示出了图示了根据某些实施例的通过由积分历史值和亮值限定的2D平 面中的变换进行偏移移位校正的方法的标绘图。 图14示出了图示了根据某些实施例的使用测序单元的方法1400的流程图。 6 CN 111615629 A 说 明 书 3/36 页 图15示出了图示了根据某些实施例的使用测序单元的方法的流程图。 图16A和图16B示出了根据某些实施例的仅通过逐点标准化处理的与通过在积分 历史亮模式平面中的二维变换、继之以逐点标准化处理的样本数据的比较。 图17示出了一个示例运行直方图1701,其可以根据类似于图16B中所示的经处理 的测序信号数据来计算。 图18示出了图示了根据某些实施例的使用测序单元的方法的流程图。 图19示出了根据一些实施例的用于标准化和偏移校正的示例系统。 图20是根据本公开的某些方面的计算机系统。 术语 除非另行限定,否则本文中使用的技术和科学术语具有与本领域普通技术人员通常理 解的相同的含义。与本文中描述的方法、设备和材料类似或等同的方法、设备和材料可以在 所公开技术的实践中使用。提供以下术语以便于理解某些频繁使用的术语,并且不意味着 限制本公开的范围。本文中使用的缩写在化学和生物领域内具有其常规含义。 “核酸”可以指代采用单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合 物。该术语可以涵盖含有已知核苷酸类似物或修饰的主链残基或键的核酸,该已知核苷酸 类似物或修饰的主链残基或键是合成的、天然存在的和非天然存在的,它们具有与参考核 酸类似的结合属性,并且以与参考核苷酸类似的方式代谢。这样的类似物的示例可以包括 但不限于硫代磷酸酯、亚磷酰胺、甲基膦酸酯、手性甲基膦酸酯、2-O-甲基核糖核苷酸、肽核 酸(PNA)。除非另行指示,否则特定的核酸序列也隐含地涵盖其保守修饰的变体(例如,简并 密码子替换)和互补序列,以及明确指示的序列。具体地,简并密码子替换可以通过生成序 列来实现,在所述序列中,一个或多个所选(或所有)密码子的第三位置被用混合碱基和/或 脱氧肌苷残基替换(Batzer等人,Nucleic  Acid  Res .  19:5081(1991);Ohtsuka等人,J.  Biol .  Chem .  260:2605-2608(1985);Rossolini等人,Mol .  Cell .  Probes  8:91-98  (1994))。术语核酸可以与基因、cDNA、mRNA、寡核苷酸和多核苷酸可交换地使用。 术语“模板”可以指代被拷贝到DNA核苷酸中用于DNA合成的互补链中的单链核酸 分子。在一些情况下,模板可以指代在mRNA的合成期间拷贝的DNA序列。 术语“引物”可以指代为DNA合成提供起始点的短核酸序列。诸如DNA聚合酶之类的 催化DNA合成的酶可以为用于DNA复制的引物添加新的核苷酸。 “聚合酶”可以指代实行多核苷酸的模板导向合成的酶。该术语涵盖全长多肽和具 有聚合酶活性的结构域二者。DNA聚合酶是本领域技术人员公知的,并且包括但不限于隔离 自或源自激烈火球菌、嗜热高温球菌和海洋热球菌或其修饰形式的DNA聚合酶。它们包括依 赖于DNA的聚合酶和依赖于RNA的聚合酶二者,诸如逆转录酶。已知至少五个依赖于DNA的 DNA聚合酶家族,尽管大多数落入家族A、B和C中。在不同的家族当中几乎没有或没有序列类 似性。大多数家族A聚合酶是单链蛋白质,其可以包含多个酶功能,该多个酶功能包括聚合 酶、3’至5’核酸外切酶活性和5’至3’核酸外切酶活性。家族B聚合酶通常具有单个催化结构 域,其具有聚合酶和3’至5’核酸外切酶活性,以及辅助因子。家族C聚合酶通常是具有聚合 和3’至5’核酸外切酶活性的多亚基蛋白质。在大肠杆菌中,已经发现了三种类型的DNA聚合 酶,即DNA聚合酶I(家族A)、II(家族B)和III(家族C)。在真核细胞中,三个不同的家族B聚合 酶——即DNA聚合酶 、 和 ——与核复制方面有关,并且家族A聚合酶——即聚合酶 7 CN 111615629 A 说 明 书 4/36 页 ——被用于线粒体DNA复制。其他类型的DNA聚合酶包括噬菌体聚合酶。类似地,RNA聚合酶 通常包括真核RNA聚合酶I、II和III,和细菌RNA聚合酶以及噬菌体和病毒聚合酶。RNA聚合 酶可以是依赖于DNA和依赖于RNA的。 “纳米孔”指代在膜中形成或以其他方式提供的孔、通道或通路。膜可以是诸如脂 质双分子层之类的有机膜,或者是诸如由聚合材料形成的膜之类的合成膜。纳米孔可以被 设置成与感测电路或被耦合到感测电路的电极相邻或在其附近,该感测电路诸如例如是互 补金属氧化物半导体(CMOS)或场效应晶体管(FET)电路。在一些示例中,纳米孔具有约为 0.1纳米(nm)至大约1000  nm的特性宽度或直径。在一些实现方式中,纳米孔可以是蛋白质。 术语“核苷酸”除了指代天然存在的核糖核苷酸或脱氧核糖核苷酸单体之外,还可 以被理解成指代包括衍生物和类似物的其相关的结构变体,它们在功能上关于其中使用该 核苷酸(例如,与互补碱基的杂交)的特定环境等同,除非环境另外清楚地指示。 术语“标签”可以指代可检测的部分,其可以是原子或分子,或者是原子或分子的 集合。标签可以提供光学的、电化学的、磁性的或静电的(例如,感应的、电容的)签名,该签 名可以借助于纳米孔来检测。通常,当核苷酸附接到标签时,它被叫做“标记核苷酸”。标签 可以经由磷酸部分附接到核苷酸。 术语“亮时期”通常可以指代由通过AC信号施加的电场强制标记核苷酸的标签进 入纳米孔中的时间段。术语“暗时期”通常可以指代由通过AC信号施加的电场将标记核苷酸 的标签推出纳米孔的时间段。AC循环可以包括亮时期和暗时期。在不同的实施例中,被施加 到纳米孔单元以将纳米孔单元置于亮时期(或暗时期)的电压信号的极性可以不同。亮时期 和暗时期可以对应于交流信号相对于参考电压的不同部分。 术语“信号值”可以指代从测序单元输出的测序信号的值。根据某些实施例,测序 信号可以是从一个或多个测序单元的电路中的一点测量和/或输出的电信号,例如,信号值 可以是(或可以表示)电压或电流。信号值可以表示电压和/或电流的直接测量结果,和/或 可以表示间接测量结果,例如,信号值可以是电压或电流达到指定值所花费的测量的持续 时间。信号值可以表示与纳米孔的电阻率相互关联的任何可测量的量,并且根据该信号值 可以得出纳米孔(匹配样式和/或未匹配样式)的电阻率和/或电导。作为另一个示例,信号 值可以对应于光强度,例如,来自与利用聚合酶被催化成核酸的核苷酸附接的荧光团的光 强度。 术语“直方图”可以指代为指定数量的间隔(分箱)中的每一个存储多个信号值的 计数的数据结构。每个分箱可以对应于信号值的离散值(例如,如由ADC的分辨率确定的)或 对应于间隔内的可能信号值的范围。
分享到:
收藏