2001年,在人类基因组计划的支持下,成功实现了对人类基因组的完整测序。这项测序耗时15年,耗资近30亿美元。此后,开发了高通量测序技术,也称为下一代测序Next Generation Sequencing (NGS),以减少人类基因组测序的时间和成本。 2005年,第一个NGS测序仪由454 Life Sciences公司推送到市场。该测序仪将人类基因组测序的成本降低了50,000倍。

在过去的十年中,NGS技术的发展取得了显著进步,将人类基因组测序的成本降至约1,000美元。更令人兴奋的是,NGS技术已经向市场推出了小型测序仪(仅仅是与微波炉相当的尺寸),将测序时间缩减到几个小时,使基因测序技术能够应用在临床中诊断患者的基因组。这些进步使得基因组测序技术得到了企业家和投资者的关注。目前,最流行的NGS技术是基于 “短序列片段测序”,可以读取多达1000个碱基对base pairs(“bp”)的DNA序列片段。以下是对短序列片段测序NGS中的代表性技术的专利概述。

454 Life Sciences(由罗氏收购)

2005年,位于康涅狄格州的454 Life Sciences推出了第一个NGS测序仪。 2007年,454 Life Sciences发布了对James Watson, DNA结构的共同发现者,的基因组的测序结果。同一年,罗氏以1.549亿美元收购了454 Life Sciences 。 454 Life Sciences的测序技术基于焦磷酸测序,或者称之为,单核苷酸添加single-nucleotide addition(SNA)合成测序法。在这种方法中,DNA被分割成较短的序列片段,不多于1,000 碱基对。将这些DNA片段固定在链霉包被的磁性小颗粒上,每个颗粒上具有一个特定DNA片段。然后通过乳液聚合酶链反应Polymerase Chain Reaction(PCR)扩增DNA片段,在单个颗粒上产生数百万份拷贝(US 7,323,305)。然后,将颗粒分布在刻蚀过的玻璃芯片的单孔中,用于测序。在测序期间,依次加入四种脱氧核苷酸deoxynucleotides(dNTP),即dATP,dCTP,dGTP和dTTP,与DNA序列片段反应。当核苷酸添加到DNA序列片段时,会释放出生物光信号。光信号的强度被记录下来,并转化成DNA片段的序列信息(US 7,335,762,US 7,211,390)。每次反应后,剩余的脱氧核苷酸会被洗去,并接着加入下一种脱氧核苷酸进行反应。通过循环加入四种脱氧核苷酸进行反应,来读取DNA 片段的序列。

Illumina

该领域的另一家著名公司是Illumina,其主要测序技术基于使用固相桥式扩增和循环可逆终止cyclic reversible termination(CRT)合成测序法。就像454的技术一样,在Illumina的测序仪中,DNA被分割成大约200碱基对的序列片段。将这些DNA片段连接到被刻蚀而图案化的玻璃芯片上,使每个图形点中具有一个特定DNA序列(US 7,790,418)。 通过PCR扩增后,每个图形点含有数百万拷贝的特定DNA序列,并将其在测序前分离成单链。在测序期间,加入所有四种有荧光标记和3’羟基端封闭的脱氧核苷酸的混合物进行反应。由于使用3’羟基端封闭的反应终止子,每个循环向DNA序列中只加入单个脱氧核苷酸。荧光信号的颜色显示了与所添加的脱氧核苷酸相对应的DNA序列的碱基信息。进行荧光成像后,反应终止子和荧光标记被移除,进而为DNA序列的下一个脱氧核苷酸的反应做好准备(US 7,115,400)。记录添加的每个脱氧核苷酸信息,也就应对了DNA片段的序列信息。

Ion Torrent

Ion Torrent开发了第一个不使用光信号的NGS测序仪。 该测序技术是依靠化学信号,尤其是离子信号。在Ion Torrent的技术中,DNA被分割成约200碱基对的片段,并固定在小颗粒上进行乳液PCR扩增。扩增后的小颗粒被分散在刻蚀过的玻璃芯片的单孔中,为之后的测序做准备。与454的技术相似,将每种脱氧核苷酸循环添加到单孔中进行反应。记录的信号是由于脱氧核苷酸与DNA序列结合释放H +离子而导致的孔中溶液的pH值变化(US 7,948,015)。

Beijing Genomics InstituteBGI华大基因

华大基因收购了Complete Genomics并改进了Complete Genomics的技术推出了BGISEQ-500。 华大基因使用DNA纳米球技术来扩增DNA序列,并使用联合探针锚定聚合技术combinatorial probe-anchor synthesis(cPAS)来测序。 DNA 纳米球扩增技术是目前唯一液相DNA扩增技术。在该技术中,DNA被分割成约100碱基对的片段。该片段的每一侧与第一种衔接子,即衔接子1连接。连接后的DNA片段被扩增,通过将两端的衔接子结合而形成环状连接的序列片段。该环状DNA片段被切割以加入第二种衔接子,即衔接子2,并重复扩增和环化过程。一旦将四种衔接子,即衔接子1,2,3和4加入到DNA片段中,则通过滚环扩增进一步扩增最后的环状DNA以产生纳米球DNA模板。将DNA纳米球固定在图案化的芯片上用于随后的测序(US 7,709,197,US 8,445,197)。 联合探针锚定聚合技术是从联合探针锚定连接技术combinatorial probe-anchor ligation sequencing(cPAL)(US 8,617,811)发展而来,以增加测量的DNA 序列片段的长度。目前为止,并没有对联合探针锚定聚合技术的详细披露。

Applied Biosystems(现为Thermo Fisher Scientific

Applied Biosystems(ABI)的寡核苷酸连接和检测测序法 Sequencing by Oligonucleotide Ligation and Detection (SOLiD)是边连接边测序的唯一技术。在ABI SOLiD中,DNA序列片段被固定在磁颗粒的表面,并通过乳液PCR扩增。然后,将颗粒共价结合到玻璃芯片上进行测序。该测序法使用双碱基编码方法对DNA片段进行测序。在边连接边测序的过程中,一个具有锚定点和探针的序列复合物会连接到DNA片段上。锚定点具有一段与DNA片段上的衔接子互补的已知序列,并且引发探针的连接。探针是荧光标记的双核苷酸。一旦探针连接到DNA片段上,该荧光图像就被采集下来用以测量双碱基组合。在这种方法中,为了识别其他未知碱基,必须​​已知双碱基组合中的一个碱基。成像后,荧光标记将被移除,新的双碱基探针将与DNA片段连接以供下一次测量(US 8,329,404,US 9,217,177)。双碱基编码方法的优点是序列中的每个碱基在一次测序过程中将被读取两边,从而降低错误率。

短序列片段测序的限制和下一代方法

虽然短序列片段NGS只能处理高达1,000 碱基对的DNA序列,但该测序法可以并行处理数百万到数十亿次序列片段。在短短几个小时内,NGS可以测序到Gbytes的数据。这一技术显著增加了基因组测序的吞吐量,并使在临床诊断和治疗中使用NGS成为可能。然而,由于人类基因组高度复杂,具有许多长序的重复序列,而短序列片段测序不能充分覆盖这些重复区域,由此导致难以精确测量整个基因组的信息或变化。为了解决这个短序列片段测序的问题,目前正在开发新的技术。我们将在下一期讨论这些新技术。

相关专利列表:

专利号 主题 专利权人 发明人
US 7,323,305 Methods of amplifying and sequencing nucleic acids 454 Life Sciences Corporation John H. Leamon; Kenton L. Lohman; Jonathan M. Rothberg; Michael P. Weiner
US 7,335,762 Apparatus and method for sequencing a nucleic acid 454 Life Sciences Corporation Jonathan M. Rothberg; Joel S. Bader; Scott B. Dewell; Keith McDade; John W. Simpson; Jan Berka; Christopher M. Colangelo; Michael P. Weiner
US 7,211,390 Method of sequencing a nucleic acid 454 Life Sciences Corporation Jonathan M. Rothberg; Joel S. Bader; Scott B. Dewell; Keith McDade; John W. Simpson; Jan Berka; Christopher M. Colangelo
US 7,790,418 Isothermal amplification of nucleic acids on a solid support Illumina Cambridge Limited; Illumina, Inc. Pascal Mayer
US 7,115,400 Methods of nucleic acid amplification and sequencing Solexa Ltd. Celine Adessi; Eric Kawashima; Pascal Mayer; Jean-Jacques Mermod; Gerardo Turcatti
US 7,948,015 Methods and apparatus for measuring analytes using large scale FET arrays Life Technologies Corporation Jonathan M. Rothberg; Wolfgang Hinz; Kim L. Johnson; James Bustillo
US 7,709,197 Nucleic acid analysis by random mixtures of non-overlapping fragments Callida Genomics, Inc. Radoje Drmanac
US 8,445,197 Single molecule arrays for genetic and chemical analysis Callida Genomics, Inc. Radoje Drmanac; Matthew J. Callow; Snezana Drmanac; Brian K. Hauser; George Yeung
US 8,617,811 Methods and compositions for efficient base calling in sequencing reactions Complete Genomics, Inc. Radoje Drmanac
US 8,329,404 Reagents, methods, and libraries for bead-based sequencing Applied Biosystems LLC Kevin McKernan; Alan Blanchard; Lev Kotler; Gina Costa
US 9,217,177 Methods for bead-based sequencing APPLIED BIOSYSTEMS, LLC Kevin McKernan; Alan Blanchard; Lev Kotler; Gina Costa