對很多人來說,基因測序儀都是一個很陌生的名詞。然而,如果你感受過獨步世界的中國高鐵技術,見證過中國發(fā)射的量子衛(wèi)星,還聽說過獨占世界超算排行榜長達五年的中國超級計算機,那么處于全球領先地位的中國基因測序儀也絕對值得一探究竟。
人們常說,19世紀是蒸汽機的世紀,20世紀是汽車和計算機的世紀,而21世紀則是生命科學的世紀。生命科學研究將在醫(yī)療健康、體育運動、農(nóng)業(yè)養(yǎng)殖、司法刑偵、太空探索等眾多方面廣泛而深遠地改造人類生活。作為生命科學研究最核心的基礎性工具,基因測序儀已經(jīng)成為當前中美全面科技競爭的重要領域。
什么是基因測序
基因測序技術是基因組學研究的核心技術,是現(xiàn)代生命科學研究中最廣泛應用的重要技術。你可能還不知道,地球上幾乎所有你能看見和看不見的生命形式都是由基因編碼而成的。塞滿商場的人類、賣萌為生的熊貓,爬過陽臺的甲蟲、各類叫不上名字的樹木花草以及數(shù)萬億和我們親密接觸的細菌、微生物,都是由DNA編碼的生命體。
每一個生命都像是執(zhí)行一段代碼的程序,而DNA正是生命的源代碼。相應地,破解生命源代碼的技術,就是DNA測序。
發(fā)現(xiàn)雙螺旋——讓測序成為可能
如果說測序技術的進步是發(fā)掘礦藏的過程,那么還需要先行者告訴我們礦藏的方向和位置。完成這項任務的,正是科學界的兩位頂尖人物——沃森和克里克。
雙螺旋結構的發(fā)現(xiàn)者James Watson和Francis Crick
1953年,沃森和克里克發(fā)現(xiàn)了DNA雙分子螺旋結構,人類對生命的認識有了重大的突破,即:“生命是序列的,生命是數(shù)據(jù)的?!鄙w的全基因組包含了其全部遺傳信息,這些信息是A-T、C-G四種堿基兩兩配對后排列成的長鏈。這些堿基的排列信息可以被讀取出來,以1010001的二進制形式存儲在計算機中;可見,生命的密碼是一組可以被數(shù)據(jù)化的堿基排布序列。因此,測定DNA序列就成為解讀遺傳信息的先決條件和整個生命科學研究的重要基礎。
可以說,正是DNA雙螺旋結構的發(fā)現(xiàn),帶動了DNA測序技術的大發(fā)展,開啟了人類歷史上方向明確而歷時長久、道路曲折、投入巨大、進展驚人的探索。
測序技術發(fā)展的四個階段
DNA雙螺旋的發(fā)現(xiàn),讓破解生命源代碼的DNA測序在原理上成為可能,現(xiàn)在我們就來回顧測序技術的具體發(fā)展,其主要經(jīng)歷了四個階段。因篇幅所限,這篇文章將為你展示前兩個階段。
階段1:從“前直讀”到“直讀”
1964年,即DNA螺旋被發(fā)現(xiàn)11年后,康奈爾大學的研究者第一次分析了酵母的核苷酸序列。這次研究標志著一個新時代的開始。不過,正如承載生命信息的大分子經(jīng)歷了從RNA到DNA的歷程,最開始的測序方法是用來測定RNA序列的,實驗用不同的RNA酶對RNA模板進行“消化”(digestion),并根據(jù)反應后產(chǎn)物中可能重疊的序列間接推導可能的完整序列。這種測序技術流程繁瑣,推導復雜,很難重復,驗證還更為困難。不僅如此,在試圖測定雙鏈且更加穩(wěn)定的DNA時,這種方法沒能獲得成功。
直讀法示例
在技術的發(fā)展史上,新技術的出現(xiàn)就像制作一個木桶,每一塊木板都代表一種必須具備的基礎條件,任意一塊板的缺失都不構成一個木桶,同時,木板之間還需要彼此適應和融合。直接讀取DNA序列的測序技術(即“直讀法”),正是這樣一個木桶。它是在分子克隆技術、凝膠電泳技術、放射自顯影三種技術全部成熟之后才出現(xiàn)的。在這三種技術的基礎之上,直接讀取DNA序列的SBC和SBS測序法問世?!爸弊x法”的最大突破在于不再需要間接推導,而是可以直接在凝膠上按順序直觀讀出測序模板,判斷DNA分子每個堿基位置上為T-C還是A-G。
SBC與SBS這兩種方法在原理上相似,但具體操作有諸多不同。SBC法使用化學試劑,有較強的毒性,且技術復雜較難掌握,成功率不高。相比之下,SBS法使用酶試劑,具有操作簡便、結果穩(wěn)定、準確性高且重復性好等特點。更有意思的是,運用SBS法的設備相對簡單,可以實驗室自制或采用通用設備,還有使用方便的標準化試劑盒,因此很快風靡全球相關實驗室。SBS法由英國科學家桑格(Frederick Sanger)于1975年率先發(fā)明,因此也被稱為Sanger法。這種直讀法的發(fā)明也為DNA測序的數(shù)字化和自動化奠定了基礎
Sanger電泳法跑膠結果示例圖
階段2:從手工到自動化
上世紀80年代以前,分子生物學這門學科一直都被戲稱為“現(xiàn)代技術、手工操作”,直到DNA測序技術出現(xiàn),分子生物學才有了第一種實現(xiàn)自動化和信息化的技術。此后測序技術在幾十年發(fā)展歷程中不斷吸收其他領域新技術(如物理領域的納米技術及激光技術、化學領域的熒光標記核苷酸技術、生化領域的毛細管電泳分析、信息領域高密度芯片等技術)并將它們?nèi)跒橐惑w的成果,形成了現(xiàn)代科學研究技術中的強力工具。
1986年,加州理工學院的胡德(Leroy Hood)發(fā)明了以四種熒光物質(zhì)標記測序反應產(chǎn)物的“四色熒光法”,這些熒光物質(zhì)在不同波長的激光下呈現(xiàn)不同顏色。這項技術成為廣受歡迎的SBS測序法(Sanger測序法)走向自動化的關鍵突破。
四色熒光法原理示意圖和自動測序儀的四色熒光“峰圖”
這種方法將測序效率提高了數(shù)倍,讀長達到500nt(nt:nucleotide 核苷酸,是衡量單鏈核酸的長度單位),分辨率大為提高;而且,這是測序技術發(fā)展史上首次真正徹底拋棄了放射性物質(zhì)的使用。測序效率也稱為“通量“,是指單臺設備一次反應所獲取的序列數(shù)據(jù)量。
另外,還有一個與通量同樣重要的概念——“讀長”:測序儀的測序原理是將目標DNA大量復制,然后用酶將這些DNA長鏈切斷,并分別對每一小段測序,最后將這些片段拼接還原成完整的長鏈。讀長就是指測序儀能讀出的每一個DNA片段的長度。這兩個概念很重要,后面還會經(jīng)常提到。
據(jù)此,美國ABI公司在1986年推出了第一臺商品化的平板電泳全自動測序儀——ABI 370A。此后,該公司又推出了多種改進型,在讀長、通量、準確性方面都有很大提高,這種自動化測序儀成為劃時代的國際“人類基因組計劃(HGP)”得以啟動的重要技術依據(jù)。
盡管這一代測序儀為“人類基因組計劃”做出了突出貢獻,但只實現(xiàn)了測序過程的自動化,在自動測序之前的細菌克隆、手工制膠、手工加樣等操作都需要消耗大量的人力。一組數(shù)據(jù)可以說明問題:在“人類基因組計劃”沖刺階段,華大在6個月的時間里完成了50萬次成功的測序反應,共消耗了1500萬個形狀大小與醫(yī)用“針頭”類似的移液器吸頭。
未完待續(xù),詳見下期:爆發(fā)式的進步
小貼士
1.人類基因組計劃(Human Genome Project, HGP)
人類基因組計劃是一項規(guī)模宏大,跨國跨學科的科學探索工程。其宗旨在于測定組成人類染色體(指單倍體)中所包含的30億個堿基對組成的核苷酸序列,從而繪制人類基因組圖譜,并且辨識其載有的基因及其序列,達到破譯人類遺傳信息的最終目的?;蚪M計劃是人類為了探索自身的奧秘所邁出的重要一步,是繼曼哈頓計劃和阿波羅登月計劃之后,人類科學史上的又一個偉大工程。
這一計劃于1990年正式啟動。美國、英國、法國、德國、日本和我國科學家共同參與了這一預算達30億美元的人類基因組計劃。2001年,人類基因組工作草圖發(fā)表。2003年4月14日,六國首腦共同宣布人類基因組測序勝利完成。
2.測序效率與讀長
測序效率也稱為“通量”,是指單臺設備一次反應所獲取的序列數(shù)據(jù)量。測序儀的測序原理是將目標DNA大量復制,然后用酶將這些DNA長鏈切斷,分別對每一小段測序,最后根據(jù)片段首尾重合的部分,拼接還原成完整的長鏈。讀長就是指測序儀能讀出的每一個DNA片段的長度。
3.SBC與SBS
這兩種方法的原理相似,但具體操作有諸多不同。SBC法使用化學試劑,有較強的毒性,且技術復雜較難掌握,成功率不高。相比之下,SBS法使用酶試劑,具有操作簡便、結果穩(wěn)定、準確性高且重復性好等特點。且運用SBS法的設備相對簡單,可以實驗室自制或采用通用設備,還有使用方便的標準化試劑盒,因此很快風靡全球相關實驗室。