91儀器信息網(wǎng) 隨著DNA測序技術(shù)開始大規(guī)模商業(yè)化應(yīng)用,我們已經(jīng)可以很容易地得到自己的全基因組測序結(jié)果。雖然三代測序技術(shù)只需要短短一天就可以完成一個人的全基因組測序,但即使是現(xiàn)在,基因組的測序與分析依然是繁重復(fù)雜的工作。1990年人類基因組計(jì)劃提出后,多個國家分工合作,歷史14年才完成人類的基因組測序,這足以說明測序過程需要的龐大工作量。測序時間的縮短不僅得益于測序技術(shù)的發(fā)展,還需要感謝計(jì)算機(jī)技術(shù)日新月異帶來的數(shù)據(jù)處理能力的飛速發(fā)展。
近日,中國農(nóng)業(yè)科學(xué)院深圳農(nóng)業(yè)基因組研究所阮玨團(tuán)隊(duì)開發(fā)出了基于第三代DNA測序技術(shù)的算法Wtdbg。這是2016年Wtdbg算法初步研究成功后的升級版本,分析速度與今年4月發(fā)布的Flye算法相比提升了5倍,并且突破了測序分析時間長于測序數(shù)據(jù)產(chǎn)出時間的瓶頸,大大提高了第三代測序數(shù)據(jù)的分析效率。據(jù)了解,更高的版本在今年初就已經(jīng)進(jìn)入研究階段。
目前,市場上商用的DNA測序技術(shù)仍然以第二代高通量測序(NGS)為主,主要原因是在早期第三代測序技術(shù)的成本要高很多,以及第三代測序技術(shù)錯誤率高,而且因?yàn)闇y序原理不同,基于第二代測序技術(shù)的基因組裝方法無法配適,組裝缺少效率。阮玨團(tuán)隊(duì)在第二代測序組裝分析理論德布魯因圖的基礎(chǔ)上提出了模糊布魯因圖,將測序數(shù)據(jù)切分為固定長度的短串,再利用短串恢復(fù)出全基因組序列。同時通過重新定義 短串 ,研究團(tuán)隊(duì)使模糊布魯因圖具有了高效率和高容錯的優(yōu)點(diǎn)。
2016年Wtdbg算法研發(fā)成功后就成為國內(nèi)多家基因測序企業(yè)主要的組裝分析工具。雖然不是測序方法的進(jìn)步,但算法的突破對基因測序技術(shù)的影響也很大?,F(xiàn)階段,生物醫(yī)學(xué)研究的發(fā)展趨勢是以全基因組組裝方式對群體進(jìn)行測序分析,而Wtdbg算法的發(fā)展讓這一目標(biāo)成為現(xiàn)實(shí)。
數(shù)據(jù)處理系統(tǒng)幾乎是所有先進(jìn)儀器的核心系統(tǒng)之一。不管是光譜、質(zhì)譜、色譜等分析儀器還是電子顯微鏡等光學(xué)儀器在獲取數(shù)據(jù)之后都需要通過數(shù)據(jù)處理軟件分析數(shù)據(jù)得出檢測結(jié)果。而數(shù)據(jù)處理系統(tǒng)的核心就是算法,其中除了分析數(shù)據(jù)的算法之外還包括減少誤差、修正硬件特性的算法等。算法的進(jìn)步可以提高儀器的數(shù)據(jù)處理能力,讓儀器的檢測結(jié)果更精確,減少檢測結(jié)果的誤差,還可以提高儀器的檢測速度。
隨著大數(shù)據(jù)時代的到來,儀器將越來越智能化和數(shù)字化,這一進(jìn)程需要依靠大量的算法支撐。不僅分析儀器的檢測數(shù)據(jù)需要算法分析,數(shù)據(jù)的儲存、傳輸、對比也需要算法處理。甚至當(dāng)實(shí)驗(yàn)室通過互聯(lián)網(wǎng)技術(shù)形成一個整體,儀器與儀器之間的互動,人與數(shù)據(jù)化實(shí)驗(yàn)室的互動都是算法大展拳腳的舞臺。
資料來源:新華網(wǎng)
編輯點(diǎn)評:現(xiàn)代醫(yī)學(xué)證明,一切疾病都與基因相關(guān)。而基因檢測不僅可以針對性的預(yù)防疾病,還具有以下特點(diǎn):指導(dǎo)科學(xué)用藥,有效避免臨床誤診;設(shè)計(jì)個性化體檢套餐;指導(dǎo)個性化醫(yī)療服務(wù);進(jìn)行個性化的運(yùn)動指導(dǎo);有的放矢的進(jìn)行個性化的保健。所以說,科學(xué)技術(shù)進(jìn)步在很大程度上促進(jìn)了基因測序的發(fā)展,這對于人類健康而言有著積極的作用。
近日,中國農(nóng)業(yè)科學(xué)院深圳農(nóng)業(yè)基因組研究所阮玨團(tuán)隊(duì)開發(fā)出了基于第三代DNA測序技術(shù)的算法Wtdbg。這是2016年Wtdbg算法初步研究成功后的升級版本,分析速度與今年4月發(fā)布的Flye算法相比提升了5倍,并且突破了測序分析時間長于測序數(shù)據(jù)產(chǎn)出時間的瓶頸,大大提高了第三代測序數(shù)據(jù)的分析效率。據(jù)了解,更高的版本在今年初就已經(jīng)進(jìn)入研究階段。
目前,市場上商用的DNA測序技術(shù)仍然以第二代高通量測序(NGS)為主,主要原因是在早期第三代測序技術(shù)的成本要高很多,以及第三代測序技術(shù)錯誤率高,而且因?yàn)闇y序原理不同,基于第二代測序技術(shù)的基因組裝方法無法配適,組裝缺少效率。阮玨團(tuán)隊(duì)在第二代測序組裝分析理論德布魯因圖的基礎(chǔ)上提出了模糊布魯因圖,將測序數(shù)據(jù)切分為固定長度的短串,再利用短串恢復(fù)出全基因組序列。同時通過重新定義 短串 ,研究團(tuán)隊(duì)使模糊布魯因圖具有了高效率和高容錯的優(yōu)點(diǎn)。
2016年Wtdbg算法研發(fā)成功后就成為國內(nèi)多家基因測序企業(yè)主要的組裝分析工具。雖然不是測序方法的進(jìn)步,但算法的突破對基因測序技術(shù)的影響也很大?,F(xiàn)階段,生物醫(yī)學(xué)研究的發(fā)展趨勢是以全基因組組裝方式對群體進(jìn)行測序分析,而Wtdbg算法的發(fā)展讓這一目標(biāo)成為現(xiàn)實(shí)。
數(shù)據(jù)處理系統(tǒng)幾乎是所有先進(jìn)儀器的核心系統(tǒng)之一。不管是光譜、質(zhì)譜、色譜等分析儀器還是電子顯微鏡等光學(xué)儀器在獲取數(shù)據(jù)之后都需要通過數(shù)據(jù)處理軟件分析數(shù)據(jù)得出檢測結(jié)果。而數(shù)據(jù)處理系統(tǒng)的核心就是算法,其中除了分析數(shù)據(jù)的算法之外還包括減少誤差、修正硬件特性的算法等。算法的進(jìn)步可以提高儀器的數(shù)據(jù)處理能力,讓儀器的檢測結(jié)果更精確,減少檢測結(jié)果的誤差,還可以提高儀器的檢測速度。
隨著大數(shù)據(jù)時代的到來,儀器將越來越智能化和數(shù)字化,這一進(jìn)程需要依靠大量的算法支撐。不僅分析儀器的檢測數(shù)據(jù)需要算法分析,數(shù)據(jù)的儲存、傳輸、對比也需要算法處理。甚至當(dāng)實(shí)驗(yàn)室通過互聯(lián)網(wǎng)技術(shù)形成一個整體,儀器與儀器之間的互動,人與數(shù)據(jù)化實(shí)驗(yàn)室的互動都是算法大展拳腳的舞臺。
資料來源:新華網(wǎng)
編輯點(diǎn)評:現(xiàn)代醫(yī)學(xué)證明,一切疾病都與基因相關(guān)。而基因檢測不僅可以針對性的預(yù)防疾病,還具有以下特點(diǎn):指導(dǎo)科學(xué)用藥,有效避免臨床誤診;設(shè)計(jì)個性化體檢套餐;指導(dǎo)個性化醫(yī)療服務(wù);進(jìn)行個性化的運(yùn)動指導(dǎo);有的放矢的進(jìn)行個性化的保健。所以說,科學(xué)技術(shù)進(jìn)步在很大程度上促進(jìn)了基因測序的發(fā)展,這對于人類健康而言有著積極的作用。