項目成果在國家自然科學(xué)基金項目(批準(zhǔn)號:32025009、91940306、31722031)等資助下,中國科學(xué)院北京生命科學(xué)研究院趙方慶研究員團(tuán)隊開發(fā)了一種高效測定分析環(huán)形RNA的方法,相關(guān)成果以“利用納米孔測序和CIRI-long技術(shù)對環(huán)狀RNA進(jìn)行綜合分析(Comprehensive profiling of circular RNAs with nanopore sequencing and CIRI-long)”為題,于2021年3月11日以長文形式在《自然 生物技術(shù)》(Nature Biotechnology)上在線發(fā)表。 環(huán)形RNA是一類在真核生物中廣泛存在的、具有特殊環(huán)狀結(jié)構(gòu)的RNA分子。近期多個研究發(fā)現(xiàn),環(huán)形RNA不僅發(fā)揮miRNA海綿、RBP海綿以及翻譯短肽等生物學(xué)功能,而且通過結(jié)合蛋白分子,參與天然免疫等生理過程發(fā)揮重要功能。而確定環(huán)形RNA的全長序列,是進(jìn)行環(huán)形RNA功能研究的重要基礎(chǔ)。目前的研究方法對于環(huán)形RNA結(jié)構(gòu)的識別能力主要被二代測序的讀長所限制,對于長度較長(>500bp)的環(huán)形RNA分子,仍然缺少有效的全長重構(gòu)手段。
趙方慶團(tuán)隊首先測試了不同實驗條件對環(huán)形RNA的富集效果,進(jìn)而對環(huán)形RNA建庫流程進(jìn)行優(yōu)化,并通過使用poly(A) tailing提升RNase R對環(huán)形RNA的富集效率。最后應(yīng)用納米孔測序技術(shù),實現(xiàn)了對目標(biāo)環(huán)形RNA的全長序列進(jìn)行直接測定。基于上述實驗流程,趙方慶團(tuán)隊進(jìn)一步開發(fā)了用于識別納米孔測序數(shù)據(jù)中環(huán)形RNA序列的CIRI-long算法。CIRI-long將一致性序列比對到參考基因組,對其中的反向剪接位點和內(nèi)部結(jié)構(gòu)進(jìn)行識別,并基于基因注釋和剪接信號信息,提供單一樣本內(nèi)和多樣本間結(jié)果的整合與校正方法(圖1),從而實現(xiàn)環(huán)形RNA的準(zhǔn)確識別和全長重構(gòu)。
與傳統(tǒng)的二代測序方法相比,CIRI-long方法大幅提升了環(huán)形RNA全長重構(gòu)能力,并可實現(xiàn)與二代測序相近的分析成本。同時,CIRI-long提供了樣本間整合分析的工具,并針對納米孔測序的高錯誤率建立了有效校正方法,為環(huán)形RNA的功能研究提供了重要的方法學(xué)工具,具有很高的應(yīng)用價值。
圖1: 環(huán)形RNA全長重構(gòu)的實驗與計算流程
趙方慶團(tuán)隊首先測試了不同實驗條件對環(huán)形RNA的富集效果,進(jìn)而對環(huán)形RNA建庫流程進(jìn)行優(yōu)化,并通過使用poly(A) tailing提升RNase R對環(huán)形RNA的富集效率。最后應(yīng)用納米孔測序技術(shù),實現(xiàn)了對目標(biāo)環(huán)形RNA的全長序列進(jìn)行直接測定。基于上述實驗流程,趙方慶團(tuán)隊進(jìn)一步開發(fā)了用于識別納米孔測序數(shù)據(jù)中環(huán)形RNA序列的CIRI-long算法。CIRI-long將一致性序列比對到參考基因組,對其中的反向剪接位點和內(nèi)部結(jié)構(gòu)進(jìn)行識別,并基于基因注釋和剪接信號信息,提供單一樣本內(nèi)和多樣本間結(jié)果的整合與校正方法(圖1),從而實現(xiàn)環(huán)形RNA的準(zhǔn)確識別和全長重構(gòu)。
與傳統(tǒng)的二代測序方法相比,CIRI-long方法大幅提升了環(huán)形RNA全長重構(gòu)能力,并可實現(xiàn)與二代測序相近的分析成本。同時,CIRI-long提供了樣本間整合分析的工具,并針對納米孔測序的高錯誤率建立了有效校正方法,為環(huán)形RNA的功能研究提供了重要的方法學(xué)工具,具有很高的應(yīng)用價值。
圖1: 環(huán)形RNA全長重構(gòu)的實驗與計算流程