這幾天我的朋友圈被一篇Nature文章刷屏了,仔細一看原來是我的博士導(dǎo)師之一,陳之端老師課題組發(fā)表的。今天,有幸邀請到共同第一作者孫苗,也是我的師弟,“八卦”一下這篇文章背后的故事。
孫苗,中科院植物所博士畢業(yè),現(xiàn)在美國佛羅里達大學(xué)自然歷史博物館從事開花植物系統(tǒng)發(fā)育和多樣化研究;合作導(dǎo)師是美國著名的雙院士夫婦,Doug Soltis和Pam Soltis教授。孫苗擅長植物分類和大數(shù)據(jù)處理,尤其擅長使用Unix Shell與R進行數(shù)據(jù)挖掘和分析處理。
我和孫苗一人一小瓶啤酒,隔著屏幕干杯,開始了今天的專訪。
寧:師弟,首先恭喜你們的文章受邀發(fā)表在最新一期的Nature期刊上,對中國生物多樣性的保護將有重大的指導(dǎo)意義,也為中國植物科學(xué)研究打了一劑強心針??梢院唵谓榻B一下這篇文章的主要發(fā)現(xiàn)和意義嗎?這個發(fā)現(xiàn)是否改變了我們以前的認(rèn)識呢?
苗:中國有近3萬種維管植物,約占全世界的10%,是生物多樣性十分豐富的國家之一。而且我們國家的地勢地貌復(fù)雜多樣,尤其是由于青藏高原隆起形成了新的生物多樣性熱點地區(qū)。很多植物學(xué)大家,比如吳征鎰(2008年中國國家最高科學(xué)獎獲得者)和路安民先生一直都在探討哪些地區(qū)是生物多樣性的“搖籃”(孕育新物種的地區(qū)),哪些地區(qū)是生物多樣性的“博物館”(保存古老物種的地區(qū))。但以前苦于缺乏大尺度的基因數(shù)據(jù),不能得到肯定的結(jié)論。我們這篇文章通過重建中國開花植物的親緣關(guān)系和分化時間,結(jié)合物種分布數(shù)據(jù),揭示了中國開花植物生物多樣性形成的時空格局。我們發(fā)現(xiàn)中國東部地區(qū)是“博物館”,物種多樣性程度高且親緣關(guān)系較離散,也就是遺傳多樣性高;西部地區(qū)是“搖籃”,雖然物種多樣性程度高但遺傳多樣性相對較低。這個發(fā)現(xiàn)對中國物種多樣性的保護十分重要,因為我們國家現(xiàn)在很多自然保護區(qū)大都在西部地區(qū),因為那里人煙稀少,容易建立;而東部地區(qū)的自然保護區(qū)大都比較稀疏、分散,因為人口比較密集。所以我們在文中建議在中國東部(廣東、廣西、貴州和海南)建立跨省區(qū)的自然保護區(qū)和國家公園,從而更加系統(tǒng)地保護該區(qū)域較高的遺傳多樣性。
寧:我注意到這個文章采樣十分密集,涵蓋了26978種開花植物,我也曾經(jīng)研究過開花植物,深知工作量巨大,你們是怎么實現(xiàn)的呢?
苗:說來話長,這個項目經(jīng)歷了近30年的積累,充分體現(xiàn)了我的導(dǎo)師陳之端老師的不驕不躁,契而不舍地鉆研精神和胸懷博大的科研合作精神。我們并沒有閉門造車,而是和很多國內(nèi)單位(仙湖植物園、武漢植物園,等等)開展了廣泛的合作,也和國際單位(美國、澳大利亞等)建立了密切的合作關(guān)系。
寧:可以簡單介紹一下這個項目的背景嗎?你們是如何逐漸形成這篇文章的思路的?我猜一開始可能并沒有設(shè)想將把這篇文章發(fā)到Nature吧。
苗:我認(rèn)為陳老師思路一直很清晰,一開始心中就有一個大格局,在下一盤大棋。2016年,Journal of Systematics and Evolution的第54期的整個專輯,就是對我們這個工作的初始數(shù)據(jù)的全面匯報。而這篇Nature文章也只是階段性成果,后期還會繼續(xù)發(fā)掘,陸續(xù)還會有很多成果發(fā)表。這篇Nature文章是基于中國生命之樹項目(Tree of Life, China Project),于2008年正式啟動。
寧:這篇文章投稿過程順利嗎?我注意到從投稿到最后接受用了大約一年時間。
苗:總體是順利的,這篇文章一開始就投到了Nature,三個審稿人的意見都比較正面,只是提了一些改進意見。后來,陳老師動員我們組內(nèi)外又增加和強化了很多分析,由于數(shù)據(jù)量大,運算周期長,所以一共用了大約一年的時間。而且,據(jù)我了解,發(fā)Naure一年的周期屬于正常運行時刻表,不算長。
寧:作為一名青年科學(xué)家,您是如何平衡家庭和工作的呢?
苗:來美國之前,Soltis夫婦在我心中是神一樣的存在。以前,我認(rèn)為可以在他們的實驗室學(xué)習(xí)到很多學(xué)術(shù)知識和技術(shù)。幾年下來,的確學(xué)了很多東西。原來看見代碼就打怵,現(xiàn)在也能教別人寫代碼了。但我認(rèn)為最重要的是跟他們學(xué)會了思考問題的方式,以及如何協(xié)調(diào)家庭和工作。Soltis夫婦精力十分旺盛,每天都堅持早起和運動,身體比我的還好;他們夫妻之間琴瑟和鳴,可以說是科研界的“神雕俠侶”。我現(xiàn)在也深深地認(rèn)為家庭是第一位的,沒有和諧的家庭何談科研呢?美國有一句話說得好,“Happy Wife, Happy Life”,我也深表同意。
寧:我知道你擅長R,這篇文章里面有沒有用到R呢?哪幾個圖是用R做的呢?
苗:談不上擅長。不過我以前的確是電腦小白,現(xiàn)在也能熟練運用R和Python編寫代碼了。而且,我還參加了美國當(dāng)?shù)氐墓娼M織,Data and Software Carpentry。一開始我也是聽課學(xué)習(xí)的,后來我取得了培訓(xùn)資格證書,現(xiàn)在已經(jīng)成為資深培訓(xùn)師,培訓(xùn)美國當(dāng)?shù)厝耸褂肦和Unix Shell (Bash)進行日常數(shù)據(jù)處理。我們這篇文章有很多分析和圖是用R制作的,比如正文的平均分化年齡(MDTc)在網(wǎng)格內(nèi)的評估分析系統(tǒng)發(fā)育多樣性(PD),以及圖4和附件數(shù)據(jù)里面的圖表。R語言在統(tǒng)計和制圖方面很有優(yōu)勢,可以清晰明確地展現(xiàn)你的科學(xué)發(fā)現(xiàn),而且繪圖是高質(zhì)量的,可以達到直接發(fā)表水平。春節(jié)后,我受邀在“投必得學(xué)院”講授R語言和Unix基本操作,感興趣的朋友可以關(guān)注一下他們的公眾號,了解一下動態(tài)。
寧:謝謝您接受我們的專訪,最后可否對年輕科研工作者和研究生們介紹一下您的成功經(jīng)驗嗎?
苗:我感覺合作對科學(xué)研究十分重要,是做好科研的法寶。陳老師就十分善于合作,他為人謙遜儒雅,不爭名奪利,大家都很信服他。我能來到Soltis實驗室工作,也是陳老師和Soltis教授長期合作的結(jié)果。