在讀博期間,李明輝博士主攻的是動(dòng)物遺傳圖的構(gòu)建。為了更貼近人類(lèi)健康與臨床,李博士在中國(guó)科學(xué)院和生物芯片上海國(guó)家工程研究中心聯(lián)合培養(yǎng)的博后工作期間,開(kāi)始了肝癌甲基化異化譜方面的研究,主要對(duì)包括肝癌的應(yīng)用甲基化進(jìn)行診斷、分型以及預(yù)后等方向。正是這段經(jīng)歷,讓他與甲基化的表觀遺傳修飾結(jié)下了不解之緣,為之后從事科技服務(wù)行業(yè)奠定了科研基礎(chǔ),為表觀星圖計(jì)劃的成立提供了初始契機(jī)。
近日,記者有幸采訪了表觀星圖計(jì)劃首席科學(xué)家、中科普瑞技術(shù)產(chǎn)品總監(jiān)李明輝博士,請(qǐng)他分享了創(chuàng)建中國(guó)人甲基化數(shù)據(jù)庫(kù)的故事。
1、不惑之年再啟程
2017年啟動(dòng)的“中國(guó)十萬(wàn)人基因組計(jì)劃”,是我國(guó)在人類(lèi)基因組研究領(lǐng)域?qū)嵤┑氖讉€(gè)重大國(guó)家計(jì)劃,通過(guò)收集十萬(wàn)人的基因組、表型和暴露組等數(shù)據(jù),繪制中國(guó)人精細(xì)基因組圖譜,來(lái)研究疾病健康和基因遺傳的關(guān)系。“但該計(jì)劃還缺少重要的一環(huán),”李博士一語(yǔ)中的,“人的復(fù)雜疾病是在環(huán)境和基因組的共同作用下導(dǎo)致的,而環(huán)境對(duì)于基因組的影響有可能是通過(guò)表觀遺傳的現(xiàn)象而產(chǎn)生的。如果把表觀遺傳方面的數(shù)據(jù)加入基因組計(jì)劃,將會(huì)對(duì)十萬(wàn)人基因組計(jì)劃產(chǎn)生錦上添花的效果,使珍貴樣本的數(shù)據(jù)更加完整。”
隨后,李明輝博士組建了表觀星圖技術(shù)團(tuán)隊(duì)并負(fù)責(zé)十萬(wàn)人基因組甲基化計(jì)劃。被問(wèn)及為何不惑之年還選擇再出發(fā)時(shí),李博士回答道,“在我十幾年的科技服務(wù)過(guò)程中,接觸到了包括方案設(shè)計(jì)、數(shù)據(jù)分析、論文撰寫(xiě)等眾多項(xiàng)目?jī)?nèi)容。這當(dāng)中也看到很多遺憾,比如課題因經(jīng)費(fèi)不足,不能進(jìn)行全方面的實(shí)驗(yàn)設(shè)計(jì)而被迫選擇從某一角度進(jìn)行研究,但是這樣得到的數(shù)據(jù)并不具備代表性。另一方面,受限于甲基化研究的技術(shù)手段和價(jià)格,研究者往往會(huì)放棄這方面的研究。我們希望通過(guò)‘表觀星圖計(jì)劃’,能夠?yàn)橹袊?guó)科研提供自己的力量。”
2、表觀星圖計(jì)劃
表觀星圖計(jì)劃是國(guó)內(nèi)首個(gè)大型甲基化組項(xiàng)目,通過(guò)與國(guó)內(nèi)外基因組隊(duì)列計(jì)劃聯(lián)動(dòng),以及與Illumina公司的戰(zhàn)略合作,建立中國(guó)人甲基化基準(zhǔn)數(shù)據(jù)庫(kù),為表觀遺傳領(lǐng)域研究、應(yīng)用和臨床檢測(cè)等建立基礎(chǔ)數(shù)據(jù)庫(kù)。該項(xiàng)目計(jì)劃首期將完成十萬(wàn)人甲基化芯片與大數(shù)據(jù)分析(2018年計(jì)劃招募首期星圖計(jì)劃參與課題,免費(fèi)提供10000例DNA甲基化芯片用于項(xiàng)目研究),后期逐步擴(kuò)大范圍,通過(guò)甲基化基準(zhǔn)基因數(shù)據(jù)庫(kù)的建立,為科研和臨床研究,乃至臨床檢測(cè)等應(yīng)用提供基礎(chǔ)數(shù)據(jù)庫(kù),并建立相關(guān)標(biāo)準(zhǔn),為國(guó)內(nèi)各科研單位和醫(yī)療機(jī)構(gòu)的精準(zhǔn)診斷和精準(zhǔn)治療提供甲基化層面的基因數(shù)據(jù)保證,同時(shí)為全球華人的精準(zhǔn)診斷提供更為精準(zhǔn)的參考。
對(duì)于合作,表觀星圖團(tuán)隊(duì)會(huì)優(yōu)先選擇如醫(yī)院、科研院所、大學(xué)等有基礎(chǔ)的單位。對(duì)于一些來(lái)自社會(huì)力量的合作需求,李博士表示,也會(huì)基于科研意義進(jìn)行選擇性合作。另外,由于目前的科研主要關(guān)注健康領(lǐng)域,對(duì)于一些老百姓感興趣的內(nèi)容,比如與年齡、長(zhǎng)壽相關(guān)問(wèn)題等,如若在表觀星圖計(jì)劃中遇到,團(tuán)隊(duì)未來(lái)可能也會(huì)開(kāi)展相關(guān)的趣味性研究。
作為計(jì)劃的首席科學(xué)家,李博士對(duì)表觀星圖計(jì)劃的未來(lái)充滿(mǎn)期待。“對(duì)于每個(gè)人而言,基因組是生來(lái)就固定的,但表觀基因組則會(huì)隨著時(shí)間變化。這時(shí)候,患者的病癥就需要從基因組上的突變精細(xì)到表觀組學(xué)上甲基化的某些變異區(qū)分,而這些甲基化的變異又由那些非編碼RNA所調(diào)控,通過(guò)表觀星圖計(jì)劃,會(huì)把基因組、甲基化組等信息形成一個(gè)能夠充分利用的數(shù)據(jù)網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)就相當(dāng)于一個(gè)星圖,它能幫助每個(gè)人在“星空”中找到屬于自己的位置,患病的時(shí)候可以得到一個(gè)更精準(zhǔn)的指導(dǎo)和治療。”李博士這樣暢想著。
那么,該計(jì)劃何時(shí)能運(yùn)用于臨床,讓老百姓獲益?李博士表示,當(dāng)前世界各國(guó)都在為精準(zhǔn)醫(yī)療努力,因?yàn)槲覈?guó)是一個(gè)多民族的國(guó)家,各個(gè)民族之間的基因組與表觀基因組之間也有系列的差異。但是,如果能通過(guò)某一患者的突變基因或變異的甲基化的位點(diǎn)以及表達(dá)改變的這種圖譜找到一個(gè)很接近的人,而后者剛好已經(jīng)得到有效的治療,那么就可以將該人的治療方法用于指導(dǎo)現(xiàn)在的患者。
李博士進(jìn)一步說(shuō)道,受限于已有的治療方法或者批準(zhǔn)的靶向用藥的種類(lèi),目前的腫瘤精準(zhǔn)治療大多針對(duì)少數(shù)幾個(gè)基因的變異情況,很難考慮到其他基因的突變以及甲基化異常和基因表達(dá)的變化。未來(lái),我們希望能通過(guò)多組學(xué)的模式更細(xì)致的對(duì)每一個(gè)體的變異進(jìn)行細(xì)分,對(duì)新的樣本進(jìn)行更加細(xì)致的指導(dǎo)。
3、AI碰撞生命科學(xué)
2月15日,Nature雜志以長(zhǎng)文形式發(fā)表AI和甲基化的最新研究成果,研究人員基于腫瘤組織DNA的甲基化數(shù)據(jù),開(kāi)發(fā)了一個(gè)新的機(jī)器學(xué)習(xí)程序,可準(zhǔn)確區(qū)分約100種不同的中樞神經(jīng)系統(tǒng)腫瘤。對(duì)于這項(xiàng)研究,李博士也有自己的見(jiàn)解:“這是一項(xiàng)非常有意義的研究,為未來(lái)我們對(duì)于腫瘤的研究提供了有效信息和指導(dǎo)。”
“當(dāng)下,我們主要關(guān)注基因突變,實(shí)際上基因突變的原因極其復(fù)雜,所以需要加入一些其他組織的數(shù)據(jù)進(jìn)行輔助性分型或診斷;”李博士說(shuō)道,“對(duì)于中樞神經(jīng)系統(tǒng)來(lái)說(shuō),腦細(xì)胞種類(lèi)繁多:近幾年通過(guò)對(duì)大胞神經(jīng)元的單細(xì)胞轉(zhuǎn)錄組與甲基化測(cè)序發(fā)現(xiàn),人的腦細(xì)胞分為很多不同類(lèi)型的細(xì)胞,而這些細(xì)胞間的差異表現(xiàn)在不同表觀基因組修飾以后形成的轉(zhuǎn)錄組、蛋白組。如此多的腦細(xì)胞癌變以后,治療方式勢(shì)必也要進(jìn)行不同的劃分。所以在這篇文章中,作者建立了通過(guò)甲基化譜對(duì)一百多種中樞系統(tǒng)的腫瘤進(jìn)行劃分的標(biāo)準(zhǔn),對(duì)我們以后對(duì)中樞神經(jīng)腫瘤的治療提供了有效的指導(dǎo)。”
鑒于人工智能和生命科學(xué)技術(shù)的飛速發(fā)展,李博士相信,未來(lái)兩者還會(huì)碰撞出更多的火花。他進(jìn)一步解釋道,“以現(xiàn)在的圖像識(shí)別為例,AI診斷的準(zhǔn)確率已經(jīng)能夠超過(guò)大多數(shù)醫(yī)生。未來(lái),臨床診斷將是一個(gè)基于系統(tǒng)生物學(xué)的研究,這其中的數(shù)據(jù)非常之大,涉及到的知識(shí)面和彼此之間的相互聯(lián)系相當(dāng)復(fù)雜,單純靠某個(gè)研究機(jī)構(gòu)或課題組進(jìn)行分析是非常困難的,這就需要人工智能對(duì)已有的知識(shí)進(jìn)行綜合,將它們整合成網(wǎng)絡(luò),之后通過(guò)繼續(xù)學(xué)習(xí)及人工智能的方法對(duì)不同組學(xué)、來(lái)源的數(shù)據(jù)進(jìn)行有效的學(xué)習(xí)去指導(dǎo)科研及臨床治療。”
結(jié)語(yǔ)
采訪的最后,李明輝博士期待,這個(gè)由一群“老兵”攜手創(chuàng)建的新公司——中科普瑞,能為大健康事業(yè)貢獻(xiàn)一份力量。他表示,未來(lái),表觀星圖計(jì)劃聯(lián)合中科普瑞將為中國(guó)的科研與臨床做出更多有價(jià)值的事情。