去年7月,澳大利亞弗林德斯大學研究團隊宣布,利用AI技術(shù)開發(fā)的新型季節(jié)性流感疫苗已進入臨床試驗階段。該產(chǎn)品基于一套配體搜索算法(SAM),而公眾冠以“首個AI設(shè)計藥物”的稱謂,多少傳遞出業(yè)界對AI賦能藥物研發(fā)的期待。
同樣令公眾注意的是,兩個月后,加拿大的Deep Genomics公司也對外表示,“第一款由AI發(fā)現(xiàn)的治療候選藥物(therapeutic candidate)”成功誕生。這款名為DG12P1的化合物,得益于AI從靶點發(fā)現(xiàn)到先導化合物篩選的全程指導,只耗費了18個月。
AI工具越來越多地應(yīng)用于藥物發(fā)現(xiàn)。盡管一些主要參與者指出,這些工具能給藥物研發(fā)帶來巨大的變革機遇,但還是有不少業(yè)內(nèi)人士持懷疑態(tài)度。
“有爭論很正常,任何一項新技術(shù)在普及之前,都會面臨這種挑戰(zhàn)。”6月底,采訪了晶泰科技聯(lián)合創(chuàng)始人溫書豪,對方如是回應(yīng)這種意見分歧,“AI當然有它擅長的地方,比如對數(shù)據(jù)的處理能力,但也還有需要提升的空間。我們擁抱的不是純粹的技術(shù),而應(yīng)該看重技術(shù)在藥物開發(fā)中帶來的結(jié)果,從這一點出發(fā),包括AI在內(nèi)的數(shù)字化,實際上提供了一種認識事物的新視角。”
晶泰科技聯(lián)合創(chuàng)始人、董事長溫書豪博士
從宏觀到微觀,藥物是什么?
長周期、高成本的特征,一直是新藥研發(fā)行業(yè)的顯著標簽。通常認為,成功開發(fā)出一款新藥需要滿足“10億美元、10年時間”的前提,但現(xiàn)實似乎正變得更為復雜。
按照2014年Tufts Center的統(tǒng)計報告,開發(fā)一款藥物的資金門檻已經(jīng)提升到25.88億美元。具體來說,藥企實際支出13.95億美元,加上12-14%的名義利率(資本成本),彌補資本時間和機會成本后,得到一個新化合物的成本便陡然上升。從時間維度看,這種變化趨勢讓藥物開發(fā)變得越發(fā)困難。
究其原因,這一方面與新藥研發(fā)的成功率不斷降低、臨床試驗成本不斷增加,以及監(jiān)管條件更加嚴格等因素相關(guān);另一方面,藥企正在快速消耗著既往發(fā)現(xiàn)的新藥靶點。
持續(xù)增長的資本化研發(fā)費用
“工業(yè)界可能更多從生物、化學的角度去看這個事情,例如,怎樣設(shè)計出更優(yōu)的臨床試驗方案,在最短的時間內(nèi)驗證藥物的有效性、安全性,然后推動后面的上市申報。但基于物理背景,我們希望能以更微觀的角度理解藥物和靶點的相互作用。實際上,這種思維是貫穿整個藥物開發(fā)流程的,從前期的藥物設(shè)計到后面的臨床研究,更清楚地認識藥物,都有助于提高成功率,降低試錯成本。”溫書豪解釋說。
藥物都是原子、電子組成的——這也是溫書豪在藥物開發(fā)領(lǐng)域的切入點。2014年,溫書豪與馬健、賴力鵬還在美國麻省理工學院攻讀博士后,從事物理學研究。受當?shù)貏?chuàng)業(yè)氛圍的影響,三人決定從所擅長的藥物晶型出發(fā),成立晶泰科技,希望能加速藥物研發(fā),提高創(chuàng)新藥物可及性。
上述理念得到了輝瑞的認可,后者針對雙方的合作,還專門發(fā)表了一篇討論量子物理學和AI如何影響藥物發(fā)現(xiàn)與開發(fā)的文章:“近年來,科學家已經(jīng)開始使用被稱為晶型預(yù)測(CSP)的計算機建模技術(shù)來進行虛擬晶體學研究。通過應(yīng)用量子物理學,科學家可以預(yù)測分子中電子的行為,以確定其3-D結(jié)構(gòu)。”
外界通常把晶型預(yù)測作為晶泰科技的一個標簽,實際上正如文中所述,輝瑞科學家對于晶泰科技在底層物理、人工智能以及跨云超算能力在新藥發(fā)現(xiàn)中的巨大應(yīng)用潛力做了詳細闡述。在這些跨國大藥企的驅(qū)動下,晶泰科技已經(jīng)打造起“物理+AI+云端超算”的新一代藥物發(fā)現(xiàn)平臺ID4。更重要的是,這個平臺已經(jīng)在中美的近20個新藥開發(fā)項目中取得多個里程碑式進展。
CSP和AI新藥發(fā)現(xiàn)都涉及很多復雜的數(shù)學計算,依賴相應(yīng)的計算能力。“過去大家認為藥物電子云和人體靶點蛋白電子云之間的相互作用是固定不變的,實際上它們會互相干擾。”溫書豪認為,雖然變化能量很小,然而為了算準其中的結(jié)果則需要花費很多算力。由于既往的條件缺乏,藥企通常放棄這個環(huán)節(jié),導致晶型預(yù)測不準,以及新藥設(shè)計中假陽性分子的產(chǎn)生。隨著AI、云計算技術(shù)的發(fā)展,上述難題可以得到有效解決。
另一個值得注意的現(xiàn)象是,越來越多的國際大型藥企,開始推動設(shè)立首席數(shù)字官(Chief Digital Officer)。這很大程度上也透露出,藥物開發(fā)行業(yè)正在擁抱多學科交叉的融合浪潮。雖然目前復合型人才缺口仍舊很大,但在溫書豪眼中,這些變動至少扭轉(zhuǎn)了傳統(tǒng)觀點對于藥物的認知,讓其下探到更加微觀的世界。
AI藥物開發(fā)的“三座大山”
“人工智能不僅給相關(guān)科學家?guī)砹诵碌奶魬?zhàn),也給生物制藥行業(yè)及其發(fā)現(xiàn)和開發(fā)新藥的既定流程帶來了新的挑戰(zhàn)。”2019年12月,《自然評論藥物發(fā)現(xiàn)》(Nature Reviews Drug Discovery)刊登的一篇文章,重新思考了AI時代的藥物設(shè)計。
在藥物發(fā)現(xiàn)中,將先導分子的特征提高到候選藥物級別的過程,被稱為“設(shè)計-制造-測試-分析”(DMTA)周期。這種基于假設(shè)的經(jīng)典方法,首先使用可用數(shù)據(jù)來進行假設(shè)并設(shè)計分子(或從庫中選擇現(xiàn)有分子),隨后合成設(shè)計化合物,并用適當活性測試法進行測試和驗證假設(shè)。然后,對這些知識進行分析并將其轉(zhuǎn)化為下一個周期的設(shè)計假設(shè)的基礎(chǔ)。
AI的優(yōu)勢,在于無需依賴大型篩選化合物庫,而是可以在每次操作中合成少量化合物,并且僅以測試所需的量進行合成。換句話說,AI為提高DMTA效率提供了一系列選擇。通過提供改進合成路線和優(yōu)化反應(yīng)條件,AI算法模型可以使化學家遵循最有效的路線,從而縮短“制造”階段。
需要指出,一套標準的數(shù)據(jù)集對建立AI預(yù)測模型至關(guān)重要。如果憑借有限的數(shù)據(jù)以及局限的理解來進行預(yù)測,那么即使是很復雜的算法,也無法產(chǎn)生有用的結(jié)果。
實際上,數(shù)據(jù)問題正是當前業(yè)界對AI應(yīng)用于藥物開發(fā)的作用有無及其大小的分歧源頭之一。文首引述的兩個案例,也要面臨同樣的追問:有些內(nèi)部數(shù)據(jù)無法獲取,AI的數(shù)據(jù)集和訓練集都有局限;此外,由于數(shù)據(jù)的規(guī)范不一致,質(zhì)量問題也影響了結(jié)果的可信度。
然而,溫書豪卻對此有所保留:“數(shù)據(jù)不可忽視,但對數(shù)據(jù)本身的理解同樣重要。一開始,訓練集的大小還真不一定有那么關(guān)鍵。”以晶泰科技的經(jīng)驗為例,由于早期并不具備從大型藥企獲得數(shù)據(jù)的條件,晶泰科技犧牲巨大的算力,通過虛擬數(shù)據(jù)自建能力,解決藥物設(shè)計中最基本的模塊——這種數(shù)字孿生(Digital Twin)技術(shù),可以在虛擬空間中完成映射,從而反映相對應(yīng)的實體裝備的全生命周期過程。
另一方面,晶泰科技在具體項目過程中,也會衍生出一系列可用數(shù)據(jù)。并且,這種數(shù)據(jù)的反饋直接作用于算法模型,幫助后者優(yōu)化調(diào)整。有趣的是,溫書豪似乎比外界更在意AI算法的可發(fā)揮空間。“每個新藥開發(fā)項目中,我們會對算法在每個環(huán)節(jié)起了多少作用進行評估,甚至要建立相應(yīng)的量化標準。”溫書豪補充說。
相較于“AI新藥發(fā)現(xiàn)”的概念,溫書豪更愿意將這個過程看作“數(shù)字化和人工智能在制藥工業(yè)的一次效率升級”。而升級的內(nèi)涵,除了是數(shù)據(jù)獲取與算法利用方式的變革之外,還包括了算力的巨大提升。
深入至原子電子級的微觀藥物分子研究
“在微觀上,他們(晶泰科技)正在計算藥物分子中電子效應(yīng)對藥物作用帶來的影響。但由于分子具有許多不斷移動和變化的電子,因此必須同時執(zhí)行多次計算,而得出最終答案可能需要數(shù)十億次計算。”輝瑞格羅頓研究站材料科學的全球負責人Bruno Hancock,在前述那篇關(guān)于晶泰科技合作的文章中指出,當云服務(wù)提供商為這些項目計算時,晶泰科技成為其最大的用戶。
目前,晶泰科技仍舊借助云服務(wù)提供商進行計算工作。但從最理想的情況出發(fā),溫書豪也設(shè)想過構(gòu)建內(nèi)部云端架構(gòu)。這可以進一步降低成本,加快項目周期,與此同時,還能把晶泰科技的算法融入其中,實現(xiàn)協(xié)同效應(yīng)。
為制藥工業(yè)開源
以體量而論,作為最早布局國內(nèi)AI藥物開發(fā)的科技公司之一,晶泰科技的成長有目共睹。
2015年底,成立不到一年的晶泰科技便從騰訊獲得2400萬元A輪融資;2017年,晶泰科技的1500萬美元B輪融資中,股東還出現(xiàn)了紅杉資本中國和Google的身影;在2018年,中國人壽作為領(lǐng)投方,也參與了晶泰科技B+輪融資。
“AI、云計算和醫(yī)藥結(jié)合的科技公司”,這是此前溫書豪給晶泰科技打下的標簽。按照其所規(guī)劃的發(fā)展邏輯,晶泰科技通過算法連接了AI和藥物研發(fā),這為TMT領(lǐng)域的基金入局提供了可能。更重要的是,引入這些投資方后,晶泰科技得以調(diào)動后者所擁有的巨大算力,進而實現(xiàn)對藥物開發(fā)環(huán)節(jié)的推動。
這便回到晶泰科技的起點上。“我們最終的目的,是幫助制藥工業(yè)開源,而開源的表現(xiàn)之一就是,大家可以利用這個平臺,催生出更多的藥物資產(chǎn)。”溫書豪認為,“對大藥企來說意味著新的產(chǎn)品管線,對中小藥企來說是孵化和壯大的機會,對CRO公司來說則增加了相應(yīng)的研發(fā)需求帶給他們更多的業(yè)務(wù)。”