APS | 上海藥物所綜述擴(kuò)散模型在AI輔助的抗體設(shè)計(jì)中的應(yīng)用
文章來(lái)源:上海藥物研究所 | 發(fā)布時(shí)間:2024-10-09 | 【打印】 【關(guān)閉】
2024年9月30日,中國(guó)科學(xué)院上海藥物研究所徐華強(qiáng)團(tuán)隊(duì)在Acta Pharmacologica Sinica發(fā)表綜述文章“AI-driven antibody design with generative diffusion models: current insights and future directions”。本綜述總結(jié)了擴(kuò)散模型在AI輔助抗體設(shè)計(jì)中的應(yīng)用,包括抗體的從頭設(shè)計(jì)、已有抗體結(jié)構(gòu)的優(yōu)化、以及相應(yīng)的實(shí)驗(yàn)評(píng)測(cè)方法,系統(tǒng)地總結(jié)了基于擴(kuò)散模型的抗體生成領(lǐng)域的研究進(jìn)展,并為進(jìn)一步改進(jìn)針對(duì)抗體設(shè)計(jì)的擴(kuò)散模型提供了參考。
抗體是不可或缺的免疫系統(tǒng)組成部分,也是現(xiàn)代大分子藥物設(shè)計(jì)最重要的部分,然而抗體藥物的研發(fā)和優(yōu)化通常面臨花費(fèi)多、周期長(zhǎng)、優(yōu)化難等實(shí)驗(yàn)相關(guān)的問(wèn)題,亟待先進(jìn)的計(jì)算方法提供支持和輔助??焖侔l(fā)展的人工智能(AI)模型已經(jīng)在多種任務(wù)中起到了關(guān)鍵作用,而擴(kuò)散模型作為AI領(lǐng)域的后起之秀,不僅對(duì)圖片和視頻生成產(chǎn)生了革命性改變,也已經(jīng)在蛋白質(zhì)設(shè)計(jì)、小分子設(shè)計(jì)等藥物設(shè)計(jì)領(lǐng)域發(fā)揮了作用。鑒于擴(kuò)散模型能夠高效學(xué)習(xí)大量高質(zhì)量數(shù)據(jù)的分布,并且能夠根據(jù)提示詞生成相關(guān)數(shù)據(jù)的特點(diǎn),其在抗體設(shè)計(jì)領(lǐng)域中,尤其是用抗原作為“提示詞”生成抗體方面,具有天然的優(yōu)勢(shì)。為此,本文綜述了擴(kuò)散模型在抗體設(shè)計(jì)領(lǐng)域的應(yīng)用,以輔助架起抗體設(shè)計(jì)方面計(jì)算和實(shí)驗(yàn)的橋梁。
圖1.如何在抗體設(shè)計(jì)任務(wù)中使用擴(kuò)散模型
抗體設(shè)計(jì)任務(wù)主要包括兩方面,分別是從頭抗體設(shè)計(jì)和抗體優(yōu)化。圖2展示了一些從頭抗體設(shè)計(jì)方法。其中針對(duì)抗體的RFDiffusion在抗體和蛋白訓(xùn)練數(shù)據(jù)上進(jìn)行了微調(diào),并結(jié)合ProteinMPNN方法設(shè)計(jì)CDR序列,基于語(yǔ)言模型提取隱空間信息的思路在AntiBARTy Diffusion和EAGLE上也得到了應(yīng)用,AbDiffuser則嘗試通過(guò)設(shè)計(jì)新的模型架構(gòu)來(lái)整合抗原-抗體相互作用的序列和結(jié)構(gòu)信息。在從頭抗體設(shè)計(jì)上,這些思路都取得了一定成果,包括實(shí)驗(yàn)上微摩爾級(jí)別的親和力,或設(shè)計(jì)了和上市藥物相媲美的新抗體。
圖2.在從頭抗體設(shè)計(jì)中應(yīng)用擴(kuò)散模型
而針對(duì)已有抗體的優(yōu)化問(wèn)題,研究者們不僅可以使用針對(duì)抗體專(zhuān)門(mén)設(shè)計(jì)和訓(xùn)練的,基于結(jié)構(gòu)或基于序列的模型(如DiffAb或NOS)來(lái)從抗原-抗體復(fù)合物結(jié)構(gòu)出發(fā)生成新的抗原結(jié)合區(qū),還可以使用通用的蛋白質(zhì)設(shè)計(jì)模型(如基于結(jié)構(gòu)的RFdiffusion、Chroma或者基于序列的EvoDiff、Taxdiff),這樣的模型將生成新的結(jié)構(gòu)或序列,后續(xù)可以在計(jì)算或?qū)嶒?yàn)方法上進(jìn)一步評(píng)價(jià)所生成的蛋白質(zhì)。該綜述還討論了如何在結(jié)構(gòu)、序列、結(jié)合親和力估計(jì)和實(shí)驗(yàn)方法上評(píng)測(cè)所生成的抗體。
圖3.利用通用的蛋白質(zhì)生成模型優(yōu)化抗體
綜上所述,擴(kuò)散模型的應(yīng)用為加速抗體設(shè)計(jì)提供了新途徑,主要包括利用高質(zhì)量的大數(shù)據(jù)集,來(lái)捕捉界面的復(fù)雜相互作用和探索更廣闊的序列空間。盡管仍面臨一些挑戰(zhàn),如負(fù)樣本的缺失,計(jì)算估計(jì)方法的準(zhǔn)確度有限,抗體成藥性的評(píng)估等,但AI方法的不斷完善進(jìn)步和相關(guān)數(shù)據(jù)庫(kù)的擴(kuò)充,有望進(jìn)一步提高基于擴(kuò)散模型的抗體設(shè)計(jì)的精確性和有效性,最終使其成為生物技術(shù)領(lǐng)域的優(yōu)質(zhì)工具。
上海藥物所博士研究生何欣恒、助理研究員李俊睿為本文共同第一作者;上海藥物所徐華強(qiáng)研究員為本文通訊作者。本研究得到了國(guó)家自然科學(xué)基金,中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)科技專(zhuān)項(xiàng),上海市市級(jí)科技重大專(zhuān)項(xiàng)和臨港實(shí)驗(yàn)室的基金資助。