上海高研院在mRNA藥物遞送系統(tǒng)脂質(zhì)納米顆粒(LNPs)人工智能預(yù)測(cè)方面取得突破性進(jìn)展

文章來源:上海高等研究院  |  發(fā)布時(shí)間:2024-05-15  |  【打印】 【關(guān)閉

  

mRNA疫苗靶向治療泛癌癥是當(dāng)前藥物研究的熱點(diǎn),具有重大學(xué)術(shù)和經(jīng)濟(jì)價(jià)值。mRNA設(shè)計(jì)中的重要挑戰(zhàn)是遞送系統(tǒng)脂質(zhì)納米顆粒(LNPs)的構(gòu)建,作為把mRNA治療藥物或疫苗送達(dá)靶細(xì)胞的載體,LNPs組分篩選制備存在周期長、成本高的難題。以Chat GPT為代表的新一輪人工智能技術(shù)正推動(dòng)人類社會(huì)全面變革,通過人工智能模型輔助藥物分子和物質(zhì)組分設(shè)計(jì),結(jié)合實(shí)驗(yàn)測(cè)試迭代,驅(qū)動(dòng)規(guī)?;幬锇l(fā)現(xiàn),針對(duì)mRNA-LNPs,利用人工智能技術(shù)跨學(xué)科交叉,對(duì)快速設(shè)計(jì)自主高轉(zhuǎn)染效率的mRNA-LNPs具有重要意義。?

近日,中國科學(xué)院上海高等研究院(以下簡稱“上海高研院”)人工智能團(tuán)隊(duì)劉立莊研究團(tuán)隊(duì)在mRNA藥物遞送系統(tǒng)脂質(zhì)納米顆粒人工智能預(yù)測(cè)方面取得突破性進(jìn)展,提出了一種基于mRNA-LNPs三維微觀結(jié)構(gòu)與生化性質(zhì)間映射的自注意力機(jī)制深度學(xué)習(xí)模型,實(shí)現(xiàn)了LNPs高精度自動(dòng)篩選,結(jié)果優(yōu)于目前公開發(fā)表方法,相關(guān)研究成果以“Data-balanced transformer for accelerated ionizable lipid nanoparticles screening in mRNA delivery”為題發(fā)表在國際生物信息期刊Briefings in Bioinformatics上。

本研究設(shè)計(jì)基于mRNA-LNPs三維微觀結(jié)構(gòu)與生化性質(zhì)間映射的自注意力機(jī)制深度學(xué)習(xí)模型,稱為TransLNP(圖1)。TransLNP采用跨分子類自動(dòng)學(xué)習(xí)方法(圖2),提取其他已有分子數(shù)據(jù)積累的知識(shí),實(shí)現(xiàn)針對(duì)LNPs的小樣本訓(xùn)練學(xué)習(xí),從而實(shí)現(xiàn)不同分子類之間算法模型的遷移。為構(gòu)建mRNA-LNPs三維微觀結(jié)構(gòu)與生化性質(zhì)間映射關(guān)系,充分利用粗粒度原子序列信息和細(xì)粒度原子空間對(duì)應(yīng)關(guān)系,基于自注意力機(jī)制的原子信息(原子類型、坐標(biāo)、相對(duì)距離矩陣、邊類型矩陣)交互,提取分子級(jí)特征。此外,針對(duì)有限的LNPs數(shù)據(jù)造成的不平衡問題,設(shè)計(jì)BalMol(balance molecule)模塊,通過平滑標(biāo)簽分布和分子特征分布來平衡數(shù)據(jù)。TransLNP實(shí)現(xiàn)LNPs轉(zhuǎn)染效率預(yù)測(cè)均方誤差MSE<5,對(duì)比現(xiàn)行主流的多種圖卷積神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)算法相比,結(jié)果顯示(圖3),在均方誤差、決定系數(shù)R2和皮爾遜相關(guān)系數(shù)評(píng)價(jià)指標(biāo)中性能最優(yōu),指標(biāo)達(dá)到該領(lǐng)域一流水平。

圖1 TransLNP架構(gòu)圖

圖2 跨分子類自動(dòng)學(xué)習(xí)架構(gòu)圖

圖3 TransLNP與多種圖卷積神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)算法預(yù)測(cè)結(jié)果對(duì)比圖

該工作實(shí)現(xiàn)快速精準(zhǔn)預(yù)測(cè)mRNA-LNPs的轉(zhuǎn)染效率以及新脂質(zhì)納米顆粒結(jié)構(gòu)預(yù)測(cè),新方法將推動(dòng)mRNA藥物在基因治療、疫苗開發(fā)和藥物遞送等領(lǐng)域的應(yīng)用發(fā)展。上海高研院碩士研究生武坤為本研究論文第一作者,上海高研院劉立莊正高級(jí)工程師為通訊作者,聯(lián)合了國家蛋白質(zhì)科學(xué)研究(上海)設(shè)施李娜正高級(jí)工程師,日本筑波大學(xué)王梓旭博士共同完成。

文章鏈接: ttps://doi.org/10.1093/bib/bbae186