上海高研院在mRNA藥物遞送系統(tǒng)脂質(zhì)納米顆粒(LNPs)人工智能預(yù)測方面取得突破性進(jìn)展
文章來源:上海高等研究院 | 發(fā)布時間:2024-05-15 | 【打印】 【關(guān)閉】
mRNA疫苗靶向治療泛癌癥是當(dāng)前藥物研究的熱點,具有重大學(xué)術(shù)和經(jīng)濟(jì)價值。mRNA設(shè)計中的重要挑戰(zhàn)是遞送系統(tǒng)脂質(zhì)納米顆粒(LNPs)的構(gòu)建,作為把mRNA治療藥物或疫苗送達(dá)靶細(xì)胞的載體,LNPs組分篩選制備存在周期長、成本高的難題。以Chat GPT為代表的新一輪人工智能技術(shù)正推動人類社會全面變革,通過人工智能模型輔助藥物分子和物質(zhì)組分設(shè)計,結(jié)合實驗測試迭代,驅(qū)動規(guī)?;幬锇l(fā)現(xiàn),針對mRNA-LNPs,利用人工智能技術(shù)跨學(xué)科交叉,對快速設(shè)計自主高轉(zhuǎn)染效率的mRNA-LNPs具有重要意義。?
近日,中國科學(xué)院上海高等研究院(以下簡稱“上海高研院”)人工智能團(tuán)隊劉立莊研究團(tuán)隊在mRNA藥物遞送系統(tǒng)脂質(zhì)納米顆粒人工智能預(yù)測方面取得突破性進(jìn)展,提出了一種基于mRNA-LNPs三維微觀結(jié)構(gòu)與生化性質(zhì)間映射的自注意力機(jī)制深度學(xué)習(xí)模型,實現(xiàn)了LNPs高精度自動篩選,結(jié)果優(yōu)于目前公開發(fā)表方法,相關(guān)研究成果以“Data-balanced transformer for accelerated ionizable lipid nanoparticles screening in mRNA delivery”為題發(fā)表在國際生物信息期刊Briefings in Bioinformatics上。
本研究設(shè)計基于mRNA-LNPs三維微觀結(jié)構(gòu)與生化性質(zhì)間映射的自注意力機(jī)制深度學(xué)習(xí)模型,稱為TransLNP(圖1)。TransLNP采用跨分子類自動學(xué)習(xí)方法(圖2),提取其他已有分子數(shù)據(jù)積累的知識,實現(xiàn)針對LNPs的小樣本訓(xùn)練學(xué)習(xí),從而實現(xiàn)不同分子類之間算法模型的遷移。為構(gòu)建mRNA-LNPs三維微觀結(jié)構(gòu)與生化性質(zhì)間映射關(guān)系,充分利用粗粒度原子序列信息和細(xì)粒度原子空間對應(yīng)關(guān)系,基于自注意力機(jī)制的原子信息(原子類型、坐標(biāo)、相對距離矩陣、邊類型矩陣)交互,提取分子級特征。此外,針對有限的LNPs數(shù)據(jù)造成的不平衡問題,設(shè)計BalMol(balance molecule)模塊,通過平滑標(biāo)簽分布和分子特征分布來平衡數(shù)據(jù)。TransLNP實現(xiàn)LNPs轉(zhuǎn)染效率預(yù)測均方誤差MSE<5,對比現(xiàn)行主流的多種圖卷積神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)算法相比,結(jié)果顯示(圖3),在均方誤差、決定系數(shù)R2和皮爾遜相關(guān)系數(shù)評價指標(biāo)中性能最優(yōu),指標(biāo)達(dá)到該領(lǐng)域一流水平。
圖1 TransLNP架構(gòu)圖
圖2 跨分子類自動學(xué)習(xí)架構(gòu)圖
圖3 TransLNP與多種圖卷積神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)算法預(yù)測結(jié)果對比圖
該工作實現(xiàn)快速精準(zhǔn)預(yù)測mRNA-LNPs的轉(zhuǎn)染效率以及新脂質(zhì)納米顆粒結(jié)構(gòu)預(yù)測,新方法將推動mRNA藥物在基因治療、疫苗開發(fā)和藥物遞送等領(lǐng)域的應(yīng)用發(fā)展。上海高研院碩士研究生武坤為本研究論文第一作者,上海高研院劉立莊正高級工程師為通訊作者,聯(lián)合了國家蛋白質(zhì)科學(xué)研究(上海)設(shè)施李娜正高級工程師,日本筑波大學(xué)王梓旭博士共同完成。
文章鏈接: ttps://doi.org/10.1093/bib/bbae186