營養(yǎng)與健康所邵振與詹麗杏研究組合作開發(fā)蛋白質組比較算法解析紅細胞分化和肝癌異質性

文章來源:上海營養(yǎng)與健康研究所  |  發(fā)布時間:2024-10-17  |  【打印】 【關閉

  

10月14日,國際期刊Genome Biology在線發(fā)表了中國科學院上海營養(yǎng)與健康研究所邵振研究組、詹麗杏研究組與中國科學院分子細胞科學卓越創(chuàng)新中心柳欣研究組題為”zMAP toolset: model?based analysis of large?scale proteomic data via a variance stabilizing z?transformation”的合作研究成果。該研究針對當前TMT和iTRAQ等定量蛋白質組數(shù)據缺乏多樣本比較分析工具的瓶頸,開發(fā)了zMAP工具集,并應用它解析了紅細胞分化過程和肝癌病人組織之間的蛋白質組動態(tài)變化。

TMT和iTRAQ等重同位素標記技術已廣泛用于蛋白質組定量分析,為研究組織發(fā)育和疾病進程中的蛋白質表達變化提供了基礎?,F(xiàn)有的蛋白質組差異分析工具主要面向兩個或兩組樣本之間比較,能進行多樣本比較的工具有限。尤其是這些平臺生成的蛋白質組數(shù)據往往包含強烈的批次效應,導致能夠整合多個質譜實驗批次數(shù)據開展定量比較分析的工具更是匱乏,局限了它們在大規(guī)模生物樣本分析中的應用。針對該瓶頸,研究者開發(fā)了zMAP和reverse-zMAP兩個新計算模型,并基于它們搭建了一個多功能的蛋白質組數(shù)據分析平臺(http://bioinfo.cemps.ac.cn/shaolab/zMAP),面向基于不同實驗設計的多批次多樣本數(shù)據開展統(tǒng)計比較和下游整合分析(圖1)。

研究人員應用zMAP分析了一個已發(fā)表的紅細胞分化蛋白質組數(shù)據集,包含4種細胞類型(成年階段造血干祖細胞A0及體外分化5天后的原紅細胞A5;胚胎階段造血干祖細胞F0及分化5天后的原紅細胞F5)和5次4通道iTRAQ實驗生成的5組生物學重復。zMAP識別了2290個顯著高變化蛋白質,并基于z統(tǒng)計值對它們的表達模式聚類,發(fā)現(xiàn)很多僅在胚胎紅細胞分化過程中上調的蛋白質。研究人員從中選擇了S100A8、S100A9、CHI3L1和PTEN,驗證了這些基因在相應分化過程中發(fā)揮了不可或缺的作用。

此外,研究人員還應用reverse-zMAP分析了一個包含159例原發(fā)肝癌患者腫瘤和瘤旁正常對照組織的公開TMT蛋白質組數(shù)據集,鑒定出3097個高變蛋白質。基于它們z統(tǒng)計值矩陣的主成分分析可以將兩類樣本清楚分開。結合z統(tǒng)計值和病人生存數(shù)據的Cox比例風險回歸分析鑒定了大量預后相關蛋白質。它們中69.6%與第一主成分(PC1)顯著相關,即在腫瘤和正常對照組織之間差異表達,其中很多如NPC1和UBE2C可作為肝癌進展分子標志物。研究人員基于PC1得分對腫瘤樣本進行層次聚類,將它們分為三個亞組,發(fā)現(xiàn)該分型能夠比常用的TNM和BCLC分期更好地解釋病人預后差異;另一方面,基于z統(tǒng)計值的基因集變異分析(GSVA)指出,PC1得分較高的癌旁對照肝組織樣本表現(xiàn)出肝代謝通路下調和免疫相關通路上調這一特殊狀態(tài),可能為肝癌發(fā)生“炎癌轉換”過程蛋白質組的轉變模式提供有價值線索。上述兩方面發(fā)現(xiàn)表明這兩類病人組織樣本沿PC1分布的異質性均具有可觀的生物學意義。研究人員還整合z統(tǒng)計值和腫瘤體細胞突變數(shù)據開展了蛋白質表達數(shù)量性狀位點分析(pQTL)。5個高頻突變基因中,攜帶TSC2突變的腫瘤樣本PC1得分較高,并且患者預后較差,其腫瘤中TSC2蛋白質表達顯著降低。根據pQTL結果,發(fā)現(xiàn)TSC2突變下調的均為對病人生存有利的蛋白質,而上調的均為對病人生存不利的蛋白質。最后,研究人員驗證了NPC1和UBE2C對肝癌細胞增殖和侵襲的促進作用以及TSC2的抑癌作用。

中國科學院上海營養(yǎng)與健康研究所博士后桂秀琪、研究生黃靜、吳燕君、郭烜和中國科學院分子細胞科學卓越創(chuàng)新中心研究生阮林杰為該論文共同第一作者。中國科學院上海營養(yǎng)與健康研究所邵振研究員、涂世奇副研究員、詹麗杏研究員和中國科學院分子細胞科學卓越創(chuàng)新中心柳欣研究員為該論文共同通訊作者。該工作得到國家自然科學基金委、科技部、中國科學院等多項基金支持。研究使用的所有組學數(shù)據均為已公開發(fā)表數(shù)據。

原文鏈接::https://genomebiology.biomedcentral.com/articles/10.1186/s13059-024-03382-9


圖1:蛋白質組數(shù)據分析平臺zMAP的核心架構