機器學(xué)習(xí)是一種使計算機系統(tǒng)能夠從數(shù)據(jù)中學(xué)習(xí)并做出預(yù)測或決策的技術(shù)。它是人工智能(AI)的一個重要分支,主要依賴于統(tǒng)計學(xué)、優(yōu)化理論和計算機科學(xué)的方法。機器學(xué)習(xí)在腫瘤研究中扮演著越來越重要的角色,在腫瘤生物標(biāo)志物、分子分型、藥物發(fā)現(xiàn)和開發(fā)等領(lǐng)域中廣泛應(yīng)用。比如利用機器學(xué)習(xí)分析腫瘤基因組數(shù)據(jù),識別與癌癥相關(guān)的基因變異和突變,開發(fā)腫瘤早期診斷的預(yù)測模型;在藥物發(fā)現(xiàn)階段,機器學(xué)習(xí)可以預(yù)測小分子藥物與靶點的結(jié)合能力,加速藥物篩選過程。
近期,來自哈佛醫(yī)學(xué)院的研究人員開發(fā)了一種基于AKT和EZH2雙重抑制劑的三陰乳腺癌治療方法,并利用機器學(xué)習(xí)篩選和構(gòu)建了療效敏感性預(yù)測模型,相關(guān)成果發(fā)表在Nature期刊上。
三陰性乳腺癌(TNBC)是最具侵襲性的乳腺癌亞型,復(fù)發(fā)率最高。晚期TNBC的主要治療標(biāo)準(zhǔn)是進(jìn)行全身化療聯(lián)合免疫治療,或單獨全身化療;然而,治療反應(yīng)通常持續(xù)時間很短。因此,迫切需要開發(fā)更有效的治療方法。
PI3K信號通路的組成部分是潛在的治療靶點,因為在超過70%的TNBC病人中,PIK3CA、AKT1或PTEN均發(fā)生了改變。然而,與激素受體陽性乳腺癌亞型相比,目前尚不清楚TNBC是否會對PI3K通路抑制劑產(chǎn)生反應(yīng),以及會產(chǎn)生何種反應(yīng)。
研究人員利用TNBC細(xì)胞系和小鼠模型測試了AKT抑制劑和組蛋白甲基轉(zhuǎn)移酶EZH2抑制劑聯(lián)合使用能有效殺死腫瘤細(xì)胞,有趣的是單獨使用其中一種抑制劑對腫瘤沒有效果。隨后作者利用轉(zhuǎn)錄組測序和體內(nèi)熒光成像等技術(shù)揭示了EZH2和AKT抑制劑可驅(qū)動TNBC細(xì)胞分化,促進(jìn)其轉(zhuǎn)變成管腔樣(luminal-like)細(xì)胞狀態(tài),這是雙重抑制劑抗腫瘤作用的關(guān)鍵因素。
研究人員聚焦管腔細(xì)胞分化的關(guān)鍵調(diào)節(jié)因子GATA3研究了雙重抑制劑的作用機制。研究發(fā)現(xiàn)EZH2抑制能打開了增強子序列上的染色質(zhì)從而調(diào)節(jié)GATA3的表達(dá)。AKT的抑制能阻礙FOXO1的磷酸化,并觸發(fā)FOXO1在增強子和啟動子序列上的結(jié)合。一旦細(xì)胞分化,EZH2和AKT抑制劑就能通過劫持退化過程中的信號分子來驅(qū)動細(xì)胞凋亡。進(jìn)一步,這一過程通過誘導(dǎo)IL-6—JAK1—AT3通路,觸發(fā)促凋亡蛋白BMF的表達(dá)來實現(xiàn)的。
EZHE/AKT雙重抑制劑治療TNBC的作用機制模式圖
(圖源Schade AE, et al., Nature, 2024)
研究發(fā)現(xiàn)EZH2和AKT抑制劑治療TNBC細(xì)胞系呈現(xiàn)敏感型和耐藥型,于是研究人員基于機器學(xué)習(xí)開發(fā)了藥物治療反應(yīng)的預(yù)測模型。首先選擇了17個細(xì)胞系(包含10個敏感細(xì)胞系和7個耐藥細(xì)胞系)的轉(zhuǎn)錄組數(shù)據(jù)集,根據(jù)敏感型和耐藥型的差異表達(dá)基因集(5組變量)作為訓(xùn)練集,隨后選擇隨機森林和支持向量機算法構(gòu)建預(yù)測模型并利用留一交叉驗證策略(leave-one-out cross-validation)驗證模型預(yù)測性能。根據(jù)預(yù)測性能準(zhǔn)確性,研究人員選擇差異倍數(shù)大于5倍的差異表達(dá)基因集作為變量和隨機森林算法作為最優(yōu)的預(yù)測模型。最后作者利用TCGA中TBNC組織樣本的轉(zhuǎn)錄組數(shù)據(jù)庫作為獨立驗證集對預(yù)測模型進(jìn)行了驗證,預(yù)測結(jié)果顯示55%的樣本對于EZH2/AKT雙重抑制劑治療是敏感的,這一發(fā)現(xiàn)與本研究中細(xì)胞系的敏感率(60%)相似。
機器學(xué)習(xí)模型訓(xùn)練和預(yù)測評估工作流程示意圖
(圖源Schade AE, et al., Nature, 2024)
綜上,本研究為這種高度侵襲性腫瘤類型確定了一種有希望的治療策略,并說明了解除管制的表觀遺傳酶如何將腫瘤與致癌脆弱性隔離開來。這些研究還揭示了發(fā)育組織特異性細(xì)胞死亡途徑如何被用于治療益處。
拜譜小結(jié)
生物標(biāo)志物的發(fā)現(xiàn)和驗證對于疾病的早期診斷、治療監(jiān)測和預(yù)后評估至關(guān)重要。機器學(xué)習(xí)可以從大量的基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)和其他類型的生物數(shù)據(jù)中挖掘出潛在的生物標(biāo)志物,并通過算法篩選出與疾病狀態(tài)最相關(guān)的生物分子或特征。使用機器學(xué)習(xí)分類算法對生物標(biāo)志物進(jìn)行分類,區(qū)分疾病狀態(tài)和健康狀態(tài),進(jìn)而通過建立機器學(xué)習(xí)模型進(jìn)行疾病的診斷、預(yù)測疾病的發(fā)展和治療反應(yīng)或患者預(yù)后。
拜譜生物拜作為國內(nèi)領(lǐng)先的多組學(xué)公司,可提供完善成熟的蛋白組學(xué)、代謝組學(xué)、轉(zhuǎn)錄組學(xué)等多組學(xué)產(chǎn)品技術(shù)服務(wù)體系。拜譜生物建立了完善的基于蛋白質(zhì)組學(xué)、代謝組學(xué)的機器學(xué)習(xí)分析流程,可實現(xiàn)隨機森林、極端梯度提升(Xgboost)、支持向量機(SVM)、樸素貝葉斯法(Naive Bayes, NB)、K-近鄰法(K-Nearest Neighbors,KNN)、LASSO邏輯回歸等經(jīng)典機器學(xué)習(xí)算法分析,同時可提供ROC、PR、混淆矩陣、生存分析等臨床性能分析,為臨床大隊列和生物標(biāo)志物研究提供了豐富的選擇。
參考文獻(xiàn):
Schade AE, Perurena N, Yang Y, et al. AKT and EZH2 inhibitors kill TNBCs by hijacking mechanisms of involution. Nature. Published online October 9, 2024. doi:10.1038/s41586-024-08031-6B1