帕金森?。≒D)是一種復雜且日益流行的中樞神經(jīng)系統(tǒng)(CNS)神經(jīng)退行性疾病。它從運動前階段(以非運動癥狀為特征,如快速眼動睡眠行為障礙)發(fā)展到運動失能階段。臨床上需要客觀的早期/前期運動疾病階段的生物標志物,以干預和減緩潛在的神經(jīng)退行性過程。外周液體生物標志物侵入性較小、易于獲得,可用于重復和長期監(jiān)測,這對于即將進行的神經(jīng)保護試驗的人群的篩查是必要的。
2024年6月18日,英國倫敦大學學院兒童健康研究所和英國倫敦大奧蒙德街醫(yī)院的H?llqvist Jenny等人在Nature Communications上在線發(fā)表了題為“Plasma proteomics identify biomarkers predicting Parkinson’s disease up to 7 years before symptom onset”,文章采用無偏倚的最先進的質(zhì)譜法,通過比較PD患者于健康對照(HC)的血漿樣本,發(fā)現(xiàn)PD患者血漿中存在早期炎癥特征。此后,通過創(chuàng)建高通量和靶向蛋白質(zhì)組學分析進入驗證階段,該分析應用于來自獨立復制隊列的樣本,包括新發(fā)PD, HC和孤立的快速眼動睡眠行為障礙(iRBD)患者,機器學習模型通過分析八種血液生物標志物,準確識別所有帕金森患者,并在運動發(fā)病前7年對79%的運動前個體進行分類。這些生物標志物中有許多與癥狀嚴重程度相關(guān)。這種特殊的血檢顯示了早期階段的分子事件,可以幫助識別有風險的參與者,進行旨在減緩/預防運動帕金森氏癥的臨床試驗。
英文標題:Plasma proteomics identify biomarkers predicting Parkinson’s disease up to 7 years before symptom onset(Nature Communications,IF=14.70,2024)
中文標題:血漿蛋白質(zhì)組學鑒定在癥狀出現(xiàn)前7年預測帕金森病的生物標志物
研究材料:健康及患者血漿樣本
組學技術(shù):非靶向蛋白組、MRM靶向蛋白組
主要研究結(jié)果
1. 蛋白質(zhì)組學發(fā)現(xiàn)階段(第0階段)
發(fā)現(xiàn)隊列由10名隨機選擇的drug-na?ve PD患者和10名匹配的HC患者組成。使用無標記質(zhì)譜分析,對血漿進行了自下而上的蛋白質(zhì)組學分析。該分析確定了1238個蛋白質(zhì),限制鑒定來自每個蛋白質(zhì)至少一個肽和每個肽至少兩個片段。在排除具有少于兩個獨特肽或識別分數(shù)低于設(shè)定閾值的蛋白質(zhì)后,剩下895種不同的蛋白質(zhì)。在這些蛋白質(zhì)中,有47種是顯著不同的(圖1-2)。通路分析表明在幾個炎癥通路中富集。
(圖源:H?llqvist et al., Nature Communications, 2024)
圖1. 研究的整個工作流程。這項研究包括三個階段。第0階段包括通過非靶向質(zhì)譜法發(fā)現(xiàn)蛋白質(zhì)組學,以鑒定假定的生物標志物,隨后是第1階段,從發(fā)現(xiàn)階段的目標轉(zhuǎn)移到靶向質(zhì)譜MRM方法,并應用于新的更大的樣本隊列,最后是第2階段,改進靶向MRM方法,分析更多的樣本,以評估靶向蛋白質(zhì)組的臨床可行性
(圖源:H?llqvist et al., Nature Communications, 2024)
圖2. 新發(fā)PD(n = 10)和健康對照(n = 10)的血漿樣品中的發(fā)現(xiàn)階段,由火山圖表示,顯示PD和對照之間的蛋白質(zhì)表達差異(階段0)。顯示了重要蛋白質(zhì)的 GO 注釋,虛線表示 p = 0.05。顯示了 IPA 的疾病和功能注釋,分為具有正或負激活評分的注釋
2.選擇目標蛋白質(zhì)組學分析的蛋白質(zhì)
接下來,基于發(fā)現(xiàn)階段確定的潛在生物標志物開發(fā)了一種經(jīng)過驗證的高通量和多重質(zhì)譜靶向蛋白質(zhì)組學檢測方法。該測定中還包括其它蛋白質(zhì),其中一些蛋白質(zhì)已在先前的PD,阿爾茨海默病(AD)和衰老的發(fā)現(xiàn)研究中被發(fā)現(xiàn)。此外,還納入了文獻中鑒定的幾種已知的促炎和抗炎蛋白,這些蛋白先前已發(fā)展成為內(nèi)部靶向蛋白質(zhì)組神經(jīng)炎癥組。使用這種方法,我們創(chuàng)建了一個靶向蛋白質(zhì)組學面板。這項靶向蛋白質(zhì)組學和多重分析包括121種蛋白質(zhì),旨在驗證生物標志物并探測在發(fā)現(xiàn)階段被確定為受干擾的途徑(圖3)。
(圖源:H?llqvist et al., Nature Communications, 2024)
圖3. 新發(fā)帕金森?。≒D)受試者、健康對照(HC)以及其他神經(jīng)系統(tǒng)疾病 (OND) 和孤立性 REM 睡眠行為障礙(iRBD)的驗證隊列的工作流程和目標蛋白質(zhì)組學分析結(jié)果概述
3.目標蛋白質(zhì)組學驗證階段(第1階段)
對于靶向蛋白質(zhì)組學分析,使用獨立于蛋白質(zhì)組學發(fā)現(xiàn)步驟的血漿樣本,來自99名最近診斷為新發(fā)PD的個體(48名男性,50%,平均年齡67歲)和36名健康對照(HC;男性20人,57%,平均年齡64歲)。這是主要隊列。又增加了進一步的樣本進行驗證,包括41名患有其他神經(jīng)系統(tǒng)疾?。∣ND)的患者(29名男性,71%,平均年齡70歲)和18名vPSG確診的iRBD患者(10名男性,56%,平均年齡67歲)。
4. 鑒定新生帕金森病患者和健康對照者之間顯著差異表達的生物標志物-靶向蛋白質(zhì)組學驗證階段(第1階段)
開發(fā)了針對121種蛋白質(zhì)的靶向蛋白質(zhì)組學分析,其中32種在血漿中一致且可靠地檢測到。在這32個標志物中,有23個被證實在PD和HC之間有顯著差異表達。在iRBD患者和HC之間以及OND和HC之間的比較中發(fā)現(xiàn)了6種差異表達蛋白(圖3)。新生PD和iRBD組均表現(xiàn)出絲氨酸蛋白酶抑制劑SERPINA3、SERPINF2和SERPING1以及中心補體蛋白C3的上調(diào)表達。與HC相比,顆粒蛋白前體蛋白在所有三組患者(PD, iRBD和OND)中均下調(diào)。OND組和PD組的PTGDS、CST3、VCAM1和PLD3蛋白表達相同且上調(diào)。圖4用Box-scatter圖顯示了顯著不同的蛋白質(zhì)。
(圖源:H?llqvist et al., Nature Communications, 2024)
圖4. 對照組和不同疾病組之間的蛋白質(zhì)顯著不同:新發(fā)PD(DNP)、iRBD 和 OND(II 期)。數(shù)據(jù)顯示為Box-scatter,疊加著各個測量值的散點圖
5. 差異表達蛋白的生物學意義——靶向蛋白質(zhì)組學驗證階段(第1階段)
使用通路分析(Ingenuity pathway analysis [IPA], Qiagen)評估了差異表達蛋白的參與及其對生物過程的影響。確定了三個主要的途徑簇,包括(i) 絲氨酸蛋白酶抑制劑或絲氨酸蛋白酶以及補體和凝血成分的表達,(ii) 內(nèi)質(zhì)網(wǎng) (ER) 應激/熱休克相關(guān)蛋白和 (iii) VCAM1、SELE 和 PPP3CB 的表達。最高的富集分數(shù)包括急性期反應信號通路、凝血系統(tǒng)、補體系統(tǒng)、LXR/RXR 激活、FXR/RXR 激活和糖皮質(zhì)激素受體信號傳導,這些都是參與炎癥反應的途徑。
炎癥相關(guān)通路(包括補體系統(tǒng)和急性期反應)表現(xiàn)出最高的顯著性水平,其次是調(diào)節(jié)蛋白質(zhì)折疊、內(nèi)質(zhì)網(wǎng)應激和熱休克蛋白的途徑。蛋白質(zhì)和通路的網(wǎng)絡表示顯示由炎癥/凝血/脂質(zhì)代謝(FXR/RXR 和 LXR/RXR)、熱休克蛋白/蛋白質(zhì)錯誤折疊以及與 Wnt 信號傳導和細胞外基質(zhì)蛋白相關(guān)的更多異質(zhì)性通路簇組成的簇。根據(jù)本研究中觀察到的蛋白質(zhì)表達,推測發(fā)生的潛在有害和保護機制,導致神經(jīng)元路易體內(nèi)含物中α-突觸核蛋白的寡聚化和積累,并最終導致多巴胺能神經(jīng)元細胞丟失(圖5)。
(圖源:H?llqvist et al., Nature Communications, 2024)
圖5 提示差異表達蛋白參與神經(jīng)元突觸核蛋白疾病
6.使用蛋白質(zhì)生物標志物的多重蛋白質(zhì)組合預測新發(fā)帕金森病——靶向蛋白質(zhì)組學驗證階段(第1階段)
接下來,應用機器學習,使用驗證階段的PD和HC樣本構(gòu)建判別OPLS-DA模型。樣本聚類為兩個截然不同且分離良好的類別,對模型的評估表明其非常顯著。對類分離影響最大的蛋白質(zhì)是GRN、DKK3、C3、SERPINA3、HPX、SERPINF2、CAPN2、SERPING1和SELE。
隨后,我們探討了觀察到的蛋白質(zhì)表達是否可用于構(gòu)建能夠預測個體是屬于PD組還是HC組的回歸模型。確定了一組以100%準確率區(qū)分PD和HC的蛋白質(zhì),然后構(gòu)建了線性支持向量分類模型并應用遞歸特征消除來查明最具歧視性的變量。數(shù)據(jù)分為兩部分:一部分用于模型訓練,其中70%用于模型訓練,另一部分包含30%用于測試。各部分保持PD和對照樣品的比例。模型中包含的特征數(shù)量由特征排序確定,并在訓練數(shù)據(jù)集中交叉驗證遞歸特征消除。特征選擇產(chǎn)生了一個具有八個預測因子的模型:GRN、MASP2、HSPA5、PTGDS、ICAM1、C3、DKK3 和 SERPING1。在模型中預測訓練數(shù)據(jù),并導致所有樣本被分類到正確的類別中。我們進一步構(gòu)建了受試者工作特征(ROC)和精確回憶(PR)曲線,以說明每種蛋白質(zhì)區(qū)分PD和HC的能力,并將其與組合多重蛋白質(zhì)組合的能力進行比較。組合面板在ROC和PR曲線上均實現(xiàn)了1.0的AUC。ROC曲線中單個預測因子的AUC范圍為0.53至0.92,PR曲線中的AUC范圍為0.79至0.96(圖6)。通過對數(shù)據(jù)進行6次拆分和 40 次重復的重復交叉驗證來進一步評估整個數(shù)據(jù)集。由此產(chǎn)生的分類指標的精確度、召回率、F1分數(shù)和平衡準確率得分的平均值和標準差分別為 0.87±0.09、0.87±0.08、0.86 ±0.09 和 0.82±0.12,從而表明了一個高度穩(wěn)健的分類模型。
(圖源:H?llqvist et al., Nature Communications, 2024)
圖6 PD和對照受試者的線性支持向量分類(第一階段)。測試集中單個和組合蛋白質(zhì)的受試者工作特征(ROC)和精確召回率(PR)曲線表明,單個蛋白質(zhì)的 ROC 曲線下面積 (AUC) 值為 0.53–0.92,PR 值為 0.79–0.96,而組合預測因子的AUC= 1.0
7.開發(fā)快速和精細的 LC-MS/MS 方法并評估獨立和縱向iRBD隊列(獨立復制隊列 - 第2階段)
為了評估針對高危受試者的初始預測模型的結(jié)果,開發(fā)并改進了的靶向和多重蛋白質(zhì)組學測試,以僅定量那些從初始靶向蛋白質(zhì)組學測定中易于可靠檢測到的蛋白質(zhì)(n = 32)。接下來,分析了來自54名iRBD患者的獨立隊列的另外146個縱向樣本。將第二階段所有可用的縱向 iRBD 樣本(n = 146)應用于第一階段構(gòu)建的兩個機器學習模型(OPLS-DA 和支持向量機)(PD 與 HC)。OPLS-DA模型基于所有32種檢測到的蛋白質(zhì),將70%的iRBD樣品鑒定為PD,而基于8種蛋白質(zhì)的 SVM 模型將 79% 的樣品鑒定為 PD。如上所述,在分析時,縱向 iRBD 驗證隊列中的 54 名受試者中有 16 名患有 PD/DLB。最早的正確分類是表型轉(zhuǎn)化前7.3年,最晚的分類是診斷前 0.9 年(平均 3.5 年± 2.4 年)。
(圖源:H?llqvist et al., Nature Communications, 2024)
圖7 一組新獲得的前驅(qū)孤立性快速眼動睡眠行為障礙(iRBD)樣本(II 期)的預測結(jié)果。在OPLS-DA模型中預測了來自診斷為iRBD的個體的146份新血清樣本,其中幾份具有縱向隨訪樣本。70%的樣本被預測為帕金森病(PD),40 人中有23人的所有縱向樣本被預測為PD。在更精細的支持向量機(SVM)模型中,146 個新樣本中有79%被預測為PD,40個個體中有27個始終將其所有縱向樣本預測為PD
8. 差異表達的蛋白質(zhì)生物標志物與靶向蛋白質(zhì)組學驗證階段患者臨床數(shù)據(jù)之間的相關(guān)性
接下來評估PD和HC(從第1階段)中的蛋白質(zhì)表達與臨床評分的關(guān)系,發(fā)現(xiàn) GRN、DKK3、PPP3CB 和 SELE 與 H&Y 和 UPDRS 第 II 部分、III 部分和總分呈負相關(guān),可能表明更嚴重的臨床(尤其是運動)損傷與 Wnt 信號通路(DKK3 和 PPP3CB)中標志物的低表達之間存在聯(lián)系。較高的胱抑素C血漿水平與UPDRS第III部分(運動性能)和 UPDRS 總分中的較高數(shù)字相關(guān)。PTGDS血漿水平也與MMSE呈負相關(guān)。中樞補體級聯(lián)蛋白 C3 與 MMSE 呈負相關(guān),與 H&Y、UPDRS 第 III 部分和總分呈正相關(guān)。UPR調(diào)節(jié)蛋白BiP(HSPA5)與MMSE呈負相關(guān),與H&Y和UPDRS第II、III部分和總分呈正相關(guān)。ERAD相關(guān)蛋白HSPAIL和脂聯(lián)素與H&Y、UPDRS第II、III部分和總分呈正相關(guān)。SERPINs(SERPINA3、SERPINF2和SERPING1)和血紅素(HPX)與MMSE呈負相關(guān),與H&Y和UPDRS第II、III部分和總分呈正相關(guān)。一般來說,MMSE評分與H&Y階段和UPDRS評分呈負相關(guān)(圖8)。
(圖源:H?llqvist et al., Nature Communications, 2024)
圖8 通過靶向質(zhì)譜法測量的蛋白質(zhì)的相關(guān)性和聚類熱圖以及對照組和帕金森病受試者的臨床評分(第1階段)。使用 Spearman 程序進行關(guān)聯(lián),并將聚類方法設(shè)置為平均值。MMSE簡易精神狀態(tài)檢查,UPDRS統(tǒng)一帕金森病評定量表
小結(jié)
帕金森病已成為世界上增長最快的神經(jīng)退行性疾病,目前影響著全球近1000萬人。因此,迫切需要疾病改善和預防戰(zhàn)略。這種策略的發(fā)展受到兩個局限性的阻礙:我們對帕金森病分子病理生理學中最早事件的理解存在重大差距,并且我們?nèi)狈煽亢涂陀^的生物標志物和易于獲得的生物體液中的測試。因此,我們需要能夠更早地識別PD的生物標志物,最好是在個體出現(xiàn)嚴重的神經(jīng)元損失和致殘性運動和/或認知疾病之前的重要時間。這些生物標志物將推進基于人群的篩查,以確定有風險的個體以及哪些人可以被納入即將到來的預防試驗。
拜譜小結(jié)
將多組學分析轉(zhuǎn)移到具有臨床意義的結(jié)果,直接影響未來的藥物試驗計劃和生物標志物驗證。血液檢測組可以在未來進一步驗證后幫助識別有患PD/DLB風險的受試者,并為即將到來的預防試驗對他們進行分層。血清和血漿樣本具有很高的相關(guān)性,相反,血漿/血清和腦脊液配對樣本的分析僅與這些外周和中央隔室中的標志物濃度呈弱相關(guān),因此有必要對不同的樣本類型進行生物標志物的篩查并找到最佳特異性的標志物。拜譜生物作為一家國內(nèi)領(lǐng)先的多組學服務公司,可提供成熟完善的蛋白質(zhì)組學、代謝組學、轉(zhuǎn)錄組與基因組等多組學技術(shù)服務,助力高分文章的發(fā)表。針對血液樣本,拜譜生物推出了醫(yī)學大隊列血液多組學多維解決方案,可提供超高深度血液蛋白質(zhì)組、糖蛋白修飾組、血液標志物精準靶向檢測、血液代謝組等多組學技術(shù)服務,歡迎大家咨詢!
參考文獻:
H?llqvist J, Bartl M, Dakna M, Schade S, Garagnani P, Bacalini MG, Pirazzini C, Bhatia K, Schreglmann S, Xylaki M, Weber S, Ernst M, Muntean ML, Sixel-D?ring F, Franceschi C, Doykov I, ?piewak J, Vinette H, Trenkwalder C, Heywood WE, Mills K, Mollenhauer B. Plasma proteomics identify biomarkers predicting Parkinson's disease up to 7 years before symptom onset. Nat Commun. 2024 Jun 18; 15(1): 4759. doi: 10.1038/s41467-024-48961-3.