結直腸癌(CRC)是全球第三大常見疾病,也是導致癌癥死亡的第二大原因。大多數結直腸癌起源于腺瘤,但只有約3%-5%的腺瘤會最終發(fā)展成癌癥。從腺瘤到結直腸癌的進展是一個緩慢的多步驟過程,涉及驅動突變的逐步累積。這一過程為早期發(fā)現病變提供了干預機會,目前常規(guī)方法是每年進行監(jiān)測性結腸鏡檢查,缺乏可靠的生物標志物來預測腺瘤的發(fā)展。
FFPE樣本,即福爾馬林固定石蠟包埋樣本,因其能夠在室溫下長期保存,有效固定組織結構,保持細胞和組織的原有形態(tài),與臨床數據緊密關聯(lián),為疾病機制研究、生物標志物和藥物靶標發(fā)現提供了寶貴的資源。
因此,本研究通過基于質譜的蛋白質組學和機器學習分析,對丹麥國家篩查計劃中收集的一組高級別(HG)腺瘤的FFPE樣本進行了分析。研究者從98個選定的HG腺瘤樣本中生成了一個蛋白質組數據集,其中45個樣本屬于非異時性晚期新生物組(G0),53個樣本屬于異時性晚期新生物組(G1)。通過各種算法和統(tǒng)計軟件對98個樣本的定量蛋白質組數據進行了深入分析,發(fā)現它們的蛋白質組可以預測異時性晚期病變的發(fā)展和進展。
英文題目:Proteomic Profiling of Colorectal Adenomas Identifies a Predictive Risk Signature for Development of Metachronous Advanced Colorectal Neoplasia
中文題目:結直腸腺瘤的蛋白質組學分析識別出預測異時性晚期結直腸腫瘤發(fā)展的預測風險標志物。
發(fā)表期刊:Gastroenterology
影響因子:25.7
樣本類型:高級別腺瘤的FFPE樣本
組學技術:FFPE蛋白質組、全基因組測序
圖1 技術路線圖
一、研究結果
全基因組測序分析
研究者對G0組的7個樣本和G1組的25個樣本進行全基因組測序分析,結果顯示在結構變異或拷貝數變異方面,兩組之間沒有顯著差異。兩組樣本的突變負荷沒有顯著差異,G0組的中位數突變負荷略高于G1組。兩組中突變頻率最高的10個基因是相同(ZNF717,MUC3A,MUC6,MUC16,MUC4,ANKRD36C,CDC27,CTBP2,OR4C5,HLA-DRB1),盡管兩組之間的而一些基因的突變狀態(tài)有顯著差異,但這些差異不太可能反映兩組樣本在惡性潛力上的一般差異。
圖2 全基因組測序分析G0和G1組腺瘤突變概況
(圖源:Bech JM., Gastroenterology, 2023)
FFPE蛋白質組分析
由于基因組結果無法區(qū)分兩組之間的差異,本研究進一步對45個G0樣本和53個G1樣本的石蠟切片組織進行蛋白質組學分析,發(fā)現兩組樣本的表達模式有明顯區(qū)別。在limma分析中,共鑒定到460種蛋白質差異蛋白。隨后基于彈性網絡回歸算法分析,篩選出53個顯著差異蛋白,對這些差異蛋白進行聚類分析,結果表明這53種共識蛋白質足以將非異時性腺瘤組和異時性腺瘤組的樣本進行分區(qū),意味著這53種蛋白質可以作為區(qū)分兩組樣本的生物標志物。
圖3 G0和G1組腺瘤的蛋白質組分析
(圖源:Bech JM., Gastroenterology, 2023)
共表達模塊分析揭示復雜網絡結構與功能富集
隨后通過共表達模塊分析得到的復雜多節(jié)點系統(tǒng),這些系統(tǒng)不由單一蛋白質定義,而是通過STRING數據庫中的蛋白質-蛋白質相互作用網絡來揭示。四個最大的模塊(dustyRed、oliveGreen、lavenderPurple和goldenBrown)中有三個包含共識蛋白質。這些模塊顯示出不同的網絡結構,其中dustyRed和lavenderPurple模塊包含多個亞簇,而oliveGreen模塊則更為均勻。同時GO富集分析顯示與高爾基體和內質網囊泡運輸、免疫系統(tǒng)和炎癥反應相關的蛋白質在這些模塊中過表達。
圖4 共表達模塊和差異豐度蛋白的網絡分析
(圖源:Bech JM., Gastroenterology, 2023)
候選蛋白質及其ROC分析
最后,作者將候選蛋白列表與其他關于腺瘤的蛋白質組學數據集進行交集分析,篩選出54種候選蛋白,并排除了可能影響結果的樣本,大仙在測試的54種蛋白質中,28種得到了至少一項外部研究的支持。進一步的ROC分析后,12種蛋白質的ROC分析滿足AUC標準(0.75),其中ITGA1在不同樣本組間的豐度存在顯著差異。在驗證集中,3種蛋白質(C1QBP、POF1B和ITGA1)顯示出與正常樣本不同的腺瘤特異性豐度。通過計算篩選出8種蛋白質進行多類ROC分析,最終確定了37個模型,其中C1QBP、ERGIC1和ORMDL1組成的模型得分最高。
圖5 候選蛋白的箱線圖及其ROC曲線
(圖源:Bech JM., Gastroenterology, 2023)
二、小結
在這項研究中,通過對98個高級別腺瘤樣本(G0和G1組)的蛋白質組學分析,共鑒定出460種差異豐度蛋白,并利用彈性網回歸模型進一步篩選出53種關鍵蛋白。加權共表達網絡分析揭示了與患者分組顯著相關的蛋白質共表達模塊,而網絡分析則展示了這些模塊中蛋白的復雜相互作用。此外,研究者還通過富集分析發(fā)現了與囊泡運輸、免疫系統(tǒng)和炎癥相關的蛋白在某些模塊中的過度表達。最終,通過ROC分析,研究者篩選出12種具有預測價值的蛋白質,并構建了一個包含C1QBP、ERGIC1和ORMDL1三種蛋白質的最高得分模型,這些發(fā)現為結直腸癌的早期預測提供了新的分子標記物。
三、熱點產品推薦—超高深度FFPE蛋白質組
福爾馬林固定和石蠟包埋(FFPE)是長期保存病理樣本的金標準,可以在常溫下保存數十年,便于長期研究和樣本庫的建立。FFPE樣本數量龐大,全球有超過10億個組織樣本以FFPE形式保存,且這些樣本包含了長期、詳細的臨床隨訪信息,為研究疾病的分子機制、潛在的生物標志物提供了寶貴的資源。近些年來,對于不同疾病類型的FFPE樣本的蛋白質組學隊列研究逐漸增多,已經成為了Nat Commun、Int J Surg、Cell Repo Med等頂刊???,涉及肺癌、腦膠質瘤、乳腺癌等多種疾病的機制解析和生物標志物篩選,為疾病的治療預后提供了重要價值。
圖6 已發(fā)表文獻中不同疾病類型FFPE樣本的蛋白鑒定量
拜譜生物超高深度FFPE蛋白質組對樣本處理、數據采集和生物信息學分析等方面全流程優(yōu)化,結合全新一代Astral質譜儀,在多個大隊列項目中穩(wěn)定實現9000+蛋白鑒定量,高于文獻報道FFPE樣本蛋白檢測水平。這種高鑒定量的實現,意味著我們能夠從FFPE樣本中提取更多的蛋白質信息,為疾病機理的研究和生物標志物的發(fā)現提供了更豐富的數據支持。歡迎大家咨詢!
圖7 拜譜生物實測項目數據
參考文獻:
Bech JM, Terkelsen T, Bartels AS, et al. Proteomic Profiling of Colorectal Adenomas Identifies a Predictive Risk Signature for Development of Metachronous Advanced Colorectal Neoplasia. Gastroenterology. 2023 Jul;165(1):121-132.e5. doi: 10.1053/j.gastro.2023.03.208.