質(zhì)譜方法在蛋白質(zhì)組學(xué)研究中起到無與倫比的作用,但基于質(zhì)譜的蛋白質(zhì)組學(xué)基礎(chǔ)復(fù)雜且跨越多個(gè)科研領(lǐng)域,由此蛋白質(zhì)組學(xué)有很高的進(jìn)入門檻。本綜述旨在為相對簡單的定量蛋白質(zhì)組學(xué)實(shí)驗(yàn)的技術(shù)細(xì)節(jié)提供一個(gè)易于理解的圖解指南。本綜述進(jìn)行了基于質(zhì)譜的蛋白質(zhì)組學(xué)實(shí)驗(yàn)概述,從樣品準(zhǔn)備到蛋白質(zhì)組數(shù)據(jù)分析,并解釋了數(shù)據(jù)是如何獲得、處理和分析的。最后,我們對蛋白質(zhì)組學(xué)的未來進(jìn)行了簡短討論,探討了可能與質(zhì)譜相輔相成的下一代蛋白質(zhì)測序技術(shù),為蛋白質(zhì)組學(xué)創(chuàng)造出更為豐富的未來。
標(biāo)題:An Introduction to Mass Spectrometry-Based Proteomics
期刊:Journal of proteome research
發(fā)表時(shí)間:2023年7月7日
圖1. 基于質(zhì)譜的蛋白質(zhì)組學(xué)概述(圖源:Shuken, J Proteome Res, 2023)
一、簡介
以質(zhì)譜為基礎(chǔ)的蛋白質(zhì)組學(xué)可以解決關(guān)于蛋白質(zhì)的一系列問題,如蛋白質(zhì)的序列、表達(dá)豐度、亞細(xì)胞定位、蛋白功能、三維結(jié)構(gòu)、化學(xué)反應(yīng)性及蛋白質(zhì)-蛋白質(zhì)相互作用等。這項(xiàng)技術(shù)的核心儀器便是質(zhì)譜儀,它可以檢測不同復(fù)雜程度的樣品中蛋白質(zhì)的質(zhì)量電荷比(m/z)和信號強(qiáng)度。
基于質(zhì)譜的蛋白質(zhì)組學(xué)最常見的技術(shù)之一是使用數(shù)據(jù)依賴式采集(data-dependent acquisition,DDA)對樣品(細(xì)胞、組織、體液或者植物、真菌等材料)進(jìn)行非靶向自下而上(bottom-up)的定量蛋白質(zhì)組學(xué)實(shí)驗(yàn)。短語“自下而上”是指從肽分析中推斷蛋白質(zhì)的信息,這類型研究的方法是從樣品中提取蛋白質(zhì),酶解為肽段,然后采用質(zhì)譜分析多肽(通常7-30個(gè)氨基酸較為適宜)(圖2)。當(dāng)以DDA模式獲取質(zhì)譜數(shù)據(jù)時(shí),檢測到肽,然后立即逐個(gè)選擇進(jìn)行片段化,以便在下游數(shù)據(jù)分析中分配其序列。與完整的蛋白質(zhì)相比,多肽有以下幾個(gè)優(yōu)點(diǎn):較小的大小分散分布、更適合反相高效液相色譜(HPLC)分離,并產(chǎn)生更容易解釋的片段光譜。
圖2. 典型的非靶向自下而上質(zhì)譜蛋白質(zhì)組實(shí)驗(yàn)的簡化概念概述(圖源:Shuken, J Proteome Res, 202
二、實(shí)驗(yàn)流程
2.1 樣本制備
每個(gè)蛋白質(zhì)組實(shí)驗(yàn)都從樣品制備開始,自下而上蛋白質(zhì)組學(xué)的通用樣品制備工作流程如圖3所示。整個(gè)過程包括蛋白質(zhì)的提取、變性、使用二硫蘇糖醇(DTT)或磷酸三氯乙基酯(TCEP)還原二硫鍵、使用碘乙酰胺(IAA)將巰基烷基化,以及隨后被LysC和胰蛋白酶“消化”。消化后的肽段需經(jīng)C18包被的固相進(jìn)行脫鹽,最后將肽重懸于液相色譜-串聯(lián)質(zhì)譜(LC-MS/MS)分析兼容的水緩沖液中,此時(shí)肽可以進(jìn)行LC-MS/MS分析(圖3)。
圖 3. 基于自下而上質(zhì)譜的蛋白質(zhì)組學(xué)的通用樣品制備工作流程(圖源:Shuken, J Proteome Res, 20
2.2 LC-MS/MS分析
LC-MS/MS運(yùn)行開始后的第一步是樣品提取和上樣到HPLC柱上。根據(jù)儀器的不同,這個(gè)過程可以以多種不同的方式發(fā)生;圖4展示了一個(gè)簡單的示例。在使用高效液相色譜的非靶向蛋白質(zhì)組學(xué)方法中,通常涉及通過施加負(fù)壓(拉)然后施加正壓(推)將特定數(shù)量的樣品加載到高效液相色譜柱上。一旦肽被裝載到色譜柱上,就會(huì)同時(shí)發(fā)生四件事:液相色譜、氣相肽離子的形成(電離)、肽的質(zhì)譜分析(MS1)和片段的質(zhì)譜分析(MS2)。
圖4. LC-MS/MS中高效液相色譜法的簡化說明(圖源:Shuken, J Proteome Res, 2023)
2.2.1 HPLC
樣品通過使用預(yù)編程溶劑梯度的高效液相色譜柱洗脫,即在整個(gè)運(yùn)行過程中改變?nèi)軇┗旌衔锏某煞?,其長度通常為30-180分鐘。在蛋白質(zhì)組學(xué)中,高效液相色譜幾乎總是以反相模式進(jìn)行,這意味著柱中填充了疏水固定相(通常是二氧化硅包被長度為18個(gè)碳的線性烴鏈,稱為C18)。溶劑(流動(dòng)相)通常是兩種溶液的混合物(水溶液如0.1%甲酸和有機(jī)溶液如乙腈),每種溶液都由自己的梯度泵泵送。肽根據(jù)其疏水性被部分分離,在梯度過程中在不同時(shí)間(保留時(shí)間,RTs)洗脫。最佳梯度取決于幾個(gè)因素,包括色譜柱、樣品復(fù)雜性、儀器和實(shí)驗(yàn)?zāi)繕?biāo)。圖5顯示了一個(gè)使用HPLC梯度進(jìn)行肽分離的例子,色譜圖中的每個(gè)峰代表一組不同的離子。
圖5. LC-MS/MS運(yùn)行的典型色譜圖,樣品為胰蛋白酶和LysC消化的小鼠腦蛋白(圖源:Shuken, J Prote
2.2.2 肽電離
隨著梯度的進(jìn)行,部分分離的肽被連續(xù)地噴射到光譜儀中。在施加電壓的影響下,從HPLC柱頂端噴射出含有多肽的帶電液滴;帶電荷的肽被脫溶(進(jìn)入氣相),進(jìn)入光譜儀,并在光譜儀內(nèi)的電磁場推動(dòng)下向前推進(jìn)(圖6)。給定的肽在電離時(shí)通??梢圆捎貌煌碾姾蔂顟B(tài);每個(gè)電荷狀態(tài)通常對應(yīng)于質(zhì)子化狀態(tài)(有多少質(zhì)子與肽結(jié)合)。不同的電荷狀態(tài)導(dǎo)致不同的m/z值:例如,z = 1的電離肽將具有m/z = [m + H],其中m是中性肽的質(zhì)量,H是質(zhì)子的質(zhì)量,而z = 2的相同肽將具有m/z = [m + 2H]/2。肽的不同電荷狀態(tài)被特異性分離,稱為肽的不同“前體”。
圖6. 兩種流行的蛋白質(zhì)組學(xué)質(zhì)譜儀示意圖(圖源:Shuken, J Proteome Res, 2023)
2.2.3 肽質(zhì)譜掃描(MS1)
光譜儀反復(fù)快速獲取光譜以檢測電離肽。這些頻譜采集事件被稱為“MS1掃描”。任何質(zhì)譜的獲取都需要一個(gè)質(zhì)量分析儀,它根據(jù)它們的質(zhì)量電荷比(m/z)值來解析離子,以及一個(gè)測量電信號的探測器。兩個(gè)流行的質(zhì)量分析儀和檢測器是飛行時(shí)間分析儀和軌道阱(圖7)。
Q Exactive(Thermo Fisher Scientific)是相對簡單的軌道阱質(zhì)譜儀,MS1掃描的范圍在400 ~ 1600 Th之間(Th為m/z的單位)。多肽進(jìn)入C -Trap中,在吸收動(dòng)能的氮(N2)分子的幫助下,經(jīng)過一定的離子積累時(shí)間(“注入時(shí)間”),C -Trap同時(shí)并立即將其離子送入軌道阱。一旦進(jìn)入軌道阱,離子圍繞中心主軸進(jìn)動(dòng),并以與它們的m/z值成比例的頻率沿主軸振蕩。當(dāng)它們移動(dòng)時(shí),會(huì)產(chǎn)生波動(dòng)電流,通過傅里葉變換處理得出m/z值和強(qiáng)度。這種質(zhì)量分析方法具有高m/z分辨率和精度。測量完成后,生成如圖7A所示的MS1頻譜。
圖7. MS1和MS2光譜的例子。A. MS1頻譜;B. MS2頻譜(圖源:Shuken, J Proteome Res
另外一種質(zhì)譜儀timsTOF(Bruker)和Q Exactive之間的一個(gè)主要區(qū)別是添加了捕獲離子遷移譜(TIMS)(圖6)。當(dāng)肽進(jìn)入timsTOF時(shí),它們在雙TIMS分析儀的第一個(gè)區(qū)域積累25 - 200 ms,然后在TIMS分析儀的第二部分被氣流定位在不同的位置,而氣流的方向是縱向梯度電場。離子在雙TIMS分析儀第二部分的位置與其通過氣體的能力有關(guān)(“遷移率”,與碰撞截面成反比)。然后在25 - 200 ms的過程中逐漸從雙TIMS分析儀中“洗脫”,從而對不同的前體進(jìn)行額外的分離。由于TOF的質(zhì)量分析和MCP的檢測需要很短的時(shí)間(每次掃描約0.1 ms),因此在雙TIMS分析儀排空期間獲得了許多MS1光譜,每次MS1采集都可能在下一個(gè)MS1之前觸發(fā)MS2光譜,就像Q Exactive一樣。
2.2.4 碎片MS掃描(MS2)
MS1采集測量電離肽的m/z值和強(qiáng)度,但缺乏確定肽身份/序列所需的信息。雖然m/z值通常具有很高的準(zhǔn)確性,但在m/z誤差允許范圍內(nèi)存在太多可能的肽,無法僅根據(jù)m/z來識(shí)別肽。為了獲得鑒定所需的信息,將多肽片段化(通常在肽鍵處),用質(zhì)譜儀測量片段,所得光譜稱為“MS2光譜”。
在每次MS1掃描后,光譜儀在運(yùn)行時(shí)可能會(huì)選擇在MS1光譜中觀察到的一些離子進(jìn)行重新積累和碎片化。雖然存在多種前體選擇策略,但通常選擇光譜中強(qiáng)度最高的前體。為了避免重復(fù)選擇先前碎片化的肽,最近碎片化的m/z值被排除在選擇之外。
為了確定質(zhì)譜峰是否可能代表肽而不是污染離子,光譜儀尋找鄰近的重同位素峰,如13C和15N。一個(gè)碳都是12C的離子的質(zhì)量(m)比含有一個(gè)13C的相同離子的質(zhì)量(m)低1.003 Da,含13C離子對應(yīng)的MS峰的m/z值大約高1/z,如z = 1時(shí)高1.0 Th, z = 2時(shí)高0.5 Th,z = 3時(shí)高0.33 Th,依此類推。因此,給定任何觀察到的峰,如果在這些m/z距離上發(fā)現(xiàn)鄰近的峰,則可以推定離子的電荷。這些峰的相對強(qiáng)度也可以估計(jì)出離子中有多少C和N原子,因此離子是肽的可能性有多大(圖8);在給定的m/z下,肽的典型同位素峰強(qiáng)度比不同于洗滌劑或碳水化合物等其它分子。由于許多非肽污染離子具有+1電荷,并且z = +1的肽片段通常信息較少,通常選擇帶+2或更大電荷的離子進(jìn)行碎裂。
圖8. 模擬質(zhì)量增加陽離子的MS1譜(圖源:Shuken, J Proteome Res, 2023)
使用碰撞誘導(dǎo)解離(CID)將每個(gè)選定的前體碎片化,并獲得碎片的MS2譜,這些MS2光譜被用來鑒定肽。離子被加速進(jìn)入高能CID(HCD)池或碰撞池,在那里它們與氣體分子(通常是N2)碰撞。碰撞誘導(dǎo)質(zhì)子在解離之前從肽的某處轉(zhuǎn)移到肽的一個(gè)主酰胺鍵上。CID傾向于優(yōu)先切割羰基碳和酰胺氮之間的C - N鍵(即肽鍵),產(chǎn)生m/z值可預(yù)測的片段,稱為b離子和y離子,b離子包含肽的C端,y離子包含肽的N端(圖9),產(chǎn)生的碎片進(jìn)行類似于MS1的質(zhì)量分析和檢測過程(圖7B)。
圖9. 基于移動(dòng)質(zhì)子模型的碰撞誘導(dǎo)解離(CID)破碎事件的可能機(jī)制(圖源:Shuken, J Proteome Res,
2.2.5 小結(jié)
整個(gè)梯度過程中(通常為30 - 180分鐘),光譜儀不斷積累氣相離子。MS1離子被評估為肽樣性質(zhì)進(jìn)行分析,每個(gè)假定的肽被重新積累和碎片化(MS2),然后循環(huán)往復(fù)。在Q Exactive中,如果一次MS1掃描耗時(shí)50 ms,并觸發(fā)10次MS2掃描,每次掃描耗時(shí)200 ms,那么這個(gè)周期將在大約2 s內(nèi)完成。在timsTOF中,一個(gè)典型的周期需要25 ~ 200 ms。這個(gè)周期在整個(gè)梯度過程中重復(fù)數(shù)百到數(shù)千次,產(chǎn)生數(shù)千個(gè)光譜。這種采集模式被稱為數(shù)據(jù)依賴采集(DDA),因?yàn)楂@取MS2頻譜的決定取決于MS1數(shù)據(jù);另一種方法是數(shù)據(jù)獨(dú)立采集(DIA)。如上所述,不充分電離的肽不會(huì)被檢測到,但肽也必須很好地碎片化,即產(chǎn)生足夠有信息的碎片以供識(shí)別(圖9)。
三、拜譜生物小結(jié)
本期內(nèi)容詳細(xì)介紹了基于質(zhì)譜的蛋白質(zhì)實(shí)驗(yàn)流程的樣本準(zhǔn)備及LC-MS/MS分析,下一篇將介紹數(shù)據(jù)分析及蛋白質(zhì)組學(xué)前沿發(fā)展,敬請期待!
參考文獻(xiàn):
Shuken SR. An Introduction to Mass Spectrometry-Based Proteomics. J Proteome Res. 2023; 22(7):2151-2171. doi: 10.1021/acs.jproteome.2c00838.