La Espectrometria de Masas en la Identificación de Proteinas Dra. Irene Fernández Servicio de Espectrometria de Masas. UB. PROTEÒMICA Gel 1. Spot 2. Rentat 3. Digestió 4. Extracció Extracció Proteïna Barreja de Pèptids tríptics Espectrometria de Masses MALDI Electrospray Base de Dades ELIMINACIÓN - Colorantes ( sales de plata, Coomassie Blue, . . . ) - Urea (desnaturalitzación prot., detergentes ) - Agentes reductores ( DTT, DTE ) - Glicerol, agentes alquilantes, SDS Proteasas y posiciones de corte específicas Proteína Enzima Trypsin Posición de corte /K-, /R-, \P Chymotrypsin Glu C (V8) Lys C Asp N /W-, /Y-, /F-, \P /E-, /D, \P /K-, \P /d- R K R Trypsin K Mezcla de Péptidos trípticos R K Informació masses MS NH2 15.200 Da % COOH Punts de digestió Modificació m/z Proteïna Digestió Enzimàtica ( Trypsina, V8) Química (CNBr, BNPS) Seqüència MS/MS NH2 1025 MS COOH NH2 COOH 215 518 m/z Pèptids tríptics 874 1025 1448 m/z BASE DE DADES Detección en el Masas Cromatograma de iones TIC % EM A) Muestra pura t Spec#1[BP=399.0,18512] 399 100 % 1.9E+4 279 90 263 718 80 277 % Intensity 70 622 280 328 60 40 30 20 623 415 50 247 717 621 400 278 301 377 560 456 721 625 10 0 200 360 520 680 840 0 1000 Mass(m /z) m/z Espectro Voyager Spec #1 MC[BP = 379.1, 6899] % 379.1 100 6899 90 904.5 80 1296.7 70 1570.7 50 294.1 40 30 20 10 1298.7 234.0 228.0 0 225 1572.7 335.1 906.5 520 815 1110 Mass (m/z) 1405 m/z 0 1700 Voyager Spec #1 MC[BP = 379.1, 6899] 1296.7 100 % 12C+14N+16O 4940.9 90 80 1297.7 70 13C+14N+16O 12C+15N+16O 60 % Intensity % Intensity 60 50 2x13C+14N+16O 13C+15N+16O 40 1298.7 30 20 10 0 1292.0 1294.2 1296.4 1298.6 Mass (m/z) 1300.8 m/z 0 1303.0 Monoisotopic Mass Monoisotopic Mass Monoisotopic Mass Average Mass ANALISIS DE UNA MEZCLA TIC 1 2 3 HPLC EM 4 % 1 2 % 3 % % m/z 4 m/z % m/z m/z FONTS D’IONITZACIÓ ELECTROSPRAY MALDI ELECTROSPRAY FONT ELECTROSPRAY LC/MS HPLC Introducció directa Ions : (M+nH)n+, (M-nH)n- analitzador Característiques del procés d'ionització (I) a) Tècnica d'ionització suau - T. Ambient - P. Atmosfèrica - Molt poca fragmentació b)Pot produir MULTIPLICITAT DE CÀRREGA en aquelles molècules amb posicions susceptibles d'ionitzar -se, com els grups -NH2 lliures de les proteïnes. ! No es necessari disposar d'analitzadors de gran rang de lectura, es a dir amb quadrupols ( < 4000uma ) es poden detectar molècules de 100.000uma. Tripèptid Lys-Met-Asp ( KMD) MW monoisotopic= 459.3 Da CH-(CH2)3-NH2 H2N-CH-CO-NH-CHR2-CO-NH-CHR3-COOH A CH-(CH2)3-NH2 + H3N-CH-CO-NH-CHR2-CO-NH-CHR3-COOH A1 (M+H)+= 460.3 + CH-(CH2)3-NH3 + H3N-CH-CO-NH-CHR2-CO-NH-CHR3-COOH A2 (M+2H)2+= 461.3/2 = 230.6 A2 % 230.6 A1 460.3 m/z ES Myoglobin 20 femtomoles MWaverage=16.951.1 A18 A19 A20 Espectre real ESI A21 A m/z n= Deconvolució a l’escala real de masses m m1-H m2- m1 Barreja: human haemoglobin n= 1 !m= 1 !m !m n= 2 !m= 0,5 n= 3 !m= 0,33 n = 1/!m - Micro Electrospray : µL/min LC/MS amb split - Nano Electrospray : nL/min. Biomolècules. No LC/MS. Si MS/MS. Límits de detecció femtomols - Tampons volàtils - Molècules solubles en dissolvents polars (H2O, CH3CN, MeOH). - Mostres netes ( no : sals, detergents, SDS, ...), processos previs de purificació. - Tècnica depenent de la Concentració - Lectura ions positius i negatius. - Informació : Pes Molecular ( <40Kda) • Seqüència : Fragmentació en font • Tàndem MS/MS TIC MALDI Matrix Assisted Laser Desorption Ionization 1 µL Cristal.lització Matriu ( SA, CHCA, THAP, DHB) Mostra Concentracions: Peptids,proteïnes : 0.1 a 10pmol/µL Oligonucleòtids :10 a 100pmol/µL Laser hν Ions (M+H)+ (M-H)- MALDI Analitzador ( TOF, quadrupol) MALDI - Tècnica senzilla i ràpida. Fàcil preparació mostra. - Informació :. Pes Molecular. Fins 300KDa. Poca fragmentació . Anàlisi barreges sense separació prèvia ( digerits proteics ) . Seqüenciació : PSD, ISD, Enzimàtica (informació estructural ) . Proteïnes, pèptids, oligonucleòtids, oligosacàrids, . . . . - Quantitat de mostra : µL, conc. : <pmol - No quantitativa Spec #1=>NR(1.50)[BP = 2131.5, 591] 2165.49 100 ADA 2305.90 90 80 40394.3 70 % Intensity 590.8 60 50 20173.1 40 30 20 10 0 0 14264.4 28528.8 42793.2 0 71322.0 57057.6 Mass (m/z) TRYPSINA Spec #1[BP = 1891.3, 1175] 1891.36 100 1175.0 2424.58 90 Pèptids tríptics 80 % Intensity 70 60 50 40 1144.22 30 1130.14 1517.20 20 10 0 584 1036.17 909.59 1287.16 1152.18 1156 1860.34 2168.47 2511.59 2801.34 2272.49 1484.15 1914.17 1728 3033.48 2504.32 2300 Mass (m/z) 2713.54 2872 0 3444 Daniel C. Liebler “ Introduction to Proteomics”. Humana Press, 2002 Daniel C. Liebler “ Introduction to Proteomics”. Humana Press, 2002 (Time of flight) Detector INFORMACIÓ ESTRUCTURAL • Lectura dels ions formats a la font • Possibilitat de fragmentació (MSn). Informació estructural Pèptids i proteïnes MS Anàlisi dels ions de la font. A+ , B + , C+ MS2 Selecció d'un dels ions anteriors: Precursor A+ Excitació del Precursor per a fragmentar -lo. A+ Lectura dels ions resultants MS3 Selecció d'un dels ions anteriors: A+1 Excitació per a fragmentar -lo: A+1 ..... ...... A + 1 , A+ 2 , A + 3 A + 1 , A+ 2 , A + 3 Detector A+11 , A+12 Información masas Digestión NH2 NH2 MS COOH COOH NH2 Proteína COOH 874 MS/MS 1025 1448 m/z Péptidos trípticos m/z = 1025 p* A-L-R-S-C-D-K-R BASES DE DATOS 215 518 725 m/z Secuencia péptidos trípticos Proteína SEQÜÈNCIACIÓ EN MS - Maldi-TOF : PSD, ISD - Electrospray i Maldi-TOF/TOF: MS/MS - Comparació MS vs Seq. EDMAN . MS mesura masses. AA nous o modificats es poden detectar bé. . N-terminal no lliure no és problema . MS es pot fer directament sobre barreges senzilles . Adquisició rápida i no gasta reactius . Tamany de pèptids fins a 25 residus aprox. . L’informació a vegades no es complerta i alguns pèptids presenten dificultats . Quantitat : pmol de substància MALDI-TOF INFORMACIO ESTRUCTURAL (ISD) ( In Source Decay ) -La ΔM entre els diferents fragments ens informa de la seqüència Tant en proteínes com en DNA SECUENCIACIÓN DE PÉPTIDOS Fragmentos iónicos x3 R1 O y3 z3 x2 y2 z2 x1 y1 z1 C-Terminal R2 O R3 O R4 NH2- C- -C- -N- -C- -C- -N- -C- -C- -N--C H H H H H H H N-Terminal a1 b 1 CO2H c1 a2 b2 c2 a3 b3 c3 H2N------aa1------aa2------aa3------COOH - Immonium Ions ( Fragmentaciones características de cada aminoácido H2N+=CHRn) Roepstorff, P.; Fohlmann, J. Biomed.Mass Spectrom, 11, 601 (1984) Ejemplo espectro MS/MS Ión precursor doblemente cargado: 627.3 Mr = 1253.6 Da Secuencia: qCYFHQFLK NANOLC011_011009135104 #781 RT: 51.94 F: + c d Full ms2 [email protected] [ 160.00-1265.00] -Espectros complicados. -Programas secuenciación DE NOVO. -Introducción en las bases de datos. AV: 1 NL: 5.24E5 672.1 100 95 90 85 80 75 70 65 Relative Abundance 60 55 434.8 50 535.1 45 40 719.0 1107.1 819.2 994.1 35 848.1 30 1108.1 25 407.0 20 271.7 518.1 435.8 15 10 5 259.9 176.4 242.4 282.9 343.8 994.9 536.0 849.2 654.2 1080.1 983.2 482.6 618.5 389.0 736.2 803.3 315.7 943.4 966.3 1125.9 1011.9 1179.3 0 200 300 400 1109.1 581.9 500 600 700 m/z 800 900 1000 1100 1213.6 1200 Secuenciación - PSD MALDI-TOF con REFLECTOR Linear Detector Fuente Reflector Detector Tof-Lineal Selección m/z= Reflector Laser Láser % Espectro m/z PSD del Péptido de MW=1404.6 Peso de los fragmentos Introducción base de datos Protein Databases NCBI Swiss Prot OWL Secuencia AKLMRLQ Gene Databases dbEST Fragmentación MS/MS Ionización Selección - Analizadores en Tandem - Ion Trap Fragmentación Lectura Fragmentos % Espectro fragmentos m/z Fragmentación MS/MS Fuente Ionización Analizador Selección C.C. Fragmentación Analizador Lectura Fragmentos Triple Quadrupolo QQQ Quadrupolo-TOF QTOF Sector Magnético Quadrupolo BQ TOF-TOF ESI/Q-TOF Fuente Quadrupolo TOF muestra Ionización (M+H)+n separación m/z CID MS/MS separación m/z MS/MS d’un pèptid tríptic de la Myoglobina GLSDGEWQQVLNVWGK MW=1815.3 A2 % 908.5 A 1816.3 A3 MS/MS m/z y5 % y6 y3 y4 N V L y7 y9 y10 V W QQ m/z GLSDGE-W-QQ-V-L-N-V-WGK A G C A A Q A C G INFORMACIÓ ESTRUCTURAL • • Lectura dels ions formats a la font Possibilitat de fragmentació (MSn). Informació estructural Pèptids i proteïnes MS Anàlisi dels ions de la font. A+ , B+ , C+ MS2 Selecció d'un dels ions anteriors: Precursor A+ Excitació del Precursor per a fragmentar-lo. A+ Lectura dels ions resultants MS3 Selecció d'un dels ions anteriors: A+1 Excitació per a fragmentar-lo: A+1 ..... ...... A+1 , A+2 , A+3 A+1 , A+2 , A+3 A+11 , A+12 Modificaciones Postraduccionales . Las proteínas estan presentes en los sistemas vivos en múltiples formas modificadas, lo que añade complejidad a la resolución de los proteomas. Modificaciones más importantes: --Fosforilaciones --Glicosilaciones --Oxidaciones --Acetilaciones. . . Thermo electron corporation MODIFICACIONES POSTRADUCCIONALES 1) FOSFORILACIONES : Serina (S), Threonina (T) y Tyrosina (Y) Cambios Biológicos . Activación/desactivación enzimática . Alteración interacciones y asociaciones proteicas . Cambio estructura proteínas, degradación. . . Cambios observables en el masas . Adición Grupo Fosfato : PO4H3 . ΔM de la Proteína/Péptido . MS/MS M-S-D-K + 80 uma por cada fosforilación PO4H3 m/z=1 Pérdida PO3 m/z=1 Pérdida M- p S-D-K ΔΜ = − 98 ΔM = - 79 Fosforilación de S , T y Y Modificaciones Postraduccionales : Fosforilación Spec #1 MC=>NR(4.00)[BP = 11258.5, 617] G-N-D-T-T-L-D-S-S-M-E 11260.97 100 617.4 90 80 % Intensity 70 60 50 40 30 11221.81 20 10 0 11000 11200 11400 11600 11800 Mass (m/z) ** 0 12000 **** G-N-D-T-T-L-D-S-S-M-E * Spec #1=>NR(5.00)[BP = 11346.4, 372] 11347.98 100 11427.25 90 * * * 371.7 11.266 11506.70 80 11.347 % Intensity 70 60 11.427 11554.65 11266.47 50 11387.06 11606.43 40 11.506 11712.60 30 11831.89 20 10 0 11000 11200 11400 11600 Mass (m/z) 11800 0 12000 80 80 80 Thermo electron corporation MODIFICACIONES POSTRADUCCIONALES 2) GLICOSILACIONES : Adición de un Carbohidrato o un Polisacárido dando lugar a una glicoproteína. Moléculas complejas debido a la heterogeneidad de los azúcares. . >60% Proteínas en mamíferos . Marcadores interacciones célula/célula, célula/molécula : Fertilización, respuesta immune, replicación viral, infecciones parasitarias, crecimiento de la célula, inflamaciones, degradaciones . . . Cambios observables en el masas . Adición azúcares en posiciones N-Linked NH2 Asn O-Linked Ser, Thr . Incremento del peso de la proteína en función de la modificación. N- y O-linked Protein Glicosylation Thermo electron corporation MODIFICACIONES POSTRADUCCIONALES 2) GLICOSILACIONES : Análisis . Identificación de la Proteína Glicosilada, tipo de Glicosilación y posición en la cadena peptídica, caracterización de la Glicosilación : Secuencia de las cadenas . Incremento del peso de la proteína en función de la modificación. Estrategia GlcNac Proteolisis Detección y aislamiento de la Proteína GlcNac LC-MS/MS MALDITOF/TOF . Identificación Proteína ( DataBase) . Identificación grupo GlcNac . Posición en la cadena peptídica . Secuenciación azúcares Secuenciación cadena glicosídica . Enzimática ( glicosidasas ) . MS/MS GlcNac % m/z MODIFICACIONES POSTRADUCCIONALES 3) Acetilaciones: Adición de un grupo Acilo ( -COCH3) en el grupo amino terminal o los grupos amino libres (Lisina K ) ΔM = 42 Oxidaciones: Metioninas ΔM = 16 Aductos acrilamida: Cisteínas ΔM = 71 Carbamidometilación : Adición grupo -CH2CONH2 en el grupo -SH de las cisteínas ΔM = 57 Comprovación Interacción Específica entre Proteínas Da Dominio Da Fusionado con GST GST-Da Mw= 36 KDa ? Myo D Dominio Myo D Fusionado con polyhistidinas Myo D Mw= 15 KDa Secuencia His6 MYO-D MW aprox 15300Da MRGSHHHHHHGMASMTGGQQMGRDLYDDDDKD PSSSSAMAPKKKRKVPGVPSSNCIDWIX KRKTTNADRRKAATMRERRRLSKVNEAFETLKRC TSSNPNQRLPKVEILRNAIRYIEGLQALLR DQGSPGTELNCGR 1) Interacción proteica + GST-Da Extracto Proteico 2) Columna afinidad GST 1D-SDS-PAGE Eluido Lavado 3) Liberación proteína Proteínas no interaccionantes GST-Da Prot. Interaccionante MW 1D-SDS-PAGE ELUÍDO CROMATOGRAFÍA DE AFINIDAD Voyager Spec #1=>NR(0.80)=>NR(1.00)[BP = 15457.7, 629] 100 628.9 15407 GST-Da 36504 90 80 GST-Da degradation GST-Da (2+) % Intensity 18288 27179 GST-Da 70 MyoD? 60 50 MyoD ? 40 9999.0 17999.4 25999.8 34000.2 Mass (m/z) Espectro MALDI-TOF 42000.6 50001.0 Digerido tríptico de la proteína interaccionante con Da Espectro de MALDI-TOF Voyager Spec #1[BP = 1175.7, 16833] 1175.74 100 1.7E+4 90 80 -Recorte -Dig. Trypsina -Extracción péptidos -Análisis MS % Intensity 70 60 50 40 2073.00 30 2058.01 1177.75 1206.72 20 1050.59 10 842.55 1333.66 2075.00 1404.70 2060.01 1406.71 1080.45 1208.72 2327.12 2014.02 1300.68 2665.34 1478.67 1613.861717.96 1180.66 1052.60 861.10957.47 1308.77 1422.75 770.34 1838.851935.01 2055.95 2146.982251.20 2384.18 2515.28 2649.34 2776.53 2894.57 1513.43 0 0 749.0 1199.2 1649.4 2099.6 2549.8 3000.0 Mass (m/z) Identificación Proteína Interaccionante con Da Myo D Peptide Mass Fingerprinting + p Full ms2 [email protected] [ 160.00-1250.00] 100 Relative Abundance 90 Bases de Datos 588.34 899.4 MS/MS ión 588.3 (+2) YIEGLQALLR 588.75 80 70 589.24 60 50 40 249.1 770.5 600.4 30 288.2 20 406.0 888.2 576.1 472.3 401.2 450.3 10 0 MS/MS Spectra MS-TAG ZoomScan Ión 588.3 (+2) 277.0 548.2 175.2 200 300 400 500 704.1 1001.2 775.2 713.4 647.1 881.4 600 700 800 900 m/z 1000 1100 1200 Resultado: Proteína Myo D Index Number: 127240 Acc. #: P10085 Species: MOUSE Name: Myoblast determination protein 1 pI of Protein: 5.3 Protein MW: 34219 Amino Acid Composition: A36 C9 D25 E19 F8 G22 H8 I7 K9 L27 M4 N9 P36 Q9 R25 S32 T13 V10 W1 Y9 1 11 21 31 41 51 MELLSPPLRD IDLTGPDGSL CSFETADDFY DDPCFDSPDL RFFEDLDPRL VHVGALLKPE 81 91 101 111 121 131 VRAPSGHHQA GRCLLWACKA CKRKTTNADR RKAATMRERR RLSKVNEAFE TLKRCTSSNP 161 171 181 191 201 211 QALLRDQDAA PPGAAAFYAP GPLPPGRGSE HYSGDSDASS PRSNCSDGMM DYSGPPSGPR 241 251 261 271 281 291 KSAAVSSLDC LSSIVERIST DSPAAPALLL ADAPPESPPG PPEGASLSDT EQGTQTPSPD 61 EHAHFSTAVH 141 NQRLPKVEIL 221 RQNGYDTAYY 301 AAPQCPAGSN Péptidos trípticos identificados - VNEAFETLKR YIEGLQALL 71 PGPGAREDEH 151 RNAIRYIEGL 231 SEAVRESRPG 311 PNAIYQVL