5 p redicción de modificaciones Post-traduccionales Capítulo Con el eminente desarrollo de la proteómica, las bases del conocimiento biológico recopiladas en bases de datos, en particular sobre modificaciones post-trasduccionales (MPTD) en proteínas, han jugado un papel crucial en la investigación de la regulación celular. Los sitios de modificación PTD son de extrema importancia en el control de transducción de señales dada su influencia sobre las propiedades físicas y químicas, plegamiento, conformación, distribución, estabilidad, actividad y función de las proteínas. Entre las MPTD más frecuentes están las siguientes: fosforilación, N-glicosilación, acetilación, hidroxilación, miristilación, isoprenilación, y sulfatación, entre otros. Para detectar los sitios de modificaciones post-traduccionales en secuencias de aminoácidos o proteínas son empleados diferentes servidores, entre los cuales tenemos: UNIVERSIDAD DE CARTAGENA Findmod URL: http://www.expasy.ch/tools/findmod/ ENTIDAD ADMINISTRADORA Instituto Suizo de Bioinformática. DESCRIPCIÓN Findmod predice el potencial de modificaciones post-trasduccionales y de sustituciones singulares de aminoácidos en péptidos. Las masas de péptidos determinadas experimentalmente son comparadas con las de péptidos específicos calculados teóricamente depositados en Swiss-Prot o con la de secuencia introducida en el servidor. La diferencia entre las masas es empleada para caracterizar la proteína de interés debido a que corresponden a sitios MPTD conocidos, depositados en Swiss-Prot (Wilkins et al., 1999). dbPTM (Depósito de Información de Modificaciones Post-traduccionales) URL: http://dbptm.mbc.nctu.edu.tw// ENTIDADES ADMINISTRADORAS Instituto de Bioinformática, Departamento Nacional de Ciencias Biológicas e Instituto de Ingeniería Bioquímica, Chiao Tung. Universidad de Taiwán. Departamento de Obstetricia y Ginecología, Hospital Memoria de Chang Gung. Centro Médico Tao-Yuan 333, Taiwán. DESCRIPCIÓN dbPTM es una base de datos cuya función es compilar información de modificaciones post-trasduccionales (PTDs), sitios catalíticos, accesibilidad al solvente de residuos de aminoácidos, estructura secundaria y terciaria de proteínas, dominios de proteínas y variaciones en las proteínas. UNIVERSIDAD DE CARTAGENA La base de datos incluye todos los sitios de MPTD de validación experimental de SwissProt (Farriol et al., 2004), PhosphoELM (Diella et al., 2004) y O-GLYCBASE (Gupta et al., 1998). DbPTM identifica de forma sistemática sitios importantes de MPTD en proteínas (Fosforilación, glicosilación y sulfatación), a partir de tres herramientas de predicción independientes que pueden ser accedidas a través de ella: KinasePhos (http://kinasephos.mbc.nctu.edu.tw/), Sulfosite (http://sulfosite.mbc.nctu.edu.tw/) Glicosee y (http://dbtm.mbc.nctu. edu.tw/GlycoSee/). KinasePhos incorpora los Modelos Ocultos de Markov (HMM) para la identificación de sitios específicos de fosforilación a enzimas kinasas con un 87% de predicción (Huang et al., 2005a; y Huan et al., 2005b). Sulfosite permite predecir sitios Y de sulfatación y Glicosee determina los sitios de N-glicosilación N y C terminales. La estructura secundaria y accesibilidad al solvente son también predichas computacionalmente (Lee et al., 2006). Ejemplo: La secuencia en formato fasta de la Actinidina de 30 kD fue utilizada como información de entrada en el servidor dbPTM. El reporte de los resultados es dividido en 5 partes (Figura 5.1). La primera muestra una tabla cuya primera columna aparecen vínculos que representan los ID (ACTN_ACTCH) de secuencias de proteínas almacenadas en Swiss-Prot utilizada en el alineamiento con la introducida en el servidor. En las demás columnas está reportado el porcentaje de identidad (100%), longitud de aminoácidos alineados (254), rango de la secuencia introducida (1-254) y de la depositada en la base de datos Swiss-Prot utilizada en el alineamiento (127-380). De igual manera el valor E y un score que refleja el grado de semejanza entre las secuencias (Figura 5.1A). Luego se hace click sobre el vinculo ID de interés que aparece en la primera columna de la tabla en este caso ACTN_ACTCH y aparece un segundo reporte que muestra la información de la proteína (Código de acceso en el Swiss-Prot (p00785), ID, nombre (Actinidain precursor), especie a la cual pertenece (Actinidia Chinesis), taxonomia, secuencia y datos estructurales si son conocidos de la proteína, entre otros) (Figura 5.1B). UNIVERSIDAD DE CARTAGENA 5.1A. 5.1B. FIGURA FIGURAA.A. UNIVERSIDAD DE CARTAGENA FIGURA FIGURAA.A. 5.1C. Figura 5.1. Reporte de salida del servidor dbPTM. A) Resultado de Búqueda de secuencias similares a la ingresada en la base de datos Swissprot. B) Información de la proteína. C)Modificaciones Post-traduccionales. D) Esquema de las predicciones anteriores. 5.1D. UNIVERSIDAD DE CARTAGENA La tercera parte muestra una lista de las posibles modificaciones post-traduccionales acompañadas de la posición del aminoácido involucrado y su accesibilidad al solvente (ASA). El sitio catalítico y su estructura secundaria. La serina en la posición 6 del precursor de la Actinidina tiene una mayor probabilidad de ser fosoforilada, debido a su mayor accesibilidad (29%) al solvente, además hace parte del péptido señal del precursor de la proteína, por lo tanto es posible que este residuo este interaccionando con los fosfolípido de la membrana. También hay que resaltar el residuo N29 con accesibilidad de 46% ubicado en el péptido de activación del precursor podría ser Nglicosilada por una enzima N-glicosiltransferasa. Por último, el reporte de salida dbPTM muestra un diagrama de los sitios de MPTD, estructura secundaria, accesibilidad al solvente y dominio de las proteínas. Servidor NetAcet 1.0 URL: http://www.cbs.dtu.dk/services/NetAcet/ ENTIDAD ADMINISTRADORA Centro para el Análisis de Secuencias Biológicas (CBS), Universidad Técnica de Dinamarca. DESCRIPCIÓN Servidor para la Predicción de Sitios de acetilación para N-terminales (Kiemer et al., 2005). ProP URL: http://www.cbs.dtu.dk/services/ProP/ ENTIDAD ADMINISTRADORA Centro para el Análisis de Secuencias Biológicas (CBS), Universidad Técnica de Dinamarca. UNIVERSIDAD DE CARTAGENA GlycoMod URL: http://www.expasy.ch/tools/glycomod/ DESCRIPCIÓN El servidor GlycoMod Determina posibles estructuras oligosacáridas unidas a proteínas a partir de sus masas determinadas experimentalmente (es posible utilizarlos para la oligosacáridos libres o derivatizaciones aligosacáridas y por glicopéptidos) (Cooper et al., 2001). YinOYang URL: http://www.cbs.dtu.dk/services/YinOYang/ DESCRIPCIÓN Servidor basado en Redes Neuronales para la predicción de sitios de unión de O-ß-Nacetilglucosamina en proteínas eucarióticas (Gupta et al., en preparación). SITIOS DE FOSFORILACIÓN NetPhos URL: http://www.cbs.dtu.dk/services/NetPhos// ENTIDAD ADMINISTRADORA Centro para el Análisis de Secuencias Biológicas (CBS), Universidad Técnica de Dinamarca. DESCRIPCIÓN Netphos utiliza una red neuronal para la determinación de sitios de fosforilación a serinas, treoninas y tirosinas en proteínas eucarióticas (Blom et al., 1999). UNIVERSIDAD DE CARTAGENA DESCRIPCIÓN Servidor para la obtención de los sitios de anclaje de propéptidos de Arginina y Lisina en secuencias de proteínas eucarióticas (Duckert et al., 2004). Las siguientes direcciones de Internet corresponden a servidores de sitios posttrasduccionales: SITIOS DE GLICOSILACIÓN Big-PI Predicto URL:http://mendel.imp.univie.ac.at/sat/gpi/ gpi_server.html DESCRIPCIÓN Servidor para la predicción de sitios de unión de Glico-fosfatidilinositol (GPI) en proteínas (Eisenhaber et al., 2000; Eisenhaber et al., 2003). DGPI URL : http://129.194.185.165/dgpi/DGPI_demo_en.html DESCRIPCIÓN Servidor para la obtención de sitios de anclaje y de GPI en proteínas (Undenfriend y Kodukula 1995). GPI-SOM: Identification of GPI-anchor signals URL: http://gpi.unibe.ch/ DESCRIPCIÓN El servidor GPI-SOM Predice los sitios GPI con alta exactitud en proteínas eucarióticas. (Fankhauser y Maser et al., 2005). UNIVERSIDAD DE CARTAGENA Ejemplo: A continuación es presentado el reporte de salida de Netphos, a partir de la secuencia de la Actinidina de 30 kD. Este informe contiene 3 partes como aparece en la Figura 5.2. 5.2A. Figura 5.2. Resultados de la predicción de sitios de fosforilación por medio del servidor Net-phos. 5.2B. UNIVERSIDAD DE CARTAGENA 5.2C. La primera sección señala la distribución de los sitios de fosforilación predichos a lo largo de la secuencia para Y, S y T. La segunda muestra la posición de sitios de fosforilación dentro de la secuencia junto a un valor asociado con la probabilidad de que aparezca dicha modificación (Figura 5.2B) y la ultima corresponde a una representación gráfica de los sitios de fosforilación a lo largo de la secuencia (Figura 5.2C). OTROS SERVIDORES DE FOSFORILACIÓN ScanSite pI/Mw URL: http://www.expasy.ch/tools/scanprosite/ DESCRIPCIÓN Calcula el pI y Mw, además de los estados múltiples de fosforilación (Gattiker PlantsP URL: http://PlantsP.sdsc.edu. UNIVERSIDAD DE CARTAGENA DESCRIPCIÓN Es una base de datos funcional de sitios de fosforilación (Gribskov et al., 2001) y predice los sitios de N-miristilación en proteínas de plantas (Podell et al., 2004). NetPhosK URL: http://www.cbs.dtu.dk/services/NetPhosK/ DESCRIPCIÓN Predice los sitios de fosforilación en proteínas de células eucarióticas (Blom et al., 2004). DISPHOS URL: http://core.ist.temple.edu/pred/ DESCRIPCIÓN Predice sitios de fosforilación en proteínas (Iakoucheva et al., 2004). UNIVERSIDAD DE CARTAGENA REFERENCAS •Blom, N., Gammeltoft, S., Brunak, S. (1999). Sequence and Structure Based Prediction of Eukaryotic Protein Phosphorylation Sites. J. Mol. Biol. 294(5):1351-1362. •Blom, N., Sicheritz-Ponten, T., Gupta, R., Gammeltoft, S., Brunak, S. (2004). Prediction of posttranslational glycosylation and phosphorylation of proteins from the amino acid sequence. Proteomics. 4(6):1633-1649. •Cooper, C.A., Gasteiger, E., Packer, N. (2001). GlycoMod - A software Tool for Determining Glycosylation. Compositions from Mass Spectrometric Data. Proteomics. 1(2):340-349. •Diella, F., Cameron, S., Gemund, C., Linding, R., Via, A., Kuster, B., Sicheritz Ponten, T., Blom, N., Gibson, T.J. (2004). Phospho.ELM: a database of experimentally verified phosphorylation sites in eukaryotic proteins. BMC Bioinformatics. 5:79. •Duckert, P., Brunak, S., Blom, N. (2004). Prediction of proprotein convertase cleavagesites. Protein Eng. Des. Sel. 17(1):107-112. •Eisenhaber, B., Bork, P., Yuan,Y., Loeffler, G., Eisenhaber, F. (2000). Automated annotation of GPI anchor sites: case study C.elegans. TIBS. 25(7):340-341. •Eisenhaber, F., Eisenhaber, B., Kubina, W., Maurer-Stroh, S., Neuberger, G., Schneider, G., Wildpaner, M. (2003). Prediction of lipid posttranslational modifications and localization signals from protein sequences: big-, NMT and PTS1. Nucleic Acids Res. 31(13):3631-3634. •Fankhauser, N., Maser, P. (2005). Identification of GPI anchor attachment signals by a Kohonen selforganizing map. Bioinformatics. 21(9):1846-1852. •Farriol-Mathis, N., Garavelli, J.S., Boeckmann, B., Duvaud, S., Gasteiger, E., Gateau, A., Veuthey, A.L., Bairoch, A. (2004). Annotation of post-translational modifications in the Swiss-Prot knowledge base Proteomics. 4(6):1537-1550. •Gattiker, A., Gasteiger, E., Bairoch, A. (2002). ScanProsite: a reference implementation of a PROSITE scanning tool. Appl. Bioinformatics. 1(2):107-108. •Gribskov, M., Fana, F., Harper, J., Hope, D.A., Harmon, A.C., Smith, D.W., Tax, F.E., Zhang, G. (2001). PlantsP: a functional genomics database for plant phosphorylation. Nucleic Acids Res. 29(1):111113. UNIVERSIDAD DE CARTAGENA •Gupta, R., Birch, H., Rapacki, K., Brunak, S., Hansen, J.E. (1999). O-GLYCBASE version 4.0: a revised database of O-glycosylated proteins. Nucleic Acids Res. 27(1): 370-372. •Gupta, R., Hansen, J., Brunak, S. Identifying intracellular O-(beta)-GlcNAc `yin-yang' switches in the available human proteome. manuscript in preparation. •Undenfriend, S., Kodukula, K. (1995). How glycosylphosphatidylinositolanchored membrane proteins are made. Annu. Rev. Biochem. 64:563-591. •Huang, H.D., Lee, T.Y., Tzeng, S.W., Horng, J.T. (2005a). KinasePhos: a web tool for identifying protein kinase-specific phosphorylation sites. Nucleic Acids Res. 33 (Web Server issue):226-229. •Huang, H.D., Lee, T.Y., Tseng, S.W., Wu, L.C., Horng, J.T., Tsou, A.P. (2005b). Incorporating hidden markov models for identifying protein kinase-specific phosphorylation sites. J. Comput. Chem. 26(10):1032-1041. •Iakoucheva, L.M., Radivojac, P., Brown. C.J., O'Connor, T.R., Sikes, J.G., Obradovic, Z., Dunker, A.K. (2004). Intrinsic disorder and protein phosphorylation. Nucleic Acids Res. 32(3):1037-1049. •Kiemer, L., Bendtsen, J., Blom, N. (2005). NetAcet: Prediction of N-terminal acetylationsites. Bioinformatics. 21(7):1269-1270. •Lee, T.Y., Huang, H.D., Hung, J.H., Huang, H.Y., Yang, Y.S., Wang, T.H. (2006). dbPTM: An Information repository of protein post-translational modification. Nucleic Acids Res. 34(Database issue):622-627. UNIVERSIDAD DE CARTAGENA