ESTRUCTURAS de PROTEINAS Wikimedia Commons by LadyofHats Paolo Maietta Grupo de Biología Computacional Estructural Centro Nacional de Investigaciónes Oncológicas (CNIO) Summer School 2013 Introducción a la Bioinformática Bioinformática estructural Julio 2013 Estructura de proteínas Determinación experimental de la estructura Cristalografía de rayos X Resonancia magnética nuclear (NMR) Microscopía electrónica 3D Estructura de proteínas Determinación experimental de la estructura Cristalografía de rayos X Resonancia magnética nuclear (NMR) Microscopía electrónica 3D Proteínas • • • • • Polímeros de los 20 aminoácidos naturales en conformación L Con un número de resíduos típico entre 100 y 300, aunque pueden llegar a más de 1000 (titina, ~34000). Por debajo de 20-30 se les llama péptidos La mayoría de las proteínas tiene poca estructura regular, en forma de hojas o fibrilar, y forman forman grandes agregados con misión estructural. Proteínas estructurales (colágeno), pelo, lana, etc... La estructura proteica se mantiene por interacciones entre los resíduos que la componen. Enlaces de H, enlaces disulfuro, puentes salinos. La rotura de estas interacciones por calor, cambios de pH, conduce a la desnaturalización Aunque hay proteínas que se pliegan con ayuda de chaperonas, es hipótesis generalizada que la mayoría de la información para su estructura 3D se encuentra en la secuencia. De los aminoácidos …. Cada aminoácido tiene unas características físico - químicas distintas; Estas influyen en el plegamiento de la proteína De los aminoácidos …. Cada aminoácido tiene unas características físico - químicas distintas; Estas influyen en el plegamiento de la proteína Y además los aminoácidos están conectados entre si en una cadena …. >Estructura Primaria ASKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTT GKLPVPWPTLVTTFSYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTIFF KDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNV YIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHY LSTQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYK … a la Estructura Diagramas de Ramachandran Pro Gly Matthews/Van Holde Biochemistry, 2nd edition α helices α El esqueleto de la proteína adopta una conformación de hélice y en cada giro entran 3.6 residuos. Los enlaces de hidrógenos entre los grupos carboxilo del residuo n y el grupo amino del residuo n+4 estabilizan la estructura. Las hélices son flexibles y las cadenas laterales miran hacia fuera. β strands βa βp α Los β strands se juntan para generar β sheets gracias a la energía de estabilización de los enlaces de hidrógeno entre las diferentes láminas. Más β strands and turns ... Los β sheets pueden estar plegados o torcidos pero no son flexibles !! Los β sheets pueden contener láminas paralelas, anti-paralelas o una mezcla de ambas. Más β strands and turns ... Los β sheets pueden estar plegados o torcidos pero no son flexibles !! Los β sheets pueden contener láminas paralelas, anti-paralelas o una mezcla de ambas. Estructura terciaria • Interacciones entre resíduos. O C (+) N CH (-) H O C NH Enlaces disulfuro CH Enlaces de H Interacciones hidrofóbicas Puentes salinos O C + O H N CH 3 Estructura terciaria Interacciones con el disolvente Hydrophobic Hydrophilic H-bond ! Denaturation Renaturation Native (ordered, folded) state ! ! Denatured (unfolded) state Estructura terciaria Un fold es la unidad básica de plegamiento en las proteínas. ● Formados por varias unidades de estructura secundaria dispuestas de una manera característica. ● Cuando en una proteína se presentan varios folds, se habla de dominios estructurales. Con frecuencia, un dominio representa una parte de una proteína con una función característica. ● Los elementos del fold se juntan por interacciones no covalentes, normalmente entre las cadenas laterales. ● Existen bases de datos para la caracterización estructural de proteínas ● ● ● SCOP: Clasificación jerárquica hecha manualmente CATH: Clasificación automática y supervisada visualmente. Clase, Arquitectura, Topología, Homología Estructura terciaria α Orthogonal bundle Updown bundle horseshoe solenoide α Barril α/α β trefoil Sandwich β Barril β 4-propellor 8-propellor α/β. Principalmente láminas B paralelas con motivo β-α-β α+β. Principalmente láminas β antiparalelas, con zonas α y β separadas Superroll Tim-barrel horseshoe Sandwich−βαβ inmunoglobulin Clustering jerárquico αααα α α α α αααα α α α α α α α ααααα α α α α α α α ααα ααα α α α α α αααα α α αα αα αα α αα α α α αα αααα α α α α αα α β α ββα α α α αααα β β β β β ααα α βββ ααα βββ αααα β ββββ βββ β βββα β β ββββββββββββββββββββββ β Determinación estructura Estructura de proteínas Determinación experimental de la estructura Cristalografía de rayos X Resonancia magnética nuclear (NMR) Microscopía electrónica 3D Cristalografia de Rayos X ● ● ● ● Fuente de Rayos X: Ánodo rotatorio. Mejor un sincrotón Monocromador o espejos de enfoque Goniómetro para determinar el ángulo de inclinación del cristal. Detector de área: Usualmente placas fotográficas o dispositivos CCD Cristalografia de Rayos X ● ● ● ● Patrón de difracción Los rayos X son dispersados por la nube electrónica de los átomos de la proteína. Cuantos más electrones tiene un átomo, más poder de dispersión. ● Un pequeño cristal de proteína es expuesto a rayos X. Los rayos difractados son recogidos por un detector. El resultado del experimento es un patrón de reflexiones de diferente intensidad Deben recogerse muchos patrones para cubrir todo el espacio de orientaciones del cristal. Tras el procesado de los datos, se acaba con una lista de intensidades en una red tridimensional de índices. Lo que mide el detector es la intensidad de los factores de estructura Cristalografia de Rayos X ● Es la parte crítica del proceso Subtilisina Celulasa Calmodulina Toxina del tetanos Cómo hacer un cristal Los cristales de proteína son frágiles y contienen alrededor de un 50 % de disolvente. ● Se comienza con un solución concentrada (2-50 mg/ml) y se añaden agentes precipitantes. ● El proceso debe ser lento y con frecuencia hay que probar muchas condiciones. Right : The hanging drop technique. Center : 24 such hanging drop experiments are set up in a Linbro plate. Right : A kit of different screening solutions, a set-up Linbro plate, dialysis buttons and a micro batch plate behind a goniometer head. ● Los cristales deben tener decenas de nm. En todas direcciones para ser útiles en difracción. ● Cristalografia de Rayos X Enhebrado de secuencia de la proteína en el mapa de densidad electrónica NMR Ciertos núcleos (1H, 13C, 15N, 31P) tienen momento angular ≠ 0. Bajo campos magnéticos fuertes se puede separar los niveles de energía de núcleos con distinto número de spin (número cuántico magnético). el spin se va a alinear en relación al campo, pero la absorción de radiación electromagnética de frecuencia apropiada (radio) induce una transición. Cuando los núcleos revierten al estado de equilibrio (relajación) emiten una radiación que puede ser medida. La frecuencia exacta de esta radiación emitida depende del entorno en el que se encuentra el núcleo. NMR NMR NMR vs Rayos X ME ME ● ● ● Número limitado de imágenes de proyección Imágenes de proyección Especimen original Resolución limitada Hay mucho ruido en las imágenes. Translacional y rotacional Algoritmos de reconstrucción Reconstrucción tridimensional ME ME Protein Data Bank El repositorio de las estructuras 3D The Protein Data Bank El wwPDB es un repositorio para estructuras de proteínas y otras macromoleculas biológicas El wwPDB está constituido por 4 grupos: RCSB, BRMB, PDBe y PDB-Japan. Cada uno ofrece la misma información básica pero con presentación gráfica personalizada y también enlazando a servicios especificos. The Protein Data Bank The RCSB Protein Data Bank The RCSB Protein Data Bank The RCSB Protein Data Bank The RCSB Protein Data Bank The RCSB Protein Data Bank The RCSB Protein Data Bank The RCSB Protein Data Bank Sequence Tab Uniprot Sequence Cross-reference Secondary structure The RCSB Protein Data Bank The RCSB Protein Data Bank Header Chain ID Journal The RCSB Protein Data Bank Atom Residues Co-ordinates Chain ID Flexibility Documentación de referencia http://www.wwpdb.org/docs.html Bases de Datos basadas en información estructural Alineamiento estructural Se define como la superposición de 2 o más estructuras 3D, intentando que cuantos más átomos coincidan Normalmente los programas tienen en cuenta principalmente de los carbonos alpha Los alineamientos de estructuras no son alineamientos de secuencias, pero a partir de ellos se pueden obtener Los alineamientos estructurales además son importantes para comparaciones evolutivas y estudios funcionales Existen distintos métodos, cada uno basado en ideas distintas. For example, DALI (contact maps), Mammoth (secondary structure), SSAP (dynamic programming) LGA (longest segment). SCOP (Structural Classification of Proteins) La base de datos proporciona una detallada descripción de las relaciones estructurales entre proteínas. Está curada manualmente. FOLD: Major structural similarity. Proteins are defined as having a common fold if they have the same secondary structures arrangement and the same topological connections. SUPERFAMILY: Probable common evolutionary origin. Proteins often have low sequences identities, but structural and functional features suggest a common evolutionary origin. FAMILY: Clear evolutionary relationship. Proteins in families are clearly evolutionarily related. Generally the pairwise residue identities are greater than 30%. The CATH Database Es la misma idea de SCOP, pero la clasificación es distinta y hay 4 niveles. La clasificación de CATH se lleva a cabo de forma semi-automática Class: Secondary structure and packing Architecture: overall shape, domain structure and orientation (no connectivities between the secondary structures) Topology (FOLD family): overall shape and connectivities. Homologous superfamily: proteins are thought to share common ancestor. Similarities by sequence alignment and then by structure comparison using the SSAP structural alignment program. CATH & SCOP statistics FIN (xFIN) = 2 FIN