Facultad de Ciencias Exactas y Naturales - UBA Cristalización y cristalografía de proteínas Guía de TPs 11-12 Química Biológica II-B: Estructura y Función de Biomoléculas 2004 TP 11: Cristalización de Proteínas Práctico de “hanging drop” En este práctico intentaremos reproducir condiciones de cristalización previamente establecidas de la proteína lisozima de huevo de gallina (HEL). Para ello utilizaremos la técnica de difusión de vapor en “hanging drop”. Haremos un estudio breve de la influencia de la concentración de la proteína y del precipitante en la aparición y tamaño de cristales. Para ello, variaremos en forma de damero ambos parámetros. Las condiciones de cristalización son las siguientes: 1.1 M NaCl, 0,1 M AcNa pH 4,6. Se probarán condiciones de acuerdo al siguiente esquema: Lisozima NaCl 1.0 M 0,1 M AcNa pH 4,6 NaCl 1.1 M 0,1 M AcNa pH 4,6 NaCl 1.2 M 0,1 M AcNa pH 4,6 50mg/ml 40 mg/ml 30 mg/ml Se largaran gotas mezclando 3 ul de solución proteica con 3 ul de licor madre. En el reservorio se pondrán 500 ul de licor madre. Práctico de “sitting drop” En este práctico utilizaremos la técnica de difusión de vapor en “sitting drop”. Haremos un estudio breve de la influencia de la concentración de la proteína y del precipitante en la aparición y tamaño de cristales. Para ello, variaremos en forma de damero ambos parámetros. Las condiciones de cristalización son las siguientes: 1 M NaCl, 0,1 M AcNa pH 4,6. Se probarán condiciones de acuerdo al siguiente esquema: Lisozima NaCl 1.0 M NaCl 1.1 M NaCl 1.2 M 0,1 M AcNa pH 4,6 0,1 M AcNa pH 4,6 0,1 M AcNa pH 4,6 50mg/ml 40 mg/ml 30 mg/ml Se largaran gotas mezclando 5 ul de solución proteica con 5 ul de licor madre. En el reservorio se pondrán 500 ul de licor madre. Montado de Cristales Una vez obtenido el cristal de la proteína en estudio, el paso siguiente consiste en ubicarlo de forma adecuada en el equipo de difracción para ser incidido por los rayos X. Para ello existen dos métodos, según la colección de datos se haga a temperatura ambiente o en condiciones criogénicas. En el primer caso, los cristales son colocados en capilares de vidrio o cuarzo de 0,01 mm de espesor con la ayuda de pipetas y jeringas especiales, teniendo en cuenta que quede a ambos lados del cristal (pero sin tocarlo) una pequeña cantidad de aguas madres para evitar su desecación. Por otro lado, la toma de datos a bajas temperaturas requiere que los cristales sean atrapados por tensión superficial en pequeños lazos o “loops”, en donde el flujo de nitrógeno en ebullición utilizado impacta directamente sobre el cristal. Para este método es necesaria una inmersión previa o “soaking” del cristal en una solución crioprotectora (en general aguas madres con glicerol o etilenglicol) que evita que se forme hielo cristalino en el cristal, con la consecuente aparición de anillos de difracción de hielo en las imágenes TP 12: Resolución de la estructura de una macromolécula por cristalografía de rayos X El objetivo de un experimento de difracción de rayos X es reconstruir una imagen en tres dimensiones de la macromolécula cristalizada, a partir de la información dada por la difracción (por parte de los electrones de la molécula) de los rayos X que inciden sobre el cristal. Esta reconstrucción es posible si contamos con la descripción completa de la onda (i.e., amplitud, frecuencia y fase) de cada rayo difractado (reflexión). Con esta información se obtiene un mapa de densidad electrónica, que permite construir un modelo de la molécula acorde a dicha densidad electrónica. El modelo final constituye un archivo de coordenadas x, y, z que describe la posición espacial de cada átomo de la macromolécula en estudio. El diagrama del proceso de resolución de una estructura es el siguiente: Colección y procesamiento de datos de proteína nativa (obtención amplitudes) Obtención de fases Existe un modelo Reemplazo molecular (usar las fases del modelo) No existe un modelo Selenoderivado (Sincrotron) Átomos pesados (Ánodo rotatorio) Posición de selenio Posición de átomos pesados Construir un modelo inicial Determinación de fases Sustituir la secuencia Calcular mapa de densidad electrónica Calcular mapa de densidad electrónica Construir modelo Modelo y mapa con fases a afinar Afinamiento automático y reconstrucción manual del modelo Estimación de la calidad de la estructura Primeros Resultados – Obtención de la celda unidad y grupo espacial La primera información que se debe obtener con las primeras imágenes son el grupo espacial y los parámetros de celda correspondiente. Conocer la simetría del cristal es importante para diseñar la estrategia de colección de datos y esencial para la integración de datos. Sólo son necesarias unas pocas imágenes para su determinación. Programas utilizados en esta etapa: Mosflm, Denzo (ánodo rotatorio, sincrotrón) Frambo, Astro (ánodo rotatorio del instituto) Si en las primeras imágenes se observan spots a buena resolución y la celda unidad se puede hallar sin problemas, se continuan tomando imágenes hasta conseguir un set completo de datos. El número total de imágenes y la porción a cubrir para logran un set completo de observaciones dependen fuertemente del grupo espacial. Integración y escalamiento Una vez tomado un juego completo de datos, debe integrarse la información de todas las imágenes y ponerla en la misma escala. Esto es necesario debido a que existen variaciones entre las imágenes debidas a la intensidad de los rayos X y el decaimiento del cristal; además, la simetría del cristal determina que muchas de las reflexiones medidas sean redundantes. El resultado de ello es una lista de intensidades de las reflexiones únicas (con su error experimental) y de sus posiciones en el espacio recíproco (h, k, l). Finalmente se transforman las intensidades en factores de estructura, los cuales se guardan en un archivo que con frecuencia lleva la extensión .mtz. Programas utilizados en esta etapa: Mosflm, Scalepack, Sort/Scala, Truncate (ánodo rotatorio, sincrotrón) Saint, XDS (ánodo rotatorio del instituto) Estos factores de estructura contienen la amplitud de las ondas difractadas, pero carecen de información acerca de la fase de la onda. Sin conocer fases, no podemos interpretar la información experimental de modo tal de reconstruir la estructura de la macromolécula. Obtención de fases La obtención de fases es el punto de mayor dificultad en la resolución de una estructura. Si se cuenta con las coordenadas espaciales de una macromolécula de estructura homóloga previamente resuelta, se puede usar ésta como modelo y tomar las fases a partir de ella. Para ellos debemos hacer uso de programas de REEMPLAZO MOLECULAR (molecular replacement). Computacionalmente se realiza una orientación del modelo en la celda unidad de forma tal que los factores de estructura del modelo se parezcan lo más posible a los factores de estructura observados experimentalmente. En general, el modelo utilizado es el de una proteína de estructura secundaria y terciaria similar a la investigada, a la cual se le reemplazan todas sus cadenas laterales por alaninas. Programas utilizados en esta etapa: Suite CCP4: AMoRe, MolRep Suite CNS: Molecular Replacement Si no se cuenta con una estructura con suficiente homología, se deben estimar las fases a partir de otros métodos. Uno de los mas utilizados es el llamado MIR (multiple isomorphous replacement), en donde las fases se determinan a partir de la difracción de cristales de la misma proteína derivatizada con átomos pesados (e.g. Hg, Pt). Los metales se une en forma no covalente a ciertos residuos de la molécula cristalizada. Las fases de las difracciones correspondientes a los átomos pesados se pueden obtener por el cálculo de las posiciones de dichos átomos, mediante las llamadas funciones de Patterson. A partir de las fases de los átomos pesados se pueden estimar las fases del resto de los átomos en la estructura. Programas utilizados en esta etapa: Suite CCP4 (varios programas) Suite CNS (varios programas) La información de fases se incorpora en el cálculo de los factores de estructura, que ahora sí se acercarán a la representación matemática de las ondas difractadas. Afinamiento y reconstrucción iterativa del modelo El paso siguiente consiste en el afinamiento de las fases estimadas, el cálculo de un mapa de densidad electrónica con dichas fases, y la reconstrucción del modelo molecular de acuerdo a dicho mapa. Para ello se suele trabajar en forma iterativa, alternadamente en el espacio recíproco y en el espacio directo. Afinamiento en el espacio recíproco: En este proceso se modifican progresivamente las posiciones atómicas del modelo (coordenadas espaciales guardadas en un archivo con extensión .pdb), buscando la mayor similitud posible entre los factores de estructura experimentales (Fo) y los calculados con el modelo (Fc). Esto redunda en una mejora en las fases estimadas. Los cambios en las posiciones atómicas son condicionados por penalidades de distancias y ángulos de enlace, conformación absoluta de aminoácidos (rotámeros) y ángulos diedros permitidos. Se usan diversos programas de la suite CCP4 (e.g. Refmac) o CNS (e.g. Refine). Una vez halladas las coordenadas más favorables para un ciclo de afinamiento, se combina su información de fases con las observaciones experimentales y se calculan mediante transformaciones de Fourier, mapas de densidad electrónica (x,y,z). Afinamiento en el espacio directo: Una vez obtenido el mapa de densidad electrónica, se lleva a cabo lo que se conoce como reconstrucción del modelo (model building). En un programa de graficación (e.g. O, CrystalView) se carga el mapa de densidad electrónica y se le superpone el esqueleto del modelo. Se busca entonces que el modelo ajuste a la densidad experimental. Para ello se modifican las partes del modelo que no se ajustan a la densidad electrónica observada. Lo más común es agregar cadenas laterales de aminoácidos que no se encuentran asignados en el modelo inicial, o mover la posición de la cadena principal o las cadenas laterales asignadas. Para ello es crucial el conocimiento de la secuencia de la proteína investigada. Es muy inusual que con el primer mapa se puedan reconstruir todas las cadenas laterales, lo que se recomienda es colocar solamente aquellas que se vean nítidamente en el mapa y dejar las otras para los siguientes ciclos de afinamiento. Una vez modificadas adecuadamente las posiciones de los átomos del modelo, se vuelve a comenzar con el afinamiento en el espacio recíproco y así sucesivamente. La pregunta es entonces, ¿cuándo finaliza el afinamiento? A medida que se afina tanto en el espacio recíproco como en el directo, el modelo se va ajustando cada vez más a la densidad electrónica. El grado de precisión y detalle estructural que se va logrando depende de la resolución obtenida originariamente en las imágenes. Como guía para el ajuste del modelo a la densidad electrónica existe un factor estadístico de correlación R, que marca la diferencia relativa entre los factores de estructura Fo y Fc. Cuando sucesivos pasos de afinamiento no modifican apreciablemente el valor de este parámetro, y el mismo oscila en valores cercanos a 0,25, se puede considerar concluído el afinamiento de la estructura. Sin embargo, aún pueden quedar zonas de densidad electrónica sin asignar, las cuales probablemente correspondan a moléculas de agua estructurales, de iones constitutivos o cofactores de la molécula, o bien de aditivos de la solución de cristalización. La asignación racional de estas densidades hará bajar aún mas el factor R. En este momento se da por terminado el afinamiento. Seguidamente se analizan distintos parámetros de la estructura que permiten evaluar la calidad del modelo. Junto con el factor R, se calcula un factor Rfree (similar al R pero calculado con observaciones que no participaron en el proceso de afinamiento). También se calculan desviaciones de la idealidad en longitudes y ángulos de unión, y se analizan la presencia o no de ángulos conformacionales irregulares correspondientes a la cadena principal, mediante el gráfico de Ramachandran. El resultado de todo el proceso de resolución de estructuras es un archivo de texto con extensión .pdb, que contiene las coordenadas espaciales del modelo, ajustadas a la densidad electrónica experimental. También nos quedará un archivo con los factores estructura experimentales y un mapa de densidad electrónica. El último paso es el depósito de las coordenadas obtenidas para el modelo (.pdb) en la base de datos del Protein Data Bank (www.rcsb.org), donde a cada proteína publicada se le asigna un códico alfanumérico de 4 caracteres (e.g. 1HEL corresponde a la lisozima de clara de huevo de gallina). Esta base de datos es gratuita y de acceso público. Bibliografía 1) “Crystallization of Biological Macromolecules”. Edited by Alexander McPherson. CSHL Press, New York, 1999. 2) “Second virial coefficient as predictor in protein crystal growth” George, A., chiang, Y., Guo, B., Arabshashi, A., Cai, Z. and Wilson W.W. Methods in Enzymology, 276:100-110, 1997. 3) “Crystallography Made Crystal Clear”, 2nd edition. Gale Rhodes. Academic Press, San Diego, 2000. 4) “Principles of protein X-ray crystallography” 2nd edition. Jan Drenth. SpringerVerlag, New York, 1999.