1 2 Evolución Molecular Coordinadora: Susanna Manrubia Miembros de la línea de investigación: Jacobo Aguirre Araujo, María Arribas Hernán, Carlos Briones Llorente, Laura Cabanillas Vega, José Ángel Capitán Gómez, Cristina Cid Sánchez, Héctor Díaz Maldonado, María Fernández Algar, Laura García Descalzo, Eva García López, Ana García Sacristán , Manuel J. Gómez Rodríguez, Enrique González, Jaime I. Iranzo Sanz, Eva Mª Lanagrán Valero, Ester Lázaro Lázaro, Francisco J. López de Saro, Carlos Lugo, Susanna Manrubia Cuevas, Miguel Moreno Molina, Michael Stich Resumen: La línea de Evolución Molecular tiene como objetivo la caracterización experimental y teórica de los mecanismos evolutivos a nivel molecular. Los grupos que integran esta línea abordan cuestiones que requieren el uso de distintos sistemas, desde ácidos nucleicos hasta genomas completos, incluyendo aptámeros de RNA y DNA, virus de RNA y microorganismos extremófilos. Un aspecto clave para que la adaptación sea observable en el marco de esta investigación es la existencia de suficiente heterogeneidad en las poblaciones estudiadas. Ello permite el análisis de la dinámica in vitro de conjuntos de moléculas de RNA o virus de RNA en tiempos de semanas o meses, y la monitorización de los cambios moleculares que subyacen a la adaptación a nuevos ambientes o a la exposición a nuevas presiones de selección. En el caso de la evolución de microorganismos y genomas, donde habitualmente los tiempos a los que se producen los cambios moleculares son mayores, se analizan poblaciones naturales de distinta procedencia o con diferentes historias evolutivas, a fin de determinar los cambios genómicos implicados en su adaptación y, por ende, en su supervivencia. Desde una perspectiva más formal se analizan modelos computacionales de la evolución de poblaciones de moléculas de RNA y se plantean modelos fenomenológicos dirigidos a comprender los mecanismos básicos que relacionan genotipo y fenotipo, el efecto de la selección natural en la adaptación y la emergencia de la innovación evolutiva. Relación secuencia-estructura-función en el RNA experimental han sido los siguientes: Un tema fundamental en la investigación sobre el origen y la evolución temprana de la vida es el estudio de los procesos que pudieron llevar a la formación de las primeras macromoléculas poliméricas con información biológica (ácidos nucleicos y proteínas). De acuerdo con el modelo del “Mundo RNA” actualmente vigente, este ácido nucleico habría precedido al DNA y a las proteínas como biopolímero informativo, debido a su versatilidad funcional: es un archivo de información genética, tiene funciones estructurales y también catalíticas. Por tanto, las relaciones secuenciaestructura-función en el RNA son imprescindibles para explicar tanto la dinámica adaptativa de poblaciones de secuencias de RNA como la evolución precelular (RuizMirazo et al., en prensa). Dentro de este contexto general, en nuestra línea se investigan aspectos como las propiedades de moléculas análogas de los ácidos nucleicos naturales [como el ácido nucleico peptídico, PNA (Briones y Moreno, 2012)], las características de la relación entre secuencia y estructura secundaria en el RNA (Romero-López et al., 2012), el plegamiento tridimensional de esta molécula en distintas condiciones iónicas, la modularidad del RNA, la polimerización de ribonucleótidos sobre superficies catalizadoras, los procesos de selección de los ácidos nucleicos in vitro (aptámeros específicos contra diferentes dianas moleculares) o los escenarios formales que podrían explicar la aparición de RNAs autoreplicativos. En su aspecto más aplicado, se desarrollan aptámeros con aplicaciones terapéuticas, y biosensores basados en PNA o en aptámeros. 1. Se ha analizado la estructura del sitio de entrada interna del ribosoma (IRES) existente en la región 5’ del genoma del virus de la hepatitis C (HCV) mediante una combinación de microarrays de DNA y modificación química (sistema SHAPE). Se ha caracterizado el tipo de interacciones RNA-RNA que se establecen entre los extremos 5’ y 3’ del genoma de este virus, necesarias para que el IRES sea funcional y por tanto puedan traducirse las proteínas virales (Romero-López et al., 2012). Los logros principales en el año 2012 en el ámbito 2. Se ha optimizado la tecnología de microscopía de fuerza atómica (AFM) para el estudio de la estructura del IRES de HCV y del virus de la fiebre aftosa (FMDV) en diferentes condiciones iónicas (García-Sacristán et al., preprint). 3. Se han utilizado las técnicas de selección y evolución in vitro de ácidos nucleicos (RNA y DNA) previamente optimizadas en nuestro laboratorio para desarrollar aptámeros específicos contra una molécula de bajo peso molecular muy interesante como biomarcador en Astrobiología: el antibiótico Thiostrepton. Se ha iniciado el trabajo para la obtención de aptámeros de RNA y DNA contra dos proteínas que se unen al elemento IRES y poseen un gran interés como reguladores funcionales: Ebp1 y PCBP2. 4. Se han desarrollado aptámeros de RNA específicos contra la región 5’UTR del genoma del virus de la inmunodeficiencia humana (HIV), y se han diseñado moléculas cortas que poseen una funcionalidad similar a la de los aptámeros completos. Se ha demostrado el 1 4 3 sus consecuencias evolutivas. Aunque la mayor disponibilidad de mutaciones beneficiosas podría ser ventajosa, el hecho de que a alta tasa de error éstas aparezcan en contextos genómicos deletéreos puede dificultar su propagación y, en consecuencia, también la adaptación. Durante el año 2012 se han proseguido con el estudio de las consecuencias que el aumento artificial de la tasa de error tiene en la evolución, utilizando como modelo un virus RNA, el bacteriófago Qβ, replicando en presencia del análogo de nucleósido mutagénico 5azacitidina (AZC). Se ha prestado especial atención a la propagación en la población viral de varias mutaciones que aportan ventajas selectivas en presencia del mutágeno. Algunas de estas mutaciones llegan a fijarse, mientras que otras permanecen como polimorfismos durante un número elevado de generaciones. Los principales logros obtenidos son los siguientes: Figura 1. Frecuencia de mutación en el bacteriófago Qβ salvaje (wt) y en varios mutantes seleccionados en presencia de AZC. Se observa que todos los mutantes disminuyen la frecuencia de mutación respecto al virus salvaje en presencia de AZC. Sin embargo, mientras que para los mutantes en la replicasa (A2982G y U3582C) este descenso es significativo, no lo es para el mutante en la proteína readthrough (A1746U). gran potencial inhibidor en cultivo celular de estas moléculas, que han sido patentadas para su uso en terapia y diagnóstico (Patente P201231819). En el ámbito computacionales: de los estudios teóricos y 1. Se han utilizado los algoritmos de plegamiento in silico de RNA para analizar las poblaciones de aptámeros obtenidas experimentalmente en el laboratorio. La aproximación combinada in silico-in vitro ha permitido obtener los aptámeros de menor longitud (con sólo 16 nucleótidos) que son estables y activos como inhibidores de HIV. 2. Hemos continuado el estudio de la estructura topológica del espacio de genotipos a través del análisis de las redes neutrales de estructura secundaria de RNA y su accesibilidad mutua. Relación genotipo-fenotipo en virus de RNA Los virus RNA forman poblaciones altamente heterogéneas, capaces de adaptarse en tiempos récord a los cambios en las presiones selectivas. Este hecho, unido a que sus reducidos tamaños genómicos permiten establecer fácilmente relaciones entre el genotipo y el fenotipo, los convierte en un modelo excelente para estudiar los mecanismos moleculares básicos de la adaptación. El proceso adaptativo está determinado por dos parámetros principales que condicionan la proporción de mutaciones beneficiosas y la capacidad para que éstas se fijen en la población: el tamaño molecular y la tasa de error de la replicación. El aumento de la tasa de error incrementa la cantidad total de todos los tipos de mutaciones (beneficiosas, neutrales y deletéreas), lo cual hace muy difícil predecir 1. Se ha encontrado que las mutaciones polimórficas se distribuyen en varias líneas evolutivas que compiten entre ellas, dificultando la emergencia de una secuencia consenso definida. Cada línea evolutiva puede aportar ventajas selectivas a través de mecanismos moleculares diferentes, lo cual implica la coexistencia de multiples vías adaptativas en la población viral (Cabanillas et al., 2013). 2. Se ha demostrado que dos de las mutaciones beneficiosas que aparecen en el gen de la replicasa no pueden asociarse en el mismo genoma, lo cual es un claro ejemplo de epistasis antagonística. Como consecuencia, estas mutaciones compiten entre ellas, retrasándose su fijación y dando lugar a su presencia prolongada como polimorfismos. 3. La variedad de contextos genómicos en los que los polimorfismos son detectados indica que las mutaciones beneficiosas recurren frecuentemente en el bacteriófago Qβ. Este hecho podría disminuir las consecuencias negativas que la competición entre diferentes mutaciones tiene en la adaptación. 4. Se ha avanzado en el conocimiento de los mecanismos moleculares por los que actúan varias de las mutaciones beneficiosas seleccionadas en presencia de AZC. Se ha encontrado que las mutaciones en la replicasa disminuyen la frecuencia de mutación en el espectro de mutantes de la población viral. Otra de las mutaciones, localizada en el gen de la proteína readthrough, posiblemente afecta a la regulación de la expresión génica de dos de las proteínas virales. Por último, durante el año 2012 se han iniciado las siguientes líneas de investigación: 1. Selección y caracterización de mutantes del bacteriófago Qβ que posean mayor estabilidad en condiciones ambientales extremas en ausencia de replicación. 2. Evolución del bacteriófago Qβ en presencia de metales con capacidad para inducir estrés oxidativo. 2 6 5 Modelos de evolución y adaptación molecular En el año 2011 comenzamos un ambicioso proyecto que ha comenzado a producir resultados. El objetivo es el desarrollo de una teoría evolutiva del cambio fenotípico a partir de un conocimiento suficiente de la dinámica evolutiva a nivel molecular (o de genotipo). Para ello necesitamos conocer las propiedades topológicas de las llamadas redes de genotipos (RG), definidas como el (usualmente astronómicamente grande) conjunto de genotipos que dan lugar al mismo fenotipo, o función biológica observable. Con anterioridad demostramos con redes de secuencias de RNA correspondientes a la misma estructura secundaria que, en este caso, las RG poseían una distribución amplia de grado –es decir, del número de vecinos a distancia una mutación de un genotipo dado—y que tenían la propiedad de ser asortativas. En el año 2012 hemos ampliado este estudio al caso de selfavoiding walks a través del modelo HP. Este modelo considera residuos hidrófobos y polares y representa una primera aproximación al caso del plegamiento de proteínas. Los resultados obtenidos hasta el momento muestran interesantes paralelismos con el caso del RNA que estamos explorando. Por otra parte, hemos desarrollado la teoría dinámica de caminantes aleatorios sobre este tipo de redes. Hemos observado un interesante fenómeno no descrito hasta ahora y que hemos denominado phenotypic entrapment (atrapamiento fenotípico). El proceso dinámico que mueve a una población sobre RG causa un movimiento hacia regiones más conectadas, de forma que la probabilidad de escapar de una red de genotipos dada (o de un fenotipo) depende del tiempo que la población ha presentado ese mismo fenotipo. Este es un caso de proceso semi-Markoviano, con memoria de su historia anterior (Manrubia y Cuesta, preprint). En colaboración con el grupo del Prof. Esteban Domingo del Centro de Biología Molecular “Severo Ochoa” hemos seguido el análisis de la ventaja de terapias de combinación frente a terapias secuenciales. El modelo matemático que desarrollamos en años anteriores ha sido aplicado al caso del virus de la hepatitis C. Como en casos anteriores, hemos podido establecer la terapia y la dosis de antivirales que minimiza la carga viral, la aparición de mutantes resistentes, o ambas cantidades. Evolución y adaptación de microorganismos Otro de los objetivos de la investigación en la línea de Evolución Molecular es el estudio de la organización y de la dinámica de poblaciones de microorganismos, y de los cambios moleculares que les permiten adaptarse a nuevas condiciones y colonizar distintos ambientes. Una de las tareas fundamentales consiste en determinar mediante técnicas de proteómica, y con la utilización de diversas especies bacterianas extremófilas (especialmente psicrófilas), cuál es el funcionamiento de la maquinaria molecular y cómo varía en función del entorno, con la intención de identificar las modificaciones involucradas en un amplio número de funciones celulares y especialmente las relacionadas con la adaptación al ambiente y la evolución de los microorganismos. Un tema de especial interés es el papel desempeñado en la adaptación al calor y al frío de las proteínas de choque térmico –o heat shock proteins (Hsps)—y el de las cold shock proteins (Csps). Estas proteínas son sensibles a los cambios ambientales y pueden condicionar la evolución de poblaciones y estirpes que están sometidas a selección por presión ambiental. Funcionan formando complejos con otras moléculas y se ha comprobado que la participación de otras proteínas (denominadas client proteins) en estos complejos depende de las condiciones ambientales. Los hitos alcanzados en el año 2012 son los siguientes: 1. Se ha ampliado el estudio de proteínas responsables de la adaptación de los microorganismos psicrófilos al frío. Además de la previamente identificada Heat shock protein 90 (Hsp90/HtpG), se ha estudiado el papel de otras HSPs en la adaptación. Entre las más importantes se han identificado DnaK, DnaJ, GroEL y GroES. Además, se ha encontrado que otras proteínas involucradas en la adaptación al frío de los microorganismos psicrófilos son proteínas relacionadas con la replicación y traducción (factor de elongación Tu, factor de elongación Ts, proteínas ribosomales, etc.) y proteínas que se han relacionado con el estrés oxidativo (SOD, Thiol specific antioxidant, etc.). 2. Se ha estudiado el efecto del aumento de temperatura de los ambientes glaciares en las poblaciones de las bacterias y microorganismos eucariotas que los habitan. Con el objetivo de identificar cómo evolucionan las poblaciones de microorganismos residentes en las muestras de hielo glacial, se han estudiado mediante microscopía electrónica de barrido y se han identificado mediante secuenciación de su 16S rRNA y 18S rRNA. Se ha observado que las abundancias relativas de microorganismos a diferentes niveles taxonómicos están correlacionadas con la altitud, el área y el pH de los glaciares, pero no con otros parámetros ambientales estudiados tales como su composición química. Hemos participado en la Campaña Antártica 2012-2013, en la que hemos obtenido nuevas muestras y datos ambientales con los que seguir realizando nuevos trabajos experimentales en laboratorio. Evolución del genoma En el año 2012 ha continuado el desarrollo de un proyecto plurianual centrado en el estudio de la dinámica y evolución de los elementos móviles del genoma en poblaciones microbianas extremófilas. Un objetivo central de este proyecto es la comprensión de aspectos básicos de la biología de las secuencias de inserción a fin de determinar su papel en la evolución de los genomas bacterianos. Los hitos alcanzados en el año 2012 son los siguientes: 3 7 8 implicaciones de una estructura en cuasiespecies de las poblaciones virales para el diseño de terapias exitosas (Perales et al., 2012) y las implicaciones biomédicas de tasas de mutación elevadas en virus (Sanjuán et al., 2012). Publicaciones y artículos de los miembros de la Línea, relacionados con las actividades desarrolladas en el 2012 C. Briones y M. Moreno. Applications of peptide nucleic acids (PNAs) and locked nucleic acids (LNAs) in biosensor development (2012). Analytical and Bioanalytical Chemistry, 402, 3071-3089. Figura 2. Ajuste del modelo de evolución neutra de secuencias de inserción a la abundancia de la familia IS110. El histograma muestra la abundancia observada en varios centenares de genomas bacterianos; la línea azul es el ajuste al modelo neutro. Para esta familia de secuencias de inserción, un modelo análogo con selección proporciona un ajuste tan bueno como el del modelo neutro. En la mayoría de casos, el modelo neutro (más sencillo) es preferido frente al que incorpora un efecto deletéreo de las secuencias de inserción en el genoma huésped. 1. Se ha analizado los patrones de transposición de 57.515 secuencias de inserción presentes en 1.806 cromosomas bacterianos circulares y completamente secuenciados. Estos datos han revelado la existencia de sesgos en la transposición en numerosas familias que han sido correlacionados con la replicación del cromosoma. 2. Se ha analizado la distribución filogenética y la distribución ecológica (en metagenomas) de las secuencias de inserción. 3. Se ha estudiado bioquímicamente la interacción entre transposasas y factores de replicación en bacterias. Se han descubierto numerosos casos de interacciones entre las transposasas que muestran sesgos en el genoma y el factor de procesividad β. 4. Hemos realizado estudios de la distribución de abundancias de las distintas familias de secuencias de inserción en los genomas bacterianos. El resultado obtenido es que las abundancias de secuencias de inserción pueden ser explicadas como resultado de la dinámica de un proceso neutral de duplicacióndeleción donde la selección natural no juega un papel determinante (Iranzo et al., preprint). Finalmente, la actividad científica de los miembros de la línea ha dado lugar a varias revisiones y artículos de opinión en diversos ámbitos, como la relevancia de la existencia de redes de genotipos en la complejidad química de un mundo de RNA prebiótico (Manrubia, 2012a), los retos que supone una modelización realista de las poblaciones virales (Manrubia, 2012b), las L. Cabanillas, M. Arribas, E. Lázaro (2013). Evolution at increased error rate leads to the coexistence of multiple adaptive pathways in an RNA virus. BMC Evolutionary Biology 13, 11 J. A. Capitán, J. Borge-Holthoefer, S. Gómez, J. Martínez-Romo, L. Araujo, J. A. Cuesta, and A. Arenas (2012). Local-based semantic navigation on a networked representation of information. PLoS ONE 7(8), e43694. L. García-Descalzo, García-López, E., Moreno, A. M., Alcazar, A., Baquero, F., Cid, C. (2012). Mass spectrometry for direct identification of biosignatures and microorganisms in Earth analogs of Mars. Planetary and Space Science 72, 138-145. L. García-Descalzo, García-López, E., Alcazar, A., Baquero, F., Cid, C. (2012). Gel electrophoresis of proteins. In: Gel Electrophoresis / Book 1; ISBN: 978953-51-0458-2. InTech. Rijeka, Croatia. L. García-Descalzo, Alcazar, A., Baquero, F., Cid, C. (2012). Biotechnological applications of cold-adapted bacteria. In: Extremophiles: Sustainable resources and Biotechnological Implications. Wiley-Blackwell. Hoboken, New Jersey. L. García-Descalzo, García-López, E., Postigo, M., Baquero, F., Alcazar, A., Cid, C. (2012). Eukaryotic microorganisms in cold environments. Examples from Pyrenean glaciers. Frontiers in Microbiology, doi: 10.3389/fmicb.2013.00055. A. García Sacristán, E. López-Camacho, A. ArizaMateos, M. Moreno, R.M. Jáudenes, J. Gómez, J.A. Martín-Gago and C. Briones. A magnesium-dependent RNA structural switch at the internal ribosome entry site of hepatitis C virus genome monitored by atomic force microscopy. Preprint. M. J. Gómez, González-Tortuero, E., Díaz-Maldonado, H., and López de Saro, F.J. Chromosomal replication dynamics determine location and orientation of bacterial mobile elements. Preprint. J. Iranzo and S. C. Manrubia (2012). Evolutionary dynamics of genome segmentation in multipartite viruses. Proceedings of the Royal Society of London B 279, 4 10 9 3812-3819 J. Iranzo, M. J. Gómez, F. J. López de Saro, and S. C. Manrubia, Large-scale genomic analysis suggests a neutral punctuated dynamics of mobile elements in prokaryotic genomes. Preprint. F. J. López de Saro (2013). Regulation of interactions with sliding clamps during DNA replication and repair, In Advances in Genome Science: Changing Views in Living Organisms, Vol. 1 (C. Neri, Ed.), Bentham Books, pp. 293-315. procedimiento de obtención y sus aplicaciones”. Nº de solicitud: P201231819 País de prioridad: España. Fecha de prioridad: 23 de noviembre de 2012. Entidad Titular: Consejo Superior de Investigaciones Científicas (CSIC), Instituto Nacional de Técnica Aeroespacial (INTA) Empresa que lo está explotando: Aptus Biotech (Acuerdo de Licencia) F. J. López de Saro, Gómez, M.J., González-Tortuero, E. and Parro, V. (2013). The Dynamic Genomes of Acidophiles, In "Polyextremophiles: Life Under Multiple Forms of Stress, Vol. 27" (J. Seckbach, A. Oren and H. Stan-Lotter, Eds.), Springer, pp. 81-97. S. C. Manrubia (2012a). Neutral networks and chemical function in RNA. Comment on “Evolutionary dynamics of RNA-like replicator systems: a bioinformatic approach to the origin of life”. Physics of Life Reviews 9, 277-278. S. C. Manrubia (2012b). Modelling viral evolution and adaptation: challenges and rewards. Current Opinion in Virology 2, 531-537. S. C. Manrubia, Jacob B. Axelsen, and Damián H. Zanette (2012). Role of demographic dynamics and conflict in the population-area relationship for human languages. PLoS ONE 7, e40137. S. C. Manrubia and J. A. Cuesta, Evolution on genotype networks leads to phenotypic entrapment. Preprint. C. Perales, J. Iranzo, S. C. Manrubia, and E. Domingo (2012). The impact of quasispecies dynamics on the use of therapeutics. Trends in Microbiology 20, 595-603. C. Romero-López, A. Barroso-del Jesús, A. GarcíaSacristán, C. Briones y A. Berzal-Herranz (2012). The folding of the hepatitis C virus internal ribosome entry site depends on the 3’-end of the viral genome. Nucleic Acids Research 40: 11697-11713. K. Ruiz-Mirazo*, C. Briones* y A. de la Escosura. [* equal contribution]. Prebiotic ‘systems chemistry’: New perspectives on the origins of life. Chemical Reviews, en prensa. R. Sanjuán R, Lázaro E, Vignuzzi M (2012). Biomedical implications of viral mutation and evolution. Future Virology 7, 391-402. PATENTE Inventores (p.o. de firma): A. Berzal-Herranz, C. Briones, S. Cuevas-Manrubia, F.J. Sánchez-Luque, M. Stich Título: “Moléculas inhibidoras del virus de la inmunodeficiencia humana tipo 1 (VIH-1), 5