DIANA FERNANDA VERA R. Bióloga-Universidad Nacional de Colombia DIRECTOR FABIO A. ARISTIZABAL Departamento de Farmacia Facultad de Ciencias DIRECTOR ASOCIADO EMILIANO BARRETO Instituto de Biotecnología 2004 1 TÍTULO EN ESPAÑOL: DISEÑO DE UNA ESTRATEGIA PARA LA EVALUACIÓN DE ATRIBUTOS FUNCIONALES EDÁFICOS MEDIANTE SONDAS DE ADN TÍTULO EN INGLÉS: DESIGN OF A STRATEGY FOR THE ATTRIBUTES NEANS DNA PROBES. EVALUATION OF FUNCTIONAL RESUMEN EN ESPAÑOL: Haciendo acopio de la información depositada en las tres principales bases de datos genómicos internacionales, y por medio del análisis y aplicación de estrategias de minería de datos, se desarrolló una metodología base para el ulterior diseño de una Herramienta Molecular de Evaluación Funcional de Suelos. Dicha herramienta sería aplicable en el estudio de la diversidad bioquímica y los ciclos minerales en los que participan los microorganismos de diversos ecosistemas terrestres. La información bibliográfica y aquella contenida en las bases, permitió luego de su evaluación, filtrado y clasificación, el diseño de un modelo conceptual en el cual se visualizan las rutas metabólicas microbianas involucradas en los ciclos biogeoquímicos del carbono, nitrógeno, azufre e hierro, sus enzimas correspondientes y los genes codificantes. Dicho modelo pudo ser utilizado en la proposición de 192 marcadores moleculares para 13 grandes procesos bioquímicos, que incluyen: la reducción de sulfato, oxidación de compuestos azufrados, metanogénesis, carboxidotrofía, oxidoreducción de hierro, reducción de nitrato, nitrito, óxido nítrico, óxido nitroso, amonificación, nitrificación y fijación de nitrógeno, así como marcadores para dos grupos taxonómicos de endomicorrizas (géneros Paragbmusy Archaeospora). A través de la utilización de herramientas bioinformáticas se condujo al desarrollo de 191 sondas representativas del 38% de estos marcadores. TRADUCCIÓN DEL RESUMEN AL INGLÉS: The investigation stocked up on the information placed in the three main international genomic databases, and through analysis and application of data mining strafiegies, conducted to development of a methodology that to subsequently facilítate the design of a Molécula- Tool of Functional Evaluation of Soils, applicable to the sfcudy of the biochemical diversity of the mineral cycles in diverse terrestrial ecosystems inside which the microorganisms are involved. After evaluation, the information was filtered and classificated, it permitted the design of a conceptual model in which, the metabolical routes involved in the biogeochemical cycles of the carbón, nitrogen, sulfur and iron, their corresponding enzymes and the genes are visualized. Said model it could be utilized in the proposal of 192 molecular markers for 13 biochemical processes, that include: sulphate reduction, sulfur compounds oxidation, methanogenic way, carboxidotrophy, iron redox, nitrate reduction, nitrite reduction, nitric oxide reduction, nitrous oxide reduction, ammonification, nitrification and nitrogen fixation, and for two taxonomic groups of endomycorrhizae (genus Paragbmus and Archaeospora). The útilcatión of bioinformatic toob was conducted to development of 191 probes, wich represent 38% of the markers. DESCRIPTORES O PALABRAS CLAVES EN ESPAÑOL: ciclos biogeoquímicos, marcadores moleculares, evaluación de suelos, minería de datos, diseño de sondas. TRADUCCIÓN AL INGLÉS DE LOS DESCRIPTORES: biogeochemical cycles, molecular markers, soil evaluation, data mining, probes design. FIRMA DEL DIRECTOR: Nombre(S) completo(s) del(tos) autor(es) y (Ano de nacimiento): DIANA FERNANDA VERA RAIGOSA, 21 de Octubre de 1974 (21-10-74). DISEÑO DE UNA ESTRATEGIA PARA LA EVALUACION DE ATRIBUTOS FUNCIONALES EDAFICOS MEDIANTE ¡< SONDAS DEADN DIANA FERNANDA VERA RAIGOSA Investigación presentada como requisito parcial para optar al título de Magister Scientiae en Microbiología BOGOTÁ D.C., DICIEMBRE DE 2004 MAESTRIA INTERFACULTADES EN MICROBIOLOGÍA FACULTAD DE CIENCIAS UNIVERSIDAD NACIONAL DE COLOMBIA "El Director de Tesis, el Presidente de Tesis y el Consejo Examinador de Grado, no serán responsables de las ideas emitidas por el candidato". (Artículo 217, estatutos de la Universidad Nacional de Colombia) PRESIDENTE DEL JURADO A. * £ 7 JURADO JURADO Bogotá D.C., 2004 <Este y todos mis [ogros a quienes no soCo me fian dado (a vida, sino que [a Han enriquecido con su amory sabiduría, mis padres. ♦ Agradezco a mis directores de tesis EMILIANO BARRETO y FABIO ARISTIZÁBAL por sus ideas y orientación oportunas. ♦ A la UNIVERSIDAD NACIONAL DE COLOMBIA por el excelente nivel académico, al que he tenido la fortuna de acceder durante todos mis años de formación profesional. ♦ A mis padres, OMAYRA RAIGOSA y ALCIDES VERA, por haberme apoyado siempre en la consecución de mis logros con infinito amor. ♦ A mi tía ROSALBA RAIGOSA, por su comprensión y consejo. ♦ A mi amiga CLAUDIA I. MARTÍNEZ, quien me ayudó en los momentos difíciles, con su apoyo moral y muy importante también: económico. (r ♦ A VLADIMIR PAEZ FONSECA, quien a lo largo de diez años me ha brindado su amistad incondicional, apoyándome en la realización de todas mis metas y ofreciéndome su valiosa ayuda. Su aporte en esta tesis es invaluable. ♦ A GERMAN GÓMEZ, por su cariño, amistad y paciencia durante las etapas de realización de esta tesis y por su importante aporte de conocimientos en el área de sistemas. ♦ A la Profesora MARTHA R. FONTANILLA por su calidad docente, gracias a la cual inicié el aprendizaje y comencé a interesarme en la biología molecular. ♦ Al profesor ABDÓN CORTÉS, quien promovió mi cariño por la ciencia del suelo. INTRODUCCIÓN.................................................................................................. 11 OBJETIVOS........................................................................................................ 15 2.1. OBJETIVO GENERAL.................................................................................. 15 2.2. OBJETIVOS ESPECÍFICOS.............................................................................15 MARCO CONCEPTUAL............................................................................................ 16 3.1. BIODIVERSIDAD........................................................................................16 3.2. GRUPOS FUNCIONALES Y DIVERSIDAD FUNCIONAL........................................... 17 3.3. CICLOS BIOGEOQUÍMICOS...........................................................................18 3.4. EVALUACIÓN DE SUELOS............................................................................. 20 3.5. ARREGLOS DE ADN Y EL ACCESO A LA BIODIVERSIDAD....................................... 21 3.6. CONCEPTOS PARA EL DISEÑO DE UN MICROARREGLO......................................... 23 3.7. BIOINFORMÁTICA...................................................................................... 25 METODOLOGÍA................................................................................................... 32 4.1. LA CONCEPCIÓN HOLÍSTICA DE LOS CICLOS BIOGEOQUÍMICOS.............................32 4.2. OBTENCIÓN Y MANIPULACIÓN DE DATOS MOLECULARES.....................................32 4.3. DISEÑO DE SONDAS...................................................................................38 RESULTADOS........................................................................ ............................. 42 DISCUSIÓN DE RESULTADOS.................................................................................. 67 6.1. RUTAS BIOQUÍMICAS..................................................................................71 6.1.1. Cido del Carbono:................................................................................ 71 6.1.2. Cido del Azufre:...................................................................................74 6.1.3. Cido del Nitrógeno............................................................................... 75 6.1.4. Cido del Hierro................................................................................... 77 6.1.5. Cido del Fósforo.............................................................................. .....78 6.2. MODELO CONCEPTUAL............................................................................... 79 6.3. APROXIMACIÓN FUNCIONAL........................................................................ 81 6.4. BASE DE DATOS....................................................................................... 32 6.5. ANÁLISIS DE LAS HERRAMIENTAS Y CRITERIOSBIOINFORMÁTICOS........................87 6.6. DISEÑO DE OUGONUCLEÓTIDOS................................................................... 91 CONCLUSIONES.................................................................................................. .95 RECOMENDACIONES.............................................................................................97 BIBLIOGRAFÍA Figura 1. Esquema genera! de la realización de un m icroarreglo, Lucchini et ai., [2001]................................... ............................................................... .....22 Figura 2. Salida del programa ClustalX...................... .................. .....................35 Figura 3. Salida de! programa CeneDoc en donde se observa la salida del alineam iento en ClustalX de secuencias pertenecientes a l ADN codificante para ARNr 18S de Arcbaeospora. Las zonas azules corresponden a áreas de gran sim ilitud, en tanto que las naranja presentan algunas discrepancias. Abajo secuencia consenso.............................. .............. .......................... ...... 37 Figura 4. Salida de! programa NJPLOT, donde se observa un cladograma obtenido a través de CíustafX..... ..................................... . 38 Figura 5. Ventana de! subprograma Oligo, de GeneRunner............ ........ ............40 Figura 6. Diagrama de rutas bioquím icas de los ciclos d el carbono, nitrógeno, azufre e hierro (páginas siguientes)................... ................ ................................. .....42 Figura 7. Modelo conceptual de integración de los ciclos biogeoquím icos considerados {página siguiente)..... ....................................... .......... ............ 50 Figura 8. Representación de la proporción de secuencias de ADN para cada grupo enzim ático a nivel de Dom inio taxonómico. Clave de abreviaturas ver Tabla 3......52 Figura 9. Distribución de las secuencias de ADN encontradas por División.............53 Figura 10. Histograma de frecuencia de secuencias de ADN por Género...............53 Figura 11. Representación de la proporción de secuencias de proteína para cada grupo enzim ático a nivel de Dominio taxonómico (abreviaturas ver Tabla 3).......... 54 Figura 12. Distribución de ¡as secuencias de proteína encontradas, por División.... 55 Figura 13. Histograma de frecuencia de secuencias de proteína por Género......... 55 Figura 14. Número de sondas seleccionadas a p a rtir de las secuencias de ADN, por nive! taxonómico........... ................. ............. ....... ............................. ..66 Figura 15. Número de sondas seleccionadas por nivel taxonómico, a p artir de las secuencias de proteína traducidas................... ............................................ . 66 Figura 16. Ventana de bienvenida a la consulta para ¡a base de datos Bioproc_suelos..................................... .............................. ................. .......,.S3 Figura 17. Ventana de consulta de la base de datos BioProc_suelos............ ........83 Figura 18. Salida del programa BlastN del NCBI............................................... 91 Tabla 1. Formato de ingreso de inform ación a la base de datos Bioproc_Sueíos...... . 33 Tabla 2. Parám etros utilizados para e l análisis de especificidad por medio de BLAST... 39 Tabla 3. Listado de géneros m icrobianos y enzimas seleccionadas, incluidos en e l análisis.......................... ..................... *....-............... ..................................... 56 Tabla 4. Listado de procesos enzimáticos, catalizadores y genes codificantes utilizados.. 60 Tabla 5. Elem entos esenciales para la mayoría de las plantas superiores y concentraciones internas que se consideran adecuadas [Salisbury & Ross. 1994]...... 70 ANEXO 1. Oligonuc/eótidos diseñados y sus parám etros termodinámicos y físicos (páginas siguientes)...................... .............. .............. ..................... ........ ..111 ANEXO 2. Listado de prim ers reportados en la literatura para ¡os principales procesos enzim áticos considerados en la investigación......................... ........ ...................118 ANEXO 3. Listado de enzimas-genes para las cuales no existió reporte de dom inios en la base ProDom................... ................... ....................................................... 123 INTRODUCCIÓN El suelo constituye una fuente primordial de vida para la Tierra, siendo el medio de sostenimiento y nutrición para las plantas. Es un hábitat que posee una gran diversidad de microorganismos (bacterias, arqueas, hongos, algas, protozoarios y virus), y en el cual se desarrolla todo tipo de biota macroscópica (coleópteros, miriápodos, hormigas, colémbolos, nemátodos, ácaros, larvas, mamíferos pequeños y reptiles). Sus componentes bióticos y abióticos en permanente interacción, son el motor de los ciclos biogeoquímicos en los ecosistemas terrestres (mineralización de la materia orgánica, nitrificación, fijación de nitrógeno y oxidación de metano, entre otros procesos) [Luna eta l, 2002], considerándose que entre el 80 y 90% de los procesos edáficos, se encuentran mediados por microorganismos [Nannipieri et al., 2003]. El suelo es un sistema de suma complejidad, por lo que no obstante la realización de numerosos estudios (básicamente ex situ) que han ayudado a comprender sus procesos fisiológicos individuales, así como los mecanismos y organismos involucrados, persisten la incertidumbre y el desconocimiento acerca de la manera como se produce el acoplamiento de dichos componentes en una maquinaria eficiente, y de los principios que rigen su resistencia al cambio y promueven la homeóstasis. El estudio de los ecosistemas, en particular del edáfico, puede emprenderse no solo a partir de la consideración de los organismos o poblaciones, sino también estudiando el ambiente abiótico en relación con ellos. De los 90 elementos químicos que se encuentran en la naturaleza, 30 a 40 son necesarios para los organismos vivos. Algunos, son requeridos en grandes cantidades (carbono, hidrógeno, oxígeno y nitrógeno), en tanto que otros lo son en menor proporción. Ciclos como el del carbono, son considerados más "móviles" que otros, debido a que el material es devuelto al medio tan rápidamente como le es quitado. Otros en cambio, son menos móviles, y así una porción de la reserva puede perderse por largos periodos de tiempo, en lugares o formas químicas inaccesibles para los organismos [Odum, 1972]. De allí la importancia que tiene distinguir qué procesos bioquímicos y con qué intensidad son llevados a cabo por parte de los diversos grupos microbianos, para así determinar su dinámica de consumo/retorno en un suelo particular. Hasta hace muy poco, la identificación de grupos fisiológicos microbianos y la evaluación de su diversidad en suelos, exigía el aislamiento a partir de cultivos en medios diferenciales [Amann et al, 1995]. El establecimiento de sus niveles poblacionales requería la utilización de técnicas de conteo en placa, las cuales no revelan la realidad edáfica. Se sabe que en muchos casos, las células no forman colonias visibles sobre medios de cultivo [Amann e ta i, 1995] y en la mayoría de ellos, se trata de especies no cultivables, pues con los métodos tradicionales solo se ha registrado cerca del 1% de la comunidad microbiana total del suelo [Borneman & Triplett, 1997]; otros presentan requerimientos específicos, no dilucidados aún. De esta forma, se estima que en el suelo, del 80 al 90% de los microorganismos aún permanecen sin identificar [Borneman et al, 1996]. Debido a las deficiencias existentes en cuanto al conocimiento de la magnitud de grupos taxonómicos, es posible que este acercamiento no sea adecuado al momento de diseñar un método de evaluación de suelos; puesto que ello implicaría tres aspectos relevantes y generadores de sesgo: i) Solo estaría representado un muy pequeño porcentaje de la totalidad de especies; ii) Se debería hacer una jerarquización por importancia ecológica de las especies a seleccionar, con el fin de escoger solo aquellas "relevantes", esto, si se ha podido establecer previamente el alcance del término; y iii) para que el método no tuviera una aplicación restringida, se deberían tener en cuenta especies microbianas consideradas como "ubicuas", las cuales no han sido determinadas experimentalmente [Cho &Tiedje, 2000]. Como indican algunos autores [Hooper et al, 2002], la riqueza de especies como una medida simple de diversidad biótica, no tiene un suficiente poder descriptivo: la dinámica de los procesos que se dan al nivel de un ecosistema, dependen más de las características funcionales (metabólicas) de los organismos involucrados, que de su identidad taxonómica, aunque esta sea implícita. La diversidad funcional, se refiere al intervalo y valor de tales características, que resultan influyentes en las propiedades o atributos del ecosistema. De acuerdo con algunos autores [Hooper e ta l, 2002], esta medida puede ser expresada en una gran variedad de formas, incluyendo el número y abundancia relativa de grupos funcionales, la variedad de interacciones con los procesos ecológicos o la diferencia promedio entre especies en aspectos relacionados con la función. El funcionamiento y la estabilidad de cualquier ecosistema son posibles gradas a la compartimentalización de procesos llevados a cabo por diferentes poblaciones, de tal manera que su coexistencia depende de que no haya sóbrelapamiento total de sus nichos funcionales. De esta manera, una comunidad extremadamente dinámica facultará el sostenimiento de un ecosistema funcionalmente estable [Fernández etal, 1999]. Por último, la problemática de la variedad de técnicas utilizadas en el estudio de las poblaciones microbianas del suelo (FISH, extracción y reasociación de ADN, comparación de lípidos de membrana [McCaig et al, 1999]; detección por variantes de PCR, RFLPs, ARDRA, clonación de ARNr 16S, DGGE, TGGE [McCaig et a/, 1999]; RISA [Jensen e ta l, 1993]; SSCP [Lee et a l, 1996], entre otras), además de las modificaciones desarrolladas para cada aplicación en particular, hacen que el proceso de encontrar patrones ecológicos para las especies microbianas, empleando las diferentes investigaciones publicadas, sea una labor imposible; haciendo irrealizable el contraste de resultados a nivel taxonómico. Las posibilidades de evaluación de un gran número de genes en paralelo, han hecho que la aplicación de microarreglos sea una herramienta cada vez mas utilizada y con grandes perspectivas en el área ambiental; esto ha sido reconocido por diversos autores, entre ellos, Dennis et al. (2003), quienes encontraron en la técnica, una solución para la deteccción de la expresión de genes bacterianos en aguas residuales y otros sistemas complejos. Algunos investigadores, han empleado esta herramienta para la exploración de vías bioquímicas aisladas en algunos ciclos de la materia, tal es el caso de Loy et a l (2002), quienes realizan una aproximación taxonómica por medio de marcadores para ARNr, en la evaluación de linajes de reductores de sulfato. Otros, usan la aproximación funcional en la evaluación de rutas parciales, como el caso de Wu et al (2001), recurriendo a esta técnica para la estimación de la reducción de nitrito y la oxidación de metano y amonio en ambientes marinos. Sin embargo, una aproximación funcional, que además faculte la visualización y comprensión completas de la complejidad funcional del suelo, no ha sido abordada. Adicional mente, se detectó la carencia de esquemas que permitieran visualizar las interaciones que pueden generarse entre los ciclos biogeoquímicos, y que de esta manera, facilitan el análisis de los resultados que pueden ser encontrados por medio de la aproximación experimental. Con base en las anteriores premisas, se plantea el diseño de una metodología que permita a futuro, el desarrollo y aplicación de una herramienta, utilizando marcadores moleculares específicos para grupos funcionales microbianos, involucrados en los ciclos biogeoquímicos de ecosistemas terrestres. Dada la complejidad del subsistema edáfico y el alto grado de incertidumbre existente al momento de establecer la causalidad de la mayoría de los fenómenos ocurrentes en él [Burke et al, 2003], el diseño de la metodología y la futura aplicación de una herramienta molecular, generarán avances en el proceso de evaluación de la relación existente entre tales factores y la dinámica funcional de los microorganismos telúricos. OBJETIVOS 2.1. OBJETIVO GENERAL Diseñar una metodología para la evaluación molecular de grupos funcionales microbianos de relevancia en suelos. 2.2. OBJETIVOS ESPECÍFICOS 2.2.1.Realizar un modelo conceptual que permita la comprensión del funcionamiento e interacciones existentes entre los grupos metabólicos microbianos del suelo. 2.2.2.Identificar con ayuda del modelo conceptual, aquellas enzimas que resulten más representativas de los procesos funcionales seleccionados. 2.2.3.Determinar los marcadores moleculares apropiados para cada una de las enzimas designadas. 2.2.4.Diseñar los oligonucleótidos necesarios en la construcción de las sondas de ADN para cada marcador elegido. MAMO CONCEPTUAL Los microorganismos habitan prácticamente todas las regiones del planeta, desde los polos, en ambientes bajo el punto de congelación y muy secos, hasta los trópicos con temperaturas altas y con elevada precipitación pluvial. Su presencia y actividad son esenciales para la salud y funcionamiento adecuado de todos los ecosistemas [Olalde & Aguilera, 1998]. 3.1. BIODIVERSIDAD Biodiversidad, es la variedad y variabilidad de todas las formas de vida, el complejo ecológico en el cual están presentes, y los procesos de los que forman parte [Olalde & Aguilera, 1998]. En este sentido, y en relación con los microorganismos, el suelo es un ecosistema de enorme riqueza microbiana [Olalde & Aguilera, 1998]. El estudio de la diversidad de microorganismos en el suelo es un reto formidable, en primer lugar, porque las definiciones clásicas de especie no se aplican a los microorganismos (muchos no tienen ciclo sexual) y hay que ajustarlas: el aspecto morfológico no es muy útil, debido a que morfológicamente muchos microorganismos distintos parecen similares. De esta manera, se tiene que hacer uso de las características fisiológicas para definir especies. En segundo lugar, la necesidad de mantener condiciones controladas, hace que los microorganismos deban ser aislados y estudiados en el laboratorio; además del hecho de que un mismo microorganismo puede comportarse de maneras muy distintas ante cambios ambientales [Valencia & Peña, 2001]. La evaluación de la diversidad genética expresa el potencial de las capacidades metabólicas en un ambiente, no obstante es más difícil de efectuar [Valencia & Peña, 2001], debido a que requiere conocer el número de genomas distintos y el conjunto total de genes microbianos presentes en un espacio/tiempo determinado. Una medición de la diversidad más operativa, es la diversidad funcional, definida como el conjunto de capacidades metabólicas o procesos distintos presentes en el suelo; es una información más gruesa que no repara en taxa y que no requiere graneles conocimientos acerca de los microorganismos presentes y sus ciclos, pero que expresa las capacidades metabólicas de éstos [Valencia & Peña, 2001]. 3.2. GRUPOS FUNCIONALES Y DIVERSIDAD FUNCIONAL Los pasos en la transformación individual de sustratos están asociados con grupos microbianos metabélicamente definidos (ej. denitrificantes, nitrificantes y fijadores de nitrógeno, etc.) [Taroncher et al., 2003]. Diversos microorganismos pueden llevar a cabo un paso individual, proveyendo un ensamblaje con redundancia de capacidades. Tales agrupamientos que realizan un proceso bioquímico común, pueden ser definidos como un grupo funcional. Recientes estudios en el área de diversidad microbiana, centrados sobre los genes de ARNr 16S y otros genes funcionales, codificantes de enzimas responsables de transformaciones específicas, indican que los grupos funcionales pueden ser inmensamente diversos [Taroncher etal, 2003]. A menudo, la clasificación funcional tiene dos objetivos distintos, uno de los cuales es investigar los efectos de las especies sobre las propiedades del ecosistema (grupos funcionales de efecto) y otro que examina la respuesta de las especies a cambios en el ambiente, tales como disturbios, disponibilidad de recursos, o clima (grupos funcionales de respuesta) [Hooper etal., 2002]. Los organismos del suelo parecen tener un alto nivel de redundancia funcional [Wolters et al., 2000]. Esto sugiere que los procesos que involucran la transferencia de nutrientes a través de la esfera de nutrición del suelo están ampliamente distribuidos a través de la comunidad subterránea. Las funciones llevadas a cabo por especies con actividades únicas sin embargo, son una excepción. El ejemplo más notable es provisto por los pocos géneros de bacterias que llevan a cabo ciertas transformaciones en el ciclo del nitrógeno (como nitrificación, denitrificación) [Wolters etal., 2000]. En forma similar, la habilidad para degradar substratos orgánicos recalcitrantes tales como lignina o sustancias húmicas, está confinada a unos pocos géneros microbianos [Wolters et al., 2000]. Una gran acumulación de mantillo sobre la superficie del suelo debida a la pérdida de organismos capaces de romper materiales recalcitrantes, puede alterar drásticamente la disponibilidad de nutrientes para las plantas [Wolters etal., 2000]. 3.3. CICLOS BIOGEOQUÍMICOS Los organismos de la superficie y subterráneos, resultan críticos dentro de los ciclos biogeoquímicos, pero aún existe un conocimiento limitado acerca de la manera como la biota que vive bajo tierra y sus funciones, son dependientes de la biota existente en la superficie y viceversa. El mantenimiento de la vida con cierto grado de equilibrio, depende de dos factores: el recambio cíclico de elementos indispensables, fundamentalmente, carbono, nitrógeno, oxígeno, fósforo y azufre y el aporte constante de energía solar. A través del proceso fotosintético y la energía solar, los productores primarios, extraen elementos del medio ambiente en forma de compuestos inorgánicos y biosintetizan compuestos orgánicos, que son incorporados en células y tejidos. Estos materiales orgánicos acumulados, representan de forma directa o indirecta la fuente de energía para otros integrantes de las redes tróficas. Antes de que estos elementos puedan ser utilizados nuevamente como alimento para los organismos fotosintéticos, deben volver a su estado inorgánico [Sztern & Pravia, 1999]. Esta conversión del estado orgánico al inorgánico es conocida como mineralización y se debe en gran parte a la descomposición de los restos vegetales y animales, así como de los productos orgánicos de la excreción de estos últimos [Sztern & Pravia, 1999]. Es llevada a cabo por un grupo de microorganismos denominados genéricamente como descomponedores. Se estima que aproximadamente el 90% del C02que se produce en la biosfera se debe a la actividad metabólica de este grupo. La gran importancia de los microorganismos en el proceso de mineralización es el resultado de tres factores [Sztern & Pravia, 1999]: su omnipresencia en la biosfera, consecuencia de la facilidad de propagación de los organismos; su elevada velocidad metabólica y de crecimiento, y la gran diversidad fisiológica que les confiere una capacidad colectiva para degradar todos los compuestos orgánicos naturales que se pongan a su alcance. Todas las sustancias orgánicas naturales, son descompuestas por al menos una población microbiana, lo que explica la ausencia de materia orgánica inalterada en la biosfera cuando se mantiene el equilibrio entre la velocidad de emisión de ésta, y la capacidad de transformación de los descomponedores [Sztern & Pravia, 1999]. Sin embargo, cualquier especie microbiana en si misma, es un agente limitado de mineralización, la gran versatilidad metabólica es consecuencia de la acción conjunta de una gran diversidad de grupos fisiológicos [Coates et al., 2002]. Compuestos de Importancia Especial en el Ciclo del Carbono Dentro del ciclo del carbono, los hongos juegan un papel fundamental, puesto que son unos de los organismos responsables de transformar alrededor del 80% de la celulosa que se produce, la cual es la mayor reserva de carbono existente y el polisacárido más abundante en la naturaleza, con una producción que se estima en 1.4 billones de ton/año [Cabrera, 2000]. Entre los hongos, los basidiomicetos son comúnmente los recicladores dominantes de los residuos de plantas, debido a que son importantes productores de enzimas modificadoras de lignina: peroxidasas de lignina y manganeso, y lacasas [Thorn et al, 1996]. La degradación del componente lignina en la materia orgánica es el paso más limitante para la descomposición eficiente de la celulosa asociada. El conocimiento de la fisiología de la degradación de lignina por los basidiomicetos, está limitada a unas pocas especies habitantes de leños; aquellos que causan la pudrición blanca en la madera, son los más eficientes degradadores de lignina en la naturaleza (Phanerochaete chrysosporium y Trametes versico/o/) [Thorn et al, 1996]. Otro compuesto importante es la quitina, un polímero de N-acetilglucosamina, constituyente común de los exoesqueletos de los artrópodos y que también está presente en las paredes celulares de algunos hongos. La hidrólisis es usualmente mediada por enzimas extracelulares inducibles denominadas quitinasas, encargadas de romper los enlaces beta entre carbonos 1-4 del carbohidrato [Stanier et a l, 1986]. Las sustancias húmicas son los materiales orgánicos naturales no vivos más extendidos y ubicuos en medios acuáticos y terrestres y representan la principal fracción de materia orgánica del suelo [Steffen et al, 2002]. Las sustancias húmicas comprenden una mezcla física y químicamente heterogénea de compuestos biogénicos de peso molecular relativamente alto con una naturaleza mixta, alifática y aromática [Steffen et al, 2002], La degradación microbiana de las sustancias húmicas - particularmente de las de alto peso molecular, mitades aromáticas en AH (ácidos húmicos) y humina—es una parte importante del retorno del humus y es de esta manera esencial para el mantenimiento del ciclo del carbono global [Steffen et al, 2002]. Algunos de los hongos basidiomicetos de la pudrición blanca, que colonizan madera, desintegran AH de alto peso molecular formando AF (ácidos fúlvicos) de bajo peso molecular y dióxido de carbono. Se observó correlación entre la actividad de las peroxidasas extracelulares y la degradación de AH, y una peroxidasa de manganeso (MnP) que despolimerizaba y mineralizaba in vitro diferentes AH [Steffen etal, 2002]. 3.4. EVALUACIÓN DE SUELOS Todos los parámetros físicos y químicos usados en el conocimiento de la textura y calidad del suelo, tales como densidad de poros, capacidad de infiltración, materia orgánica, pH, conductividad eléctrica y fertilidad, pueden ser medidos por los laboratorios de suelo de manera rutinaria. Sin embargo, los parámetros biológicos tales como biomasa microbiana, nitrógeno potencialmente mineralizable y respiración, son indicadores recientes y un poco más problemáticos. Existen tres vías básicas para acceder a la biomasa microbiana del suelo: su conteo a través de microscopio, la medición de un indicador de actividad como el C02, o la medición de partes de microorganismos, tales como membranas. Generalmente estos métodos son indicadores muy amplios de la biomasa microbiana o de su actividad. Últimamente, se han diseñado métodos moleculares como indicadores de biomasa microbiana y/o diversidad y composición de especies, tales como AFLPs y RISA entre otros [Gregory etal., 2003; Peplies etal., 2003]. La aplicación de técnicas moleculares se ha incrementado durante los últimos años [Morris et al., 2002], debido a que éstas permiten un mejor acceso a las comunidades. Sin embargo, no se han desarrollado herramientas que permitan analizar conjuntamente diversas rutas metabólicas. Algunos autores [Borneman & Triplett, 1997], aplicaron la técnica RISA para determinar los efectos de la deforestación en la Amazonia, lo cual demostró un impacto profundo, cuantitativo de ésta sobre la diversidad bacteriana del suelo. Este trabajo efectuado para acceder a los efectos del manejo del suelo sobre la diversidad microbiana en forma independiente de cultivo, estuvo seguido por otras investigaciones, como aquella realizada por Buckley et al. [1998], quienes en un estudio a largo plazo realizado en la estación biológica Kellogg, encontraron que la diversidad de los campos cultivados sin otra intervención, difirió poco de aquella que sí sufrió regímenes de manejo agrícola; aún así, la diversidad bacteriana de los suelos con manejo fue significativamente diferente de aquella de suelos que nunca habían sido cultivados. El estudio de Taroncher et al. [2003], utilizando un microarreglo de oligonucleótidos para analizar la diversidad funcional de genes implicados en el ciclo del nitrógeno en sedimentos de río (sistema de bahías de Shesapeake), resulta ser pionero en el tema. Una investigación centrada en la caracterización de una comunidad microbiana dependiente de nitrato, utilizando al gen narG como marcador funcional, fue llevada a cabo por Gregory et al. [2003]. También, la utilización de DGGE en el trabajo de Ovreas et al. [1998], permitió determinar cambios en la comunidad microbiana en un suelo sometido a actividad agrícola en Krohnestykket, Noruega. No obstante, para ejecutar análisis de este tipo de manera masiva, es necesario determinar aquellos marcadores moleculares que puedan resultar mas adecuados. Los marcadores moleculares (fragmentos o porciones de ADN, detectados de forma directa o mediante su expresión sea ARNm o proteína), pueden asociarse a características fenotípicas deseables en el organismo de interés. Una gran variedad de estos marcadores ha sido aplicada para el estudio de las comunidades de microorganismos, tales como los genes para proteínas del choque térmico, glutamina sintetasa, ATPasa, topoisomerasas, genes para ARNr, muy útiles en la caracterización de tales comunidades. Para los microorganismos del suelo, han sido utilizados marcadores relacionados con el metabolismo del nitrógeno, tales como genes para la enzima nitrogenasa, óxido nitroso reductasa y nitrito reductasa. Asimismo, se han aplicado genes que intervienen en la oxidación de metano o de amonio entre otros [Kent & Triplett, 2002], a través de técnicas que aprovechan la capacidad de hibridización existente entre cadenas de nucleótidos, tales como los arreglos de ADN. 3.5. ARREGLOS DE ADN Y EL ACCESO A LA BIODIVERSIDAD Los microarreglos de ADN son una herramienta poderosa para el análisis paralelo de muchos genes, basados en el fenómeno de hibridización ADN-ADN (Figura 1) [Kent & Triplett, 2002]. Los arreglos de ácidos nucleicos o chips de ADN, proveen oportunidades para la detección múltiple de ácidos nucleicos. Originalmente diseñados para secuenciación a gran escala, diagnóstico clínico y análisis genético [Small et al, 2001], los arreglos tienen un enorme potencial para el análisis de comunidades microbianas, detección de patógenos y monitoreo de miles de genes [Dennis et al, 2003]. Muestra bacteriana de referencia .*$§&>. Muestra bacteriana de prueba v /^DNc marcado mezclado e hibridizado al microarreglo ADNc se une al gen correspondiente F • • ■:■-© Expresado solo 'ó- ' • Btpnesado en Solo en --".y.-'-7$ No Figura 1. Esquema general de la realización de un microarreglo, Lucchini et al., [2001]. Las aproximaciones comunes para la fabricación y análisis de arreglos, incluyen sondas de ADNc y oligonucleótidos fijos sobre un elemento plano, geles, o láminas de vidrio [Small etal, 2001]. Solo recientemente, la tecnología del arreglo se ha extendido al área ambiental, y aunque tiene un gran potencial para caracterizar las comunidades microbianas y su función en el ambiente [Taroncher et al., 2003], su uso es limitado por el costo de los equipos para la generación de imágenes e impresión del arreglo. Las aplicaciones ambientales de esta tecnología incluyen los estudios de expresión genética, la identificación y genotipificación de bacterias basada sobre similitudes ADNADN, genética de poblaciones y detección de genes funcionales [Taroncher et al, 2003]. Ellos pueden ser usados para identificar y cuantificar los genes microbianos involucrados en las transformaciones biogeoquímicas del ambiente. Basados en el principio de hibridización mencionado, las sondas son diseñadas para una multiplicidad de blancos, incluyendo diferentes genes y variantes del mismo gen, que llevan a la determinación de la presencia y abundancia de genes específicos. Las aplicaciones más comunes de los microarreglos utilizan oligonucleótidos de ADN de diferentes tamaños, representando la secuencia parcial o total de los genes específicos. En el estudio realizado por Taroncher et al. [2003], los autores detectaron múltiples variantes del mismo gen optimizando el proceso de diseño de la prueba y las condiciones de hibridización con 22 oligonucleótidos de 70-meros; llevaron a cabo ensayos con los genes representativos de las familias de genes para la nitrogenasa, la nitrito reductasa desasimilativa y la amonio monooxigenasa, y no observaron hibridización cruzada entre las tres familias de genes o entre los tres subgrupos de genes de la nitrito reductasa (nirS, nirK, y nirK). Ahora, es posible diseñar un microarreglo de oligonucleótidos que tenga en cuenta una variedad de genes involucrados en diferentes vías geoquímicamente relevantes en paralelo y analizarlos simultáneamente en un estudio completo. 3.6. CONCEPTOS PARA EL DISEÑO DE UN MICROARREGLO Los primeros microarreglos de oligonucleótidos contenían cientos de sondas distintas por gen, en orden a maximizar la sensibilidad y especificidad de detección [Norton et al., 2002]. No obstante, con el paso de los años, el número de oligos utilizado por gen ha decrecido, debido parcialmente al incremento en la cantidad de información que se ha hecho disponible en las bases de datos; así mismo, los algoritmos de selección de sondas han mejorado, con lo cual, el número requerido de oligos ha disminuido y la tendencia ha sido la de maximizar el número de genes que son ensayados simultáneamente sobre un microarreglo, más que la colocación indiscriminada de todo tipo de secuencias sobre él [Antipova et al., 2002]. Debido a esta necesidad, se han incrementado los métodos utilizados para reducir el número de sondas por gen, mientras se maximiza la sensibilidad y especificidad de estos grupos reducidos de oligos [Antipova et al., 2002]. Tampoco se consideró la utilización de "todas" las variantes posibles de una secuencia como una orientación adecuada, debido a que esto hace que la aproximación sea más de tipo taxonómico que funcional. El objetivo primordial es llegar a la detección de la actividad efectiva de una gran variedad de organismos en el suelo para una función dada, mas no el hallazgo de una especie particular, aún cuando esta información pueda ser obtenida. Las variaciones de secuencia que puedan detectarse por medio del uso de las sondas diseñadas no se conoce y solo podrá evaluarse una vez se realicen estudios de campo. Sin embargo, en otros estudios, se ha determinado que una sonda degenerada de 70 nucleótidos puede detectar genes con quienes comparta hasta un 87% de identidad [Tamaru et al., 2000], lo cual implica una variación de 9 nucleótidos. El hecho de que las sondas proceden de secuencias involucradas en procesos de gran importancia para la supervivencia de los microorganismos, es una circunstancia que podría favorecer su escasa variabilidad. Igualmente, el microarreglo puede ser diseñado de una manera tal, que los genes puedan ser dispuestos por grupo funcional, facilitando la visualización de la ocurrencia de las reacciones aisladas, en conjunto dentro de un ciclo, o a nivel integrado de todos los ciclos. El microarreglo permite detectar puntos de ruptura de los procesos y correlacionarlos con parámetros ambientales para establecer sus causas. Igualmente, poner en evidencia las porciones de un ciclo que pueden resultar más susceptibles de ser afectadas, ya sea porque el sustrato enzimático no está presente en concentraciones adecuadas, por la carencia de factores inductores o porque los organismos encargados de su ejecución se encuentran inactivos o pueden haber sido eliminados del medio. Sin embargo, es necesario precisar que como otro tipo de aproximaciones, ésta permite obtener resultados comprobatorios mas no reprobatorios, es decir la señal de hibridización puede manifestar la ocurrencia del proceso enzimático con un nivel de significancia dado, pero la ausencia de señal no permite aseverar que la reacción no se está produciendo. Un aspecto que debe ser considerado para el diseño y evaluación del microarreglo, es el número de copias de un gen que pueden estar presentes en una célula en un momento dado, puesto que este factor incide en la intensidad de la señal registrada [Farrelly et ai, 1995]. Por ejemplo, en Nitrosomonas europaea, se ha encontrado que los genes amoC, amoA y amoB (amonio monooxígenasa), que son adyacentes, se presentan en dos copias [Hirota etaí, 2000]. En el caso de los genes para la denitrificación y la fijación de nitrógeno se reporta un bajo número de copias. En tanto que los genes para la hidroxilamina oxidoreductasa {hao), presentan números variables de éstas. Nuevamente en N. europaea se han reportado 3 copias de hao, que muestran tan solo 1 pb de diferencia en sus 1701 pb [Hommes et al, 2001]. Este hecho hace pensar en la necesidad del cálculo de factores de corrección para tal evento. La dificultad que existe en el presente, es que aun cuando para algunos grupos taxonómicos ya se conoce información acerca del número de copias, esta no es la regla. Se sabe que este número puede variar entre especies y esto hace casi imposible el conocimiento total a mediano plazo. La planificación de un microarreglo va más allá del proceso de laboratorio, inicia con una estrategia que debe dar respuesta a preguntas como: ¿Cuál será el alcance del microarreglo?, ¿cuál será la forma de extracción de ARN que maximice la información?, ¿qué limitaciones tiene el proceso de extracción?, ¿cuales restricciones técnicas y financieras existen?, ¿cuántas réplicas de la muestra se van a tener en cuenta? (normalmente se sugieren 3), ¿cuál va a ser el número de copias de la sonda?, etc. [Peng & Stromberg, en línea]. Las principales fuentes de variabilidad en el diseño del arreglo son: Las interacciones no específicas debidas a complejidades combinatoriales en la población blanco, la equivalencia termodinámica de las sondas, y la preparación y amplificación del ADN prueba, todas las cuales fueron tenidas en cuenta para el establecimiento de la población final de oligonucleótidos [Taroncher etal, 2003]. Entre las diferentes fuentes de error previas al desarrollo del microarreglo se encuentran: a. La técnica de extracción de ADN, puesto que algunas técnicas extraen una menor concentración de ADN fúngico frente al bacteriano, y existen probabilidades de coamplificacion de otros organismos eucariotes como algas, plantas y nemátodos, la presencia de compuestos húmicos, etc. Hoy día existen diversos métodos que han mostrado eficiencia en la recuperación de ADN de buena calidad, especialmente en suelos con altos contenidos de ácidos húmicos y taninos, como los tropicales [Nannipieri et al., 2003]. b. El número de ciclos considerados para la amplificación por PCR puede ser problemático. Soares et al [1997], recomiendan intervalos entre 22 y 25 ciclos para evitar el incremento en la proporción de secuencias quiméricas. c. Los cebadores (primers) empleados en la amplificación del ADN microbiano a partir de suelo deben ser lo suficientemente sensibles como para amplificar todas las secuencias posibles [Soares et al., 1997]. Los cebadores universales pueden ofrecer una buena solución y deben complementarse con aquellos específicos para el gen de interés (ver Anexo 2), para aumentar las posibilidades de obtener resultados representativos. 3.7. BIOINFORMÁTICA La bioinformática se encuentra en la intersección entre las aplicaciones de la información y las ciencias de la vida. Comprende la investigación y el desarrollo de sistemas útiles para entender el flujo de información desde los genes a las estructuras moleculares, su función bioquímica, su conducta biológica y, finalmente, su influencia [Febles & González, 2002]. Se ocupa de la utilización y almacenamiento de grandes cantidades de información biológica, mediante el uso de los computadores para el análisis de la datos biológicos, los análisis de correlación, la extracción y el procesamiento de la información [Febles & González, 2002]. La bioinformática hace uso de lo que se conoce como minería de datos, la cual ha sido definida como "la exploración y análisis, por medios automáticos o semi-automáticos, de grandes cantidades de datos en orden a descubrir patrones completos y reglas". El objetivo final es convertir datos en información y esta información en conocimiento [Basset et al, 1999]. Existen dos aproximaciones a la minería de datos, la primera comprende la prueba de hipótesis con el descubrimiento de conocimiento, en la cual la inducción o perturbación de un proceso biológico llevará a los resultados predichos, aunque a menudo también revela nuevos fenómenos; y una aproximación por análisis exploratorio, en la cual los datos son llevados a "hablar de si mismos" después de una serie de procedimientos que pueden incluir la estadística, el reconocimiento de patrones, la clasificación y la predicción [Basset et al, 1999; Febles & González, 2002]. En este último aspecto, la minería de datos aplica una dinámica que se mueve en sentido contrario al método científico tradicional, aquí no se formula una hipótesis para luego diseñar un experimento y cuestionar las premisas, por el contrario, se captan y procesan los datos con la esperanza de que de ellos surja una hipótesis apropiada. Se desea que los datos describan o indiquen el porqué presentan determinada configuración y comportamiento [Febles & González, 2002]. Las técnicas de minería de datos no pueden utilizarse para confirmar o rechazar hipótesis, porque puede conducir a errores. Su función es tratar de explorar datos, darles sentido, convertir un volumen de datos, que poco o nada aportan a la descripción, en información para interpretar un fenómeno o para adoptar decisiones [Febles & González, 2002]. Herramientas Bioinformáticas Las bases de datos de secuencias, constituyen el sustrato de todas las herramientas bioinformáticas usadas en análisis de secuencias. El mayor motor para el desarrollo de la bioinformática ha sido la biología molecular, y en concreto la disponibilidad de secuencias de ADN y proteína. Las herramientas bioinformáticas más usadas se han desarrollado como una respuesta a las necesidades de información sobre las secuencias, aprovechando el conocimiento previo almacenado en las bases de datos. Para secuencias de nucleótidos, existen tres bases de datos principales que colaboran entre sí, cada una colecta y procesa las nuevas secuencias e información biológica relevante que hubiera podido ser consignada por los científicos de la región, cada 24 horas. Por tal motivo, presentan un contenido idéntico, excepto para cualquier secuencia que haya sido añadida en el último día. La base de datos de nucleótidos, presenta información de secuencias del GenBank, EMBL, y DDBJ. Cada entrada en la base tiene un identificador único, que es una cadena de letras y/o números. Si bien existe gran cantidad de iniciativas que ha producido un enorme número de bases de datos más o menos especializadas con distintos contenidos, estos servidores recopilan las secuencias de ADN que se han ido depositando desde su primera versión, que para el EMBL fue el año 1982 existiendo por aquel entonces 568 secuencias [Dopazo & Valencia, 2001]. En lo referente a la información de proteínas, el PIR es la base de secuencias moleculares más antigua (1984); sus entradas surgieron a partir de esfuerzos de colaboración entre instituciones y son organizadas biológicamente usando sus relaciones estructurales, funcionales o evolutivas. Las entradas incluyen secuencias de aminoácidos y en muchos casos, las anotaciones posteriores incluyen citaciones, referencias a la base de datos de nucleótidos, información genética común, etc. PIR-NREF es una base de datos de referencia, no redundante generada al interior de PIR. Ha sido diseñada para proveer una colección completa de todos los datos de secuencias de proteína, de acuerdo con los proyectos de secuenciación de genomas actuales. Contiene todos los atributos de las fuentes, que corresponden a secuencias en PIR-PSD, SwissProt, TrEMBL, RefSeq, GenPept y PDB y ofrece una redundancia mínima. Las secuencias idénticas, del mismo organismo reportadas en diferentes bases de datos, son presentadas como una entrada NREF única, con IDs de proteína y nombres de cada base de datos, además de la secuencia, taxonomía y bibliografía. La base de datos es reevaluada cada dos semanas y la versión 1.46 de Mayo 6 de 2004 contenía 1'634.871 entradas, en su mayoría procedentes de TrEMBL y GenPept fhttp://www- nbrf.aeoraetown.edu/pirwww/search/pirnref.shtmn. La búsqueda de las secuencias puede ser ejecutada a partir de los servidores ubicados en las páginas de los proveedores mencionados, o puede ser realizada mediante una estrategia más flexible y completa como es el SRS o Sequence Retrieval System creado por Lion Bioscience. El SRS es un potente gestor y es la herramienta más utilizada para la búsqueda de información, contiene elementos de aproximadamente 180 bases de datos diferentes que incluyen bibliografía (MEDLINE), secuencias, motivos, señales, información adicional (taxonomía, códigos genéticos, etc.,) estructuras de proteínas, mapas genéticos y cromosómicos, mutaciones, mutaciones específicas de locus, rutas metabólicas y resultados de búsquedas (alineamientos, BLAST, etc.), entre otras. Toda esta información se puede consultar mediante preguntas con expresiones lógicas que pueden tener la complejidad deseada. Las consultas se pueden hacer sobre los distintos campos de las diferentes bases de datos y habitualmente implican el uso de palabras clave que definen los intereses de la búsqueda [Dopazo & Valencia, 2001]. El objetivo del SRS es proporcionar un acceso eficiente a las distintas bases de datos utilizando cualquier formato disponible. SRS permite dos modos de trabajo, uno con un interfaz gráfica de usuario, sencillo de usar y otro basado en la línea de comandos, orientado al especialista y a su uso por medio de programas auxiliares. El servidor presenta una pantalla inicial con varias opciones que proporcionan ayuda e información adicional, y un botón de entrada para iniciar una sesión de trabajo. SRS permite buscar en más de una base de datos al mismo tiempo, de una manera sencilla o detallada. Para este último caso existe un formulario en donde se indican los criterios de búsqueda deseados, la manera como deben combinarse y el modo de visualizar los resultados. Una característica interesante es que se puede trabajar sobre algunas o todas las secuencias mostradas indicando "todas menos las elegidas" o "todas las elegidas", para aplicar a un conjunto de secuencias operaciones como guardar en disco duro el listado de las entradas seleccionadas o ver el listado de esas secuencias. Otra propiedad importante de SRS, es que establece enlaces entre la información almacenada en todas las bases de datos, con lo cual se puede saltar a la entrada correspondiente para acceder a información relativa, sin necesidad de realizar nuevas búsquedas en cada base de datos rhttp://www.eez.csic.es/cursos/bioinfP0/cap2.html. ir Una de las bases de datos especializada, y que se centra en la búsqueda de particularidades en las secuencias de aminoácidos es ProDom, contiene información acerca de las familias de proteína, obtenida por análisis automatizado de las secuencias disponibles. Es útil para el análisis de los arreglos de dominios de familias protéicas complejas y ayuda a analizar relaciones de homología en proteínas modulares. Presenta una interfaz gráfica de fácil navegación entre arreglos esquemáticos de dominios, alineamientos múltiples, árboles filogenéticos, entradas de SwissProt, patrones de Prosite, familias de pFam y estructuras 3D de PDB. Las nuevas secuencias pueden ser buscadas contra ProDom, alineadas con las familias de dominios existentes y modeladas sobre las bases de dominios homólogos en PDB [Corpet et a/.,2000]. La aspiración al momento de realizar alineamientos entre secuencias, es que la función de puntaje refleje de manera más o menos fiel, los eventos biológicos que les dieron origen; de tal manera, que si los puntajes son optimizados, se produzca un alineamiento biológicamente correcto. Los programas de alineamiento pueden dividirse en dos categorías principales: los métodos que alinean secuencias usando la longitud total (globales) y los métodos que alinean solamente regiones de alta similitud (locales). Tradicionalmente el método de alineamiento global más común es Clustal, que es más comúnmente utilizado cuando las secuencias presentan longitudes similares. La única forma de conocer la calidad del alineamiento sin embargo, es comparando las salidas de diferentes programas [Lassmann & Sonnhammer, 2002]. ClustalW es un programa diseñado para el alineamiento pareado y múltiple de secuencias tanto de ADN como de proteína. Trabaja en tres pasos principales: 1) Alineando todos los pares de secuencias de manera separada con el fin de calcular una matriz de distancias que indique la divergencia existente entre cada par de secuencias; 2) Calculando un árbol guía a partir de la matriz de distancias y 3) Alineando progresivamente las secuencias de acuerdo al orden de ramificación del árbol guía [Thompson et a!., 2003]. ClustalX (1.8) es la interface gráfica para ClustalW, en donde el esquema de color permite determinar la presencia de elementos conservados en el alineamiento. El programa utiliza el método de NJ (Neighbour Joining) para calcular las distancias (porcentaje de divergencia) entre todos los pares de secuencias del alineamiento, y luego vuelve a aplicar el método a la matriz de distancias. Clustal provee un indicador de la calidad del alineamiento brindando una gráfica de puntaje de conservación para cada columna, el cual se incrementa con una mayor conservación. Se espera que existan residuos de bajo puntaje a una frecuencia moderada en todas las secuencias, debido a la divergencia del proceso natural de evolución. NJPLOT es un programa de diagramación de árboles filogenéticos que viene incluido con ClustalW, permite la visualización de los árboles iniciales formulados por este programa durante las primeras etapas de comparación pareada de secuencias, y facilita su utilización en la discriminación de grupos de secuencias [Perriére & Gouy, 1996]. Por otra parte, T-coffee (Tree-based Consistency Objective function for alignment Evaluation) un método que adicionalmente utiliza el alineamiento local, provee un medio simple y accequible de generar alineamientos múltiples y que admite fuentes heterogéneas de datos. Estos pueden ser el resultado de alineamientos pareados locales y globales, almacenados en una librería. Adicionalmente, usa una estrategia progresiva alineando primero los mejores datos de la librería de manera similar a la utilizada en ClustalX. Es un método un poco más lento, pero incrementa la precisión del alineamiento [Notredame etal, 2000]. Con el fin de evaluar la especificidad de cadenas de nucleótidos o aminoácidos frente a todas las secuencias reportadas en una base de datos, puede utilizarse un método de alineamiento como Blast. Blast es el programa de alineamiento de secuencias más rápido, debido a lo cual compromente algún grado de sensibilidad. El grupo de subprogramas incluye: BLASTN el cual realiza una búsqueda de un nucleótido contra una base de datos de secuencias nucleotídicas; BLASTP que compara una secuencia de aminoácidos contra una base de datos de secuencias protéicas; BLASTX que compara los productos de la traducción conceptual de los 6 marcos de lectura de una secuencia de nucleótidos (ambas cadenas) contra una base de datos de secuencias protéicas; TBLASTN que realiza una búsqueda de una secuencia de proteina contra una base de datos de secuencias nucleotídicas traducidas en sus 6 marcos de lectura (ambas cadenas) y TBLASTX que compara las traducciones de los 6 marcos de lectura de una secuencia de nucleótidos contra traducciones en 6 marcos de lectura de una base de datos de secuencias nucleotídicas rwww.ncbi.nlm.nih.oov/BLASTI. Para la manipulación de alineamientos se han diseñado una gran variedad de programas disponibles vía web, muchos de ellos de forma gratuita o a manera de Trial. Bioedit V5.0 es un editor de secuencias biológicas de interfaz gráfica, escrito en lenguaje C++ que corre sobre la plataforma Windows. Provee las funciones básicas para la edición, alineamiento, manipulación y análisis de secuencias de ácidos nucleicos y proteína. Tiene una capacidad para 20000 secuencias y provee un gran contenido de información que incluye el sombreado dinámico de posiciones de alineamiento, perfiles de hidrofobicidad/hidrofilicidad, graficación 2D, adición de comentarios, entre otra. Otro programa que ofrece utilidades para análisis y edición de alineamientos es GeneDoc, diseñado para ayudar a los usuarios a mejorar sus alineamientos y sobrepasar las limitaciones mas comunes en los programas de alineamiento múltiple. Ayuda en la extracción de información para ser usada en la planeación e interpretación del trabajo experimental. Permite hacer una buena anotación de los alineamientos, remoción de secuencias, sombreado y definición de características estructurales de los mismos. http://www.concentric.net/~Ketchup/Qenedoc.shtml. GeneRunner 3.05., es un programa de análisis simple en biología molecular; permite el ingreso de secuencias de ADN o proteína de manera manual o a partir de bases de datos como el GenBank. Puede realizar manipulaciones estándar de datos de secuencia como: Búsqueda de secuencias de ADN para sitios de restricción; búsqueda de secuencias de proteína para sitios de clivaje de peptidasas; traducción de ADN en secuencias de proteína y búsqueda de marcos abiertos de lectura; diseño de primers para PCR y secuenciación y alineamientos múltiples de secuencias. I_a herramienta OligoAnalysis utilizada en la investigación, faculta al investigador a ingresar un oligonucleótido de manera directa o seleccionarlo a partir de una secuencia. Faculta el calcular las principales características de un oligo como, Tm, %GC, estructura secundaria, etc. Adicionalmente los resultados obtenidos pueden ser impresos de una manera tal, que pueden ser fácilmente incluidos en informes y presentaciones . METODOLOGÍA 4.1. LA CONCEPCIÓN HOLÍSTICA DE LOS CICLOS BIOGEOQUÍMICOS Durante la primera etapa del diseño de la metodología, se llevó a cabo la búsqueda de información referente a los diferentes ciclos biogeoquímicos, considerados claves en el reciclaje de la materia orgánica y el sostenimiento de la dinámica de nutrientes en el subsistema suelo. Se analizaron los diferentes componentes de los ciclos y las reacciones bioquímicas implicadas. Con base en la información disponible, se generó un modelo conceptual en el que se involucraron los diferentes procesos realizados por grupos funcionales microbianos conocidos, y se visualizaron las interacciones existentes entre ellos. De igual manera, partiendo de dicho modelo se establecieron las enzimas propias de cada uno de los procesos, que pudieran ser útiles como marcadores, con ayuda de los siguientes preceptos: ❖ Están involucradas en la ocurrencia de los ciclos biogeoquímicos en los suelos. ❖ Permiten un seguimiento de procesos intermedios del ciclo, es decir, que son un factor primordial en pasos críticos dentro de cada uno de ellos. ❖ Los productos enzimáticos están presentes siempre para el mismo proceso y son propios de éste (especificidad de acción: un marcador - un proceso). ❖ Su actividad se encuentra asociada a grupos funcionales específicos y no es de distribución generalizada. ❖ Existen suficientes secuencias reportadas en las bases de datos. 4.2. OBTENCIÓN Y MANIPULACIÓN DE DATOS MOLECULARES En una fase consecutiva, se efectuó la búsqueda de las secuencias de ADN y proteína reportadas a nivel mundial para cada una de las enzimas elegidas, a través de la exploración en las bases de 32 datos GenBank (http://www.ncbi.nlm.nih.gov/), EMBL (European Molecular Biology Laboratory; http://www.embl-heidelberQ.de’>y DDBJ (DNA Data Bank of Japan; http://www.ddbi.niQ.ac.ipV a través del SRS de Lion Bioscience (Sequence Retrieval System; http://srs.im.ac.cn/srs71bin/coibin/waetz?-paae+srsq2+-noSession) ubicado en el Instituto de Microbiología de la Academia China de Ciencias y PIR NREF (Non-Redundant Reference Protein Database; http://www- nbrf.qeoraetown.edu/pirwww/search/pirnref.shtml) (miembro del consorcio Uniprot desde el 2002), respectivamente. Adicionalmente la pre-existencia de dominios fue establecida por medio de la búsqueda en la base ProDom (http://protein.toulouse.inra.fr/pnodom/current/html/form.Dho). estableciendose que a pesar de que existieran reportes para las enzimas, se continuaría su aplicación en las etapas subsecuentes de la investigación. Los datos a utilizar fueron determinados con base en los siguientes criterios: ♦ Seleccionar aquellas secuencias relacionadas con microorganismos terrestres o de suelos inundados, observando los campos de descripción para las secuencias reportadas. ♦ No tener en cuenta secuencias STS y secuencias de elementos en Cis. La información seleccionada, recopilada y depurada fue catalogada de acuerdo a criterios como número de accesión, longitud, tipo de molécula (ADN o proteína), organismo, etc. y organizada en una base de datos Local, la cual se denominó BIOPROC_SUELOS, de forma manual y con base en el formato de la Tabla 1: Tabla 1. Formato de ingreso de información a la base de datos Bioproc_Suelos. CAMPO EJEMPLO PROCESO REALIZADO Celulólisis GRUPO ENZIMÁTICO B-glucosidasas GEN glu # ACCESION AB088351 SECUENCIA ADN aataacacttagcaagtaaggctgaacttaagcttgcggtcctggttagcaacgccga agtacttctcgacctcggtggtttgggcaggtgtgtcgaaagcagtgaaccagaaacc actggcatccttctgctgccagagccagcatccaacattgttgtagaactgctgcagact ggcggtcgtggcagcagccttctggtagttgggtcccttggtaggccagccggtctcac caacccagacagtagccttg CAMPO EJEMPLO SECUENCIA PROTEINA mkffsttetlavalmmtgeavagtykgfsmganradgvckweadwkkdfqaiksw nkalvkavpaakatgmkilvgiwstddahfgrdkaallkaikqhgtgwiaaisvgsedl yrkdispqklaqqiydvrgmvhqynkalkvghtdtwtawvdgtndwtkacdiaitn gfpywqgvpikdalrlktfqnsywnvkkhvqavnskatvwvgetgwptkgpnyqk aaattaslqqfynnvgcwlwqqkdasgfw # LOCUS (GenBank reportado en PIR) >BAC66096 DESCRIPCION DEL GEN rga genes for putative beta-l,3-glucosidase, putative rhamnogalacturonan acetyltransferase, complete cds ORGANISMO Gibberella zeae LONGITUD (#bases) 3411 TIPO DE SECUENCIA complete cds OTROS The trichothecene biosynthesis gene cluster of Fusarium graminearum F15 contains a limited number of essential pathway genes and expressed non-essential genes DOMINIO Eukarya RENO Fungi DIVISION Ascomycota SUBDIVISION Pezizomycotina CLASE Sordariomycetes SUBCLASE Hypocreomycetidae ORDEN Hypocreales FAMILIA Nectriaceae GENERO Gibberella a. Los campos relacionados con la clasificación taxonómica (de Dominio a Género), fueron utilizados con el fin de generar una organización jerárquica, relacionada con los campos Gen y Grupo enzimático, por medio de una herramienta de filtrado en el manejador de bases de datos MySQL. Por ejemplo, para el Gen [lac] mostrar todos los datos por debajo del nivel taxonómico de la Subdivisión Homobasidiomycota. b. Con base en dicha jerarquización, los campos correspondientes a Accesión o Locus fueron empleados en la generación de archivos de texto (*.txt) para ADN y Proteína, que contenían las secuencias respectivas. Tales archivos fueron formateados utilizando un procesador de texto. Ejemplo: "Secuencias de ADN para el gen lac, Fungi-Basidiomycota-Homobasidiomycota" >AJ420176 cactggcatgggtttttccagagaggtcccaattgggcggatggtcctgttttcgtcacacagtgcccgatcgctagcggatactcgtttctata cgacttccgagttcctggtcaggctggtaggtcgcgtctttctccctttgtttaatgttcgtgatgctgaggatccacatcctagggacgttctggt accacagtc >AJ420175 cactggcacgggttcttccaacatggtaccaactgggccgatggcgccgccttcgtgaaccagtgccctatcgctactggcaactcgttcctgt acgacttcggcgtcccggatcaagcgggtaagtcctacagcaccaatgtattatcctcgctgctcacgtgtgtacagggacgttctggtacca cagtc >X52134 tatgcacactttccttcgctccacggcactcgttgtggcaggcctgtctgcccgcgcccttgccagcattgggcccgttaccgactttcacatcgt caacgccgccgtctctcccgatggtttctctcgccaggctgtcctggctgagggtgtcttccctggcccgctcatcgccggcaacaaggtactcc atttctctctcatccccgggatatgcgctgacggtcggcacagggcgacaatttccagatcaat Los archivos de texto generados para ADN y Proteína, fueron empleados para llevar a cabo los alineamientos múltiples, cuya finalidad fue la de determinar secuencias únicas y conservadas, con la utilización de los programas CLUSTAL X [Thompson et al., 2003] (Figura 2) y TCOFFEE (versión GNU-Linux) [Notredame etal, 2000]. _ Ai File EdS Alignment Trees Cotors ¡Múltiple Alignment Mode 1 2 3 4 5 6 7 8 9 10 11 Q uality Help Font Size:¡10 CAA93150 CAD126S9 AAF70180 AAF37580 A A L S7854 BAA02918 BAC45251 BAB16890 BAA34922 AAB70917 BAA92251 KDPKRH5 ruler 1 ....... 1 0 ......... 2 0 ......... 3 0 ......... 4 0 ......... 5 0 ..... —BFSÜHSBHII®3SLIS«£ ~Si®Rí®KQfSpHlB|5p¡^£^jgTlST8AREM(DNGQ£NVí ----- ^ 1'DPpR^^SMPÍáRHKRuA^A^ftW P A File D:\DocumentosVTesis\Escritos\genchiAbacteria.aln loaded. ñgura 2. Salida delprograma ClustaIX. Se ensayaron diferentes combinaciones de parámetros, cuyo objetivo fue el obtener buenos alineamientos; para tal procedimiento se utilizaron archivos por lotes *.BAT, con la finalidad de acceder vía comando al panel de control de ClustalX y ejecutar simultáneamente múltiples ventanas de alineamiento. Para el alineamiento de las secuencias de ADN se utilizaron los siguientes parámetros: ♦ Penalización por apertura de espacios (0-100) de 80, de extensión 70, retraso por divergencia 40%, peso de transición 0.5. También se utilizaron los parámetros por defecto del programa (15,6.66, 30% y 0.5, respectivamente). Para los alineamientos de secuencias protéicas, los parámetros usados fueron: Penalización residuo específica, penalización por residuos hidrofílicos (GPSNDQEKR), separación de gaps (0-100) de 4, no separación de espacios terminales, y se variaron las siguientes condiciones: ❖ para una matriz PAM40 la penalización por apertura de espacios (0-100) de 80, de extensión 70, retardo por divergencia de 40%. ❖ Para PAM120 penalización por apertura de espacios (0-100) de 50, de extensión 50, retardo por divergencia de 40%. ❖ Para PAM350, por defecto, penalización por apertura de espacios (0-100) de 10, extensión 0.2, retardo por divergencia de 40%. Las anteriores matrices fueron calculadas por medio de una herramienta bioinformática ubicada en la dirección: http://www.cmbi.kun.nl/bioinf/tools. la cual realiza una extrapolación a diferentes distancias evolutivas partiendo de una matriz PAM 1. Se realizó un tipo de alineamiento utilizando los parámetros por defecto, que incluyen el uso de una Matriz Blosum 62, con penalizaciones por apertura (0-100) de 10 y por extensión de 0.2 y un retraso por divergencia de 30%. Los alineamientos obtenidos en ClustalX, fueron re-introducidos en el programa T-coffee 1.37 para la plataforma Windows, al cual se accedió vía línea de comandos utilizando igualmente archivos por lotes. Los parámetros usados fueron aquellos que el programa configuró por defecto. Los alineamientos fueron visualizados por medio de la herramienta de importación de *.ALN, del programa GENEDOC (Figura 3) [Nicholas & Nicholas, 1997], el cual permite tanto la observación de las secuencias consenso, como las gráficas de porcentaje de identidad que permiten detectar la consistencia del alineamiento. GcmcOóc - |g en 18 S a r c h a e a *p « > 4T»*f‘f Fie Project & S Arrange DjcglBl a í t M _| Sha^e £roups Scfire c|8|g| V :ÍS É »§Í Ire e Reports F|ot M ndow m |»[ « M a | 5 lc n | P | E | 8 | H | I | L | 0|1Í :cgTGGTAAT TCTAGA -Iffl x| Help I S.I I I I * U N C T T C tG G AAGG M|U] Ga g Figura 3. Salida del programa GeneDoc en donde se observa la salida del alineamiento en ClustalX de secuencias pertenecientes al ADN codificante para ARNr 18S de Archaeospora. Las zonas azules corresponden a áreas de gran similitud, en tanto que las naranja presentan algunas discrepancias. Abajo secuencia consenso. Aquellas secuencias generadoras de ruido, fueron extraídas mediante el programa Seaview [Galtier et ai, 1996], utilizando como criterio los cladogramas generados por ClustalX que fueron observados con la ayuda del programa NJPLOT (ver Figura 4). Estos cladogramas también fueron empleados para agrupar aquellas secuencias más similares y favorecer el hallazgo de consensos más consistentes que siguieran una asociación natural de las secuencias. □ naiGGammapioteobacteria.dnd jJ S lx J File Edit Fort Paper O peration---------------------------------------------(• Full tree C New outgroup C Swap nodes Subtree D isplay [“ jBranch lengthsj T Bootstrap valúes Subtree Up j Help j ,0.05, E rH ■Y11935 Y11936 Y11937 — Y11938 -Y11939 Y15252 •U71398 — A F 197465 ■X16181 Figura 4. Salida del programa NJPLOT, donde se observa un dadograma obtenido a través de ClustalX. Luego de la obtención de resultados a partir de las variaciones realizadas en los parámetros de alineamiento, para un mismo grupo de secuencias, se efectuó una comparación visual seleccionando aquellos que pudieran ser más adecuados, por mostrar regiones comunes más consistentes. 4.3. DISEÑO DE SONDAS Además del requisito mencionado arriba, las secuencias consenso fueron seleccionadas con base en su longitud: La cadena de caracteres continuos no podía ser menor de 11 con el fin de permitir un diseño de oligonudeótidos adecuado. Las secuencias fueron posteriormente sometidas a un análisis de especificidad vía web, a través del 38 subprograma BLASTN 2.2.9. para ADN y BLASTP para proteína, del NCBI. Las características utilizadas se encuentran en la Tabla 2: Tabla 2. Parámetros utilizados para el análisis de especificidad por medio de BLAST. Filtro de baja complejidad X Búsqueda BLASTP BLASTN Características X Nr, Est, Environmental para Nr, Environmental, SwissProt para todos todos los organismos los organismos Longitud palabra 11 3 Valor E 0.001 0.001 Otros Matriz Blosum62 (penalización apertura: 12, extensión: 1) Las secuencias (ADN y proteína) que detectaban cadenas blanco relacionadas, con una alta similitud (altos puntajes) y valores E altamente significativos (<0.001), fueron elegidas para la posterior evaluación de las características termodinámicas adecuadas para la disposición en un microarreglo. Adicionalmente, fue tomada en cuenta la información gráfica mostrada por Blast referente a dominios catalíticos o estructurales, con el fin de complementarla con aquella relativa a los valores de significancia y el grado de especificidad requeridos para el nivel taxonómico al cual se evaluó cada gen. Las secuencias de proteína seleccionadas luego de la ejecución de BLAST, fueron traducidas a ADN, utilizando el subprograma Reverse Transíate de Bioedit, mediante una tabla de codones universal para Bacteria, Archaea y Eukarya, al igual que las tablas #11 (bacterial and plant plastid) y #4 (Mold, protozoan and Coelenterate) del GenBank, referidas a Bacterias-Archaea y Hongos, respectivamente. Posteriormente, la base de datos de los posibles oligonucleótidos fue analizada de conformidad con el esquema desarrollado por Matveeva et al. [2004], para la discriminación de secuencias conservadas, en cuanto a utilidad en el desarrollo de microarreglos. Se utilizó la subrutina Oligo del Programa GeneRunner 3.05 (Figura 5). Las características son: 0Sgo:jAGCTATAAC6ATGATCGACGGATT <Senxeohfo> Sliand Molecule MolWt: E'«*l 9 lop « DNA 6 3 .0 | Tm: C E«p C RNA 614 Len: |24 Frttei Tm. 70.5 j | Edil «tíñeme J| Switchotgos | *GCTm; 6C+AT Tu: 68.0 f lee energr IdGJ Temp: 18.0 4.1 [ Piobe con£picoMol); nMol/A260: 0.60 Saft con(milljMolí; 1000.00 ug/A260: 41.7 j 4 Fotnainide: 0.0 X6C: -42.8 j 3*-151idhuí. 17 Bo«oijjn>- |« rtfi 184.8 j len>- [5 Slemlen >- [5 dH -481.5 i Baseluns / Palindiomes dS -8.3 j 3'-enddG __ ú fr - r fT " q h > ii [ il Sort |Tm;| 00 d6:| "T" (■ U a itpin lo o p » P D iroen C fiu lg e lo o p t P Interna! lo o p » 5 * BGCTftTfiflCGflT ifi G TTflGGCAGCTfl 3' STEM « 1 9 IS 3 BP LONG. LOOP 3. IT | O* lf~ C A U C E L ]| H E LP ]| Erin> ]| P e la u ft» | Figura 5. Ventana de¡ subprograma Oligo, de GeneRunner. ❖ Los oligonucleótidos deben haber sido originados a partir de una secuencia consenso. ❖ Los oligonucleótidos que tengan potenciales de auto-apareamiento debidas a interacciones intra e intermoleculares mayores que los umbrales definidos (Inter: (AG° 37) > -8 kcal/mol e Intra: (AG°37) > -1.1 kcal/mol, deben ser rechazados. Es necesario tener en cuenta las temperaturas desde 37°C, puesto que algunos ensayos de hibridización oligo-ARN la utilizan. Las temperaturas de hibridización deben ser bajas para asegurar la estabilidad de los híbridos. ❖ Las secuencias deben ser evaluadas en cuanto a su potencial de apareamiento mayor a un umbral definido, con el fin de reducir las posibilidades de hibridización cruzada. Además de los anteriores lincamientos se debe tener en cuenta: ❖ La longitud de los oligonucleótidos, puesto que es mejor para el microarreglo utilizar secuencias similares en este aspecto [Cho & Tiedje, 2002] y que de preferencia posean una longitud mayor a 25 nucleótidos [Bhanot et al., 2003]. ❖ Deben excluirse aquellas sondas que sean particularmente ricas en AT o GC, en concordancia con los lincamientos empíricos dados por Affymetrix [Bhanot et ai, 2003]. En orden a estimar estos parámetros, se determinaron algunas condiciones estándar: La concentración establecida para el ADN prueba fue de 0.6 pM, el cual se considera un valor seguro para la mayoría de hibridizaciones. La concentración de sales fue de 1M por defecto. La concentración de Formamida fue 0. Se debe tener en cuenta que otros valores requeridos por el investigador, deben generar resultados diferentes. La Tm es definida como la temperatura a la cual la mitad de las moléculas de ADN aún se hallan en doble cadena. Este valor es calculado por el programa GeneRunner usando la siguiente fórmula: Tm=AH/(AS + R In (CT) - 273.15 en donde, H es la entalpia, S la entropía, R es 1.987 cal.mol1, y CT es la concentración total de la hebra, y condiciona la temperatura a la cual se realiza la etapa me/ting o de separación de las hebras. Está directamente relacionada con el porcentaje o contenido de GC, por esta razón este valor debió ser menor al 55% (43.1% en promedio). Affimetrix publicó un grupo de heurísticos que se usa en el diseño de sondas. Estos fueron derivados empíricamente y son usados por esta empresa para diseñar oligonucleótidos de aproximadamente 20 nucleótidos de longitud: b. El número total de As o Ts debe ser menor a 10 (<50%). c. El número total de Cs o Gs debe ser menor a 9 (<45%). d. El número total de As y Ts en cualquier ventana de 8 bases debe ser menor de 7 (<87.5%). e. El número de Cs y Gs en cualquier ventana de 8 bases debe ser menor de 6 (<75%). Las sondas inicialmente escogidas fueron recortadas hasta cumplir con los criterios propuestos, o eliminadas, y una vez depuradas fue creada una base de sondas definitivas, las cuales se utilizaron para la evaluación de posibles apareamientos entre ellas, con ayuda de la rutina BlastN del programa BioEdit. RESULTADOS Figura 6. Diagrama de rutas bioquímicas de los ciclos del carbono, nitrógeno, azufre e hierro (páginas siguientes). -Ifo c < NOS A líe m b r a n a p la s m á t ic a Periplasma Membrana M+ T e t r a h i d r o so rc in a p te rin o H-S-CoM C O Z -C o A 2 H» T etrahidrosarcinapter ina Coenzwia A ? A b P ^ 'J ATP H2SPT:CoM itlransferasa Form ato i) H2 3 H2 0 O x id o r ed u c t asa 5 -F e Su lfito O xidasa Fe3+ dependiente k) 8 H* 4 Fe *2 3H 2 0 4 Fe -3 ^ 2 glutort- ¡i oxidados 2 glutatíon reducidos .&• ATP + H 20 * ► C a d e n a de tran sporte de e- Pi s u l f u r ¡I AbPi ADP > 2t - AttP "ÍHtTP *fc.,AbP APS ▼ A P j'V ', reduct'•‘?ÍO • ' l 2t- 2e- rto oxidasa ADP Jo su lfa to C 6x i d o r ed uctasa ATP o < 504-2 "/ C ITO PLASM A -5 KedaEín delafe o»tóH<u<tasa y n# otíese Jepentílerte de F í> a «s Anaerobiosis i Fs304 ^X •S, Aerobiosis ¡jUpfic'loivrc *■Fe304 ✓;Fe2+ N 4 Fe 3+ n) ■£>■ 00 zcoz -ACETATO PIRUVATO /tCETATO LACTATO Reducción desasin ilativa T ro n s f e ra s a 5 sitesis Reducción asimikitiva 3NADP-HÍT 3NADPH NADP-k -*''' NADPH M em brano i♦ ( i ) - 20i ; * ; n i > c n ^^A. 2H+ ( tu * g i j> (f: foilna«Tu» ^u2-fji)-;{u2t(niKu2*(D H2 0 2 H2 0 iji i ) ) (tutq>-;cii z-(iip-cu2-kii£> ff)-acu*(ni)-cu2- 2 > ^ * f l ) - Cu ; * q i - i > C u R . MnPII Acido orqénit- * Acido orgónit^f e í 3+ AfaPX )= o *1) >f5t * Ata 2+ f. * ^ - ^ 2 0 Y - - A H202 ¡Xp)Ciclo catalítico de las lacasas [Tomado de Lucas e t al. 2001]. d)Ciclo catalítico de la enzima Manganeso peroxidasa [Tomado de Lucas e t ai. 20011. o)Ciclo catalítico de la Lignin Peroxidasa [Tomado de Lucas e t ai, 2001], n)Proceso oxidoreductivo en el ciclo del hierro [modificado de Prescott e t al., 2000]. bacterias reductoras de sulfato [Basado en Brüser e t ai, 2000]. I) Rutas de oxidación anaerobia de compuestos sulfurados reducidos en bacterias (muy común en fotosintéticas) [Brüser e t ai, 2000]. m)Esquema de acoplamiento de la reducción asimilativa y desasimilativa de sulfato, oxidación de H2 y la síntesis de ATP en k)Oxidación de azufre elemental. Bacterias quimioautótrofas [Basado en Prescott e t al, 2000] h, i )Oxidación de compuestos reducidos de carbono con la liberación de C02, en la que se involucra la enzima COdeshidrogenasa. Bacterias metanotrofas, carboxidotrofas [Basado en Conrad, 1996]. j) Vía reductiva desde compuestos carbonados oxidados como COZ hacia metano [Thauer, 1998], g) Vía metanogénica por reducción de acetato [Basado en Ferry, 1995]. f)Reducción desasimilativa de nitrato a nitrito y a amonio, disipación de poder reductor y detoxificación de nitrito, nitrito reductasas y nitrato reductasas NADH dependientes (Klebsiella y Rhodobacter) [Moreno e t a/, 1999]. e)Acoplamiento de la oxidación de amonio y posterior reducción de hidroxilamina en el proceso de denitrificación. d) Asimilación de Nitrato. Se muestra la nitrato reductasa asimilativa dependiente de ferredoxina (Fd) (cianobccíerias) y las c) Reacciones químicas que ocurren durante la fijación de nitrógeno [Basado en Zehr e t a l 2003]. codificantes de la nitrato reductasa (niaD) y de la nitrito reductasa (niiA) forman un "cluster" [Tomado de Kinghorn, 1989]. transportadora de electrones anaerobia [modificado de Moreno etal., 1999]. b)fteducción asimilativa de nitrato en hongos. El sistema de trannsporte del nitrato incluye un permeasa (gen crnA), los genes a) Vías de respiración de nitrato (nar) y denitrificación (nos, nir, ñor) en bacterias. Se observa la organización de la cadena te Í (Fe 3+) ______ 0=®VFe4n 6> H 20 >Ata 2 + X ÁAn 3+ Acido orgánico quelorits, R a d í ca Feas^ __ Acido orgánico quelonfre LDH lactato deshidrogenase!; H2asa Hidrogenase, CO-deshidrogenasa; CoM, CoB Coenzima M, Coenzima B; APS Adenosin fosfosulfato; PAPS Fosfoadenosin fosfosulfato; citoplasmática NADH-dependiente (2 subunidades); CO-desh Hidroxilamina oxidoreductasa; nirBD Nitrito reductasa fei-redoxin dependiente (algunas bacterias); Hao Ferredoxina reducida; N irA nitrato reductasa asimilato-ia cofactor bis-molibdopterin guanina dinucleótido; NarB Nitrato reductasa ferredoxin dependiente; ;Fdred M6C)-NasA Subunidad catalítica de la nitrato reductasa y :¡u Sistema de transporte nitrato-nitrito; NasC NADH-nitrato reductasa; N rf ABCD Subunidades de la nitrito reductasa: de hongos; NiiA Nitrito reductasa de hongos; nasFED de transporte de nitrato en hongos: NiaD Nitrato reductasa Q H 2 -Q Quinona reducida-oxidada; CrrA Permeasa-sistema Abreviaturas Utilizadas: Modelo conceptual de integración de los ciclos biogeoquímicos considerados {página Figura 7. siguiente). «JWt □ Archaea [.J Bacteria Desconocido 0 Eukarya tlpffShaea ---- - QBacterla Si Desconocido ~ EJEukafya Figura 8. Representación de la proporción de secuencias de ADN para cada grupo enzimático a nivel de Dominio taxonómico. Clave de abreviaturas ver Tabla 3. ión de tas secuencias de ADN encontradas por División. Figura 9. Distribución #géneros Figura 10. Histograma de frecuencia de secuencias de ADN por Género. Figura 11. Representación de la proporción de secuencias de proteína para cada grupo enzimat/co a nivel de Dominio taxonómico (abreviaturas ver Tabla 3). 54 Figura 12. Distribución de ias secuencias de proteína encontradas, por División. #géneros Figura 13. Histograma de frecuencia de secuencias de proteína por Género. ENZIMA/PROCESO GÉNERO AMONIO MONOOXIGENASA Nitrosomonas, Nitrosospira, Nitrosovibrio, Pseudomonas (amo) APS QUINASA (apsq) Escherichia, Klebsiella APS REDUCTASA (apsr) AHochromatium, Desulfovibrio APS SULFURILASA AHochromatíum, Escherichia, complejo Klebsiella, Burkholderia Pseudomonas, cepacia, Rhizobium, Rhodococcus, Sinorhizobium B-GLUCOSIDASA (bgluc) Agrobacterium, Aspergillus, Butyrivibno, Candida, Bacillus, Bifidobacterium, Celluiomonas, Cellvibrio, Chryseobacteríum, Clavibacter, üostridium, Cochliobolus, Debaryomyces, Escherichia, Gibberella, Gluconacetobacter, grupo Bacillus cereus, Humicola, Hypocrea, Klebsiella, Lactococcus, Kluyveromyces, Paenibacillus, Phaeosphaeria, Pantoea, Pichia, Sphingomonas, Lactobacillus, Pectobacterium, Rhizobium, Streptococcus, Serrada, Taiaromyces, Thermobifída, thermobispora, Thermotoga ENDOGLUCANASA (endog) Actinomyces, Agaricus, Aspergillus, Bacillus, Bionectria, Celluiomonas, Chaetomium, üostridium, Debaryomyces, Emericella, Erwinia, Fusarium, Gluconacetobacter, Humicola, Hypocrea, Irpex, Methanococcus, Nectria, Paenibacillus, Pectobacterium, Phytophthora, Promicromonospora, Pseudomonas, Rolstonia, Rhizobium, Stachybotrys, Taiaromyces, Thermoascus, Thermobifída, Trametes, Trichoderma, Xanthomonas EXOGLUCANASA (exog) Acremonium, Alternaría, Aspergillus, Blumeria, Candida, Celluiomonas, üostridium, Cochliobolus, Complejo Cryphonectña/Endothia, Fusarium, Humicola, Hypocrea, Penicillium, Phanerochaete, Pleurotus, Streptomyces, Taiaromyces, Thermoascus, Trichoderma, Volvariella CO-DESHIDROGENASA (codh) Methanosaeta, Methanosarcina ENZIMA/PROCESO GÉNERO ENDO-MICORRIZACIÓN Archaeospora (archaeo), Paraglomus (parag) (SUBUNIDADES ARNr) FERREDOXIN NITRITO Emericella, Nostoc, Synechococcus, Acinetobacter REDUCTASA ASIMILATIVA (feniderasi) FERREDOXIN SULFITO AHochromatium, Escherichia, Pseudomonas, Rhizobium, REDUCTASA ASIMILATIVA Salmonella, Thiocapsa (fesiderasi) DINITROGENASAS (n2) Anabaena, Azomonas, Azotobacter, Azorhizophilus, Oostridium, Heliobacterium, Metanosarcina, Rhodobacter, Rhodospirillum NITROGENASA FEMO (n2femo) Aicaiigenes, Azospirillum, Azotobacter, Bradyrhizobium, Burkholderia, Calothrix, Chlorogloecopsis, Oostridium, Cytindrospermum, Fischerella, Gtuconacetobacter, Herbaspirillum, Klebsiella, Leptospirillum, Mesorhizobium, Methanothermobacter, Nodutaria, Nostoc, Pseudomonas, Rhizobium, Rhodobacter, Scytonema, Synechococcus OXIDO NÍTRICO REDUCTASA Achromobacter, Aicaiigenes, Azospirillum, Nitrosomonas, (niored) Pseudomonas OXIDO NITROSO REDUCTASA Achromobacter, (nored) Bradyrhizobium, Aicaiigenes, Azospirillum, Ochrobactrum, Paracoccus, Pseudomonas, Ralstonia, Rhodobacter, Sinorhizobium OXIDO REDUCTASA NADPH Escherichia, Salmonella, Thiocapsa (nadphredox) PAPS REDUCTASA (papsred) AHochromatium, complejo Burkholderia Escherichia, Rhizobium, Salmonella, Thiocapsa cepacia, QUITINASA (quit) Aeromonas, Ajel/omyces, Bacillus, Blumeria, Arthrobacter, Aspergillus, Botryotina, Candida, Chromobacterium, Oostridium, complejo Burkholderia cepacia, Cordyceps, Doohwaniella, Emericella, grupo Bacillus cereus, Janthinobacterium, Kurthia, Nocardiopsis, Pseudomonas, Rhizopus, Serraba, Stenotrophomonas, Streptomyces, Trichoderma, Ustilago, Verticillium, Xanthomonas RUSTICIANINA (rust) Acidithiobacillus SULFITO REDUCTASA Klebsiella, Rhizobium, Salmonella ASIMILATIVA (siderasi) SULFITO REDUCTASA AHochromatium, Archaeoglobus, Bilophila, Desulfacinum, DESASIMILATIVA (siredd) Desulfitobacterium, Desulfobacula, Desulfobacter, Desulfobacterium, Desulfobotulus, Desulfobulbus, Desulfocella, Desulfococcus, Desulfofaba, Desulfofustis, Desulfohalobium, Desulfomicrobium, Desulfomonile, Desulfonatronum, Desulfonatrovibrio, Desulforhabdus, Desulforhopalus, Desulfosarcina, Desulfotomaculum, Desulfosporosinus, Desulfovibrio, Dseulfovirga, Syntrophobacter, Thermodesulfovibrio TIOSULFATO REDUCTASA Salmonella (tiosared) HIDROXILAMINA ÓXIDO Nitrosomonas, Nitrosospira REDUCTASA (hao) FENOLOXIDASAS (fenol) Trametes LACASAS (lac) Agaricus, Aspergillus, Botryotina, Ceriporiopsis, Climacocystis, Colletotrichum, Coriolopsis, Cryphonectria, Cyathus, Daedalea, Ganoderma, Fusarium, Gymnopus, Gaeumannomyces, Heterobasidion, Hypholoma, Lentinula, Neurospora, Phlebia, PHoderma, Pleurotus, Podospora, Pycnoporus, Streptomyces, Thanatephorus, Trametes ENZIMA/PROCESO GÉNERO 1 LIGNIN PEROXIDASAS (ligper) Bjerkandera, Ceriporiopsis, Phanerochaete, Trametes MN-PEROXIDASAS (mnper) Ceriporiopsis, Dichomitus, Heterobasidion, Phanerochaete, Pleurotus, Trametes, Tylospora METANO OXIGENASA Methylobacter, Methylocaldum, PARTICULADA (pmo) Methy/ococcus, Methyíocapsa, Methylocystis, Methylomicrobium, Methylomonas, Methylosinus, Nitrosomonas METIL- CO-M-REDUCTASA Methanobacterium, Methanobrevibacter, (mcomred) Methanocaldococcus, Methanococcus, Methanocorpusculum, Methanoculleus, Methanomethylovorans, Methanopyrus, Methanofollis, Methanomicrobium, Methanosaeta, Methanosareina, Methanosphaera, Methanospirillum, Methanothermococcus, Methanotorris, NADH-NITRITO REDUCTASA Amyco/atopsis ASIMILATIVA (nadhniredasi) NITRATO REDUCTASA Oostridium, Oscillatoria, Pseudomonas, Amyco/atopsis, ASIMILATIVA (naredasi) Azospirillum, Baciitus, Klebsiella NITRATO REDUCTASA Bacillus, Escherichia, grupo Bacillus cereus, Paenibacillus, DESASIMILTTATIVA DE Pectobacterium, MEMBRANA (nareddmem) Shewanella, Staphy/ococcus NITRATO REDUCTASA Azospirillum, DESASIMILTTATIVA Ralstonia, PERIPLASMICA (nareddper) Sulfurospirillum, Synechococcus, Wolinella NITRITO REDUCTASA Achromobacter, Alcaligenes, Azospirillum, Blastobacter, DENITRIFICANTE (niredden) Bradyrhizobium, Pseudomonas, Moraxella, Paracoccus, Rhodobacter, Mesorhizobium, Ra/stonia, Serratia, Pseudomonas, Rhodopseudomonas, Ensifer, Hyphomicrobium, Nitrosomonas, Ochrobactrum, Pseudomonas, Rhizobium, Rhodobacter, Sinorhizobium NITRITO REDUCTASA Alcaligenes, Azorhizobium, Azospirillum, Desulfovibrio, DESASIMILATIVA PERIPLASMICA Escherichia, Gluconacetobacter, Klebsiella, Paracoccus, (nireddper) Penicillium, Pseudomonas, Staphy/ococcus Ralstonia, Roseobacter, Metano monooxigenasa Oxidación de metano metanotrofos pmoA tipo I y II particulada Sulfito reductasa Reducción desasimilativa de sulfito dsrA, subunidad alpha desasimilativa (SOs=) a sulfuro de hidrógeno dsrB, subunidad beta (desulfoviridina) (H2S) Nitrito dsrD, subunidad delta reductasa Reducción de nitrito (NO2 ) a óxido Catalizado por los productos denitrificante periplásmica de dos genes n irK (contiene nítrico (NO) cobre) y el otro tiene un citocromo cdl nirS Nitrito reductasa Reducción desasimilativa de nitrito nrfA desasimilativa periplásmica (NO2 ) a amonio (respiración de subunidad catalítica (NH4+) citocromo c nitrato), amonificación Nitrito reductasa Reducción desasimilativa de nitrito nirB, subunidad beta desasimilativa periplásmica (NO?) a amonio (Nrtt+) (disipación nirD, subunidad delta de poder reductor y detoxificación de nitrito) Óxido nitroso reductasa Reducción de óxido nitroso (N2O) a nosZ nitrógeno molecular (N2) Amonio monooxigenasa Oxidación de amonio (NH4+) a amoA, subunidad A amoB, subunidad B nitrito (NO2 ) amoC, subunidad C Metil CoenzimaM reductasa Reducción de (metanógenas) CO2 a metano mcrA subunidad A, unidad de transcripción para las 3 subunidades de la enzima: mcrBDCGA (en oxidación de CO a C02, también cdhA, subunidad alpha CO-deshidrogenasa carboxidotrofas contiene un enzima oxidación de sulfuro de carbono cdhB, subunidad epsilon la cofactor cdhC, subunidad beta de (OCS) cdhD, Codesh. molibdopterina) componente Co/Fe-S subunidad delta cdhE, subunidad gamma coxL, subunidad grande. coxM, subunidad mediana Acetil-CoA sintetasa, acsA en Utilización de acetato homoacetógenos actúa en conjunción con la CO- deshidrogenasa NADH-Nitrito reductasa Reducción de nitrito (NCV) a nasB* asimilativa (bacterias como hidroxilamina (NH2OH) y a amonio nirA** (NIV, vía asimilativa) biosíntesis K. oxytocá)* y ferredoxin nitrito reductasa de compuestos de N asimilativa (cianobacteria)** Hidroxilamina reductasa oxido Reducción de hidroxilamina hao (NH2OH) a amonio (NIV) Nitrogenasa dinitrogenasa reducción de nitrógeno molecular Subunidad FeMo dinitrogenasa (N2) a amonio (NH4+) I de dinitrogenasa, la 2 heterodímeros: nifD-nifK. reductasa Fe nitrogenasa V Dinitrogenasas alternativas: vnfH (vanadio), anfH (hierro). Nitrogenasas alternativas - con vanadio: vnfD, subunidad alfa de la Vanitrogenasa. vnfG, subunidad delta de la Va-nitrogenasa. vnfK, subunidad beta de la Va-nitrogenasa. - con hierro: anfD, subunidad alfa3 de la dinitrogenasa. anfG, subunidad delta3 de la dinitrogenasa. anfK, subunidad beta3 de la dinitrogenasa. Complejo enzimático de Oxidación de tiosulfato (S203=) a phsA, tiosulfato reductasa tiosulfato-tiosulfato sulfato (S04=) phsB, proteína hierro reductasa, cataliza a sulfito y azufre. H2S phsC, proteína anclada membrana Rusticianina oxidación de Fe+2 a Fe+3 rusA rusB rustA - a : GEN PROCESO cysD, Sulfato (S04=) a APS ATP sulfurilasa sulfato transferasa adenilil subunidad pequeña. cysN, sulfato adenilil transferasa subunidad grande. APS quinasa Fosforilación de APS a PAPS cysC APS reductasa Sulfito (S03=) a APS aprA, adenililsulfato reductasa subunidad alfa. aprB, adenililsulfato reductasa subunidad beta. surC, adenilil sulfato reductasa. cysH PAPS reductasa PAPS reductasa Sulfilo reductasa Reducción asimilativa de sulfito cysG, Sulfito reductasa- (S03 =) a sulfuro de hidrógeno sirohemo sintetasa. cysl, sulfuro de H:ferredoxin (HaS) oxidoreductasa. cysJ, NADPH sulfito reductasa componente de flavoproteina. Nitrato reductasa asimilatoria Reducción de nitrato (NOs) a narB** o soluble (cianobacteria)** nitrito (NO2 ) vía asimilativa, biosíntesis de compuestos de N. Nitrato reductasa asimilatoria Reducción de nitrato (NO3 ) a nasC, subunidad pequeña de o soluble citoplasmática nitrito (NO2 ) vía asimilativa, transferencia de electrones. (bacterias como K. oxytoca)* biosintesis compuestos de N. nasA*, subunidad catalítica grande. Nitrato reductasa Reducción de nitrato (NO3 ) a narG, unidad catalítica de Mo desasimilativa de membrana nitrito (NO2 ) vía desasimilativa unida a membrana. (respiración y disipadora de rédox denitrificación) narH, subunidad beta. narl, subunidad gamma. Nitrato reductasa Reducción de nitrato (NCK) a napA, subunidad grande. desasimilativa periplásmica nitrito (NCb) vía desasimilativa napB, subunidad pequeña, (disipación de poder reductivo y dihemo citocromo c. densificación) Nitrato reductasa asimilativa Reducción de nitrato en hongos nitrito (NO?) vía (N O 3) a nit2 (no hubo reportes) asimilativa, nit4 (no hubo reportes) niaD, biosintesis compuestos de N. (dependiente de NADPH) Nitrito reductasa asimilativa Reducción de nitrito (NOf) en hongos amonio (NIV, vía a niiA asimilativa) biosintesis de compuestos de N Óxido nítrico reductasa Reducción de óxido nítrico (NO) a norB, consta de subunidades: óxido nitroso (N20) relacionada dos qnorB con la detoxificacón y cnorB. Lacasas Mineralización de lignina ti¡A, Icsl, lapl, Iap2 huminas pox,l-3, poxA Fenoloxidasa Manganeso Peroxidasas Mineralización de lignina Mineralización y mnpl, mnp2, mnp3, mnp4, mnpB. huminas Lignin Peroxidasas y lccl-5, IccK, lacl-14, yA, de huminas lignina y üpA, HpB, tipC, UpE> lipl, HpG, HpH, HpJ, vgll, Iip2r tpgl, IpgA, IpgB Archeospora spp. Endomicorrización rrsi Endomicorrización rrs2 Endomicorrización 18 S Endomicorrización 5 .8 S Paragtomus spp. Archeospora spp. Paragtomus spp. Archeospora spp. Paragtomus spp. Archeospora spp. Paragtomus spp. ENZIMA-MOLECULA/GÉNERO quitinasas GEN PROCESO Quitina chiC, chiB, chiA, bcc, ch¡F, chil, chilS, c h ill, c h i(3, 37, 41, 55, 60, 67, 69, 80, 92), ch il9 , chit, chitiA, chitiB, c ts l, cts2, cht4, kchi, pchA, bccl. Endo-B-glucanasas Degradación de celulosa Bg/H, cenA, bg/2, egl, e g ll, eg!3, eg¡4, eg¡5, bglB, bg/C, bglA, egltA, b g ll Exo-6 -glucanasas Degradación de celulosa Cex, exgl, b g ll, exg2 Celobiohidrolasas Degradación de celulosa Cé/1234567, cbhl, cbhA, cbhB Endo/Exoglucanasas Degradación de celulosa ce! Celodextrinasas Remoción de la celobiosa celACGDYDCO acc2 xynA engBDEHKLMNXY eme cenC bgxA bglxA cbh2, Figura 14. Número de sondas seleccionadas a partir de las secuencias de ADN, por nivel taxonómico. Figura 15. Número de sondas seleccionadas por nivel taxonómico, a partir de las secuencias de proteína traducidas. DISCUSIÓN DE RESULTADOS La investigación realizada, hizo acopio de la información depositada en las tres principales bases de datos genómicos internacionales, y a través de su análisis condujo al desarrollo de una metodología de trabajo, cuyo objetivo a largo plazo, será el diseño de una Herramienta Molecular de Evaluación Funcional de Suelos. El estudio hace uso de estrategias de minería de datos, disciplina que aplica un punto de vista contrario al método científico tradicional. Se basa en el aprovechamiento de la información que ha sido recopilada en estas bases por parte de diversos investigadores, y en el concepto de que es posible desarrollar aplicaciones tomando rutas diferentes a la experimentación a priori. La información contenida en las bases, debió ser evaluada de acuerdo al objetivo central del trabajo, filtrada y clasificada. Las bases de datos son una gran fuente de información que puede ser aprovechada desde diferentes perspectivas, siendo esta una de las posibilidades. 0 suelo, resulta ser el componente más importante dentro de los ecosistemas terrestres, puesto que a pesar de carecer de autonomía en términos productivos (las bacterias fotosintéticas y quimiosintéticas como aquellas oxidantes de compuestos inorgánicos simples como amoniaco, nitrito, sulfito, hierro ferroso no pueden suplir la producción del ecosistema), permite el sustento físico y nutricional de la comunidad de productores existente en la superficie, facultando de esta manera la estabilidad funcional del ecosistema. Los microorganismos del suelo participan en todos y cada uno de los procesos de degradación de la materia, y son los primeros eslabones en la cadena alimenticia, puesto que de ellos depende en primer término, la liberación de los nutrientes que posteriormente serán tomados por las plantas, y en consecuencia el sostenimiento de los ecosistemas. Adicionalmente, se ha demostrado que la composición y la diversidad funcional de las comunidades de microbios, resulta el principal factor controlador de la productividad ecosistémica [Phillips et al., 2000]. Por tal razón, la comprensión de tales interacciones microbianas, puede permitir un incremento en los beneficios obtenidos de su aprovechamiento, la reversión en procesos de degradación, la restauración de ecosistemas, etc. Dado que el sistema suelo puede ser considerado como una caja negra, gracias al gran número de variables ambientales asociadas con su dinámica, se proyectó el diseño de un método que permitiera entender la influencia e interacción de los diversos factores ambientales sobre procesos críticos del ecosistema. Uno de los principales problemas que llevaron a la formulación de la investigación, fue la preocupación de que aún las técnicas de cultivo microbiológicas tradicionales son el sistema de análisis de suelos más utilizado, especialmente en nuestro país, en donde se hace uso de ellas para acceder al conocimiento de la composición a grosso de la microflora y microfauna del suelo, y de su diversidad. La veracidad de la información obtenida por esta vía, es discutible, dado el error que se genera durante el proceso de aislamiento de los microorganismos, la variedad tanto de formas de vida como de microambientes en el suelo, sugieren así mismo una gama muy extensa de condiciones de crecimiento, que hacen poco probable que la microflora quede representada en el escaso número de medios de cultivo que pueden ser utilizados para la evaluación ex situ. Adicional mente, el problema del favorecí miento o no de ciertos microorganismos bajo estas condiciones, hacen que la mayoría de ellos no puedan ser registrados o sean subestimados en cuanto a su abundancia y diversidad. De ninguna manera, la densidad microbiana en una caja de cultivo, refleja la densidad real que subyace en el suelo. Por estas y más razones, es claramente necesario explorar metodologías y hacer acopio de las técnicas más avanzadas, con el fin de determinar si resultan apropiadas para estos propósitos. Como primer paso para lograr este objetivo, se requiere analizar la forma de su ejecución, para tener claramente definidas las condiciones de operación del método, cuales pueden ser los posibles pasos a seguir y las dificultades que deben ser afrontadas. Como elemento de evaluación en desarrollos posteriores, se definieron algunas de las características que debía poseer un buen método de análisis de suelos, cualquiera sea su mecanismo de aproximación: ♦ Debe ser una técnica económicamente viable, cuyos costos sean fácilmente cubiertos frente a su utilidad e información; en donde los costos de equipos y operación, permitan el ofrecimiento del servicio a la comunidad. ♦ Debe ser muy confiable, puesto que los datos tienen que reflejar de manera adecuada la realidad edáfica. Esto se logra con una estandarización de la técnica en laboratorio, controlando las posibles fuentes de error. ♦ Debe ser lo suficientemente rápida en la obtención de resultados, como para permitir el procesamiento de un gran número de muestras en un tiempo tal, que no sea considerado una fuente de error adicional. ♦ Debe permitir obtener la máxima información posible, observando las diferentes escalas de funcionamiento del ecosistema, permitiendo generar tanto una imagen global del estado de un suelo, como la detección de puntos de ruptura de procesos. ♦ Debe permanecer vigente, es decir, que a medida que nuevos procesos sean evaluados y se obtenga información al respecto, pueda ser adicionada y la técnica no resulte obsoleta. ♦ Debe evaluar los diferentes procesos que ocurren en el suelo, no simplemente la existencia de un grupo taxonómico determinado, especialmente, en lo referente a aquellos procesos que no son exclusivos de un grupo microbiano en particular. Sin embargo, debería permitir el acceso a esta información si es requerida. ♦ Debe ser reproducible, lo cual permite la implementación de normas de calidad y así mismo el establecimiento de resultados repetibles en diferentes laboratorios. ♦ No puede estar restringida a un tipo particular de suelo, por el contrario, debe ser aplicable a toda clase de ellos, incluyendo sedimentos y suelos inundados de cualquier procedencia. La utilización de la información genómica de los microorganismos, permite que se obtengan datos reales de los procesos ocurrentes en el suelo, en donde las limitaciones, estarán ya no determinadas por la fuente de datos, sino por la optimización de los procedimientos que se llevan a cabo en su consecución. De esta manera, la aplicación de técnicas moleculares permite cumplir con gran número de los requerimientos antes indicados; por otra parte, los microarreglos de ADN han demostrado ser una técnica fiable, repetible y lo suficientemente rápida como para ser implementada en servicios de análisis. Al tratarse de sistema relativamente nuevo, adolece de no estar lo suficientemente estandarizado como para minimizar el efecto del error, pero se están haciendo grandes adelantos al respecto, que hacen pensar que su fiabilidad tendrá un incremento vertiginoso. Una vez definida la problemática o motivo del estudio, se plantearon los posibles mecanismos de abordaje para el diseño de la metodología. En primer lugar, la búsqueda de información publicada, permitió entrever una carencia de herramientas de evaluación holística de los procesos biogeoquímicos, puesto que en la literatura solo se encontró la evaluación de ciclos aislados, así que el diseño de este tipo de herramientas, aún no ha sido abordado. Para determinar el tipo de funciones bioquímicas que iban a ser tenidas en cuenta, fue necesario observar todo el universo de ciclos de nutrientes existentes y comenzar por darles un valor de importancia que favoreciera su selección. Dado que la productividad de los ecosistemas terrestres proviene de la vegetación, y debido a que los servicios que ésta brinda pueden ser vistos económicamente, como fuente de diversidad, generación de oxígeno, sustento de la cadena alimenticia, o en la generación de recursos de aprovechamiento humano, una buena motivación en la inversión de esfuerzos de investigación, es el sostenimiento y desarrollo de la biomasa vegetal. Por tal motivo, los ciclos biogeoquímicos de mayor importancia fueron determinados pensando en los elementos que son esenciales para las plantas y las concentraciones en las que son requeridos (Tabla 5). Tabla 5. Elementos esenciales para la mayoría de las plantas superiores y concentraciones internas que se consideran adecuadas [Salisbury & Ross, 1994]. ELEMENTO SÍMBOLO QUÍMICO CONCENTRACIÓN EN TÜIDO SECO (%) Molibdeno Mo 0.00001 Níquel Ni ? Cobre Cu 0.0006 Cinc Zn 0.002 Manganeso Mn 0.005 Boro B 0.002 Hierro Fe 0.01 Cloro Cl 0.01 Azufre S 0 .1 Fósforo P 0.2 Magnesio Mg 0.2 Calcio Ca 0.5 Potasio K 1 Nitrógeno N 1.5 Hidrógeno H 6 Oxígeno 0 45 Carbono C 45 Los microorganismos se encuentran involucrados en la mayor parte de los ciclos referentes a estos elementos. Dado su papel como degradadores de materia orgánica en el retorno de nutrientes, 70 como reguladores en la velocidad con que ésta ocurre y como fórmulas de ingreso de nutrientes gaseosos o en estados insolubles, se consideró que en la medida en que mayores cantidades de algunos nutrientes son reclamados por la biomasa vegetal, su importancia se incrementa. Por ese motivo, fueron seleccionados los elementos Carbono, Nitrógeno, Fósforo, Azufre, Hierro e Hidrógeno para el estudio, y la búsqueda de información se centró sobre el tipo de reacciones ocurrentes en las diferentes porciones de tales ciclos y las enzimas involucradas en ellas, con lo cual se procedió a la búsqueda y/o diseño de los diagramas correspondientes. 6.1. RUTAS BIOQUÍMICAS Los diagramas de reacciones observados en la Figura 6 , fueron obtenidos a partir de las diferentes fuentes bibliográficas consultadas, y muestran cada una de las transformaciones que suelen ocurrir para las diferentes vías metabólicas dentro de los ciclos biogeoquímicos. Como es implícito, un ciclo biogeoquímico sugiere la existencia de procesos químicos como reacciones de oxidoreducción, con la mediación de agentes biológicos, que involucran la transformación de nutrientes importantes para la subsistencia de los procesos vitales a nivel global. Se requiere evaluar cada uno de estos procesos con el fin de seleccionar aquellos que resultan críticos y detectar las enzimas clave y su utilidad como marcadores. 6.1.1. C ic lo del C arbono: El carbono puede estar presente en formas reducidas, tales como el metano (CH4) y la materia orgánica, y en formas más oxidadas como el monóxido de carbono (CO) y el C02. Los reductores (como el hidrógeno) y oxidantes (como el 0 2), influyen en el curso de las reacciones biológicas y químicas que involucran al carbono. Si el hidrógeno y el metano se mueven desde áreas anaerobias hacia aerobias, se crea una oportunidad para que los oxidantes aerobios de hidrógeno y metano puedan actuar [Prescott et al., 2000]. De los 500 millones de toneladas de metano producidas anualmente en el planeta, las bacterias oxidantes de metano contribuyen al reciclaje del 60% [Gilbert etal., 2000]; dado que mantienen el equilibrio en la reserva de este gas de invernadero deben ser incluidas en cualquier evaluación microbiológica realizada en suelos. Los genes involucrados en la oxidación de metano (pmoA, mmoB, y mxaF), ya han sido usados para caracterizar comunidades microbianas del suelo [Kent & Triplett, 2002], lo cual facilita su elección. La metano monooxigenasa (MMO) (Figura 6 i) existe en dos formas diferentes [Murrell et al, 2000], la enzima seleccionada para este estudio se encuentra ligada a membrana y está evolutivamente relacionada con la amonio monooxigenasa (AMO) de las bacterias denitrificantes, siendo sintetizada solo en presencia de suficientes concentraciones de cobre. La ventaja que presentó para su selección, es que a diferencia de la MMO particulada, se encuentra presente en todos los metanotrofos [Conrad, 1996], pudiendo ser usada como marcador funcional para estos organismos. Los organismos que efectúan la reacción contraria, los metanógenos, poseen varios biomarcadores potenciales, incluyendo 1) la coenzima F420, 2) los isoprenoides y éteres lipídicos en las membranas celulares, y 3) la coenzima M (CoM). El segundo marcador es del tipo bioquímico, por lo cual no es aplicable a la metodología planteada. Se consideró la coenzima M como el marcador más útil, debido a que todos los metanógenos conocidos expresan esta enzima [Hallam et al, 2003]. Por otra parte, la coenzima F420 tiene dos limitaciones, la primera se debe a que las concentraciones intracelulares de coenzima F420 presentan muchas variaciones y la segunda es que se encuentra extendida en grupos que no son metanógenos [Elias et al, 1999]. La coenzima M está involucrada en otras reacciones de reducción a metano como la que ocurre a partir de C02 o acetato (Figura 6gj) entre otros. Este último, es una de las principales fuentes y solo se han cultivado dos géneros que lo llevan a cabo: Methanosarcina y Methanothrix. En este conjunto de reacciones, el acetato debe ser activado a AcetilCoA antes del clivaje de los enlaces CC y C-S. El grupo carbonilo es oxidado a C02, el grupo metilo es transferido vía tetrahidrosarcinapterina a la coenzima M. La metanogénesis partiendo de CO2, toma lugar bajo condiciones anóxicas y es una forma de respiración anaerobia [Conrad, 1996]. Las CO-deshidrogenasas también son enzimas claves en el ciclo del carbono en los suelos, puesto que intervienen en el metabolismo del CO de microbios diversos fisiológica y filogenéticamente, que lo utilizan como única fuente de energía y carbono [Lorite et al, 2000], entre ellos se cuentan hongos, actinomicetos, otras bacterias y arqueas [King, 2003]. Además de la oxidación de CO, se encuentran involucrados en la reducción de acetil-coA (metanogénesis) y en la reducción de compuestos como el sulfuro y disulfuro de carbono (Figura 6gh), por lo cual fueron consideradas. La degradación de compuestos orgánicos naturales más recalcitrantes como la quitina, la lignina y la celulosa, es de suma importancia para el retorno al sistema de sus principales constituyentes, siendo el carbono el elemento de mayor proporción. La despolimerización de estos compuestos también conlleva la liberación de una importante fuente de nitrógeno y azufre, por lo cual, estos polímeros pueden ser incluidos en los respectivos ciclos biogeoquímicos. A continuación, se establecen las principales enzimas involucradas en dichos procesos, en donde su carácter único, las lleva a ser seleccionadas como marcadores. Los hongos como unos de los mejores degradadores de lignina, secretan varias enzimas oxidativas incluyendo LiP, MnP, lacasas y quitinasas [Larrondo et al., 2003], utilizadas como marcadores. Las lacasas (bencenodiol oxigeno oxidoreductasas), son glicoproteínas que contienen cuatro átomos de cobre y catalizan la oxidación de la lignina, usando oxígeno molecular como aceptar de electrones; el cual es luego reducido a agua. Las lacasas fúngicas, degradan lignina en conjunción con la lignin peroxidasa (LiP) y la manganeso peroxidasa (MnP) [Muñoz et al., 1997] (Figura 6 p). Los sustratos van formando radicales libres que pueden convertirse en quinonas mediante oxidaciones [Lucas etal., 2001]. El ciclo catalítico de las LiP o ligninasas es semejante al de otras peroxidasas. La oxidación de la enzima a expensas del peróxido de hidrógeno, origina la transformación de su sitio activo en un compuesto intermediario (compuesto I, Figura 6o). Este compuesto actúa como generador de radicales libres. Así, en presencia de un compuesto aromático (fenólico o no) donador de electrones, el compuesto I es reducido a compuesto II (ganando un electrón) a la vez que se genera un radical aromático (.+). Tras una segunda reducción del compuesto II con un sustrato aromático se regenera la enzima nativa, cerrándose el ciclo. Es la peroxidasa con el más alto potencial de oxidoreducción, lo que explica su poder oxidante sobre las unidades aromáticas no fenólicas de la lignina [Lucas etal., 2001]. 0 ciclo catalítico de la Manganeso Peroxidasa es semejante al de la LiP, pero hay diferencias en la reacción de reducción, siendo el Mn(II) el donador de electrones. Tanto el compuesto I como el II son reducidos por el Mn(II) (Figura 6q), a la vez que éste es oxidado a Mn(III). Los iones Mn(III) con alto potencial de reducción son estabilizados mediante la formación de quelatos con ácidos orgánicos como el oxalato, malonato, malato, tartrato o lactato [Lucas etal, 2001]. Los genes para celulasas fueron recopilados teniendo en cuenta la selección de éstos genes realizada por Lynd et al. [2002], en la cual se indican los diferentes genes codificantes para los grupos de acción catalítica de éstas: endo-B-glucanasas, exo-B-glucanasas, celobiohidrolasas y celodextrinasas. La inclusión de estos procesos y las proteínas catalizadores de la despolimerización de la celulosa, se basa en que este compuesto es el mayor componente de la biomasa vegetal. 6.1.2. C ic lo del A z u fre : Los microorganismos son los principales contribuyentes del ciclo del azufre, por ejemplo, los microorganismos fotosintéticos usan sulfuro como fuente de electrones. En ausencia de luz, este compuesto puede pasar hacia ambientes oxidados, en donde géneros de quimiolitoautótrofos como Thiobacillus realizan su acción. En contraste, cuando el sulfato se difunde hacia hábitat reducidos, provee una oportunidad para que otros grupos microbianos lo reduzcan, utilizándolo como aceptar de electrones para la producción de energía. Este es un ejemplo de un proceso de reducción desasimilativa y de respiración anaerobia. En comparación, la reducción de sulfato para su uso en biosíntesis de aminoácidos y proteínas es descrita como reducción asimilativa. El sulfito es un intermediario que puede ser reducido a sulfuro por una amplia variedad de microorganismos, incluyendo A/teromonasy Clostridium, Desulfovibrio y Desulfotomaculum [Prescott etal., 2000]. Se ha reconocido que enzimas como la sulfuro oxigenasa, que cataliza la oxidación de compuestos de azufre muy reducidos como el azufre elemental e iones sulfuro, la tiosulfato citocromo Coxidoreductasa que aprovecha la capacidad donadora de electrones del tiosulfato, la sulfito oxidasa encargada de la oxidación de sulfito a sulfato, la APS reductasa involucrada en la producción de Adenosin-fosfosulfato, que ha sido propuesta como un marcador útil por el grado de conservación de las secuencias codificantes en diferentes grupos [Friedrich, 2002] y la ADP sulfurilasa encargada de la liberación del ión sulfato, son las principales encargadas de la etapa oxidativa del ciclo del azufre, que permite su aprovechamiento por las plantas y otros organismos (Figura 61). Otra vía de oxidación de azufre ocurre a través de la oxidación a ácido sulfídrico, la posterior oxidación a sulfito por medio de la enzima Sulfito reductasa, la cual es dependiente de Fe3+y la formación de SO<t“ con la ayuda de la oxidoreductasa S-Fe (Figura 6k). La reducción de sulfato por las dos vías existentes, asimilativa y desasimilativa, muestran enzimas de distribución generalizada entre los grupos funcionales. La primera vía es requerida para la formación de aminoácidos como la cisteína, precursora de las moléculas orgánicas que contienen azufre reducido [Snoeek et al., 2003]. La respiración anaerobia de sulfato es un componente central del ciclo global del azufre y es exhibida solo por procariotes [Loy etal., 2002]. Las enzimas ATP sulfurilasa, flavoproteina hierro-azufre adenosin 5-fosfosulfato reductasa (APS) y la sirohemo sulfato reductasa, están involucradas en el metabolismo tanto oxidativo como reductivo (Figura 6 m), la primera, por ejemplo, es la enzima clave encargada de la activación del sulfato [Snoeek et al., 2003]. Todas las enzimas son encontradas generalmente en bacterias y arqueas reductoras de sulfato. Además, la presencia de APS reductasa y ATP sulfurilasa ha sido reportada para varias especies de bacterias sulfuro-oxidantes quimiotróficas y fototróficas, esto las hace de utilidad en la evaluación de la ocurrencia de las reacciones en suelo. La enzima(bi)sulfito reductasa desasimilativa (DSR), ha sido reportada como la enzima primordial en la ruta desasimilativa de reducción de sulfato y sulfito [Karkhoff etal., 1995]. 6.1.3. C ic lo del N itró g e n o Debido a que el nitrógeno del nitrato se haya muy oxidado, debe ser primero reducido a amonio antes de poder ser convertido a una forma orgánica. Esta reducción de nitrato es de tipo asimilativo. En este caso, el nitrógeno hará parte de la materia orgánica y no es utilizado para la generación de energía [Prescott et al., 2000]. Este proceso se consideró trascendente por cuanto permite una forma de almacenamiento temporal del nitrógeno, regulando su disponibilidad biológica, lo que es muy importante en suelos tropicales en donde el exceso de nitrógeno se pierde rápidamente, ya sea por denitrificación o por lavado, así que la reserva en la biomasa microbiana resulta crítica para la fertilidad de los suelos. Como puede observarse en la figura 6 b) en los hongos existen dos enzimas claves ejecutando la función, la nitrato reductasa (NIAD) y la nitrito reductasa (NIIA) [Kinghorn, 1989]. En bacterias pueden estar involucradas varias enzimas diferentes, dependiendo del organismo a tratar (5d), NARB y NIRA en Cianobacterias y NASA, NASB y NASC en una amplia diversidad de microorganismos [Alien et al., 2001]; también fueron consideradas dos enzimas relacionadas con la transferencia de electrones hacia el citoplasma NRFA (Figura 6f) y NASC. La nitrificación, el proceso aerobio de oxidación del ión amonio (NH4+) a nitrito (NCh) y subsecuentemente a nitrato (N03 ), es de igual manera una transformación que permite que exista disponibilidad de nitrógeno en un estado fácilmente asimilable por las raíces [Salisbury & Ross, 1994]. En un aspecto negativo, las bacterias oxidantes de amonio tienen actividad sobre fertilizantes a base de urea y de amonio, oxidándolos a nitrito, por lo cual son fácilmente lavados, generando importantes pérdidas al favorecer también la denitrificación [Purkhold etal, 2000]. La enzima AMOA (Figura 6e), es una enzima única para los mirificantes oxidantes de amonio y de la cual se sabe que provee un nivel de resolución filogenético que cubre los diferentes taxa [Casciotti & Ward, 2001; Purkhold et al., 2000; Rosch et al., 2002; Aakra et al., 2001], por lo cual fue escogida como marcador adecuado en la evaluación de esta función en suelos. 0 proceso de densificación, requiere un conjunto de condiciones ambientales diferente. En este proceso desasimilativo, el nitrato es usado como un oxidante en la respiración anaerobia. Los principales productos incluyen N2 y N20, aunque el nitrito (N02) también puede acumularse. El nitrito es de importancia ambiental, debido a que contribuye a la formación de nitrosaminas carcinogénicas y constituye un compuesto tóxico para las plantas. Finalmente, el nitrato puede también ser transformado a amonio en una reducción desasimilativa por una variedad de bacterias, incluyendo Geobacter metall/reducens, Desulfovibriospp., y Clostridium spp. [Prescott etal., 2000]. Dado que la densificación completa requiere de la acción secuencial de 4 enzimas, la nitrato reductasa, la nitrito reductasa, la óxido nítrico reductasa (monóxido de nitrógeno reductasa), y la óxido nitroso reductasa (monóxido de dinitrógeno reductasa) (Figura 6a), éstas, deben ser consideradas conjuntamente para la evaluación de la acción biológica sobre el ciclo del nitrógeno. De las dos nitrato reductasas, la enzima asociada a membrana está típicamente involucrada con la respiración de este compuesto bajo condiciones anóxicas, y juega probablemente el papel más importante en el ciclo ambiental del nitrógeno [Gregory et al., 2003]. Esta enzima condiciona el éxito de las bacterias oxidantes de amonio para tolerar grandes cantidades de nitrito o el crecimiento en ambientes anóxicos. Así mismo, la nitrito reductasa en una enzima clave en la vía de la denitrificación, como lo indican Casciotti & Ward [2001]. Por el contrario, la utilidad de la monóxido de nitrógeno reductasa ha sido puesto en duda, debido a que se ha encontrado que pequeñas cantidades de NO son originadas a menudo a partir de la respiración de nitrato, y no de la denitrificación, por lo que esta propiedad parece no ser exclusiva de los denitrificantes [Zumft, 1997]. La asociación catalítica napAB (Nitrito reductasa periplásmica, Figura 6f) tiene una variedad de papeles fisiológicos en diferentes organismos, desde la catálisis del primer paso para una verdadera vía de densificación anaerobia, hasta el aprovechamiento de bajas concentraciones de nitrato, permitiendo su respiración en presencia de oxígeno y conduciendo al consumo de equivalentes reductores durante el crecimiento sobre carbono reducido [Richardson, 2000; Zumft, 1997], La enzima hidroxilamin oxidoreductasa también puede catalizar una reacción de densificación en ausencia de oxígeno utilizando como aceptor de electrones el nitrito (Figura 6f), se ha descrito en especies de Planctomycetales como Scalíndua sorokinn, Kuenenia stuttgartiensis, Brocadia anammoxidans, P/anctomyces. Es una reacción inhibida además por exceso de nitrito o fosfatos [Strous et al., 1999]. Por otra parte, la fijación de nitrógeno, proceso biológico único que permite el aprovechamiento de la fuente atmosférica de este macroelemento, es llevada a cabo por procariotes aerobios y anaerobios, simbióticos y libres, en un proceso de alto consumo energético en el cual se suceden consecutivamente procesos reductivos graduales, cuyo objetivo final es la obtención de amonio (Figura 6c). Debido a que ha sido extensamente estudiada, la subunidad II de la dinitrogenasa de hierro codificada por el gen nifH no fue incluida en el estudio. Se han diseñado cebadores y sondas eficientes para este marcador [Poly et al., 2001], por lo cual, se consideró realizar la búsqueda para los heterodímeros de la subunidad I de la dinitrogenasa (nifD y nifK), para las subunidades alfa, delta y beta de la nitrogenasa de vanadio (vnfD, vnfG y vnfK) y para las subunidades alfa3, beta 3 y delta3 de la dinitrogenasa II (anfD, anfG y anfK), así como las nitrogenasas alternativas (vnfH y anfH). Para genes representativos del ciclo del nitrógeno, como nitrogenasa, nitrito reductasa desasimilativa y amonio monooxigenasa, no existe hibridización cruzada con genes de la nitrito reductasa nirS y nirK [Taroncher et al., 2003], por ello fueron considerados candidatos para el estudio realizado, puesto que pueden ser analizados en paralelo. 6.1.4. C ic lo del H ie rro El ciclo del hierro, incluye varios géneros microbianos diferentes que realizan su oxidación, la transformación de ión ferroso (Fe2+) a férrico(Fe3+). ThiobacWus ferrooxidans lo ejecuta bajo condiciones acidas, Gallionella es activa bajo pHs neutros y Sulfolobus funciona bajo condiciones ácidas y termofílicas. Otros organismos como Sphaerotüus y Leptothrix, producen esta oxidación con la formación de hierro insoluble, que precipita a pH neutro pero creciendo sobre sustratos orgánicos (quimioheterótrofos) [Straub et al., 1996]. Este ciclo está estrechamente ligado al del azufre, siendo muy dependiente de los procesos oxidoreductivos de los compuestos azufrados (figura 6 k) y a la metanogénesis, en donde la disponibilidad de Fe(III) como un aceptor de electrones alterno para la respiración microbiana es un factor controlador. Su acción donante de electrones también es sumamente importante en bacterias aerobias [Straub et al, 1996]. La importancia de este ciclo tiene entre sus argumentos el hecho de que en suelos del trópico, este elemento contribuye a la "pérdida" del fósforo disponible en los suelos; el alto contenido de hierro hace casi inoficiosa la aplicación de fertilizantes fosforados, los cuales son rápidamente inmovilizados. En ecosistemas inundados o con regímenes pluviométricos variables, la disponibilidad del fósforo y otros elementos está relacionada con los estados de oxidación del hierro. La única enzima considerada específica para este ciclo es la rusticianina, la cual es una proteína de cobre y el componente principal en la cadena de transporte de electrones en quimiolitótrofos acidófilos como T. ferrooxidans, razón por la cual fue seleccionada [Walter et al., 1996] (Figura 6 n). 6.1.5. C ic lo del F ó sfo ro Debido a que el ciclo del fósforo es de carácter sedimentario, y a que no existe un grupo funcional que sea considerado como solubilizador o fijador de fósforo, encontrar un marcador específico para este ciclo no fue posible. La capacidad degradadora de materia orgánica, y la actividad de fosfatasas con la consecuente liberación de compuestos fosforados, es una capacidad extendida en el mundo microbiano, por lo tanto, se estimó adecuado tener en cuenta solo aquellos organismos que por sus características, facilitan el acceso de este importante elemento a las plantas, las micorrizas; las cuales funcionan a manera de bombas, concentrando el escaso fósforo de algunos suelos en su micelio. Las micorrizas son un puente entre diferentes ciclos, como el del carbono y el nitrógeno; parecen estar involucradas en la fijación de este último, gracias a la presencia de endosimbiontes del género Burkholdería [Minerdi et al., 2001] y, adicionalmente permiten la recuperación de fósforo del sumidero geoquímico retornándolo al sistema biológico. Dado que para la detección de estos organismos se han diseñado cebadores y sondas basadas en ARNr subunidad pequeña [Kjoeller & Roendahl, 2001; Redecker, 2000; Redecker etal, 2000], su evaluación es una excepción a la orientación original de esta investigación, por cuanto no se trata de un grupo funcional sino de un grupo taxonómico. La información recopilada alrededor del Orden Gomales permitió conocer la existencia de secuencias que permitieran la detección de dos nuevos grupos que han sido considerados recientemente, el género Archaeospora y el género Paraglomus [Morton & Benny, 2001] y por consiguiente en este trabajo fueron abordados, observando las regiones codificantes para ARNr 18S, 5.8S, y los espaciadores intergénicos U S l e US2. La utilización de hidrógeno como donante de electrones por muchas bacterias, con ayuda de hidrogenasas para la producción de ATP o para crecimiento autotrófico está ligada a muchas reacciones dentro de los ciclos biogeoquímicos, como se observa en el modelo que fue diseñado posterior al establecimiento de las reacciones enzimáticas. 6.2. MODELO CONCEPTUAL Una vez detectadas las vías bioquímicas para los procesos mencionados, se inició la búsqueda de los genes encargados de la codificación de sus enzimas, teniendo en cuenta que a pesar de que éstas medien las reacciones bioquímicas de una ruta metabólica particular y por ello pueden parecer semejantes, los nombres de los genes codificantes pueden variar entre organismos, como pudo observarse para las enzimas: rusticianina (Rus, rust), Nitrito reductasa (nrfA, nirB) y lacasa, entre otras. A partir de las fuentes de información recopiladas (vías bioquímicas, enzimas y genes), se diseñó un modelo conceptual (Figura 7) en el que se integraron las principales etapas de la actividad biológica en el retorno de los elementos químicos hacia el suelo, como un primer paso para el desarrollo del sistema de sondas moleculares, que permitiera seguir las dinámicas de dichos procesos. Esta forma de representación, permitió observar de una manera más explícita las vías de retroalimentación y de qué manera las alteraciones en alguno de sus componentes pueden afectar a los restantes. A continuación, se describen las diferentes zonas en que se divide el modelo (ver Figura 7), iniciando con el proceso de mineralización de la materia orgánica: La mineralización de la necromasa es un aspecto vital para el componente heterotrófico; en esta transformación, se liberan componentes en diferentes estados de degradación [Odum, 1972; Brock & Madigan, 1993] a partir de sustancias complejas que de esta manera pueden ingresar a un ciclo biogeoquímico, o ser aprovechados directamente y de forma inmediata por ia biota. Dentro del ciclo del carbono, se representa la actividad de los hongos micorrícicos en el retorno de materia desde el suelo hacia las plantas (uniendo dos compartimientos del ecosistema), la actividad de los organismos fermentadores y de otros microorganismos que degradan compuestos recalcitrantes como lignina, quitina, huminas y celulosa en sus constituyentes simples [Steffen et al., 2002; Muñoz et al., 1997; Metcalfe et al., 2002] y que aumentan de esta manera la velocidad de retorno de los diferentes elementos químicos. Otra forma de ingreso del carbono involucra el componente gaseoso, en donde éste es fijado a través de procesos fotosintéticos con mediación del oxígeno o de sustratos diferentes (fotosíntesis anoxigénica), u oxidado por bacterias carboxidotrofas [Drake et al., 2002; King, 1999]. Así mismo, se produce su retorno hacia la atmósfera en forma de metano, con la mediación de compuestos reductores como el hidrógeno [Valentine, 2002]. Otro ciclo que involucra a este último, es el del hierro, el cual exhibe formas de mayor o menor solubilidad de acuerdo a su estado de oxidación [Sobolev & Roden, 2002], lo que incide también en los ciclos del azufre y del fósforo, elemento éste, al que comúnmente se encuentra ligado [Vera et al., 2002]. El ciclo del nitrógeno también se ve afectado por el estado redox del sustrato, puesto que su retención o liberación, obedece a los niveles de saturación hídrica del suelo [Braker & Tiedje, 2003]; así, en suelos inundados o anóxicos predominan procesos de denitrificación [Braker & Tiedje, 2003] que tienen como resultado la pérdida del nitrógeno hacia la atmósfera, caso contrario a suelos bien drenados en donde son frecuentes los procesos de fijación de este elemento y su circulación en formas oxidadas [Zehr et ai, 2003]. Se encontró hace un tiempo, que la oxidación del hierro (II) está acoplada al proceso de denitrificación siguiendo la reacción: lOFeCOs + 2 NQ3 + 24H20 ---- > 10Fe(OH)3 + N2 + lOHCOf + 8 H+ [Zumft, 1997], Finalmente, el ciclo del azufre resulta ser bastante complejo debido a los diferentes grados de oxidación que puede presentar, y a la gran variedad de compuestos de los que forma parte; su trayectoria va desde compuestos muy oxidados como el sulfato, hasta formas gaseosas como el ácido sulfídrico, que domina en suelos reductores [Castro et al., 2002] y que condiciona su desaparición del ecosistema. Los elementos químicos considerados, pueden hacer parte tanto de vías degradativas, como de vías de construcción de estructuras biológicas, o simplemente de mecanismos de disipación de energía. La visualización esquemática de las enzimas involucradas en cada uno de los procesos mencionados, así como de los genes encargados de su codificación, facilitan el seguimiento y desarrollo de la Investigación, pues establecen un primer paso en la búsqueda de secuencias anotadas en las bases de datos, y permiten su actualización a medida que el conocimiento de la biología molecular de estos procesos es ampliada para un mayor número de organismos. Como se dijo anteriormente, los nombres de los genes codificantes suelen sufrir variaciones, por este motivo, se requiere efectuar búsquedas exhaustivas en las bases de datos, no solamente ingresando el nombre particular de un gen, sino también la actividad enzimática. Con la estrategia planteada fueron encontradas secuencias para 192 genes (ver Tabla 4). 6.3. APROXIMACIÓN FUNCIONAL El estudio fue proyectado para centrarse en la clasificación funcional más que en la taxonómica, puesto que la especialización microbiana se manifiesta más de forma bioquímica que morfológica. Ha sido un punto de vista discutido, sin embargo las razones son evidentes: 1. Aún se desconoce la existencia de un elevado porcentaje de microorganismos del suelo, con lo cual se pueden deducir iguales falencias en cuanto a su ubicación taxonómica; no es posible prever si nuevas secuencias reportadas pertenecerán a un grupo anteriormente descrito o constituirán un nuevo taxón. 2. El abordaje funcional es mas incluyente, permite asociar de manera más segura un organismo, aún cuando no haya sido anteriormente descrito, puesto que es más probable que un gen de gran importancia metabólica, exhiba regiones conservadas que ayudan en su identificación, aún en grupos diversos. Su variación estará condicionada por el tiempo de divergencia a partir de un ancestro común, y por ello las sondas a construir deben tener en cuenta diferentes niveles taxonómicos. 3. El diseño de sondas que permitan un abordaje taxonómico viable (es más difícil cubrir la totalidad de especies descritas), debe tomar en cuenta solo niveles de clasificación por encima de especie, ya que es conocido que bacterias que pertenecen a un mismo género, de hecho pueden diferir en cuanto actividades metabólicas específicas. 4. Debido al desconocimiento que persiste para la mayoría de géneros y especies del suelo, el abordaje taxonómico encasilla a los microorganismos dentro de un grupo fisiológico en particular. Por el contrario, en la naturaleza, es común que un organismo desempeñe diferentes funciones dependiendo de su hábitat y de variaciones ambientales específicas (historia de vida), por ello la aplicación taxonómica resulta ser restrictiva y excluyente. 5. El abordaje taxonómico también puede dejar de lado especies endémicas, nunca descritas y que pueden ser claves en la productividad del ecosistema gracias a su actividad. 6. La comunidad es una unidad funcional, con una estructura que es más variable que el tipo de metabolismo, las especies que la componen son hasta cierto punto intercambiables en tiempo y espacio (Fernández etal., 1999). Con lo anterior, se concluye que la evaluación funcional integral, permite visualizar de una manera más real el nivel de estabilidad de un ecosistema, en donde el suelo puede ser utilizado como un mecanismo que refleja su estado de salubridad. La evaluación de un proceso químico aislado no siempre resulta tan informativa en la detección de alteraciones, puesto que los organismos están asociados en comunidades bióticas, las cuales mantienen su unidad gracias a la interdependencia de sus miembros. La evaluación de la diversidad funcional en conjunto, permite establecer si un ecosistema es sustentable o ha sido gravemente disturbado, establecer grados de alteración y generar indicadores de niveles de recuperación o del estado sucesional en que se encuentra un ecosistema. Otra ventaja de este abordaje frente al procedimiento tradicional (cultivo en medios artificiales), es que a través de esta metodología, puede ser posible detectar la actividad biológica, aun cuando ésta sea muy reducida, incluso bajo umbrales que no pueden ser detectados por métodos convencionales, ya que por medio del uso de microarreglos se ha llegado a la detección de cantidades muy pequeñas de ADN, del orden de 10 pg (equivalente a aproximadamente 10^ copias) por blanco [Cho & Tiedje, 2002]. Por el contrario, si un organismo perteneciente a un grupo funcional, no crece en el medio de cultivo selectivo, existe la incertidumbre de si en realidad dicha función está ocurriendo en el suelo o no, o se trata tan solo de que aquellos grupos encargados de la misma no pueden ser aislados. 6.4. BASE DE DATOS A partir de la información de secuencias obtenidas en los bancos mundiales de datos como se menciona en la bibiografía, se creó una base de datos para consulta local, con 3668 entradas para ADN y 3955 entradas para proteína, escrita en lenguaje basic de OpenOffke, para las plataformas Windows y Linux, a la cual es posible acceder mediante una interfase gráfica que se despliega por 82 medio de la Suite OpenOffice, como se observa en las Figura 16 y 17, este programa es de tipo "Open Source" por lo cual se incluye en el CD adjunto. Acerca de BioPiocSuelos Este programa forma parte integral de la Tesis de Grado DISEÑO DE UNA ESTRATEGIA PARA LA EVALUACION DE ATRIBUTOS FUNCIONALES EDAFICOS MEDIANTE SONDAS DE ADN Bogotá D.C.. Colom bia O ctubre de 2 0 0 4 Ayuda Figura 16. Ventana de bienvenida a la consulta para la base de datos Bioproc_suelos. BloProcSi Sistema de Consulta a la Base de Dato r....MOLECULA - — — -— ------------------------ — AD N 1Seleccione Campo ry 1Seleccione Campo r* r — ----------■ ----------------- P r o t e ín a s _Ljjsel J l l 1 Seleccione Campo jJ ) -iJI : ' - -J JÜ 1 Seleccione Campo jj | Seleccione Campo JÜ Consultar Cancelar Figura 17. Ventana de consulta de la base de datos BioProc_suelos. Ayuda La base se encuentra dispuesta en formato CD, fue dividida en secciones correspondientes a los datos de proteína y de ADN, en la cual se consignó la información referente a los campos previamente seleccionados en la metodología, además de otros como información de ID de familia de proteína en la base ProDom, descripción general de la familia y la fuente a partir de la cual se obtuvo el ID de las secuencias. El análisis de la cantidad y calidad de los datos de la base, se presenta en las Figuras 8 a 13, que se consideran a continuación. La Tabla 3 muestra los géneros de microorganismos reportados en las bases de datos. Las gráficas 7 y 10 muestran una mayor cantidad de reportes de secuencias de ADN y proteína pertenecientes al Dominio Bacteria, frente a los Dominios Eukarya y Archaea; lo cual se justifica, debido a que la mayoría de estudios difundidos han estado dirigidos hacia este dominio en particular. Los informes de secuencias de hongos son más escasos y se limitan a grupos fisiológicos particulares como los ligninolíticos y los quitinolíticos, en donde su alta capacidad de degradación de compuestos recalcitrantes ha sido comprobada [Gutiérrez & Roncando, en línea]. Tradicionalmente, el Dominio Archaea ha sido asociado con hábitats extremos; posiblemente esta ha sido la causa de que muy poca atención haya sido puesta en el análisis de sus actividades en suelos. Sin embargo, empieza a reconocerse su presencia e importancia en ecosistemas terrestres [Basset et al., 1999; Borneman & Triplett, 1997; Kent & Triplett, 2002], Se cuenta también con una modesta representación de secuencias no identificadas más allá del nivel de dominio, indicio del desconocimiento que persiste en el área de la microbiología de suelos, en donde según ha sido señalado anteriormente, un mínimo porcentaje de microorganismos han sido aislados [Ovreas et al., 1998]. Existen aún un gran número de microorganismos edáficos por ser reconocidos y por ende muchos de los genes involucrados en ciclos biogeoquímicos por identificar y secuenciar; en tanto que la vasta mayoría de las secuencias referidas en las bases de datos pertenecen a organismos cuyos genomas han sido el foco de interés y definidos como organismos tipo. Los análisis moleculares filogenéticos de los genes norB, detectaron dos subgrupos separados: por una parte los organismos cultivados y por otra genes obtenidos de muestras ambientales, demostrando una discrepancia típica entre estos dos tipos [Braker & Tiedje, 2003]. Scala & Kerkhof [1999], también indican que no existe sobrelapamiento en las secuencias del gen nosZentre los microorganismos del grupo cultivado y las secuencias ambientales. Dado lo anterior, una mayor diversidad de grupos taxonómicos representados en las bases de datos, redunda en una mayor precisión en el desarrollo de herramientas que permiten la detección de los grupos funcionales, en sistemas complejos como el suelo. Sin embargo, es de esperarse que dada la importancia que las actividades enzimáticas requeridas en los ciclos de nutrientes tienen para los organismos que las llevan a cabo, las similitudes entre grupos de secuencias de ADN de diferentes organismos sean consistentes y que por lo tanto las secuencias consenso desarrolladas, permitan cubrir un amplio intervalo de éstas en los suelos. Por otra parte, se ha encontrado que el grado de conservación de los genes microbianos, es similar entre diferentes genomas y que alrededor de un 70% de los genes de cualquier organismo tiene homólogos en otros genomas [Peplies et al, 2003]. Otro aspecto relevante, es el relativamente escaso número de investigaciones que se relacionan con la microbiología del suelo, realizadas durante los últimos años. No obstante haberse encontrado entre los datos alrededor de 700 reportes de diversa índole que involucran a estos microorganismos, existen tan solo 35 investigaciones en donde el objetivo principal fue la microflora edáfica. Es llamativo encontrar que de estos reportes, alrededor del 90% han sido llevados a cabo en suelos de climas templados. Los conocimientos acerca de la biología molecular de microorganismos de suelos tropicales que han sido difundidos entre la comunidad científica, son poco numerosos, y no existen trabajos suficientes que aborden la existencia de endemismos que incluyan áreas relativamente pequeñas [Cho &Tiedje, 2000; Febles & González, 2002]. En las gráficas 8 y 11, se demuestra una mayor representación de la división Proteobacteria respecto a otros grupos, esto se debe a que son bacterias que despiertan gran interés y que han sido ampliamente estudiadas fisiológica y filogenéticamente, en primer lugar, por su capacidad oxidativa de metano [Lucchini etal., 2001; Morris et al., 2002]; en segundo lugar, la enzima clave de este proceso, la metano oxigenasa (pmoA) ha mostrado estar relacionada filogenéticamente con otra enzima prioritaria, la amonio monooxigenasa (amoA) [Lucchini etal, 2001; Morris etal, 2002] y esto ha despertado gran interés. El elevado número de secuencias reportadas, procedentes de estos dos genes son la causa de este fenómeno (secuencias de ADN reportadas para amoA, 156; para pmoA, 99; secuencias de proteína reportadas para los genes amoA, 154; para pmoA, 109). Las gráficas 9 y 12, indican una escasa representación de géneros microbianos entre las secuencias de ADN y proteína registradas en las bases de datos. Por ejemplo, en la figura 10 se puede observar que más del 80% de los géneros exhibe un escaso número de secuencias, los genes bgxA, abg, ce/A, ce/C, celY, chi92, pchA, sat, para los que se registra solo una secuencia, no pudieron ser incluidos en el análisis, mientras que otros genes mostraron solo dos secuencias, lo cual es insuficiente para la obtención de consensos adecuados para el desarrollo de sondas [Taroncher et al., 2003]. Un comportamiento similar se observa para las secuencias de proteína. El número y calidad de las secuencias evaluadas, es un factor de suma importancia en el diseño de oligonucleótidos, puesto que la evaluación de un número adecuado de secuencias permitirá así mismo, apreciar la mayor cantidad posible de sus variantes y con ello, la probabilidad de recuperación en una muestra de suelo de secuencias relacionadas con una vía metabólica en particular, se incrementa. Uno de los principales obstáculos encontrados, fue la ausencia de reportes de secuencias referentes a algunos procesos enzimáticos de los ciclos del nitrógeno y azufre: oxidación de nitrito, oxidación de azufre elemental, oxidación de sulfito y oxidación de APS, entre otros. A pesar de los esfuerzos realizados para la comprensión de los procesos ocurrentes en los suelos, la aún escasa aplicación de metodologías moleculares en el área de suelos, no ha permitido acelerar el proceso de conocimiento de los diversos genomas presentes en ellos, como primer paso para la detección de secuencias codificantes de enzimas involucradas en ciclos biogeoquímicos. Sin embargo, la aplicación de estrategias de minería de datos como es el caso de la presente investigación, permiten identificar carencias en estos campos y por lo tanto pueden ayudar a focalizar los nuevos estudios hacia áreas que aún no han sido abordadas. Cuando los alineamientos obtenidos fueron observados en una escala taxonómica encima del nivel de familia (en donde se espera una alta divergencia de secuencias), aún se encontraron secuencias consenso muy similares a las de niveles inferiores (napA, narH, nosZ, y anfDentre otros, evaluados al nivel de división), lo que puede revelar eventos de transferencia horizontal de genes, como se ha comprobado para la enzima sulfito reductasa desasimiiativa (dsrAB), Adenosin-5-fosfosulfato reductasa (apsA) [Friedrich, 2002; Wagner et al, 1998], lignin peroxidasa {Hp) [Stewart & Cullen, 1999], el grupo de genes /7/r (nitrito reductasa) [Braker et al., 1998] y para el gen nap (nitrito reductasa periplásmica) [Moreno et al., 1999], ya que estos eventos son relativamente frecuentes [Prozorov, 2001], incluso entre bacterias y hongos [Zumft, 1997]. Dado que las partículas de arcilla pueden proteger al ADN liberado de ser degradado por nucleasas, el hecho puede facilitar la transformación de células bacterianas competentes [Nannipieri et a l, 2003]; el fenómeno también puede ser causado por un alto grado de conservación de secuencia, a pesar de las grandes distancias evolutivas que pueden separar estos grupos. Friedrich [2002], ha sugerido otro planteamiento para explicar este tipo de fenómeno en los genes dsrAB, indicando que éstos pueden ser parte de islas metabólicas móviles. Las APS reductasas desasimilativas muestran homología con las succinato y fumarato reductasas, mientras el tipo asimilativo se ha relacionado con la superfamilia CysH. Así, las dos clases de la enzima, que llevan a cabo reacciones catalíticas similares, pueden tener orígenes evolutivos diferentes [Bick et al, 2000]. 6.5. ANÁLISIS DE LAS HERRAMIENTAS Y CRITERIOS BIOINFORMÁTICOS En la búsqueda efectuada en las 3 principales bases de datos mundiales, fueron seleccionadas aquellas secuencias codificantes relacionadas con las vías metabólicas de interés; elementos en Cis y secuencias STS no fueron evaluadas, debido a que en primer lugar, las STS son secuencias relativamente inseguras, altamente redundantes y que pueden constituir contaminantes o artefactos de la clonación [Schuler, 1997], por otra parte, las secuencias en Cis, corresponden a elementos controladores que participan en eventos de replicación, transcripción y traducción [Lewin, 2001]. Dado que para la detección de la actividad microbiana relacionada con los ciclos deberá hacerse acopio de transcritos, estos elementos no fueron considerados. Adicionalmente, la falta de conocimiento acerca de muchos de los elementos reguladores para las diversas rutas metabólicas hacen de momento incierta su utilización. Se decidió utilizar ambos tipos de secuencias, ADN y proteína, con el objetivo de obtener resultados más consistentes y en algunos casos complementarios. Es necesario tener en cuenta que, dado que las proteínas son un producto funcional del gen, la preservación de su secuencia es crítica, por esta razón, resulta ser de mayor utilidad su evaluación a diferentes niveles taxonómicos, en tanto que las secuencias de ADN pueden ser más útiles cuando se analizan relaciones en categorías por debajo de familia o en secuencias que se sabe que evolucionan muy lentamente [Alyar, 2001]. Se prefirió la utilización del sistema de recuperación de secuencias de Lion Bioscience, debido a que ofrece una mayor flexibilidad para la formulación de búsquedas, al permitir la inclusión de re/eases y updates de las diferentes bases de datos de manera separada y la realización de búsquedas más complejas gracias a las posibilidades de cruzar diferentes bases de datos. Así mismo, los campos de búsqueda se amplían incluyendo colecciones de cultivos y listados taxonómicos cuando así se requiere. Se realizaron variaciones en los grados de rigurosidad para los parámetros de alineamiento de Clustal X, con la finalidad de reducir el número de espacios (gaps) y desapareamientos requeridos, pues la inserción de espacios realizada de manera indiscriminada puede generar consensos cuya ocurrencia natural es poco probable. Para algunos casos, las mayores penalizaciones tanto de apertura de espacios como de extensión, produjeron regiones que visualmente mostraron alto grado de similitud (diagrama de barras de ClustalX), respecto a otras combinaciones menos estrictas. Debido a que las regiones del ADN que representan sitios activos de la proteína tienden a ser más conservadas, los costos de apertura y extensión mayores tenderán a hacer evidentes este tipo de regiones, a diferencia de áreas de la proteína que pueden permitirse una mayor flexibilidad y que por lo tanto tenderán a variar mayormente a lo largo de su evolución, debido a la acumulación de mutaciones, fenómenos de recombinación, etc. [Prozorov, 2001]. Este tipo de secuencias puede llegar a hacerse visible con la disposición de parámetros menos exigentes (costos de aperturas y extensiones más moderados), aunque se corre el riesgo de generar secuencias consenso laxas, a costa de insertar y extender espacios de una manera que no pudo ocurrir en el transcurso evolutivo. La estrategia utilizada durante la investigación, fue la alineación de todas las secuencias, sin importar su nivel de relación, utilizando los parámetros por defecto los cuales prevén una baja penalización (10 para apertura y 0.2 por extensión, para una escala entre 0-100), arrojando una aproximación inicial. Posteriormente, las condiciones fueron modificadas a un valor de penalización de 80 para apertura y 70 para extensión, para aquellas secuencias taxonómicamente más cercanas. Esto es justificado, debido a que la colocación de espacios (gapi) en alineamientos entre secuencias estrechamente relacionadas, es mucho más segura que entre las más distantes, puesto que el intervalo de valores de penalización que pueden encontrar la solución correcta o la mejor posible es muy amplio [Thompson et al, 2003]. Por el contrario, con secuencias muy divergentes, los puntajes dados a residuos no idénticos deben elegirse cuidadosamente. Además, las diferencias de tamaño entre las secuencias pueden resultar contraproducentes si no se penaliza debidamente la inserción de espacios, dado que el programa tenderá a igualar en tamaño a las secuencias a través de la inserción y extensión de espacios [Thompson et al, 2003]. Para secuencias de proteína, la elección de bajos niveles de penalización resulta ser aún más crítica, puesto que los espacios (gaps) no ocurren aleatoriamente, sino más a menudo entre los principales elementos estructurales secundarios de las hélices alfa y de las hojas beta, que a su interior [Thompson e ta l, 2003]. Dado que los cladogramas arrojados por el subprograma NJPLOT de ClustalX fueron utilizados para encontrar secuencias consenso por grupos de similitud de secuencias, esto permitió un máximo aprovechamiento de la información mostrada por los alineamientos. Esta aproximación reduce la generación de lo que podría considerarse como ruido, pero que no es más que la presencia de subgrupos de secuencias similares entre sí pero divergentes al ser comparadas con otros subgrupos. Su extracción puede ser muy costosa desde el punto de vista de pérdida de información, por tal motivo deben ser reservadas para posteriormente ser tomadas como variantes del gen que pueden ser de utilidad en el diseño del método. Basándose en el hecho de que ClustalX alinea en primer lugar aquellas secuencias que presentan mayor similitud, se deduce que aquellas más divergentes, resultan más difíciles de alinear de manera correcta, por lo tanto, se considera que es mejor retardar su incorporación hasta que las primeras secuencias hayan sido alineadas. Esto brinda una mejor oportunidad de que la decisión de introducir los espacios (gaps) entre las posiciones menos conservadas sea correcta, por tal motivo, el parámetro de retardo que por defecto se encuentra configurado al 30% de identidad, fue modificado incrementándolo al 40%. Para las secuencias de proteína se propuso un esquema similar de penalizaciones, pero adicional mente, fue necesario considerar el tipo de matrices de puntuación utilizado. Debido a que las matrices PAM son mas sensibles para alineamientos de secuencias homologas, se utilizó el valor por defecto para ClustalX (PAM350), con el fin de realizar los alineamientos preliminares; luego, de manera selectiva y de acuerdo al nivel taxonómico de agrupación, se probaron las matrices PAM40 y PAM120 para secuencias más cercanas en su jerarquía taxonómica (como aquellas pertenecientes a una misma familia) o aquellas más lejanas, respectivamente. Se evaluaron los resultados de manera comparativa, para obtener el alineamiento con regiones más conservadas, menos espacios intercalados y el mayor costo de penalización. La utilización de varios parámetros es soportada por las recomendaciones realizadas por Thompson etal. [2003], quienes indican que cuando las distancias mutacionales entre las secuencias son desconocidas, se deben correr por lo menos tres búsquedas utilizando estos criterios. La matriz Blosum utilizada, fue aquella establecida por defecto para ClustalX (Blosum 62). De acuerdo a lo reportado por Lassman & Sonnhammer [2002], las diferencias entre los programas Clustal y Tcoffee es escasa (5% en promedio); a pesar de lo cual, los datos fueron también probados con este último obteniendo las ventajas de ambos métodos, dado que Tcoffee realiza el alineamiento dos veces, una primera con el programa ClustalW (más útil cuando se quiere comparar una secuencia en toda su extensión) y una segunda con el programa Lalign (alineamiento local, lo que permite un alineamiento más acorde con la presencia de motivos), a partir de los cuales genera una librería seguida de la comparación simultánea de las secuencias. Tcoffee presenta la desventaja de que en la versión actual, no permite el alineamiento de un número de secuencias mayor a 50, que presenten una longitud promedio de 160 residuos, ya que genera mensajes de error. El alineamiento por Tcoffee fue realizado con los parámetros por defecto, tanto para ADN como para proteína, con la finalidad de cubrir las deficiencias que pudieran presentarse con la sola utilización de ClustalX. Sin embargo, para que los alineamientos produjeran buenos resultados, fue necesario filtrar aquellas regiones de baja complejidad, de acuerdo a lo recomendado por Notredame etal., [2000]. Las secuencias consenso fueron ingresados en el programa BLAST (BlastN y BlastP) para la búsqueda de secuencias similares, un ejemplo de salida está dado en la Figura 18. Dado que la especificidad de la asociación prueba-blanco depende del grado de divergencia de la secuencia, la cual puede ser muy alta entre genes blanco en poblaciones naturales [Pearson, 2001], es necesario seleccionar un nivel de significancia para similitud muy bajo (<0.01), con el fin de disminuir el riesgo de hibridización cruzada. Debido a que el número de entradas de la base de datos del NCBI es muy grande, el valor umbral debe ser lo más bajo posible, puesto que E se incrementa linealmente con el número de entradas [Pearson, 2001]. El valor de significancia estadística seleccionado se consideró adecuado, puesto que una disminución demasiado grande puede aumentar el riesgo de cometer error estadístico tipo II, el cual debe ser minimizado. Sequences pr-oriucinq siqnificant alignaents: gi|5713167lgbl«F165921.1|0F165921 GI oimis brasilianun» strain... gl|5713168|gb|AF165922.1 |ftF165922 G l o w s brasilianun strain... gi|5713166|gb|AF165920.1|AF165920 Gloiws brasilianu* strain... gi|5713165|gb|l»Fl6S919.1| AF165919 Glonus brasili¿nun strain... gl|571316*|gb|flF165910.1|W165918 Glowis brasilianun strain... gi (22098271gb jUB 1987.1 (GOUS1987 Glonus occultum strain GR58... gi|6093125|enbJAJ012112.2|6BR012112 Glonus brasiliaou» 5.8S... gi j3299*927|dbj|ftK109710.1| Oryza sativa (japónica cultivar... gi¡288*309M|gb|WCBHK/HH.9| Hnno sapiens chronoso» 19 clon#... gi¡1*509603jgb|AC01916*.9¡ Hono sapiens BAC clone RP11 1*6J... gi¡2l952878|dbj|BP88*36*-*| Oryza sativa (japónica cultiua»*... gi|188«»*785|dbj|AP003291.3| Oryza sativa (Japónica cultivar... gi17131*551gb|AC009*2*.21AC 009*2* Mono sapiens, clone RP11-... gi|136999981dbjjAP8028*6.2 | Hono sapiens genonic DHft, chron... gl|1«SWliil|íM|IU.r<NI/6S.l8| Human ONfi sequence fron clone ... Score E (bits) Ualue *8 *8 *8 *8 *8 *8 *8 3* 3* 3* 3* 3* 3* 3* 8* 2e-ft* 2 e 0* 2e-8* ?e-8* 2e-0* 2e-«J* 8.059 3.7 3.7 3.7 3.7 3.7 3.7 3.7 3.7 Alignnents >gi(5713167Jgb18F165921„1|AF165921 G l o w s brasilianun strain UU22* clone 1* 18S ribosonal RNA gene. partial sequence; internal transcriben spacer 1, 5.8S ribosonal RNA gene and internal transcribed spacer 2, conplete sequence; and 26S ribosomal RHA gene, partial sequence Lcnyth - 525 Score - *8.1 bits (2*>, Expect - 2c-tt* Identities - 2*/2* (180*) Strand * Plus / Plus Qvery: 1 gtagtycacaatgaatagcgcggg 2* 1111111 tti 11111111111111 Sbjct: 3*6 gtagtgcacaatgaatagcgcggg 369 *i Figura 18. Salida del programa BlastN del NCBI. 6.6. DISEÑO DE OLIGONUCLEÓTIDOS Luego de la evaluación de especificidad de las secuencias de ADN, se debió determinar la homogeneidad del perfil termodinámico, así como la de su estructura secundaria, con base en las recomendaciones reportadas para el diseño de oligonucleótidos. La energía libre de Gibbs, fue calculada por el programa a través del método del vecino más cercano (Nearest-Neighbor) de Breslauer et al. [1986] para ADN y dado que la energía de un oligo a temperatura T, mide la tendencia de éste a hibridizar con su pareja perfecta sobre un gen blanco Sugnet [1999], un valor fuertemente negativo indica que el oligo tiende a hibridizar espontáneamente con su pareja a una temperatura T. Al incrementarse la temperatura, AG crecerá hacia cero [Rahman, 2004]. Se optó por la selección de oligos que tuvieron una temperatura de fusión uniforme (Tm promedio de 73°C), valores de energía libre negativos (en promedio -45 kcal/mol) y longitudes alrededor de las 26 bases (ver Anexo 1). En cuanto a este último factor, se ha comprobado que a medida que la longitud de la sonda se incrementa, tiende a perderse la capacidad de discriminar desapareamientos; en tanto que si su longitud es escasa, la intensidad de la señal de hibridización en un microarreglo decrece ostensiblemente (Zhou & Thompson, 2002). La presencia de estructuras secundarias, resulta de importancia crítica para el proceso de hibridización in vitro, puesto que las asas en hairpin, los dímeros y otras formas de autohibridización, compiten por la sonda con la secuencia blanco. Lo anterior, impide un correcto apareamiento entre ellas, lo que recae sobre la intensidad de señal del microarreglo. La estabilidad de este tipo de formaciones fue evaluada a través del valor de energía libre de Gibbs que poseían dichos enlaces. Las sondas fueron recortadas o eliminadas de acuerdo a la adaptación que presentaron respecto a todos los criterios definidos. Posterior a este proceso, se efectuó un nuevo análisis BlastN en la base de datos del GenBank, con el fin de determinar si su especificidad inicial fue conservada, luego del acortamiento de las secciones. Referente a la categoría de las sondas que pudieron ser diseñadas, al menos de manera teórica, sería posible la detección de 73 genes de los 192 valorados inicialmente, con ayuda de 191 oligonucleótidos. Este número equivale al 38% de la población total. Con lo cual se confirma nuevamente la necesidad de intensificar esfuerzos hacia el reconocimiento de nuevas secuencias en suelos. De esta población de oligonucleótidos se destacan aquellos que pudieron ser diseñados para los géneros Paragtomus y Archaeospora, miembros recientes de las endomicorrizas, entre estos se incluyen sondas para los genes ARNrl8S (2), 5.8S (1), para los espaciadores intergénicos ITS1 (2) e 1JS2 (3), que constituyen un nuevo reporte. Los oligonucleótidos fueron diseñados partiendo de la agrupación de secuencias procedentes de diferentes niveles taxonómicos, que pudieran permitir la detección de una actividad enzimática en suelos, de ser posible a una jerarquía taxonómica superior (Dominio); sin embargo, esto está condicionado por la variabilidad de secuencia que puede generarse en las categorías inferiores. Así que finalmente se consiguieron oligonucleótidos que están orientados a la distinción de un grupo funcional en particular a nivel de Reino, División, Clase, Orden, Familia y en algunos casos en que no pudo ser más amplio, a Género. En la Figura 14, se indica el número de sondas que podrían ser utilizadas en la captura de organismos por debajo de determinado nivel taxonómico, se destaca que para los genes bglA, chiA, chil y LiP, las sondas podrían ser utilizadas en la captura de organismos por encima del nivel de dominio. Además, los genes anfG, anfK, tacasa, narG, nifD, dsrA y vnfK, referidos en la base de datos de oligonudeótidos (ver Anexo 1) para jerarquías por debajo de dominio, ofrecen posibilidades para la detección de secuencias no identificadas aún. Para el primer caso, el número resulta pobre al comparar la gran cantidad de genes evaluados, las causas, relacionadas con el desconocimiento de una mayor variedad de secuencias y a diferentes niveles taxonómicos, ya han sido analizadas. En otros niveles taxonómicos, la representatividad es alta, destacándose los grupos de genes que pueden ser analizados al nivel de división; este nivel de resolución es bueno y en muchos casos suficiente. Al nivel de familia podría detectarse el mayor número de secuencias (49). La Figura 15, muestra la representación de secuencias traducidas a partir de proteína, que pueden llegar a ser utilizadas para la captura de genes en los niveles taxonómicos superiores como Orden e incluso Dominio. Al primer nivel, se podría brindar información acerca de muchos de los grupos funcionales microbianos en suelos, que llevan a cabo funciones como la oxidación de amonio (amoA), la celulólisis (ce/F), la reducción de C02 a metano (mcrA), la fijación de nitrógeno {riifD y nifK), la reducción asimilativa de nitrato (nasA) y la denitrificación (nosZ). A niveles inferiores a dominio, sería posible detectar secuencias para genes codificantes de la reducción desasimilativa de sulfito (dsrB) y oxidación de amonio (amoB). Como se indicó en la metodología, siempre existe la posibilidad de que las sondas planteadas, presenten hibridizaciones entre ellas, por lo cual se hace necesario examinar dicha característica. Su evaluación permitió eliminar algunas de las secuencias que presentaron regiones comunes para el mismo gen, y facultó la detección de dos sondas con regiones redundantes entre genes diferentes (Iccl y chil), las cuales fueron señaladas en la base de datos. Este tipo de factores deben ser tenidos en cuenta al momento de diseñar el microarreglo, puesto que se podría presentar hibridizaciones competitivas in vitro, que causarían alteraciones en la interpretación de las señales. El reconocimiento de similitudes entre las secuencias diseñadas y motivos de proteína ya existentes, procedentes de la base ProDom, fue efectuado por medio del programa BLASTX, el cual indicó coincidencias para algunas de las secuencias, aunque otras no se hallaban reportadas. Esto significa que pudieron haberse encontrado motivos de proteína para los genes subrayados en el anexo 3, que no tenían reporte en la base ProDom, los cuales deben ser evaluados profundamente. más Los microarreglos basados en grupos funcionales, permiten diferenciar entre la diversidad conocida de blancos de ADN y la parcialmente desconocida, con una alta identidad de secuencia. Por esta razón, es muy probable que las secuencias tipo o consenso puedan ser de ayuda en la captura de genes que incluyan el universo de microorganismos hoy inexplorado, a medida que la diversidad de secuencias codificantes para un gen se incrementa. Esta investigación proporciona bases acerca de la factibilidad de realizar una aproximación utilizando esta vía metodológica. Si se desea detectar un grupo taxonómico en particular al nivel de resolución deseado, se puede hacer uso de las regiones consecutivas a la zona consenso que en los alineamientos no mostraron similitudes entre sí, para el diseño de cebadores, debido a que son exclusivas de cada una de las secuencias. Un proceso posterior de secuenciación podría facilitar el acceso a nuevas secuencias de organismos desconocidos, y potenciar así la adquisición de nueva información. A medida que la tecnología de los microarreglos se perfecciona, la opción de prescindir de la amplificación por PCR y utilizar directamente el ADN aislado del suelo puede permitir la cuantificación de la actividad biológica evaluada, ampliando la información obtenida. Las secuencias de aminoácidos que identifican motivos de proteína, y cuya traducción a ADN no pudo ser realizada de la manera descrita, pueden tener aplicación en otro tipo de herramientas. Los arreglos de proteína son un campo que comienza a hacerse extenso [Joos, 2004] y aunque las aplicaciones actuales son más restringidas que para el ADN, es posible que el tiempo permita ampliarlas, razón por la cual se incluyeron en la base de datos. La metodología planteada, el abordaje, el tratamiento y el análisis practicado a los datos, pueden hacerse extensivos a otras áreas de la ciencia diferentes a la microbiología de suelos, con lo cual su incidencia es más amplia. Los razonamientos aquí aplicados para la utilización de las herramientas bioinformáticas, pretenden ser de utilidad en la toma de decisiones para otras situaciones. La consecución de los objetivos planteados en esta y otras investigaciones, permiten sustentar que existen otras vías efectivas para la construcción de conocimiento, que incluyen el aprovechamiento de información existente y aparentemente inconexa, en la creación de aplicaciones. CONCLUSIONES 1. Se estableció una vía metodológica diferente a la microbiológica clásica como aproximación al estudio de la dinámica biológica en suelos, con base en la minería de datos, la cual tiene aplicación en la evaluación de atributos funcionales del suelo, tales como la diversidad bioquímica y los ciclos minerales en los que participan los microorganismos en diversos ecosistemas terrestres. 2. Se analizaron las diferentes etapas del proceso, además de los aciertos y dificultades ofrecidos por las herramientas bioinformáticas utilizadas. 3. Se propusieron algunas enzimas mediadoras en 13 grandes procesos bioquímicos, como marcadores potenciales para el seguimiento de la dinámica biológica en suelos, entre estos se cuentan: la reducción de sulfato, oxidación de compuestos azufrados, metanogénesis, carboxidotrofía, oxidoreducción de hierro, reducción de nitrato, nitrito, óxido nítrico, óxido nitroso, amonificación, nitrificación y fijación de nitrógeno, fundamentada en la información existente en cuanto a su función, ubicación, tipo de aplicación, presencia en diferentes organismos, reportes de posibilidad o uso como marcador. 4. Fue posible sugerir 192 marcadores para las enzimas elegidas, seleccionados por estar comprometidos en los principales procesos bioquímicos del ecosistema suelo. A partir de las secuencias, se diseñaron 183 oligonucleótidos representativos de 73 genes. 5. Se diseñaron 8 sondas específicas para dos nuevos géneros de micorrizas arbusculares, 6 de ellas para el género Paragtomus y 2 para Archaeospora. Tales oligonucleótidos constituyen nuevos reportes para los genes ARNrl8S (2), 5.8S (1) y para los espaciadores intergénicos ITS1 (2) e ITS2 (3) de estos grupos. 6. Se desarrolló un modelo conceptual que presenta de una manera interrelacionada los principales aspectos de los ciclos del carbono, nitrógeno, azufre e hierro, facilitando de esta forma, la visualización de las enzimas y genes codificantes que han sido reportados hasta el momento. Es una iniciativa útil para la comprensión holística de las funciones que se cumplen en el suelo y que son el sustento del ecosistema. 7 . El modelo conceptual también posibilita un abordaje de la ecología del suelo, a través de la observación de las relaciones causa-efecto entre los componentes microbianos, la predicción de la estabilidad de un ecosistema con base en el componente edáfico, y la detección de actividades metabólicas sin necesidad de conocer la identidad de los microorganismos presentes. 8. Se discutieron las ventajas y consideraciones observadas para optar por el abordaje funcional y no taxonómico. 9. Se recopiló una base de datos de 3668 entradas para ADN y 3955 entradas para proteína, la cual puede ser actualizada para su utilización en el área de la microbiología de suelos; permitiendo por medio de un motor de búsqueda, acceder a información relevante de las secuencias como: fuente (ADN, proteína), función, accesión, secuencia (nucleótidos o aminoácidos), longitud, organismo, descripción, datos taxonómicos. 10.La herramienta de evaluación que se obtenga a raíz de la metodología desarrollada, podría emplearse en el análisis funcional de todo tipo de suelos, debido a que en su diseño se han tenido en cuenta organismos procedentes de diferentes regiones geográficas y hábitat. H .E l desarrollo de las sondas para los genes bg/A, chiA, chil y LiP, podría resultar de utilidad en el estudio general de procesos como celulólisis, quitinólisis y ligninólisis en suelos, debido a que se abarcó toda su jerarquía taxonómica. Genes como aquellos para la oxidación de amonio, fijación de nitrógeno, reducción de nitrato y reducción de sulfato, podrían ser evaluados a niveles inferiores a dominio. 1 2 .Durante la investigación, fueron obtenidas cinco sondas que podrían permitir la detección separada de los procesos mediados por los genes pmoA y amoA, los cuales habitualmente han ofrecido dificultades para la distinción de sus actividades en suelos. 1 3 . Las sondas desarrolladas pueden ser empleadas en la búsqueda de secuencias de microorganismos edáficos que no han sido previamente aislados, como una forma de incrementar las posibilidades de ser representadas en los análisis, adicionalmente a la inclusión de las secuencias moleculares obtenidas a partir de la búsqueda a través del SRS. RECOMENDACIONES 1. Se recomienda, la utilización de una herramienta de búsqueda de secuencias que permita la elección de las tres principales bases de datos internacionales, puesto que a pesar del intercambio diario que realizan entre ellas, existen diferencias debido a la inclusión de los releasesand updates. 2. Se requiere intensificar la investigación dirigida hacia el área de la microbiología de suelos, con énfasis especial en la detección y secuenciación de genes relacionados con los ciclos de la materia, para de esta manera, asegurar que las sondas de ADN desarrolladas en un futuro, tengan mayores posibilidades de detección de una amplia gama de microorganismos pertenecientes a un grupo funcional. 3. Se propone la ampliación de estudios edáficos hacia el reconocimiento del dominio Archaea y su importancia en los suelos; de manera que se profundice en el conocimiento de su diversidad metabólica, la cual ha estado comúnmente orientada a la contribución que el grupo tiene en la producción de metano. 4. Debido a que la variedad de géneros y secuencias reportadas para algunos genes, es en muchos casos escasa y en otras inexistente, se debe reevaluar el enfoque que han tenido los estudios de suelos a microorganismos tipo, ampliando el conocimiento hacia organismos diferentes y hada genes que no han sido secuenciados. Por ejemplo, puede ser importante conocer los organismos involucrados en el ciclo del hierro en suelos drenados, en donde las variaciones en el nivel freático y de saturación, pueden generar micronichos para actividades de oxidorreducción; o el caso de genes para la oxidación de nitrito, azufre elemental, sulfito y APS, entre otros, los que a pesar de estar bien documentados, no presentaron reportes de secuencias. 5. En cuanto a la aplicación de herramientas bioinformáticas, como puede deducirse de este estudio, es recomendable hacer un análisis previo y profundo, sobre las posibilidades de aplicación que puede ofrecer un programa, su nivel de resolución, mecanismos para aumentar su precisión, parámetros que ofrece, etc., con ei fin de seleccionar los que resulten más adecuados y que brinden la mayor información. 6. Se sugiere recopilar información acerca de los cebadores que han sido reportados para estas enzimas, especialmente en lo referente a su especificidad génica y su capacidad de amplificación de variantes, con el fin de determinar, si se require construir nuevos iniciadores o realizar combinaciones de ellos. 7. Se plantean otras posibilidades de abordaje en el desarrollo de este tipo de sondas, por ejemplo, partiendo de información molecular acerca de motivos y dominios que ofrecen las bases de datos como ProDom, Pfam, etc. 8. Por último, se sugiere la continuación de este estudio en otras etapas, donde se evalúe la especificidad in vitro de las sondas señaladas, se realice la estandarización tanto del proceso de extracción de ADN total de los microorganismos presentes en muestras de suelos, como de la retrotranscripción a partir del primero. Así mismo, se plantee la inclusión de las diferentes variantes de las regiones conservadas para establecer la disposición del microarreglo y su factibilidad de implementación. BIBLIOGRAFÍA ♦ Aakra A., Utaker J.B. & Nes I.F. 2001. Comparative phylogeny ofthe ammonia monooxygenase subunit A and 16S rRNA genes o f ammonia-oxidizing bacteria. FEMS Microbiology Letters, 205:237-242. ♦ Alien A.E., Booth M.G., Frischer M.E., Verity P.G., Zehr J.P. & Zant S. 2001. Diversity and Detection o f Nitrate Assimiiation Genes in Marine Bacteria. Applied and Environmental Microbiology, 67(ll):5343-5348. ♦ Alyar A. 2001. Methods in Molecular Biology, vol. 132: Bioinformatics Methods and Protocols. Ed. S. Misener & S.A. Krawetz. Humana Press Inc., Totowa NJ. ♦ Amann R., Ludwig W. & Schleifer K. 1995. Phylogenetic Identification and In Situ Detection of IndividualMicrobial Cells without Cultivation. Microbiological Reviews, 59(1): 143-169. ♦ Antipova A.A., Tamayo P. & Golub T.R. 2002. A Strategy for OUgonudeotide Microarray Probe Reducthn. Genome Biology, 3: 0073.1-0073.4. ♦ Bang S.W., Clark D.S. & Keasling J.D. 2000. Engineering Hydrogen Sulfide Production and Cadmium Removal by Expression ofthe Thiosulfate Reductase Gene (phsABC) from Salmonella enterica Serovar Typhimurium in Escherichia coli. Applied and Environmental Microbiology, 66 (9): 3939-3944. ♦ Basset D.E., Eisen M.B. & Boguski M.S. 1999. Gene Expression Informatics -It's ail in your mine. Nature Genetics, 21 suppl: 51-55. ♦ Bayer E.A., Chanzy H., Lamed R. & Shoham Y. 1998. Cellulose, Cellulases and Cellulosomes. Current Opinión in Structural Biology, 8:548-557. ♦ Bhanot G., Louzoun Y., Zhu J. & DeLisi C. 2003. The Importance o f Thermodynamic Equilibrium for High Throughput Gene Expression Arrays. Biophysical Journal, 84:124-135. ♦ Bick J.A., Dennis J.J., Zylstra G.J., Nowack J. & Leustek T. 2000. Identification ofa New Class o f S’-Adeny/ylsulfate (APS) Reductases from Sulfate-Assimilating Bacteria. Journal of Bacteriology, 182(1):135-142. ♦ Borneman J., Skroch P., O'Sullivan K., Palus J., Rumjanek N., Jansen J., Niehuis J. & Triplett E. 1996. Molecular Microbial Diversity o f an Agricultura! Soil in Wisconsin. Applied and Environmental Microbiology, 62(6): 1935-1943. ♦ Borneman J. & Triplett E. 1997. Molecular Microbial Diversity in Soils from Eastern Amazonia: Evidence for Unusual Microorganisms and Microbial Population Shifts Associated with Defbrestation. Applied and Environmental Microbiology, 63(7): 2647-2653. ♦ Bourne D.G., McDonald I.R. & Murrell J.C. 2001. Comparison o f pmoA PCR Primer Sets as Tools for Investigating Methanotroph Diversity in Three Danish Soils. Applied and Environmental Microbiology, 67(9):3802-3809. ♦ Braker G., Fesefeldt A. & Witzelpplied K.P. 1998. Development o f PCR Primer Systems for AmpUfícation o f Nitrite Reducíase Genes (nirK and nirS) To Detect Denitrífying Bacteria in Environmental Samples. Applied and Environmental Microbiology, 64(10): 3769-3775. ♦ Braker G. & Tiedje J.M. 2003. Nitric Oxide Reducíase (norB) Genes from Puré Cultures and Environmental Samples. Applied and Environmental Microbiology, 69(6):3476-3483. ♦ Breslauer K.J., Franks R., Blockers H. & Marky L.A. 1986. Predicting DNA Dúplex Stability from the Base Sequence (Nearest-neighbor interactions/DNA structure/thermodynamics). Proceedings of the National Academical Sciences USA, 83:3746-3750. ♦ BrockT.D. & Madigan M.T. 1993. Microbiología. Sexta edición. Prentice Hall Hispanoamericana, S.A., Naucalpán de Juárez, México. ♦ Browning D.F.,Beatty C.M.,Wolfe A.J.,Cole J.A. & Busby S.J. 2002. Independent Regulation of the Divergent Escherichia coli nrfA and acsPl Promoters by a Nudeoprotein Assembly at Shared Regulatory Región. Molecular Microbiology, 43(3):687-701. ♦ Brüser T., Selmer T. & Dahl C. 2000. ADP Sulfurylase from Thiobacillus denitrificans is an Adeny/ylsulfate: Phosphate Adenylyltransferase and Belongs to a New Family o f Nudeotidyltransferases. Journal of Biology and Chemistry, 275(3): 1691-1698. ♦ Buckley D.H., Graber J.R., & Schmidt T.M. 1998. Phylogenetic Analysis o f Nonthermophilic Members ofthe Kingdom Crenarchaeota and their Diversity and Abundance in Soils. Applied and Environmental Microbiology, 64:4333-4339. ♦ Burke R.A. Molina M., Cox J.E., Osher L.J. & Piccolo M. 2003. Stable Carbón Isotope Ratio and Composition o f Microbial Fatty Acids in Tropical Soils. Journal of Environmental Quality, 32:198206.2. ♦ Cabrera L.T. Aporte al Conocimiento de la Microbiota Fúngica del Suelo de la Amazonia Colombiana, con Enfasis en Tres Grupos Funcionales. Trabajo de Grado (Biólogo). Pontificia Universidad Javeriana, Santafe de Bogotá, 2000. ♦ Casciotti K.L. & Ward B.B. 2001. Dissimi/atory Nitrite Reducíase Genes from Autotrophic Ammonia-Oxidizing Bacteria. Applied and Environmental Microbiology, 67(5):2213-2221. ♦ Castro H., Reddy K.R. & Ogram A. 2002. Composition and Function of Sulfate-Reducing Prokaryotes in Eutrophic and Pristine Areas o f the Florida Everglades. Applied and Environmental Microbiology, 68(12):6129-6137. ♦ Cho J.C. & Tiedje J.M. 2000. Biogeography and Degree o f Endemicity of Fluorescent Pseudomonas Strains in Soil. Applied and Environmental Microbiology, 66(12): 5448-5456. ♦ Cho J.C. & Tiedje J. M. 2002. Quantitative Detection o f Microbial Genes by Using DNA Microarrays. Applied and Environmental Microbiology, 68(3): 1425-1430. ♦ Coates J.D., Colé K.A., Chakraborty R., O'Connor S.M. & Achenbach L.A. 2002. Diversity and Ubiquity o f Bacteria Capable o f Utitizing Humic Substances as Electron Donors for Anaerobic Respiration. Applied and Environmental Microbiology, 68(5): 2445-2452.1. ♦ Conrad R. 1996. Soil Microorganisms as Controllers o f Atmospheric Trace Gases (H2, CO, CH4, OCS, N20, and NO). Microbiological Reviews, 60(4): 609-640. ♦ Corpet F., Servant F., Gouzy J. & Kahn D. 2000. ProDom and ProDom-CG: tools for protein domain analysis and whole genome comparisons. Nucleic Acids Research, 28:267-269. ♦ Dennis P., Edwards E.A., Liss S.N. & Fulthorpe R. 2003. Monitoring Gene Expression in Mixed Microbial Communities by Using DNA Microarrays. Applied and Environmental Microbiology, 69 (2):769-778. ♦ Dopazo J. & Valencia A. 2001. [en línea]. Bioinformática y genómica. [ref. Enero 20 de 2004]. http://bioinfo.cnio.es/docus/courses/ leon2002/BioinfoGenomica.pdf. ♦ Drake H.L., Küsel K. & Matthies C. 2002. Ecological Consequences o f the Phylogenetic and Physiological Diversities ofAcetogens. Antonie van Leeuwenhoek, 81:203-213. ♦ Elias D.A., Krumholz L.R., Tanner R.S. & Suflita J.M. 1999. Estimation o f Methanogen Biomass by Quantítation o f Coenzyme M. Applied and Environmental Microbiology, 65(12):5541-5545. ♦ Farrelly V., Rainey F.A. & Stackebrandt E. 1995. Effect o f Genome Size and rrn Gene Copy Number on PCR Amplifícation o f 16S rRNA Genes from a Mixture o f Bacterial Species. Applied and Environmental Microbiology, 61(7):2798-2801. ♦ Febles J.P. & González A. [en linea], 2002. Aplicación de la minería de datos en la bioinformática [ref. 24 de mayo de 2004]. http://www.infomed.sld.cu/revistas/aciA/ol10_2_02/aci03202.htm. ♦ Fernández A., Huang S., Seston S., Xing J., Hickey R., Criddle C. & Tiedje J. 1999. How Stable Is Stable? Function versus Community Composition. Applied and Environmental Microbiology, 65 (8): 3697-3704. ♦ Ferry J.G. 1995. CO dehydrogenase. Annual Review of Microbiology, 49:305-333. ♦ Friedrich M.D. 2002. Phyiogenetic Ana/ysis Reveáis Múltiple Lateral Transfers o f Adenosine5'-Phosphosulfate Reducíase Genes among Su/fate-Reducing Microorganisms. Journal of Bacteriology, 184(1): 278-289. ♦ Galtier N., Gouy M. & Gautier C. 1996. Seaview and Phylo_win: two graphic too/s for sequence alignment and molecular phylogeny. Applied Biosciences, 12:543-548. ftp://Dbil.univ- ♦ Gilbert B., McDonald I.R., Finch R., Stafford G.P., Nieisen A.K. & Murrell J.C. 2000. Molecular Ana/ysis o f the pmo (Particulate Methane Monooxygenase) Operons from Two Type II Methanotrophs. Applied and Environmental Microbiology, 66(3):966-975. ♦ Gregory L., Bond P., Richardson D. & Spiro S. 2003. Characteñzation o f a Nitrate-Respiring Bacterial Community using the Nitrate Reducíase Gene (narG) as a Functional Marker. Microbiology, 149: 229-237. ♦ Gutiérrez G. & Roncando A. [en línea]. Estrategias para el Análisis de Genomas. [ref. 24 de mayo de 2004]. Disponible en web: http://bioinf.ibun.unal.edu.co/~Qautierrez/EAG.html. ♦ Hallam SJ., Girguis P.R., Presten C.M., Richardson P.M. & DeLong E.F. 2003. Identification of Methyl Coenzyme M Reducíase A (mcrA) Genes Associated wiíh Meíhane -Oxidizing Archaea. Applied and Environmental Microbiology, 69(9):5483-5491. ♦ Hirota R., Yamagata A., Kato 1, Kuroda A., Ikeda T., Takiguchi N., & Ohtake H. 2000. Physical Map Location ofíhe Mulíicopy Genes Coding for Ammonia Monooxygenase and Hydroxylamine Oxidoreducíase in the Ammonia-Oxidizing Baclerium Nitrosomonas sp. Sírain ENI-11. Journal of Bacteriology, 182(3):825-828. ♦ Hommes N.G., Sayavedra-Soto L.A. & Arp DJ. 2001. Transcripí Ana/ysis ofMulíiple Copies of amo (Encoding Ammonia Monooxygenase) and hao (Encoding Hydroxylamine Oxidoreducíase) in Nitrosomonas europaea. Journal of Bacteriology, 183(3): 1096-1100. ♦ Hooper D.U., Solan M., Symstad A., Díaz S., Gessner M.O., Buchmann N., Degrange V., Grime P., Hulot F., Mermiilod F., Roy J., Spehn E. & Van Peer L. 2002. Species Diversity, Functional Diversity and Ecosysíem Funcíioning. p. 195-281. In M. Loreau, S. Naeem, and P. Inchausti (Ed.), Biodiversity and Ecosystem Functioning: Synthesis and Perspectives. Oxford Universlty Press, London, UK. ♦ Jensen M., Webster J. & Strauss N. 1993. Rapid Identification o f Bacteria on the Basis o f Polymerasa Chain Reaction-Amplifíed Ribosomal DNA Spacer Polymorphirms. Applied and Environmental Microbioiogy, 59: 945-952. ♦ Joos T. 2004. Protein Microarray Technology. Expert Review of Proteomics, l(l):l-3. ♦ Kang B.S. & Young M.K. 1999. Ooning and Molecular Characterization ofthe Genes for Carbón Monoxide Dehydrogenase and Localization o f Molybdopterin, fíavin Adenine Dinudeotide, and Iron-Sulfur Centers in the Enzyme o f Hydrogenophaga pseudofíava. Journal of Bacteriology, 181 (18):5581-5590. ♦ Karknoff-Schweizer R.R., Huber D.P.W. & Voordouw 6. 1995. Conservatíon o f the Genes for Dissimilatory Sulfite Reducíase from Desulfovibrio vulgaris and Archaeoglobus fulgidus allows their Detection by PCR. Applied and Environmental Microbioiogy, 61:290-296. ♦ Kawase T., Saito A., Sato T., Kanai R., Fujii T., Nikaiao N., Miyasnita K. & Watanabe T. 2004. Distribution and Phylogenetic Analysis of Family 19 Chitinases in Actinobacteria. Applied and Environmental Microbioiogy, 70(2): 1135-1144. ♦ Kent A.D. & Triplett E.W. 2002. Microbial Communities and their Interactions in Soil and Rhizosphere Ecosystems. Annual Review of Microbioiogy, 56:211-36. ♦ King G.M. 1999. Attributes of Atmospheric Carbón Monoxide Oxidation by Maine Forest Soils. Applied and Environmental Microbioiogy, 65 (12):5257-5264. ♦ King G.M. 2003. Molecular and Culture-based Analyses o f Aerobic Carbón Monoxide Oxidizer Diversity. Applied and Environmental Microbioiogy, 69(12):7257-7265. ♦ Kinghorn J.R. 1989. Genetical, Biochemical and Structural Organization o f the Aspergillus nidulans crnA-niiA-niaD Gene Cluster. In J.R. Wray, J.R. Kinghorn eds. Molecular and Genetic Aspects of Nitrate Assimilation. Oxford Science Publications, Oxford, pp. 69-87. ♦ Kjoller R. & Roendahl S. 2001. Molecular Diversity o f Glomalean (arbuscular mycorrhizal) Fungí Determined as Distinct Glomus Specific DNA Sequences from Roots o f Field Grown Peas. Mycological Research, 105 (9):1027-1032. ♦ Kolb S., Knief C., Stubner S. & Conrad R. 2003. Quantitative Detection o f Methanotrophs in Soil by Novel pmoA-Targeted Real-Time PCR Assays. Applied and Environmental Microbioiogy, 69 (5):2423-2429. ♦ Larrondo L.F., Salas L., Meló F., Vicuña R. & Cullen D. 2003. A Novel Extracellular Multicopper Oxidase from Phanerochaete chrysosporium with Ferroxidase Activity. Applied and Eenvi ronmental Microbioiogy, 69(10):6257-6263. ♦ Lassmann T. & Sonnhammer E.L.L. 2002. Quality assessment o f múltiple aiignment programs. FEBS Letters 529:126-130. ♦ Lee D., Gun Zo Y. & Kim S. 1996. Non-radioactive Method to Study Genetic Profíles o f Natural Bacterial Communities by PCR-Single Strand Conformation Polymorphism. Applied and Environmental Microbiology, 62:3112-3120. ♦ Lewin B. 2001. Genes VII. Marbán Libros, Madrid España. 990p. ♦ Lorite M.J. Tachil J., Sanjuán 1, Meyer O., & Bedmar E.J. 2000. Carbón Monoxide Dehydrogenase Activity in Bradyrhizobium japonicum. Applied and Environmental Microbioiogy, 66(5): 1871-1876. ♦ Loy A., Lehner A., Lee N., Adamczyk I , Meier H., Emst 1, Schleifer K.H. & Wagner M. 2002. Oiigonudeotide Microarray for 16S rRNA Gene-Based Detection o f aH Recognized Uneages of Sutfate-Reducing Prokaryotes in the Environment. Applied and Environmental Microbiology, 68 (10):5064-5081. ♦ Lucas R., Robles A.M., del Postigo-Gáivez A., García T., Pérez R. & Aivarez G. 2001. Biodegradación de la Celulosa y la Lignina. Ia Ed. Universidad de Jaén, Servicio de Publicaciones e Intercambio Científico, D.L. España, pp. 146. ♦ Lucchini S., Thompson A. & Hinton J.C.D. 2001. Microarrays for microbiologists. Microbiology, 147: 1403-1414. ♦ Luna M.L., Vega C., Franco M.O., Vásquez S., Trujillo N., Ramírez E. & Dendooven L. 2002. Actividad microbiana en suelos. Avance y perspectiva, 21: 328-332. ♦ Luton P., Wayne J.M., Sharp R.J. & Riley P.W. 2002. The mcrA gene as an atternative to 16S rRNA in the phyiogenetic analysis o f methanogen populations in landfill. Microbiology, 148:3521-3530. ♦ Lynd L.R., Weimer P.J., van Zyl W.H. & Pretorius I.S. 2002. Microbial Cellulose Utiiization: Fundamentáis and Biotechnology. Microbiology and Molecular Biology Reviews, 66(3): 506-577. ♦ Matveeva O.V., Foley B.T., Nemtsov V.A., Gesteland R.F., Matsufuji S., Atkins J.F., Ogurtsov A. % Shabalina S. 2004. Identification o f regions in múltiple sequence alignments thermodynamicaify suitabie for targeting by consensus oligonudeotides: application to H1V genome. BMC Bioinformatics, 5(44): 1-13. ♦ McCaig A., Glover A. & Prosser, J. 1999. Molecular Analysis o f Bacterial Community Structure and Diversity in Unimproved and Improved Upland Grass Pastures. Applied and Environmental Microbiology, 65: 1721-1730. ♦ McDevitt C., Burreil P., Biackaii L.L. & McEwan A.G.2000. Aerobic Nitrate Respiration in a NitriteOxidising Bioreactor. FEMS Microbioiogy Letters, 184:113-118. ♦ Metcaife A.C., Krsek M., Gooday G.W., Prosser J.I. & Weliington M.H. 2002. Molecular Analysis o f a Bacterial Chitinolytic Community in an Upland Pasture. Applied and Environmental Microbioiogy, 68(10): 5042-5050. ♦ Minerdi D., Fani R., Gallo R.( Boarin A. & Bonfante P. 2001. Nitrogen Fixation Genes in an Endosymbiotic Burkholderia Strain. Applied and Environmental Microbioiogy, 67(2):725-732. ♦ Mobarry B.K., Wagner M., Urbain V., Rittmann B.. & Stahl D.A. 1996. Phy/ogenetic Probes for Analyzing Abundance and Spatial Organizaron ofNitrifying Bacteria. Applied and Environmental Microbioiogy, 62:2156-2162. ♦ Moreno-Vivián C., Cabeiio P., Martínez-Luque M., Blasco R. & Castillo F. 1999. Prokaryotic Nitrate Reductíon: Molecular Properties and Functionaí Distinction among Bacterial Nitrate Reductases. Journal of Bacteriology, 181(21):6573-6584. ♦ Morris C.E., Bardin M., Berge O., Frey-KIett P., Fromin N., Girardin H., Guinebretiere M.H., Lebaron P., Thiery J.M., & Troussellier M. 2002. Microbia/ Biodiversity: Approaches to Experimenta¡ Design and Hypothesis Testing in Primary Scientifíc Literature from 1975 to 1999. Microbioiogy and Molecular Bioiogy Reviews, 66 (4): 592-6Í6. ♦ Morton J.B. & Benny G.L. 2001. Two new families o f Glomales, Archaeosporaceae and Paragiomaceae, with two new genera Archaeospora and Paragiomus, based on concordant molecular and morphological characters. Mycologia, 93:181-195. ♦ Muñoz C., Guillen F., Martínez A.T. & Martínez M.J. 1997. Laccase Isoenzymes o f Pleurotus eryngii: Characterization, Catalytíc Properties, and Participation in Activation o f Molecular Oxygen and Mn21 Oxidation. Applied and Environmental Microbioiogy, 63(6):2166-2174. ♦ Murrell, J.C., Giibert B. 8i McDonald I.R. 2000. Molecular bioiogy and regulation o f methane monooxygenase. Archives of Microbioiogy, 173:325-332. ♦ Nannipieri P., Ascher J., Ceccherini M.T., Landi L., Pietramellara G. & Renella G. 2003. Microbial Diversity and Soil Functions. European Journal of Soil Science, 54:655-670. ♦ Nicholas K.B. & Nicholas H.B. 1997. GeneDoc: a too/ for editing and annotating múltiple seguence atignments. Disponible en web: www.psc.edu/blomed/genedoc. ♦ Norton J.M., Alzerreca J.J., Suwa Y. & Klotz M.G. 2002. Diversity o f Ammonia Monooxygenase Operon in Autotrophic Ammonia-oxidizing Bacteria. Archives in Microbioiogy, 177:139-149. ♦ Notredame C., Higgins D.G. & Heringa J. 2000. T-Coffee: A Novel Method for Fast and AccurateMultiple Sequence Alignment. Journal of Molecular Bioiogy, 302: 205-217. ♦ Odum E. 1972. Ecología, 3ra edición. Interamericana, México. ♦ Ohrmund S.R. & Elrod S. [en línea]. The Development of Primers Specifíc to Bacterial Species that Produce Celiuiase Enzymes Using the Tools of Bioinformatic [ref. 15 de abrii de 2004. http://ebi.calpoly.edu/senior_projects/SteveO_SP.pdf. ♦ Olalde V. & Aguilera L.1.1998. Microorganisms and Biodiversity. Terra, 16(3): 290-292. ♦ Ovreas L., Jensen S., Daae F.L. & Torsvik V. 1998. Microbial Community Changes in a Perturbed Agricultura! Soil Investigated by Molecular and Physiological Approaches. Applied and Environmental Microbiology, 64(7):2739-2742. ♦ Pearson W.R. Methods in Molecular Biology, vol. 132: Bioinformatics Methods and Protocols. Ed. S. Misener & S.A. Krawetz. Humana Press Inc., Totowa N .l ♦ Peng X. & Stromberg AJ. [en línea]. Microarray Experiment Design and Statisticai Anaiysis. Chapter 7 [ref. 8 de septiembre de 2004]. http://www.kbnn.louisviile.edu/about/Pubs/Pengstromberg.pdf. ♦ Peplies X, Glóckner F.O. & Amann R. 2003. Optimization Strategies for DNA Microarray-Based Detection o f Bacteria with 165 rRNA-Targeting OUgonudeotide Probes. Applied and Environmental Microbiology, 69(3): 1397-1407. ♦ Perriére G. & Gouy M. 1996. WWW-Query: An on-Une retrieval system for biological sequence banks. Biochimie, 78:364-369. ♦ Phillips CJ, Harris D., Dollhopf S.L., Gross K.L., Prosser 3.1. & Paul E.A. 2000. Effects o f Agronomic Treatments on Structure and Function o f Ammonia-Oxidizing Communities. Applied and Environmental Microbiology, 66(12): 5410-5418. ♦ Poly F., Ranjard L., Nazaret S., Gourbiére F. & Monrozier L.J. 2001. Comparison o f nifH Gene Pools in Soils and Soil Microenvironments with Contrasting Properties. Applied and Environmental Microbiology, 67(5):2255-2262. ♦ Prescott L.M., Harley J.P & Klein D.E. 2000. McGraw-Hill. Microbiology. 4th edition. Electronic Book. ♦ flozorov A.A. 2001. Recombinational Rearrangements in Bacterial Genome and Bacterial Adaptaban to the Environment. Mikrobiologiya, 70(5): 581-594. ♦ Purkhola U., Pommerening-Roser A., Juretschko S., Schmid M.C., Koops H.P. & Wagner M. 2000. Phylogeny o f AH Recognized Species o f Ammonia Oxidtzers Based on Comparative 16S rRNA and amoA Sequence Anaiysis: Implications for Molecular Diversity Surveys. Applied and Environmental Microbiology, 66(12):5368-5382. ♦ Rahmann S. 2004. [en línea]. Promide, Probe Selection and Microarray Design. [ref. 18 de Agosto de 2004]. ♦ Redecker D. 2000. Specifíc PCR primers to identify arbuscular mycorrhizal fungi within cotonized roots. Mycorrhiza, 10:73-80. ♦ Redecker D., Morton J.B. & Bruns T.D. 2000. AncestralUneages ofArbuscular Mycorrhizal Fungi (dómales). Moiecuiar Phylogenetics and Evolution, 14(2):276-284. ♦ Richardson DJ. 2000. Bacterial Respiration: a flexible process for a changing environment. Microbioiogy, 146:551-571. ♦ Rósch C., Mergeí A. & Bothe H. 2002. Biodiversity o f Denitrifying and Dinitrogen-Fixing Bacteria in an AcidForestSoii Applied and Environmentai Microbioiogy, 68(8):3818-3829. ♦ Rotthauwe J.H., Witzel K.P. & Liesack W. 1997. The Ammonia Monooxygenase Structural Gene amoA as a Functional Marker: molecular fíne-scale analysis o f natural ammonia-oxidizing populations. Applied and Envinomental Microbioiogy, 63:4704-4712. ♦ Salisbury F.B. & Ross C.W. 1994. Fisiología Vegetal. Grupo Editorial Iberoamérica S.A., México, D.F. 759 p.p. ♦ Scala DJ. & Kerkhof L.J. 1999. Diversity o f Nitrous Oxide Reducíase (nosZ) Genes in Continental ShelfSediments. Applied and Environmentai Microbioiogy, 65(4): 1681-1687. ♦ Schuler G.D. 1997. Bioinformatics: Pieces o f the puzzle: expressed sequence tags and the catalog o f human genes. Journal of Molecular Medicine, 75: 694-698. ♦ Small J., Cali D., Brockman F., Straub T. & Chandler D. 2001. Direct Detection o f 16S rRNA in Soil Extracts by Using Oligonucleotide Microarrays. Applied And Environmentai Microbioiogy, 67 (10):4708-4716. ♦ Soares A., Frois G., Seldin L. & van Elsas J.D. 1997. Molecular Microbial Ecoiogy. Revista de Microbiología, 28:135-147. ♦ Sobolev D. & Roden E.E. 2002. Evidence for Rapid Microscale Bacterial Redox Cycling oflron in Circumneutrai Environments. Antonie van Leeuwenhoek, 81: 587-597. ♦ Stanier R., Ingraham J.L., Wheelis M.L. & Painter P.R. 1986. The Microbial World. Fifht Edition. Prentice Hall, New Jersey USA. 689p. ♦ Steffen K.T., Hatakka A. & Hofrichter M. 2002. Degradation o f Humic Acids by the LitterDecomposing Basidiomycete Collybia dryophila. Applied and Environmentai Microbioiogy, 68(7): 3442-3448. ♦ Stewart P. & Cullen D. 1999. Organization and Differential Regulation o f a Cluster o f Lignin Peroxidase Genes o f Phanerochaete chrysosporium. Journal of Bacteriology, 181(11):34273432. ♦ Straub K.L. Benz M., Schink B. & Widdel F. 1996. Anaerobic, Nitrate-Dependent Microbial Oxidation o f Ferrous Iron. Applied and Environmentai Microbioiogy, 62(4): 1458-1460. ♦ Strous M., Kuenen J.G. & Jetten M.S. 1999. Key Physiology of Anaerobic Ammonium Oxidation. Applied and Environmental Microbiology, 65(7): 3248-3250. ♦ Sugnet C. 1999. [en línea]. Design Considerations [ref. 18 de Agosto de 2004]. http://www.cse.ucsc.edu/~sugnet/oligo_picker/node2.html. ♦ Sztern D. & Pravia M.A. Manual para la Elaboración de Compost: Bases Conceptuales y Procedimientos. Uruguay: Presidencia de la República - Oficina de Planeamiento y Presupuesto Unidad de Desarrollo Municipal - Organización Panamericana de la Salud, 1999. 69 p. ♦ Tamaru Y., Karita S. Ibrahim A., Chan H. & Doi R. 2000. A Large Gene Cluster for the üostrídium cellulovorans Cellulosome. Journal of Bacteriology, 182(20):5906-5910. ♦ Taroncher G.,Griner E.M., Francis C.A. & Ward B. 2003. OUgonudeotíde Microarray for the Study o f Functional Gene Diversity in the Nitrogen Cycle in the Environment. Applied and Environmental Microbiology, 69(2): 1159-1171. ♦ Thauer R.K. 1998. Biochemistry o f methanogenesis: a tribute to Marjory Stephenson. Microbiology, 144:2377-2406. ♦ ThompsonJ.D., GibsonT.J., Plewniak F., Jeanmougin F. & Higgins D.G. (1997). The ClustalX windows interface: flexible strategies for múltiple sequence alignment aided by quality analysis tools. Nucleic Acids Research, 24:4876-4886. ♦ Thompson J.D., Higgins D.G. & Gibson T.J. [en línea]. CLUSTAL W: improving the sensitivity o f Progressive múltiple sequence alignment through sequence weighting, position specifíc gap penalties and weight matrix choice [ref. 20 de diciembre de 2003]. http://bimas.dcrt.nih.gov/dustalw/clustalw.html. bajado en diciembre 2003. ♦ Thorn R.G., Reddy C.A., Harris D. 8i Eldor A.P. 1996. Isolation of Saprophytic Basidiomycetes fromSoil. Applied and Environmental Microbiology, 62(11): 4288-4292. ♦ Valencia E. & Peña JJ. 2001 El suelo y sus habitantes microbianos: consideraciones ecológicas. Avance y Perspectiva, 20:401-406. ♦ Valentine D.L. 2002. Biogeochemistry and Microbial Ecology o f Methane Oxidation in Anoxic Environments: a review. Antonie van Leeuwenhoek, 81:271-282. ♦ Vera D.F., Pérez H. & Valencia H. 2002. Aislamiento de Hongos Solubilizadores de Fosfatos de la Rizosfera de Arazá (Eugenia stipitata, Myrtaceae). Acta Biológica Colombiana, 7(1): 33-40. ♦ Wagner M, Roger A.J., Flax J.L., Brusseau G.A. & Stahl D.A. 1998. Phylogeny o f Dissimilatory Sulfite Reductases Supports an Early Origin o f Sulfate Respiration. Journal of Bacteriology, 180 (11): 2975-2982. ♦ Walter R.L., Ealick S.E., Friedman A.M., Blake R.C., Proctor P. & Shoham M. 1996. Múltiple Wavelength Anomalous Diffraction (MAD) Crystal Structure o f Rusticyanin: A Highly Oxidizing Cupredoxin with Extreme AcidStabiüty. Journal of Molecular Biology, 263:730-751. ♦ Wolters V., Silver W., Bignell D., Coleman D., Lavelle P., Van Der Putten W., De Ruiter P., Rusek J., Wall D., Wardle D., Brussaard L, Dangerfieid J., Brown V., Giller K., Hooper D., Sala O., Tiedje J. & Van Veen J. 2000. Effects o f Global Changes on Above • and Beiowground Biodiversity in Terrestrial Ecosystems: Implications for Ecosystem Functioning. Bioscience, 50 (12): 1089-1098. ♦ Wu L., Thompson D.K., Li G., Hurt R.A., Tiedje J.M. & Zhou J. 2001. Development and Evaluation o f Functional Gene Arrays for Detection o f Se/ected Genes in the Environment Applied and Environmental Microbiology, 67(12):5780-5790. ♦ Zehr J.P., Jenkins B.D., ShortS.M. & Steward G.F. 2003. Nitrogenase Gene Diversity and Microbial Community Structure: a cross-system comparison. Environmental Microbiology, 5(7): 539-554. ♦ Zhou J. & Thompson D.K. 2002. Challenges in Applying Microarray to Environmental Studies. Current Opinión in Biotechnology, 13(3):204-207. ♦ Zumft W.G. 1997. Cell Biology and Molecular Basis o f Denitrification. Microbiology and Molecular Biology Reviews, 61(4):533-616. ANEXOS ANEXO 1. OUgonudeótidos diseñados y sus parámetros termodinámicos y físicos (páginas siguientes). 1 1 n i n i 1 1 1 t 1 1 1 1 1 1 i n i 1 1 1 1 ..............................................i i i í I 2 5 !i< i * 3t£E mi ¡gis isi riiüü tí 5 £ < i t l s 3 • . ib $ < *6 < | - N « t » « O S O (>03 5 >0 K 00 Ov O •H IO « 4 «4 H «-• N Í 5 Í 5 S S S Í S S S S 5 Í S 1 1 2 ? i o> 3 no B í -• o —. 8 1 5 9 00 t ir> * <y ®. •4 i? 8 SI <2 °> 9 0 0 ft a -r N I 9 0 « — eo to ** ¡? ’ ? n •* * <M N; * 0. N. «0 -V fu O —« « •x. oa *x •s 9 «■4 mi f •n — 7 * ■ 1 ■ ’. fv % o iri m vb fC t TV « M* m 1 00 i¡ 9 i 1 v£> r^ ‘ w <* o>" r^ < «> . •M n rs " «? - l ¥ N UT> — 9 97 •-4 s «5 9 « « t m ’V a u Q c C P. ? \tí pj ■« i ¡ O O s OJ % $ * i*> - « » Y o & o — oo o ^ '\ "■ .i i-, y w- ™ A u w> ^ <V 9 in Sí. ?> o -.' o *1 «o !z• «n. ^ — (V *>. co X « 9 o ^ 10 ^ 5* < **.O «0 K, « -* <y o. o P o id o> 5 - OvOiN i- O *!• N B » 00 £ O *> «n 9 o 9 i S. I S •- . t «•> O í O . O T -i ^ ® O O O ítin N r ^ ^ j a « n s s ? ; s ! 8 i * s * s s s ! n s 8 a í ; ; r. 8 ” * <n ^ <M fvl •ii ♦ •¿i po < s| S £ £ £¡fe ^ « s ü i <0 ^ M N <w N «QCDNOx' vi r ot o l¿ ¡t pi S í t p í í f c S Í É f c f c j é f í i f c ^ ¿se if> • oN oN. -Ni - No rWv í &H ^ » ^ 0 ' T>*f>',f p«r^ •«- .o r\i o «r ~ o m ^ o n » <S» <S» lf> N M N N N N N N S i n N W f t W N N W n f t i M (\l IM « N 9 ? 3 iVv mÜ ao O O B N fJÍlflN W O ÍW n N C U Iflm íin I S ? 8 2 2 £ 2* t2 I ■ I I2 2 2 2 J S 3 S-11 1 ! 1 1! 1 í í í 1 1 111 f 11 * I í 1 1 ! 11 i i i i i «8 <S lili Ii £> u I iS | I o p o I p lililí f u_ U? í < s < < < t u. tr Ü_ i* » 1* £ £ £ U_ Uiil iilü illilü iü llit ! ‘l ü i i i i i i i i ü i m i i i i n u n i H H H : » ; » 8 t K) «O lt)5'0^«¿-0< 0'0'í)'0Sl> SN ^ ^ ^113 I! í | } í I 1 1 i °?1?» & 8 £S: 2 2 a:9 £ l & S f Ü 8 ! I K¡Í I 8 § 8 » » S ? S 8 ’ ?Ü' í Sí f f O M i t c a S N U i ü ) O ^ fy n a ^ co r\j s i » < % < * < * ro I f r l f'4 t- § & 1 i fc fc i u w n u n i u n w n n u n n n N Mt l> S 'j » N o« o >rO o »v i » >oJ >u >x f,c o v \|| OiS »o r >oJ <! >S « <• Ki - b' - <o ó í- m ^ úi i> » w u fv>C'^OA'á»-^*- ní o 'nJ co O w u r o o u N u N u N W i t > N u M u W (O IM # N O N OI N N 8 -v< l \) # & ¿ & á N O ni w u ui N Jl ff 5* rn *¿»f N 'J M OI | ^ 1 í ^ /W wL f í w o i /> i« C i» ^ P P (M 6 .J (« Crü curo i C ü i r \ ) O i ^ W i . u „ — S UJChOiNjO>0>r5*>woc'0¡íW tsstí;«^Sí;í5 u N i f f l i o K í á í . ' >.. n i-. .. í? o o o i. r- A o •*o ^ o g g JL. *. Vi M w <U j» O o u¡ £ g g * g i; § 'í* 'J K> £ o o £ <b i* > $ '5 s ^ SX o O 00 o £ C> £ ¿ O rvj p<>. IV» i» w n ¿ ? P 6 w ct w o o o o ta i § ®o s ■— o ot - ± -k w ó Z «S» r ¿ 5 > V* s > S*S v¿> ¿ S : 8 3 ¿ g 2 V j -vi Cí “ i» >» >u K) bv U 0< >1 U (*■ N >1 r\j i> ^ ^ s 4» S? > « 00 K- J S t > » » 4 s \o oo _ ,. I ¿i ¿>ó *- r* a> Ul « s s i _•■ * f\J ► * uj 'o J: £ 3 -fe *- ‘ o o o O 6 oí o > £ $ Ai ^ ¿ s 5 w ;0 V> ** » > -2 * «* § S § . gi :o lo ai K> w m en oí * * « 5} * N w N W í P ¿> <> <i» r\> en ^ % c íz 3 i 3 "i H 3 t; o « t - ►* m m m » *► * *- p (A> IV) M *O R £*M 8 1 i 8 3S 3 * > 5> 5 3 > . 1 1 2 > * M „ *l|lii n ? S S J 2 S S 8 S S ? ? S S Ü S 2 8 2 n * Í 1y i §* * ¡I 4 2 1 8 | > Q > 2 >H 2 > > 9 - * 3 2 3 > > $ > ? ? 5P 3P n £ [ f í n t i m a s * f m i t j f j* IIIIIIIIIIIIIIIII IIIII 7 ti £ | S s 2 8 2 2 2 2 8 2 8 I B- f Í •„ r>. a> h* csi O r* r* *-« ís vC f* M «e 3 í •ó tr> o r< ró r* o V JÉ s fc <* en 'O h* s ♦ cu (Ni t si 8 ur> Sí 'O ai * K N <n t\í f3 M i¡ «n * — . .1 tsi <T m :s *2 9 5 ü o o» ft> 8 <n CVJ a « s . K V tí X ■ 1 1 * í § * i i -8 1 1 3 (SI i m + CT* -o •* -o (si K K 00 CJ n O (M N. in R <n M fO ■>r s R 1 o ■o N- en o. m lf) O <*» R <D <M s? «H <• oo ® «*» i O < c 0 0 0 - . 0 f t^ 0 »CO0O* i j ftl ! ssii.lffi 5 co N (u «n vO <*> K ."-.i «V* <o «\l ♦ <M 5 III! Hi i IS|?!!H!í ! 2 < <1 o <0 H 3 s •# 5 8 «*> ■<* ■O <o en O ro «SI (O CM CM C\i 'Ó T 68.1 L f > 42.9 hs pj 8 778 í m m t f i ' O ^ t v j ^ n v ' T o -1<0»«- ! «Ot f 1NCO' r K 77.5 ■«e « i tft « m iW <M ÍO o s ♦.■o.0 2 O. ”* t o S § í o í'? o ó 9 o 9 o 9 o - ' 9 o’ o o — o o o N X) 0 s s-s. ^m■ a■ ^(V> oív ^ ^ 3'" < S > N. —. 5 ^ tf\ Q. «O 9 v 69 —! a 9 oo £• < 24 O í 2 n 74.7 o ■A 3* » & £ S V r9 29 25 76.8 2- O» *■* N** N* K O 9 9 I >% < <r> <*> ■r N % : 3 1 «*> tf> Sr 5o ; ? 9 * <v í*•> 4L7 v o -r' ^ i § ^ ■* a » K 24 ^ h c«Oo í V i 1 <© co .* «0 <r> 5 . 5 $ £ •<> m 9 3 r 9 3 r = 2 t 9 ? 3 ;i ? «O o » "í M O. o. « p o < «H 4 O-iv»1rr','1 OV «, ■v K. 3 »\ 1 ? ’a -I. *“1 mW o 33 - NN 3 S g S S N' 22 ? m Sf o ? t S » ¡s 5" « S t 27 i r*> qO O. C\í 24 S . n 24 O 1 «q ! ? " » § 7 a 2 ¡p t ♦ s ?f?H §§§ 1 1 1M<s ) r ^*i O«>OOO — i'j — i í r«j0rto<*»’«x>f | 8 c 1 ! f í i < ?5 fj * í | 3 lili 3 | S 3 1 5 .... H H i t tí a « UJ U) f i< <B I I 0 1 II Ñ £ 1 U1l Lii & < I I II 11 l i l i l í i gi f i 1f f j f i 1 i i f O f f l f i i l l l í i l l I l l i S f f ¡1 i f t Z t 2 2 2 Í2 »< lülll * S S S S S § S 2 Í 3 3 « i§ £ i§ § 3 2 « W <n t w *•< « « *■ * *í < < < < u í S S ? S 2115 <* ~o t n '< í ® 2 T - r 0? v - ; o . " IO m “cj o o 9 9' *» o O Q, Sf § §' § N5, |S ¡ ? .. ♦ -• o o o o V •? j ^ o* 9 « 8 fe ir» «o n oo r* if> m fú s <) io <j fs¡ n n ” 9 csj en <c:•a o * ro IO w O O 9 cu — <o - <— _2 £ ^ > S¡ ¿i i s «o ¡ 3if> o <n • 9 « A N V O Q «»»♦«? r> K Krr N~ «m. ?• K S v oo o 2 9 2 f s •- n n - - *H O S¡•• <TN N *» <3 fe T» s8 ' 7 T >L < < N ^ °V *. <y «o o N V i 9 í*) v n *v O. g N *H *"<• &3 s a ¥ V, ^ 9s.9" " «V' O 5 ° °v °. °. O O O |\ 5. « . o o o | I ^” 2 9 r« ? i s5 s ? 1 1 1 o ^ •O M o P s¿ § ? 5 o p í . 5 5 i<. S~ S<*> ^ £ O o ? *H S' - £ 5 a ^ 5 O, O $ W o : t o - o 9 9 o 9 cv* <*> N 5 fí o ▼. rv' T Ow «0 K K> s M <Ó j O i f i o o<>f ^N a d N O ' »-« O £ K o W^' O' ON N S «O «O K "í '*. -* -'. "? i -4— - 'O® K o q ® <n k<si ? IO ^ N N CJ n CM 8 SS 8 3 s •* Oj ♦ í> IO -1 S r* « K m N jfl S «i n K K 1*4 O M p M ' aNi ,in nN no i nN N ’r n »r M• of < o «f ol oi >i c «N3m' t r — f i i lnM< M N nn N M W M 'nONONNN N t o l N M R o N—f •«ro t j MN r ní O>“ m 1 1 1 1 1 S % í T C \ I! ! ! ? §! I 1 1 0 J j O r r' ~ O < M 5 1 ®1O c 0 í \ ) O < \ i O I ?v ? «% ? ? ? § > v tá e* H M S lg N W (5 O ?-5 1cm !<i> 3 m 5 «\j i iO „ I P l l <oo O 2 p o £ £ f l í í y s í ¥ i < ? ? ? í í f ? ^ 2 2 í 2 ¿ 2 2 2 -b 2 ¡Bi.S ! ti &Eí£O.Í'!Iu ;s;y miUiUiífíH! $ I y $ « 5 fc i 5 i s < 5 * < 3 < ¿s iiiiliihiilliiiiilíii h i i r w ro u m u ! IINII * f i ' r Ü j¡ * i i i i i i i i i n JTl íj i i i u iiiisisinsim ^ n I\) N O w l\> l\) W » > N y i u n n m n n n i m u n i m u ' Í ^ o o b w o - o o i o o o j O u o í q 5 5 ó i i f f ¡ v U « i j k a > * Í U H U Í H o n Jí K r* oK >o m ) ° "J K) > 4 *>4 t> 4 O* W V3 » >1 K) * -g * ¿i a s a s * 00 < Jl O CU o $ t :f>JU(r cfc£¡ N »¿'M v b l »¿ f »¿VM£ 9 ' Í Ó ' N ¿"M W * »¿U s » Í ] i ' f M 55 O ■ • *5 o ? A o ir* > .O .— .— o i — y§ 'S o o V ■¡ FS t k i N -5 •? * O *> ^ o % o O 1» O •- o o ° o O V» A o ° fc o o o % o tui t^ '§ * S s o O>s ■ V» *-- O» - o «V» * 'to ui Vn> ;*o V- o o ú> r P V: * „ * P £ > í* *'■é ¿ é e 5 i g > c .* ¿ £ü ¿ ¿ > * S .3 g .3 8 k i¡ É -“ $ S 5 K> 5 >v> . ¿5L!fi<5W(lMTTW bóMINTO "SUBMVTSMN"" Bacteria dsrB mcrA Archaea narS Bacteria nasA Bacteria nifD nifK nirS Bacteria nosZ Bacteria rtosZ Bacteria nosZ Bacteria 183fTATACXSÁTG ATATTCTG 6ATGATTTT 1S4^CTGCA6CTGGAAAATTTAT6TGAAAAAC6 185TCT66AACT6A&C6ATT6C6TG AT lw [Á TTA C C A C C 6 A TTTTC A 66 A A A A A 6 A TA TT6 Í87 [lTt6 T66 6 C A 6 C C A f A t T ACCG 188ATSSC&AAACCCT&6A ACC6ATT A 189 C G TCT&6AT6T6AT6AAATSC6ATAAAAT 190 TTA T GAAC&AT AAAGCGAACACCCGT 191 T Bacteria Archaea Bacteria Bacteria chiB chiB Proteobacteria Betaproteobacteria Proteobacteria Alphaproteobacteria Proteobacteria Alphaproteobacteria Proteobacteria Gammaproteobacteria Euryarchaeota 75 76.3 31 fthodobacterales Rhodospirillales 26 32 J8e-06 (0.01) 75.1 77.4 77.2 77.6 24 29 71.9 22 0.005 (0.01) 70.23(0.01) 4e-04 (0.01) Methanosarcinales 0.15 (0.01) 5e-04 (0.01) 0.23 (0.01) Proteobacteria Gammaproteobacteria Pseudomonadales Proteobacteria A Iphoproteobacteria fthizobtales 77.7 29 24 4e-04 (0.01) 69.3 Proteobacteria 29 le-04 (0.01) 72.6 73.7 73.3 27 24 0.058(0.01) 77.2 25 0.067 (0.001) 0.001 (0.01) 28 Metanococcales Actinomycetales 0.34 (0.01) Methanococci Proteobacteria Proteobacteria Sammaproteobacteria Actinobacteria Ce IF Bacteria 77.6 30 0.007 (0.001) anfD Bacteria Tm 77.4 Bases 77.7 E blast 24 óübew 26 Proteobacteria Betaproteobocteria BTBT3HJN Nitrosomonadales 0.005 ( 0.001) 0.015(0.01) amoB Bacteria amoB Bacteria één 181 CTSCA666CAACTATS6<rrATCA6 182 TGAATATCTGGATAAAGTGTGCGAAATTC 179 6AAA6T6ACCAAC6AA66CAGC&ÁT 180 6 6 C T A T T A T T T T ATTCC6ACCAACCA6 176 AACATTACC&&CA&CT666ATSATTT 177 AAACT6CT6ACC6SC6AAACCATT 178 ATACCT6SCASACCA AACSTT ATATTA&C6 # 0,2/14,2 -53,8 -49 -55,5 37.9 42.3 37.5 -52,3 -48,8 -43,1 50 -55,5 50 -37-60,9 -1>/-93,1 -5,9/-39 -0.4/-984 í,6/-100¿ -5,9/-39 -6/-33,5 J i 2,1/0 1,2/-141,3 ^0,4/24,8 -6,3/112,6; 0,6/2,9 -0,4/24 1,4/0 -46,3 -44,7 1,7/0 2/0 0,6/2,9 -49,7 -44,4 -49,8 -48,3 -55,6 Hairpin b é' b incros (Kcal/mol) (dG/Tm) (dG/Tm) -50,9 1,9/0 -5,9/-39 -48,6 -5,3/-47,9 32.3 37.9 50 32.1 34.5 54.2 40.7 52 43.3 50 46.2 K¿¿ ANEXO 2. Listado de primers reportados en la literatura para los principales procesos enzimáticos considerados en la investigación. Primer (5'-3') Nombre EnzimaMolécula/Taxón PmoA A l 89 F [GGNGACTGGGACTTCTGG] Mb661R II223F [GGTAARGACGTTGCNCCGG] Mb601R Mc468R [CGTCGTATGTGGCCGAC] II646R Mcap630R [ACRTAGTGGTAACCTTGYAA] Forest675R Kolb et al., 2003 [GCSGTGAACAGGTAGCTGCC] [CGTGCCGCGCTCGACCATGYG] [CTCGACGATGCGGAGATATT] [CCYACSACATCCTTACCGAA] PmoA A650R Bourne et [ACGTCCTTACCGAAGGT] al., 2001 DsrAB, DsrD DSR1F [ACSCACTGGAAGCACG] DSR4R Castro et DsrAB, DsrD a!., 2002 [GTGTAGCAGTTACCGCA] P94F [CCTCTAGAATCGG(A/T)ACCTGGAAGGA(C/T) P93R Karkhoff et GACATCAA] al., 1995 [CCTCTAGAGGGCACAT(G/C) GTGTAGCAGTTACCGCA] Enzima- Nombre Primer (5'-3') Molécula/Taxón DsrAB, DsrD DSR1F [AC[C/G]CACTGGAAGCACG] DSR2F [CTGGAAGGA[C/T]GACATCAA] DSR3F [GAAGAA[C/G]ATG[A/T]ACGGG 1IJ DSR4R [GTGTAGCAGTTACCGCA] DSR5R Wagner et NirK, NirS al, 1998 [TGCCGAGGAGAACGATGTC] NirKIF [GG(A/C)ATGGT(G/T)CC(C/G)TGGCA] NirK2F [GC(C/G)(C/A)T(C/G)ATGGT(C/G)CTGCC] nirK3R [GAACTTGCCGGT(A/C/G)G(C/T)CCAGAC] nirK4R [GG(A/G)AT(A/G)A(A/G)CCAGG i TTCC] nirK5R [GCCTCGATCAG(A/G)TT(A/G)TGG] [CCTA(C/T)TGGCCGCC(A/G)CA(A/G)T] nirSIF [TACCACCC(C/G)GA(A/G)CCGCGCGT] nirS2F [TTCCT(C/G/T)CA(C/T)GACGGCGGC] nírS3F [TTC(A/G)TCAAGAC(C/G)CA(C/T)CCGAA] nirS4F [GCCGCCGTC(A/G)TG(A/C/G)AGGAA] nirS3R [CTTGTTG(A/T)ACTCG(C/G)(C/G)CTGCAC] nirS5R tCGTTGAACrT(A/G)CCGGT] nirS6R Braker et al., 1998 NirK Cunir3 [CGTCTA(C/T)CA(C/T)TCCGC(A/C/G)CC] Cunir4 Casciotti & [GCCTCGATCAG(A/G)1T(A/G)TGG] Ward, 2001 Nombre Enzima- Primer (5'-3’) Molécula/Taxón NirK, NirS K15F [GGCATGGTACCTTGGCACGTAACCTCGGGC] K16R [CATTAGATCGTCGTTCCAATCACCGGT] [CACGGYGTBCTGCGCAAGGGCGC] [CGCCACGCGCGGYTCSGGGTGGTA] KA3F KA25R Rósch et al., 2002 nosZ [CGYTGTTCMTCGACAGCCAG] NosZF NosZR Rósch et [CATGTGCAGNGCRTGGCAGAA] al., 2002 NosZ CAMP-N0S661F [CUACUACUACUACGGCUGGGGGCUGACCAA] CAMP-N0S1773R [CAUCAUCAUCAUAURUCGAUCARCUGBUCGU Seala & Kerkhof, U] 1999 AmoA AmoA-lF [GGGGTTTCTACTGGTGGT] AmoA-2R [CCCCTCKGSAAAGCCTTCTTC] Rotthauwe et al., 1997 AmoA NU3 [CCTGTGCrCCATGCTCCG] NEU [CCCCTCTGCTGCACTCTA] NSO190 [CGATccccTGcrn NS01225 [CGCGATTGTATTACGTGTGA] Nsml56 [TATTAGCACATCTTTCGAT] iacc] Nsv443 Mobarry et [CCGTGACCGTTTCGTTCCG] al., 1996 AmoA 301F [GACTGGGACTTCTGGCTGGACTGGAA] 302R [TTTGATCCCCTCTGGAAAGCCTTCTTC] 304R [TAYCGCTTCCGGCGGCATTTTCGCCGC] 305F [GTGGTTTGGAACRGICARAGCAAA] 308R [TCCCAGCTKCCGGTRATGTTCATCC] Norton etal., 2002 Primer (5’-3’) Nombre EnzimaMolécula/Taxón AmoB A3 [TATGTACTGCAGGCAGAAGTTGCGCTTG] A4 Hirota et al., [CGAATTCGACAGGCTAATTGATGCTTCG] 2000 McrA [GGTGGTGTMGGATTCACACARTAYGCWACAG F R Luton et al., C] CdhABCDE 2002 [TTCATTGCRTAGTTWGGRTAGTT] SL degenerados [GCNCARGARAARGCNGTNGARCC] Kang & Young, tTGNACNGGNGCRTTCAT] 1999 NapA V16 [GCNCCNTGYMGNTTYTGYGG] V17 [RTGYTGRTTRAANCCCATNGTCCA] V66 [TAYTTYYTNHSNAARATHATGTAYGG] V67 [DATNGGRTCATYTCNGCCATRTT] GC-clamp [GCCCGCCGCGCGCGGCGGGCGGGGCGGGGGC McDevitt et al., ACGGGGGG] 2000 Hao PhlO (hao3) [CTCCGTAAATATGCGGGTCA] HB5 (haol,2) [CTCCGTAATCTACCTGTTCGTCGGCTT] para Nitrosomonas spp. Hommes et al., 2001 HAO NifH H4 Hirota et ai, [CTCTAGAAATATGGCAAATACGGCACAAGC] 2000 [CTCTAGATAACGATACGGCGCTGTGTC] PolF [TGCGAYCCSAARGCBGACTC] PoIR [ATSGCCATCATYTCRCCGGA] Poly et al., 2001 NifH NifHF [AAAGGYGGWATCGGYAARTCCACCAC] nifHR [1IG I1SGCSGCRTACATSGCCATCAT] K07F [GCGTTCTACGGTAAGGGCGGTATCGGNAAR] AMRR tGCTACTACYTCGCCSGA] Rósch et al., 2002 Enzima- Nombre Primer (5'-3') Molécula/Taxón NblOOO Nitrito oxidasa Mobarry [TGCGACCGGTCATGG-3] et al., 1996 NrfA Para D. vulgaris [CTGAGGAGAAGAGCCGCAAC] pORF571C)f [GCTTGGCGGAGACCAGAC] pORF5712r nrfAE87 nrfAH87 nrfAElO nrfAHIO Browning et al., 2002 PhsABC F [TCAGCGAATTCTAATAACAGGAGG] R [CATTAI 11IATGGATCCGCTCAGAC] F [TCAGCTGGATCCAATAACAGGAGG] R Bang et al., [CATTAI 11IATGAATTCGCTCAGAC] 2000 Glomales (ADNr) LOCT670R [AAGGCCATGACGCTTCGC] ATRP420F [AACAATACAGGGCCTTTAC] Redecker, 2000 grupo Giomus GLOM1310 mosseae/intraradices GLOM5.8R [AGCTAGGYC1AACATTGTTA] [TCCGI1GTTGAAAGTGATC] Redecker, 2000 grupo Glomus LETC1670 etunicatum/ claroideu [GATCGGCGATCGGTGAGT] Redecker, 2000 m Acauiosporaceae ACAU1660 [TGAGACrCrCGGATCGG] Redecker, 2000 Gigasporaceae GIGA5.8R Redecker, 2000 [ACTGACCCTCAAGCAKGTG] Primer (5'-3') Nombre EnzimaMolécula/Taxón A. ARCH1311 Grupos [TGCTAAATAGCCAGGCTGY] gerdemanii/A. trappei Redecker, 2000 y G. occultumjG. brasilianum ANEXO 3. Listado de enzimas-genes para ias cuales no existió reporte de dominios en la base ProDom. genes Enzimas A m o n io m o n o o x ig e n a s a amoBC C O -d e s h id r o g e n a s a cdhE, coxL, coxM N itr o g e n a s a I a lte r n a t iv a s vnfH, anfH, anfK R u s tic ia n in a rusA, rustA A P S red u ctasa surC N itr it o r e d u c t a s a a s i m i l a t i v a e n h o n g o s niiA N itr a to r e d u c t a s a a s im ila tiv a e n h o n g o s niaD L acasas lccl-3, Iac34678, lacio, la c ll, Iacl2f Iacl3, Iacl4, IccK, tHA, Icsl, lapl-2, poxl-3, poxA M a n g a n e s o p e r o x id a s a s mnpl234, mnpB L ig n in p e r o x i d a s a s HpABCEIGHJ, vgll, Hp2, IpglAB Q u itin a s a s chiF, chil5, chi37, chi41, chi55r chi60, chi69, chi80, chi92, chil9, chitiA, chitiB, ctsl, cts2, cht4, kchi, pchA E n d o -B -g lu c a n a s a s cenA, eg l, e g ll, eg/3, eg¡4, eg!5, bglC, egltA C e lo b io h id r o la s a s ce/3, cbhl, cbh2. cbh3. cbhA. cbhB C e lo d e x tr in a s a s celY, celO, acc2, engBDHKLMNY, cenC, bgxA, bglxA