diana fernanda vera r. - Universidad Nacional de Colombia

Anuncio
DIANA FERNANDA VERA R.
Bióloga-Universidad Nacional de Colombia
DIRECTOR
FABIO A. ARISTIZABAL
Departamento de Farmacia
Facultad de Ciencias
DIRECTOR ASOCIADO
EMILIANO BARRETO
Instituto de Biotecnología
2004
1
TÍTULO EN ESPAÑOL: DISEÑO DE UNA ESTRATEGIA PARA LA EVALUACIÓN DE ATRIBUTOS
FUNCIONALES EDÁFICOS MEDIANTE SONDAS DE ADN
TÍTULO EN INGLÉS: DESIGN OF A STRATEGY FOR THE
ATTRIBUTES NEANS DNA PROBES.
EVALUATION
OF FUNCTIONAL
RESUMEN EN ESPAÑOL: Haciendo acopio de la información depositada en las tres principales
bases de datos genómicos internacionales, y por medio del análisis y aplicación de estrategias de
minería de datos, se desarrolló una metodología base para el ulterior diseño de una Herramienta
Molecular de Evaluación Funcional de Suelos. Dicha herramienta sería aplicable en el estudio de la
diversidad bioquímica y los ciclos minerales en los que participan los microorganismos de diversos
ecosistemas terrestres. La información bibliográfica y aquella contenida en las bases, permitió luego
de su evaluación, filtrado y clasificación, el diseño de un modelo conceptual en el cual se visualizan
las rutas metabólicas microbianas involucradas en los ciclos biogeoquímicos del carbono, nitrógeno,
azufre e hierro, sus enzimas correspondientes y los genes codificantes. Dicho modelo pudo ser
utilizado en la proposición de 192 marcadores moleculares para 13 grandes procesos bioquímicos,
que incluyen: la reducción de sulfato, oxidación de compuestos azufrados, metanogénesis,
carboxidotrofía, oxidoreducción de hierro, reducción de nitrato, nitrito, óxido nítrico, óxido nitroso,
amonificación, nitrificación y fijación de nitrógeno, así como marcadores para dos grupos
taxonómicos de endomicorrizas (géneros Paragbmusy Archaeospora). A través de la utilización de
herramientas bioinformáticas se condujo al desarrollo de 191 sondas representativas del 38% de
estos marcadores.
TRADUCCIÓN DEL RESUMEN AL INGLÉS: The investigation stocked up on the information
placed in the three main international genomic databases, and through analysis and application of
data mining strafiegies, conducted to development of a methodology that to subsequently facilítate
the design of a Molécula- Tool of Functional Evaluation of Soils, applicable to the sfcudy of the
biochemical diversity of the mineral cycles in diverse terrestrial ecosystems inside which the
microorganisms are involved. After evaluation, the information was filtered and classificated, it
permitted the design of a conceptual model in which, the metabolical routes involved in the
biogeochemical cycles of the carbón, nitrogen, sulfur and iron, their corresponding enzymes and
the genes are visualized. Said model it could be utilized in the proposal of 192 molecular markers
for 13 biochemical processes, that include: sulphate reduction, sulfur compounds oxidation,
methanogenic way, carboxidotrophy, iron redox, nitrate reduction, nitrite reduction, nitric oxide
reduction, nitrous oxide reduction, ammonification, nitrification and nitrogen fixation, and for two
taxonomic groups of endomycorrhizae (genus Paragbmus and Archaeospora). The útilcatión of
bioinformatic toob was conducted to development of 191 probes, wich represent 38% of the
markers.
DESCRIPTORES O PALABRAS CLAVES EN ESPAÑOL: ciclos biogeoquímicos, marcadores
moleculares, evaluación de suelos, minería de datos, diseño de sondas.
TRADUCCIÓN AL INGLÉS DE LOS DESCRIPTORES: biogeochemical cycles, molecular markers,
soil evaluation, data mining, probes design.
FIRMA DEL DIRECTOR:
Nombre(S) completo(s) del(tos) autor(es) y (Ano de nacimiento): DIANA FERNANDA
VERA RAIGOSA, 21 de Octubre de 1974 (21-10-74).
DISEÑO DE UNA ESTRATEGIA PARA LA
EVALUACION DE ATRIBUTOS
FUNCIONALES EDAFICOS MEDIANTE
¡<
SONDAS DEADN
DIANA FERNANDA VERA RAIGOSA
Investigación presentada como requisito parcial para optar
al título de Magister Scientiae en Microbiología
BOGOTÁ D.C., DICIEMBRE DE 2004
MAESTRIA INTERFACULTADES EN MICROBIOLOGÍA
FACULTAD DE CIENCIAS
UNIVERSIDAD NACIONAL DE COLOMBIA
"El Director de Tesis, el Presidente de Tesis y el Consejo Examinador de Grado, no serán
responsables de las ideas emitidas por el candidato".
(Artículo 217, estatutos de la Universidad Nacional de Colombia)
PRESIDENTE DEL JURADO
A.
* £ 7
JURADO
JURADO
Bogotá D.C., 2004
<Este y todos mis [ogros a quienes no soCo me fian dado (a vida,
sino que [a Han enriquecido con su amory sabiduría, mis padres.
♦ Agradezco a mis directores de tesis EMILIANO BARRETO y FABIO ARISTIZÁBAL por sus ideas y
orientación oportunas.
♦ A la UNIVERSIDAD NACIONAL DE COLOMBIA por el excelente nivel académico, al que he tenido
la fortuna de acceder durante todos mis años de formación profesional.
♦ A mis padres, OMAYRA RAIGOSA y ALCIDES VERA, por haberme apoyado siempre en la
consecución de mis logros con infinito amor.
♦ A mi tía ROSALBA RAIGOSA, por su comprensión y consejo.
♦ A mi amiga CLAUDIA I. MARTÍNEZ, quien me ayudó en los momentos difíciles, con su apoyo
moral y muy importante también: económico.
(r
♦ A VLADIMIR PAEZ FONSECA, quien a lo largo de diez años me ha brindado su amistad
incondicional, apoyándome en la realización de todas mis metas y ofreciéndome su valiosa
ayuda. Su aporte en esta tesis es invaluable.
♦ A GERMAN GÓMEZ, por su cariño, amistad y paciencia durante las etapas de realización de
esta tesis y por su importante aporte de conocimientos en el área de sistemas.
♦ A la Profesora MARTHA R. FONTANILLA por su calidad docente, gracias a la cual inicié el
aprendizaje y comencé a interesarme en la biología molecular.
♦ Al profesor ABDÓN CORTÉS, quien promovió mi cariño por la ciencia del suelo.
INTRODUCCIÓN.................................................................................................. 11
OBJETIVOS........................................................................................................ 15
2.1. OBJETIVO GENERAL.................................................................................. 15
2.2. OBJETIVOS ESPECÍFICOS.............................................................................15
MARCO CONCEPTUAL............................................................................................ 16
3.1. BIODIVERSIDAD........................................................................................16
3.2. GRUPOS FUNCIONALES Y DIVERSIDAD FUNCIONAL........................................... 17
3.3. CICLOS BIOGEOQUÍMICOS...........................................................................18
3.4. EVALUACIÓN DE SUELOS............................................................................. 20
3.5. ARREGLOS DE ADN Y EL ACCESO A LA BIODIVERSIDAD....................................... 21
3.6. CONCEPTOS PARA EL DISEÑO DE UN MICROARREGLO......................................... 23
3.7. BIOINFORMÁTICA...................................................................................... 25
METODOLOGÍA................................................................................................... 32
4.1. LA CONCEPCIÓN HOLÍSTICA DE LOS CICLOS BIOGEOQUÍMICOS.............................32
4.2. OBTENCIÓN Y MANIPULACIÓN DE DATOS MOLECULARES.....................................32
4.3. DISEÑO DE SONDAS...................................................................................38
RESULTADOS........................................................................ ............................. 42
DISCUSIÓN DE RESULTADOS.................................................................................. 67
6.1. RUTAS BIOQUÍMICAS..................................................................................71
6.1.1. Cido del Carbono:................................................................................ 71
6.1.2. Cido del Azufre:...................................................................................74
6.1.3. Cido del Nitrógeno............................................................................... 75
6.1.4. Cido del Hierro................................................................................... 77
6.1.5. Cido del Fósforo.............................................................................. .....78
6.2. MODELO CONCEPTUAL............................................................................... 79
6.3. APROXIMACIÓN FUNCIONAL........................................................................ 81
6.4. BASE DE DATOS....................................................................................... 32
6.5. ANÁLISIS DE LAS HERRAMIENTAS Y CRITERIOSBIOINFORMÁTICOS........................87
6.6. DISEÑO DE OUGONUCLEÓTIDOS................................................................... 91
CONCLUSIONES.................................................................................................. .95
RECOMENDACIONES.............................................................................................97
BIBLIOGRAFÍA
Figura 1. Esquema genera! de la realización de un m icroarreglo, Lucchini et ai.,
[2001]................................... ............................................................... .....22
Figura 2. Salida del programa ClustalX...................... .................. .....................35
Figura 3. Salida de! programa CeneDoc en donde se observa la salida del
alineam iento en ClustalX de secuencias pertenecientes a l ADN codificante para
ARNr 18S de Arcbaeospora. Las zonas azules corresponden a áreas de gran
sim ilitud, en tanto que las naranja presentan algunas discrepancias. Abajo
secuencia consenso.............................. .............. .......................... ......
37
Figura 4. Salida de! programa NJPLOT, donde se observa un cladograma obtenido a
través de CíustafX..... ..................................... .
38
Figura 5. Ventana de! subprograma Oligo, de GeneRunner............ ........ ............40
Figura 6. Diagrama de rutas bioquím icas de los ciclos d el carbono, nitrógeno, azufre
e hierro (páginas siguientes)................... ................ ................................. .....42
Figura
7. Modelo conceptual de integración de los ciclos biogeoquím icos
considerados {página siguiente)..... ....................................... .......... ............ 50
Figura 8. Representación de la proporción de secuencias de ADN para cada grupo
enzim ático a nivel de Dom inio taxonómico. Clave de abreviaturas ver Tabla 3......52
Figura 9. Distribución de las secuencias de ADN encontradas por División.............53
Figura 10. Histograma de frecuencia de secuencias de ADN por Género...............53
Figura 11. Representación de la proporción de secuencias de proteína para cada
grupo enzim ático a nivel de Dominio taxonómico (abreviaturas ver Tabla 3).......... 54
Figura 12. Distribución de ¡as secuencias de proteína encontradas, por División.... 55
Figura 13. Histograma de frecuencia de secuencias de proteína por Género......... 55
Figura 14. Número de sondas seleccionadas a p a rtir de las secuencias de ADN, por
nive! taxonómico........... ................. ............. ....... ............................. ..66
Figura 15. Número de sondas seleccionadas por nivel taxonómico, a p artir de las
secuencias de proteína traducidas................... ............................................ . 66
Figura
16.
Ventana de bienvenida a la
consulta para ¡a base de datos
Bioproc_suelos..................................... .............................. ................. .......,.S3
Figura 17. Ventana de consulta de la base de datos BioProc_suelos............ ........83
Figura 18. Salida del programa BlastN del NCBI............................................... 91
Tabla 1. Formato de ingreso de inform ación a la base de datos Bioproc_Sueíos...... . 33
Tabla 2. Parám etros utilizados para e l análisis de especificidad por medio de BLAST... 39
Tabla 3. Listado de géneros m icrobianos y enzimas seleccionadas, incluidos en e l
análisis.......................... ..................... *....-............... ..................................... 56
Tabla 4. Listado de procesos enzimáticos, catalizadores y genes codificantes utilizados..
60
Tabla 5. Elem entos esenciales para la mayoría de las plantas superiores y
concentraciones internas que se consideran adecuadas [Salisbury & Ross. 1994]...... 70
ANEXO 1. Oligonuc/eótidos diseñados y sus parám etros termodinámicos y físicos
(páginas siguientes)...................... .............. .............. ..................... ........ ..111
ANEXO 2. Listado de prim ers reportados en la literatura para ¡os principales procesos
enzim áticos considerados en la investigación......................... ........ ...................118
ANEXO 3. Listado de enzimas-genes para las cuales no existió reporte de dom inios en
la base ProDom................... ................... ....................................................... 123
INTRODUCCIÓN
El suelo constituye una fuente primordial de vida para la Tierra, siendo el medio de sostenimiento y
nutrición para las plantas. Es un hábitat que posee una gran diversidad de microorganismos
(bacterias, arqueas, hongos, algas, protozoarios y virus), y en el cual se desarrolla todo tipo de
biota macroscópica (coleópteros, miriápodos, hormigas, colémbolos, nemátodos, ácaros, larvas,
mamíferos pequeños y reptiles). Sus componentes bióticos y abióticos en permanente interacción,
son el motor de los ciclos biogeoquímicos en los ecosistemas terrestres (mineralización de la
materia orgánica, nitrificación, fijación de nitrógeno y oxidación de metano, entre otros procesos)
[Luna eta l, 2002], considerándose que entre el 80 y 90% de los procesos edáficos, se encuentran
mediados por microorganismos [Nannipieri et al., 2003]. El suelo es un sistema de suma
complejidad, por lo que no obstante la realización de numerosos estudios (básicamente ex situ)
que han ayudado a comprender sus procesos fisiológicos individuales, así como los mecanismos y
organismos involucrados, persisten la incertidumbre y el desconocimiento acerca de la manera
como se produce el acoplamiento de dichos componentes en una maquinaria eficiente, y de los
principios que rigen su resistencia al cambio y promueven la homeóstasis.
El estudio de los ecosistemas, en particular del edáfico, puede emprenderse no solo a partir de la
consideración de los organismos o poblaciones, sino también estudiando el ambiente abiótico en
relación con ellos. De los 90 elementos químicos que se encuentran en la naturaleza, 30 a 40 son
necesarios para los organismos vivos. Algunos, son requeridos en grandes cantidades (carbono,
hidrógeno, oxígeno y nitrógeno), en tanto que otros lo son en menor proporción. Ciclos como el del
carbono, son considerados más "móviles" que otros, debido a que el material es devuelto al medio
tan rápidamente como le es quitado. Otros en cambio, son menos móviles, y así una porción de la
reserva puede perderse por largos periodos de tiempo, en lugares o formas químicas inaccesibles
para los organismos [Odum, 1972]. De allí la importancia que tiene distinguir qué procesos
bioquímicos y con qué intensidad son llevados a cabo por parte de los diversos grupos microbianos,
para así determinar su dinámica de consumo/retorno en un suelo particular.
Hasta hace muy poco, la identificación de grupos fisiológicos microbianos y la evaluación de su
diversidad en suelos, exigía el aislamiento a partir de cultivos en medios diferenciales [Amann et
al, 1995]. El establecimiento de sus niveles poblacionales requería la utilización de técnicas de
conteo en placa, las cuales no revelan la realidad edáfica. Se sabe que en muchos casos, las
células no forman colonias visibles sobre medios de cultivo [Amann e ta i, 1995] y en la mayoría de
ellos, se trata de especies no cultivables, pues con los métodos tradicionales solo se ha registrado
cerca del 1% de la comunidad microbiana total del suelo [Borneman & Triplett, 1997]; otros
presentan requerimientos específicos, no dilucidados aún. De esta forma, se estima que en el
suelo, del 80 al 90% de los microorganismos aún permanecen sin identificar [Borneman et al,
1996]. Debido a las deficiencias existentes en cuanto al conocimiento de la magnitud de grupos
taxonómicos, es posible que este acercamiento no sea adecuado al momento de diseñar un
método de evaluación de suelos; puesto que ello implicaría tres aspectos relevantes y generadores
de sesgo: i) Solo estaría representado un muy pequeño porcentaje de la totalidad de especies; ii)
Se debería hacer una jerarquización por importancia ecológica de las especies a seleccionar, con el
fin de escoger solo aquellas "relevantes", esto, si se ha podido establecer previamente el alcance
del término; y iii) para que el método no tuviera una aplicación restringida, se deberían tener en
cuenta especies microbianas consideradas como "ubicuas", las cuales no han sido determinadas
experimentalmente [Cho &Tiedje, 2000]. Como indican algunos autores [Hooper et al, 2002], la
riqueza de especies como una medida simple de diversidad biótica, no tiene un suficiente poder
descriptivo: la dinámica de los procesos que se dan al nivel de un ecosistema, dependen más de
las características funcionales (metabólicas) de los organismos involucrados, que de su identidad
taxonómica, aunque esta sea implícita. La diversidad funcional, se refiere al intervalo y valor de
tales características, que resultan influyentes en las propiedades o atributos del ecosistema. De
acuerdo con algunos autores [Hooper e ta l, 2002], esta medida puede ser expresada en una gran
variedad de formas, incluyendo el número y abundancia relativa de grupos funcionales, la variedad
de interacciones con los procesos ecológicos o la diferencia promedio entre especies en aspectos
relacionados con la función.
El funcionamiento y la estabilidad de cualquier ecosistema son
posibles gradas a la compartimentalización de procesos llevados a cabo por diferentes poblaciones,
de tal manera que su coexistencia depende de que no haya sóbrelapamiento total de sus nichos
funcionales. De esta manera, una comunidad extremadamente dinámica facultará el sostenimiento
de un ecosistema funcionalmente estable [Fernández etal, 1999].
Por último, la problemática de la variedad de técnicas utilizadas en el estudio de las poblaciones
microbianas del suelo (FISH, extracción y reasociación de ADN, comparación de lípidos de
membrana [McCaig et al, 1999]; detección por variantes de PCR, RFLPs, ARDRA, clonación de
ARNr 16S, DGGE, TGGE [McCaig et a/, 1999]; RISA [Jensen e ta l, 1993]; SSCP [Lee et a l, 1996],
entre otras), además de las modificaciones desarrolladas para cada aplicación en particular, hacen
que el proceso de encontrar patrones ecológicos para las especies microbianas, empleando las
diferentes investigaciones publicadas, sea una labor imposible; haciendo irrealizable el contraste de
resultados a nivel taxonómico.
Las posibilidades de evaluación de un gran número de genes en paralelo, han hecho que la
aplicación de microarreglos sea una herramienta cada vez mas utilizada y con grandes perspectivas
en el área ambiental; esto ha sido reconocido por diversos autores, entre ellos, Dennis et al.
(2003), quienes encontraron en la técnica, una solución para la deteccción de la expresión de
genes bacterianos en aguas residuales y otros sistemas complejos. Algunos investigadores, han
empleado esta herramienta para la exploración de vías bioquímicas aisladas en algunos ciclos de la
materia, tal es el caso de Loy et a l (2002), quienes realizan una aproximación taxonómica por
medio de marcadores para ARNr, en la evaluación de linajes de reductores de sulfato. Otros, usan
la aproximación funcional en la evaluación de rutas parciales, como el caso de Wu et al (2001),
recurriendo a esta técnica para la estimación de la reducción de nitrito y la oxidación de metano y
amonio en ambientes marinos. Sin embargo, una aproximación funcional, que además faculte la
visualización y comprensión completas de la complejidad funcional del suelo, no ha sido abordada.
Adicional mente, se detectó la carencia de esquemas que permitieran visualizar las interaciones que
pueden generarse entre los ciclos biogeoquímicos, y que de esta manera, facilitan el análisis de los
resultados que pueden ser encontrados por medio de la aproximación experimental.
Con base en las anteriores premisas, se plantea el diseño de una metodología que permita a
futuro, el desarrollo y aplicación de una herramienta, utilizando marcadores moleculares específicos
para grupos funcionales microbianos, involucrados en los ciclos biogeoquímicos de ecosistemas
terrestres. Dada la complejidad del subsistema edáfico y el alto grado de incertidumbre existente al
momento de establecer la causalidad de la mayoría de los fenómenos ocurrentes en él [Burke et
al, 2003], el diseño de la metodología y la futura aplicación de una herramienta molecular,
generarán avances en el proceso de evaluación de la relación existente entre tales factores y la
dinámica funcional de los microorganismos telúricos.
OBJETIVOS
2.1.
OBJETIVO GENERAL
Diseñar una metodología para la evaluación molecular de grupos funcionales
microbianos de relevancia en suelos.
2.2. OBJETIVOS ESPECÍFICOS
2.2.1.Realizar un modelo conceptual que permita la comprensión del funcionamiento e
interacciones existentes entre los grupos metabólicos microbianos del suelo.
2.2.2.Identificar con ayuda del modelo conceptual, aquellas enzimas que resulten más
representativas de los procesos funcionales seleccionados.
2.2.3.Determinar los marcadores moleculares apropiados para cada una de las enzimas
designadas.
2.2.4.Diseñar los oligonucleótidos necesarios en la construcción de las sondas de ADN para cada
marcador elegido.
MAMO CONCEPTUAL
Los microorganismos habitan prácticamente todas las regiones del planeta, desde los polos, en
ambientes bajo el punto de congelación y muy secos, hasta los trópicos con temperaturas altas y
con elevada precipitación pluvial. Su presencia y actividad son esenciales para la salud y
funcionamiento adecuado de todos los ecosistemas [Olalde & Aguilera, 1998].
3.1. BIODIVERSIDAD
Biodiversidad, es la variedad y variabilidad de todas las formas de vida, el complejo ecológico en el
cual están presentes, y los procesos de los que forman parte [Olalde & Aguilera, 1998]. En este
sentido, y en relación con los microorganismos, el suelo es un ecosistema de enorme riqueza
microbiana [Olalde & Aguilera, 1998]. El estudio de la diversidad de microorganismos en el suelo
es un reto formidable, en primer lugar, porque las definiciones clásicas de especie no se aplican a
los microorganismos (muchos no tienen ciclo sexual) y hay que ajustarlas: el aspecto morfológico
no es muy útil, debido a que morfológicamente muchos microorganismos distintos parecen
similares. De esta manera, se tiene que hacer uso de las características fisiológicas para definir
especies. En segundo lugar, la necesidad de mantener condiciones controladas, hace que los
microorganismos deban ser aislados y estudiados en el laboratorio; además del hecho de que un
mismo microorganismo puede comportarse de maneras muy distintas ante cambios ambientales
[Valencia & Peña, 2001].
La evaluación de la diversidad genética expresa el potencial de las capacidades metabólicas en un
ambiente, no obstante es más difícil de efectuar [Valencia & Peña, 2001], debido a que requiere
conocer el número de genomas distintos y el conjunto total de genes microbianos presentes en un
espacio/tiempo determinado. Una medición de la diversidad más operativa, es la diversidad
funcional, definida como el conjunto de capacidades metabólicas o procesos distintos presentes en
el suelo; es una información más gruesa que no repara en taxa y que no requiere graneles
conocimientos acerca de los microorganismos presentes y sus ciclos, pero que expresa las
capacidades metabólicas de éstos [Valencia & Peña, 2001].
3.2. GRUPOS FUNCIONALES Y DIVERSIDAD FUNCIONAL
Los pasos en la transformación individual de sustratos están asociados con grupos microbianos
metabélicamente definidos (ej. denitrificantes, nitrificantes y fijadores de nitrógeno, etc.)
[Taroncher et al., 2003]. Diversos microorganismos pueden llevar a cabo un paso individual,
proveyendo un ensamblaje con redundancia de capacidades. Tales agrupamientos que realizan un
proceso bioquímico común, pueden ser definidos como un grupo funcional. Recientes estudios en
el área de diversidad microbiana, centrados sobre los genes de ARNr 16S y otros genes
funcionales, codificantes de enzimas responsables de transformaciones específicas, indican que los
grupos funcionales pueden ser inmensamente diversos [Taroncher etal, 2003].
A menudo, la clasificación funcional tiene dos objetivos distintos, uno de los cuales es investigar los
efectos de las especies sobre las propiedades del ecosistema (grupos funcionales de efecto) y otro
que examina la respuesta de las especies a cambios en el ambiente, tales como disturbios,
disponibilidad de recursos, o clima (grupos funcionales de respuesta) [Hooper etal., 2002].
Los organismos del suelo parecen tener un alto nivel de redundancia funcional [Wolters et al.,
2000]. Esto sugiere que los procesos que involucran la transferencia de nutrientes a través de la
esfera de nutrición del suelo están ampliamente distribuidos a través de la comunidad subterránea.
Las funciones llevadas a cabo por especies con actividades únicas sin embargo, son una excepción.
El ejemplo más notable es provisto por los pocos géneros de bacterias que llevan a cabo ciertas
transformaciones en el ciclo del nitrógeno (como nitrificación, denitrificación) [Wolters etal., 2000].
En forma similar, la habilidad para degradar substratos orgánicos recalcitrantes tales como lignina
o sustancias húmicas, está confinada a unos pocos géneros microbianos [Wolters et al., 2000].
Una gran acumulación de mantillo sobre la superficie del suelo debida a la pérdida de organismos
capaces de romper materiales recalcitrantes, puede alterar drásticamente la disponibilidad de
nutrientes para las plantas [Wolters etal., 2000].
3.3. CICLOS BIOGEOQUÍMICOS
Los organismos de la superficie y subterráneos, resultan críticos dentro de los ciclos
biogeoquímicos, pero aún existe un conocimiento limitado acerca de la manera como la biota que
vive bajo tierra y sus funciones, son dependientes de la biota existente en la superficie y viceversa.
El mantenimiento de la vida con cierto grado de equilibrio, depende de dos factores: el recambio
cíclico de elementos indispensables, fundamentalmente, carbono, nitrógeno, oxígeno, fósforo y
azufre y el aporte constante de energía solar. A través del proceso fotosintético y la energía solar,
los productores primarios, extraen elementos del medio ambiente en forma de compuestos
inorgánicos y biosintetizan compuestos orgánicos, que son incorporados en células y tejidos. Estos
materiales orgánicos acumulados, representan de forma directa o indirecta la fuente de energía
para otros integrantes de las redes tróficas. Antes de que estos elementos puedan ser utilizados
nuevamente como alimento para los organismos fotosintéticos, deben volver a su estado
inorgánico [Sztern & Pravia, 1999]. Esta conversión del estado orgánico al inorgánico es conocida
como mineralización y se debe en gran parte a la descomposición de los restos vegetales y
animales, así como de los productos orgánicos de la excreción de estos últimos [Sztern & Pravia,
1999]. Es llevada a cabo por un grupo de microorganismos denominados genéricamente como
descomponedores. Se estima que aproximadamente el 90% del C02que se produce en la biosfera
se debe a la actividad metabólica de este grupo. La gran importancia de los microorganismos en el
proceso de mineralización es el resultado de tres factores [Sztern & Pravia, 1999]: su
omnipresencia en la biosfera, consecuencia de la facilidad de propagación de los organismos; su
elevada velocidad metabólica y de crecimiento, y la gran diversidad fisiológica que les confiere una
capacidad colectiva para degradar todos los compuestos orgánicos naturales que se pongan a su
alcance. Todas las sustancias orgánicas naturales, son descompuestas por al menos una población
microbiana, lo que explica la ausencia de materia orgánica inalterada en la biosfera cuando se
mantiene el equilibrio entre la velocidad de emisión de ésta, y la capacidad de transformación de
los descomponedores [Sztern & Pravia, 1999]. Sin embargo, cualquier especie microbiana en si
misma, es un agente limitado de mineralización, la gran versatilidad metabólica es consecuencia de
la acción conjunta de una gran diversidad de grupos fisiológicos [Coates et al., 2002].
Compuestos de Importancia Especial en el Ciclo del Carbono
Dentro del ciclo del carbono, los hongos juegan un papel fundamental, puesto que son unos de los
organismos responsables de transformar alrededor del 80% de la celulosa que se produce, la cual
es la mayor reserva de carbono existente y el polisacárido más abundante en la naturaleza, con
una producción que se estima en 1.4 billones de ton/año [Cabrera, 2000].
Entre los hongos, los basidiomicetos son comúnmente los recicladores dominantes de los residuos
de plantas, debido a que son importantes productores de enzimas modificadoras de lignina:
peroxidasas de lignina y manganeso, y lacasas [Thorn et al, 1996]. La degradación del
componente lignina en la materia orgánica es el paso más limitante para la descomposición
eficiente de la celulosa asociada. El conocimiento de la fisiología de la degradación de lignina por
los basidiomicetos, está limitada a unas pocas especies habitantes de leños; aquellos que causan la
pudrición blanca en la madera, son los más eficientes degradadores de lignina en la naturaleza
(Phanerochaete chrysosporium y Trametes versico/o/) [Thorn et al, 1996]. Otro compuesto
importante es la quitina, un polímero de N-acetilglucosamina, constituyente común de los
exoesqueletos de los artrópodos y que también está presente en las paredes celulares de algunos
hongos. La hidrólisis es usualmente mediada por enzimas extracelulares inducibles denominadas
quitinasas, encargadas de romper los enlaces beta entre carbonos 1-4 del carbohidrato [Stanier et
a l, 1986].
Las sustancias húmicas son los materiales orgánicos naturales no vivos más extendidos y ubicuos
en medios acuáticos y terrestres y representan la principal fracción de materia orgánica del suelo
[Steffen et al, 2002]. Las sustancias húmicas comprenden una mezcla física y químicamente
heterogénea de compuestos biogénicos de peso molecular relativamente alto con una naturaleza
mixta, alifática y aromática [Steffen et al, 2002], La degradación microbiana de las sustancias
húmicas - particularmente de las de alto peso molecular, mitades aromáticas en AH (ácidos
húmicos) y humina—es una parte importante del retorno del humus y es de esta manera esencial
para el mantenimiento del ciclo del carbono global [Steffen et al, 2002]. Algunos de los hongos
basidiomicetos de la pudrición blanca, que colonizan madera, desintegran AH de alto peso
molecular formando AF (ácidos fúlvicos) de bajo peso molecular y dióxido de carbono. Se observó
correlación entre la actividad de las peroxidasas extracelulares y la degradación de AH, y una
peroxidasa de manganeso (MnP) que despolimerizaba y mineralizaba in vitro diferentes AH
[Steffen etal, 2002].
3.4. EVALUACIÓN DE SUELOS
Todos los parámetros físicos y químicos usados en el conocimiento de la textura y calidad del
suelo, tales como densidad de poros, capacidad de infiltración, materia orgánica, pH, conductividad
eléctrica y fertilidad, pueden ser medidos por los laboratorios de suelo de manera rutinaria. Sin
embargo, los parámetros biológicos tales como biomasa microbiana, nitrógeno potencialmente
mineralizable y respiración, son indicadores recientes y un poco más problemáticos. Existen tres
vías básicas para acceder a la biomasa microbiana del suelo: su conteo a través de microscopio, la
medición de un indicador de actividad como el C02, o la medición de partes de microorganismos,
tales como membranas. Generalmente estos métodos son indicadores muy amplios de la biomasa
microbiana o de su actividad.
Últimamente, se han diseñado métodos moleculares como
indicadores de biomasa microbiana y/o diversidad y composición de especies, tales como AFLPs y
RISA entre otros [Gregory etal., 2003; Peplies etal., 2003].
La aplicación de técnicas moleculares se ha incrementado durante los últimos años [Morris et al.,
2002], debido a que éstas permiten un mejor acceso a las comunidades. Sin embargo, no se han
desarrollado herramientas que permitan analizar conjuntamente diversas rutas metabólicas.
Algunos autores [Borneman & Triplett, 1997], aplicaron la técnica RISA para determinar los efectos
de la deforestación en la Amazonia, lo cual demostró un impacto profundo, cuantitativo de ésta
sobre la diversidad bacteriana del suelo. Este trabajo efectuado para acceder a los efectos del
manejo del suelo sobre la diversidad microbiana en forma independiente de cultivo, estuvo seguido
por otras investigaciones, como aquella realizada por Buckley et al. [1998], quienes en un estudio
a largo plazo realizado en la estación biológica Kellogg, encontraron que la diversidad de los
campos cultivados sin otra intervención, difirió poco de aquella que sí sufrió regímenes de manejo
agrícola; aún así, la diversidad bacteriana de los suelos con manejo fue significativamente diferente
de aquella de suelos que nunca habían sido cultivados. El estudio de Taroncher et al. [2003],
utilizando un microarreglo de oligonucleótidos para analizar la diversidad funcional de genes
implicados en el ciclo del nitrógeno en sedimentos de río (sistema de bahías de Shesapeake),
resulta ser pionero en el tema. Una investigación centrada en la caracterización de una comunidad
microbiana dependiente de nitrato, utilizando al gen narG como marcador funcional, fue llevada a
cabo por Gregory et al. [2003]. También, la utilización de DGGE en el trabajo de Ovreas et al.
[1998], permitió determinar cambios en la comunidad microbiana en un suelo sometido a actividad
agrícola en Krohnestykket, Noruega. No obstante, para ejecutar análisis de este tipo de manera
masiva, es necesario determinar aquellos marcadores moleculares que puedan resultar mas
adecuados.
Los marcadores moleculares (fragmentos o porciones de ADN, detectados de forma directa o
mediante su expresión sea ARNm o proteína), pueden asociarse a características fenotípicas
deseables en el organismo de interés. Una gran variedad de estos marcadores ha sido aplicada
para el estudio de las comunidades de microorganismos, tales como los genes para proteínas del
choque térmico, glutamina sintetasa, ATPasa, topoisomerasas, genes para ARNr, muy útiles en la
caracterización de tales comunidades.
Para los microorganismos del suelo, han sido utilizados
marcadores relacionados con el metabolismo del nitrógeno, tales como genes para la enzima
nitrogenasa, óxido nitroso reductasa y nitrito reductasa. Asimismo, se han aplicado genes que
intervienen en la oxidación de metano o de amonio entre otros [Kent & Triplett, 2002], a través de
técnicas que aprovechan la capacidad de hibridización existente entre cadenas de nucleótidos,
tales como los arreglos de ADN.
3.5. ARREGLOS DE ADN Y EL ACCESO A LA BIODIVERSIDAD
Los microarreglos de ADN son una herramienta poderosa para el análisis paralelo de muchos
genes, basados en el fenómeno de hibridización ADN-ADN (Figura 1) [Kent & Triplett, 2002]. Los
arreglos de ácidos nucleicos o chips de ADN, proveen oportunidades para la detección múltiple de
ácidos nucleicos. Originalmente diseñados para secuenciación a gran escala, diagnóstico clínico y
análisis genético [Small et al, 2001], los arreglos tienen un enorme potencial para el análisis de
comunidades microbianas, detección de patógenos y monitoreo de miles de genes [Dennis et al,
2003].
Muestra bacteriana de referencia
.*$§&>.
Muestra bacteriana de prueba
v
/^DNc marcado mezclado e hibridizado al microarreglo
ADNc se une al gen correspondiente
F • •
■:■-©
Expresado solo
'ó- ' •
Btpnesado en
Solo en
--".y.-'-7$
No
Figura 1. Esquema general de la realización de un microarreglo, Lucchini et al., [2001].
Las aproximaciones comunes para la fabricación y análisis de arreglos, incluyen sondas de ADNc y
oligonucleótidos fijos sobre un elemento plano, geles, o láminas de vidrio [Small etal, 2001]. Solo
recientemente, la tecnología del arreglo se ha extendido al área ambiental, y aunque tiene un gran
potencial para caracterizar las comunidades microbianas y su función en el ambiente [Taroncher et
al., 2003], su uso es limitado por el costo de los equipos para la generación de imágenes e
impresión del arreglo. Las aplicaciones ambientales de esta tecnología incluyen los estudios de
expresión genética, la identificación y genotipificación de bacterias basada sobre similitudes ADNADN, genética de poblaciones y detección de genes funcionales [Taroncher et al, 2003]. Ellos
pueden ser usados para identificar y cuantificar los genes microbianos involucrados en las
transformaciones biogeoquímicas del ambiente.
Basados en el principio de hibridización
mencionado, las sondas son diseñadas para una multiplicidad de blancos, incluyendo diferentes
genes y variantes del mismo gen, que llevan a la determinación de la presencia y abundancia de
genes específicos. Las aplicaciones más comunes de los microarreglos utilizan oligonucleótidos de
ADN de diferentes tamaños, representando la secuencia parcial o total de los genes específicos. En
el estudio realizado por Taroncher et al. [2003], los autores detectaron múltiples variantes del
mismo gen optimizando el proceso de diseño de la prueba y las condiciones de hibridización con
22
oligonucleótidos de 70-meros; llevaron a cabo ensayos con los genes representativos de las
familias de genes para la nitrogenasa, la nitrito reductasa desasimilativa y la amonio
monooxigenasa, y no observaron hibridización cruzada entre las tres familias de genes o entre los
tres subgrupos de genes de la nitrito reductasa (nirS, nirK, y nirK). Ahora, es posible diseñar un
microarreglo de oligonucleótidos que tenga en cuenta una variedad de genes involucrados en
diferentes vías geoquímicamente relevantes en paralelo y analizarlos simultáneamente en un
estudio completo.
3.6. CONCEPTOS PARA EL DISEÑO DE UN MICROARREGLO
Los primeros microarreglos de oligonucleótidos contenían cientos de sondas distintas por gen, en
orden a maximizar la sensibilidad y especificidad de detección [Norton et al., 2002]. No obstante,
con el paso de los años, el número de oligos utilizado por gen ha decrecido, debido parcialmente al
incremento en la cantidad de información que se ha hecho disponible en las bases de datos; así
mismo, los algoritmos de selección de sondas han mejorado, con lo cual, el número requerido de
oligos ha disminuido y la tendencia ha sido la de maximizar el número de genes que son ensayados
simultáneamente sobre un microarreglo, más que la colocación indiscriminada de todo tipo de
secuencias sobre él [Antipova et al., 2002]. Debido a esta necesidad, se han incrementado los
métodos utilizados para reducir el número de sondas por gen, mientras se maximiza la sensibilidad
y especificidad de estos grupos reducidos de oligos [Antipova et al., 2002].
Tampoco se consideró la utilización de "todas" las variantes posibles de una secuencia como una
orientación adecuada, debido a que esto hace que la aproximación sea más de tipo taxonómico
que funcional. El objetivo primordial es llegar a la detección de la actividad efectiva de una gran
variedad de organismos en el suelo para una función dada, mas no el hallazgo de una especie
particular, aún cuando esta información pueda ser obtenida. Las variaciones de secuencia que
puedan detectarse por medio del uso de las sondas diseñadas no se conoce y solo podrá evaluarse
una vez se realicen estudios de campo. Sin embargo, en otros estudios, se ha determinado que
una sonda degenerada de 70 nucleótidos puede detectar genes con quienes comparta hasta un
87% de identidad [Tamaru et al., 2000], lo cual implica una variación de 9 nucleótidos. El hecho de
que las sondas proceden de secuencias involucradas en procesos de gran importancia para la
supervivencia de los microorganismos, es una circunstancia que podría favorecer su escasa
variabilidad.
Igualmente, el microarreglo puede ser diseñado de una manera tal, que los genes puedan ser
dispuestos por grupo funcional, facilitando la visualización de la ocurrencia de las reacciones
aisladas, en conjunto dentro de un ciclo, o a nivel integrado de todos los ciclos. El microarreglo
permite detectar puntos de ruptura de los procesos y correlacionarlos con parámetros ambientales
para establecer sus causas. Igualmente, poner en evidencia las porciones de un ciclo que pueden
resultar más susceptibles de ser afectadas, ya sea porque el sustrato enzimático no está presente
en concentraciones adecuadas, por la carencia de factores inductores o porque los organismos
encargados de su ejecución se encuentran inactivos o pueden haber sido eliminados del medio. Sin
embargo, es necesario precisar que como otro tipo de aproximaciones, ésta permite obtener
resultados comprobatorios mas no reprobatorios, es decir la señal de hibridización puede
manifestar la ocurrencia del proceso enzimático con un nivel de significancia dado, pero la ausencia
de señal no permite aseverar que la reacción no se está produciendo.
Un aspecto que debe ser considerado para el diseño y evaluación del microarreglo, es el número
de copias de un gen que pueden estar presentes en una célula en un momento dado, puesto que
este factor incide en la intensidad de la señal registrada [Farrelly et ai, 1995]. Por ejemplo, en
Nitrosomonas europaea, se ha encontrado que los genes amoC, amoA y amoB (amonio
monooxígenasa), que son adyacentes, se presentan en dos copias [Hirota etaí, 2000]. En el caso
de los genes para la denitrificación y la fijación de nitrógeno se reporta un bajo número de copias.
En tanto que los genes para la hidroxilamina oxidoreductasa {hao), presentan números variables
de éstas. Nuevamente en N. europaea se han reportado 3 copias de hao, que muestran tan solo 1
pb de diferencia en sus 1701 pb [Hommes et al, 2001]. Este hecho hace pensar en la necesidad
del cálculo de factores de corrección para tal evento. La dificultad que existe en el presente, es que
aun cuando para algunos grupos taxonómicos ya se conoce información acerca del número de
copias, esta no es la regla. Se sabe que este número puede variar entre especies y esto hace casi
imposible el conocimiento total a mediano plazo.
La planificación de un microarreglo va más allá del proceso de laboratorio, inicia con una estrategia
que debe dar respuesta a preguntas como: ¿Cuál será el alcance del microarreglo?, ¿cuál será la
forma de extracción de ARN que maximice la información?, ¿qué limitaciones tiene el proceso de
extracción?, ¿cuales restricciones técnicas y financieras existen?, ¿cuántas réplicas de la muestra se
van a tener en cuenta? (normalmente se sugieren 3), ¿cuál va a ser el número de copias de la
sonda?, etc. [Peng & Stromberg, en línea].
Las principales fuentes de variabilidad en el diseño del arreglo son: Las interacciones no específicas
debidas a complejidades combinatoriales en la población blanco, la equivalencia termodinámica de
las sondas, y la preparación y amplificación del ADN prueba, todas las cuales fueron tenidas en
cuenta para el establecimiento de la población final de oligonucleótidos [Taroncher etal, 2003].
Entre las diferentes fuentes de error previas al desarrollo del microarreglo se encuentran:
a. La técnica de extracción de ADN, puesto que algunas técnicas extraen una menor concentración
de ADN fúngico frente al bacteriano, y existen probabilidades de coamplificacion de otros
organismos eucariotes como algas, plantas y nemátodos, la presencia de compuestos húmicos,
etc. Hoy día existen diversos métodos que han mostrado eficiencia en la recuperación de ADN
de buena calidad, especialmente en suelos con altos contenidos de ácidos húmicos y taninos,
como los tropicales [Nannipieri et al., 2003].
b. El número de ciclos considerados para la amplificación por PCR puede ser problemático. Soares
et al [1997], recomiendan intervalos entre 22 y 25 ciclos para evitar el incremento en la
proporción de secuencias quiméricas.
c. Los cebadores (primers) empleados en la amplificación del ADN microbiano a partir de suelo
deben ser lo suficientemente sensibles como para amplificar todas las secuencias posibles
[Soares et al., 1997]. Los cebadores universales pueden ofrecer una buena solución y deben
complementarse con aquellos específicos para el gen de interés (ver Anexo 2), para aumentar
las posibilidades de obtener resultados representativos.
3.7. BIOINFORMÁTICA
La bioinformática se encuentra en la intersección entre las aplicaciones de la información y las
ciencias de la vida. Comprende la investigación y el desarrollo de sistemas útiles para entender el
flujo de información desde los genes a las estructuras moleculares, su función bioquímica, su
conducta biológica y, finalmente, su influencia [Febles & González, 2002]. Se ocupa de la utilización
y almacenamiento de grandes cantidades de información biológica, mediante el uso de los
computadores para el análisis de la datos biológicos, los análisis de correlación, la extracción y el
procesamiento de la información [Febles & González, 2002].
La bioinformática hace uso de lo que se conoce como minería de datos, la cual ha sido definida
como "la exploración y análisis, por medios automáticos o semi-automáticos, de grandes
cantidades de datos en orden a descubrir patrones completos y reglas". El objetivo final es
convertir datos en información y esta información en conocimiento [Basset et al, 1999].
Existen dos aproximaciones a la minería de datos, la primera comprende la prueba de hipótesis con
el descubrimiento de conocimiento, en la cual la inducción o perturbación de un proceso biológico
llevará a los resultados predichos, aunque a menudo también revela nuevos fenómenos; y una
aproximación por análisis exploratorio, en la cual los datos son llevados a "hablar de si mismos"
después de una serie de procedimientos que pueden incluir la estadística, el reconocimiento de
patrones, la clasificación y la predicción [Basset et al, 1999; Febles & González, 2002]. En este
último aspecto, la minería de datos aplica una dinámica que se mueve en sentido contrario al
método científico tradicional, aquí no se formula una hipótesis para luego diseñar un experimento y
cuestionar las premisas, por el contrario, se captan y procesan los datos con la esperanza de que
de ellos surja una hipótesis apropiada. Se desea que los datos describan o indiquen el porqué
presentan determinada configuración y comportamiento [Febles & González, 2002].
Las técnicas de minería de datos no pueden utilizarse para confirmar o rechazar hipótesis, porque
puede conducir a errores. Su función es tratar de explorar datos, darles sentido, convertir un
volumen de datos, que poco o nada aportan a la descripción, en información para interpretar un
fenómeno o para adoptar decisiones [Febles & González, 2002].
Herramientas Bioinformáticas
Las bases de datos de secuencias, constituyen el sustrato de todas las herramientas
bioinformáticas usadas en análisis de secuencias. El mayor motor para el desarrollo de la
bioinformática ha sido la biología molecular, y en concreto la disponibilidad de secuencias de ADN
y proteína. Las herramientas bioinformáticas más usadas se han desarrollado como una respuesta
a las necesidades de información sobre las secuencias, aprovechando el conocimiento previo
almacenado en las bases de datos. Para secuencias de nucleótidos, existen tres bases de datos
principales que colaboran entre sí, cada una colecta y procesa las nuevas secuencias e información
biológica relevante que hubiera podido ser consignada por los científicos de la región, cada 24
horas. Por tal motivo, presentan un contenido idéntico, excepto para cualquier secuencia que haya
sido añadida en el último día. La base de datos de nucleótidos, presenta información de secuencias
del GenBank, EMBL, y DDBJ. Cada entrada en la base tiene un identificador único, que es una
cadena de letras y/o números. Si bien existe gran cantidad de iniciativas que ha producido un
enorme número de bases de datos más o menos especializadas con distintos contenidos, estos
servidores recopilan las secuencias de ADN que se han ido depositando desde su primera versión,
que para el EMBL fue el año 1982 existiendo por aquel entonces 568 secuencias [Dopazo &
Valencia, 2001].
En lo referente a la información de proteínas, el PIR es la base de secuencias moleculares más
antigua (1984); sus entradas surgieron a partir de esfuerzos de colaboración entre instituciones y
son organizadas biológicamente usando sus relaciones estructurales, funcionales o evolutivas. Las
entradas incluyen secuencias de aminoácidos y en muchos casos, las anotaciones posteriores
incluyen citaciones, referencias a la base de datos de nucleótidos, información genética común,
etc. PIR-NREF es una base de datos de referencia, no redundante generada al interior de PIR. Ha
sido diseñada para proveer una colección completa de todos los datos de secuencias de proteína,
de acuerdo con los proyectos de secuenciación de genomas actuales. Contiene todos los atributos
de las fuentes, que corresponden a secuencias en PIR-PSD, SwissProt, TrEMBL, RefSeq, GenPept y
PDB y ofrece una redundancia mínima. Las secuencias idénticas, del mismo organismo reportadas
en diferentes bases de datos, son presentadas como una entrada NREF única, con IDs de proteína
y nombres de cada base de datos, además de la secuencia, taxonomía y bibliografía. La base de
datos es reevaluada cada dos semanas y la versión 1.46 de Mayo 6 de 2004 contenía 1'634.871
entradas,
en
su
mayoría
procedentes
de
TrEMBL
y
GenPept
fhttp://www-
nbrf.aeoraetown.edu/pirwww/search/pirnref.shtmn.
La búsqueda de las secuencias puede ser ejecutada a partir de los servidores ubicados en las
páginas de los proveedores mencionados, o puede ser realizada mediante una estrategia más
flexible y completa como es el SRS o Sequence Retrieval System creado por Lion Bioscience. El SRS
es un potente gestor y es la herramienta más utilizada para la búsqueda de información, contiene
elementos de aproximadamente 180 bases de datos diferentes que incluyen bibliografía
(MEDLINE), secuencias, motivos, señales, información adicional (taxonomía, códigos genéticos,
etc.,) estructuras de proteínas, mapas genéticos y cromosómicos, mutaciones, mutaciones
específicas de locus, rutas metabólicas y resultados de búsquedas (alineamientos, BLAST, etc.),
entre otras. Toda esta información se puede consultar mediante preguntas con expresiones lógicas
que pueden tener la complejidad deseada. Las consultas se pueden hacer sobre los distintos
campos de las diferentes bases de datos y habitualmente implican el uso de palabras clave que
definen los intereses de la búsqueda [Dopazo & Valencia, 2001].
El objetivo del SRS es
proporcionar un acceso eficiente a las distintas bases de datos utilizando cualquier formato
disponible. SRS permite dos modos de trabajo, uno con un interfaz gráfica de usuario, sencillo de
usar y otro basado en la línea de comandos, orientado al especialista y a su uso por medio de
programas auxiliares.
El servidor presenta una pantalla inicial con varias opciones que proporcionan ayuda e información
adicional, y un botón de entrada para iniciar una sesión de trabajo. SRS permite buscar en más de
una base de datos al mismo tiempo, de una manera sencilla o detallada. Para este último caso
existe un formulario en donde se indican los criterios de búsqueda deseados, la manera como
deben combinarse y el modo de visualizar los resultados. Una característica interesante es que se
puede trabajar sobre algunas o todas las secuencias mostradas indicando "todas menos las
elegidas" o "todas las elegidas", para aplicar a un conjunto de secuencias operaciones como
guardar en disco duro el listado de las entradas seleccionadas o ver el listado de esas secuencias.
Otra propiedad importante de SRS, es que establece enlaces entre la información almacenada en
todas las bases de datos, con lo cual se puede saltar a la entrada correspondiente para acceder a
información relativa, sin necesidad de realizar nuevas búsquedas en cada base de datos
rhttp://www.eez.csic.es/cursos/bioinfP0/cap2.html.
ir
Una de las bases de datos especializada, y que se centra en la búsqueda de particularidades en las
secuencias de aminoácidos es ProDom, contiene información acerca de las familias de proteína,
obtenida por análisis automatizado de las secuencias disponibles. Es útil para el análisis de los
arreglos de dominios de familias protéicas complejas y ayuda a analizar relaciones de homología en
proteínas modulares. Presenta una interfaz gráfica de fácil navegación entre arreglos esquemáticos
de dominios, alineamientos múltiples, árboles filogenéticos, entradas de SwissProt, patrones de
Prosite, familias de pFam y estructuras 3D de PDB. Las nuevas secuencias pueden ser buscadas
contra ProDom, alineadas con las familias de dominios existentes y modeladas sobre las bases de
dominios homólogos en PDB [Corpet et a/.,2000].
La aspiración al momento de realizar alineamientos entre secuencias, es que la función de puntaje
refleje de manera más o menos fiel, los eventos biológicos que les dieron origen; de tal manera,
que si los puntajes son optimizados, se produzca un alineamiento biológicamente correcto. Los
programas de alineamiento pueden dividirse en dos categorías principales: los métodos que
alinean secuencias usando la longitud total (globales) y los métodos que alinean solamente
regiones de alta similitud (locales). Tradicionalmente el método de alineamiento global más común
es Clustal, que es más comúnmente utilizado cuando las secuencias presentan longitudes similares.
La única forma de conocer la calidad del alineamiento sin embargo, es comparando las salidas de
diferentes programas [Lassmann & Sonnhammer, 2002].
ClustalW es un programa diseñado para el alineamiento pareado y múltiple de secuencias tanto de
ADN como de proteína. Trabaja en tres pasos principales: 1) Alineando todos los pares de
secuencias de manera separada con el fin de calcular una matriz de distancias que indique la
divergencia existente entre cada par de secuencias; 2) Calculando un árbol guía a partir de la
matriz de distancias y 3) Alineando progresivamente las secuencias de acuerdo al orden de
ramificación del árbol guía [Thompson et a!., 2003]. ClustalX (1.8) es la interface gráfica para
ClustalW, en donde el esquema de color permite determinar la presencia de elementos
conservados en el alineamiento. El programa utiliza el método de NJ (Neighbour Joining) para
calcular las distancias (porcentaje de divergencia) entre todos los pares de secuencias del
alineamiento, y luego vuelve a aplicar el método a la matriz de distancias. Clustal provee un
indicador de la calidad del alineamiento brindando una gráfica de puntaje de conservación para
cada columna, el cual se incrementa con una mayor conservación. Se espera que existan residuos
de bajo puntaje a una frecuencia moderada en todas las secuencias, debido a la divergencia del
proceso natural de evolución. NJPLOT es un programa de diagramación de árboles filogenéticos
que viene incluido con ClustalW, permite la visualización de los árboles iniciales formulados por
este programa durante las primeras etapas de comparación pareada de secuencias, y facilita su
utilización en la discriminación de grupos de secuencias [Perriére & Gouy, 1996].
Por otra parte, T-coffee (Tree-based Consistency Objective function for alignment Evaluation) un
método que adicionalmente utiliza el alineamiento local, provee un medio simple y accequible de
generar alineamientos múltiples y que admite fuentes heterogéneas de datos. Estos pueden ser el
resultado de alineamientos pareados locales y globales, almacenados en una librería.
Adicionalmente, usa una estrategia progresiva alineando primero los mejores datos de la librería de
manera similar a la utilizada en ClustalX. Es un método un poco más lento, pero incrementa la
precisión del alineamiento [Notredame etal, 2000].
Con el fin de evaluar la especificidad de cadenas de nucleótidos o aminoácidos frente a todas las
secuencias reportadas en una base de datos, puede utilizarse un método de alineamiento como
Blast. Blast es el programa de alineamiento de secuencias más rápido, debido a lo cual
compromente algún grado de sensibilidad. El grupo de subprogramas incluye: BLASTN el cual
realiza una búsqueda de un nucleótido contra una base de datos de secuencias nucleotídicas;
BLASTP que compara una secuencia de aminoácidos contra una base de datos de secuencias
protéicas; BLASTX que compara los productos de la traducción conceptual de los 6 marcos de
lectura de una secuencia de nucleótidos (ambas cadenas) contra una base de datos de secuencias
protéicas; TBLASTN que realiza una búsqueda de una secuencia de proteina contra una base de
datos de secuencias nucleotídicas traducidas en sus 6 marcos de lectura (ambas cadenas) y
TBLASTX que compara las traducciones de los 6 marcos de lectura de una secuencia de nucleótidos
contra traducciones en 6 marcos de lectura de una base de datos de secuencias nucleotídicas
rwww.ncbi.nlm.nih.oov/BLASTI.
Para la manipulación de alineamientos se han diseñado una gran variedad de programas
disponibles vía web, muchos de ellos de forma gratuita o a manera de Trial. Bioedit V5.0 es un
editor de secuencias biológicas de interfaz gráfica, escrito en lenguaje C++ que corre sobre la
plataforma Windows. Provee las funciones básicas para la edición, alineamiento, manipulación y
análisis de secuencias de ácidos nucleicos y proteína. Tiene una capacidad para 20000 secuencias y
provee un gran contenido de información que incluye el sombreado dinámico de posiciones de
alineamiento, perfiles de hidrofobicidad/hidrofilicidad, graficación 2D, adición de comentarios, entre
otra. Otro programa que ofrece utilidades para análisis y edición de alineamientos es GeneDoc,
diseñado para ayudar a los usuarios a mejorar sus alineamientos y sobrepasar las limitaciones mas
comunes en los programas de alineamiento múltiple. Ayuda en la extracción de información para
ser usada en la planeación e interpretación del trabajo experimental. Permite hacer una buena
anotación de los alineamientos, remoción de secuencias, sombreado y definición de características
estructurales de los mismos. http://www.concentric.net/~Ketchup/Qenedoc.shtml.
GeneRunner 3.05., es un programa de análisis simple en biología molecular; permite el ingreso de
secuencias de ADN o proteína de manera manual o a partir de bases de datos como el GenBank.
Puede realizar manipulaciones estándar de datos de secuencia como: Búsqueda de secuencias de
ADN para sitios de restricción; búsqueda de secuencias de proteína para sitios de clivaje de
peptidasas; traducción de ADN en secuencias de proteína y búsqueda de marcos abiertos de
lectura; diseño de primers para PCR y secuenciación y alineamientos múltiples de secuencias. I_a
herramienta OligoAnalysis utilizada en la investigación, faculta al investigador a ingresar un
oligonucleótido de manera directa o seleccionarlo a partir de una secuencia. Faculta el calcular las
principales características de un oligo como, Tm, %GC, estructura secundaria, etc. Adicionalmente
los resultados obtenidos pueden ser impresos de una manera tal, que pueden ser fácilmente
incluidos en informes y presentaciones .
METODOLOGÍA
4.1. LA CONCEPCIÓN HOLÍSTICA DE LOS CICLOS BIOGEOQUÍMICOS
Durante la primera etapa del diseño de la metodología, se llevó a cabo la búsqueda de información
referente a los diferentes ciclos biogeoquímicos, considerados claves en el reciclaje de la materia
orgánica y el sostenimiento de la dinámica de nutrientes en el subsistema suelo. Se analizaron los
diferentes componentes de los ciclos y las reacciones bioquímicas implicadas. Con base en la
información disponible, se generó un modelo conceptual en el que se involucraron los diferentes
procesos realizados por grupos funcionales microbianos conocidos, y se visualizaron las
interacciones existentes entre ellos. De igual manera, partiendo de dicho modelo se establecieron
las enzimas propias de cada uno de los procesos, que pudieran ser útiles como marcadores, con
ayuda de los siguientes preceptos:
❖
Están involucradas en la ocurrencia de los ciclos biogeoquímicos en los suelos.
❖
Permiten un seguimiento de procesos intermedios del ciclo, es decir, que son un factor
primordial en pasos críticos dentro de cada uno de ellos.
❖
Los productos enzimáticos están presentes siempre para el mismo proceso y son
propios de éste (especificidad de acción: un marcador - un proceso).
❖
Su actividad se encuentra asociada a grupos funcionales específicos y no es de
distribución generalizada.
❖
Existen suficientes secuencias reportadas en las bases de datos.
4.2. OBTENCIÓN Y MANIPULACIÓN DE DATOS MOLECULARES
En una fase consecutiva, se efectuó la búsqueda de las secuencias de ADN y proteína reportadas a
nivel mundial para cada una de las enzimas elegidas, a través de la exploración en las bases de
32
datos GenBank (http://www.ncbi.nlm.nih.gov/), EMBL (European Molecular Biology Laboratory;
http://www.embl-heidelberQ.de’>y DDBJ (DNA Data Bank of Japan; http://www.ddbi.niQ.ac.ipV a
través del SRS de Lion Bioscience (Sequence Retrieval System; http://srs.im.ac.cn/srs71bin/coibin/waetz?-paae+srsq2+-noSession) ubicado en el Instituto de Microbiología de la Academia China
de
Ciencias
y
PIR
NREF
(Non-Redundant
Reference
Protein
Database;
http://www-
nbrf.qeoraetown.edu/pirwww/search/pirnref.shtml) (miembro del consorcio Uniprot desde el
2002), respectivamente.
Adicionalmente la pre-existencia de dominios fue establecida por medio de la búsqueda en la base
ProDom (http://protein.toulouse.inra.fr/pnodom/current/html/form.Dho). estableciendose que a
pesar de que existieran reportes para las enzimas, se continuaría su aplicación en las etapas
subsecuentes de la investigación.
Los datos a utilizar fueron determinados con base en los siguientes criterios:
♦ Seleccionar aquellas secuencias relacionadas con microorganismos terrestres o de suelos
inundados, observando los campos de descripción para las secuencias reportadas.
♦ No tener en cuenta secuencias STS y secuencias de elementos en Cis.
La información seleccionada, recopilada y depurada fue catalogada de acuerdo a criterios como
número de accesión, longitud, tipo de molécula (ADN o proteína), organismo, etc. y organizada en
una base de datos Local, la cual se denominó BIOPROC_SUELOS, de forma manual y con base en
el formato de la Tabla 1:
Tabla 1. Formato de ingreso de información a la base de datos Bioproc_Suelos.
CAMPO
EJEMPLO
PROCESO REALIZADO
Celulólisis
GRUPO ENZIMÁTICO
B-glucosidasas
GEN
glu
# ACCESION
AB088351
SECUENCIA ADN
aataacacttagcaagtaaggctgaacttaagcttgcggtcctggttagcaacgccga
agtacttctcgacctcggtggtttgggcaggtgtgtcgaaagcagtgaaccagaaacc
actggcatccttctgctgccagagccagcatccaacattgttgtagaactgctgcagact
ggcggtcgtggcagcagccttctggtagttgggtcccttggtaggccagccggtctcac
caacccagacagtagccttg
CAMPO
EJEMPLO
SECUENCIA PROTEINA
mkffsttetlavalmmtgeavagtykgfsmganradgvckweadwkkdfqaiksw
nkalvkavpaakatgmkilvgiwstddahfgrdkaallkaikqhgtgwiaaisvgsedl
yrkdispqklaqqiydvrgmvhqynkalkvghtdtwtawvdgtndwtkacdiaitn
gfpywqgvpikdalrlktfqnsywnvkkhvqavnskatvwvgetgwptkgpnyqk
aaattaslqqfynnvgcwlwqqkdasgfw
# LOCUS (GenBank reportado en PIR)
>BAC66096
DESCRIPCION DEL GEN
rga
genes
for
putative
beta-l,3-glucosidase,
putative
rhamnogalacturonan acetyltransferase, complete cds
ORGANISMO
Gibberella zeae
LONGITUD (#bases)
3411
TIPO DE SECUENCIA
complete cds
OTROS
The trichothecene biosynthesis gene cluster of Fusarium
graminearum F15 contains a limited number of essential
pathway genes and expressed non-essential genes
DOMINIO
Eukarya
RENO
Fungi
DIVISION
Ascomycota
SUBDIVISION
Pezizomycotina
CLASE
Sordariomycetes
SUBCLASE
Hypocreomycetidae
ORDEN
Hypocreales
FAMILIA
Nectriaceae
GENERO
Gibberella
a. Los campos relacionados con la clasificación taxonómica (de Dominio a Género), fueron
utilizados con el fin de generar una organización jerárquica, relacionada con los campos Gen y
Grupo enzimático, por medio de una herramienta de filtrado en el manejador de bases de datos
MySQL.
Por ejemplo, para el Gen [lac] mostrar todos los datos por debajo del nivel taxonómico de
la Subdivisión Homobasidiomycota.
b. Con base en dicha jerarquización, los campos correspondientes a Accesión o Locus fueron
empleados en la generación de archivos de texto (*.txt) para ADN y Proteína, que contenían las
secuencias respectivas. Tales archivos fueron formateados utilizando un procesador de texto.
Ejemplo:
"Secuencias de ADN para el gen lac, Fungi-Basidiomycota-Homobasidiomycota"
>AJ420176
cactggcatgggtttttccagagaggtcccaattgggcggatggtcctgttttcgtcacacagtgcccgatcgctagcggatactcgtttctata
cgacttccgagttcctggtcaggctggtaggtcgcgtctttctccctttgtttaatgttcgtgatgctgaggatccacatcctagggacgttctggt
accacagtc
>AJ420175
cactggcacgggttcttccaacatggtaccaactgggccgatggcgccgccttcgtgaaccagtgccctatcgctactggcaactcgttcctgt
acgacttcggcgtcccggatcaagcgggtaagtcctacagcaccaatgtattatcctcgctgctcacgtgtgtacagggacgttctggtacca
cagtc
>X52134
tatgcacactttccttcgctccacggcactcgttgtggcaggcctgtctgcccgcgcccttgccagcattgggcccgttaccgactttcacatcgt
caacgccgccgtctctcccgatggtttctctcgccaggctgtcctggctgagggtgtcttccctggcccgctcatcgccggcaacaaggtactcc
atttctctctcatccccgggatatgcgctgacggtcggcacagggcgacaatttccagatcaat
Los archivos de texto generados para ADN y Proteína, fueron empleados para llevar a cabo los
alineamientos múltiples, cuya finalidad fue la de determinar secuencias únicas y conservadas, con
la utilización de los programas CLUSTAL X [Thompson et al., 2003] (Figura 2) y TCOFFEE (versión
GNU-Linux) [Notredame etal, 2000].
_
Ai
File
EdS
Alignment
Trees
Cotors
¡Múltiple Alignment Mode
1
2
3
4
5
6
7
8
9
10
11
Q uality
Help
Font Size:¡10
CAA93150
CAD126S9
AAF70180
AAF37580
A A L S7854
BAA02918
BAC45251
BAB16890
BAA34922
AAB70917
BAA92251
KDPKRH5
ruler
1 ....... 1 0 ......... 2 0 ......... 3 0 ......... 4 0 ......... 5 0 .....
—BFSÜHSBHII®3SLIS«£
~Si®Rí®KQfSpHlB|5p¡^£^jgTlST8AREM(DNGQ£NVí
----- ^ 1'DPpR^^SMPÍáRHKRuA^A^ftW P
A
File D:\DocumentosVTesis\Escritos\genchiAbacteria.aln loaded.
ñgura 2. Salida delprograma ClustaIX.
Se ensayaron diferentes combinaciones de parámetros, cuyo objetivo fue el obtener buenos
alineamientos; para tal procedimiento se utilizaron archivos por lotes *.BAT, con la finalidad de
acceder vía comando al panel de control de ClustalX y ejecutar simultáneamente múltiples
ventanas de alineamiento.
Para el alineamiento de las secuencias de ADN se utilizaron los siguientes parámetros:
♦ Penalización por apertura de espacios (0-100) de 80, de extensión 70, retraso por divergencia
40%, peso de transición 0.5. También se utilizaron los parámetros por defecto del programa
(15,6.66, 30% y 0.5, respectivamente).
Para los alineamientos de secuencias protéicas, los parámetros usados fueron: Penalización residuo
específica, penalización por residuos hidrofílicos (GPSNDQEKR), separación de gaps (0-100) de 4,
no separación de espacios terminales, y se variaron las siguientes condiciones:
❖
para una matriz PAM40 la penalización por apertura de espacios (0-100) de 80, de
extensión 70, retardo por divergencia de 40%.
❖
Para PAM120 penalización por apertura de espacios (0-100) de 50, de extensión 50,
retardo por divergencia de 40%.
❖
Para PAM350, por defecto, penalización por apertura de espacios (0-100) de 10,
extensión 0.2, retardo por divergencia de 40%.
Las anteriores matrices fueron calculadas por medio de una herramienta bioinformática ubicada en
la dirección: http://www.cmbi.kun.nl/bioinf/tools. la cual realiza una extrapolación a diferentes
distancias evolutivas partiendo de una matriz PAM 1.
Se realizó un tipo de alineamiento utilizando los parámetros por defecto, que incluyen el uso de
una Matriz Blosum 62, con penalizaciones por apertura (0-100) de 10 y por extensión de 0.2 y un
retraso por divergencia de 30%.
Los alineamientos obtenidos en ClustalX, fueron re-introducidos en el programa T-coffee 1.37 para
la plataforma Windows, al cual se accedió vía línea de comandos utilizando igualmente archivos por
lotes. Los parámetros usados fueron aquellos que el programa configuró por defecto.
Los alineamientos fueron visualizados por medio de la herramienta de importación de *.ALN, del
programa GENEDOC (Figura 3) [Nicholas & Nicholas, 1997], el cual permite tanto la observación de
las secuencias consenso, como las gráficas de porcentaje de identidad que permiten detectar la
consistencia del alineamiento.
GcmcOóc - |g en 18 S a r c h a e a *p « > 4T»*f‘f
Fie
Project & S
Arrange
DjcglBl a í t M
_|
Sha^e
£roups Scfire
c|8|g|
V :ÍS É »§Í
Ire e
Reports F|ot M ndow
m
|»[ « M a | 5 lc n | P | E | 8 | H | I | L | 0|1Í
:cgTGGTAAT
TCTAGA
-Iffl x|
Help
I S.I I I I
* U N
C T T C tG G
AAGG
M|U]
Ga g
Figura 3. Salida del programa GeneDoc en donde se observa la salida del alineamiento en ClustalX
de secuencias pertenecientes al ADN codificante para ARNr 18S de Archaeospora. Las zonas azules
corresponden a áreas de gran similitud, en tanto que las naranja presentan algunas discrepancias.
Abajo secuencia consenso.
Aquellas secuencias generadoras de ruido, fueron extraídas mediante el programa Seaview [Galtier
et ai, 1996], utilizando como criterio los cladogramas generados por ClustalX que fueron
observados con la ayuda del programa NJPLOT (ver Figura 4). Estos cladogramas también fueron
empleados para agrupar aquellas secuencias más similares y favorecer el hallazgo de consensos
más consistentes que siguieran una asociación natural de las secuencias.
□ naiGGammapioteobacteria.dnd
jJ S lx J
File Edit Fort Paper
O peration---------------------------------------------(• Full tree C New outgroup C Swap nodes
Subtree
D isplay
[“ jBranch lengthsj T Bootstrap valúes
Subtree Up j Help j
,0.05,
E rH
■Y11935
Y11936
Y11937
— Y11938
-Y11939
Y15252
•U71398
— A F 197465
■X16181
Figura 4. Salida del programa NJPLOT, donde se observa un dadograma obtenido a través de
ClustalX.
Luego de la obtención de resultados a partir de las variaciones realizadas en los parámetros de
alineamiento, para un mismo grupo de secuencias, se efectuó una comparación visual
seleccionando aquellos que pudieran ser más adecuados, por mostrar regiones comunes más
consistentes.
4.3. DISEÑO DE SONDAS
Además del requisito mencionado arriba, las secuencias consenso fueron seleccionadas con base
en su longitud: La cadena de caracteres continuos no podía ser menor de 11 con el fin de permitir
un diseño de oligonudeótidos adecuado.
Las secuencias fueron posteriormente sometidas a un análisis de especificidad vía web, a través del
38
subprograma BLASTN 2.2.9. para ADN y BLASTP para proteína, del NCBI. Las características
utilizadas se encuentran en la Tabla 2:
Tabla 2. Parámetros utilizados para el análisis de especificidad por medio de BLAST.
Filtro de baja complejidad X
Búsqueda
BLASTP
BLASTN
Características
X
Nr, Est, Environmental para Nr, Environmental, SwissProt para todos
todos los organismos
los organismos
Longitud palabra
11
3
Valor E
0.001
0.001
Otros
Matriz Blosum62 (penalización apertura:
12, extensión: 1)
Las secuencias (ADN y proteína) que detectaban cadenas blanco relacionadas, con una alta
similitud (altos puntajes) y valores E altamente significativos (<0.001), fueron elegidas para la
posterior evaluación de las características termodinámicas adecuadas para la disposición en un
microarreglo.
Adicionalmente, fue tomada en cuenta la información gráfica mostrada por Blast referente a
dominios catalíticos o estructurales, con el fin de complementarla con aquella relativa a los valores
de significancia y el grado de especificidad requeridos para el nivel taxonómico al cual se evaluó
cada gen.
Las secuencias de proteína seleccionadas luego de la ejecución de BLAST, fueron traducidas a
ADN, utilizando el subprograma Reverse Transíate de Bioedit, mediante una tabla de codones
universal para Bacteria, Archaea y Eukarya, al igual que las tablas #11 (bacterial and plant plastid)
y #4 (Mold, protozoan and Coelenterate) del GenBank, referidas a Bacterias-Archaea y Hongos,
respectivamente.
Posteriormente, la base de datos de los posibles oligonucleótidos fue analizada de conformidad con
el esquema desarrollado por Matveeva et al. [2004], para la discriminación de secuencias
conservadas, en cuanto a utilidad en el desarrollo de microarreglos. Se utilizó la subrutina Oligo
del Programa GeneRunner 3.05 (Figura 5). Las características son:
0Sgo:jAGCTATAAC6ATGATCGACGGATT
<Senxeohfo> Sliand Molecule
MolWt:
E'«*l
9 lop « DNA
6
3
.0
|
Tm:
C E«p C RNA
614 Len: |24
Frttei Tm.
70.5 j | Edil «tíñeme J| Switchotgos |
*GCTm;
6C+AT Tu: 68.0 f lee energr IdGJ Temp:
18.0
4.1 [ Piobe con£picoMol);
nMol/A260:
0.60
Saft con(milljMolí;
1000.00
ug/A260:
41.7 j 4 Fotnainide:
0.0
X6C:
-42.8 j 3*-151idhuí. 17 Bo«oijjn>- |«
rtfi
184.8 j len>- [5 Slemlen >- [5
dH
-481.5 i Baseluns / Palindiomes
dS
-8.3 j
3'-enddG
__ ú
fr - r fT " q h >
ii [
il Sort |Tm;| 00 d6:| "T"
(■ U a itpin lo o p » P D iroen C fiu lg e lo o p t P Interna! lo o p »
5 * BGCTftTfiflCGflT
ifi G
TTflGGCAGCTfl
3'
STEM « 1 9
IS 3 BP LONG. LOOP
3.
IT
|
O*
lf~ C A U C E L ]|
H E LP
]|
Erin>
]| P e la u ft» |
Figura 5. Ventana de¡ subprograma Oligo, de GeneRunner.
❖
Los oligonucleótidos deben haber sido originados a partir de una secuencia consenso.
❖
Los oligonucleótidos que tengan potenciales de auto-apareamiento debidas a
interacciones intra e intermoleculares mayores que los umbrales definidos (Inter: (AG°
37) > -8 kcal/mol e Intra: (AG°37) > -1.1 kcal/mol, deben ser rechazados. Es
necesario tener en cuenta las temperaturas desde 37°C, puesto que algunos ensayos
de hibridización oligo-ARN la utilizan. Las temperaturas de hibridización deben ser
bajas para asegurar la estabilidad de los híbridos.
❖
Las secuencias deben ser evaluadas en cuanto a su potencial de apareamiento mayor
a un umbral definido, con el fin de reducir las posibilidades de hibridización cruzada.
Además de los anteriores lincamientos se debe tener en cuenta:
❖
La longitud de los oligonucleótidos, puesto que es mejor para el microarreglo utilizar
secuencias similares en este aspecto [Cho & Tiedje, 2002] y que de preferencia
posean una longitud mayor a 25 nucleótidos [Bhanot et al., 2003].
❖
Deben excluirse aquellas sondas que sean particularmente ricas en AT o GC, en
concordancia con los lincamientos empíricos dados por Affymetrix [Bhanot et ai,
2003].
En orden a estimar estos parámetros, se determinaron algunas condiciones estándar: La
concentración establecida para el ADN prueba fue de 0.6 pM, el cual se considera un valor seguro
para la mayoría de hibridizaciones. La concentración de sales fue de 1M por defecto. La
concentración de Formamida fue 0. Se debe tener en cuenta que otros valores requeridos por el
investigador, deben generar resultados diferentes.
La Tm es definida como la temperatura a la cual la mitad de las moléculas de ADN aún se hallan
en doble cadena. Este valor es calculado por el programa GeneRunner usando la siguiente fórmula:
Tm=AH/(AS + R In (CT) - 273.15
en donde, H es la entalpia, S la entropía, R es 1.987 cal.mol1, y CT es la concentración total de la
hebra, y condiciona la temperatura a la cual se realiza la etapa me/ting o de separación de las
hebras. Está directamente relacionada con el porcentaje o contenido de GC, por esta razón este
valor debió ser menor al 55% (43.1% en promedio).
Affimetrix publicó un grupo de heurísticos que se usa en el diseño de sondas. Estos fueron
derivados empíricamente y son usados por esta empresa para diseñar oligonucleótidos de
aproximadamente 20 nucleótidos de longitud:
b. El número total de As o Ts debe ser menor a 10 (<50%).
c. El número total de Cs o Gs debe ser menor a 9 (<45%).
d. El número total de As y Ts en cualquier ventana de 8 bases debe ser menor de 7 (<87.5%).
e. El número de Cs y Gs en cualquier ventana de 8 bases debe ser menor de 6 (<75%).
Las sondas inicialmente escogidas fueron recortadas hasta cumplir con los criterios propuestos, o
eliminadas, y una vez depuradas fue creada una base de sondas definitivas, las cuales se utilizaron
para la evaluación de posibles apareamientos entre ellas, con ayuda de la rutina BlastN del
programa BioEdit.
RESULTADOS
Figura 6. Diagrama de rutas bioquímicas de los ciclos del carbono, nitrógeno, azufre e hierro
(páginas siguientes).
-Ifo
c
<
NOS
A líe m b r a n a
p la s m á t ic a
Periplasma
Membrana
M+ T e t r a h i d r o so rc in a p te rin o
H-S-CoM
C O Z -C o A
2 H»
T etrahidrosarcinapter ina
Coenzwia A
?
A b P ^ 'J
ATP
H2SPT:CoM
itlransferasa
Form ato
i)
H2
3 H2 0
O x id o r ed u c t asa
5 -F e
Su lfito O xidasa
Fe3+ dependiente
k)
8 H*
4 Fe *2
3H 2 0
4 Fe -3
^ 2 glutort- ¡i
oxidados
2 glutatíon
reducidos
.&•
ATP + H 20
*
►
C a d e n a de
tran sporte
de e-
Pi
s u l f u r ¡I
AbPi
ADP
>
2t -
AttP
"ÍHtTP
*fc.,AbP
APS
▼
A P j'V ',
reduct'•‘?ÍO •
'
l
2t-
2e-
rto oxidasa
ADP
Jo su lfa to
C 6x i d o r ed uctasa
ATP
o
< 504-2 "/
C ITO PLASM A
-5
KedaEín delafe o»tóH<u<tasa
y n# otíese Jepentílerte de F í>
a
«s
Anaerobiosis
i
Fs304
^X •S,
Aerobiosis
¡jUpfic'loivrc
*■Fe304
✓;Fe2+
N
4
Fe 3+
n)
■£>■
00
zcoz
-ACETATO
PIRUVATO
/tCETATO
LACTATO
Reducción desasin ilativa
T ro n s f e ra s a
5 sitesis
Reducción asimikitiva
3NADP-HÍT
3NADPH
NADP-k -*'''
NADPH
M em brano
i♦ ( i ) - 20i ; * ; n i > c n
^^A.
2H+
( tu
* g i j>
(f:
foilna«Tu»
^u2-fji)-;{u2t(niKu2*(D
H2 0 2
H2 0
iji i ) )
(tutq>-;cii z-(iip-cu2-kii£>
ff)-acu*(ni)-cu2-
2
> ^ * f l ) - Cu ; * q i - i > C u
R .
MnPII
Acido orqénit-
*
Acido orgónit^f
e
í
3+
AfaPX
)= o
*1)
>f5t
*
Ata 2+
f. *
^ - ^ 2 0
Y
- - A
H202
¡Xp)Ciclo catalítico de las lacasas [Tomado de Lucas e t al. 2001].
d)Ciclo catalítico de la enzima Manganeso peroxidasa [Tomado de Lucas e t ai. 20011.
o)Ciclo catalítico de la Lignin Peroxidasa [Tomado de Lucas e t ai, 2001],
n)Proceso oxidoreductivo en el ciclo del hierro [modificado de Prescott e t al., 2000].
bacterias reductoras de sulfato [Basado en Brüser e t ai, 2000].
I) Rutas de oxidación anaerobia de compuestos sulfurados
reducidos en bacterias (muy común en fotosintéticas) [Brüser e t ai, 2000].
m)Esquema de acoplamiento de la reducción asimilativa y desasimilativa de sulfato, oxidación de H2 y la síntesis de ATP en
k)Oxidación de azufre elemental. Bacterias quimioautótrofas [Basado en Prescott e t al, 2000]
h, i )Oxidación de compuestos reducidos de carbono con la liberación de C02, en la que se involucra la enzima COdeshidrogenasa. Bacterias metanotrofas, carboxidotrofas [Basado en Conrad, 1996].
j) Vía reductiva desde compuestos carbonados oxidados como COZ hacia metano [Thauer, 1998],
g) Vía metanogénica por reducción de acetato [Basado en Ferry, 1995].
f)Reducción desasimilativa de nitrato a nitrito y a amonio, disipación de poder reductor y detoxificación de nitrito,
nitrito reductasas y nitrato reductasas NADH dependientes (Klebsiella y Rhodobacter) [Moreno e t a/, 1999].
e)Acoplamiento de la oxidación de amonio y posterior reducción de hidroxilamina en el proceso de denitrificación.
d) Asimilación de Nitrato. Se muestra la nitrato reductasa asimilativa dependiente de ferredoxina (Fd) (cianobccíerias) y las
c) Reacciones químicas que ocurren durante la fijación de nitrógeno [Basado en Zehr e t a l 2003].
codificantes de la nitrato reductasa (niaD) y de la nitrito reductasa (niiA) forman un "cluster" [Tomado de Kinghorn, 1989].
transportadora de electrones anaerobia [modificado de Moreno etal., 1999].
b)fteducción asimilativa de nitrato en hongos. El sistema de trannsporte del nitrato incluye un permeasa (gen crnA), los genes
a) Vías de respiración de nitrato (nar) y denitrificación (nos, nir, ñor) en bacterias. Se observa la organización de la cadena
te
Í
(Fe 3+)
______
0=®VFe4n
6>
H 20
>Ata 2 +
X
ÁAn 3+
Acido orgánico
quelorits,
R a d í ca Feas^
__
Acido orgánico
quelonfre
LDH lactato deshidrogenase!; H2asa Hidrogenase,
CO-deshidrogenasa; CoM, CoB Coenzima M, Coenzima B; APS
Adenosin fosfosulfato; PAPS Fosfoadenosin fosfosulfato;
citoplasmática NADH-dependiente (2 subunidades); CO-desh
Hidroxilamina oxidoreductasa; nirBD Nitrito reductasa
fei-redoxin dependiente (algunas bacterias); Hao
Ferredoxina reducida; N irA nitrato reductasa asimilato-ia
cofactor bis-molibdopterin guanina dinucleótido; NarB
Nitrato reductasa ferredoxin dependiente; ;Fdred
M6C)-NasA Subunidad catalítica de la nitrato reductasa y :¡u
Sistema de transporte nitrato-nitrito; NasC NADH-nitrato
reductasa; N rf ABCD Subunidades de la nitrito reductasa:
de hongos; NiiA Nitrito reductasa de hongos; nasFED
de transporte de nitrato en hongos: NiaD Nitrato reductasa
Q H 2 -Q Quinona reducida-oxidada; CrrA Permeasa-sistema
Abreviaturas Utilizadas:
Modelo conceptual de integración de los ciclos biogeoquímicos considerados {página
Figura 7.
siguiente).
«JWt
□ Archaea
[.J Bacteria
Desconocido
0 Eukarya
tlpffShaea
---- - QBacterla
Si Desconocido
~ EJEukafya
Figura 8. Representación de la proporción de secuencias de ADN para cada grupo enzimático a
nivel de Dominio taxonómico. Clave de abreviaturas ver Tabla 3.
ión de tas secuencias de ADN encontradas por División.
Figura 9. Distribución
#géneros
Figura 10. Histograma
de frecuencia de secuencias de ADN por Género.
Figura 11. Representación de la proporción de secuencias de proteína para cada grupo enzimat/co
a nivel de Dominio taxonómico (abreviaturas ver Tabla 3).
54
Figura 12. Distribución de ias secuencias de proteína encontradas, por División.
#géneros
Figura 13. Histograma de frecuencia de secuencias de proteína por Género.
ENZIMA/PROCESO
GÉNERO
AMONIO MONOOXIGENASA
Nitrosomonas, Nitrosospira, Nitrosovibrio, Pseudomonas
(amo)
APS QUINASA (apsq)
Escherichia, Klebsiella
APS REDUCTASA (apsr)
AHochromatium, Desulfovibrio
APS SULFURILASA
AHochromatíum,
Escherichia,
complejo
Klebsiella,
Burkholderia
Pseudomonas,
cepacia,
Rhizobium,
Rhodococcus, Sinorhizobium
B-GLUCOSIDASA (bgluc)
Agrobacterium, Aspergillus,
Butyrivibno,
Candida,
Bacillus,
Bifidobacterium,
Celluiomonas,
Cellvibrio,
Chryseobacteríum, Clavibacter, üostridium, Cochliobolus,
Debaryomyces,
Escherichia,
Gibberella,
Gluconacetobacter, grupo Bacillus cereus, Humicola,
Hypocrea,
Klebsiella,
Lactococcus,
Kluyveromyces,
Paenibacillus,
Phaeosphaeria,
Pantoea,
Pichia,
Sphingomonas,
Lactobacillus,
Pectobacterium,
Rhizobium,
Streptococcus,
Serrada,
Taiaromyces,
Thermobifída, thermobispora, Thermotoga
ENDOGLUCANASA (endog)
Actinomyces, Agaricus, Aspergillus, Bacillus, Bionectria,
Celluiomonas, Chaetomium, üostridium, Debaryomyces,
Emericella,
Erwinia,
Fusarium,
Gluconacetobacter,
Humicola, Hypocrea, Irpex, Methanococcus, Nectria,
Paenibacillus,
Pectobacterium,
Phytophthora,
Promicromonospora, Pseudomonas, Rolstonia, Rhizobium,
Stachybotrys, Taiaromyces, Thermoascus, Thermobifída,
Trametes, Trichoderma, Xanthomonas
EXOGLUCANASA (exog)
Acremonium, Alternaría, Aspergillus, Blumeria, Candida,
Celluiomonas,
üostridium,
Cochliobolus,
Complejo
Cryphonectña/Endothia, Fusarium, Humicola, Hypocrea,
Penicillium,
Phanerochaete,
Pleurotus,
Streptomyces,
Taiaromyces, Thermoascus, Trichoderma, Volvariella
CO-DESHIDROGENASA (codh)
Methanosaeta, Methanosarcina
ENZIMA/PROCESO
GÉNERO
ENDO-MICORRIZACIÓN
Archaeospora (archaeo), Paraglomus (parag)
(SUBUNIDADES ARNr)
FERREDOXIN NITRITO
Emericella, Nostoc, Synechococcus, Acinetobacter
REDUCTASA ASIMILATIVA
(feniderasi)
FERREDOXIN SULFITO
AHochromatium, Escherichia, Pseudomonas, Rhizobium,
REDUCTASA ASIMILATIVA
Salmonella, Thiocapsa
(fesiderasi)
DINITROGENASAS (n2)
Anabaena,
Azomonas,
Azotobacter,
Azorhizophilus,
Oostridium, Heliobacterium, Metanosarcina, Rhodobacter,
Rhodospirillum
NITROGENASA FEMO (n2femo)
Aicaiigenes, Azospirillum, Azotobacter, Bradyrhizobium,
Burkholderia, Calothrix, Chlorogloecopsis, Oostridium,
Cytindrospermum,
Fischerella,
Gtuconacetobacter,
Herbaspirillum, Klebsiella, Leptospirillum, Mesorhizobium,
Methanothermobacter, Nodutaria, Nostoc, Pseudomonas,
Rhizobium, Rhodobacter, Scytonema, Synechococcus
OXIDO NÍTRICO REDUCTASA
Achromobacter, Aicaiigenes, Azospirillum, Nitrosomonas,
(niored)
Pseudomonas
OXIDO NITROSO REDUCTASA
Achromobacter,
(nored)
Bradyrhizobium,
Aicaiigenes,
Azospirillum,
Ochrobactrum,
Paracoccus,
Pseudomonas, Ralstonia, Rhodobacter, Sinorhizobium
OXIDO REDUCTASA NADPH
Escherichia, Salmonella, Thiocapsa
(nadphredox)
PAPS REDUCTASA (papsred)
AHochromatium,
complejo
Burkholderia
Escherichia, Rhizobium, Salmonella, Thiocapsa
cepacia,
QUITINASA (quit)
Aeromonas,
Ajel/omyces,
Bacillus,
Blumeria,
Arthrobacter,
Aspergillus,
Botryotina,
Candida,
Chromobacterium, Oostridium, complejo Burkholderia
cepacia, Cordyceps, Doohwaniella, Emericella, grupo
Bacillus cereus, Janthinobacterium, Kurthia, Nocardiopsis,
Pseudomonas, Rhizopus, Serraba, Stenotrophomonas,
Streptomyces,
Trichoderma,
Ustilago,
Verticillium,
Xanthomonas
RUSTICIANINA (rust)
Acidithiobacillus
SULFITO REDUCTASA
Klebsiella, Rhizobium, Salmonella
ASIMILATIVA (siderasi)
SULFITO REDUCTASA
AHochromatium, Archaeoglobus, Bilophila, Desulfacinum,
DESASIMILATIVA (siredd)
Desulfitobacterium,
Desulfobacula,
Desulfobacter,
Desulfobacterium,
Desulfobotulus,
Desulfobulbus,
Desulfocella, Desulfococcus, Desulfofaba, Desulfofustis,
Desulfohalobium,
Desulfomicrobium,
Desulfomonile,
Desulfonatronum,
Desulfonatrovibrio,
Desulforhabdus,
Desulforhopalus,
Desulfosarcina,
Desulfotomaculum,
Desulfosporosinus,
Desulfovibrio,
Dseulfovirga,
Syntrophobacter, Thermodesulfovibrio
TIOSULFATO REDUCTASA
Salmonella
(tiosared)
HIDROXILAMINA ÓXIDO
Nitrosomonas, Nitrosospira
REDUCTASA (hao)
FENOLOXIDASAS (fenol)
Trametes
LACASAS (lac)
Agaricus,
Aspergillus,
Botryotina,
Ceriporiopsis,
Climacocystis, Colletotrichum, Coriolopsis, Cryphonectria,
Cyathus,
Daedalea,
Ganoderma,
Fusarium,
Gymnopus,
Gaeumannomyces,
Heterobasidion,
Hypholoma,
Lentinula, Neurospora, Phlebia, PHoderma, Pleurotus,
Podospora, Pycnoporus, Streptomyces, Thanatephorus,
Trametes
ENZIMA/PROCESO
GÉNERO
1
LIGNIN PEROXIDASAS (ligper)
Bjerkandera, Ceriporiopsis, Phanerochaete, Trametes
MN-PEROXIDASAS (mnper)
Ceriporiopsis,
Dichomitus,
Heterobasidion,
Phanerochaete, Pleurotus, Trametes, Tylospora
METANO OXIGENASA
Methylobacter,
Methylocaldum,
PARTICULADA (pmo)
Methy/ococcus,
Methyíocapsa,
Methylocystis,
Methylomicrobium,
Methylomonas, Methylosinus, Nitrosomonas
METIL- CO-M-REDUCTASA
Methanobacterium,
Methanobrevibacter,
(mcomred)
Methanocaldococcus,
Methanococcus,
Methanocorpusculum,
Methanoculleus,
Methanomethylovorans,
Methanopyrus,
Methanofollis,
Methanomicrobium,
Methanosaeta,
Methanosareina,
Methanosphaera,
Methanospirillum,
Methanothermococcus, Methanotorris,
NADH-NITRITO REDUCTASA
Amyco/atopsis
ASIMILATIVA (nadhniredasi)
NITRATO REDUCTASA
Oostridium, Oscillatoria, Pseudomonas, Amyco/atopsis,
ASIMILATIVA (naredasi)
Azospirillum, Baciitus, Klebsiella
NITRATO REDUCTASA
Bacillus, Escherichia, grupo Bacillus cereus, Paenibacillus,
DESASIMILTTATIVA DE
Pectobacterium,
MEMBRANA (nareddmem)
Shewanella, Staphy/ococcus
NITRATO REDUCTASA
Azospirillum,
DESASIMILTTATIVA
Ralstonia,
PERIPLASMICA (nareddper)
Sulfurospirillum, Synechococcus, Wolinella
NITRITO REDUCTASA
Achromobacter, Alcaligenes, Azospirillum, Blastobacter,
DENITRIFICANTE (niredden)
Bradyrhizobium,
Pseudomonas,
Moraxella,
Paracoccus,
Rhodobacter,
Mesorhizobium,
Ra/stonia,
Serratia,
Pseudomonas,
Rhodopseudomonas,
Ensifer,
Hyphomicrobium,
Nitrosomonas,
Ochrobactrum,
Pseudomonas, Rhizobium, Rhodobacter, Sinorhizobium
NITRITO REDUCTASA
Alcaligenes, Azorhizobium, Azospirillum, Desulfovibrio,
DESASIMILATIVA PERIPLASMICA Escherichia, Gluconacetobacter, Klebsiella, Paracoccus,
(nireddper)
Penicillium,
Pseudomonas,
Staphy/ococcus
Ralstonia,
Roseobacter,
Metano
monooxigenasa Oxidación de metano metanotrofos pmoA
tipo I y II
particulada
Sulfito
reductasa Reducción desasimilativa de sulfito dsrA, subunidad alpha
desasimilativa
(SOs=) a sulfuro de hidrógeno dsrB, subunidad beta
(desulfoviridina)
(H2S)
Nitrito
dsrD, subunidad delta
reductasa Reducción de nitrito (NO2 ) a óxido Catalizado por los productos
denitrificante periplásmica
de dos genes n irK (contiene
nítrico (NO)
cobre) y el otro tiene un
citocromo cdl nirS
Nitrito
reductasa Reducción desasimilativa de nitrito nrfA
desasimilativa periplásmica
(NO2 )
a
amonio
(respiración
de
subunidad
catalítica
(NH4+) citocromo c
nitrato),
amonificación
Nitrito
reductasa Reducción desasimilativa de nitrito nirB, subunidad beta
desasimilativa periplásmica
(NO?) a amonio (Nrtt+) (disipación nirD, subunidad delta
de poder reductor y detoxificación
de nitrito)
Óxido nitroso reductasa
Reducción de óxido nitroso (N2O) a nosZ
nitrógeno molecular (N2)
Amonio monooxigenasa
Oxidación de amonio (NH4+) a amoA, subunidad A
amoB, subunidad B
nitrito (NO2 )
amoC, subunidad C
Metil CoenzimaM reductasa
Reducción
de
(metanógenas)
CO2
a
metano mcrA subunidad A, unidad de
transcripción
para
las
3
subunidades de la enzima:
mcrBDCGA
(en oxidación de CO a C02, también cdhA, subunidad alpha
CO-deshidrogenasa
carboxidotrofas
contiene
un
enzima oxidación de sulfuro de carbono cdhB, subunidad epsilon
la
cofactor
cdhC, subunidad beta
de (OCS)
cdhD, Codesh.
molibdopterina)
componente
Co/Fe-S subunidad delta
cdhE, subunidad gamma
coxL, subunidad grande.
coxM, subunidad mediana
Acetil-CoA
sintetasa,
acsA
en Utilización de acetato
homoacetógenos actúa en
conjunción
con
la
CO-
deshidrogenasa
NADH-Nitrito
reductasa Reducción
de
nitrito
(NCV)
a nasB*
asimilativa (bacterias como hidroxilamina (NH2OH) y a amonio nirA**
(NIV, vía asimilativa) biosíntesis
K. oxytocá)*
y ferredoxin nitrito reductasa de compuestos de N
asimilativa (cianobacteria)**
Hidroxilamina
reductasa
oxido Reducción
de
hidroxilamina hao
(NH2OH) a amonio (NIV)
Nitrogenasa
dinitrogenasa reducción de nitrógeno molecular Subunidad
FeMo
dinitrogenasa (N2) a amonio (NH4+)
I
de
dinitrogenasa,
la
2
heterodímeros: nifD-nifK.
reductasa Fe
nitrogenasa V
Dinitrogenasas
alternativas:
vnfH (vanadio),
anfH (hierro).
Nitrogenasas alternativas
- con vanadio:
vnfD, subunidad alfa de la Vanitrogenasa.
vnfG, subunidad delta de la
Va-nitrogenasa.
vnfK, subunidad beta de la
Va-nitrogenasa.
- con hierro:
anfD, subunidad alfa3 de la
dinitrogenasa.
anfG, subunidad delta3 de la
dinitrogenasa.
anfK, subunidad beta3 de la
dinitrogenasa.
Complejo
enzimático
de Oxidación de tiosulfato (S203=) a
phsA, tiosulfato reductasa
tiosulfato-tiosulfato
sulfato (S04=)
phsB, proteína hierro
reductasa, cataliza a sulfito y
azufre.
H2S
phsC, proteína anclada
membrana
Rusticianina
oxidación de Fe+2 a Fe+3
rusA
rusB
rustA
-
a
:
GEN
PROCESO
cysD,
Sulfato (S04=) a APS
ATP sulfurilasa
sulfato
transferasa
adenilil
subunidad
pequeña.
cysN,
sulfato
adenilil
transferasa subunidad grande.
APS quinasa
Fosforilación de APS a PAPS
cysC
APS reductasa
Sulfito (S03=) a APS
aprA, adenililsulfato reductasa
subunidad alfa.
aprB, adenililsulfato reductasa
subunidad beta.
surC,
adenilil
sulfato
reductasa.
cysH
PAPS reductasa
PAPS reductasa
Sulfilo reductasa
Reducción asimilativa de sulfito cysG,
Sulfito
reductasa-
(S03 =) a sulfuro de hidrógeno sirohemo sintetasa.
cysl, sulfuro de H:ferredoxin
(HaS)
oxidoreductasa.
cysJ, NADPH sulfito reductasa
componente de flavoproteina.
Nitrato reductasa asimilatoria Reducción de nitrato (NOs) a narB**
o soluble (cianobacteria)**
nitrito
(NO2 )
vía
asimilativa,
biosíntesis de compuestos de N.
Nitrato reductasa asimilatoria Reducción de nitrato (NO3 ) a nasC, subunidad pequeña de
o
soluble
citoplasmática nitrito
(NO2 )
vía
asimilativa, transferencia de electrones.
(bacterias como K. oxytoca)* biosintesis compuestos de N.
nasA*, subunidad
catalítica
grande.
Nitrato
reductasa Reducción de nitrato (NO3 ) a narG, unidad catalítica de Mo
desasimilativa de membrana
nitrito (NO2 ) vía desasimilativa unida a membrana.
(respiración
y
disipadora de rédox
denitrificación) narH, subunidad beta.
narl, subunidad gamma.
Nitrato
reductasa Reducción de nitrato (NCK) a napA, subunidad grande.
desasimilativa periplásmica
nitrito (NCb) vía desasimilativa napB,
subunidad
pequeña,
(disipación de poder reductivo y dihemo citocromo c.
densificación)
Nitrato reductasa asimilativa Reducción de nitrato
en hongos
nitrito
(NO?)
vía
(N O 3)
a nit2 (no hubo reportes)
asimilativa, nit4 (no hubo reportes)
niaD,
biosintesis compuestos de N.
(dependiente
de
NADPH)
Nitrito reductasa asimilativa Reducción de nitrito (NOf)
en hongos
amonio
(NIV,
vía
a niiA
asimilativa)
biosintesis de compuestos de N
Óxido nítrico reductasa
Reducción de óxido nítrico (NO) a norB,
consta
de
subunidades:
óxido nitroso (N20)
relacionada
dos
qnorB
con
la
detoxificacón y cnorB.
Lacasas
Mineralización
de
lignina
ti¡A, Icsl, lapl, Iap2
huminas
pox,l-3, poxA
Fenoloxidasa
Manganeso Peroxidasas
Mineralización
de
lignina
Mineralización
y mnpl, mnp2, mnp3, mnp4,
mnpB.
huminas
Lignin Peroxidasas
y lccl-5, IccK, lacl-14, yA,
de
huminas
lignina
y üpA, HpB, tipC, UpE> lipl,
HpG, HpH, HpJ, vgll, Iip2r
tpgl, IpgA, IpgB
Archeospora spp.
Endomicorrización
rrsi
Endomicorrización
rrs2
Endomicorrización
18 S
Endomicorrización
5 .8 S
Paragtomus spp.
Archeospora spp.
Paragtomus spp.
Archeospora spp.
Paragtomus spp.
Archeospora spp.
Paragtomus spp.
ENZIMA-MOLECULA/GÉNERO
quitinasas
GEN
PROCESO
Quitina
chiC, chiB, chiA, bcc, ch¡F,
chil, chilS, c h ill, c h i(3, 37,
41, 55, 60, 67, 69, 80, 92),
ch il9 , chit, chitiA, chitiB,
c ts l,
cts2,
cht4,
kchi,
pchA, bccl.
Endo-B-glucanasas
Degradación de celulosa
Bg/H,
cenA,
bg/2,
egl,
e g ll, eg!3, eg¡4, eg¡5, bglB,
bg/C, bglA, egltA, b g ll
Exo-6 -glucanasas
Degradación de celulosa
Cex, exgl, b g ll, exg2
Celobiohidrolasas
Degradación de celulosa
Cé/1234567,
cbhl,
cbhA, cbhB
Endo/Exoglucanasas
Degradación de celulosa
ce!
Celodextrinasas
Remoción de la celobiosa
celACGDYDCO
acc2
xynA
engBDEHKLMNXY
eme
cenC
bgxA
bglxA
cbh2,
Figura 14. Número de sondas seleccionadas a partir de las secuencias de ADN, por nivel
taxonómico.
Figura 15. Número de sondas seleccionadas por nivel taxonómico, a partir de las secuencias de
proteína traducidas.
DISCUSIÓN DE RESULTADOS
La investigación realizada, hizo acopio de la información depositada en las tres principales bases de
datos genómicos internacionales, y a través de su análisis condujo al desarrollo de una
metodología de trabajo, cuyo objetivo a largo plazo, será el diseño de una Herramienta Molecular
de Evaluación Funcional de Suelos. El estudio hace uso de estrategias de minería de datos,
disciplina que aplica un punto de vista contrario al método científico tradicional. Se basa en el
aprovechamiento de la información que ha sido recopilada en estas bases por parte de diversos
investigadores, y en el concepto de que es posible desarrollar aplicaciones tomando rutas
diferentes a la experimentación a priori. La información contenida en las bases, debió ser evaluada
de acuerdo al objetivo central del trabajo, filtrada y clasificada. Las bases de datos son una gran
fuente de información que puede ser aprovechada desde diferentes perspectivas, siendo esta una
de las posibilidades.
0 suelo, resulta ser el componente más importante dentro de los ecosistemas terrestres, puesto
que a pesar de carecer de autonomía en términos productivos (las bacterias fotosintéticas y
quimiosintéticas como aquellas oxidantes de compuestos inorgánicos simples como amoniaco,
nitrito, sulfito, hierro ferroso no pueden suplir la producción del ecosistema), permite el sustento
físico y nutricional de la comunidad de productores existente en la superficie, facultando de esta
manera la estabilidad funcional del ecosistema. Los microorganismos del suelo participan en todos
y cada uno de los procesos de degradación de la materia, y son los primeros eslabones en la
cadena alimenticia, puesto que de ellos depende en primer término, la liberación de los nutrientes
que posteriormente serán tomados por las plantas, y en consecuencia el sostenimiento de los
ecosistemas. Adicionalmente, se ha demostrado que la composición y la diversidad funcional de las
comunidades de microbios, resulta el principal factor controlador de la productividad ecosistémica
[Phillips et al., 2000]. Por tal razón, la comprensión de tales interacciones microbianas, puede
permitir un incremento en los beneficios obtenidos de su aprovechamiento, la reversión en
procesos de degradación, la restauración de ecosistemas, etc. Dado que el sistema suelo puede ser
considerado como una caja negra, gracias al gran número de variables ambientales asociadas con
su dinámica, se proyectó el diseño de un método que permitiera entender la influencia e
interacción de los diversos factores ambientales sobre procesos críticos del ecosistema.
Uno de los principales problemas que llevaron a la formulación de la investigación, fue la
preocupación de que aún las técnicas de cultivo microbiológicas tradicionales son el sistema de
análisis de suelos más utilizado, especialmente en nuestro país, en donde se hace uso de ellas para
acceder al conocimiento de la composición a grosso de la microflora y microfauna del suelo, y de
su diversidad. La veracidad de la información obtenida por esta vía, es discutible, dado el error que
se genera durante el proceso de aislamiento de los microorganismos, la variedad tanto de formas
de vida como de microambientes en el suelo, sugieren así mismo una gama muy extensa de
condiciones de crecimiento, que hacen poco probable que la microflora quede representada en el
escaso número de medios de cultivo que pueden ser utilizados para la evaluación ex situ.
Adicional mente, el problema del favorecí miento o no de ciertos microorganismos bajo estas
condiciones, hacen que la mayoría de ellos no puedan ser registrados o sean subestimados en
cuanto a su abundancia y diversidad. De ninguna manera, la densidad microbiana en una caja de
cultivo, refleja la densidad real que subyace en el suelo. Por estas y más razones, es claramente
necesario explorar metodologías y hacer acopio de las técnicas más avanzadas, con el fin de
determinar si resultan apropiadas para estos propósitos.
Como primer paso para lograr este
objetivo, se requiere analizar la forma de su ejecución, para tener claramente definidas las
condiciones de operación del método, cuales pueden ser los posibles pasos a seguir y las
dificultades que deben ser afrontadas.
Como elemento de evaluación en desarrollos posteriores, se definieron algunas de las
características que debía poseer un buen método de análisis de suelos, cualquiera sea su
mecanismo de aproximación:
♦ Debe ser una técnica económicamente viable, cuyos costos sean fácilmente cubiertos frente a
su utilidad e información; en donde los costos de equipos y operación, permitan el ofrecimiento
del servicio a la comunidad.
♦ Debe ser muy confiable, puesto que los datos tienen que reflejar de manera adecuada la
realidad edáfica. Esto se logra con una estandarización de la técnica en laboratorio, controlando
las posibles fuentes de error.
♦ Debe ser lo suficientemente rápida en la obtención de resultados, como para permitir el
procesamiento de un gran número de muestras en un tiempo tal, que no sea considerado una
fuente de error adicional.
♦ Debe permitir obtener la máxima información posible, observando las diferentes escalas de
funcionamiento del ecosistema, permitiendo generar tanto una imagen global del estado de un
suelo, como la detección de puntos de ruptura de procesos.
♦ Debe permanecer vigente, es decir, que a medida que nuevos procesos sean evaluados y se
obtenga información al respecto, pueda ser adicionada y la técnica no resulte obsoleta.
♦ Debe evaluar los diferentes procesos que ocurren en el suelo, no simplemente la existencia de
un grupo taxonómico determinado, especialmente, en lo referente a aquellos procesos que no
son exclusivos de un grupo microbiano en particular. Sin embargo, debería permitir el acceso a
esta información si es requerida.
♦ Debe ser reproducible, lo cual permite la implementación de normas de calidad y así mismo el
establecimiento de resultados repetibles en diferentes laboratorios.
♦ No puede estar restringida a un tipo particular de suelo, por el contrario, debe ser aplicable a
toda clase de ellos, incluyendo sedimentos y suelos inundados de cualquier procedencia.
La utilización de la información genómica de los microorganismos, permite que se obtengan datos
reales de los procesos ocurrentes en el suelo, en donde las limitaciones, estarán ya no
determinadas por la fuente de datos, sino por la optimización de los procedimientos que se llevan a
cabo en su consecución. De esta manera, la aplicación de técnicas moleculares permite cumplir con
gran número de los requerimientos antes indicados; por otra parte, los microarreglos de ADN han
demostrado ser una técnica fiable, repetible y lo suficientemente rápida como para ser
implementada en servicios de análisis. Al tratarse de sistema relativamente nuevo, adolece de no
estar lo suficientemente estandarizado como para minimizar el efecto del error, pero se están
haciendo grandes adelantos al respecto, que hacen pensar que su fiabilidad tendrá un incremento
vertiginoso.
Una vez definida la problemática o motivo del estudio, se plantearon los posibles mecanismos de
abordaje para el diseño de la metodología. En primer lugar, la búsqueda de información publicada,
permitió entrever una carencia de herramientas de evaluación holística de los procesos
biogeoquímicos, puesto que en la literatura solo se encontró la evaluación de ciclos aislados, así
que el diseño de este tipo de herramientas, aún no ha sido abordado. Para determinar el tipo de
funciones bioquímicas que iban a ser tenidas en cuenta, fue necesario observar todo el universo de
ciclos de nutrientes existentes y comenzar por darles un valor de importancia que favoreciera su
selección. Dado que la productividad de los ecosistemas terrestres proviene de la vegetación, y
debido a que los servicios que ésta brinda pueden ser vistos económicamente, como fuente de
diversidad, generación de oxígeno, sustento de la cadena alimenticia, o en la generación de
recursos de aprovechamiento humano, una buena motivación en la inversión de esfuerzos de
investigación, es el sostenimiento y desarrollo de la biomasa vegetal. Por tal motivo, los ciclos
biogeoquímicos de mayor importancia fueron determinados pensando en los elementos que son
esenciales para las plantas y las concentraciones en las que son requeridos (Tabla 5).
Tabla 5. Elementos esenciales para la mayoría de las plantas superiores y concentraciones internas
que se consideran adecuadas [Salisbury & Ross, 1994].
ELEMENTO
SÍMBOLO QUÍMICO
CONCENTRACIÓN EN
TÜIDO SECO (%)
Molibdeno
Mo
0.00001
Níquel
Ni
?
Cobre
Cu
0.0006
Cinc
Zn
0.002
Manganeso
Mn
0.005
Boro
B
0.002
Hierro
Fe
0.01
Cloro
Cl
0.01
Azufre
S
0 .1
Fósforo
P
0.2
Magnesio
Mg
0.2
Calcio
Ca
0.5
Potasio
K
1
Nitrógeno
N
1.5
Hidrógeno
H
6
Oxígeno
0
45
Carbono
C
45
Los microorganismos se encuentran involucrados en la mayor parte de los ciclos referentes a estos
elementos. Dado su papel como degradadores de materia orgánica en el retorno de nutrientes,
70
como reguladores en la velocidad con que ésta ocurre y como fórmulas de ingreso de nutrientes
gaseosos o en estados insolubles, se consideró que en la medida en que mayores cantidades de
algunos nutrientes son reclamados por la biomasa vegetal, su importancia se incrementa. Por ese
motivo, fueron seleccionados los elementos Carbono, Nitrógeno, Fósforo, Azufre, Hierro e
Hidrógeno para el estudio, y la búsqueda de información se centró sobre el tipo de reacciones
ocurrentes en las diferentes porciones de tales ciclos y las enzimas involucradas en ellas, con lo
cual se procedió a la búsqueda y/o diseño de los diagramas correspondientes.
6.1. RUTAS BIOQUÍMICAS
Los diagramas de reacciones observados en la Figura 6 , fueron obtenidos a partir de las diferentes
fuentes bibliográficas consultadas, y muestran cada una de las transformaciones que suelen ocurrir
para las diferentes vías metabólicas dentro de los ciclos biogeoquímicos. Como es implícito, un ciclo
biogeoquímico sugiere la existencia de procesos químicos como reacciones de oxidoreducción, con
la mediación de agentes biológicos, que involucran la transformación de nutrientes importantes
para la subsistencia de los procesos vitales a nivel global. Se requiere evaluar cada uno de estos
procesos con el fin de seleccionar aquellos que resultan críticos y detectar las enzimas clave y su
utilidad como marcadores.
6.1.1.
C ic lo del C arbono:
El carbono puede estar presente en formas reducidas, tales como el metano (CH4) y la materia
orgánica, y en formas más oxidadas como el monóxido de carbono (CO) y el C02. Los reductores
(como el hidrógeno) y oxidantes (como el 0 2), influyen en el curso de las reacciones biológicas y
químicas que involucran al carbono. Si el hidrógeno y el metano se mueven desde áreas
anaerobias hacia aerobias, se crea una oportunidad para que los oxidantes aerobios de hidrógeno
y metano puedan actuar [Prescott et al., 2000].
De los 500 millones de toneladas de metano producidas anualmente en el planeta, las bacterias
oxidantes de metano contribuyen al reciclaje del 60% [Gilbert etal., 2000]; dado que mantienen el
equilibrio en la reserva de este gas de invernadero deben ser incluidas en cualquier evaluación
microbiológica realizada en suelos. Los genes involucrados en la oxidación de metano (pmoA,
mmoB, y mxaF), ya han sido usados para caracterizar comunidades microbianas del suelo [Kent &
Triplett, 2002], lo cual facilita su elección. La metano monooxigenasa (MMO) (Figura 6 i) existe en
dos formas diferentes [Murrell et al, 2000], la enzima seleccionada para este estudio se encuentra
ligada a membrana y está evolutivamente relacionada con la amonio monooxigenasa (AMO) de las
bacterias denitrificantes, siendo sintetizada solo en presencia de suficientes concentraciones de
cobre. La ventaja que presentó para su selección, es que a diferencia de la MMO particulada, se
encuentra presente en todos los metanotrofos [Conrad, 1996], pudiendo ser usada como marcador
funcional para estos organismos.
Los organismos que efectúan la reacción contraria, los metanógenos, poseen varios biomarcadores
potenciales, incluyendo 1) la coenzima F420, 2) los isoprenoides y éteres lipídicos en las
membranas celulares, y 3) la coenzima M (CoM). El segundo marcador es del tipo bioquímico, por
lo cual no es aplicable a la metodología planteada. Se consideró la coenzima M como el marcador
más útil, debido a que todos los metanógenos conocidos expresan esta enzima [Hallam et al,
2003]. Por otra parte, la coenzima F420 tiene dos limitaciones, la primera se debe a que las
concentraciones intracelulares de coenzima F420 presentan muchas variaciones y la segunda es
que se encuentra extendida en grupos que no son metanógenos [Elias et al, 1999].
La coenzima M está involucrada en otras reacciones de reducción a metano como la que ocurre a
partir de C02 o acetato (Figura 6gj) entre otros. Este último, es una de las principales fuentes y
solo se han cultivado dos géneros que lo llevan a cabo: Methanosarcina y Methanothrix. En este
conjunto de reacciones, el acetato debe ser activado a AcetilCoA antes del clivaje de los enlaces CC y C-S. El grupo carbonilo es oxidado a C02, el grupo metilo es transferido vía
tetrahidrosarcinapterina a la coenzima M. La metanogénesis partiendo de CO2, toma lugar bajo
condiciones anóxicas y es una forma de respiración anaerobia [Conrad, 1996].
Las CO-deshidrogenasas también son enzimas claves en el ciclo del carbono en los suelos, puesto
que intervienen en el metabolismo del CO de microbios diversos fisiológica y filogenéticamente,
que lo utilizan como única fuente de energía y carbono [Lorite et al, 2000], entre ellos se cuentan
hongos, actinomicetos, otras bacterias y arqueas [King, 2003]. Además de la oxidación de CO, se
encuentran involucrados en la reducción de acetil-coA (metanogénesis) y en la reducción de
compuestos como el sulfuro y disulfuro de carbono (Figura 6gh), por lo cual fueron consideradas.
La degradación de compuestos orgánicos naturales más recalcitrantes como la quitina, la lignina y
la celulosa, es de suma importancia para el retorno al sistema de sus principales constituyentes,
siendo el carbono el elemento de mayor proporción. La despolimerización de estos compuestos
también conlleva la liberación de una importante fuente de nitrógeno y azufre, por lo cual, estos
polímeros pueden ser incluidos en los respectivos ciclos biogeoquímicos. A continuación, se
establecen las principales enzimas involucradas en dichos procesos, en donde su carácter único, las
lleva a ser seleccionadas como marcadores. Los hongos como unos de los mejores degradadores
de lignina, secretan varias enzimas oxidativas incluyendo LiP, MnP, lacasas y quitinasas [Larrondo
et al., 2003], utilizadas como marcadores.
Las lacasas (bencenodiol oxigeno oxidoreductasas), son glicoproteínas que contienen cuatro
átomos de cobre y catalizan la oxidación de la lignina, usando oxígeno molecular como aceptar de
electrones; el cual es luego reducido a agua. Las lacasas fúngicas, degradan lignina en conjunción
con la lignin peroxidasa (LiP) y la manganeso peroxidasa (MnP) [Muñoz et al., 1997] (Figura 6 p).
Los sustratos van formando radicales libres que pueden convertirse en quinonas mediante
oxidaciones [Lucas etal., 2001].
El ciclo catalítico de las LiP o ligninasas es semejante al de otras peroxidasas. La oxidación de la
enzima a expensas del peróxido de hidrógeno, origina la transformación de su sitio activo en un
compuesto intermediario (compuesto I, Figura 6o). Este compuesto actúa como generador de
radicales libres. Así, en presencia de un compuesto aromático (fenólico o no) donador de
electrones, el compuesto I es reducido a compuesto II (ganando un electrón) a la vez que se
genera un radical aromático (.+). Tras una segunda reducción del compuesto II con un sustrato
aromático se regenera la enzima nativa, cerrándose el ciclo. Es la peroxidasa con el más alto
potencial de oxidoreducción, lo que explica su poder oxidante sobre las unidades aromáticas no
fenólicas de la lignina [Lucas etal., 2001].
0 ciclo catalítico de la Manganeso Peroxidasa es semejante al de la LiP, pero hay diferencias en la
reacción de reducción, siendo el Mn(II) el donador de electrones. Tanto el compuesto I como el II
son reducidos por el Mn(II) (Figura 6q), a la vez que éste es oxidado a Mn(III). Los iones Mn(III)
con alto potencial de reducción son estabilizados mediante la formación de quelatos con ácidos
orgánicos como el oxalato, malonato, malato, tartrato o lactato [Lucas etal, 2001].
Los genes para celulasas fueron recopilados teniendo en cuenta la selección de éstos genes
realizada por Lynd et al. [2002], en la cual se indican los diferentes genes codificantes para los
grupos de acción catalítica de éstas: endo-B-glucanasas, exo-B-glucanasas, celobiohidrolasas y
celodextrinasas. La inclusión de estos procesos y las proteínas catalizadores de la despolimerización
de la celulosa, se basa en que este compuesto es el mayor componente de la biomasa vegetal.
6.1.2.
C ic lo del A z u fre :
Los microorganismos son los principales contribuyentes del ciclo del azufre, por ejemplo, los
microorganismos fotosintéticos usan sulfuro como fuente de electrones. En ausencia de luz, este
compuesto puede pasar hacia ambientes oxidados, en donde géneros de quimiolitoautótrofos como
Thiobacillus realizan su acción. En contraste, cuando el sulfato se difunde hacia hábitat reducidos,
provee una oportunidad para que otros grupos microbianos lo reduzcan, utilizándolo como aceptar
de electrones para la producción de energía. Este es un ejemplo de un proceso de reducción
desasimilativa y de respiración anaerobia. En comparación, la reducción de sulfato para su uso en
biosíntesis de aminoácidos y proteínas es descrita como reducción asimilativa. El sulfito es un
intermediario que puede ser reducido a sulfuro por una amplia variedad de microorganismos,
incluyendo A/teromonasy Clostridium, Desulfovibrio y Desulfotomaculum [Prescott etal., 2000].
Se ha reconocido que enzimas como la sulfuro oxigenasa, que cataliza la oxidación de compuestos
de azufre muy reducidos como el azufre elemental e iones sulfuro, la tiosulfato citocromo Coxidoreductasa que aprovecha la capacidad donadora de electrones del tiosulfato, la sulfito oxidasa
encargada de la oxidación de sulfito a sulfato, la APS reductasa involucrada en la producción de
Adenosin-fosfosulfato, que ha sido propuesta como un marcador útil por el grado de conservación
de las secuencias codificantes en diferentes grupos [Friedrich, 2002] y la ADP sulfurilasa encargada
de la liberación del ión sulfato, son las principales encargadas de la etapa oxidativa del ciclo del
azufre, que permite su aprovechamiento por las plantas y otros organismos (Figura 61). Otra vía de
oxidación de azufre ocurre a través de la oxidación a ácido sulfídrico, la posterior oxidación a sulfito
por medio de la enzima Sulfito reductasa, la cual es dependiente de Fe3+y la formación de SO<t“
con la ayuda de la oxidoreductasa S-Fe (Figura 6k).
La reducción de sulfato por las dos vías existentes, asimilativa y desasimilativa, muestran enzimas
de distribución generalizada entre los grupos funcionales. La primera vía es requerida para la
formación de aminoácidos como la cisteína, precursora de las moléculas orgánicas que contienen
azufre reducido [Snoeek et al., 2003]. La respiración anaerobia de sulfato es un componente
central del ciclo global del azufre y es exhibida solo por procariotes [Loy etal., 2002].
Las enzimas ATP sulfurilasa, flavoproteina hierro-azufre adenosin 5-fosfosulfato reductasa (APS) y
la sirohemo sulfato reductasa, están involucradas en el metabolismo tanto oxidativo como
reductivo (Figura 6 m), la primera, por ejemplo, es la enzima clave encargada de la activación del
sulfato [Snoeek et al., 2003]. Todas las enzimas son encontradas generalmente en bacterias y
arqueas reductoras de sulfato. Además, la presencia de APS reductasa y ATP sulfurilasa ha sido
reportada para varias especies de bacterias sulfuro-oxidantes quimiotróficas y fototróficas, esto las
hace de utilidad en la evaluación de la ocurrencia de las reacciones en suelo. La enzima(bi)sulfito
reductasa desasimilativa (DSR), ha sido reportada como la enzima primordial en la ruta
desasimilativa de reducción de sulfato y sulfito [Karkhoff etal., 1995].
6.1.3.
C ic lo del N itró g e n o
Debido a que el nitrógeno del nitrato se haya muy oxidado, debe ser primero reducido a amonio
antes de poder ser convertido a una forma orgánica. Esta reducción de nitrato es de tipo
asimilativo. En este caso, el nitrógeno hará parte de la materia orgánica y no es utilizado para la
generación de energía [Prescott et al., 2000]. Este proceso se consideró trascendente por cuanto
permite una forma de almacenamiento temporal del nitrógeno, regulando su disponibilidad
biológica, lo que es muy importante en suelos tropicales en donde el exceso de nitrógeno se pierde
rápidamente, ya sea por denitrificación o por lavado, así que la reserva en la biomasa microbiana
resulta crítica para la fertilidad de los suelos. Como puede observarse en la figura 6 b) en los
hongos existen dos enzimas claves ejecutando la función, la nitrato reductasa (NIAD) y la nitrito
reductasa (NIIA) [Kinghorn, 1989]. En bacterias pueden estar involucradas varias enzimas
diferentes, dependiendo del organismo a tratar (5d), NARB y NIRA en Cianobacterias y NASA,
NASB y NASC en una amplia diversidad de microorganismos [Alien et al., 2001]; también fueron
consideradas dos enzimas relacionadas con la transferencia de electrones hacia el citoplasma NRFA
(Figura 6f) y NASC.
La nitrificación, el proceso aerobio de oxidación del ión amonio (NH4+) a nitrito (NCh) y
subsecuentemente a nitrato (N03 ), es de igual manera una transformación que permite que exista
disponibilidad de nitrógeno en un estado fácilmente asimilable por las raíces [Salisbury & Ross,
1994]. En un aspecto negativo, las bacterias oxidantes de amonio tienen actividad sobre
fertilizantes a base de urea y de amonio, oxidándolos a nitrito, por lo cual son fácilmente lavados,
generando importantes pérdidas al favorecer también la denitrificación [Purkhold etal, 2000]. La
enzima AMOA (Figura 6e), es una enzima única para los mirificantes oxidantes de amonio y de la
cual se sabe que provee un nivel de resolución filogenético que cubre los diferentes taxa [Casciotti
& Ward, 2001; Purkhold et al., 2000; Rosch et al., 2002; Aakra et al., 2001], por lo cual fue
escogida como marcador adecuado en la evaluación de esta función en suelos.
0 proceso de densificación, requiere un conjunto de condiciones ambientales diferente. En este
proceso desasimilativo, el nitrato es usado como un oxidante en la respiración anaerobia. Los
principales productos incluyen N2 y N20, aunque el nitrito (N02) también puede acumularse. El
nitrito es de importancia ambiental, debido a que contribuye a la formación de nitrosaminas
carcinogénicas y constituye un compuesto tóxico para las plantas. Finalmente, el nitrato puede
también ser transformado a amonio en una reducción desasimilativa por una variedad de bacterias,
incluyendo Geobacter metall/reducens, Desulfovibriospp., y Clostridium spp. [Prescott etal., 2000].
Dado que la densificación completa requiere de la acción secuencial de 4 enzimas, la nitrato
reductasa, la nitrito reductasa, la óxido nítrico reductasa (monóxido de nitrógeno reductasa), y la
óxido nitroso reductasa (monóxido de dinitrógeno reductasa) (Figura 6a), éstas, deben ser
consideradas conjuntamente para la evaluación de la acción biológica sobre el ciclo del nitrógeno.
De las dos nitrato reductasas, la enzima asociada a membrana está típicamente involucrada con la
respiración de este compuesto bajo condiciones anóxicas, y juega probablemente el papel más
importante en el ciclo ambiental del nitrógeno [Gregory et al., 2003]. Esta enzima condiciona el
éxito de las bacterias oxidantes de amonio para tolerar grandes cantidades de nitrito o el
crecimiento en ambientes anóxicos. Así mismo, la nitrito reductasa en una enzima clave en la vía
de la denitrificación, como lo indican Casciotti & Ward [2001]. Por el contrario, la utilidad de la
monóxido de nitrógeno reductasa ha sido puesto en duda, debido a que se ha encontrado que
pequeñas cantidades de NO son originadas a menudo a partir de la respiración de nitrato, y no de
la denitrificación, por lo que esta propiedad parece no ser exclusiva de los denitrificantes [Zumft,
1997].
La asociación catalítica napAB (Nitrito reductasa periplásmica, Figura 6f) tiene una variedad de
papeles fisiológicos en diferentes organismos, desde la catálisis del primer paso para una
verdadera vía de densificación anaerobia, hasta el aprovechamiento de bajas concentraciones de
nitrato, permitiendo su respiración en presencia de oxígeno y conduciendo al consumo de
equivalentes reductores durante el crecimiento sobre carbono reducido [Richardson, 2000; Zumft,
1997],
La enzima hidroxilamin oxidoreductasa también puede catalizar una reacción de densificación en
ausencia de oxígeno utilizando como aceptor de electrones el nitrito (Figura 6f), se ha descrito en
especies de Planctomycetales como Scalíndua sorokinn, Kuenenia stuttgartiensis, Brocadia
anammoxidans, P/anctomyces. Es una reacción inhibida además por exceso de nitrito o fosfatos
[Strous et al., 1999].
Por otra parte, la fijación de nitrógeno, proceso biológico único que permite el aprovechamiento de
la fuente atmosférica de este macroelemento, es llevada a cabo por procariotes aerobios y
anaerobios, simbióticos y libres, en un proceso de alto consumo energético en el cual se suceden
consecutivamente procesos reductivos graduales, cuyo objetivo final es la obtención de amonio
(Figura 6c). Debido a que ha sido extensamente estudiada, la subunidad II de la dinitrogenasa de
hierro codificada por el gen nifH no fue incluida en el estudio. Se han diseñado cebadores y sondas
eficientes para este marcador [Poly et al., 2001], por lo cual, se consideró realizar la búsqueda
para los heterodímeros de la subunidad I de la dinitrogenasa (nifD y nifK), para las subunidades
alfa, delta y beta de la nitrogenasa de vanadio (vnfD, vnfG y vnfK) y para las subunidades alfa3,
beta 3 y delta3 de la dinitrogenasa II (anfD, anfG y anfK), así como las nitrogenasas alternativas
(vnfH y anfH).
Para genes representativos del ciclo del nitrógeno, como nitrogenasa, nitrito reductasa
desasimilativa y amonio monooxigenasa, no existe hibridización cruzada con genes de la nitrito
reductasa nirS y nirK [Taroncher et al., 2003], por ello fueron considerados candidatos para el
estudio realizado, puesto que pueden ser analizados en paralelo.
6.1.4.
C ic lo del H ie rro
El ciclo del hierro, incluye varios géneros microbianos diferentes que realizan su oxidación, la
transformación de ión ferroso (Fe2+) a férrico(Fe3+). ThiobacWus ferrooxidans lo ejecuta bajo
condiciones acidas, Gallionella es activa bajo pHs neutros y Sulfolobus funciona bajo condiciones
ácidas y termofílicas. Otros organismos como Sphaerotüus y Leptothrix, producen esta oxidación
con la formación de hierro insoluble, que precipita a pH neutro pero creciendo sobre sustratos
orgánicos (quimioheterótrofos) [Straub et al., 1996]. Este ciclo está estrechamente ligado al del
azufre, siendo muy dependiente de los procesos oxidoreductivos de los compuestos azufrados
(figura 6 k) y a la metanogénesis, en donde la disponibilidad de Fe(III) como un aceptor de
electrones alterno para la respiración microbiana es un factor controlador. Su acción donante de
electrones también es sumamente importante en bacterias aerobias [Straub et al, 1996]. La
importancia de este ciclo tiene entre sus argumentos el hecho de que en suelos del trópico, este
elemento contribuye a la "pérdida" del fósforo disponible en los suelos; el alto contenido de hierro
hace casi inoficiosa la aplicación de fertilizantes fosforados, los cuales son rápidamente
inmovilizados.
En ecosistemas inundados o con
regímenes pluviométricos variables, la
disponibilidad del fósforo y otros elementos está relacionada con los estados de oxidación del
hierro. La única enzima considerada específica para este ciclo es la rusticianina, la cual es una
proteína de cobre y el componente principal en la cadena de transporte de electrones en
quimiolitótrofos acidófilos como T. ferrooxidans, razón por la cual fue seleccionada [Walter et al.,
1996] (Figura 6 n).
6.1.5.
C ic lo del F ó sfo ro
Debido a que el ciclo del fósforo es de carácter sedimentario, y a que no existe un grupo funcional
que sea considerado como solubilizador o fijador de fósforo, encontrar un marcador específico para
este ciclo no fue posible. La capacidad degradadora de materia orgánica, y la actividad de
fosfatasas con la consecuente liberación de compuestos fosforados, es una capacidad extendida en
el mundo microbiano, por lo tanto, se estimó adecuado tener en cuenta solo aquellos organismos
que por sus características, facilitan el acceso de este importante elemento a las plantas, las
micorrizas; las cuales funcionan a manera de bombas, concentrando el escaso fósforo de algunos
suelos en su micelio. Las micorrizas son un puente entre diferentes ciclos, como el del carbono y el
nitrógeno; parecen estar involucradas en la fijación de este último, gracias a la presencia de
endosimbiontes del género Burkholdería [Minerdi et al., 2001] y, adicionalmente permiten la
recuperación de fósforo del sumidero geoquímico retornándolo al sistema biológico. Dado que para
la detección de estos organismos se han diseñado cebadores y sondas basadas en ARNr subunidad
pequeña [Kjoeller & Roendahl, 2001; Redecker, 2000; Redecker etal, 2000], su evaluación es una
excepción a la orientación original de esta investigación, por cuanto no se trata de un grupo
funcional sino de un grupo taxonómico. La información recopilada alrededor del Orden Gomales
permitió conocer la existencia de secuencias que permitieran la detección de dos nuevos grupos
que han sido considerados recientemente, el género Archaeospora y el género Paraglomus [Morton
& Benny, 2001] y por consiguiente en este trabajo fueron abordados, observando las regiones
codificantes para ARNr 18S, 5.8S, y los espaciadores intergénicos U S l e US2.
La utilización de hidrógeno como donante de electrones por muchas bacterias, con ayuda de
hidrogenasas para la producción de ATP o para crecimiento autotrófico está ligada a muchas
reacciones dentro de los ciclos biogeoquímicos, como se observa en el modelo que fue diseñado
posterior al establecimiento de las reacciones enzimáticas.
6.2. MODELO CONCEPTUAL
Una vez detectadas las vías bioquímicas para los procesos mencionados, se inició la búsqueda de
los genes encargados de la codificación de sus enzimas, teniendo en cuenta que a pesar de que
éstas medien las reacciones bioquímicas de una ruta metabólica particular y por ello pueden
parecer semejantes, los nombres de los genes codificantes pueden variar entre organismos, como
pudo observarse para las enzimas: rusticianina (Rus, rust), Nitrito reductasa (nrfA, nirB) y lacasa,
entre otras.
A partir de las fuentes de información recopiladas (vías bioquímicas, enzimas y genes), se diseñó
un modelo conceptual (Figura 7) en el que se integraron las principales etapas de la actividad
biológica en el retorno de los elementos químicos hacia el suelo, como un primer paso para el
desarrollo del sistema de sondas moleculares, que permitiera seguir las dinámicas de dichos
procesos. Esta forma de representación, permitió observar de una manera más explícita las vías de
retroalimentación y de qué manera las alteraciones en alguno de sus componentes pueden afectar
a los restantes.
A continuación, se describen las diferentes zonas en que se divide el modelo (ver Figura 7),
iniciando con el proceso de mineralización de la materia orgánica: La mineralización de la
necromasa es un aspecto vital para el componente heterotrófico; en esta transformación, se
liberan componentes en diferentes estados de degradación [Odum, 1972; Brock & Madigan, 1993]
a partir de sustancias complejas que de esta manera pueden ingresar a un ciclo biogeoquímico, o
ser aprovechados directamente y de forma inmediata por ia biota. Dentro del ciclo del carbono, se
representa la actividad de los hongos micorrícicos en el retorno de materia desde el suelo hacia las
plantas (uniendo dos compartimientos del ecosistema), la actividad de los organismos
fermentadores y de otros microorganismos que degradan compuestos recalcitrantes como lignina,
quitina, huminas y celulosa en sus constituyentes simples [Steffen et al., 2002; Muñoz et al., 1997;
Metcalfe et al., 2002] y que aumentan de esta manera la velocidad de retorno de los diferentes
elementos químicos. Otra forma de ingreso del carbono involucra el componente gaseoso, en
donde éste es fijado a través de procesos fotosintéticos con mediación del oxígeno o de sustratos
diferentes (fotosíntesis anoxigénica), u oxidado por bacterias carboxidotrofas [Drake et al., 2002;
King, 1999]. Así mismo, se produce su retorno hacia la atmósfera en forma de metano, con la
mediación de compuestos reductores como el hidrógeno [Valentine, 2002]. Otro ciclo que involucra
a este último, es el del hierro, el cual exhibe formas de mayor o menor solubilidad de acuerdo a su
estado de oxidación [Sobolev & Roden, 2002], lo que incide también en los ciclos del azufre y del
fósforo, elemento éste, al que comúnmente se encuentra ligado [Vera et al., 2002]. El ciclo del
nitrógeno también se ve afectado por el estado redox del sustrato, puesto que su retención o
liberación, obedece a los niveles de saturación hídrica del suelo [Braker & Tiedje, 2003]; así, en
suelos inundados o anóxicos predominan procesos de denitrificación [Braker & Tiedje, 2003] que
tienen como resultado la pérdida del nitrógeno hacia la atmósfera, caso contrario a suelos bien
drenados en donde son frecuentes los procesos de fijación de este elemento y su circulación en
formas oxidadas [Zehr et ai, 2003]. Se encontró hace un tiempo, que la oxidación del hierro (II)
está acoplada al proceso de denitrificación siguiendo la reacción: lOFeCOs + 2 NQ3 + 24H20 ---- >
10Fe(OH)3 + N2 + lOHCOf + 8 H+ [Zumft, 1997],
Finalmente, el ciclo del azufre resulta ser bastante complejo debido a los diferentes grados de
oxidación que puede presentar, y a la gran variedad de compuestos de los que forma parte; su
trayectoria va desde compuestos muy oxidados como el sulfato, hasta formas gaseosas como el
ácido sulfídrico, que domina en suelos reductores [Castro et al., 2002] y que condiciona su
desaparición del ecosistema.
Los elementos químicos considerados, pueden hacer parte tanto de vías degradativas, como de
vías de construcción de estructuras biológicas, o simplemente de mecanismos de disipación de
energía. La visualización esquemática de las enzimas involucradas en cada uno de los procesos
mencionados, así como de los genes encargados de su codificación, facilitan el seguimiento y
desarrollo de la Investigación, pues establecen un primer paso en la búsqueda de secuencias
anotadas en las bases de datos, y permiten su actualización a medida que el conocimiento de la
biología molecular de estos procesos es ampliada para un mayor número de organismos. Como se
dijo anteriormente, los nombres de los genes codificantes suelen sufrir variaciones, por este
motivo, se requiere efectuar búsquedas exhaustivas en las bases de datos, no solamente
ingresando el nombre particular de un gen, sino también la actividad enzimática. Con la estrategia
planteada fueron encontradas secuencias para 192 genes (ver Tabla 4).
6.3. APROXIMACIÓN FUNCIONAL
El estudio fue proyectado para centrarse en la clasificación funcional más que en la taxonómica,
puesto que la especialización microbiana se manifiesta más de forma bioquímica que morfológica.
Ha sido un punto de vista discutido, sin embargo las razones son evidentes:
1.
Aún se desconoce la existencia de un elevado porcentaje de microorganismos del suelo, con lo
cual se pueden deducir iguales falencias en cuanto a su ubicación taxonómica; no es posible prever
si nuevas secuencias reportadas pertenecerán a un grupo anteriormente descrito o constituirán un
nuevo taxón.
2.
El abordaje funcional es mas incluyente, permite asociar de manera más segura un
organismo, aún cuando no haya sido anteriormente descrito, puesto que es más probable que un
gen de gran importancia metabólica, exhiba regiones conservadas que ayudan en su identificación,
aún en grupos diversos. Su variación estará condicionada por el tiempo de divergencia a partir de
un ancestro común, y por ello las sondas a construir deben tener en cuenta diferentes niveles
taxonómicos.
3.
El diseño de sondas que permitan un abordaje taxonómico viable (es más difícil cubrir la
totalidad de especies descritas), debe tomar en cuenta solo niveles de clasificación por encima de
especie, ya que es conocido que bacterias que pertenecen a un mismo género, de hecho pueden
diferir en cuanto actividades metabólicas específicas.
4.
Debido al desconocimiento que persiste para la mayoría de géneros y especies del suelo, el
abordaje taxonómico encasilla a los microorganismos dentro de un grupo fisiológico en particular.
Por el contrario, en la naturaleza, es común que un organismo desempeñe diferentes funciones
dependiendo de su hábitat y de variaciones ambientales específicas (historia de vida), por ello la
aplicación taxonómica resulta ser restrictiva y excluyente.
5.
El abordaje taxonómico también puede dejar de lado especies endémicas, nunca descritas y
que pueden ser claves en la productividad del ecosistema gracias a su actividad.
6.
La comunidad es una unidad funcional, con una estructura que es más variable que el tipo de
metabolismo, las especies que la componen son hasta cierto punto intercambiables en tiempo y
espacio (Fernández etal., 1999).
Con lo anterior, se concluye que la evaluación funcional integral, permite visualizar de una manera
más real el nivel de estabilidad de un ecosistema, en donde el suelo puede ser utilizado como un
mecanismo que refleja su estado de salubridad. La evaluación de un proceso químico aislado no
siempre resulta tan informativa en la detección de alteraciones, puesto que los organismos están
asociados en comunidades bióticas, las cuales mantienen su unidad gracias a la interdependencia
de sus miembros. La evaluación de la diversidad funcional en conjunto, permite establecer si un
ecosistema es sustentable o ha sido gravemente disturbado, establecer grados de alteración y
generar indicadores de niveles de recuperación o del estado sucesional en que se encuentra un
ecosistema.
Otra ventaja de este abordaje frente al procedimiento tradicional (cultivo en medios artificiales), es
que a través de esta metodología, puede ser posible detectar la actividad biológica, aun cuando
ésta sea muy reducida, incluso bajo umbrales que no pueden ser detectados por métodos
convencionales, ya que por medio del uso de microarreglos se ha llegado a la detección de
cantidades muy pequeñas de ADN, del orden de 10 pg (equivalente a aproximadamente 10^
copias) por blanco [Cho & Tiedje, 2002]. Por el contrario, si un organismo perteneciente a un
grupo funcional, no crece en el medio de cultivo selectivo, existe la incertidumbre de si en realidad
dicha función está ocurriendo en el suelo o no, o se trata tan solo de que aquellos grupos
encargados de la misma no pueden ser aislados.
6.4. BASE DE DATOS
A partir de la información de secuencias obtenidas en los bancos mundiales de datos como se
menciona en la bibiografía, se creó una base de datos para consulta local, con 3668 entradas para
ADN y 3955 entradas para proteína, escrita en lenguaje basic de OpenOffke, para las plataformas
Windows y Linux, a la cual es posible acceder mediante una interfase gráfica que se despliega por
82
medio de la Suite OpenOffice, como se observa en las Figura 16 y 17, este programa es de tipo
"Open Source" por lo cual se incluye en el CD adjunto.
Acerca de BioPiocSuelos
Este programa forma
parte integral de la
Tesis de Grado
DISEÑO DE UNA
ESTRATEGIA PARA LA
EVALUACION DE
ATRIBUTOS
FUNCIONALES
EDAFICOS MEDIANTE
SONDAS DE ADN
Bogotá D.C.. Colom bia
O ctubre de 2 0 0 4
Ayuda
Figura 16. Ventana de bienvenida a la consulta para la base de datos Bioproc_suelos.
BloProcSi
Sistema de Consulta a la Base de Dato
r....MOLECULA
-
— — -— ------------------------ —
AD N
1Seleccione Campo
ry
1Seleccione Campo
r*
r
— ----------■
-----------------
P r o t e ín a s
_Ljjsel J l l 1 Seleccione Campo
jJ )
-iJI :
'
- -J
JÜ
1 Seleccione Campo
jj
| Seleccione Campo
JÜ
Consultar
Cancelar
Figura 17. Ventana de consulta de la base de datos BioProc_suelos.
Ayuda
La base se encuentra dispuesta en formato CD, fue dividida en secciones correspondientes a los
datos de proteína y de ADN, en la cual se consignó la información referente a los campos
previamente seleccionados en la metodología, además de otros como información de ID de familia
de proteína en la base ProDom, descripción general de la familia y la fuente a partir de la cual se
obtuvo el ID de las secuencias.
El análisis de la cantidad y calidad de los datos de la base, se presenta en las Figuras 8 a 13, que
se consideran a continuación. La Tabla 3 muestra los géneros de microorganismos reportados en
las bases de datos.
Las gráficas 7 y 10 muestran una mayor cantidad de reportes de secuencias de ADN y proteína
pertenecientes al Dominio Bacteria, frente a los Dominios Eukarya y Archaea; lo cual se justifica,
debido a que la mayoría de estudios difundidos han estado dirigidos hacia este dominio en
particular. Los informes de secuencias de hongos son más escasos y se limitan a grupos fisiológicos
particulares como los ligninolíticos y los quitinolíticos, en donde su alta capacidad de degradación
de compuestos recalcitrantes ha sido comprobada
[Gutiérrez & Roncando, en línea].
Tradicionalmente, el Dominio Archaea ha sido asociado con hábitats extremos; posiblemente esta
ha sido la causa de que muy poca atención haya sido puesta en el análisis de sus actividades en
suelos. Sin embargo, empieza a reconocerse su presencia e importancia en ecosistemas terrestres
[Basset et al., 1999; Borneman & Triplett, 1997; Kent & Triplett, 2002],
Se cuenta también con una modesta representación de secuencias no identificadas más allá del
nivel de dominio, indicio del desconocimiento que persiste en el área de la microbiología de suelos,
en donde según ha sido señalado anteriormente, un mínimo porcentaje de microorganismos han
sido aislados [Ovreas et al., 1998]. Existen aún un gran número de microorganismos edáficos por
ser reconocidos y por ende muchos de los genes involucrados en ciclos biogeoquímicos por
identificar y secuenciar; en tanto que la vasta mayoría de las secuencias referidas en las bases de
datos pertenecen a organismos cuyos genomas han sido el foco de interés y definidos como
organismos tipo. Los análisis moleculares filogenéticos de los genes norB, detectaron dos
subgrupos separados: por una parte los organismos cultivados y por otra genes obtenidos de
muestras ambientales, demostrando una discrepancia típica entre estos dos tipos [Braker & Tiedje,
2003]. Scala & Kerkhof [1999], también indican que no existe sobrelapamiento en las secuencias
del gen nosZentre los microorganismos del grupo cultivado y las secuencias ambientales. Dado lo
anterior, una mayor diversidad de grupos taxonómicos representados en las bases de datos,
redunda en una mayor precisión en el desarrollo de herramientas que permiten la detección de los
grupos funcionales, en sistemas complejos como el suelo. Sin embargo, es de esperarse que dada
la importancia que las actividades enzimáticas requeridas en los ciclos de nutrientes tienen para los
organismos que las llevan a cabo, las similitudes entre grupos de secuencias de ADN de diferentes
organismos sean consistentes y que por lo tanto las secuencias consenso desarrolladas, permitan
cubrir un amplio intervalo de éstas en los suelos. Por otra parte, se ha encontrado que el grado de
conservación de los genes microbianos, es similar entre diferentes genomas y que alrededor de un
70% de los genes de cualquier organismo tiene homólogos en otros genomas [Peplies et al,
2003].
Otro aspecto relevante, es el relativamente escaso número de investigaciones que se relacionan
con la microbiología del suelo, realizadas durante los últimos años.
No obstante haberse
encontrado entre los datos alrededor de 700 reportes de diversa índole que involucran a estos
microorganismos, existen tan solo 35 investigaciones en donde el objetivo principal fue la
microflora edáfica.
Es llamativo encontrar que de estos reportes, alrededor del 90% han sido
llevados a cabo en suelos de climas templados. Los conocimientos acerca de la biología molecular
de microorganismos de suelos tropicales que han sido difundidos entre la comunidad científica, son
poco numerosos, y no existen trabajos suficientes que aborden la existencia de endemismos que
incluyan áreas relativamente pequeñas [Cho &Tiedje, 2000; Febles & González, 2002].
En las gráficas 8 y 11, se demuestra una mayor representación de la división Proteobacteria
respecto a otros grupos, esto se debe a que son bacterias que despiertan gran interés y que han
sido ampliamente estudiadas fisiológica y filogenéticamente, en primer lugar, por su capacidad
oxidativa de metano [Lucchini etal., 2001; Morris et al., 2002]; en segundo lugar, la enzima clave
de este proceso, la metano oxigenasa (pmoA) ha mostrado estar relacionada filogenéticamente
con otra enzima prioritaria, la amonio monooxigenasa (amoA) [Lucchini etal, 2001; Morris etal,
2002] y esto ha despertado gran interés. El elevado número de secuencias reportadas,
procedentes de estos dos genes son la causa de este fenómeno (secuencias de ADN reportadas
para amoA, 156; para pmoA, 99; secuencias de proteína reportadas para los genes amoA, 154;
para pmoA, 109).
Las gráficas 9 y 12, indican una escasa representación de géneros microbianos entre las secuencias
de ADN y proteína registradas en las bases de datos. Por ejemplo, en la figura 10 se puede
observar que más del 80% de los géneros exhibe un escaso número de secuencias, los genes
bgxA, abg, ce/A, ce/C, celY, chi92, pchA, sat, para los que se registra solo una secuencia, no
pudieron ser incluidos en el análisis, mientras que otros genes mostraron solo dos secuencias, lo
cual es insuficiente para la obtención de consensos adecuados para el desarrollo de sondas
[Taroncher et al., 2003]. Un comportamiento similar se observa para las secuencias de proteína. El
número y calidad de las secuencias evaluadas, es un factor de suma importancia en el diseño de
oligonucleótidos, puesto que la evaluación de un número adecuado de secuencias permitirá así
mismo, apreciar la mayor cantidad posible de sus variantes y con ello, la probabilidad de
recuperación en una muestra de suelo de secuencias relacionadas con una vía metabólica en
particular, se incrementa.
Uno de los principales obstáculos encontrados, fue la ausencia de reportes de secuencias
referentes a algunos procesos enzimáticos de los ciclos del nitrógeno y azufre: oxidación de nitrito,
oxidación de azufre elemental, oxidación de sulfito y oxidación de APS, entre otros. A pesar de los
esfuerzos realizados para la comprensión de los procesos ocurrentes en los suelos, la aún escasa
aplicación de metodologías moleculares en el área de suelos, no ha permitido acelerar el proceso
de conocimiento de los diversos genomas presentes en ellos, como primer paso para la detección
de secuencias codificantes de enzimas involucradas en ciclos biogeoquímicos. Sin embargo, la
aplicación de estrategias de minería de datos como es el caso de la presente investigación,
permiten identificar carencias en estos campos y por lo tanto pueden ayudar a focalizar los nuevos
estudios hacia áreas que aún no han sido abordadas.
Cuando los alineamientos obtenidos fueron observados en una escala taxonómica encima del nivel
de familia (en donde se espera una alta divergencia de secuencias), aún se encontraron secuencias
consenso muy similares a las de niveles inferiores (napA, narH, nosZ, y anfDentre otros, evaluados
al nivel de división), lo que puede revelar eventos de transferencia horizontal de genes, como se ha
comprobado para la enzima sulfito reductasa desasimiiativa (dsrAB), Adenosin-5-fosfosulfato
reductasa (apsA) [Friedrich, 2002; Wagner et al, 1998], lignin peroxidasa {Hp) [Stewart & Cullen,
1999], el grupo de genes /7/r (nitrito reductasa) [Braker et al., 1998] y para el gen nap (nitrito
reductasa periplásmica) [Moreno et al., 1999], ya que estos eventos son relativamente frecuentes
[Prozorov, 2001], incluso entre bacterias y hongos [Zumft, 1997]. Dado que las partículas de arcilla
pueden proteger al ADN liberado de ser degradado por nucleasas, el hecho puede facilitar la
transformación de células bacterianas competentes [Nannipieri et a l, 2003]; el fenómeno también
puede ser causado por un alto grado de conservación de secuencia, a pesar de las grandes
distancias evolutivas que pueden separar estos grupos.
Friedrich [2002], ha sugerido otro planteamiento para explicar este tipo de fenómeno en los genes
dsrAB, indicando que éstos pueden ser parte de islas metabólicas móviles. Las APS reductasas
desasimilativas muestran homología con las succinato y fumarato reductasas, mientras el tipo
asimilativo se ha relacionado con la superfamilia CysH. Así, las dos clases de la enzima, que llevan
a cabo reacciones catalíticas similares, pueden tener orígenes evolutivos diferentes [Bick et al,
2000].
6.5. ANÁLISIS DE LAS HERRAMIENTAS Y CRITERIOS BIOINFORMÁTICOS
En la búsqueda efectuada en las 3 principales bases de datos mundiales, fueron seleccionadas
aquellas secuencias codificantes relacionadas con las vías metabólicas de interés; elementos en Cis
y secuencias STS no fueron evaluadas, debido a que en primer lugar, las STS son secuencias
relativamente inseguras, altamente redundantes y que pueden constituir contaminantes o
artefactos de la clonación [Schuler, 1997], por otra parte, las secuencias en Cis, corresponden a
elementos controladores que participan en eventos de replicación, transcripción y traducción
[Lewin, 2001]. Dado que para la detección de la actividad microbiana relacionada con los ciclos
deberá hacerse acopio de transcritos, estos elementos no fueron considerados. Adicionalmente, la
falta de conocimiento acerca de muchos de los elementos reguladores para las diversas rutas
metabólicas hacen de momento incierta su utilización.
Se decidió utilizar ambos tipos de secuencias, ADN y proteína, con el objetivo de obtener
resultados más consistentes y en algunos casos complementarios. Es necesario tener en cuenta
que, dado que las proteínas son un producto funcional del gen, la preservación de su secuencia es
crítica, por esta razón, resulta ser de mayor utilidad su evaluación a diferentes niveles
taxonómicos, en tanto que las secuencias de ADN pueden ser más útiles cuando se analizan
relaciones en categorías por debajo de familia o en secuencias que se sabe que evolucionan muy
lentamente [Alyar, 2001].
Se prefirió la utilización del sistema de recuperación de secuencias de Lion Bioscience, debido a
que ofrece una mayor flexibilidad para la formulación de búsquedas, al permitir la inclusión de
re/eases y updates de las diferentes bases de datos de manera separada y la realización de
búsquedas más complejas gracias a las posibilidades de cruzar diferentes bases de datos. Así
mismo, los campos de búsqueda se amplían incluyendo colecciones de cultivos y listados
taxonómicos cuando así se requiere.
Se realizaron variaciones en los grados de rigurosidad para los parámetros de alineamiento de
Clustal X, con la finalidad de reducir el número de espacios (gaps) y desapareamientos requeridos,
pues la inserción de espacios realizada de manera indiscriminada puede generar consensos cuya
ocurrencia natural es poco probable. Para algunos casos, las mayores penalizaciones tanto de
apertura de espacios como de extensión, produjeron regiones que visualmente mostraron alto
grado de similitud (diagrama de barras de ClustalX), respecto a otras combinaciones menos
estrictas. Debido a que las regiones del ADN que representan sitios activos de la proteína tienden a
ser más conservadas, los costos de apertura y extensión mayores tenderán a hacer evidentes este
tipo de regiones, a diferencia de áreas de la proteína que pueden permitirse una mayor flexibilidad
y que por lo tanto tenderán a variar mayormente a lo largo de su evolución, debido a la
acumulación de mutaciones, fenómenos de recombinación, etc. [Prozorov, 2001]. Este tipo de
secuencias puede llegar a hacerse visible con la disposición de parámetros menos exigentes
(costos de aperturas y extensiones más moderados), aunque se corre el riesgo de generar
secuencias consenso laxas, a costa de insertar y extender espacios de una manera que no pudo
ocurrir en el transcurso evolutivo. La estrategia utilizada durante la investigación, fue la alineación
de todas las secuencias, sin importar su nivel de relación, utilizando los parámetros por defecto los
cuales prevén una baja penalización (10 para apertura y 0.2 por extensión, para una escala entre
0-100), arrojando una aproximación inicial. Posteriormente, las condiciones fueron modificadas a
un valor de penalización de 80 para apertura y 70 para extensión, para aquellas secuencias
taxonómicamente más cercanas. Esto es justificado, debido a que la colocación de espacios (gapi)
en alineamientos entre secuencias estrechamente relacionadas, es mucho más segura que entre
las más distantes, puesto que el intervalo de valores de penalización que pueden encontrar la
solución correcta o la mejor posible es muy amplio [Thompson et al, 2003]. Por el contrario, con
secuencias muy divergentes, los puntajes dados a residuos no idénticos deben elegirse
cuidadosamente. Además, las diferencias de tamaño entre las secuencias pueden resultar
contraproducentes si no se penaliza debidamente la inserción de espacios, dado que el programa
tenderá a igualar en tamaño a las secuencias a través de la inserción y extensión de espacios
[Thompson et al, 2003]. Para secuencias de proteína, la elección de bajos niveles de penalización
resulta ser aún más crítica, puesto que los espacios (gaps) no ocurren aleatoriamente, sino más a
menudo entre los principales elementos estructurales secundarios de las hélices alfa y de las hojas
beta, que a su interior [Thompson e ta l, 2003].
Dado que los cladogramas arrojados por el subprograma NJPLOT de ClustalX fueron utilizados para
encontrar secuencias consenso por grupos de similitud de secuencias, esto permitió un máximo
aprovechamiento de la información mostrada por los alineamientos. Esta aproximación reduce la
generación de lo que podría considerarse como ruido, pero que no es más que la presencia de
subgrupos de secuencias similares entre sí pero divergentes al ser comparadas con otros
subgrupos. Su extracción puede ser muy costosa desde el punto de vista de pérdida de
información, por tal motivo deben ser reservadas para posteriormente ser tomadas como variantes
del gen que pueden ser de utilidad en el diseño del método.
Basándose en el hecho de que ClustalX alinea en primer lugar aquellas secuencias que presentan
mayor similitud, se deduce que aquellas más divergentes, resultan más difíciles de alinear de
manera correcta, por lo tanto, se considera que es mejor retardar su incorporación hasta que las
primeras secuencias hayan sido alineadas. Esto brinda una mejor oportunidad de que la decisión
de introducir los espacios (gaps) entre las posiciones menos conservadas sea correcta, por tal
motivo, el parámetro de retardo que por defecto se encuentra configurado al 30% de identidad,
fue modificado incrementándolo al 40%.
Para las secuencias de proteína se propuso un esquema similar de penalizaciones, pero
adicional mente, fue necesario considerar el tipo de matrices de puntuación utilizado. Debido a que
las matrices PAM son mas sensibles para alineamientos de secuencias homologas, se utilizó el valor
por defecto para ClustalX (PAM350), con el fin de realizar los alineamientos preliminares; luego, de
manera selectiva y de acuerdo al nivel taxonómico de agrupación, se probaron las matrices PAM40
y PAM120 para secuencias más cercanas en su jerarquía taxonómica (como aquellas
pertenecientes a una misma familia) o aquellas más lejanas, respectivamente. Se evaluaron los
resultados de manera comparativa, para obtener el alineamiento con regiones más conservadas,
menos espacios intercalados y el mayor costo de penalización. La utilización de varios parámetros
es soportada por las recomendaciones realizadas por Thompson etal. [2003], quienes indican que
cuando las distancias mutacionales entre las secuencias son desconocidas, se deben correr por lo
menos tres búsquedas utilizando estos criterios. La matriz Blosum utilizada, fue aquella establecida
por defecto para ClustalX (Blosum 62).
De acuerdo a lo reportado por Lassman & Sonnhammer [2002], las diferencias entre los programas
Clustal y Tcoffee es escasa (5% en promedio); a pesar de lo cual, los datos fueron también
probados con este último obteniendo las ventajas de ambos métodos, dado que Tcoffee realiza el
alineamiento dos veces, una primera con el programa ClustalW (más útil cuando se quiere
comparar una secuencia en toda su extensión) y una segunda con el programa Lalign
(alineamiento local, lo que permite un alineamiento más acorde con la presencia de motivos), a
partir de los cuales genera una librería seguida de la comparación simultánea de las secuencias.
Tcoffee presenta la desventaja de que en la versión actual, no permite el alineamiento de un
número de secuencias mayor a 50, que presenten una longitud promedio de 160 residuos, ya que
genera mensajes de error.
El alineamiento por Tcoffee fue realizado con los parámetros por defecto, tanto para ADN como
para proteína, con la finalidad de cubrir las deficiencias que pudieran presentarse con la sola
utilización de ClustalX. Sin embargo, para que los alineamientos produjeran buenos resultados, fue
necesario filtrar aquellas regiones de baja complejidad, de acuerdo a lo recomendado por
Notredame etal., [2000].
Las secuencias consenso fueron ingresados en el programa BLAST (BlastN y BlastP) para la
búsqueda de secuencias similares, un ejemplo de salida está dado en la Figura 18. Dado que la
especificidad de la asociación prueba-blanco depende del grado de divergencia de la secuencia, la
cual puede ser muy alta entre genes blanco en poblaciones naturales [Pearson, 2001], es necesario
seleccionar un nivel de significancia para similitud muy bajo (<0.01), con el fin de disminuir el
riesgo de hibridización cruzada. Debido a que el número de entradas de la base de datos del NCBI
es muy grande, el valor umbral debe ser lo más bajo posible, puesto que E se incrementa
linealmente con el número de entradas [Pearson, 2001]. El valor de significancia estadística
seleccionado se consideró adecuado, puesto que una disminución demasiado grande puede
aumentar el riesgo de cometer error estadístico tipo II, el cual debe ser minimizado.
Sequences pr-oriucinq siqnificant alignaents:
gi|5713167lgbl«F165921.1|0F165921 GI oimis brasilianun» strain...
gl|5713168|gb|AF165922.1 |ftF165922 G l o w s brasilianun strain...
gi|5713166|gb|AF165920.1|AF165920 Gloiws brasilianu* strain...
gi|5713165|gb|l»Fl6S919.1| AF165919 Glonus brasili¿nun strain...
gl|571316*|gb|flF165910.1|W165918 Glowis brasilianun strain...
gi (22098271gb jUB 1987.1 (GOUS1987 Glonus occultum strain GR58...
gi|6093125|enbJAJ012112.2|6BR012112 Glonus brasiliaou» 5.8S...
gi j3299*927|dbj|ftK109710.1| Oryza sativa (japónica cultivar...
gi¡288*309M|gb|WCBHK/HH.9| Hnno sapiens chronoso» 19 clon#...
gi¡1*509603jgb|AC01916*.9¡ Hono sapiens BAC clone RP11 1*6J...
gi¡2l952878|dbj|BP88*36*-*| Oryza sativa (japónica cultiua»*...
gi|188«»*785|dbj|AP003291.3| Oryza sativa (Japónica cultivar...
gi17131*551gb|AC009*2*.21AC 009*2* Mono sapiens, clone RP11-...
gi|136999981dbjjAP8028*6.2 | Hono sapiens genonic DHft, chron...
gl|1«SWliil|íM|IU.r<NI/6S.l8| Human ONfi sequence fron clone ...
Score
E
(bits) Ualue
*8
*8
*8
*8
*8
*8
*8
3*
3*
3*
3*
3*
3*
3*
8*
2e-ft*
2 e 0*
2e-8*
?e-8*
2e-0*
2e-«J*
8.059
3.7
3.7
3.7
3.7
3.7
3.7
3.7
3.7
Alignnents
>gi(5713167Jgb18F165921„1|AF165921
G l o w s brasilianun strain UU22* clone 1* 18S ribosonal RNA
gene.
partial sequence; internal transcriben spacer 1, 5.8S
ribosonal RNA gene and internal transcribed spacer 2,
conplete sequence; and 26S ribosomal RHA gene, partial
sequence
Lcnyth - 525
Score - *8.1 bits (2*>, Expect - 2c-tt*
Identities - 2*/2* (180*)
Strand * Plus / Plus
Qvery: 1
gtagtycacaatgaatagcgcggg 2*
1111111 tti 11111111111111
Sbjct: 3*6 gtagtgcacaatgaatagcgcggg 369
*i
Figura 18. Salida del programa BlastN del NCBI.
6.6. DISEÑO DE OLIGONUCLEÓTIDOS
Luego de la evaluación de especificidad de las secuencias de ADN, se debió determinar la
homogeneidad del perfil termodinámico, así como la de su estructura secundaria, con base en las
recomendaciones reportadas para el diseño de oligonucleótidos. La energía libre de Gibbs, fue
calculada por el programa a través del método del vecino más cercano (Nearest-Neighbor) de
Breslauer et al. [1986] para ADN y dado que la energía de un oligo a temperatura T, mide la
tendencia de éste a hibridizar con su pareja perfecta sobre un gen blanco Sugnet [1999], un valor
fuertemente negativo indica que el oligo tiende a hibridizar espontáneamente con su pareja a una
temperatura T. Al incrementarse la temperatura, AG crecerá hacia cero [Rahman, 2004].
Se optó por la selección de oligos que tuvieron una temperatura de fusión uniforme (Tm promedio
de 73°C), valores de energía libre negativos (en promedio -45 kcal/mol) y longitudes alrededor de
las 26 bases (ver Anexo 1). En cuanto a este último factor, se ha comprobado que a medida que la
longitud de la sonda se incrementa, tiende a perderse la capacidad de discriminar
desapareamientos; en tanto que si su longitud es escasa, la intensidad de la señal de hibridización
en un microarreglo decrece ostensiblemente (Zhou & Thompson, 2002).
La presencia de estructuras secundarias, resulta de importancia crítica para el proceso de
hibridización in vitro, puesto que las asas en hairpin, los dímeros y otras formas de
autohibridización, compiten por la sonda con la secuencia blanco. Lo anterior, impide un correcto
apareamiento entre ellas, lo que recae sobre la intensidad de señal del microarreglo. La estabilidad
de este tipo de formaciones fue evaluada a través del valor de energía libre de Gibbs que poseían
dichos enlaces.
Las sondas fueron recortadas o eliminadas de acuerdo a la adaptación que presentaron respecto a
todos los criterios definidos. Posterior a este proceso, se efectuó un nuevo análisis BlastN en la
base de datos del GenBank, con el fin de determinar si su especificidad inicial fue conservada,
luego del acortamiento de las secciones.
Referente a la categoría de las sondas que pudieron ser diseñadas, al menos de manera teórica,
sería posible la detección de 73 genes de los 192 valorados inicialmente, con ayuda de 191
oligonucleótidos. Este número equivale al 38% de la población total. Con lo cual se confirma
nuevamente la necesidad de intensificar esfuerzos hacia el reconocimiento de nuevas secuencias
en suelos. De esta población de oligonucleótidos se destacan aquellos que pudieron ser diseñados
para los géneros Paragtomus y Archaeospora, miembros recientes de las endomicorrizas, entre
estos se incluyen sondas para los genes ARNrl8S (2), 5.8S (1), para los espaciadores intergénicos
ITS1 (2) e 1JS2 (3), que constituyen un nuevo reporte.
Los oligonucleótidos fueron diseñados partiendo de la agrupación de secuencias procedentes de
diferentes niveles taxonómicos, que pudieran permitir la detección de una actividad enzimática en
suelos, de ser posible a una jerarquía taxonómica superior (Dominio); sin embargo, esto está
condicionado por la variabilidad de secuencia que puede generarse en las categorías inferiores. Así
que finalmente se consiguieron oligonucleótidos que están orientados a la distinción de un grupo
funcional en particular a nivel de Reino, División, Clase, Orden, Familia y en algunos casos en que
no pudo ser más amplio, a Género.
En la Figura 14, se indica el número de sondas que podrían ser utilizadas en la captura de
organismos por debajo de determinado nivel taxonómico, se destaca que para los genes bglA,
chiA, chil y LiP, las sondas podrían ser utilizadas en la captura de organismos por encima del nivel
de dominio. Además, los genes anfG, anfK, tacasa, narG, nifD, dsrA y vnfK, referidos en la base de
datos de oligonudeótidos (ver Anexo 1) para jerarquías por debajo de dominio, ofrecen
posibilidades para la detección de secuencias no identificadas aún. Para el primer caso, el número
resulta pobre al comparar la gran cantidad de genes evaluados, las causas, relacionadas con el
desconocimiento de una mayor variedad de secuencias y a diferentes niveles taxonómicos, ya han
sido analizadas. En otros niveles taxonómicos, la representatividad es alta, destacándose los
grupos de genes que pueden ser analizados al nivel de división; este nivel de resolución es bueno y
en muchos casos suficiente. Al nivel de familia podría detectarse el mayor número de secuencias
(49).
La Figura 15, muestra la representación de secuencias traducidas a partir de proteína, que pueden
llegar a ser utilizadas para la captura de genes en los niveles taxonómicos superiores como Orden
e incluso Dominio. Al primer nivel, se podría brindar información acerca de muchos de los grupos
funcionales microbianos en suelos, que llevan a cabo funciones como la oxidación de amonio
(amoA), la celulólisis (ce/F), la reducción de C02 a metano (mcrA), la fijación de nitrógeno {riifD y
nifK), la reducción asimilativa de nitrato (nasA) y la denitrificación (nosZ). A niveles inferiores a
dominio, sería posible detectar secuencias para genes codificantes de la reducción desasimilativa
de sulfito (dsrB) y oxidación de amonio (amoB).
Como se indicó en la metodología, siempre existe la posibilidad de que las sondas planteadas,
presenten hibridizaciones entre ellas, por lo cual se hace necesario examinar dicha característica.
Su evaluación permitió eliminar algunas de las secuencias que presentaron regiones comunes para
el mismo gen, y facultó la detección de dos sondas con regiones redundantes entre genes
diferentes (Iccl y chil), las cuales fueron señaladas en la base de datos. Este tipo de factores
deben ser tenidos en cuenta al momento de diseñar el microarreglo, puesto que se podría
presentar hibridizaciones competitivas in vitro, que causarían alteraciones en la interpretación de
las señales.
El reconocimiento de similitudes entre las secuencias diseñadas y motivos de proteína ya
existentes, procedentes de la base ProDom, fue efectuado por medio del programa BLASTX, el cual
indicó coincidencias para algunas de las secuencias, aunque otras no se hallaban reportadas. Esto
significa que pudieron haberse encontrado motivos de proteína para los genes subrayados en el
anexo 3, que no tenían reporte en la base ProDom, los cuales deben ser evaluados
profundamente.
más
Los microarreglos basados en grupos funcionales, permiten diferenciar entre la diversidad conocida
de blancos de ADN y la parcialmente desconocida, con una alta identidad de secuencia. Por esta
razón, es muy probable que las secuencias tipo o consenso puedan ser de ayuda en la captura de
genes que incluyan el universo de microorganismos hoy inexplorado, a medida que la diversidad de
secuencias codificantes para un gen se incrementa. Esta investigación proporciona bases acerca de
la factibilidad de realizar una aproximación utilizando esta vía metodológica.
Si se desea detectar un grupo taxonómico en particular al nivel de resolución deseado, se puede
hacer uso de las regiones consecutivas a la zona consenso que en los alineamientos no mostraron
similitudes entre sí, para el diseño de cebadores, debido a que son exclusivas de cada una de las
secuencias. Un proceso posterior de secuenciación podría facilitar el acceso a nuevas secuencias
de organismos desconocidos, y potenciar así la adquisición de nueva información. A medida que la
tecnología de los microarreglos se perfecciona, la opción de prescindir de la amplificación por PCR
y utilizar directamente el ADN aislado del suelo puede permitir la cuantificación de la actividad
biológica evaluada, ampliando la información obtenida.
Las secuencias de aminoácidos que identifican motivos de proteína, y cuya traducción a ADN no
pudo ser realizada de la manera descrita, pueden tener aplicación en otro tipo de herramientas.
Los arreglos de proteína son un campo que comienza a hacerse extenso [Joos, 2004] y aunque las
aplicaciones actuales son más restringidas que para el ADN, es posible que el tiempo permita
ampliarlas, razón por la cual se incluyeron en la base de datos.
La metodología planteada, el abordaje, el tratamiento y el análisis practicado a los datos, pueden
hacerse extensivos a otras áreas de la ciencia diferentes a la microbiología de suelos, con lo cual su
incidencia es más amplia. Los razonamientos aquí aplicados para la utilización de las herramientas
bioinformáticas, pretenden ser de utilidad en la toma de decisiones para otras situaciones. La
consecución de los objetivos planteados en esta y otras investigaciones, permiten sustentar que
existen otras vías efectivas para la construcción de conocimiento, que incluyen el aprovechamiento
de información existente y aparentemente inconexa, en la creación de aplicaciones.
CONCLUSIONES
1. Se estableció una vía metodológica diferente a la microbiológica clásica como aproximación al
estudio de la dinámica biológica en suelos, con base en la minería de datos, la cual tiene
aplicación en la evaluación de atributos funcionales del suelo, tales como la diversidad
bioquímica y los ciclos minerales en los que participan los microorganismos en diversos
ecosistemas terrestres.
2. Se analizaron las diferentes etapas del proceso, además de los aciertos y dificultades ofrecidos
por las herramientas bioinformáticas utilizadas.
3. Se propusieron algunas enzimas mediadoras en 13 grandes procesos bioquímicos, como
marcadores potenciales para el seguimiento de la dinámica biológica en suelos, entre estos se
cuentan: la reducción de sulfato, oxidación de compuestos azufrados, metanogénesis,
carboxidotrofía, oxidoreducción de hierro, reducción de nitrato, nitrito, óxido nítrico, óxido
nitroso, amonificación, nitrificación y fijación de nitrógeno, fundamentada en la información
existente en cuanto a su función, ubicación, tipo de aplicación, presencia en diferentes
organismos, reportes de posibilidad o uso como marcador.
4. Fue posible sugerir 192 marcadores para las enzimas elegidas, seleccionados por estar
comprometidos en los principales procesos bioquímicos del ecosistema suelo. A partir de las
secuencias, se diseñaron 183 oligonucleótidos representativos de 73 genes.
5. Se diseñaron 8 sondas específicas para dos nuevos géneros de micorrizas arbusculares, 6 de
ellas para el género Paragtomus y 2 para Archaeospora. Tales oligonucleótidos constituyen
nuevos reportes para los genes ARNrl8S (2), 5.8S (1) y para los espaciadores intergénicos ITS1
(2) e ITS2 (3) de estos grupos.
6. Se desarrolló un modelo conceptual que presenta de una manera interrelacionada los
principales aspectos de los ciclos del carbono, nitrógeno, azufre e hierro, facilitando de esta
forma, la visualización de las enzimas y genes codificantes que han sido reportados hasta el
momento. Es una iniciativa útil para la comprensión holística de las funciones que se cumplen
en el suelo y que son el sustento del ecosistema.
7 . El modelo conceptual también posibilita un abordaje de la ecología del suelo, a través de la
observación de las relaciones causa-efecto entre los componentes microbianos, la predicción de
la estabilidad de un ecosistema con base en el componente edáfico, y la detección de
actividades metabólicas sin necesidad de conocer la identidad de los microorganismos
presentes.
8. Se discutieron las ventajas y consideraciones observadas para optar por el abordaje funcional y
no taxonómico.
9. Se recopiló una base de datos de 3668 entradas para ADN y 3955 entradas para proteína, la
cual puede ser actualizada para su utilización en el área de la microbiología de suelos;
permitiendo por medio de un motor de búsqueda, acceder a información relevante de las
secuencias como: fuente (ADN, proteína), función, accesión, secuencia (nucleótidos o
aminoácidos), longitud, organismo, descripción, datos taxonómicos.
10.La herramienta de evaluación que se obtenga a raíz de la metodología desarrollada, podría
emplearse en el análisis funcional de todo tipo de suelos, debido a que en su diseño se han
tenido en cuenta organismos procedentes de diferentes regiones geográficas y hábitat.
H .E l desarrollo de las sondas para los genes bg/A, chiA, chil y LiP, podría resultar de utilidad en
el estudio general de procesos como celulólisis, quitinólisis y ligninólisis en suelos, debido a que
se abarcó toda su jerarquía taxonómica. Genes como aquellos para la oxidación de amonio,
fijación de nitrógeno, reducción de nitrato y reducción de sulfato, podrían ser evaluados a
niveles inferiores a dominio.
1 2 .Durante la investigación, fueron obtenidas cinco sondas que podrían permitir la detección
separada de los procesos mediados por los genes pmoA y amoA, los cuales habitualmente han
ofrecido dificultades para la distinción de sus actividades en suelos.
1 3 .
Las sondas desarrolladas pueden ser empleadas en la búsqueda de secuencias de
microorganismos edáficos que no han sido previamente aislados, como una forma de
incrementar las posibilidades de ser representadas en los análisis, adicionalmente a la inclusión
de las secuencias moleculares obtenidas a partir de la búsqueda a través del SRS.
RECOMENDACIONES
1. Se recomienda, la utilización de una herramienta de búsqueda de secuencias que permita la
elección de las tres principales bases de datos internacionales, puesto que a pesar del
intercambio diario que realizan entre ellas, existen diferencias debido a la inclusión de los
releasesand updates.
2. Se requiere intensificar la investigación dirigida hacia el área de la microbiología de suelos, con
énfasis especial en la detección y secuenciación de genes relacionados con los ciclos de la
materia, para de esta manera, asegurar que las sondas de ADN desarrolladas en un futuro,
tengan mayores posibilidades de detección de una amplia gama de microorganismos
pertenecientes a un grupo funcional.
3. Se propone la ampliación de estudios edáficos hacia el reconocimiento del dominio Archaea y su
importancia en los suelos; de manera que se profundice en el conocimiento de su diversidad
metabólica, la cual ha estado comúnmente orientada a la contribución que el grupo tiene en la
producción de metano.
4. Debido a que la variedad de géneros y secuencias reportadas para algunos genes, es en
muchos casos escasa y en otras inexistente, se debe reevaluar el enfoque que han tenido los
estudios de suelos a microorganismos tipo, ampliando el conocimiento hacia organismos
diferentes y hada genes que no han sido secuenciados. Por ejemplo, puede ser importante
conocer los organismos involucrados en el ciclo del hierro en suelos drenados, en donde las
variaciones en el nivel freático y de saturación, pueden generar micronichos para actividades de
oxidorreducción; o el caso de genes para la oxidación de nitrito, azufre elemental, sulfito y APS,
entre otros, los que a pesar de estar bien documentados, no presentaron reportes de
secuencias.
5. En cuanto a la aplicación de herramientas bioinformáticas, como puede deducirse de este
estudio, es recomendable hacer un análisis previo y profundo, sobre las posibilidades de
aplicación que puede ofrecer un programa, su nivel de resolución, mecanismos para aumentar
su precisión, parámetros que ofrece, etc., con ei fin de seleccionar los que resulten más
adecuados y que brinden la mayor información.
6. Se sugiere recopilar información acerca de los cebadores que han sido reportados para estas
enzimas, especialmente en lo referente a su especificidad génica y su capacidad de
amplificación de variantes, con el fin de determinar, si se require construir nuevos iniciadores o
realizar combinaciones de ellos.
7. Se plantean otras posibilidades de abordaje en el desarrollo de este tipo de sondas, por
ejemplo, partiendo de información molecular acerca de motivos y dominios que ofrecen las
bases de datos como ProDom, Pfam, etc.
8. Por último, se sugiere la continuación de este estudio en otras etapas, donde se evalúe la
especificidad in vitro de las sondas señaladas, se realice la estandarización tanto del proceso de
extracción de ADN total de los microorganismos presentes en muestras de suelos, como de la
retrotranscripción a partir del primero. Así mismo, se plantee la inclusión de las diferentes
variantes de las regiones conservadas para establecer la disposición del microarreglo y su
factibilidad de implementación.
BIBLIOGRAFÍA
♦ Aakra A., Utaker J.B. & Nes I.F. 2001. Comparative phylogeny ofthe ammonia monooxygenase
subunit A and 16S rRNA genes o f ammonia-oxidizing bacteria. FEMS Microbiology Letters,
205:237-242.
♦ Alien A.E., Booth M.G., Frischer M.E., Verity P.G., Zehr J.P. & Zant S. 2001. Diversity and
Detection o f Nitrate Assimiiation Genes in Marine Bacteria. Applied and Environmental
Microbiology, 67(ll):5343-5348.
♦ Alyar A. 2001. Methods in Molecular Biology, vol. 132: Bioinformatics Methods and Protocols.
Ed. S. Misener & S.A. Krawetz. Humana Press Inc., Totowa NJ.
♦ Amann R., Ludwig W. & Schleifer K. 1995. Phylogenetic Identification and In Situ Detection of
IndividualMicrobial Cells without Cultivation. Microbiological Reviews, 59(1): 143-169.
♦ Antipova A.A., Tamayo P. & Golub T.R. 2002. A Strategy for OUgonudeotide Microarray Probe
Reducthn. Genome Biology, 3: 0073.1-0073.4.
♦ Bang S.W., Clark D.S. & Keasling J.D. 2000. Engineering Hydrogen Sulfide Production and
Cadmium Removal by Expression ofthe Thiosulfate Reductase Gene (phsABC) from Salmonella
enterica Serovar Typhimurium in Escherichia coli. Applied and Environmental Microbiology, 66
(9): 3939-3944.
♦ Basset D.E., Eisen M.B. & Boguski M.S. 1999. Gene Expression Informatics -It's ail in your mine.
Nature Genetics, 21 suppl: 51-55.
♦ Bayer E.A., Chanzy H., Lamed R. & Shoham Y. 1998. Cellulose, Cellulases and Cellulosomes.
Current Opinión in Structural Biology, 8:548-557.
♦ Bhanot G., Louzoun Y., Zhu J. & DeLisi C. 2003. The Importance o f Thermodynamic Equilibrium
for High Throughput Gene Expression Arrays. Biophysical Journal, 84:124-135.
♦ Bick J.A., Dennis J.J., Zylstra G.J., Nowack J. & Leustek T. 2000. Identification ofa New Class o f
S’-Adeny/ylsulfate (APS) Reductases from Sulfate-Assimilating Bacteria. Journal of Bacteriology,
182(1):135-142.
♦ Borneman J., Skroch P., O'Sullivan K., Palus J., Rumjanek N., Jansen J., Niehuis J. & Triplett E.
1996. Molecular Microbial Diversity o f an Agricultura! Soil in Wisconsin. Applied and
Environmental Microbiology, 62(6): 1935-1943.
♦ Borneman J. & Triplett E. 1997. Molecular Microbial Diversity in Soils from Eastern Amazonia:
Evidence for Unusual Microorganisms and Microbial Population Shifts Associated with
Defbrestation. Applied and Environmental Microbiology, 63(7): 2647-2653.
♦ Bourne D.G., McDonald I.R. & Murrell J.C. 2001. Comparison o f pmoA PCR Primer Sets as
Tools for Investigating Methanotroph Diversity in Three Danish Soils. Applied and Environmental
Microbiology, 67(9):3802-3809.
♦ Braker G., Fesefeldt A. & Witzelpplied K.P. 1998. Development o f PCR Primer Systems for
AmpUfícation o f Nitrite Reducíase Genes (nirK and nirS) To Detect Denitrífying Bacteria in
Environmental Samples. Applied and Environmental Microbiology, 64(10): 3769-3775.
♦ Braker G. & Tiedje J.M. 2003. Nitric Oxide Reducíase (norB) Genes from Puré Cultures and
Environmental Samples. Applied and Environmental Microbiology, 69(6):3476-3483.
♦ Breslauer K.J., Franks R., Blockers H. & Marky L.A. 1986. Predicting DNA Dúplex Stability from
the
Base
Sequence
(Nearest-neighbor
interactions/DNA
structure/thermodynamics).
Proceedings of the National Academical Sciences USA, 83:3746-3750.
♦ BrockT.D. & Madigan M.T. 1993. Microbiología. Sexta edición. Prentice Hall Hispanoamericana,
S.A., Naucalpán de Juárez, México.
♦ Browning D.F.,Beatty C.M.,Wolfe A.J.,Cole J.A. & Busby S.J. 2002. Independent Regulation of
the Divergent Escherichia coli nrfA and acsPl Promoters by a Nudeoprotein Assembly at Shared
Regulatory Región. Molecular Microbiology, 43(3):687-701.
♦ Brüser T., Selmer T. & Dahl C. 2000. ADP Sulfurylase from Thiobacillus denitrificans is an
Adeny/ylsulfate:
Phosphate Adenylyltransferase and Belongs
to
a
New
Family o f
Nudeotidyltransferases. Journal of Biology and Chemistry, 275(3): 1691-1698.
♦ Buckley D.H., Graber J.R., & Schmidt T.M. 1998. Phylogenetic Analysis o f Nonthermophilic
Members ofthe Kingdom Crenarchaeota and their Diversity and Abundance in Soils. Applied and
Environmental Microbiology, 64:4333-4339.
♦ Burke R.A. Molina M., Cox J.E., Osher L.J. & Piccolo M. 2003. Stable Carbón Isotope Ratio and
Composition o f Microbial Fatty Acids in Tropical Soils. Journal of Environmental Quality, 32:198206.2.
♦ Cabrera L.T. Aporte al Conocimiento de la Microbiota Fúngica del Suelo de la Amazonia
Colombiana, con Enfasis en Tres Grupos Funcionales. Trabajo de Grado (Biólogo). Pontificia
Universidad Javeriana, Santafe de Bogotá, 2000.
♦ Casciotti K.L. & Ward B.B. 2001. Dissimi/atory Nitrite Reducíase Genes from Autotrophic
Ammonia-Oxidizing Bacteria. Applied and Environmental Microbiology, 67(5):2213-2221.
♦ Castro H., Reddy K.R. & Ogram A. 2002. Composition and Function of Sulfate-Reducing
Prokaryotes in Eutrophic and Pristine Areas o f the Florida Everglades. Applied and
Environmental Microbiology, 68(12):6129-6137.
♦ Cho J.C. & Tiedje J.M. 2000. Biogeography and Degree o f Endemicity of Fluorescent
Pseudomonas Strains in Soil. Applied and Environmental Microbiology, 66(12): 5448-5456.
♦ Cho J.C. & Tiedje J. M. 2002. Quantitative Detection o f Microbial Genes by Using DNA
Microarrays. Applied and Environmental Microbiology, 68(3): 1425-1430.
♦ Coates J.D., Colé K.A., Chakraborty R., O'Connor S.M. & Achenbach L.A. 2002. Diversity and
Ubiquity o f Bacteria Capable o f Utitizing Humic Substances as Electron Donors for Anaerobic
Respiration. Applied and Environmental Microbiology, 68(5): 2445-2452.1.
♦ Conrad R. 1996. Soil Microorganisms as Controllers o f Atmospheric Trace Gases (H2, CO, CH4,
OCS, N20, and NO). Microbiological Reviews, 60(4): 609-640.
♦ Corpet F., Servant F., Gouzy J. & Kahn D. 2000. ProDom and ProDom-CG: tools for protein
domain analysis and whole genome comparisons. Nucleic Acids Research, 28:267-269.
♦ Dennis P., Edwards E.A., Liss S.N. & Fulthorpe R. 2003. Monitoring Gene Expression in Mixed
Microbial Communities by Using DNA Microarrays. Applied and Environmental Microbiology, 69
(2):769-778.
♦ Dopazo J. & Valencia A. 2001. [en línea]. Bioinformática y genómica. [ref. Enero 20 de 2004].
http://bioinfo.cnio.es/docus/courses/ leon2002/BioinfoGenomica.pdf.
♦ Drake H.L., Küsel K. & Matthies C. 2002. Ecological Consequences o f the Phylogenetic and
Physiological Diversities ofAcetogens. Antonie van Leeuwenhoek, 81:203-213.
♦ Elias D.A., Krumholz L.R., Tanner R.S. & Suflita J.M. 1999. Estimation o f Methanogen Biomass
by Quantítation o f Coenzyme M. Applied and Environmental Microbiology, 65(12):5541-5545.
♦ Farrelly V., Rainey F.A. & Stackebrandt E. 1995. Effect o f Genome Size and rrn Gene Copy
Number on PCR Amplifícation o f 16S rRNA Genes from a Mixture o f Bacterial Species. Applied
and Environmental Microbiology, 61(7):2798-2801.
♦ Febles J.P. & González A. [en linea], 2002. Aplicación de la minería de datos en la
bioinformática
[ref.
24
de
mayo
de
2004].
http://www.infomed.sld.cu/revistas/aciA/ol10_2_02/aci03202.htm.
♦ Fernández A., Huang S., Seston S., Xing J., Hickey R., Criddle C. & Tiedje J. 1999. How Stable
Is Stable? Function versus Community Composition. Applied and Environmental Microbiology, 65
(8): 3697-3704.
♦ Ferry J.G. 1995. CO dehydrogenase. Annual Review of Microbiology, 49:305-333.
♦ Friedrich M.D. 2002. Phyiogenetic Ana/ysis Reveáis Múltiple Lateral Transfers o f Adenosine5'-Phosphosulfate Reducíase Genes among Su/fate-Reducing Microorganisms. Journal of
Bacteriology, 184(1): 278-289.
♦ Galtier N., Gouy M. & Gautier C. 1996. Seaview and Phylo_win: two graphic too/s for sequence
alignment and molecular phylogeny.
Applied
Biosciences,
12:543-548. ftp://Dbil.univ-
♦ Gilbert B., McDonald I.R., Finch R., Stafford G.P., Nieisen A.K. & Murrell J.C. 2000. Molecular
Ana/ysis o f the pmo (Particulate Methane Monooxygenase) Operons from Two Type II
Methanotrophs. Applied and Environmental Microbiology, 66(3):966-975.
♦ Gregory L., Bond P., Richardson D. & Spiro S. 2003. Characteñzation o f a Nitrate-Respiring
Bacterial Community using the Nitrate Reducíase Gene (narG) as a Functional Marker.
Microbiology, 149: 229-237.
♦ Gutiérrez G. & Roncando A. [en línea]. Estrategias para el Análisis de Genomas. [ref. 24 de
mayo de 2004]. Disponible en web: http://bioinf.ibun.unal.edu.co/~Qautierrez/EAG.html.
♦ Hallam SJ., Girguis P.R., Presten C.M., Richardson P.M. & DeLong E.F. 2003. Identification of
Methyl Coenzyme M Reducíase A (mcrA) Genes Associated wiíh Meíhane -Oxidizing Archaea.
Applied and Environmental Microbiology, 69(9):5483-5491.
♦ Hirota R., Yamagata A., Kato 1, Kuroda A., Ikeda T., Takiguchi N., & Ohtake H. 2000. Physical
Map Location ofíhe Mulíicopy Genes Coding for Ammonia Monooxygenase and Hydroxylamine
Oxidoreducíase in the Ammonia-Oxidizing Baclerium Nitrosomonas sp. Sírain ENI-11. Journal of
Bacteriology, 182(3):825-828.
♦ Hommes N.G., Sayavedra-Soto L.A. & Arp DJ. 2001. Transcripí Ana/ysis ofMulíiple Copies of
amo (Encoding Ammonia Monooxygenase) and hao (Encoding Hydroxylamine Oxidoreducíase)
in Nitrosomonas europaea. Journal of Bacteriology, 183(3): 1096-1100.
♦ Hooper D.U., Solan M., Symstad A., Díaz S., Gessner M.O., Buchmann N., Degrange V., Grime
P., Hulot F., Mermiilod F., Roy J., Spehn E. & Van Peer L. 2002. Species Diversity, Functional
Diversity and Ecosysíem Funcíioning. p. 195-281. In M. Loreau, S. Naeem, and P. Inchausti
(Ed.), Biodiversity and Ecosystem Functioning: Synthesis and Perspectives. Oxford Universlty
Press, London, UK.
♦ Jensen M., Webster J. & Strauss N. 1993. Rapid Identification o f Bacteria on the Basis o f
Polymerasa Chain Reaction-Amplifíed Ribosomal DNA Spacer Polymorphirms. Applied and
Environmental Microbioiogy, 59: 945-952.
♦ Joos T. 2004. Protein Microarray Technology. Expert Review of Proteomics, l(l):l-3.
♦ Kang B.S. & Young M.K. 1999. Ooning and Molecular Characterization ofthe Genes for Carbón
Monoxide Dehydrogenase and Localization o f Molybdopterin, fíavin Adenine Dinudeotide, and
Iron-Sulfur Centers in the Enzyme o f Hydrogenophaga pseudofíava. Journal of Bacteriology, 181
(18):5581-5590.
♦ Karknoff-Schweizer R.R., Huber D.P.W. & Voordouw 6. 1995. Conservatíon o f the Genes for
Dissimilatory Sulfite Reducíase from Desulfovibrio vulgaris and Archaeoglobus fulgidus allows
their Detection by PCR. Applied and Environmental Microbioiogy, 61:290-296.
♦ Kawase T., Saito A., Sato T., Kanai R., Fujii T., Nikaiao N., Miyasnita K. & Watanabe T. 2004.
Distribution and Phylogenetic Analysis of Family 19 Chitinases in Actinobacteria. Applied and
Environmental Microbioiogy, 70(2): 1135-1144.
♦ Kent A.D. & Triplett E.W. 2002. Microbial Communities and their Interactions in Soil and
Rhizosphere Ecosystems. Annual Review of Microbioiogy, 56:211-36.
♦ King G.M. 1999. Attributes of Atmospheric Carbón Monoxide Oxidation by Maine Forest Soils.
Applied and Environmental Microbioiogy, 65 (12):5257-5264.
♦ King G.M. 2003. Molecular and Culture-based Analyses o f Aerobic Carbón Monoxide Oxidizer
Diversity. Applied and Environmental Microbioiogy, 69(12):7257-7265.
♦ Kinghorn J.R. 1989. Genetical, Biochemical and Structural Organization o f the Aspergillus
nidulans crnA-niiA-niaD Gene Cluster. In J.R. Wray, J.R. Kinghorn eds. Molecular and Genetic
Aspects of Nitrate Assimilation. Oxford Science Publications, Oxford, pp. 69-87.
♦ Kjoller R. & Roendahl S. 2001. Molecular Diversity o f Glomalean (arbuscular mycorrhizal) Fungí
Determined as Distinct Glomus Specific DNA Sequences from Roots o f Field Grown Peas.
Mycological Research, 105 (9):1027-1032.
♦ Kolb S., Knief C., Stubner S. & Conrad R. 2003. Quantitative Detection o f Methanotrophs in Soil
by Novel pmoA-Targeted Real-Time PCR Assays. Applied and Environmental Microbioiogy, 69
(5):2423-2429.
♦ Larrondo L.F., Salas L., Meló F., Vicuña R. & Cullen D. 2003. A Novel Extracellular Multicopper
Oxidase from
Phanerochaete
chrysosporium
with
Ferroxidase Activity.
Applied
and
Eenvi ronmental Microbioiogy, 69(10):6257-6263.
♦ Lassmann T. & Sonnhammer E.L.L. 2002. Quality assessment o f múltiple aiignment programs.
FEBS Letters 529:126-130.
♦ Lee D., Gun Zo Y. & Kim S. 1996. Non-radioactive Method to Study Genetic Profíles o f Natural
Bacterial Communities by PCR-Single Strand Conformation Polymorphism. Applied and
Environmental Microbiology, 62:3112-3120.
♦ Lewin B. 2001. Genes VII. Marbán Libros, Madrid España. 990p.
♦ Lorite M.J. Tachil J., Sanjuán 1, Meyer O., & Bedmar E.J. 2000. Carbón Monoxide
Dehydrogenase Activity in Bradyrhizobium japonicum. Applied and Environmental Microbioiogy,
66(5): 1871-1876.
♦ Loy A., Lehner A., Lee N., Adamczyk I , Meier H., Emst 1, Schleifer K.H. & Wagner M. 2002.
Oiigonudeotide Microarray for 16S rRNA Gene-Based Detection o f aH Recognized Uneages of
Sutfate-Reducing Prokaryotes in the Environment. Applied and Environmental Microbiology, 68
(10):5064-5081.
♦ Lucas R., Robles A.M., del Postigo-Gáivez A., García T., Pérez R. & Aivarez G. 2001.
Biodegradación de la Celulosa y la Lignina.
Ia Ed. Universidad de Jaén, Servicio de
Publicaciones e Intercambio Científico, D.L. España, pp. 146.
♦ Lucchini S., Thompson A. & Hinton J.C.D. 2001. Microarrays for microbiologists. Microbiology,
147: 1403-1414.
♦ Luna M.L., Vega C., Franco M.O., Vásquez S., Trujillo N., Ramírez E. & Dendooven L. 2002.
Actividad microbiana en suelos. Avance y perspectiva, 21: 328-332.
♦ Luton P., Wayne J.M., Sharp R.J. & Riley P.W. 2002. The mcrA gene as an atternative to 16S
rRNA in the phyiogenetic analysis o f methanogen populations in landfill. Microbiology,
148:3521-3530.
♦ Lynd L.R., Weimer P.J., van Zyl W.H. & Pretorius I.S. 2002. Microbial Cellulose Utiiization:
Fundamentáis and Biotechnology. Microbiology and Molecular Biology Reviews, 66(3): 506-577.
♦ Matveeva O.V., Foley B.T., Nemtsov V.A., Gesteland R.F., Matsufuji S., Atkins J.F., Ogurtsov A.
% Shabalina
S.
2004.
Identification
o f regions in
múltiple sequence alignments
thermodynamicaify suitabie for targeting by consensus oligonudeotides: application to H1V
genome. BMC Bioinformatics, 5(44): 1-13.
♦ McCaig A., Glover A. & Prosser, J. 1999. Molecular Analysis o f Bacterial Community Structure
and Diversity in Unimproved and Improved Upland Grass Pastures. Applied and Environmental
Microbiology, 65: 1721-1730.
♦ McDevitt C., Burreil P., Biackaii L.L. & McEwan A.G.2000. Aerobic Nitrate Respiration in a NitriteOxidising Bioreactor. FEMS Microbioiogy Letters, 184:113-118.
♦ Metcaife A.C., Krsek M., Gooday G.W., Prosser J.I. & Weliington M.H. 2002. Molecular Analysis
o f a Bacterial Chitinolytic Community in an Upland Pasture. Applied and Environmental
Microbioiogy, 68(10): 5042-5050.
♦ Minerdi D., Fani R., Gallo R.( Boarin A. & Bonfante P. 2001. Nitrogen Fixation Genes in an
Endosymbiotic Burkholderia Strain. Applied and Environmental Microbioiogy, 67(2):725-732.
♦ Mobarry B.K., Wagner M., Urbain V., Rittmann B.. & Stahl D.A. 1996. Phy/ogenetic Probes for
Analyzing Abundance and Spatial Organizaron ofNitrifying Bacteria. Applied and Environmental
Microbioiogy, 62:2156-2162.
♦ Moreno-Vivián C., Cabeiio P., Martínez-Luque M., Blasco R. & Castillo F. 1999. Prokaryotic
Nitrate Reductíon: Molecular Properties and Functionaí Distinction among Bacterial Nitrate
Reductases. Journal of Bacteriology, 181(21):6573-6584.
♦ Morris C.E., Bardin M., Berge O., Frey-KIett P., Fromin N., Girardin H., Guinebretiere M.H.,
Lebaron P., Thiery J.M., & Troussellier M. 2002. Microbia/ Biodiversity: Approaches to
Experimenta¡ Design and Hypothesis Testing in Primary Scientifíc Literature from 1975 to 1999.
Microbioiogy and Molecular Bioiogy Reviews, 66 (4): 592-6Í6.
♦ Morton J.B. & Benny G.L. 2001. Two new families o f Glomales, Archaeosporaceae and
Paragiomaceae, with two new genera Archaeospora and Paragiomus, based on concordant
molecular and morphological characters. Mycologia, 93:181-195.
♦ Muñoz C., Guillen F., Martínez A.T. & Martínez M.J. 1997. Laccase Isoenzymes o f Pleurotus
eryngii: Characterization, Catalytíc Properties, and Participation in Activation o f Molecular
Oxygen and Mn21 Oxidation. Applied and Environmental Microbioiogy, 63(6):2166-2174.
♦ Murrell, J.C., Giibert B. 8i McDonald I.R. 2000. Molecular bioiogy and regulation o f methane
monooxygenase. Archives of Microbioiogy, 173:325-332.
♦ Nannipieri P., Ascher J., Ceccherini M.T., Landi L., Pietramellara G. & Renella G. 2003. Microbial
Diversity and Soil Functions. European Journal of Soil Science, 54:655-670.
♦ Nicholas K.B. & Nicholas H.B. 1997. GeneDoc: a too/ for editing and annotating múltiple
seguence atignments. Disponible en web: www.psc.edu/blomed/genedoc.
♦ Norton J.M., Alzerreca J.J., Suwa Y. & Klotz M.G. 2002. Diversity o f Ammonia Monooxygenase
Operon in Autotrophic Ammonia-oxidizing Bacteria. Archives in Microbioiogy, 177:139-149.
♦ Notredame C., Higgins D.G. & Heringa J. 2000. T-Coffee: A Novel Method for Fast and
AccurateMultiple Sequence Alignment. Journal of Molecular Bioiogy, 302: 205-217.
♦ Odum E. 1972. Ecología, 3ra edición. Interamericana, México.
♦ Ohrmund S.R. & Elrod S. [en línea]. The Development of Primers Specifíc to Bacterial Species
that Produce Celiuiase Enzymes Using the Tools of Bioinformatic [ref. 15 de abrii de 2004.
http://ebi.calpoly.edu/senior_projects/SteveO_SP.pdf.
♦ Olalde V. & Aguilera L.1.1998. Microorganisms and Biodiversity. Terra, 16(3): 290-292.
♦ Ovreas L., Jensen S., Daae F.L. & Torsvik V. 1998. Microbial Community Changes in a Perturbed
Agricultura! Soil Investigated by Molecular and Physiological Approaches. Applied and
Environmental Microbiology, 64(7):2739-2742.
♦ Pearson W.R. Methods in Molecular Biology, vol. 132: Bioinformatics Methods and Protocols. Ed.
S. Misener & S.A. Krawetz. Humana Press Inc., Totowa N .l
♦ Peng X. & Stromberg AJ. [en línea]. Microarray Experiment Design and Statisticai Anaiysis.
Chapter 7 [ref. 8 de septiembre de 2004]. http://www.kbnn.louisviile.edu/about/Pubs/Pengstromberg.pdf.
♦ Peplies X, Glóckner F.O. & Amann R. 2003. Optimization Strategies for DNA Microarray-Based
Detection o f Bacteria with 165 rRNA-Targeting OUgonudeotide Probes. Applied and
Environmental Microbiology, 69(3): 1397-1407.
♦ Perriére G. & Gouy M. 1996. WWW-Query: An on-Une retrieval system for biological sequence
banks. Biochimie, 78:364-369.
♦ Phillips CJ, Harris D., Dollhopf S.L., Gross K.L., Prosser 3.1. & Paul E.A. 2000. Effects o f
Agronomic Treatments on Structure and Function o f Ammonia-Oxidizing Communities. Applied
and Environmental Microbiology, 66(12): 5410-5418.
♦ Poly F., Ranjard L., Nazaret S., Gourbiére F. & Monrozier L.J. 2001. Comparison o f nifH Gene
Pools in Soils and Soil Microenvironments with Contrasting Properties. Applied and
Environmental Microbiology, 67(5):2255-2262.
♦ Prescott L.M., Harley J.P & Klein D.E. 2000. McGraw-Hill. Microbiology. 4th edition. Electronic
Book.
♦ flozorov A.A. 2001. Recombinational Rearrangements in Bacterial Genome and Bacterial
Adaptaban to the Environment. Mikrobiologiya, 70(5): 581-594.
♦ Purkhola U., Pommerening-Roser A., Juretschko S., Schmid M.C., Koops H.P. & Wagner M.
2000. Phylogeny o f AH Recognized Species o f Ammonia Oxidtzers Based on Comparative 16S
rRNA and amoA Sequence Anaiysis: Implications for Molecular Diversity Surveys. Applied and
Environmental Microbiology, 66(12):5368-5382.
♦ Rahmann S. 2004. [en línea]. Promide, Probe Selection and Microarray Design. [ref. 18 de
Agosto de 2004].
♦ Redecker D. 2000. Specifíc PCR primers to identify arbuscular mycorrhizal fungi within cotonized
roots. Mycorrhiza, 10:73-80.
♦ Redecker D., Morton J.B. & Bruns T.D. 2000. AncestralUneages ofArbuscular Mycorrhizal Fungi
(dómales). Moiecuiar Phylogenetics and Evolution, 14(2):276-284.
♦ Richardson DJ. 2000. Bacterial Respiration: a flexible process for a changing environment.
Microbioiogy, 146:551-571.
♦ Rósch C., Mergeí A. & Bothe H. 2002. Biodiversity o f Denitrifying and Dinitrogen-Fixing Bacteria
in an AcidForestSoii Applied and Environmentai Microbioiogy, 68(8):3818-3829.
♦ Rotthauwe J.H., Witzel K.P. & Liesack W. 1997. The Ammonia Monooxygenase Structural Gene
amoA as a Functional Marker: molecular fíne-scale analysis o f natural ammonia-oxidizing
populations. Applied and Envinomental Microbioiogy, 63:4704-4712.
♦ Salisbury F.B. & Ross C.W. 1994. Fisiología Vegetal. Grupo Editorial Iberoamérica S.A., México,
D.F. 759 p.p.
♦ Scala DJ. & Kerkhof L.J. 1999. Diversity o f Nitrous Oxide Reducíase (nosZ) Genes in
Continental ShelfSediments. Applied and Environmentai Microbioiogy, 65(4): 1681-1687.
♦ Schuler G.D. 1997. Bioinformatics: Pieces o f the puzzle: expressed sequence tags and the
catalog o f human genes. Journal of Molecular Medicine, 75: 694-698.
♦ Small J., Cali D., Brockman F., Straub T. & Chandler D. 2001. Direct Detection o f 16S rRNA in
Soil Extracts by Using Oligonucleotide Microarrays. Applied And Environmentai Microbioiogy, 67
(10):4708-4716.
♦ Soares A., Frois G., Seldin L. & van Elsas J.D. 1997. Molecular Microbial Ecoiogy. Revista de
Microbiología, 28:135-147.
♦ Sobolev D. & Roden E.E. 2002. Evidence for Rapid Microscale Bacterial Redox Cycling oflron in
Circumneutrai Environments. Antonie van Leeuwenhoek, 81: 587-597.
♦ Stanier R., Ingraham J.L., Wheelis M.L. & Painter P.R. 1986. The Microbial World. Fifht Edition.
Prentice Hall, New Jersey USA. 689p.
♦ Steffen K.T., Hatakka A. & Hofrichter M. 2002. Degradation o f Humic Acids by the LitterDecomposing Basidiomycete Collybia dryophila. Applied and Environmentai Microbioiogy, 68(7):
3442-3448.
♦ Stewart P. & Cullen D. 1999. Organization and Differential Regulation o f a Cluster o f Lignin
Peroxidase Genes o f Phanerochaete chrysosporium. Journal of Bacteriology, 181(11):34273432.
♦ Straub K.L. Benz M., Schink B. & Widdel F. 1996. Anaerobic, Nitrate-Dependent Microbial
Oxidation o f Ferrous Iron. Applied and Environmentai Microbioiogy, 62(4): 1458-1460.
♦ Strous M., Kuenen J.G. & Jetten M.S. 1999. Key Physiology of Anaerobic Ammonium Oxidation.
Applied and Environmental Microbiology, 65(7):
3248-3250.
♦ Sugnet C.
1999. [en línea].
Design Considerations [ref.
18 de Agosto de 2004].
http://www.cse.ucsc.edu/~sugnet/oligo_picker/node2.html.
♦ Sztern D. & Pravia M.A. Manual para la Elaboración de Compost: Bases Conceptuales y
Procedimientos. Uruguay: Presidencia de la República - Oficina de Planeamiento y Presupuesto Unidad de Desarrollo Municipal - Organización Panamericana de la Salud, 1999. 69 p.
♦ Tamaru Y., Karita S. Ibrahim A., Chan H. & Doi R. 2000. A Large Gene Cluster for the
üostrídium cellulovorans Cellulosome. Journal of Bacteriology, 182(20):5906-5910.
♦ Taroncher G.,Griner E.M., Francis C.A. & Ward B. 2003. OUgonudeotíde Microarray for the
Study o f Functional Gene Diversity in the Nitrogen Cycle in the Environment. Applied and
Environmental Microbiology, 69(2): 1159-1171.
♦ Thauer R.K. 1998. Biochemistry o f methanogenesis: a tribute to Marjory Stephenson.
Microbiology, 144:2377-2406.
♦ ThompsonJ.D., GibsonT.J., Plewniak F., Jeanmougin F. & Higgins D.G. (1997). The ClustalX
windows interface: flexible strategies for múltiple sequence alignment aided by quality analysis
tools. Nucleic Acids Research, 24:4876-4886.
♦ Thompson J.D., Higgins D.G. & Gibson T.J. [en línea]. CLUSTAL W: improving the sensitivity o f
Progressive múltiple sequence alignment through sequence weighting, position specifíc gap
penalties
and
weight
matrix
choice
[ref.
20
de
diciembre
de
2003].
http://bimas.dcrt.nih.gov/dustalw/clustalw.html. bajado en diciembre 2003.
♦ Thorn R.G., Reddy C.A., Harris D. 8i Eldor A.P. 1996. Isolation of Saprophytic Basidiomycetes
fromSoil. Applied and Environmental Microbiology, 62(11): 4288-4292.
♦ Valencia E. & Peña JJ. 2001 El suelo y sus habitantes microbianos: consideraciones ecológicas.
Avance y Perspectiva, 20:401-406.
♦ Valentine D.L. 2002. Biogeochemistry and Microbial Ecology o f Methane Oxidation in Anoxic
Environments: a review. Antonie van Leeuwenhoek, 81:271-282.
♦ Vera D.F., Pérez H. & Valencia H. 2002. Aislamiento de Hongos Solubilizadores de Fosfatos de
la Rizosfera de Arazá (Eugenia stipitata, Myrtaceae). Acta Biológica Colombiana, 7(1): 33-40.
♦ Wagner M, Roger A.J., Flax J.L., Brusseau G.A. & Stahl D.A. 1998. Phylogeny o f Dissimilatory
Sulfite Reductases Supports an Early Origin o f Sulfate Respiration. Journal of Bacteriology, 180
(11): 2975-2982.
♦ Walter R.L., Ealick S.E., Friedman A.M., Blake R.C., Proctor P. & Shoham M. 1996. Múltiple
Wavelength Anomalous Diffraction (MAD) Crystal Structure o f Rusticyanin: A Highly Oxidizing
Cupredoxin with Extreme AcidStabiüty. Journal of Molecular Biology, 263:730-751.
♦ Wolters V., Silver W., Bignell D., Coleman D., Lavelle P., Van Der Putten W., De Ruiter P., Rusek
J., Wall D., Wardle D., Brussaard L, Dangerfieid J., Brown V., Giller K., Hooper D., Sala O.,
Tiedje J. & Van Veen J. 2000. Effects o f Global Changes on Above • and Beiowground
Biodiversity in Terrestrial Ecosystems: Implications for Ecosystem Functioning. Bioscience, 50
(12): 1089-1098.
♦ Wu L., Thompson D.K., Li G., Hurt R.A., Tiedje J.M. & Zhou J. 2001.
Development and
Evaluation o f Functional Gene Arrays for Detection o f Se/ected Genes in the Environment
Applied and Environmental Microbiology, 67(12):5780-5790.
♦ Zehr J.P., Jenkins B.D., ShortS.M. & Steward G.F. 2003. Nitrogenase Gene Diversity and
Microbial Community Structure: a cross-system comparison. Environmental Microbiology, 5(7):
539-554.
♦ Zhou J. & Thompson D.K. 2002. Challenges in Applying Microarray to Environmental Studies.
Current Opinión in Biotechnology, 13(3):204-207.
♦ Zumft W.G. 1997. Cell Biology and Molecular Basis o f Denitrification. Microbiology and Molecular
Biology Reviews, 61(4):533-616.
ANEXOS
ANEXO 1. OUgonudeótidos diseñados y sus parámetros termodinámicos y físicos (páginas
siguientes).
1 1
n
i
n
i
1 1 1 t 1 1 1 1 1 1
i n
i
1 1 1 1
..............................................i i i í
I 2 5
!i<
i *
3t£E
mi
¡gis
isi riiüü
tí 5
£ <
i t l s
3 • .
ib
$ <
*6 <
| - N
«
t »
«
O
S
O
(>03
5
>0 K
00 Ov O
•H IO «
4 «4 H
«-• N
Í 5 Í 5 S S S Í S S S S 5 Í S 1 1 2
?
i
o>
3
no
B
í
-•
o
—.
8
1
5
9
00
t
ir>
*
<y
®.
•4
i?
8
SI
<2
°>
9
0
0
ft
a
-r
N
I
9
0
«
—
eo
to
**
¡?
’
?
n
•*
*
<M N;
*
0.
N.
«0
-V
fu
O
—«
«
•x.
oa
*x
•s
9
«■4
mi
f
•n
—
7
*
■
1 ■
’. fv
%
o iri m
vb
fC t
TV
«
M*
m
1
00
i¡
9
i 1
v£>
r^ ‘
w
<*
o>"
r^
<
«> .
•M
n
rs "
«?
- l
¥
N
UT>
—
9
97
•-4
s
«5
9
«
«
t
m
’V a u Q c
C
P. ? \tí pj
■« i ¡
O
O
s
OJ
%
$
*
i*>
- «
»
Y o
&
o —
oo
o
^
'\
"■
.i
i-, y
w-
™ A
u
w>
^
<V
9
in
Sí. ?>
o -.'
o
*1
«o
!z• «n.
^ —
(V *>.
co X
« 9
o ^
10
^
5*
<
**.O
«0 K, «
-*
<y
o. o
P o
id
o>
5 -
OvOiN
i-
O *!• N B »
00 £ O *>
«n
9
o
9
i S. I S •- .
t
«•>
O í O . O
T
-i
^
®
O
O
O
ítin N r
^
^
j a « n s s ? ; s ! 8 i * s * s s s ! n s 8 a í ; ; r. 8 ” *
<n ^
<M fvl
•ii ♦ •¿i po <
s|
S £ £ £¡fe ^ « s ü i
<0 ^
M
N
<w
N
«QCDNOx' vi r ot o
l¿ ¡t pi S í t p í í f c S Í É f c f c j é f í i f c ^ ¿se
if> • oN oN. -Ni - No rWv í &H ^
» ^ 0 ' T>*f>',f p«r^ •«- .o r\i o «r ~ o m
^ o n »
<S» <S» lf>
N M N N N N N N S i n N W f t W N N W n f t i
M (\l IM
« N
9 ? 3
iVv mÜ ao
O O B N fJÍlflN W O ÍW n N C U Iflm íin
I S ?
8
2 2
£ 2* t2 I
■
I
I2
2
2
2
J S 3 S-11 1 ! 1 1! 1 í í í 1 1 111 f 11 * I í 1 1 ! 11 i i i i i
«8 <S
lili
Ii
£>
u
I
iS
|
I
o
p
o
I
p
lililí
f
u_
U?
í <
s
<
< <
t
u.
tr
Ü_
i* » 1*
£ £ £
U_
Uiil iilü illilü iü llit !
‘l ü i i i i i i i i ü i m i i i i n u n i H H H : » ; »
8
t
K) «O
lt)5'0^«¿-0< 0'0'í)'0Sl> SN ^
^ ^113
I! í
| } í
I
1
1
i
°?1?»
& 8 £S: 2
2
a:9 £ l & S
f
Ü
8
! I
K¡Í
I
8
§
8
» » S ? S 8 ’ ?Ü'
í
Sí f f O M i t c a S N U i ü )
O
^
fy n
a
^
co r\j s i
» < % < * < *
ro
I
f
r
l
f'4
t-
§ & 1 i fc fc
i u w n u n i u n w n n u n n n
N
Mt
l>
S
'j
»
N
o« o >rO o »v i » >oJ >u
>x
f,c o
v \|| OiS »o
r >oJ <!
>S
« <• Ki - b' - <o
ó í- m ^ úi i> »
w
u
fv>C'^OA'á»-^*-
ní o 'nJ co O
w
u
r
o
o
u
N
u
N
u
N
W
i t >
N
u
M
u
W
(O
IM
#
N
O
N
OI
N
N
8
-v<
l \)
#
& ¿ & á
N
O
ni
w
u
ui
N
Jl
ff 5* rn
*¿»f
N
'J
M
OI
|
^
1
í
^
/W wL f
í w
o
i
/>
i«
C
i»
^
P
P
(M
6
.J
(«
Crü
curo i C ü i r \ ) O i ^ W i . u
„ —
S UJChOiNjO>0>r5*>woc'0¡íW
tsstí;«^Sí;í5
u N i f f l i o K í á í . ' >.. n i-.
..
í? o
o o i. r- A o •*o ^ o
g g
JL.
*.
Vi
M
w
<U
j»
O
o u¡ £ g g * g i; § 'í*
'J
K>
£
o
o
£ <b i*
> $ '5
s
^
SX o
O
00 o
£
C> £
¿
O
rvj p<>.
IV»
i»
w
n
¿
?
P
6
w
ct
w
o o o
o
ta i
§
®o s
■—
o
ot - ±
-k w ó Z «S» r
¿ 5
> V* s >
S*S
v¿> ¿
S
: 8
3 ¿ g 2
V j -vi
Cí “
i» >» >u K)
bv
U
0<
>1
U
(*■
N
>1
r\j
i>
^
^
s
4»
S?
>
«
00
K-
J S
t
>
»
» 4 s
\o
oo
_ ,.
I
¿i ¿>ó *-
r*
a>
Ul «
s s i
_•■
* f\J ►
*
uj
'o
J: £ 3
-fe *- ‘
o o o
O
6
oí
o
>
£
$ Ai ^ ¿ s 5
w
;0
V> ** » > -2 * «*
§ S §
.
gi
:o
lo
ai
K>
w
m
en
oí
*
* « 5} *
N
w
N
W
í
P ¿> <> <i» r\> en
^ % c íz 3 i
3
"i H 3
t;
o
«
t - ►* m
m
m »
*►
* *- p
(A> IV)
M
*O
R £*M
8
1 i 8 3S 3
*
>
5>
5
3
>
.
1
1
2 > * M
„
*l|lii
n ? S S J 2 S S 8 S S ? ? S S Ü S 2 8 2 n *
Í
1y
i
§*
*
¡I
4 2
1 8 |
>
Q
>
2 >H
2
>
>
9 -
* 3
2
3
>
>
$
>
?
?
5P 3P
n £ [ f í n t i m a s * f m i t j f j*
IIIIIIIIIIIIIIIII IIIII
7
ti
£
|
S
s 2 8 2 2 2
2 8 2 8
I
B-
f
Í
•„ r>.
a> h*
csi O
r* r*
*-« ís
vC
f*
M
«e
3
í
•ó
tr>
o
r<
ró
r*
o
V
JÉ
s
fc
<*
en
'O
h*
s
♦
cu
(Ni
t
si
8
ur> Sí
'O
ai
*
K
N
<n
t\í
f3
M
i¡
«n
*
— . .1
tsi
<T
m :s
*2
9 5
ü
o
o»
ft>
8
<n
CVJ
a
«
s
. K
V
tí X
■ 1
1 * í
§ *
i i -8
1 1 3
(SI
i
m
+
CT* -o
•*
-o
(si K
K
00
CJ
n
O
(M
N.
in
R
<n M
fO
■>r s
R
1
o
■o
N-
en
o. m
lf)
O
<*»
R
<D
<M
s?
«H
<•
oo
®
«*»
i O
< c 0 0 0 - . 0 f t^
0 »CO0O* i
j ftl !
ssii.lffi
5
co
N
(u
«n
vO
<*>
K
."-.i «V* <o
«\l
♦
<M
5
III! Hi i IS|?!!H!í !
2 <
<1
o
<0
H
3
s
•#
5
8
«*>
■<*
■O
<o
en
O
ro «SI (O
CM CM C\i
'Ó
T
68.1 L f >
42.9
hs
pj
8
778
í
m
m
t f i ' O ^ t v j ^ n v ' T o
-1<0»«- ! «Ot f 1NCO' r K
77.5
■«e
« i tft «
m
iW
<M ÍO
o
s
♦.■o.0 2 O. ”*
t o S §
í o
í'?
o ó 9 o 9 o 9 o - ' 9 o’ o
o — o o o
N X)
0
s
s-s. ^m■
a■
^(V> oív
^
^ 3'"
<
S >
N.
—. 5
^ tf\
Q. «O
9
v
69
—!
a
9
oo £• <
24
O
í
2
n
74.7
o
■A
3* » & £
S
V
r9
29
25
76.8
2-
O»
*■* N** N* K
O
9
9
I >%
<
<r> <*>
■r N %
:
3
1 «*> tf>
Sr 5o ; ? 9 * <v í*•>
4L7
v
o -r' ^
i § ^
■*
a
»
K
24
^
h
c«Oo
í
V
i
1
<© co
.* «0
<r>
5 . 5
$
£
•<> m
9 3 r 9 3 r = 2 t 9 ? 3 ;i ?
«O
o
»
"í M
O. o.
« p o
< «H 4
O-iv»1rr','1
OV
«,
■v
K.
3
»\
1 ? ’a
-I.
*“1 mW o
33
-
NN
3 S
g S
S N'
22 ?
m Sf o ? t S » ¡s 5" « S t
27
i
r*> qO
O. C\í
24
S
. n
24
O
1
«q
! ? " » § 7 a 2 ¡p t
♦
s
?f?H §§§
1 1 1M<s ) r ^*i O«>OOO
— i'j — i í r«j0rto<*»’«x>f
|
8
c
1 !
f í i
<
?5 fj *
í | 3 lili
3 | S
3
1
5
....
H
H i t tí
a «
UJ
U)
f i<
<B
I
I
0
1
II
Ñ
£
1 U1l
Lii
& <
I
I
II
11
l i l i l í
i gi f i 1f f j f i
1 i i f O f f l f i i l l l í i l l I l l i S f f ¡1
i f t Z t
2 2 2 Í2
»<
lülll
* S S S S S § S 2 Í 3 3 « i§ £ i§ § 3
2 «
W <n t
w
*•< « «
*■
*
*í < < < < u
í S S ? S 2115
<*
~o
t n '<
í ® 2 T - r 0? v - ; o . "
IO
m “cj o
o
9
9'
*» o O Q,
Sf § §' § N5,
|S ¡ ? .. ♦
-• o o o o
V •? j ^
o* 9
«
8 fe
ir» «o n oo r*
if>
m
fú
s
<)
io
<j
fs¡
n
n
”
9
csj
en
<c:•a
o
*
ro IO w
O O
9
cu
—
<o
- <—
_2 £
^ > S¡ ¿i i
s «o
¡ 3if> o
<n
• 9
« A N
V O Q
«»»♦«?
r>
K Krr N~
«m. ?• K
S v oo o 2
9 2
f
s •-
n
n
- -
*H
O S¡••
<TN
N
*»
<3 fe T» s8 ' 7
T >L < < N
^
°V *.
<y «o o
N
V
i
9
í*)
v
n
*v
O. g
N
*H *"<•
&3 s a
¥
V,
^ 9s.9" "
«V'
O
5 °
°v °. °.
O O O
|\ 5. « .
o o o
|
I
^”
2
9 r« ? i
s5
s
?
1 1 1
o
^
•O M
o
P s¿ § ? 5 o p
í . 5 5 i<. S~ S<*> ^
£ O o
?
*H
S' - £ 5 a ^ 5
O, O
$ W o
: t o -
o 9
9 o 9
cv*
<*>
N
5
fí
o
▼.
rv'
T
Ow «0 K
K>
s M <Ó
j
O i f i o o<>f ^N a d N O '
»-« O
£ K
o
W^' O' ON
N
S
«O
«O
K
"í
'*. -* -'. "?
i -4— -
'O®
K
o
q
®
<n k<si ?
IO
^
N
N
CJ n
CM
8 SS 8 3 s
•* Oj ♦ í> IO -1
S
r*
«
K
m
N
jfl
S
«i n
K
K
1*4 O
M
p
M
' aNi ,in nN no i nN N
’r n
»r M• of <
o «f ol oi >i
c «N3m' t r —
f i i lnM<
M N nn N
M W
M 'nONONNN N
t o
l N
M R
o N—f •«ro
t j
MN r ní O>“
m
1
1 1 1 1 S
%
í
T C \
I! ! ! ? §! I
1 1
0 J
j O r r' ~ O
< M
5
1 ®1O
c 0 í \ ) O
< \ i O
I
?v ? «%
?
?
?
§
> v tá e* H
M S lg N W (5 O
?-5 1cm !<i> 3
m 5
«\j i iO
„
I
P l l
<oo O
2 p o £ £ f l í í y s í ¥ i < ?
? ? í í
f ? ^ 2 2 í
2 ¿ 2 2 2 -b 2
¡Bi.S ! ti
&Eí£O.Í'!Iu
;s;y miUiUiífíH!
$
I
y $
« 5 fc
i
5
i
s
<
5
*
<
3
<
¿s
iiiiliihiilliiiiilíii
h
i i r
w
ro
u
m
u
! IINII
* f i ' r Ü j¡ *
i i i i i i i i i n
JTl íj
i i i u
iiiisisinsim
^
n
I\) N
O
w
l\> l\) W
» > N
y
i
u
n
n
m
n
n
n
i
m
u
n
i
m
u
' Í ^ o o b w o - o o i o o o j O
u
o
í
q
5 5
ó i i f f ¡ v U « i j k a > * Í U H U Í H
o
n
Jí K
r*
oK
>o
m
)
°
"J
K)
>
4 *>4 t>
4 O*
W
V3 »
>1 K) * -g
* ¿i
a s a s *
00 <
Jl O CU
o
$
t :f>JU(r
cfc£¡
N »¿'M
v b l »¿
f »¿VM£
9 ' Í Ó ' N ¿"M
W * »¿U s » Í ] i ' f
M
55
O
■
•
*5
o
?
A
o
ir*
>
.O
.—
.— o
i
—
y§ 'S
o
o
V
■¡
FS t k i
N
-5 •?
*
O
*>
^
o %
o
O 1»
O
•- o o
°
o
O
V»
A
o
°
fc
o
o
o
%
o tui t^ '§ * S s
o
O>s ■
V»
*-- O»
-
o
«V» *
'to ui Vn> ;*o
V-
o
o
ú> r P
V: * „
* P
£ > í* *'■é ¿ é e 5 i g > c .*
¿ £ü
¿ ¿ >
*
S
.3 g .3 8 k i¡ É -“ $ S 5
K> 5
>v>
.
¿5L!fi<5W(lMTTW
bóMINTO
"SUBMVTSMN""
Bacteria
dsrB
mcrA Archaea
narS Bacteria
nasA Bacteria
nifD
nifK
nirS Bacteria
nosZ Bacteria
rtosZ Bacteria
nosZ Bacteria
183fTATACXSÁTG ATATTCTG 6ATGATTTT
1S4^CTGCA6CTGGAAAATTTAT6TGAAAAAC6
185TCT66AACT6A&C6ATT6C6TG AT
lw [Á TTA C C A C C 6 A TTTTC A 66 A A A A A 6 A TA TT6
Í87 [lTt6 T66 6 C A 6 C C A f A t T ACCG
188ATSSC&AAACCCT&6A ACC6ATT A
189 C G TCT&6AT6T6AT6AAATSC6ATAAAAT
190 TTA T GAAC&AT AAAGCGAACACCCGT
191 T
Bacteria
Archaea
Bacteria
Bacteria
chiB
chiB
Proteobacteria Betaproteobacteria
Proteobacteria Alphaproteobacteria
Proteobacteria Alphaproteobacteria
Proteobacteria Gammaproteobacteria
Euryarchaeota
75
76.3
31
fthodobacterales
Rhodospirillales
26
32
J8e-06 (0.01)
75.1
77.4
77.2
77.6
24
29
71.9
22
0.005 (0.01)
70.23(0.01)
4e-04 (0.01)
Methanosarcinales 0.15 (0.01)
5e-04 (0.01)
0.23 (0.01)
Proteobacteria Gammaproteobacteria Pseudomonadales
Proteobacteria A Iphoproteobacteria fthizobtales
77.7
29
24
4e-04 (0.01)
69.3
Proteobacteria
29
le-04 (0.01)
72.6
73.7
73.3
27
24
0.058(0.01)
77.2
25
0.067 (0.001)
0.001 (0.01)
28
Metanococcales
Actinomycetales
0.34 (0.01)
Methanococci
Proteobacteria
Proteobacteria Sammaproteobacteria
Actinobacteria
Ce IF Bacteria
77.6
30
0.007 (0.001)
anfD Bacteria
Tm
77.4
Bases
77.7
E blast
24
óübew
26
Proteobacteria Betaproteobocteria
BTBT3HJN
Nitrosomonadales 0.005 ( 0.001)
0.015(0.01)
amoB Bacteria
amoB Bacteria
één
181 CTSCA666CAACTATS6<rrATCA6
182 TGAATATCTGGATAAAGTGTGCGAAATTC
179 6AAA6T6ACCAAC6AA66CAGC&ÁT
180 6 6 C T A T T A T T T T ATTCC6ACCAACCA6
176 AACATTACC&&CA&CT666ATSATTT
177 AAACT6CT6ACC6SC6AAACCATT
178 ATACCT6SCASACCA AACSTT ATATTA&C6
#
0,2/14,2
-53,8
-49
-55,5
37.9
42.3
37.5
-52,3
-48,8
-43,1
50
-55,5
50
-37-60,9
-1>/-93,1
-5,9/-39
-0.4/-984
í,6/-100¿
-5,9/-39
-6/-33,5
J
i
2,1/0
1,2/-141,3
^0,4/24,8 -6,3/112,6;
0,6/2,9
-0,4/24
1,4/0
-46,3
-44,7
1,7/0
2/0
0,6/2,9
-49,7
-44,4
-49,8
-48,3
-55,6
Hairpin
b é'
b incros
(Kcal/mol) (dG/Tm)
(dG/Tm)
-50,9
1,9/0
-5,9/-39
-48,6
-5,3/-47,9
32.3
37.9
50
32.1
34.5
54.2
40.7
52
43.3
50
46.2
K¿¿
ANEXO 2. Listado de primers reportados en la literatura para los principales procesos
enzimáticos considerados en la investigación.
Primer (5'-3')
Nombre
EnzimaMolécula/Taxón
PmoA
A l 89 F
[GGNGACTGGGACTTCTGG]
Mb661R
II223F
[GGTAARGACGTTGCNCCGG]
Mb601R
Mc468R
[CGTCGTATGTGGCCGAC]
II646R
Mcap630R
[ACRTAGTGGTAACCTTGYAA]
Forest675R
Kolb et al., 2003
[GCSGTGAACAGGTAGCTGCC]
[CGTGCCGCGCTCGACCATGYG]
[CTCGACGATGCGGAGATATT]
[CCYACSACATCCTTACCGAA]
PmoA
A650R Bourne et [ACGTCCTTACCGAAGGT]
al., 2001
DsrAB, DsrD
DSR1F
[ACSCACTGGAAGCACG]
DSR4R Castro et
DsrAB, DsrD
a!., 2002
[GTGTAGCAGTTACCGCA]
P94F
[CCTCTAGAATCGG(A/T)ACCTGGAAGGA(C/T)
P93R Karkhoff et GACATCAA]
al., 1995
[CCTCTAGAGGGCACAT(G/C)
GTGTAGCAGTTACCGCA]
Enzima-
Nombre
Primer (5'-3')
Molécula/Taxón
DsrAB, DsrD
DSR1F
[AC[C/G]CACTGGAAGCACG]
DSR2F
[CTGGAAGGA[C/T]GACATCAA]
DSR3F
[GAAGAA[C/G]ATG[A/T]ACGGG 1IJ
DSR4R
[GTGTAGCAGTTACCGCA]
DSR5R Wagner et
NirK, NirS
al, 1998
[TGCCGAGGAGAACGATGTC]
NirKIF
[GG(A/C)ATGGT(G/T)CC(C/G)TGGCA]
NirK2F
[GC(C/G)(C/A)T(C/G)ATGGT(C/G)CTGCC]
nirK3R
[GAACTTGCCGGT(A/C/G)G(C/T)CCAGAC]
nirK4R
[GG(A/G)AT(A/G)A(A/G)CCAGG i TTCC]
nirK5R
[GCCTCGATCAG(A/G)TT(A/G)TGG]
[CCTA(C/T)TGGCCGCC(A/G)CA(A/G)T]
nirSIF
[TACCACCC(C/G)GA(A/G)CCGCGCGT]
nirS2F
[TTCCT(C/G/T)CA(C/T)GACGGCGGC]
nírS3F
[TTC(A/G)TCAAGAC(C/G)CA(C/T)CCGAA]
nirS4F
[GCCGCCGTC(A/G)TG(A/C/G)AGGAA]
nirS3R
[CTTGTTG(A/T)ACTCG(C/G)(C/G)CTGCAC]
nirS5R
tCGTTGAACrT(A/G)CCGGT]
nirS6R
Braker et al., 1998
NirK
Cunir3
[CGTCTA(C/T)CA(C/T)TCCGC(A/C/G)CC]
Cunir4 Casciotti & [GCCTCGATCAG(A/G)1T(A/G)TGG]
Ward, 2001
Nombre
Enzima-
Primer (5'-3’)
Molécula/Taxón
NirK, NirS
K15F
[GGCATGGTACCTTGGCACGTAACCTCGGGC]
K16R
[CATTAGATCGTCGTTCCAATCACCGGT]
[CACGGYGTBCTGCGCAAGGGCGC]
[CGCCACGCGCGGYTCSGGGTGGTA]
KA3F
KA25R
Rósch et
al., 2002
nosZ
[CGYTGTTCMTCGACAGCCAG]
NosZF
NosZR Rósch
et [CATGTGCAGNGCRTGGCAGAA]
al., 2002
NosZ
CAMP-N0S661F
[CUACUACUACUACGGCUGGGGGCUGACCAA]
CAMP-N0S1773R
[CAUCAUCAUCAUAURUCGAUCARCUGBUCGU
Seala & Kerkhof, U]
1999
AmoA
AmoA-lF
[GGGGTTTCTACTGGTGGT]
AmoA-2R
[CCCCTCKGSAAAGCCTTCTTC]
Rotthauwe et al.,
1997
AmoA
NU3
[CCTGTGCrCCATGCTCCG]
NEU
[CCCCTCTGCTGCACTCTA]
NSO190
[CGATccccTGcrn
NS01225
[CGCGATTGTATTACGTGTGA]
Nsml56
[TATTAGCACATCTTTCGAT]
iacc]
Nsv443 Mobarry et [CCGTGACCGTTTCGTTCCG]
al., 1996
AmoA
301F
[GACTGGGACTTCTGGCTGGACTGGAA]
302R
[TTTGATCCCCTCTGGAAAGCCTTCTTC]
304R
[TAYCGCTTCCGGCGGCATTTTCGCCGC]
305F
[GTGGTTTGGAACRGICARAGCAAA]
308R
[TCCCAGCTKCCGGTRATGTTCATCC]
Norton etal., 2002
Primer (5’-3’)
Nombre
EnzimaMolécula/Taxón
AmoB
A3
[TATGTACTGCAGGCAGAAGTTGCGCTTG]
A4
Hirota et al., [CGAATTCGACAGGCTAATTGATGCTTCG]
2000
McrA
[GGTGGTGTMGGATTCACACARTAYGCWACAG
F
R Luton et al., C]
CdhABCDE
2002
[TTCATTGCRTAGTTWGGRTAGTT]
SL degenerados
[GCNCARGARAARGCNGTNGARCC]
Kang
&
Young, tTGNACNGGNGCRTTCAT]
1999
NapA
V16
[GCNCCNTGYMGNTTYTGYGG]
V17
[RTGYTGRTTRAANCCCATNGTCCA]
V66
[TAYTTYYTNHSNAARATHATGTAYGG]
V67
[DATNGGRTCATYTCNGCCATRTT]
GC-clamp
[GCCCGCCGCGCGCGGCGGGCGGGGCGGGGGC
McDevitt
et
al., ACGGGGGG]
2000
Hao
PhlO (hao3)
[CTCCGTAAATATGCGGGTCA]
HB5 (haol,2)
[CTCCGTAATCTACCTGTTCGTCGGCTT]
para Nitrosomonas
spp. Hommes et
al., 2001
HAO
NifH
H4 Hirota et ai, [CTCTAGAAATATGGCAAATACGGCACAAGC]
2000
[CTCTAGATAACGATACGGCGCTGTGTC]
PolF
[TGCGAYCCSAARGCBGACTC]
PoIR
[ATSGCCATCATYTCRCCGGA]
Poly et al., 2001
NifH
NifHF
[AAAGGYGGWATCGGYAARTCCACCAC]
nifHR
[1IG I1SGCSGCRTACATSGCCATCAT]
K07F
[GCGTTCTACGGTAAGGGCGGTATCGGNAAR]
AMRR
tGCTACTACYTCGCCSGA]
Rósch et al., 2002
Enzima-
Nombre
Primer (5'-3')
Molécula/Taxón
NblOOO
Nitrito oxidasa
Mobarry
[TGCGACCGGTCATGG-3]
et
al.,
1996
NrfA
Para D. vulgaris
[CTGAGGAGAAGAGCCGCAAC]
pORF571C)f
[GCTTGGCGGAGACCAGAC]
pORF5712r
nrfAE87
nrfAH87
nrfAElO
nrfAHIO
Browning
et al.,
2002
PhsABC
F
[TCAGCGAATTCTAATAACAGGAGG]
R
[CATTAI 11IATGGATCCGCTCAGAC]
F
[TCAGCTGGATCCAATAACAGGAGG]
R
Bang et al., [CATTAI 11IATGAATTCGCTCAGAC]
2000
Glomales (ADNr)
LOCT670R
[AAGGCCATGACGCTTCGC]
ATRP420F
[AACAATACAGGGCCTTTAC]
Redecker, 2000
grupo
Giomus GLOM1310
mosseae/intraradices GLOM5.8R
[AGCTAGGYC1AACATTGTTA]
[TCCGI1GTTGAAAGTGATC]
Redecker, 2000
grupo
Glomus LETC1670
etunicatum/ claroideu
[GATCGGCGATCGGTGAGT]
Redecker, 2000
m
Acauiosporaceae
ACAU1660
[TGAGACrCrCGGATCGG]
Redecker, 2000
Gigasporaceae
GIGA5.8R
Redecker, 2000
[ACTGACCCTCAAGCAKGTG]
Primer (5'-3')
Nombre
EnzimaMolécula/Taxón
A. ARCH1311
Grupos
[TGCTAAATAGCCAGGCTGY]
gerdemanii/A. trappei Redecker, 2000
y
G.
occultumjG.
brasilianum
ANEXO 3. Listado de enzimas-genes para ias cuales no existió reporte de dominios en la base
ProDom.
genes
Enzimas
A m o n io m o n o o x ig e n a s a
amoBC
C O -d e s h id r o g e n a s a
cdhE, coxL, coxM
N itr o g e n a s a I a lte r n a t iv a s
vnfH, anfH, anfK
R u s tic ia n in a
rusA, rustA
A P S red u ctasa
surC
N itr it o r e d u c t a s a a s i m i l a t i v a e n h o n g o s
niiA
N itr a to r e d u c t a s a a s im ila tiv a e n h o n g o s
niaD
L acasas
lccl-3, Iac34678, lacio, la c ll, Iacl2f Iacl3,
Iacl4, IccK, tHA, Icsl, lapl-2, poxl-3, poxA
M a n g a n e s o p e r o x id a s a s
mnpl234, mnpB
L ig n in p e r o x i d a s a s
HpABCEIGHJ, vgll, Hp2, IpglAB
Q u itin a s a s
chiF, chil5, chi37, chi41, chi55r chi60,
chi69, chi80, chi92, chil9, chitiA, chitiB,
ctsl, cts2, cht4, kchi, pchA
E n d o -B -g lu c a n a s a s
cenA, eg l, e g ll, eg/3, eg¡4, eg!5, bglC,
egltA
C e lo b io h id r o la s a s
ce/3, cbhl, cbh2. cbh3. cbhA. cbhB
C e lo d e x tr in a s a s
celY, celO, acc2, engBDHKLMNY, cenC,
bgxA, bglxA
Descargar