“Reconstruyendo la historia de la vida” Fundamentos y evolución de la ciencia sistemática: comprendiendo la biodiversidad y su historia Marcela Rodriguero “En efecto, los científicos se hallan en la situación de una tribu primitiva que pretendiese reproducir el Empire State Building, habitación por habitación, sin haber visto nunca el edificio original, y ni siquiera una fotografía. Por fuerza sus planes de trabajo sólo serán una tosca aproximación a la realidad, concebida sobre la base de diversos informes de viajeros, a menudo contradictorios en cuanto a los detalles. A los efectos de empezar el edificio, cierta información debe descartarse por errónea o imposible y las primeras construcciones son poco más que parvas de pasto. La creciente sofisticación, combinada con una acumulación metódica de datos, obliga a demoler las réplicas primitivas (cada una luego de violentos altercados) para sustituirlas sucesivamente por versiones más actualizadas. Con toda facilidad podríamos dudar que la versión que se tiene después de sólo 300 años de esfuerzos sea una restauración muy adecuada del Empire State Building, pero, a falta de conocimientos claros en contrario, la tribu debe aceptarla como tal (y no tener en cuenta algunas versiones de viajeros que no concuerdan)”. E.J. Du Praw, “Cell and Molecular Biology”, academic Press, Inc, New York, 1968. 1 INTRODUCCION Hasta el momento hemos visto que la Teoría de la Evolución por medio de la Selección Natural permite explicar, por un lado, el cambio evolutivo (“herencia con modificación” según Darwin), y por el otro la adaptación de los organismos al ambiente. Este cambio evolutivo ha generado, en el curso de la historia de nuestro planeta, una increíble diversidad de organismos a partir del ancestro de toda la vida o cenancestro, mediante la ramificación sucesiva de linajes. El campo de la biología que reconstruye esta historia y que cubre los eventos que han producido la diversidad y distribución de toda la vida se denomina SISTEMATICA. La sistemática entonces no es más que la comprensión de la historia de la vida. Más allá de su importancia intelectual, este campo forma la base de todos los otros campos de la biología comparada y provee el esquema o CLASIFICACIÓN, por la cual otros biólogos comunican información acerca de los organismos, proveyendo de esta manera la base para la interpretación de la historia de la vida. La diversidad es uno de los aspectos más asombrosos del mundo vivo. Hasta el momento los biólogos han descrito aproximadamente 1.75 millones de especies vivientes y 0.25 millones de especies extintas. Es más, se cree que existen entre 10 y 100 millones de especies aún no descriptas. La contemplación de esta diversidad genera en la mente humana una serie de preguntas que demandan explicación. Desde la antigüedad el hombre ha formulado explicaciones intentando dar cuenta de la misma, las cuales pueden reducirse a dos hipótesis básicas: la creacionista y la evolutiva. Las preguntas son varias, pero pueden resumirse en tres grupos básicos que hacen referencia a tres cuestiones: la diversidad, la adaptación y las jerarquías biológicas. En este capítulo nos ocuparemos de esta última cuestión. “EL ARBOL DE LA VIDA” Cuando hablamos de la “jerarquía biológica”, nos referimos a que las especies que nos rodean se ubican en una gradación de rango, desde las más sencillas hasta las de organización más compleja. Pero… ¿cuál es la base de esta gradación? ¿Existe una relación de parentesco biológico entre estos niveles de organización, o su relación jerárquica es simplemente fruto de la casualidad? Para entender esta cuestión debemos abordar un punto importante: ¿Por qué las especies constituyen una jerarquía? Por la sencilla razón de que en el curso de la historia de la vida la evolución ha producido un patrón arborescente, divergente y jerárquico de similitud entre las especies. El llamado “árbol de la vida”, hipótesis concebida a partir de los trabajos de morfología de Geoffroy St Hilaire y de embriología de MilneEdwards a principios del siglo XIX, y esquematizada por autores como Darwin o Haeckel (Fig. 1), da cuenta de esta jerarquía biológica; la evolución no es un proceso lineal, sino (y adoptando la terminología botánica aplicada a los árboles) que es un proceso de diversificación de una rama (linaje) en dos o más ramas hijas (cladogénesis), y a su vez de éstas, en sucesivas rondas de ramificación, produciendo un entramado parecido a un árbol, en el que el crecimiento de las ramas es desigual (por la acumulación de cambio evolutivo en cada linaje o anagénesis) y también el número de ramificaciones de cada linaje (Fig. 2). Para reconstruir esta historia de la vida apelamos a la inferencia de la filogenia, o sea, la topología del proverbial “árbol de la vida”. El concepto de árbol de la vida está sustentado por la estructura del registro fósil, el cual aparece ramificado, y ha 2 constituido desde 1859 evidencia para la evolución. El mismo Darwin afirmó que el proceso evolutivo produce un patrón de “grupos dentro de grupos”. Volviendo ahora a nuestras tres preguntas, tanto la cuestión de la diversidad como la de la adaptación pueden ser respondidas ya sea desde el marco de la Teoría Evolutiva, como desde el Creacionismo. Pero es en la interpretación evolutiva de las relaciones jerárquicas de los organismos donde la hipótesis creacionista es incapaz de dar cuenta de los hechos y queda descartada. ¿Cómo podría, si no, una hipótesis de creación independiente explicar las estrechas relaciones genéticas entre los seres vivos? Si las especies próximas como el gato, el puma y el león, hubieran sido creadas de manera independiente, ¿por qué tendrían que parecerse más entre sí que con cualquier otra especie? Este parecido, manifestado en estructuras semejantes pero que presentan pequeñas modificaciones propias de cada especie, es la consecuencia de haber derivado de una estructura de una especie ancestral reciente, de modo que el parecido se debe a un proceso de herencia con modificación, según palabras del propio Darwin. Este parecido evolutivo es el responsable de que puedan agruparse de manera jerárquica los seres vivos. Las semejanzas y las diferencias entre las especies entonces, no son más que el resultado de un proceso histórico evolutivo. “La historia de la vida tiene forma de árbol” Figura 1a: Diagrama de un árbol evolutivo propuesto por Darwin en su “Cuaderno de notas sobre la transmutación de las especies” (1837) Figura 1b: Primer árbol filogenético propuesto por Ernst Haeckel (1866) 3 ♠ ♣ ♥ ♦ ⌂ Cladogénesis Anagénesis Figura 2: Eventos anagenéticos y cladogenéticos representados en una filogenia hipotética UN POCO DE HISTORIA… El esquema jerárquico de la vida es una idea secular. Ya Aristóteles (384-322 a.C.), el primer gran biólogo de la historia, creía que a todos los seres vivos se los podía distribuir en un orden jerárquico. Esta jerarquía se conoció como Scala Naturae (escala natural). La Scala naturae se iniciaba con los minerales, seguía con las plantas, continuaba con los animales más simples, ascendía hasta los vertebrados, llegaba a la especie humana y seguía incluso hacia los ángeles y hacia Dios (Fig. 3). Esta gradación lineal se consideraba como una manifestación del orden natural, y cada organismo ocupaba un eslabón fijo, inamovible y perfectamente adaptado al entorno. Pero, mientras que para Aristóteles los organismos vivos habían existido siempre, los biólogos posteriores (por lo menos los del mundo occidental) opinaban, de acuerdo a las enseñanzas del Viejo Testamento, que todos los seres vivos eran obra de una creación divina. El orden jerárquico entre todos los seres vivos se había impuesto como una prueba del fijismo de las especies y también como una justificación bíblica de la preeminencia de la especie humana sobre las demás especies. Además, creían que la mayoría de las especies habían sido creadas para servicio o placer de la humanidad y que incluso la duración del día y de la noche había sido elegida para que coincidiese con la necesidad humana de dormir. Entre los partidarios de la creación divina estaba Carolus Linneus (Linneo en lenguaje vernáculo) (1707-1778), el gran naturalista sueco del siglo XVIII, quien desarrolló nuestro sistema actual de nomenclatura para las especies (Fig. 4). En 1753 Linneo publicó su obra Species Plantarum que, en dos volúmenes, describía todas las especies de plantas que se conocían en su época. Inclusive mientras Linneo preparaba estos volúmenes enciclopédicos, los exploradores regresaban a Europa desde África y el Nuevo Mundo con plantas y animales no descriptos hasta entonces y, al parecer, hasta con nuevos tipos de seres humanos. Linneo revisó edición tras edición para dar cabida a estos descubrimientos, pero no modificó su opinión de que todas las especies que existían habían sido creadas por Dios el sexto día y que permanecieron inmutables desde entonces. No obstante, en la época de Linneo se empezó a vislumbrar que el plan de la creación era mucho más complejo de lo que se pensó en un principio. Al estudiar la naturaleza con más detalle continuamente aparecían más especies, cuya ordenación en una escala natural se hacía cada vez mas complicada. Sin embargo, naturalistas como 4 Linneo no podían sustraerse a la idea de que Dios debía haber creado la naturaleza según un orden establecido. Este orden natural, por lo tanto, debería reflejarse en la clasificación sistemática de las especies y a esto se aplicó Linneo con gran éxito. A él se debe la idea de establecer una clasificación sistemática de jerarquías inclusivas, que estableció en cuatro niveles: clase, orden, género y especie, categorías aún actuales. Pero ya bajo el paradigma evolucionista, la contribución más importante de Linneo es la utilización de técnicas de clasificación y de conceptos biológicos totalmente innovadores para la época. Linneo define el concepto de especie como la unidad de reproducción y es el primero que utiliza las piezas florales de las plantas para la clasificación, sacando provecho del reciente descubrimiento del papel sexual de las flores. Aunque algunas de estas ideas, como el sexo de las plantas, no eran bien recibidas en los círculos elegantes de la época, es evidente que Linneo sentó las bases de la moderna sistemática, aunque interpretó todo su trabajo bajo el punto de vista fijista y nunca vislumbró la posibilidad de que su clasificación, sobre la base de semejanzas anatómicas, pudiera ser el resultado de que unas especies procedieran de otras por cambios evolutivos. Con el descubrimiento de nuevas especies y los avances de la anatomía comparada, lo que en principio parecía una sucesión discontinua de especies se transformó en una serie continua y gradual, que en algunos casos experimentaba ramificaciones laterales, dejando su carácter escalar para transformarse más bien en un árbol. Así, el concepto de escala natural fue desplazado, sentando las bases de la moderna filogenia y sustituyendo las ideas fijistas por las ideas evolutivas. Desde la publicación de Sobre el Origen de las Especies en 1859, la ciencia de la taxonomía ha desempeñando un importante papel en el desarrollo de la teoría evolutiva, sirviendo de base al concepto de especie biológica y a importantes teorías sobre la especiación y la macroevolución. Figura 3: Scala naturae Figura 4: Parte del legado de Linneo (como el sistema nomenclatural y las categorías taxonómicas) ha persistido hasta nuestros días… 5 SOBRE PARECIDOS Y DIFERENCIAS… Linneo y todos los taxónomos anteriores a Darwin interpretaron a la jerarquía biológica como la imagen de la organización de los seres vivos en arquetipos o planes diseñados de un modo independiente, ajustándose de este modo a un supuesto orden creacionista. Sin embargo, la creación jerárquica admite perfectamente una explicación desde la Teoría Evolutiva. En efecto, en el árbol de la vida todos los organismos guardan una cierta relación genealógica, de forma que dos organismos cualesquiera tienen cierto grado de parentesco debido a un antecesor común del que han derivado hace más o menos un tiempo y que les hace compartir estructuras denominadas homólogas. Aquellos organismos que tienen un antecesor común más reciente presentarán, en promedio, mayor número de estructuras compartidas que otros organismos que tienen un ancestro común más antiguo. Darwin atribuyó la generación de las diferencias a la presión de selección natural en su principio de divergencia (Fig. 5), de manera que el número de sucesos evolutivos divergentes mediados por selección que han acontecido entre organismos cuyo ancestro común es más alejado es mayor que el que ha acontecido entre organismos cuyo ancestro común es más reciente. La sistemática se basa en el análisis de las homologías para reconstruir el árbol de la vida. Esto no resulta una actividad fácil en muchos casos, ya que las semejanzas pueden deberse no sólo a descendencia de un ancestro común (homología), sino también a la respuesta adaptativa independiente a causas comunes, generalmente ambientales (analogías u homoplasias). Para que sea válida, la metodología sistemática debe poder distinguir aquellas semejanzas fruto de la historia (homologías), de las que derivan de circunstancias comunes de la vida (analogías). Estas últimas generalmente oscurecen las relaciones genealógicas o filogenéticas. Figura 5: Esquema del Principio de Divergencia, enunciado por Charles Darwin en su obra “Sobre el origen de las especies” (1859). 6 PONIENDO UN POCO DE ORDEN: TAXONOMIA Y SISTEMATICA Uno de los objetivos fundamentales de los observadores del mundo natural es percibir orden en la diversidad viviente. A fin de ordenarla, los biólogos estudiosos de esta diversidad la clasifican. Para clasificar, agrupamos a los objetos en clases según sus atributos comunes. La TAXONOMÍA es la disciplina referida a la teoría y práctica de la clasificación de los organismos (o cualquier otra entidad, como los libros de una biblioteca o los artículos de un almacén en estantes). Este término fue acuñado por el biólogo francés Agustín Pirano de Candolle en 1813. Por otra parte, el paleontólogo George Gaylord Simpson propuso el concepto SISTEMÁTICA para referirse al “estudio científico de los tipos de organismos, de su diversidad y de todas las relaciones existentes entre ellos”. Consciente de que la taxonomía puede reflejar tales relaciones o no y de que el estudio de la biodiversidad es mucho más que una mera descripción y catalogación, bajo esta definición, la sistemática se concibió como la ciencia de la biodiversidad, y este nuevo concepto ampliado ha sido aceptado por casi todos los biólogos. El objetivo de la sistemática entonces no es simplemente describir el mundo vivo, sino además contribuir a su comprensión. Dijimos antes que el resultado de la clasificación es la formación de clases. Una clase es un agrupamiento de entidades similares y relacionadas entre sí, de manera que los miembros de una misma clase compartirán uno o más atributos o caracteres que no son compartidos por miembros de otros grupos. Al referirnos a los seres vivientes, cada clase se denomina taxón. Un taxón no es otra cosa que un grupo de organismos que comparten ciertas características. Los taxones pueden ser asignados a una determinada categoría taxonómica (cada una de las particiones de la jerarquía). El rango taxonómico sería el lugar que ocupa una cierta categoría taxonómica en la jerarquía. Así, el taxón “Mammalia” pertenece a la categoría taxonómica “Clase” y ocupa el mismo rango taxonómico que las otras clases, un rango inferior a los tipos o phyla y un rango superior a los órdenes y a las familias. Todo sistema de clasificación tiene dos funciones principales: facilitar la recuperación de información y servir de base para estudios comparativos. La clasificación es la clave del sistema de almacenamiento de información en todos los campos. A su vez, las clasificaciones jerárquicas permiten almacenar y recuperar información de manera eficiente, ya que cuando se describe un taxón de rango inferior, por ejemplo una especie, no es necesario repetir las características de los niveles superiores a los que pertenece. Por ejemplo, al describir un gorgojo no es necesario mencionar los caracteres presentes en todos los hexápodos (dos pares de alas, tres pares de patas, un par de antenas) o en los demás integrantes del orden Coleóptera (primer par de alas muy esclerotizado). Dado que la investigación taxonómica es indispensable en todas las ramas de la biología, resulta sorprendente lo olvidada y desprestigiada que ha estado en los últimos tiempos. El principal método en muchas disciplinas biológicas es la comparación, pero ninguna comparación podrá llegar a conclusiones significativas si no está basada en una taxonomía sólida. Pero, desde 1859 en adelante, los fundamentos filosóficos en los que se basaron las clasificaciones biológicas han atravesado una serie de cambios. La manera en la que sucesivas generaciones de biólogos han formado los “grupos dentro de grupos” no fue siempre igual… 7 ESCUELAS DE CLASIFICACION Dado que la evolución ha producido un “árbol de la vida”, las clasificaciones biológicas deben ser jerárquicas. Además, otro objetivo perseguido por el biólogo estudioso de la diversidad es la representación del orden natural expresado en la genealogía de los grupos de organismos. Ahora bien… ¿cómo se construyen estas clasificaciones? Las clasificaciones son elaboradas por los taxónomos, pero como ya hemos adelantado, en la historia de la clasificación biológica diferentes taxónomos han seguido distintas filosofías, produciendo distintos sistemas de clasificación. Durante buena parte del siglo XX, los taxónomos estuvieron divididos en tres escuelas principales: la escuela evolutiva, la escuela fenética (o taxonomía numérica), y la escuela cladística (o sistemática filogenética). La escuela de pensamiento que ha persistido hasta nuestros días y que permite reconstruir la historia de la vida (con ciertas limitaciones) es la SISTEMÁTICA FILOGENÉTICA. Es interesante conocer las principales características de cada una de ellas, para así entender la evolución de la taxonomía y de la sistemática hasta nuestros días. TAXONOMÍA EVOLUTIVA Esta escuela de pensamiento, que predominó hasta mediados de los ‘80s, fue desarrollada principalmente por el ornitólogo Ernst Mayr (1904-2005) y por el paleontólogo de mamíferos George Gaylord Simpson (1902-1984). Los taxónomos evolutivos postulaban que un sistema de clasificación sólido debería basarse en dos criterios: • la genealogía o relaciones de ascendencia común (representadas por los eventos de cladogénesis) • la cantidad de cambio evolutivo acumulado en un linaje por divergencia adaptativa (representado por los eventos de anagénesis) Ya Darwin, en su obra cumbre Sobre el origen… había señalado que “la genealogía por sí sola no proporciona una clasificación” por lo que la cantidad de cambio evolutivo acumulado no puede hacerse a un lado, ya que las ramas divergentes de un árbol filogenético “experimentan diferentes grados de modificación” y esto se expresa “en la ordenación de las formas en diferentes géneros, familias, secciones u órdenes”. ¿Pero porqué Darwin consideraría al cambio evolutivo acumulado en un linaje importante para la clasificación, más allá de los puntos de ramificación? Porque la ramificación (o cladogénesis) y la divergencia adaptativa (o anagénesis) no están correlacionadas. Esto puede entenderse si pensamos que cuando los dinosaurios conquistaron el nicho aéreo, tuvieron que adaptarse al nuevo modo de vida, resultando en una modificación drástica del fenotipo. Las ramas de la familia que permanecieron en el nicho ancestral apenas han cambiado. Esta consideración de los factores ecológicos y su impacto sobre el fenotipo es característica de la clasificación evolutiva. Es decir que los taxónomos evolutivos proponen separar en taxones diferentes a aquellos descendientes que se diferencian por una gran cantidad de cambio evolutivo y por ocupar zonas adaptativas distintas. Aquellos taxones que experimentan un cambio fenotípico tan grande que les permite conquistar una nueva zona adaptativa (como las aves con respecto a los “reptiles” o el hombre respecto a los otros primates) constituyen un “grado” (Fig. 6), y merecen ser 8 incluidos en una categoría taxonómica diferente. En consecuencia, los taxones delimitados pueden ser tanto clados o grupos monofiléticos (i.e. incluyen al antecesor común y a todos sus descendientes) como grados o grupos parafiléticos (i.e. incluyen al antecesor común y a algunos de sus descendientes, pero no todos) (Fig. 7). Al final de este apartado, cuando hayamos completado nuestro viaje por la historia de las escuelas clasificatorias comprenderá mejor esta distinción (vea PARA PENSAR…). Vale la pena resaltar que los taxónomos evolutivos adherían a la postura del realismo evolutivo, es decir que las especies se consideraban entidades reales de la naturaleza más allá de la capacidad del taxónomo para reconocerlas, y constituían unidades de evolución. Entre los conceptos realistas propuestos por los taxónomos evolutivos se pueden citar el concepto biológico de especie, propuesto por Mayr en 1970, el concepto cohesivo de especie, propuesto por Slobodchikoff en 1976 y el concepto evolutivo de especie, propuesto por Simpson en 1961 y modificado por Wiley en 1978. La representación gráfica típica de la Taxonomía Evolutiva es el árbol filogenético, esquema en el que la longitud de las ramas es proporcional a la cantidad de cambio acumulado en cada uno de ellas. También se denomina filograma. (Fig. 8a). En estos árboles se ven reflejadas las relaciones de grupos hermanos (o sea, dos taxones que están más cercanamente relacionados el uno con el otro que con un tercer taxón), por ejemplo los taxones E y F, y las relaciones de ancestro-descendiente. El rol de la Teoría Evolutiva es muy importante en este tipo de clasificaciones, que pretenden reflejar tanto los patrones como los procesos evolutivos. Las principales críticas a esta escuela se basaban en que no había un método unificador ni conceptual, por lo que la autoridad sistemática se centraba en un pequeño grupo de investigadores para cada grupo; se carecía de procedimientos formales para corroborar o refutar una clasificación propuesta; no había una medida uniforme para comparar las clasificaciones de grupos taxonómicos; faltaba una orientación filosófica clara sobre qué aspectos de la evolución se reflejan en una clasificación particular. Figura 6: Esquema de los clados (grupos monofiléticos) y de los grados (grupos parafiléticos) Es importante notar que las clasificaciones evolutivas, dado que se basan al menos en 9 parte en las relaciones genealógicas, reconocen grupos mono y parafiléticos pero desechan los grupos polifiléticos (aquellos grupos formados por dos linajes que han evolucionado convergentemente hacia estados de carácter similares; de esto se desprende que el ancestro común de ambos linajes no está contenido en el grupo) ya que forma los “grupos dentro de grupos” en base a caracteres homólogos, descartando los homoplásticos. Al otorgar una categoría taxonómica diferente a los organismos altamente divergentes, el grupo que incluye a aquellos otros que no se han diferenciado tanto se reconocerá por la posesión de caracteres primitivos, con lo que esta corriente taxonómica no distingue las homologías derivadas (sinapomorfías) de las homologías primitivas (simplesiomorfías). Figura 7: Grupo mono y parafilético esquematizados en la clasificación de los tetrápodos 10 ESCUELA FENÉTICA O TAXONOMÍA NUMÉRICA Esta corriente surgió a mediados de los años ’50 a partir de los escritos de varios investigadores. En 1963 dos de ellos, Robert Sokal (entomólogo de la Universidad de Kansas) y Peter Sneath (bacteriólogo londinense y primer investigador en utilizar una computadora con fines taxonómicos), publicaron un libro que reúne la justificación y los procedimientos de esta escuela de pensamiento, Principios de Taxonomía Numérica. La taxonomía numérica nació como un intento de obtener clasificaciones objetivas. Sus seguidores creían que las técnicas utilizadas por los taxónomos evolutivos para distinguir los caracteres filogenéticos de los no filogenéticos eran sumamente subjetivas, y evitando tal distinción creían sortear el gran problema de la subjetividad. De esta manera, la clasificación fenética (o numérica) ignora la distinción entre caracteres filogenéticos y no filogenéticos y los mezcla a fin de definir los “grupos dentro de grupos”. Es por ello que los feneticistas incluían en sus análisis toda clase de caracteres: homólogos ancestrales, homólogos derivados y homoplásticos. La filosofía que enmarca a esta forma de construir clasificaciones es radicalmente diferente de la de la escuela ya vista. Baste saber que los feneticistas eran nominalistas, es decir que para ellos en la naturaleza sólo existían organismos individuales. Plasmaban estas ideas mediante conceptos de especies tales como el morfológico (propuesto por Cain en 1954), el paleontológico (propuesto por Simpson en 1961) y el fenético (propuesto por Sokal en 1973). Por otra parte, los feneticistas opinaban que si la clasificación de los organismos se basa en un único carácter se pueden producir conflictos en función de la característica elegida para agruparlos. ¡Pensemos en los grupos que formaríamos si clasificáramos a las especies de animales tomando en cuenta la presencia de columna vertebral, y en los grupos a los que llegaría otro investigador si pusiera énfasis en la posesión de ojos! Los feneticistas creyeron solucionar este problema contemplando un gran número de caracteres en sus análisis y promediándolos. Este promedio se lleva a cabo utilizando “estadísticos de agrupamiento” (más conocidos en la literatura como “cluster statistics”). El primer objetivo es definir las “distancias” entre las especies (i.e. el promedio de las diferencias entre una especie y otra para cada uno de los muchos caracteres incluidos en el análisis taxonómico). A partir de la matriz de distancias, y utilizando un estadístico de agrupamiento, se van formando los “clusters” con los taxones incluidos en el análisis. Estos agrupamientos se expresan a través de un diagrama llamado fenograma, que permite visualizar las relaciones de similitud global entre los taxones bajo estudio (Fig. 8b). En teoría este proceso debería ser perfectamente repetible: cualquier taxónomo, si mide una gran cantidad de caracteres, debería llegar a la misma estimación de la distancia entre especies, y por ende a la misma clasificación. ¡La subjetividad se había eliminado de la taxonomía! Pero… L.A.S. Johnson, un taxónomo australiano, echó por la borda las aparentes bondades de la taxonomía numérica al identificar varias fuentes de subjetividad que no pudieron ser eliminadas. La escuela fenética nunca se repuso de esta estocada mortal. El gran problema de la taxonomía numérica estaba constituido por la gran cantidad de posibles criterios para confeccionar la matriz de distancias entre las especies y la gran cantidad de estadísticos de agrupamiento (para una revisión de los mismos consulte “Introducción y Práctica de la Taxonomía Numérica”, Crisci JV y López Armengol MF, Sec. Gral. OEA, 1983). Dado que ninguno de estos estadísticos forma grupos que sean más “reales” o más “naturales” que otros, las pretensiones de objetividad de la taxonomía numérica sucumben. El taxónomo numérico puede elegir qué tipo de distancia o qué estadístico 11 de agrupamiento utilizará en sus análisis, pero esta elección es completamente subjetiva. Sin importar cuantos caracteres mida, aún de manera completamente objetiva, el taxónomo seguidor de esta filosofía deberá optar por la mejor metodología de análisis, y de esta manera, basar su elección en algún criterio superior, que desafortunadamente no existe. Este “criterio superior” podría ser un plan de la naturaleza que provea un punto de referencia externo y objetivo para la clasificación fenética. Pero en ausencia de una jerarquía natural de similitudes fenéticas, este tipo de clasificación cae en la trampa de la subjetividad. Las clasificaciones fenéticas trataban de agrupar a las especies de acuerdo a una relación que la evolución no produce. La evolución no produce una jerarquía fenética particular privilegiada que sea más real que otras jerarquías. Por otra parte, dado que esta corriente se basaba en la idea de semejanza entre los taxones (el número de caracteres que comparten), y no en compartir un ancestro común más reciente, el conjunto de estados compartidos es muy grande y puede ser de tipo homólogo u homoplástico. Por lo tanto, es muy probable que las relaciones evolutivas entre los taxones no se vean reflejadas por estas clasificaciones y los errores serán considerables cuando la contribución de las simplesiomorfías y las homoplasias sea muy grande. Veamos un ejemplo… Los percebes adultos (los crustáceos que constituyeron el objeto de estudio de la gran tesis de Darwin), tienen una apariencia parecida a la de las lapas (un tipo de molusco). Si clasificáramos a un percebe adulto, a una lapa y a un langostino fenéticamente, agruparíamos al percebe con la lapa, aún cuando el percebe y la langosta comparten un antecesor común más reciente, lo que nos conduciría a su agrupamiento si tomáramos en cuenta las relaciones filogenéticas. Hoy por hoy, la filosofía feneticista ha caído en el olvido, aunque la metodología concebida bajo este marco de pensamiento ha sobrevivido hasta nuestros días y ha sido adoptada para resolver problemas relativos a la delimitación de especies, al estudio de la variación infraespecífica y al estudio de las relaciones filogenéticas cuando se utilizan caracteres moleculares, como veremos en un próximo apartado. ESCUELA CLADISTICA O SISTEMATICA FILOGENETICA Los fundamentos de la escuela cladística de clasificación fueron presentados por el entomólogo alemán Willi Hennig (1913-1976) en su libro Grundzüge einer Theorie der phylogenetischen Systematik (1950). Precisamente por el hecho de haber publicado su obra en ese idioma, esta pasó desapercibida por algunos años. En 1953 se citaron dos de sus párrafos en la revista Systematic Zoology (hoy Systematic Biology, la publicación más leída dentro de la disciplina) en los que se enfatizaba la necesidad de contar con un sistema general de referencia para la biología. En 1965 apareció un resumen de las principales ideas de Hennig en inglés, y en 1966 se publicó su libro traducido a ese mismo idioma con el nombre de Phylogenetic Systematics, momento en el cual las ideas del entomólogo comenzaron a popularizarse ante el resto de la comunidad científica. Hasta ese momento, el libro había sido editado en tres idiomas: alemán, inglés y castellano (este último por iniciativa de un profesor de esta universidad, el Dr. Osvaldo Reig, con el nombre de “Elementos de una Sistemática Filogenética”). En su obra, Hennig consideraba que no había manera de representar todos los parámetros de la filogenia de un grupo en un sistema tan simple como la clasificación jerárquica. Por lo tanto, en lugar de elegir representar vagamente varios factores en la clasificación, se concentró en las relaciones de grupos monofiléticos, enfatizando el grado de ancestralidad común. 12 Hennig formalizó sus ideas sosteniendo que los puntos de ramificación (eventos cladogenéticos) debían basarse en las sinapomorfías. Los grupos que comparten sinapomorfías son los grupos hermanos anteriormente citados, y éstos, que se originan en un mismo momento, deben pertenecer a categorías taxonómicas de un mismo rango. Es interesante comentar, de acuerdo a los conceptos recién detallados, que el término “cladista” y todos sus derivados (del griego klados, “rama”), fue acuñado por el taxónomo evolutivo Ernst Mayr, quien utilizó este apelativo en forma despectiva para referirse a los seguidores de la sistemática filogenética, aludiendo al interés de los mismos en los eventos de ramificación (eventos cladogenéticos), en detrimento de los eventos anagenéticos (¡recuerde lo aprendido hasta aquí!). La cladística ha desarrollado diversos algoritmos para la reconstrucción filogenética, basados en el principio de simplicidad o parsimonia (que comentaremos en el próximo apartado), cuyos resultados se expresan gráficamente en diagramas arborescentes llamados cladogramas (Fig. 8c). Los cladogramas representan relaciones cladísticas o de parentesco entre taxones, debidas a la presencia de un antecesor común (teniendo en cuenta lo aprendido hasta aquí, ¿como cree que será el largo de las ramas de un cladograma?). Las clasificaciones hennigianas se basan en la reconstrucción de las filogenias de los organismos en base exclusivamente a la utilización de caracteres homólogos derivados (o sinapomorfías). La utilización de otro tipo de semejanzas (como las similitudes homoplásticas o las similitudes homólogas primitivas) puede conducir a reconstrucciones filogenéticas erróneas. Para entender la diferencia entre los distintos tipos de similitudes, discutamos el tema de la pentadactilia (Fig. 9a). El hecho de poseer cinco dedos no sitúa al hombre más próximo a una rana que a una vaca, sino que simplemente es un estado que se ha preservado en buena parte de los tetrápodos a partir del ancestro de todos ellos, aunque algunos descendientes (como la vaca), hayan evolucionado hacia un solo dedo. Es más, tener un estado único, característico de un linaje (autapomorfía) no ayudaría a resolver la situación filogenética de la vaca respecto a otros taxones que no posean ese carácter (recuerde lo aprendido sobre la escuela evolutiva!!). De esta manera vemos que tanto los caracteres homólogos compartidos primitivos o simplesiomorfías (cinco dedos en la rana y en el hombre) y los caracteres derivados únicos o autapomorfías (un solo dedo en la vaca) no son útiles en la tarea de la reconstrucción filogenética. La clave estaría en los caracteres homólogos derivados compartidos por un grupo de organismos o sinapomorfías. Estos organismos constituirían un grupo monofilético. 13 Un ejemplo de sinapomorfía es la placenta. Los mamíferos descienden de un ancestro común que la tenía, y éste a su vez desciende de otro ancestro que no la tenía (Fig. 9b). La falta de placenta como estado ancestral no nos puede decir nada de la mayor proximidad entre pájaros, reptiles, insectos (todos ellos no placentarios) o de cualquiera de ellos con respecto a los mamíferos placentarios, pero en cambio sí podríamos utilizar a la placenta para formar el grupo monofilético “Mamíferos”. De acuerdo a lo ya visto, los grupos de las clasificaciones cladísticas entonces son monofiléticos; esta escuela rechaza a los grupos parafiléticos y a los polifiléticos. Esto se debe a que sólo los grupos monofiléticos son definidos de manera no ambigua por sus relaciones de ramificación. Contienen todas las ramas que salen del ancestro dado, y nada se debe decir o conocer acerca de la evolución fenética de las especies que descienden de cada ancestro. Analicemos un cladograma… Observando el cladograma de la Fig. 10, se desprende la hipótesis de que Prorodon teres y Prorodon marina constituyen un grupo hermano y comparten un ancestro común más reciente entre sí que con respecto a Coleps; pero los prorodontidos (P. teres + P. marina + Coleps) comparten un ancestro común más reciente entre sí que con respecto a Placidae (Placus + Spathidiopsis). Estos árboles no hipotetizan explícitamente relaciones de ancestro descendiente. En otras palabras, el presente árbol hipotetiza que Prorodon y Coleps están relacionados, pero no que Prorodon evolucionó a partir de Coleps o que Coleps evolucionó a partir de Prorodon. Los ancestros, para esta escuela, son hipotéticos. Para Hennig las especies eran las unidades básicas del proceso evolutivo y también las unidades de la clasificación. Para esta corriente de pensamiento, evolución y clasificación convergen al nivel de especie. Para el fundador de esta escuela, paradigma sistemático actual, y al igual que para los taxónomos evolutivos, las especies eran entidades reales. Los seguidores de la filosofía cladística utilizan definiciones de especie tales como el concepto filogenético, propuesto por Nixon y Wheeler en 1990, el concepto autapomórfico, propuesto por de Queiroz y Donoghue en trabajos publicados en los años 1988 y 1990, y por último el concepto monofilético de especie, planteado por Mishler y Brandon en 1987. La propuesta de la escuela cladística no se limita sólo a la metodología para la reconstrucción filogenética, sino que conlleva una postura filosófica para la clasificación de los organismos vivientes. En resumen, el método enunciado por Willi Hennig se basa en la búsqueda de caracteres que posean estados homólogos 14 compartidos que den lugar a grupos monofiléticos, que de forma jerarquizada, y partiendo desde los caracteres que posean los estados derivados más antiguos hasta los más recientes, permitan la reconstrucción de la historia de la vida. La aplicación de esta filosofía en sistemática difiere de algunas clasificaciones establecidas, algunas de ellas procedentes de la escuela evolutiva. Desde un punto de vista cladístico la tradicional clase Reptilia debería ser eliminada (ver PARA PENSAR…), ya que no constituye un grupo monofilético. Estas clasificaciones filogenéticas agrupan a las especies en base a lo reciente del ancestro común. La jerarquía de relaciones ancestrales es una jerarquía única, que se extiende hasta el principio de la vida y la incluye por completo. Esta jerarquía se puede transformar fácilmente en una clasificación. La ventaja de la clasificación cladística tiene la ventaja de la objetividad, ya que la jerarquía filogenética existe independientemente de las metodologías utilizadas para descubrirla, y es única en su forma, ya que la vida surgió una sola vez. Aunque diferentes técnicas (tema que abordaremos más adelante) arrojen diferentes soluciones o hipótesis filogenéticas, siempre hay un punto de referencia externo al cual referirse. Sabemos que la solución existe. Con el sistema fenético, tal solución no existe, no hay una única jerarquía fenética análoga a la jerarquía filogenética. La principal ventaja de la clasificación filogenética es teórica, ya que los problemas de índole práctica que plantea esta visión de la clasificación y de la historia de la vida son varios. Uno de ellos es que en realidad no conocemos las relaciones filogenéticas. Sólo las podemos inferir a partir de una reconstrucción (pues fue la vida misma quien las ha construido; nosotros sólo somos capaces de reconstruirlas y de llegar, humildemente, a una aproximación de lo que realmente ha ocurrido). Otro problema que surge al aplicar esta filosofía es la inestabilidad de la clasificación, ya que el resultado obtenido puede cambiar ante la adición de nueva evidencia (nuevas especies o nuevas fuentes de caracteres). Al cambiar la filogenia, también cambia la clasificación, y con el advenimiento de las nuevas tecnologías, tanto en al campo práctico como en el teórico, podemos afirmar que estamos viviendo una era de rápido cambio en lo que se refiere a las clasificaciones formales que estudiamos en nuestros cursos de grado. Hoy por hoy, la mayoría de los biólogos aceptan que la sistemática filogenética es el sistema mejor justificado en términos teóricos para la clasificación de los organismos vivientes. La escuela cladística es objetiva, y sin duda alguna las clasificaciones objetivas son preferibles a las subjetivas. La incerteza de las inferencias filogenéticas hace que las clasificaciones cladísticas se vean sujetas a frecuentes revisiones, aunque los principales defensores de este sistema sostienen que a raíz de sus análisis proponen hipótesis filogenéticas, y cualquier hipótesis “saludable” puede ser modificada ante la adición de nueva evidencia. La clasificación cladística se ha vuelto popular sólo recientemente. La clasificación evolutiva fue la escuela ortodoxa por excelencia desde la “síntesis moderna” (años ‘30), y quizás desde la publicación de “Sobre el origen…”, hasta los años ’80. La taxonomía numérica tuvo su esplendor desde finales de los ’50 hasta principios de los ’70. Pero actualmente estas dos escuelas han sucumbido ante la cladística. PARA PENSAR… La clasificación tradicional (i.e. taxonomía evolutiva) otorgó el rango de clase a mamíferos, aves y reptiles. Dos de estos grupos, aves y mamíferos, han sufrido independientemente un rápido cambio evolutivo y se han convertido en animales muy diferentes a los reptiles. En los distintos linajes reptilianos la tasa de cambio evolutivo 15 ha sido más lenta, por lo que han permanecido más parecidos entre sí. Los cocodrilos y las lagartijas, por ejemplo, son más parecidos entre sí que respecto a las aves. No obstante, los cocodrilos comparten un ancestro común más reciente con las aves que con las lagartijas. Los caracteres que se utilizan para agrupar a los miembros de la clase “Reptiles”, como las escamas, son ancestrales (o simplesiomórficos), resultando en la formación de un grupo parafilético. Los grupos parafiléticos se vuelven peligrosos cuando uno o más subgrupos han evolucionado rápidamente y han dejado a los otros miembros del grupo por detrás. Los grupos parafiléticos se definen por características fenéticas (caracteres ancestrales), y por lo tanto su reconocimiento es subjetivo. La clase Reptilia es descartada por la clasificación cladistíca. Un subgrupo de los ex - Reptiles llamado Archosauria, incluye cocodrilos y aves (y por consiguiente dinosaurios). Lepidosauria contiene a las lagartijas, las víboras y probablemente a las tortugas (Fig. 11). Hay muchos otros grupos parafiléticos en las clasificaciones tradicionales que hemos venido estudiando en los cursos básicos de Botánica y Zoología: invertebrados (se excluyen los vertebrados), peces (se excluyen los tetrápodos), gimnospermas (se excluyen las angiospermas), son sólo algunos de ellos… Figura 11: Clasificación tradicional y filogenética de los Vertebrados SISTEMATICA FILOGENETICA: DISTINTAS ESCUELAS DE PENSAMIENTO Mucha agua ha corrido bajo el puente desde que Willi Hennig dio a conocer sus ideas mediante su libro, y varias modificaciones han enriquecido su legado. Por otra parte, el advenimiento de la “sistemática molecular” ha propiciado la formulación de nuevas metodologías (basadas en principios totalmente diferentes) para la reconstrucción filogenética en base a esta fuente de atributos. En este apartado seguiremos bajo el marco de la sistemática filogenética, aunque exploraremos las 16 distintas escuelas de pensamiento dentro de esta corriente que actualmente domina la clasificación de los organismos. Además de la Cladística, hoy contamos con métodos probabilísticos (que reconstruyen la filogenia más probable de acuerdo a un modelo particular de evolución, en el caso del método de Máxima Verosimilitud, o de acuerdo a los propios datos, en el caso del Análisis Bayesiano) y con métodos de distancia (que lentamente están cayendo en el olvido). METODO CLADISTICO A continuación, veremos los fundamentos de la escuela cladística, a fin de entender la filosofía que sustenta a esta manera de encarar el estudio de la diversidad. Más adelante, se dedicará un capítulo completo a cada uno de sus detalles metodológicos. A partir del trabajo seminal de Willi Hennig a mediados del siglo pasado, punto de partida para el establecimiento de la escuela de la sistemática filogenética, muchos investigadores hicieron importantes aportes para el desarrollo de la cladística moderna. Algunos de los más dedicados estudiosos de la cladística que trabajan activamente en los aspectos metodológicos y teóricos de este campo son James Farris (probablemente el que más ha contribuido al desarrollo de las técnicas cuantitativas aplicadas a la cladística, residente en Suecia), Ward Wheeler (entomólogo, EEUU), James Carpenter (entomólogo, EEUU), Kevin Nixon (botánico, EEUU), Pablo Goloboff (aracnólogo, Argentina), Marc Siddall (malacólogo, EEUU) y Diana Lipscomb (protozoóloga, EEUU). Los sistemáticos seguidores de esta escuela están interesados en proponer clasificaciones filogenéticas, considerando a la filogenia como la principal causa de las similitudes y diferencias entre los organismos. Por lo tanto, si dos especies cercanas comparten varias características similares, es más probable que esto se deba a haberlas heredado de un ancestro común que a haberlas adquirido de manera independiente. Estas adquisiciones independientes idénticas no son otras que las homoplasias de las que hemos estado hablando desde el comienzo del capítulo. La formulación más moderna del método cladístico consiste en buscar aquellos cladogramas que requieran considerar como homoplásticas la menor cantidad posible de similitudes. De esta manera hemos enunciado el famoso “principio de parsimonia” (aproximación epistemológica enunciada hace más de 650 años por William Ockman, “pluralitas non est ponenda sine necessitate”, o “la multiplicidad no debería ser invocada innecesariamente”) e introducido al campo de la inferencia filogenética en los trabajos que publicaron Luca Cavalli-Sforza y Anthony Edwards en 1964 y Joseph Camin y Robert Sokal en 1965. Por medio de este principio, cuando dos más hipótesis existan, aquella que requiera la menor cantidad de supuestos o hipótesis ad-hoc será preferida. Es decir que el principio de parsimonia en realidad actúa como un criterio de optimalidad, ya que permite seleccionar entre varias hipótesis en competencia aquella que satisfaga una cierta condición. En este caso, se preferirán los cladogramas que expliquen la mayor cantidad posible de similitudes por relaciones de ancestralidad común. La consecuencia lógica de la aplicación de este principio es el agrupamiento de organismos en base a sinapomorfías. Una hipótesis filogenética puede explicar por qué todas las aves tienen alas hoy en día: porque descienden de un ancestro común; sin embargo no puede explicar cómo ese ancestro las ha adquirido. Por lo tanto, los cladogramas reflejan un patrón evolutivo, mientras que los filogramas producidos por la taxonomía evolutiva daban cuenta tanto de los patrones como de los procesos evolutivos. Por otra parte, cuando las especies que 17 comparten una característica dada se ubican en dos grupos muy separados (los taxones A y B en la Fig. 12), dicha similitud no podrá atribuirse razonablemente al ancestro común de esos dos grupos (C). La condición ♫ sólo podrá atribuirse al ancestro común C si se considera que tanto C como todas las especies intermedias entre los grupos A y B la tenían también. Pero esto significaría que todas las especies que descienden de los ancestros intermedios y tienen la condición alternativa ♪ habrían adquirido esta condición independientemente (la similitud en la condición ♪ no se debe a ancestralidad común). Por lo tanto, los casos de similitudes no atribuibles a la descendencia de un ancestro común serán más numerosos (7 pasos), y por lo tanto es preferible considerar que lo que no se debe a ancestralidad común son algunas similitudes en la condición ♫ (2 pasos). La última hipótesis de relaciones es la más parsimoniosa, y por ello la preferiremos por sobre la otra hipótesis. ♫ ♫ ♫ ♪ C ♪ ♪ ♪ ♪ C = ♪ 2 pasos C = ♫ 7 pasos Grupo A ♪ ♪ ♫ ♫ Grupo B Figura 12: Hipótesis filogenéticas más y menos parsimoniosa Al aplicar el criterio de parsimonia a la inferencia filogenética, los sistemáticos cladistas consideran que la mejor aproximación a la filogenia real es aquella reconstrucción filogenética que requiera el menor número de cambios evolutivos. Se puede justificar la aplicación de este principio si consideramos que el cambio evolutivo es improbable. Si una especie actual y su ancestro presentan una misma característica, la parsimonia sugerirá que todos los estados intermedios que conectan a la especie en consideración y a su ancestro presentaron esa misma característica. Realmente podría haber ocurrido un número muy grande de cambios entre el ancestro y la especie actual, pero un cambio seguido de una reversión no es tan probable. Cada cambio requiere una mutación en un gen o en un conjunto de ellos, y además esa sustitución se debe fijar en la población por un evento de deriva o de selección. Todo esto es muy improbable. Es mucho más probable que la misma característica haya sido pasada de ancestros a descendientes hasta llegar a la especie actual siguiendo las leyes de la herencia (de hecho, sabemos que esto es muy probable, ya que ocurre cada vez que un padre da origen a una progenie). Si pensamos en los órganos complejos compartidos entre 18 humano y chimpancé, como los ojos, el cerebro o el corazón, es fácil pensar la evolución de inicial de cada una de estas características ha requerido la ocurrencia de una serie de mutaciones, de por sí muy improbables, y la actuación de la selección natural operando durante millones de generaciones. Es casi imposible que los mismos cambios hayan evolucionado independientemente en los dos linajes a partir de la divergencia de su ancestro común. En contraste, no hay nada improbable al postular que esas características podrían haber pasado sin modificación alguna desde el ancestro común al chimpancé y al humano. Este argumento es muy convincente cuando nos referimos a caracteres morfológicos complejos, pero se vuelve menos poderoso cuando consideramos otras fuentes de caracteres, por ejemplo los caracteres moleculares. Pero en algún punto, el cambio evolutivo es muy improbable en todos los caracteres, si lo comparamos con la herencia simple, y el principio de parsimonia encuentra así su justificación en términos evolutivos. En conclusión, es más probable que una característica sea compartida por descendencia común que por evolución convergente. Por lo tanto, para cualquier conjunto de especies, una filogenia que requiera una menor cantidad de cambio evolutivo será más probable que otra que requiera más. Cabe aclarar que el criterio de parsimonia no produce automáticamente la verdadera filogenia del grupo en cuestión. ¡De hecho, nunca llegaremos a conocer la verdadera filogenia de ningún grupo! (recuerde el párrafo citado al comienzo del capítulo…). El criterio de parsimonia no garantiza encontrar una solución correcta, sino que provee la explicación más simple para las observaciones realizadas. Sirvan estas palabras como introducción al análisis cladístico solamente. En el próximo capítulo Ud. podrá profundizar en los fundamentos y las particularidades de esta metodología. Por ahora, veamos brevemente qué fuentes de caracteres pueden ser utilizadas para descubrir las sinapomorfías que delimitarán los grupos dentro de grupos en nuestros estudios. Tradicionalmente las tres escuelas hasta aquí mencionadas han utilizado caracteres morfológicos para agrupar a las especies en consideración. Dentro de esta clase de caracteres también podríamos incluir a los caracteres comportamentales y a los caracteres fisiológicos por ejemplo (¡seguimos clasificando!). Pero existe otra fuente de caracteres, más novedosa: los caracteres provenientes de las macromoléculas biológicas (ADN y proteínas). Los años transcurridos entre los ’60 a los ‘80 fueron testigo del desarrollo explosivo de las técnicas de electroforesis de isoenzimas primero, y de la secuenciación de proteínas y ADN después. La reconstrucción filogenética en base a caracteres moleculares, principalmente los provenientes del ADN, está atravesando un momento de gran popularidad, y provee un camino más hacia la comprensión de la historia de la vida. En los últimos 20 años los análisis filogenéticos basados en caracteres moleculares han revolucionado la clasificación de los organismos y hasta la propia concepción que de nosotros mismos teníamos! Como ejemplo baste saber que el genoma de los eucariotas es en realidad una quimera con respecto a los otros grandes dominios en que se divide la vida en el planeta Tierra: Bacteria y Archaea; o que el parentesco cercano de artrópodos y anélidos postulado en tantos libros de texto de Zoología podría ser espurio, puesto que los artrópodos compartirían un antecesor común más reciente con los nematodes, formando el clado conocido como Ecdysozoa. Por otra parte, la utilidad de los datos morfológicos en la sistemática moderna ha sido puesta en tela de juicio, ya que se estima que fuertes presiones de selección podrían conducir a patrones de evolución convergente. Seguramente se sorprenderá al saber que se ha postulado que la foca comparte su ancestro común más reciente con la nutria y que 19 el lobo marino comparte su ancestro común más reciente con el oso (Fig. 13). El grupo Pinnipedia, por lo tanto, está formado en base a caracteres homoplásticos. Por ello resulta polifilético, y por lo tanto artificial. Figura 13: Grupo Polifilético A partir de estas apreciaciones, algunas autoridades en el campo de la sistemática moderna han sugerido excluir a los caracteres morfológicos de todos los análisis, o al menos de aquellos en los que entran en conflicto con los caracteres moleculares. Pero hay otra corriente de sistemáticos que opinan que la exclusión de datos no constituiría una buena estrategia para solucionar el problema. Más bien pasaríamos a ignorarlo. Numerosos factores pueden crear sesgos tanto en los caracteres moleculares como en los morfológicos. Hay quienes opinan que no se debería hacer generalizaciones sobre una clase entera de caracteres, pues ninguna generalización resultará universalmente cierta. Por lo pronto, lo único que podemos decir hoy sobre la eliminación de los datos morfológicos en la investigación filogenética (al igual que hace casi 150 años en el famoso debate de Oxford) es que “EL TIEMPO LO DIRA”. A propósito de los caracteres moleculares, hay algunas consideraciones a tener en cuenta. Aunque las mutaciones están fijas en el genoma, existe la posibilidad de que, en el curso de la historia, se hayan superpuesto varios cambios en una posición dada, y que hoy no seamos capaces de notarlo. Por ejemplo, si dos especies de moscas de la fruta poseen una A en la posición 23 del gen estudiado, ¿quiere decir que han permanecido así desde la divergencia de su ancestro común? Pues no necesariamente. Puede haber ocurrido la siguiente secuencia de cambios en la especie 1: C → T → G → A, y la siguiente serie de cambios en la especie 2: G → C → T → A. El estado A observado en ambas especies… ¿permaneció así desde la divergencia del ancestro común, o fue adquirido por ambas especies independientemente (homoplasia)? A este tipo de cambio se lo denomina “cambios múltiples” (más conocido en la literatura como “multiple hits”). Los multiple hits pueden enmascarar cambios previos en ese sitio, por lo que pueden acumularse homoplasias, de manera que la estima de la filogenia por máxima parsimonia subestimará la cantidad de cambio. No obstante, este problema puede ser corregido. La corrección puede aplicarse en cualquier técnica que contemple un modelo de evolución. En esta categoría entran las metodologías abordadas en las próximas secciones. 20 METODO DE MAXIMA VEROSIMILITUD El método de Máxima Verosimilitud para la inferencia filogenética fue aplicado por primera vez por Luca Cavalli-Sforza y Anthony Edwards, pero al no utilizar datos de secuencias nucleotídicas, su trabajo pasó desapercibido. Fue Joseph Felsenstein (Universidad de Washington), quien aplicó el análisis de máxima verosimilitud a los datos de secuencias de ADN en la década del ’80, aduciendo que la reconstrucción filogenética debía ser vista como un problema estadístico. Este método se basa en un concepto proveniente del campo de la estadística general elaborado por Ronald Fischer (supervisor de Cavalli-Sforza y Edwards a quien Ud. ya conoció en el capítulo de “Genética de Poblaciones”). El concepto de verosimilitud (“likelihood” en inglés) se refiere a la probabilidad de obtener los datos observados de acuerdo a una hipótesis. La verosimilitud (L) de una hipótesis (H) entonces, para un grupo de datos (D), es proporcional a la probabilidad condicional de observar esos datos (D) dado que la hipótesis (H) es correcta: L = αP(D/H). Supongamos que un amigo nos dice que ha tirado una moneda 50 veces, y que las 50 veces ha salido cara. Probablemente nos sorprenderemos al oír semejante cosa, a menos que nuestro amigo nos revele que la moneda tenía dos caras. Sabiendo esto, ¡nadie se sorprenderá al ver que en las 50 tiradas haya salido cara! Aunque no nos hayamos percatado de ello, hemos utilizado dos modelos diferentes, antes y después de saber que la moneda estaba trucada. El primer modelo suponía que la moneda usada tenía cara y ceca, y que las tiradas eran independientes unas de otras. El segundo modelo suponía que la moneda estaba trucada (dos caras). Bajo el primer modelo, los datos (las 50 caras), son muy improbables. La probabilidad sería, aproximadamente, de uno en un trillón, y estaríamos lógicamente sorprendidos. Bajo el segundo modelo, la probabilidad de los datos es de 1, y no deberíamos sorprendernos en absoluto. El nivel de sorpresa cuando observamos los datos, entonces, está inversamente relacionado con la probabilidad de los datos bajo el modelo considerado. Estos dos modelos son dos puntos a lo largo de un continuo de posibles modelos. Por ejemplo, podríamos tener una moneda con dos cecas, de manera que la probabilidad de obtener una cara sea de 0. O tener una moneda intermedia, de manera que la probabilidad de obtener cara sea de 0.5. De hecho, la variación en el proceso de fabricación de las monedas hace que la probabilidad de obtener cara no siempre sea de 0.5. En general, no nos referimos a este continuo como a una infinidad de distintos modelos, sino a un único modelo con un parámetro p. En la reconstrucción filogenética por máxima verosimilitud basada en modelos de evolución, el modelo incluye toda la información necesaria para calcular la probabilidad de los datos. El método de máxima verosimilitud trabaja esencialmente diciéndonos cuán sorprendidos deberíamos estar de haber obtenido esos datos. La implementación de este método hará que prefiramos el modelo que hace a los datos “menos sorprendentes”. En nuestro caso, los datos serían el conjunto de secuencias nucleotídicas y la hipótesis estaría representada por el árbol (topología y largos de rama) y un modelo de evolución de secuencias. Es decir que para aplicar esta metodología es requisito elegir un modelo probabilístico de evolución molecular de los muchos que han sido propuestos, y que dé cuenta de la transformación de una secuencia en otra, tomando en cuenta parámetros tales como la tasa de sustitución nucleotídica y las frecuencias de los distintos nucleótidos (recuerde el modelo de Jukes-Cantor estudiado en el capítulo “Neutralismo”). Estos modelos pueden contemplar, por ejemplo, problemas como el que crean las sustituciones múltiples (multiple hits). De este modo, se evalúa la 21 probabilidad de que el modelo evolutivo elegido haya generado las secuencias observadas (o sea, la probabilidad de los datos bajo el modelo), teniendo en cuenta el orden de ramificación (topología) y la cantidad de cambio que se haya acumulado en las ramas del árbol (largo de ramas). La filogenia se estimará a partir de los árboles que tengan la mayor verosimilitud. Por lo tanto, al igual que en la escuela cladística, estamos otra vez frente al uso de un criterio de optimalidad. Si tenemos en cuenta que la verosimilitud se evalúa en cada posible topología, comprenderemos que este método es computacionalmente muy intenso. Es importante comprender que la verosimilitud de un árbol se refiere a la probabilidad de los datos dado un árbol. No es correcto pensar a la verosimilitud como a la probabilidad de que un árbol particular sea el correcto, ya que las probabilidades se refieren a las frecuencias relativas de los resultados particulares de un proceso aleatorio. Mientras que un árbol y sus largos de rama asociados pueden ser pensados como el resultado de un proceso aleatorio (la historia pasada y la dirección evolutiva de cualquier grupo es contingente a través de multitudes de eventos estocásticos), estamos muy lejos de ser capaces de describir adecuadamente el proceso estocástico subyacente a la generación de las filogenias en la naturaleza. En cambio, somos capaces de modelar los procesos que producen las secuencias a partir de los árboles. La verosimilitud nos permite elegir entre diferentes árboles en base a las predicciones que esos árboles implican. La topología del árbol de máxima verosimilitud nos hará sorprender menos al inspeccionar nuestras secuencias que cualquier otra topología. Además, es también importante distinguir entre la probabilidad de obtener los datos observados a partir de un modelo de evolución y la probabilidad de que el modelo subyacente sea correcto. El método de Máxima Verosimilitud no dice nada sobre la probabilidad del modelo en sí misma. El filósofo de la biología Elliot Sober lo ejemplifica de la siguiente manera: supongamos que escuchamos un ruido muy fuerte en un cuarto del piso de arriba. Podríamos sugerir que el ruido es causado por gremlins jugando a los bolos. Dada esta hipótesis, nuestra observación (el ruido en el cuarto de arriba) tiene una alta verosimilitud; si los gremlins estuvieran jugando a los bolos sobre nosotros, ¡con seguridad que los oiríamos! Sin embargo, la probabilidad de que nuestra hipótesis sea cierta (o sea, que los gremlins produzcan el ruido, en lugar de cualquier otra causa) es otra cosa; ¿cuán probable es que encontremos gremlins en nuestra casa? Ciertamente que esta probabilidad es escasa. Así, en este caso, nuestra hipótesis confiere una alta verosimilitud a los datos, pero es altamente improbable. Los métodos de máxima verosimilitud producirán buenas estimaciones de la filogenia toda vez que los modelos evolutivos sean los “correctos”. Pero si los modelos asumidos no se corresponden con la realidad, las estimaciones producidas por máxima verosimilitud serán poco fiables. La selección del modelo evolutivo es entonces un paso crítico. Hasta el año 2000, la elección del modelo adecuado constituyó el talón de Aquiles de esta metodología. El desarrollo de un algoritmo para seleccionar el modelo más adecuado para nuestras secuencias evita la elección subjetiva del modelo, problema que pasa a resolverse de un modo estadístico, aunque algunos problemas han sido detectados. Veamos ahora algunos problemas que pueden llevarnos a estimas filogenéticas espurias… Bajo ciertas condiciones, el criterio de máxima parsimonia llevará a error. El caso más conocido es el propuesto por Joe Felsenstein en 1978. Supongamos tres especies A-C y el árbol de la Fig. 14a. Supongamos además que cada uno de los caracteres observados puede tener un número limitado de estados posibles (por ejemplo A, C, G y T), que existe un número no muy grande de caracteres, y que la probabilidad 22 de cambio para todos los caracteres es igual a lo largo de una rama del árbol de la Fig. 14a. Supongamos además que la probabilidad de cambio en las ramas que dan a A y B es muy alta (y la misma para cada carácter), mientras que en la rama interna del árbol y en la rama que da a C, es muy baja (observe las ramas). En estas condiciones, es muy probable que haya más caracteres compartidos por A y B que por B y C, con lo que el análisis de parsimonia produciría la genealogía equivocada de la Fig. 14b. Las ramas que dan a A y B se dice que son muy “largas” (i.e. tienen una gran probabilidad de cambio), y entonces se ha invocado este modelo, conocido como “atracción de ramas largas” para indicar que, bajo el criterio de parsimonia, las ramas largas se “atraen” (i.e. aparecen juntas cuando deberían ir separadas). Debido a la gran probabilidad de cambio de las ramas largas, y a la escasa cantidad de estados (A, C, G y T), muchos de los cambios pueden coincidir por azar, es decir que la G en la posición mucleotídica 15 de la secuencia correspondiente a A se corresponde con otra G en la posición mucleotídica 15 de la secuencia correspondiente a B; la C en la posición mucleotídica 27 de la secuencia correspondiente a A se corresponde con otra C en la posición mucleotídica 27 de la secuencia correspondiente a B, y así sucesivamente. Pero estos cambios, que en realidad serían homoplasias, serán cuantificados como sinapomorfías por el criterio de máxima parsimonia, dando lugar a una filogenia espuria. Considerando que el criterio de máxima parsimonia produce hipótesis filogenéticas que minimizan la cantidad de cambio evolutivo requerido para explicar los datos, y que el criterio de máxima verosimilitud intenta estimar la cantidad real de cambio evolutivo de acuerdo a un modelo de evolución de secuencias, será fácil entender porqué la atracción de ramas largas significa un problema para el primer método (a propósito…¿qué tipo de árbol representa la reconstrucción filogenética para esta escuela? ). Los métodos de máxima verosimilitud presuponen que para estudiar evolución, uno debe primero saber en detalle como opera la evolución. Los seguidores de la cladística sugieren que el camino debería ser el inverso: el conocimiento que uno pueda tener sobre los mecanismos de evolución, deberá basarse en nuestros conocimientos de filogenia, y estos, por lo tanto no deberán presuponer un mecanismo evolutivo dado, siempre que sea evitable, sino que deben estar basados solamente en observaciones que puedan efectivamente hacerse en el presente. No obstante, hay quienes consideran que también existe un modelo subyacente al implementar el criterio de máxima parsimonia. El método de máxima verosimilitud representa, en cierta forma, un enfoque filosófico distinto de la reconstrucción filogenética. La controversia principal entre los seguidores de ambas escuelas no está resuelta en forma definitiva. METODO BAYESIANO Esta es la más reciente de las metodologías propuestas para la reconstrucción filogenética. Esta variante del método de Máxima Verosimilitud también requiere postular un modelo de evolución, pero en lugar de buscar un árbol con la mayor probabilidad de observar los datos, produce el mejor conjunto de árboles, dados los datos y el modelo evolutivo especificado. Por lo tanto, este método postula la probabilidad de que la hipótesis evolutiva sea correcta dados los datos de secuencias (P(H/D)). El teorema enunciado por Thomas Bayes (1702-1761) nos posibilita calcular la probabilidad de un modelo (o sea, la topología del árbol y el largo de cada rama) a partir de los resultados que se han producido (las secuencias). 23 Los principales investigadores que han impulsado el desarrollo de esta metodología son Frederik Ronquist (Suecia), John Huelsenbeck (USA), y Bruce Rannala (USA). A B C B A C L = 22 pasos L = 14 pasos Figura 14a: Filogenia hipotética de tres especies que difieren en la probabilidad de cambio Figura 14b: Filogenia espuria producto de la “atracción de las ramas largas” METODOS DE DISTANCIA Hasta ahora hemos conocido técnicas para la reconstrucción filogenética en base a caracteres “discretos”, o sea que las posiciones nucleotídicas son tomadas como tales durante el análisis. Pero también es posible, a partir de un grupo de secuencias, calcular las distancias evolutivas entre ellas. Si se conoce la distancia evolutiva entre las especies en estudio (representadas por las secuencias de un cierto gen), se puede reconstruir la historia evolutiva de las mismas. Esta familia de métodos se basa en la idea de aproximar un árbol a la matriz de distancias calculadas entre pares de especies (“distancias pareadas”) que en general son corregidas de acuerdo a algún modelo de evolución (los mismos que se utilizan en los métodos vistos más arriba). Estas distancias corregidas son estimas de las distancias evolutivas, que reflejan el número medio real de cambios por sitio que ha ocurrido entre un par de secuencias desde la divergencia de su ancestro común. La mejor manera de interpretar las distancias es considerarlas como estimas de la longitud de las ramas que separan a un par de especies dadas. Entre los investigadores que se han dedicado a desarrollar este tipo de aproximaciones figuran los japoneses Masatoshi Nei, Fujio Tajima y Naruya Saitou, entre otros, y los americanos Walter Fitch y Emanuel Margoliash. Existen varios algoritmos para computar árboles de distancia, basados o no en criterios de optimalidad. Podemos citar los métodos de cluster, dentro de los cuales podemos citar el algoritmo de UPGMA, el método de Neighbor Joining, conceptualmente relacionado al anterior, el método de Mínima Evolución y el método de Mínimos Cuadrados de Fitch y Margoliash (estos dos últimos aplican un criterio de optimalidad, en pocas palabras, cambio mínimo). Esta familia de métodos posee una gran desventaja respecto a los ya vistos: al transformar las sustituciones nucleotídicas en distancias se pierde información. Varios sets de secuencias pueden dar una misma matriz de distancias, pero a partir de estas matrices, no es posible recuperar los sets de datos originales. Claramente, los métodos de distancia son aproximaciones menos deseables que las otras, aunque son muy rápidos. 24 CONSIDERACIONES FINALES Dado que no somos capaces de observar ningún evento histórico directamente, debemos hacer inferencias a partir de la evidencia circunstancial, a menudo incompleta (secuencias que obtenemos hoy en día), para comprender la historia evolutiva de un grupo de organismos. O sea que, a pesar de la naturaleza determinística de los algoritmos estudiados, estos no hacen más que proveernos de una serie de reglas para llegar a una estima de la filogenia, que puede o no coincidir con la verdadera. La calidad de la estima de la filogenia dependerá de la calidad de los supuestos que se hicieron para arribar a ella. ¡Es imposible hacer estima alguna sin hacer supuestos!! Por lo tanto, como los biólogos evolutivos y los sistemáticos infieren eventos históricos pasados, no tienen manera de determinar con certeza la efectividad de ningún criterio (ya sea máxima parsimonia, máxima verosimilitud o cualquier otro) para recuperar la filogenia verdadera. De hecho, NUNCA se recuperará. ¿O es que se puede viajar en el tiempo? Por lo tanto, la elección de un criterio por sobre otro es, en el fondo, una decisión filosófica. APLICACIONES DE LAS TECNICAS DE RECONSTRUCCION FILOGENETICA A OTROS PROBLEMAS DE LA BIOLOGIA La revolución en la tecnología de la secuenciación de genes y los avances en el campo de la teoría de la reconstrucción filogenética están resultando en la producción de filogenias o genealogías de genes cada vez más agudas. Estas pueden ser utilizadas para entender procesos biológicos que ocurren en niveles muy diferentes de la jerarquía biológica. La genética, el desarrollo, el comportamiento, la epidemiología, la ecología, la biología de la conservación y el estudio de las adaptaciones son sólo algunos de los campos que se nutren de esta información para responder algunos de sus muchos interrogantes. La teoría coalescente (sucintamente, todos los alelos de un gen de herencia uniparental, como los genes mitocondriales, los cloroplásticos o los del cromosoma Y, en una generación “coalescen” hacia un único ancestro común) se aplica con frecuencia en el campo de la genética de poblaciones, más específicamente en la disciplina conocida como “filogeografía”, fundada por John C. Avise en la pasada década del ‘80. La filogeografía es el estudio de los procesos que gobiernan la distribución geográfica de los linajes de genes, y algunas de sus aplicaciones son el descubrimiento de especies crípticas, es estudio de la dispersión de las plagas y los vectores de enfermedades, la búsqueda de enemigos naturales para las plagas introducidas, etc. La estimación de cladogramas intraespecíficos también permite detectar asociaciones significativas entre el fenotipo y el genotipo, contribución importante en el campo de la epidemiología humana; la conservación biológica también se ve enriquecida a través de este tipo de estudios al ser aplicados al análisis de los ecosistemas y los paisajes. Además, en el estudio de la teoría de la especiación este tipo de análisis se puede aplicar al estudio de la interfase micro-macroevolutiva en la definición de la especie y al análisis del proceso de especiación. 25 La justicia muchas veces ha recurrido al análisis filogenético para ayudar a aportar evidencia en casos de contagio de enfermedades tales como el SIDA. Famoso es el caso del “clado dental”, en el estado de Florida (EEUU). La macroevolución no es ajena a la reconstrucción filogenética para el contraste de muchas de sus hipótesis. El análisis de árboles reconciliados (análisis cofilogenético o de comparación de filogenias) contemplando eventos tales como la coespeciación y la transferencia horizontal entre otros, permite evidenciar la ocurrencia o no de coevolución entre dos clados de hospedadores y parásitos (u hospedadores y mutualistas). La biogeografía histórica utiliza aproximaciones similares a las aplicadas en los estudios de coevolución para explicar la distribución de grupos de organismos, dado que procesos diferentes producen idénticos patrones en los organismos bajo estudio (la vicarianza sería similar a la coespeciación y la dispersión a la transferencia horizontal). Las adaptaciones de los organismos pueden ser analizadas a través de correlaciones (por ejemplo, el estudio de la correlación entre la tasa metabólica y el tamaño corporal en n grupo de mamíferos). Un supuesto muy importante de esta prueba estadística es la independencia de los datos, pero las relaciones genealógicas entre las especies estudiadas pueden oscurecer el estudio, dado que el parentesco filogenético viola el supuesto de independencia. Es pertinente aplicar una metodología que permita “corregir” el efecto que la descendencia común a partir de un ancestro pueda tener en nuestras conclusiones. Para ello se puede recurrir al “método comparado”, que no es otra cosa que el estudio comparado de los fenotipos a través de distintos rangos taxonómicos. Existen distintas aproximaciones, dependiendo del tipo de caracteres en estudio (discretos o cuantitativos), formuladas por Mark Ridley (USA), Jonathan Coddington (USA), Joe Felsenstein (USA), y James Cheverud (USA), entre otros. Al considerar la historia en nuestro análisis, los datos se vuelven independientes. Si aún está interesado en los campos de aplicación de la reconstrucción de filogenias más allá de la sistemática puede consultar el libro “New uses for new phylogenies” (editado por Harvey PH, Leigh Brown AJ, Maynard Smith J y Nee S, Oxford University Press, 1996). 26