1 Implicaciones científico-tecnológicas de la bioinformática y sus aplicaciones Introducción No cabe duda de que el tratamiento de la información por medio de herramientas computacionales facilita el análisis e interpretación de los resultados de los estudios que las han utilizado. En este sentido, la frase del doctor Morales es acertada: “La más inocente mirada a los datos puede inspirar una hipótesis” (Sánchez & Martínez, 2018). De lo anterior, se destaca la abrumadora cantidad de datos que existen en la red y en las bases de datos, lo cual implica que diciplinas como la bioinformática deban manejar el conocimiento de manera multidisciplinar para el beneficio de la sociedad. El tema principal de este ensayo es justamente la informática biomolecular, cuya definición general se establece a continuación: “La bioinformática es la ciencia que utiliza una combinación de las tecnologías de la computación, las ciencias de la información y el conocimiento biológico, para coleccionar, almacenar, analizar, relacionar y modelar datos biológicos.” (Carmen et al., 2003). De donde resulta interesante que, la invención tecnológica para el manejo de la información genética (biochips, bases de datos genómicas, sistemas de minería de datos, técnicas de cuantificación de la expresión génica) están a la vanguardia en el área de investigación biomédica. En consecuencia, se plantean las siguientes preguntas al respecto: ¿cuáles son los antecedentes de la bioinformática?, ¿qué escuelas han surgido con el tiempo?, ¿cómo se ha desarrollado la ciencia a partir de ella? y ¿cuáles son sus aplicaciones? La cuestión radica en la utilidad de los datos transformados en conocimiento por los científicos. Por ello, en este documento se describen brevemente los antecedentes históricos más relevantes; la aportación de Dayhoff en 1925 y el impacto del Proyecto del Genoma Humano. Además, se presentan las escuelas que engloban los métodos matemáticos, estadísticos y computacionales para solucionar problemas biológicos usando ADN, ARN e información relacionada. Al final, se hace una recapitulación de las principales aplicaciones de la bioinformática y cuáles es su utilidad en el ámbito biomédico. Con esta confluencia se pretende informar acerca de uno de los campos más útiles en el análisis y la interpretación de diversos tipos de datos, incluyendo secuencias de nucleótidos y aminoácidos, dominios de proteínas y estructura de proteínas. A continuación, se resumen los inicios de la bioinformática y cómo ha llegado a desarrollarse la ciencia sobre lo mencionado anteriormente. 2 Desarrollo En primer lugar, conforme a Lahoz (2004), Margaret Oakley Dayhoff (1925-1983) fue una investigadora en Bioquímica y profesora originaria de Filadelfia (Estados Unidos), quien destacaría por la creación de las bases de datos donde quedó almacenada la información contenida, específicamente, de dos tipos de moléculas que son los pilares básicos de la vida: el ADN y las proteínas. Dicha contribución a la ciencia establecería las bases de lo que a mediados de los años 80 se empieza a conocer como bioinformática. En segundo lugar, de acuerdo con Coltell et al. (2008), con la comprobación de que el ADN era la molécula que contenía la información genética, después del establecimiento en 1953 de la estructura del ADN, y el subsecuente establecimiento del código genético, se solidificaron las bases para el desarrollo de la era genómica, caracterizada por: técnicas de manipulación del ADN, por el estudio estructural y funcional de los genes, el análisis comparativo de genomas, la variabilidad genética, así como la estructura de las proteínas. Uno de los avances más importantes en relación con el punto anterior fue la finalización en el año 2000 y publicación en el 2003 de los resultados del Proyecto Genoma Humano (PGH), luego de 13 años de desarrollo. Desde el principio, la informática ha sido fundamental para el desarrollo del proyecto, incluso, se señala lo siguiente: El PGH no tuvo como único objetivo identificar los genes del ADN humano sino también obtener la secuencia de sus bases. Este proyecto conllevo la generación de bases de datos, a la mejora de los instrumentos de análisis de datos genómicos, así como la transferencia de tecnologías relacionadas y el abordaje de las cuestiones éticas, legales y sociales derivadas del proyecto. (Sánchez & Martínez, 2018; Coltell et al., 2008) Como se afirma en el párrafo anterior, secuenciar el genoma humano fue posible mediante la automatización y la computación. Está claro cómo este proyecto impulsó el desarrollo de la informática biomolecular; “el PGH también mostró las secuencias tanto de intrones como de exones, lo que ha permitido hacer uso de todos los recursos existentes y desarrollar herramientas bioinformáticas para reconocer patrones, simulaciones, minería de datos y plataformas especializadas, entre otros” (Sánchez & Martínez, 2018). No obstante, se observa la falta de un consenso general entre los profesionales de la bioinformática sobre cuáles son los objetivos y el ámbito de aplicación de esta diciplina. A continuación, se describen las tres principales escuelas o enfoques que consolidan el conocimiento en tendencias tecnológicas diversas. 3 Primero, Lahoz (2004) explica que, la escuela formal se caracteriza principalmente por la búsqueda de una nueva metodología, especialmente en lo referente al concepto de simulación y a la búsqueda de una nueva síntesis entre la biología y otras diciplinas. Bajo esta síntesis convergen líneas de investigación como los algoritmos genéticos (Goldberg, 1989), la teoría de autómatas celulares (Wolfram, 1986), los sistemas de Lindenmayer (Prusinkiewicz y Lindenmayer, 1990), las redes neuronales artificiales (Freeman y Skapura, 1993) o el estudio y diseño de robots y agentes autónomos (Maes, 1994) con los que poner a prueba en el mundo real algunos modelos sobre adaptación biológica y aprendizaje simulados con éxito computacionalmente. Por lo tanto, este enfoque sintético se basa en los siguientes principios básicos: el concepto de la propiedad emergente, la modelización de los sistemas biológicos, el concepto del comportamiento global del sistema a partir de las reglas de la unidad interactiva y la utilización de una estrategia de modelización de abajo hacia arriba. Después, la escuela estructural es la que define la bioinformática como: “la aplicación de los sistemas computacionales en la recogida, almacenamiento y análisis de la información biológica” (Sobral, 1997, como se citó en Lahoz, 2004). De acuerdo con Lahoz (2004), el término información biológica hace referencia a las secuencias de proteínas y ácidos nucleicos (ADN y ARN). Dentro de este enfoque, algunos profesionales dedicados, exclusivamente, al estudio de las secuencias de ADN sustituyen el término bioinformática por genómica, de manera que su labor se reduce al análisis, con la ayuda de software especializado, de las secuencias de bases o nucleótidos que constituyen el genoma de los seres vivos. Por consiguiente, la genómica es una rama o especialidad de la bioinformática, así como la proteómica, de manera análoga, resulta de aplicar los sistemas computacionales al estudio del conjunto de proteínas presente en los seres vivos (proteoma) y que caracterizan su funcionamiento. En este sentido, una vez concluidas en el Proyecto Genoma Humano la fase de secuenciación, es decir, la identificación de las bases o nucleótidos del genoma, y la fase de ensamblaje o unión de los fragmentos secuenciados procedentes de los cromosomas en su orden original, la bioinformática se encuentra en la fase de anotación, la cual consiste en completar el estudio del genoma humano identificando en la secuencia dónde están los genes y cuál es su función. Esto conduce a la genómica a una etapa conocida como postgenómica, lo cual corrobora lo mencionado por Gershon (1997, como se citó en Lahoz, 2004). 4 En un contexto en el que el PGH hace de la genómica la especialidad de la bioinformática con mayor impacto tanto científico como social, la proteómica mantiene como problema central de estudio el relativo a la predicción de la estructura tridimensional en las proteínas, también conocido como problema del plegamiento. El problema cosiste en predecir, aplicando métodos computacionales, cómo se plegará una proteína conocida su secuencia de aminoácidos. Su importancia es tal porque la función biológica de una proteína depende de su estructura tridimensional, lo cual corrobora lo mencionado por Lahoz (2004). Según Lahoz (2004), los problemas más característicos estudiados por la genómica y la proteómica son: la búsqueda de patrones en proteínas y ADN, la predicción de la estructura tridimensional de las proteínas y el almacenamiento y búsqueda de las secuencias de proteínas y ácido nucleicos en bases de datos. Por último, la escuela instrumental enfoca a la bioinformática como: “la aplicación de los ordenadores a la gestión de información biológica” (Robbins, 1996, como se citó en Lahoz, 2004). Por ende, el término información biológica tiene un propósito general en comparación con el ámbito de la escuela estructural. Las investigaciones parten de la terminología científica propia de cualquiera de las especialidades de la biología, por ejemplo, vocablos como especie, clon, ecosistema, entre otros. Los problemas más característicos estudiados dentro de esta escuela son todos aquellos relacionados con la infraestructura que soporta la información. Algunas cuestiones de interés al respecto tratan sobre: la organización coherente de los datos, la sintaxis común (lenguaje HTML, por ejemplo), el diseño de portales que faciliten la búsqueda de información relacionada, y la interdependencia y conectividad de los sistemas computacionales. Prosiguiendo con el análisis, los avances que se han producido en el conocimiento del genoma humano han tenido y van a tener en los próximos años un gran impacto tanto en biomedicina, como en las ciencias de la computación, sobre todo en el ámbito de la informática aplicada a la integración de la información genómica en la investigación epidemiológica tradicional, lo cual corrobora lo mencionado por Coltell et al. (2008). A lo largo de este texto se han expuesto diversas aplicaciones de la bioinformática. Ahora bien, de acuerdo con Coltell et al. (2008), a raíz de los nuevos enfoques derivados de la genómica y la postgenómica, resultará difícil concebir la investigación y práctica de la medicina si no es integrando la información genética, proteómica y otras disciplinas relacionadas, bajo el sufijo común de ómicas, con los datos clínicos. 5 Se espera una considerable repercusión de la aplicación de la informática en la investigación, así como su aplicación en el campo de la medicina. Se demanda, por tanto, cada día más, programas diseñados específicamente para integrar los resultados de distintas procedencias (secuenciación del ADN, genotipado, microarrays, bases de datos hospitalarias, entre otros). Coltell et al. (2008) mencionan que, las principales aplicaciones de la bioinformática son la gestión, la simulación, la minería de datos y el análisis de la información generada en el PGH, con aplicación también en la predicción de estructuras proteicas, estudios de secuencias y otras actividades derivadas de la investigación en biología. El término simulación hace referencia a la experimentación con un modelo a partir de una hipótesis de trabajo, para comprender la estructura íntima del sistema o realizar una predicción. Por minería de datos se entiende el conjunto de técnicas para la inducción de conocimiento útil a partir de masas ingentes de datos. Por otro lado, según Kanehisa y Bork (2003, como se citó en Sánchez & Martínez, 2018), una aplicación más de la bioinformática es la posibilidad de predecir el comportamiento de sistemas de gran complejidad, como las redes de interacción de proteínas en los procesos celulares y la determinación del fenotipo de los organismos. Con esta información se espera entender de manera integral todos los sistemas biológicos. En relación con la proteómica previamente mencionada, conforme a Sánchez & Martínez, 2018), la bioinformática ha contribuido a la detección de modificaciones sutiles en los patrones de expresión y a la obtención de nuevos biomarcadores. Asimismo, la bioinformática ha coadyuvado identificar blancos terapéuticos, lo que ha conducido al diseño de nuevos ensayos clínicos usando nuevas estrategias terapéuticas. Finalmente, según Kanehisa (2003, como se citó en Coltell et al., 2008), el avance que ha supuesto la bioinformática en el desarrollo de la genética y de las ciencias de la salud ha dado lugar a la posibilidad del estudio de la secuencia y estructura de proteínas, de genes (mutaciones, polimorfismos, comparación de secuencias, etc.), y al desarrollo de microarrays y de la espectrometría de masas. Estas dos últimas se aplican, respectivamente, para el análisis sistemático de la expresión de genes y la detección de la interacción entre proteínas. Toda esta información, accesible en Internet, ha transformado las bases de datos y su modo de acceso, y debería permitir a los bioinformáticos clínicos aplicarla en la práctica médica, a través de un enfoque nuevo en el tratamiento de enfermedades en lo que se denomina medicina individualizada, lo que corrobora lo mencionado por Maoio y Musen (2003, 2002, como se citaron en Coltell et al., 2008). 6 Conclusiones No cabe duda del gran beneficio que las ciencias de la salud y biológicas han obtenido con el desarrollo de la bioinformática y su aplicación en el conocimiento acerca del genoma humano. Así pues, en la atención a la salud se prevé que el uso de la tecnología de microarrays sea de gran utilidad al momento de resolver los problemas relacionados con el análisis estadístico e interpretación de los resultados, así como la subsecuente incorporación metodológica de estos resultados en la historia clínica. También, con respecto a la proteómica, se plantea el reto de utilizar enormes conjuntos de datos de origen heterogéneo y reforzar la generación de conocimiento, mediante el desarrollo y aplicación de grandes plataformas bioinformáticas que asumen las funciones de sistemas de gestión de datos y bases de datos de conocimiento. En la farmacología, la bioinformática clínica ha sido importante para identificar dianas terapéuticas, diseñar ensayos clínicos y desarrollar biomarcadores. Si bien parece que ésta sea una estrategia a largo plazo, la bioinformática clínica ha sido y será muy importante para el área biomédica. Entre otras áreas, se ha aplicado ya en la detección temprana y tratamiento de enfermedades oncológicas, así como en la identificación y reducción de riesgos y prevención de estas enfermedades. Esto ha sido posible gracias a que en la investigación se ha podido integrar la información obtenida a partir de la búsqueda en bases de datos en línea de secuencias genéticas, de proteínas, mutaciones, referencias bibliográficas y redes de regulación génica y rutas metabólicas, lo cual corrobora lo mencionado por Coltell et al. (2008). Entender el alcance de la bioinformática se consigue leyendo los numerosos artículos que se tienen al respecto, ya que en la mayoría de ellos se describen predicciones y futuras aportaciones. Si se quiere profundizar más en el tema, es recomendable buscar fuentes de información relacionadas con el modelado electrónico y atómico de proteínas, genómica computacional, bioinformática estructural, biología de sistemas, entre otros. El reto para las futuras líneas de investigación será integrar los resultados genómicos con otra clase de información, por ejemplo, genes para combatir el cambio climático (interacción genambiente) y estimular probabilidades de aplicar la bioinformática clínica a la medicina personalizada. 7 Referencias Báez Pérez, E., Alemán Lage, M., Fernández Morín, J., & Morales Rigau, J. (2003). Bioinformática: Algunos retos filosóficos, sociales, éticos y jurídicos. Revista med electrón, 25(2). Recuperado el 11 de mayo de 2020, de http://www.revmatanzas.sld.cu/revista%20medica/ano%202003/vol2%202003/revmed%2 02003%20vol2.htm Coltell, Ó., Arregui, M., Fabregat, A., & Portolés, O. (mayo de 2008). La bioinformática en la práctica médica: Integración de datos biológicos y clínicos. Revista Médica de Chile, 136(5), 645-652. doi:10.4067/S0034-98872008000500015 Lahoz-Beltrá, R. (2004). Bioinformática: simulación, vida artificial e inteligencia artificial. Madrid: Díaz de Santos. Recuperado el 11 de mayo de 2020, de https://books.google.com.mx/books?id=U4pwetEPmpQC&printsec=frontcover&dq=bioin form%C3%A1tica&hl=en&sa=X&ved=0ahUKEwi3uP6ArLLpAhUSLa0KHeloD_QQ6A EIKzAA#v=onepage&q&f=true Sánchez Mendiola, M., & Martínez Franco, A. (2018). Informática Biomédica (3 ed.). Ciudad de México: Elsevier. ISBN:978-607-30-0275-2