ASIGNATURA: BIO-INFORMÁTICA COMPUTACIÓON CELULAR APLICACIONES DE LA BIO-TECNOLOGIA EN INFORMÁTICA POR: Fº JAVIER CONEJERO BAÑÓN 1 INDICE: Introducción ...................................................................................................... 3 Definiciones ...................................................................................................... 4 Bio-tecnología ................................................................................... 4 Bio-computación ............................................................................... 4 Historia ............................................................................................................. 5 Computación celular ......................................................................................... 6 Aplicaciones futuras .......................................................................... 7 Desarrollo de computadores ADN a nanoescala .............................................. 9 Tipos de manipulaciones ................................................................... 9 Unidades de computación primarias ................................................. 9 Adleman ............................................................................. 9 Rothemund-Shapiro ............................................................ 10 Tiling .................................................................................. 10 Ribozyme ............................................................................ 11 Paun .................................................................................... 11 Un evaluador lógico universal (que opera en células de mamíferos) ............... 12 1ª aproximación ................................................................................. 12 2ª aproximación ................................................................................. 13 Conclusión ......................................................................................... 17 Paralelismo con las FPGAs .............................................................................. 19 Historia .............................................................................................. 19 Arquitectura ....................................................................................... 19 Imágenes y esquemas ........................................................................ 20 La Bio-tecnología en España ............................................................................ 21 Conclusión ........................................................................................................ 22 Glosario ............................................................................................................ 22 Bibliografía ....................................................................................................... 23 2 INTRODUCCIÓN Este trabajo trata sobre la Bio-Informática y la implicación de la informática en éste área de la ciencia. Como punto fuerte de este trabajo, tratará sobre cómo es posible construir un evaluador lógico universal utilizando como elemento básico células de mamíferos, más concretamente, células humanas. Este tema es realmente novedoso y actual, puesto que ha sido recientemente expuesto a la sociedad y está en estos momentos en investigación y desarrollo. Los avances de esta investigación abren muchas puertas a nuevos tratamientos para la detección y cura de enfermedades. Aunque la bio-informática es una materia interdisciplinar, es decir, tiene muchas ramas de conocimiento implicadas, como son: - Microbiología - Bioquímica - Genética - Biología celular - Química - Ingeniería (bio)química - Ingeniería mecánica - Ciencia y tecnología de alimentos - Electrónica - Informática El avance de la biotecnología dependerá cada vez más de la colaboración de estas disciplinas, y en el uso de lenguajes y paradigmas comunes, así como en que cada tipo de especialista comprenda los logros y limitaciones de las demás ramas biotecnológicas. 3 DEFINICIONES BIO-TECNOLOGIA La biotecnología se refiere a cualquier aplicación tecnológica que utilice sistemas biológicos y organismos vivos o sus derivados para la creación o modificación de productos o procesos para uso específico. Convention on Biological Diversity (Article 2. Use of Terms)." United Nations. 1992. Otra definición es: "La utilización de organismos vivos, o partes de los mismos, para obtener o modificar productos, mejorar plantas o animales o desarrollar microorganismos para objetivos específicos". Fuente: Sociedad Española de Biotecnología. BIO-COMPUTACIÓN Área de la Bio-Informática, que incluye el desarrollo y utilización de sistemas computacionales basados en modelos y materiales biológicos (biochips, biosensores, computación basada en ADN, entre otros). Las computadoras basadas en DNA (computadores ADN) se están empleando para la secuenciación masiva y la detección de diversas enfermedades, a partir de la explotación del procesamiento paralelo implícito. Dentro de la Bio-Computación en la Bio-Informática se encuentran 2 áreas: El desarrollo e implementación de herramientas que permitan el acceso, uso y manejo de varios tipos de información. La creación de nuevos algoritmos (fórmulas matemáticas) y estadísticos con los que se pueden relacionar partes de un conjunto enorme de datos como, por ejemplo, métodos para localizar un gen dentro de una secuencia, predecir la estructura o función de distintas proteínas y agrupar secuencias de proteínas en familias relacionadas. 4 HISTORIA La computación celular es un campo con una reciente aparición. Pero es importante citar que no se habría sido capaz de llegar a ella sin investigaciones previas en bio-tecnología. La historia de la computación celular comienza en 1994 y los hitos más importantes que se han producido hasta ahora son: 1. 1994 – Leonard Aldeman inventa un computador ADN capaz de resolver problemas matemáticos básicos. 2. 2003 – Ehud Shapiro desarrolla un proceso por el cual las enzimas Fork-I y Ligasa cortan ADN en diferentes longitudes basado en la presencia de diferentes sustancias químicas. 3. 2007 – Yaakov Benenson y su equipo de trabajo desarrollan un sistema para construir evaluadores lógicos basados en RNAi universales que operan en células de mamíferos. Y las expectativas de futuro de este ámbito son: 4. ~2010-2016 – Avances en sensores invasivos, implantables, eficientes y miniaturizados para monitorizar constantes vitales y la salud. 5. ~2020 – Red de información inalámbrica móvil de 4ª Generación ubicua permitirá a los computadores a transferir información inalámbricamente a los servicios de emergencia y hospitales. 6. ~2021 – Métodos de detección temprana de mRNA (RNA mensajero) asociado al cáncer permitirán una aplicación más efectiva de técnicas de tratamiento del cáncer. 7. ~2027 – Desarrollo de un dispositivo de extracción de ADN celular automático y mecanizado. 8. ~2029 – Miniaturización y perfeccionamiento de computadores con suficiente capacidad de procesamiento para decodificar y procesar cadenas de ADN. 9. ~2031 – Biocomputadores ADN. Gráficamente: 5 COMPUTACIÓN CELULAR La computación con ADN nació en 1994 cuando Leonard M. Aldeman, científico de computadores de la Universidad de California manipuló ADN para resolver un problema matemático. Se avanzó en este campo en 2001 por parte de Ehud Shapiro del Instituto Weizmann de Israel, cuando fue capaz de utilizar moléculas de ADN como nanocomputadores biomoleculares de manera rudimentaria, para diagnosticar cánceres. Fundamentalmente, la computación con ADN pone de manifiesto que las células humanas y los computadores tienen la capacidad de almacenar y procesar la información de manera similar. Los computadores almacenan la información en series de unos y ceros, y el ADN lo hace en función de la colocación de sus bases (adenina, guanina, timina y citosina). Como se observa en la siguiente imagen: Una de las razones más importantes por la que los computadores ADN son los computadores internos más exitosos es por las capacidades tan avanzadas del ADN. El ADN puede replicarse extremadamente rápido y eficientemente, dándole a los biocomputadores gran capacidad para transferir grandes cantidades de datos y también una capacidad inmensa de memoria, aproximadamente 100 veces mayor que los computadores de hace dos décadas. Además, estos enormes almacenes de información se contienen en un volumen muy pequeño, donde una cucharada puede contener 15 mil trillones de computadoras. Finalmente, los computadores ADN tienen una magnifica habilidad para procesar varios cálculos paralelamente, casi 109 cálculos por mL de ADN 6 por segundo, de una manera altamente eficiente energéticamente, más de un millón de veces más eficiente que los computadores de antaño. APLICACIÓNES FUTURAS Esta es la aplicación que se espera dar a los bio-computadores dentro de unos años, siguiendo el grafico anterior de la historia de la biocomputación, y es un ejemplo de una de las motivaciones que llevan a los investigadores a desarrollar este campo. La función más común de los nanocomputadores es la de monitorizar varias funciones del cuerpo humano, como el ritmo cardiaco (normalmente hecho a través de electrodos en el corazón), la presión sanguínea (normalmente con la incorporación de un sensor de presión arterial), el nivel de azúcar en sangre y la temperatura corporal. En un futuro se espera que, los avances en tecnología de biocomputadores añadirán capacidad para hacer seguimiento de la composición sanguínea, midiendo el número de células sanguíneas y otras células, y los niveles de oxigeno y carbón de manera similar. El nanocomputador ADN también se espera que sea capaz de hacer un seguimiento del deterioro de órganos y la extensión del cáncer, ambos a través de la monitorización de células y la presencia de cepas relacionadas con el cáncer en el mRNA (ARN mensajero) de la zona. Todas estas condiciones deben ser reguladas para garantizar una vida sana, y deben ser especialmente monitorizados en enfermos y ancianos. Actualmente los diabéticos deben testearse ellos mismos de vez en cuando para comprobar el nivel de azúcar en sangre. Los biocomputadores no solo aumentaran la precisión de los procedimientos de testeo, sino que también seguirán los niveles de glucosa continuamente, sin la dificultad de una aguja. Al igual que los sensores recogen información en el cuerpo, ellos la transfieren en el cuerpo de un computador ADN, localizado en el pecho, donde diagnostica cualquier irregularidad corporal. Gracias a la capacidad de memoria de los computadores ADN, una base de datos de enfermedades y cuestiones de salud puede ser almacenada en menos espacio que una gota de agua. Esta capacidad de memoria, más de 10 terabytes de datos por centímetro cúbico de ADN, es algo que en estos momentos es imposible, pero que se espera que sea una realidad dentro de 25 años. Una vez que los sensores han transferido la información a el computador, es fácil para él asociar los síntomas con todas las irregularidades medicas conocidas, y presentar un diagnostico de alguna enfermedad o dolencia. Avances modernos en la velocidad de cálculo han hecho esto posible. Actualmente el hecho de asociar los síntomas a las enfermedades requiere bastantes horas, pero con la computación ADN se espera que el diagnostico se consiga en unos segundos. Una vez que el diagnostico esté hecho, será transferido a una unidad central, localizada en un reloj de pulsera. El proceso es el siguiente: Primero, en el computador ADN (situado en el pecho), el ADN se corta gracias a diferentes enzimas en un código, que refleja los síntomas corporales capturados, y diagnostica. Este código fue creado en 2003 por el Dr. Shapiro, el cual fue el primero en usar enzimas Fork-I y Ligasa para cortar ADN con diferentes longitudes, dependiendo de diferentes síntomas y diagnósticos. Una vez que el ADN está codificado, el computador transmite la información del diagnostico a trabes del cuerpo al lugar donde está el reloj. El reloj recoge células de la superficie del 7 cuerpo, que contienen la información. Dentro del reloj, se lee el código ADN, y se convierte a un formato legible y entendible por el ser humano. Una vez que está hecha esta conversión, en el reloj se pueden mostrar las condiciones corporales internas, así como advertencias cuando la homeostasis se interrumpa, o cuando una enfermedad es diagnosticada. Modelos de relojes de pulsera más evolucionados tendrán la capacidad de contacto inalámbrico con servicios de emergencia si un individuo está en serio peligro médico. Además, el historial medico completo del individuo puede ser grabado y mantenido en el reloj para acceder los hospitales y médicos, desterrando para siempre los historiales médicos inexactos e incompletos. Se espera que esto aproximadamente en el año 2031. se haga 8 realidad DESARROLLO DE COMPUTADORES ADN A NANO-ESCALA Desde 1994 hasta 2001 hay docenas de publicaciones en las revistas Science, Nature y otras, demostrando como moléculas de ADN afrontan problemas NP que se cree que son difíciles de resolver en ordenadores electrónicos convencionales. En 2001, el grupo de Shapiro publicó un artículo mostrando que las moléculas de ADN pueden trabajar como maquinas de computación Turing. El tamaño de la maquina podría ser tan pequeña como de 10nm de largo y 3 nm de ancho, el dispositivo de computación molecular más pequeño en el mundo. En los niveles tecnológicos de manipulación de ADN, la computación ADN no proporciona ventajas sobre los computadores electrónicos, por ejemplo, cuando codificamos tareas con moléculas de ADN para el problema HPP de Adleman, si n es igual a 100, la cantidad de ADN necesaria seria mayor que el peso de la tierra. No hay suficiente espacio para mejorar el algoritmo para hacer que el número de moléculas de ADN sea prácticamente pequeño. En esta etapa, algunas personas han comenzado a preocuparse sobre las direcciones del estudio de la computación ADN. Sin embargo, en otros subcampos de la computación ADN se han hecho grandes progresos. Tipos de manipulaciones moleculares básicas para computación ADN Hay dos tipos principales: - Hibridación simple: Es la forma básica de la actividad del ADN. Fusión de dos células de distinta estirpe para dar lugar a otra de características mixtas - Tratamiento enzimático: Es la manera de operar con diferentes formas de ADN. Si se investiga los estados del ADN en todos los enfoques de computación ADN, está claro que la hibridación/deshibridación está en todos lados, no importa si los fragmentos de ADN se mantienen en cadenas simples (ssDNA) o en cadenas dobles (dsDNA). Unidades de computación primarias En la actualidad, podemos encontrar varias unidades de computación, cada una de las cuales es conocida por el nombre de su investigador (o descubridor) y que se caracterizan por tener un tratamiento diferente para cada una de ellas. Siendo todas un acercamiento a las unidades de computación pero con diferencias importantes en su estructura y funcionamiento. Y estas unidades son: Unidad Adleman Adleman usa cortos oligonucleotidos para codificar problemas matemáticos. El proceso de computación está principalmente realizado en forma de hibrización. La 9 ligación y otros pasos de manipulación molecular se usan para una abstracción de salida. La respuesta correcta se esconde en una gran cantidad de diferentes resultados de hibridación. Problemas matemáticos específicos supondrán requerimientos específicos en las secuencias de ADN, La mayoría de las secuencias de ADN pueden ser diseñadas cuantitativamente usando algunos softwares. No es fácil usar la unidad Adleman para codificar problemas de computación específicos. Normalmente los algoritmos, o manipulaciones de ADN recombinante, puede ser bastante compleja, aunque cada paso de esas manipulaciones es relativamente sencillo. Cuando se codifican problemas simples, el cálculo puede ser hibridizado en un paso, como un proceso de auto-montaje simplificado; pero cuando se codifica de manera relativamente compleja, algunos pasos de tratamiento de ADN enzimáticos serán complicados. Aunque el esquema de computación ADN de Adleman puede ser todavía difícil para resolver problemas NP de manera práctica, sus experimentos son la primera demostración que la bio-computación es posible, destacando un camino para la computación molecular a seguir. Unidad Rothemund-Shapiro Benenson y sus colaboradores publicaron otro estudio pionero en el cual un autómata ADN programable y autónomo es creado. Ellos usan cadenas dobles de ADN como entradas, endonucleasa y ligasas ADN como hardware, moléculas de transición como software, así pueden un autómata finito molecular de dos estados con una entrada de dos símbolos, ocho reglas de transición y 765 programas distintos sintacticamente. Antes del trabajo de Benenson, Rothemund propuso ideas similares. Esto es una unidad de computación ADN similar a una maquina de Turing. En sus sistemas de computación, el volumen de una gota de agua tiene billones de computadores moleculares; cada uno de esos computadores moleculares puede ser tratado como una unidad Rothemund-Shapiro. Parece que no se han preocupado mucho en si estas unidades pueden tener potencia para desarrollar dispositivos de computación ADN universales, pero esto es verdaderamente un autómata muy especial. Como indicó Shapiro, sus sistemas de computación ADN pueden ser aplicados directamente en el análisis de patrones de expresión de genes que son de enfermedades específicas, y es sensible de desarrollar otras aplicaciones biomédicas. Al principio, las unidades Rothemund-Shapiro consistían en entradas ADN, enzimas (enzimas de restricción y ligasas), moléculas de transición, moléculas reporter (o informativos) y un sistema de buffer, pero ahora la unidad ha evolucionado en una sistema sin ligasas. Además se espera desarrollar una unidad sin enzimas en un futuro cercano. Unidad Tiling El grupo de Seeman ha estado haciendo un estudio de montaje de ADN desde hace veinte años, pero la capacidad de computación del montaje de ADN surgió hace pocos años atrás. Algunos científicos hicieron sus contribuciones al montaje de ADN como un régimen de computación. Junto con Reif y con el trabajo de Winfree, el montaje de ADN se ha convertido en una de las direcciones más importantes a seguir por la computación ADN. Por su capacidad de computación universal, el montaje de ADN proporciona otra vía para el desarrollo de computadores ADN universales. 10 La computación ADN por automontaje es básicamente un proceso en array, y los tipos de cada celda del array pueden variar mucho. Las celdas se pueden formar con varios oligos de cadena simple (por ejemplo, dos tres, cuatro o cinco), y cada celda puede tener diferentes finales de ADN para un número de combinaciones con otro igual o de diferentes celdas. El array se puede diseñar de manera bidimensional o tridimensional, y la escala del array debe ser controlable. En un futuro cercano, se pondrá mucho esfuerzo en los dispositivos de computación ADN a nano escala fabricados por montaje. El montaje de ADN puede ser completamente programado, aunque experimentos de biología molecular son todavía un cuello de botella para el montaje a gran escala. El montaje se refiere al proceso por el cual una macromolécula compleja (como un colágeno) o un sistema supramolecular (como un virus) se ensambla espontáneamente desde sus componentes. Unidad Ribozyme (Ribozima) Stojanovic fue pionero en la el área de investigación de unidades (deoxy) ribozima. La (deoxy) ribozima es parte de un fragmento del ácido nucleico con una estructura tridimensional única que tiene habilidad enzimatica para cortar complementarios y específicos oligos como sustrato. Si otro oligo se combina con la (deoxy) ribozima y le impide formar conformaciones enzimaticas, esta permanecerá inactiva. Ellos encontraron que las ribozimas pueden ser manipuladas fácilmente como puertas lógicas, además pueden imitar dispositivos de computación electrónica convencionales y teóricamente desarrollar un sistema de computación ADN universal. La unidad de computación ADN basada en ribozima puede ser extremadamente útil en el diseño de dispositivos de computación lógica en el futuro. Unidad Paun La computación membranal puede ser considerada un sistema de computación biológico único. Una célula es la unidad básica para un sistema de computación membranal. Esta unidad no es una unidad de computación ADN, sin embargo, el sistema de membrana proporciona otro tipo de celda de automontaje, y cada unidad Paun puede mantener ADN en ella y puede ser capaz de trasladar moléculas de ADN entre cada unidad en un futuro, por eso las unidades de Paun se tratan como unidades de computación ADN diferentes. En estos momentos, la unidad de Paun proporciona un acercamiento especifico para afrontar computación biológica, además de para muchos estudios de bioinformática. Además, la unidad Paun puede ser una herramienta para el estudio de los patrones de ensamblaje biológicos a través de los cuales las células interactúan con las demás para formar organismos multicelulares. 11 UN EVALUADOR LÓGICO UNIVERSAL (QUE OPERA EN CELULAS DE MAMIFEROS) Un autómata molecular es un sistema molecular manipulado unido a un entorno (bio) molecular por “el flujo de mensajes de entrada y las acciones de los mensajes de salida”, donde los mensajes de entrada son procesados por un “conjunto de elementos intermedio”, esto es, un computador. Los autómatas moleculares puede implementar diversos modelos de computación (circuitos digitales y analógicos, maquinas de estados, redes neuronales) para llevar a cabo diversas tareas. En lo que sigue se muestra el diseño de una estructura de propósito general para autómatas que usan evaluación lógica para tomar decisiones basados en las entradas moleculares del entorno. Los evaluadores lógicos moleculares han sido demostrado in vitro y en células vivas. Y aunque los sistemas in vitro han demostrado cómo evaluar expresiones lógicas arbitrarias experimentalmente, los sistemas en células vivas están (a fecha septiembre de 2006) considerados teóricos. Un evaluador lógico operando en un entorno molecular intracelular puede servir con un circuito de toma de decisiones binario, esto es, provocar uno o dos procesos discretos en respuesta a entradas de este entorno. La capacidad de decisión basada en entradas endógenas para in vivo puede encontrar aplicaciones en investigación básica y medicina, como en el diagnóstico del cáncer. Para dirigir esta cuestión, se remodelan las reglas de toma de decisiones como expresiones lógicas que contienen las entradas intracelulares como variables y construir un sistema molecular que produzca una salida molecular cuando la expresión es evaluada, como true para entradas dadas (true cuando están presente y false cuando ausentes). Hay varios teóricamente equivalentes, pero prácticamente diferentes, maneras de resolver las preguntas lógicas arbitrarias: I. Una posibilidad es ser muy estricto con los módulos básicos. (por ejemplo, la primera entrada debe ser True, la segunda debe ser False), pero conectando estos módulos de manera menos estricta donde se consiga un resultado positivo global. [Primera aproximación]. II. Otra posibilidad es ser menos estricto en los módulos básicos (por ejemplo, al menos una entrada tiene que estar en un estado esperado), pero poner exigencias estrictas en la combinación de módulos, requiriendo que todas las respuestas sean positivas simultáneamente para dar una respuesta positiva global. [Segunda aproximación]. Primera aproximación Para construir un evaluador que se ajuste a la primera aproximación, hay que construir un ‘circuito’ biológico que se componga de dos o más especies de mRNA que codifiquen la misma proteína, pero que tengan diferentes regiones sin codificar. Esta proteína es la salida del sistema. Una salida activa biológica puede funcionar con un actuador. Si al menos una especie de mRNA es traducida, la salida resultante representará un valor True lógico, implementando una operación OR (Figura 1a). Los 12 niveles de especies de mRNA y la salida son determinados por la presencia o ausencia de las entradas moleculares endógenas con la ayuda de mediadores moleculares. Las moléculas siRNA detectan regiones sin traducir y por lo tanto candidatos naturales para esa mediación. Por ejemplo, si primero fusionamos diferentes conjuntos de siRNAs en la tercera región sin traducir (Untranslated region (UTR)) de las mRNAs, traduciendo las más susceptibles a cualquiera de estas siRNAs. Siguientemente, se establecen enlaces inhibidores selectivos entre las entradas endógenas y estas siRNAs. Todas las entradas deben estar presentes a la vez para bloquear todas las siRNAs y generar una salida de una mRNA, correspondiéndose con una operación lógica AND (Figura 2b). Además, si por ejemplo, las entradas A y B bloquean las siRNAS que son el objetivo de una mRNA y entradas X e Y que bloquean siRNAS que son objetivo de otra, el circuito generará una salida cuando ambos A y B están presentes o cuando ambas X e Y están presentes. Esto constituye la expresión lógica [(A AND B) OR (X AND Y)]. Si un enlace de activación esta establecido, en vez de, la presencia o ausencia de una entrada bloqueará o permitirá la producción de salida de la mRNA, respectivamente. En términos lógicos, esto convierte a una negación de la entrada ‘valor true’ (Figura 1c). Entonces, la entrada B activando s mediador siRNA cambia la expresión en [(A AND NOT(B)) OR (X AND Y)]. Y una misma entrada puede bloquear una siRNA y activar otra, y aparecer en la expresión ambas, como ella misma y como su negación. Este acuerdo de variables de entradas y sus negaciones, conocidos como literales, se conoce como una forma normal disyuntiva (DNF) (Figura 1d). Segunda aproximación Un circuito biológico que permite la segunda aproximación consta de especies de mRNA que producen un factor de trascripción que reprime un gen de decodificación de salida. Si el represor obtenido de una mRNA eficiente regula a la baja la salida, todas las mRNAs deben ser eliminadas para generar la salida, de esta manera implementando una operación lógica AND (Figura 2a). Como antes, se fusionan conjuntos de siRNA diana en el tercer UTR del represor mRNAs. Sin embargo, al contrario que en el caso anterior, aquí las entradas endógenas deben activar las siRNAs más que bloquearlas. Al 13 menos una siRNA de cada conjunto debe ser activada para eliminar toda represión mRNAs y aliviar la represión (figura 2b), correspondiendo a un operación lógica OR. Por ejemplo, si las entradas A y B activan las siRNAs que detecta una mRNA y la entradas X e Y activan siRNAs que detectan otra, necesitaremos al menos que una de las entradas A y B, y al menos que una de las entradas X e Y, estén presentes. En términos lógicos, esto constituye la expresión [(A OR B) AND (X OR Y)]. Una entrada que bloquea su mediador siRNA está negado en la expresión (Figura 2c). Esto es un ejemplo de una expresión en forma normal conjuntiva (CNF) y el circuito es un evaluador CNF (Figura 2d). Las formas estándares DNF y CNF son particularmente útiles porque cualquier condición lógica puede ser evaluada usando una representación DNF o CNF correspondiente, y además, una representación puede ser más corta que la otra. Experimentalmente se han implementado ambos tipos de evaluadores (tanto DNF como CNF) en células renales embrionarias humanas inmortalizadas. Transfeccionamos las células con los genes constituyendo los circuitos evaluadores, también se añadió, o retuvo, moléculas siRNA mediadoras para reflejar la función anticipada del modulo sensorial de acuerdo con la presencia o ausencia de entradas apareciendo como variables en la expresión (Figura 2e). Y se ensayaron los niveles de salida después de 48 horas. Para esta experimentación se eligieron derivativos de conocidos siRNAs, y se construyeron cinco parejas de cadenas siRNA en secuencias publicadas de genes no pertenecientes a mamíferos para representar hasta cinco entradas: T1 de Renilla reniformis T2 de Renilla reniformis FF3 de Firefly luciferases FF4 de Firefly luciferases 14 SI 4 de Enhanced green fluorescent protein (eGFP) Los sistemas multi-siRNA pueden mostrar interferencias entre moléculas individuales. Se midió estas interferencias, utilizando derivativos ZsYellow con cadenas individuales y el resultado fue que las interferencias eran insignificantes para este conjunto de siRNAs. Entonces se construyeron y testearon un numero de cláusulas de mRNA para los evaluadores DNF, fusionando las cadenas siRNA en la tercera UTR del gen ZsYellow. (Figura 3). En un siguiente paso, se llevó a cabo la evaluación de los experimentos para las expresiones completas tanto DNR como CNF. Se construyeron dos expresiones en forma DNF: D1: [(A AND B AND C) OR (D AND E)] D2: [(A AND C AND E) OR (NOT(A) AND B)] La misma siRNA (FF3) fue usada diferentemente en D1 y en D2, en una como variable E y en la otra como variable negada NOT(A). Como resultado, las siRNAs T1 y FF3 nunca se aplicaban juntas durante la evaluación de D2. Entonces se testearon todas las posibles asignaciones para valores verdaderos para las variables en cada expresión: 32 para D1 y 16 para D2 (Tabla 1a). La distribución de los niveles de salida en ambas expresiones es la que se muestra a continuación: Demuestra una clara separación entre los grupos de salida False y True como se requiere de un evaluador lógico, con una media de diferencias de 16 veces entre los 15 niveles de salida en los grupos True y False. La evaluación de la expresión D1, con todas las variables siendo True y sin siRNAs presentes, resultó en más de dos veces la salida de otros debido a la producción paralela de la salida de ambas cláusulas mRNAs. Este valor alto es interpretado como True. En la expresión D2, se obtuvo una evaluación False imperfecta, pero tras otros procesos más complejos de fusiones se consiguió controlar su comportamiento. El evaluador CNF (Tabla 1b) realiza una operación AND entre las cláusulas y una operación OR entre cada cláusula. Sin embargo, actualmente el evaluador CNF es cuantitativamente menos robusto que su homólogo DNF. Se cuenta con una expresión rigurosa en una mano, y con la eficiencia en la regulación decreciente por la siRNA en la otra, para mejorar su rendimiento. Ese esquema de diseño permite la evaluación paralela de una expresión y su negación. Esto puede mejorar el rendimiento general del sistema. Cuando dos salidas anticorrelacionadas se producen en paralelo, su diferencia es un indicador mejor del resultado del proceso que las salidas individuales. 16 CONCLUSIÓN Este informe representa un paso hacia los autómatas moleculares programables capaces de tomar decisiones in vivo, por la implementación de un núcleo de computación que evalúa expresiones lógicas en forma estándar. Estas formas, evaluadas usando circuitos lógicos de dos niveles, pueden suponer un aumento exponencial en tamaño para representar ciertas funciones lógicas relativas a circuitos multinivel. Sin embargo, una reducción en el número de etapas de computación reduce el tiempo de procesamiento general del circuito. El ruido y la degradación de la señal son un problema en ambas arquitecturas de los circuitos, por esto la restauración de la señal, que es, mejorar el ratio ON/OFF en etapas intermedias aumenta mucho la escalabilidad y el rendimiento. En casos donde la representación de dos niveles lógicos no pueda ser implementada eficientemente debido a la acumulación de cláusulas contenidas incompletamente, es posible subdividir la computación en una jerarquía e introducir restauración de la señal. Actualmente el rendimiento de estos circuitos es comparable a los las redes similares in vitro e in vivo que no utilizan restauración de la señal. Se propone un mecanismo sensorial a través del cual una siRNA media la presencia, y otra la ausencia, de una entrada dada a través de enlaces directos y contrarios reguladores. (Figura 5) Por ejemplo, trabajo reciente ha demostrado ambas inhibición y activación de siRNA por una pequeña molécula mientras que un autómata ADN usa distintas subsecuencias de una molécula mRNA, al contrariamente regular dos estructuras ADN de doble cadena similar a siRNA diferentes. Un mecanismo alternativo incluiría solamente un tipo de enlaces reguladores entre la entrada y uno de los mediadores, con una interacción inhibidora adicional entre este y el mediador complementario. (Figura 5) La propuesta principal parece preferible por dos razones: primero, en la colocación, se requiere dos interacciones moleculares para que una entrada sea testeada para ambas presencia o ausencia, y cuatro interacciones cuando una entrada se testea para ambas (esto es, aparece como un literal positivo y un negativo en la expresión lógica). En la alternativa, una entrada testeada para su ausencia requiere tres interacciones, incrementando el número total de interacciones por circuito. Y segundo, el primer diseño requiere al menos dos interacciones consecutivas antes del núcleo de computación, donde la alternativa requiere tres cuando testea la ausencia de una entrada. El aumento de número de pasos incrementa la probabilidad de fallo. 17 La implementación de estos circuitos exige mucho esfuerzo porque requiere múltiples y eficientes estructuras siRNA con la mínima interferencia. Se ha tratado ampliamente estos desafíos utilizando moléculas siRNA desarrolladas con ayuda del diseño asistido por ordenador. En el futuro, la utilidad de estos principios de diseño para la construcción de autómatas puede ser mejorada teniendo en cuenta la selectividad y eficiencia de los mediadores siRNA ambos como sensores y reguladores de las expresiones de los genes. La computación molecular y la biología sintética puede crear redes de procesamiento de información moleculares que son mejores que las naturales en su rendimiento cuantitativo además de permitir funcionalidades novedosas. 18 PARALELISMO CON LAS FPGAs Es fácil identificar cada uno de estos nanocomputadores, o nanocomparadores con la tecnología empleada en la fabricación de FPGAs. Dado el paralelismo que se desprende entre ambas se observa que la computación celular es un acercamiento a las FPGAs, ya que lo que en una FPGA es un bloque lógico básico, podría ser una célula y por tanto un sistema pluricelular podría identificarse con una FPGA. Para esto, en este apartado se extiende y explica el funcionamiento de las FPGAs para comprender este paralelismo. Una FPGA (del inglés Field Programmable Gate Array) es un dispositivo semiconductor que contiene bloques de lógica cuya interconexión y funcionalidad se puede programar. La lógica programable puede reproducir desde funciones tan sencillas como las llevadas a cabo por una puerta lógica o un sistema combinacional hasta complejos sistemas en un chip. Las FPGAs tienen las ventajas de ser reprogramables (lo que añade una enorme flexibilidad al flujo de diseño) (aunque hay algunas que sólo se pueden programar una vez), sus costes de desarrollo y adquisición son mucho menores para pequeñas cantidades de dispositivos y el tiempo de desarrollo es también menor. HISTORIA Las FPGAs son inventadas en el año 1984 por Ross Freeman, co-fundador de Xilinx, y surgen como una evolución de los CPLDs. Tanto los CPLDs como las FPGAs contienen un gran número de elementos lógicos programables. Si medimos la densidad de los elementos lógicos programables en puertas lógicas equivalentes (numero de puertas NAND equivalentes que podríamos programar en un dispositivo) podríamos decir que en un CPLD hallaríamos del orden de decenas de miles de puertas lógicas equivalentes y en una FPGA del orden de cientos de miles hasta millones de ellas. Aparte de las diferencias en densidad entre ambos tipos de dispositivos, la diferencia fundamental entre las FPGAs y los CPLDs es su arquitectura. La arquitectura de los CPLDs es más rígida y consiste en una o más sumas de productos programables cuyos resultados van a parar a un número reducido de biestables síncronos (también denominados flip-flops). La arquitectura de las FPGAs, por otro lado, se basa en un gran número de pequeños bloques utilizados para reproducir sencillas operaciones lógicas, que cuentan a su vez con biestables síncronos. La enorme libertad disponible en la interconexión de dichos bloques confiere a las FPGAs una gran flexibilidad. ARQUITECTURA La arquitectura básica de una FPGA consiste en una matriz de bloques lógicos programables (del inglés Configurable Logic Block o CLB) y canales de interconexión entre ellos. 19 Por un lado, los bloques lógicos están compuestos típicamente por una tabla de búsqueda de cuatro entradas (que es capaz de representar cualquier función lógica combinacional de cuatro entradas) y un flip-flop. Como se observa en la figura, el bloque lógico tiene cinco entradas en total (4 que van a parar a la tabla de búsqueda más una señal de reloj) y una única salida, que se obtiene o bien de la salida de la tabla de búsqueda sin registrar (sin pasar por el flip-flop) o bien de la salida de la tabla de búsqueda una vez registrada. Por otro lado, los canales de interconexión están compuestos por un gran número de segmentos de cable en paralelo de tal modo que cada entrada o salida (tanto de los bloques lógicos como de la FPGA en sí) puede conectarse a cualquiera de dichos segmentos del canal de interconexión. Es decir, una FPGA está formada por un array de bloques básicos y una red de interconexión que los interconecta. Y ambos componentes, tanto los bloques básicos como la forma de interconectarlos se puede configurar a voluntad. Esta configuración se realiza mediante entornos de desarrollo especializados y utilizando lenguajes de programación de alto nivel. IMÁGENES 20 LA BIOTECNOLOGIA EN ESPAÑA La industria biotecnológica española se ha quedado atrás comparado con los demás países europeos, dado que la inversión que se hace en este campo es muy pequeña. Pero en los últimos años, el gobierno ha aumentado sus esfuerzos para potenciar la biotecnología en España (las inversiones han sido sustancialmente mayores, dado que la investigación publica en biotecnología ha aumentado de los 119 millones de euros en el año 2000 a 257 millones de euros en 2004). A pesar de esto, el soporte público puede no ser suficiente para mantener el crecimiento del sector. La cantidad de financiación disponible a las compañías es todavía pequeña comparada con la cantidad recogida por la investigación privada. Y aunque la investigación privada es un sector en alza, se mantiene escaso. La demora del status español en biotecnología se puede atribuir en parte a la historia, puesto que hasta el siglo 19 no era un país en el que la ciencia era importante. Hasta el siglo 19 España tenía una tradición muy fuerte en artes y la ciencia fue muy descuidada. Además después del régimen dictatorial, la sucesión de gobiernos democráticos no ha apoyado la investigación y el desarrollo como debían. Después de todo esto, España se unió a la Unión Europea en 1996 y entonces el paisaje biotecnológico comenzó a cambiar. A pesar de todo esto, España es, en términos de publicación de documentos de investigación, el cuarto país de Europa para biotecnología y el séptimo para biología molecular. Y actualmente el número de compañías biotecnológicas ha superado en más del doble desde el año 2000 y continúa en crecimiento. Los dos núcleos más importantes donde se han establecido estas empresas son Madrid y Cataluña, y como ejemplo de ellas se pueden citar: Madrid: Bionostra. MicroBionta. Madrid-based Genetrix. Cataluña: Oryzon Genomics. Advancell. CrystaX Pharmaceuticals. Es importante citar para este trabajo que la empresa Oryzon Genomics, situada en Cataluña, tiene un proyecto a largo plazo dirigido al desarrollo de herramientas bioinformáticas basadas en sistemas biológicos. También podemos encontrar empresas en otras comunidades, las cuales han aparecido en los tres últimos años. Estas se recogen en la siguiente tabla: Compañía Situación Actividad Principal Entrechem Dropsen Genmedica Mellitus Asturias Asturias Barcelona Gerona Monitorización de medicamentos Biosensores Síndrome metabólico Síndrome metabólico Integromics Granada Bioinformática, administración de información Biobide Guipúzcoa Monitorización de medicamentos 21 Génica Innova Biocros Madrid Madrid Diagnóstico molecular Diagnóstico del alzheimer Secugen Madrid Secuenciamiento genómico Alz-Andalus Biopharm Oncostem Therapeutics Biomorphic Málaga Salmanca Sevilla Modelos animales de Alzheimer Oncologia Materiales biológicos Nanozar Zaragoza Nanotecnologia Y las dos relacionadas con el tema de este trabajo son las que aparecen resaltadas en color rojo. CONCLUSIÓN La conclusión que extraigo personalmente de este trabajo es que la investigación en este campo de la bio-informática está en pañales, es decir, es un campo que es muy actual y que está en actual expansión. Aunque las expectativas del desarrollo de este tipo de tecnología son impresionantes, las opiniones sobre la consecución o no de las mismas son también variadas. A nivel de España, el desarrollo de empresas relacionadas con la bio-informática está creciendo pero es todavía escaso, como se muestra en el último apartado del trabajo. GLOSARIO mRNA: Es el ARN mensajero, el que lleva la información desde el núcleo hasta los ribosomas. Enzima ligasa: Enzima capaz de unir, formando enlaces, fragmentos de ADN que presentan extremos adecuados. Aparece tanto en la literatura porque junto con las enzimas de restricción endonucleasas, que cortan el ADN en determinadas zonas diana de su secuencia, y junto con la PCR o reacción en cadena de la polimerasa son las herramientas básicas de la biología molecular. Algo así como pegar, cortar y generar. Hibridación: Es un tipo de técnica de biología molecular en la cual se genera una sonda (probe) de ARN o ADN específica para una secuencia de ADN o ARN que estamos buscando en un genoma o el conjunto de ARNs mensajeros de un organismo. La sonda se diseña a fin de que hibride, es decir, que se aparee con su hebra complementaria que es la que se busca. Endonucleasas: Equivalen más o menos a las enzimas de restricción, que como ya se ha puesto anteriormente en la definición de enzima ligasa, cortan el ADN por secuencias fijas. Hay una gran variedad y cada una de ellas reconoce y corta por una secuencia distinta. Por ejemplo: BamHI es una endonucleasa que corta 22 (donde están las comillas) y reconoce la secuencia …G”GATCC. La ligasa haría justo lo contrario. Moléculas o genes Reporter: Son genes o moléculas que informan sobre cómo, cuando y sobre todo donde está ocurriendo un proceso biológico. Una molécula utilizada como reporter es la GFP (Green fluorescent protein). Ribozimas: Son un tipo de enzimas que en vez de estar formadas por proteína (como el 99,99% de todas las enzimas) están formadas por ARN (Ribozimas) y más raramente aun por ADN (Desoxiribozimas). siRNA: (Small interference RNA) son moléculas cortas de ARN de interferencia. Es un tipo de ARN que utilizan las células para defenderse del ataque de virus y otras infecciones. BIBLIOGRAFÍA - Nature Biotechnology. Mayo 2007. Letter: A universal RNAi-based logic evaluator that operates in mammalian cells. ChemMatters: Cellular Silicon, a medical revolution. Current Nanoscience, 2005. Development of Nano-Scale DNA Computing Devices. Nature Biotechnology. Volume 24, number 09 September 2006. Biotechnology in Spain: Special repport. Medical Dictionary: Medterms dictionary: http://www.medterms.com/script/main/hp.asp Medical Dictionary: Merrian Webster medical dictionary: http://www.intelihealth.com/IH/ihtIH/WSIHW000/9276/9276.html Wikipedia, entrada Biotecnologia. (Definición). Technology review. October 2004. www.technologyreview.com Wikipedia, entrada FPGA http://www.eecg.toronto.edu/~vaughn/challenge/fpga_arch.html 23
Puede agregar este documento a su colección de estudio (s)
Iniciar sesión Disponible sólo para usuarios autorizadosPuede agregar este documento a su lista guardada
Iniciar sesión Disponible sólo para usuarios autorizados(Para quejas, use otra forma )