Sobre la boa que se comió un elefante o de cómo guardar un libro en una hebra de ADN Paulina Aspra Polo “… era la edad de la sabiduría, y también de la locura, la época de las creencias y de la incredulidad…” Charles Dickens Los personajes que Saint-Exupéry describe en “El Principito” desafiaron nuestra imaginación cuando nos presentaron la imagen de una boa comiéndose un elefante. ¿Cómo algo tan grande podría caber en algo tan pequeño? puede ser que nos cueste trabajo imaginar cómo podríamos guardar un libro, incluso toda la información contenida en una enciclopedia en un gramo de ADN, pero quizá eso represente el futuro del almacenamiento de información digital. Sobre la boa que se comió un elefante o de cómo guardar un libro en una hebra de ADN / CIENCIORAMA 1 El 25 de abril de 2013 se cumplieron 60 años del descubrimiento de la molécula de ADN. Watson y Crick la describieron como una serie de nucleótidos que unidos forman una cadena de ADN. Un nucleótido consiste de una base nitrogenada (adenina, timina, guanina y citosina) unida por un esqueleto de un azúcar (deoxirribosa) y un fosfato. El ADN se compone de dos cadenas que se unen por enlaces moleculares entre las bases nitrogenadas. La adenina siempre se unirá con la timina y la citosina con la guanina. En la molécula de ADN se guarda la información que necesitan los organismos para realizar sus funciones y sintetizar proteínas pero, a diferencia de los chips de ADN, los organismos leen el ADN de tres en tres nucleótidos. Al ver que se podía guardar mucha información en una molécula pequeñita, muchos científicos se preguntaron si se podría guardar otro tipo de información. Diseñaron un código donde cada nucleótido se interpreta como cero o uno. Si se traduce un libro a código de ceros y unos o código binario, se puede guardar un libro en ADN.Esto ya se había intentado antes, y habían utilizado porciones pequeñas de ADN de Escherichia coli para guardar partes de textos como el Génesis de la Biblia. También guardaron frases del libro Historia de dos ciudades de Charles Dickens y mensajes encriptados como “6 de junio: invasión a Normandía”. Sin embargo, la información almacenada era poca. Fue hasta noviembre del año pasado que investigadores de la escuela de medicina de Harvard, tradujeron un libro completo a código binario, asignaron valores a los nucleótidos (0 ó 1) y construyeron la secuencia de nucleótidos artificialmente. Obtuvieron cadenas de ADN que no codifican proteínas, sino que tienen un código de lectura y un mensaje diferente al que usan las células. Los científicos eligieron un libro que Sobre la boa que se comió un elefante o de cómo guardar un libro en una hebra de ADN / CIENCIORAMA 2 había escrito uno de ellos, curiosamente llamado Regénesis: ¿cómo la biología sintética reinventará la naturaleza y a nosotros mismos (Regenesis: How Synthetic Biology Will Reinvent Nature and Ourselves por Church G.M. y Regis E.) El libro compuesto por 53 000 palabras y 11 imágenes, se tradujo a lenguaje binario y se almacenó en menos de un gramo de ADN. La cantidad de errores que reportaron en el estudio realizado en Harvard fue de diez en 5.2 millones de bits, lo cual indica que se podría agregar mucha más información sin que se modifique el contenido. Bits en el ADN Un bit es uno de los dos dígitos posibles en el sistema binario, puede ser 0 o 1, mientras que en el sistema decimal puede ser 0,1,2… o 9. Cada 8 bits constituyen un byte. En el ADN se puede almacenar un bit de información en cada nucleótido de la secuencia. Cuando se almacena información en el ADN, se considera a las adeninas y citosinas como 0; y a las timinas y guaninas como 1. Si almacenáramos información en lenguaje binario en un gramo de ADN de cadena simple, éste podría contener 455 mil millones de bits de información. Los investigadores lograron fabricar un chip de 128 mm de largo por 86 mm de alto por 13 mm de profundidad que podría contener hasta 1.5 exabytes de información. Un exabyte contiene 1 000 000 000 de gigabytes, o lo equivalente a mil millones de discos duros de 1GB de los que se pueden encontrar comúnmente en el mercado actual. Por ejemplo, en 2008 se estimó que existían mil millones de computadoras en uso en todo el mundo, suponiendo que cada una de ellas tiene un disco duro de 1 GB, podríamos contener en un gramo de ADN el equivalente a toda la capacidad de almacenamiento de información mundial. No sólo se pueden Sobre la boa que se comió un elefante o de cómo guardar un libro en una hebra de ADN / CIENCIORAMA 3 almacenar grandes cantidades de información en el ADN, sino que también tiene ventajas como un medio estable para almacenar información por mucho tiempo, debido a que los enlaces entre sus moléculas (nucleótidos, grupos fosfato y azúcares) son muy estables. Se ha obtenido ADN de mitocondrias (organelo celular) de restos humanos de 7000 años de antigüedad que no se ha degradado en exceso. Inclusive ADN bacteriano atrapado en cristales de sal ha mantenido su estructura por 250 millones de años. Fabricación de chips de ADN Pero, ¿cómo se fabrica un chip de ADN? Los chips de ADN, también llamados microarreglos, se han utilizado en la investigación científica para Sobre la boa que se comió un elefante o de cómo guardar un libro en una hebra de ADN / CIENCIORAMA 4 identificar la presencia y cantidad de ARN mensajero en cualquier muestra que nos interese. Se pone en el chip una secuencia conocida de ADN complementaria al ARN que se espera encontrar. Si en la muestra biológica está la cadena complementaria del ADN del chip, se unen las dos cadenas debido a la afinidad que existe entre sus nucleótidos complementarios aun cuando una es de ADN y la otra de ARN (a este proceso se le llama hibridación). Esta hibridación genera una reacción fluorescente y los investigadores pueden identificar los fragmentos presentes en la muestra. (para mayor información ver: http://www.cienciorama.ccadet.unam.mx/articulos_extensos/274_e xtenso.pdf) Estas secuencias de nucleótidos son construidas artificialmente. Para fabricar chips de ADN o microarreglos para uso en la investigación o como almacén potencial de información se puede utilizar una impresora de ADN. Estas impresoras utilizan como “papel” una superficie de vidrio de poros de tamaño determinado (Controlled Pore Glass, CPG). Sobre esta superficie se adhieren uno por uno los nucleótidos deseados (A,T,C o G). Además, el ADN puede acomodarse en láminas y varias láminas por mm 3 por lo que aumenta la capacidad de almacenamiento de información. Cómo sacar un conejo de un sombrero de copa Sin embargo aún estamos lejos de tener unidades de almacenamiento de información basados en ADN en las computadoras nuestras de cada día. Para obtener la secuencia de nucleótidos que componen el ADN necesitamos una muestra que contenga miles de copias de la misma cadena. En un chip de ADN tenemos una sola copia, por lo que se utiliza un proceso de síntesis in vitro de las hebras de ADN, conocido como Sobre la boa que se comió un elefante o de cómo guardar un libro en una hebra de ADN / CIENCIORAMA 5 “reacción en cadena de la polimerasa” (Polymerase Chain Reaction, PCR). La PCR es una herramienta conocida para obtener grandes cantidades de una pequeña muestra de ADN. Por ejemplo, cuando se comete un delito y hay pocas muestras, se utiliza esta técnica para obtener la misma muestra repetida miles de veces. Una vez que la muestra ha sido amplificada, se obtiene la secuencia de nucleótidos que componen las hebras de ADN; se comparan con la muestra del sospechoso y se identifica al culpable. Cabe señalar que en la actualidad el procesamiento del ADN se realiza en pocos lugares y resulta relativamente caro (aproximadamente 11 dólares por muestra). Y se necesitaría un software que interprete la secuencia de nucleótidos y la traduzca en texto e imagen.En el caso de los investigadores de Harvard, ellos codificaron el texto en 54 000 fragmentos de ADN. Cada uno de estos fragmentos consistía de 159 nucleótidos de longitud, y tenían un bloque que especificaba su localización en el libro completo. Esto es importante, ya que es como si arrancáramos las hojas de un libro, y fueran fotocopiadas por separado, si las hojas no estuviesen numeradas el libro perdería la secuencia y tendría otro significado. Si los investigadores hubieran procesado comercialmente sus 54 000 muestras, la sola secuenciación hubiese costado cerca de 600 000 dólares. Es por eso que en la actualidad, decodificar un libro completo contenido en un chip de ADN sería muy caro. Sin embargo los investigadores confían en que en un futuro el costo de la decodificación de los chips de ADN disminuirá su costo comercial. Sobre la boa que se comió un elefante o de cómo guardar un libro en una hebra de ADN / CIENCIORAMA 6 Realidad o ficción Cada día la ciencia desafía nuestros sueños más extraordinarios, así como el Principito, debemos comenzar a ver elefantes dentro de una boa, y no un simple sombrero. Imaginemos la utilización de chips de ADN para la transmisión de mensajes crípticos. ¿Cómo? Se puede integrar ADN creado artificialmente al genoma de seres vivos. Este ADN artificial no resulta en la producción de proteínas en esos sistemas biológicos, sino que se trata de un mensaje en código binario. Por ejemplo, un grupo de investigadores japoneses ha logrado introducir fragmentos de ADN que contenían el mensaje “¡E=mc2 1905!” en el genoma de la bacteria Bacillus subtilis, sin afectar la información que este ser vivo necesita para su supervivencia. Una vez insertado el mensaje, la bacteria podía continuar viviendo y multiplicándose. Esto quiere decir que se podrían enviar mensajes de una a otra persona mediante una bacteria modificada como B subtilis. Sin embargo, no se puede utilizar este sistema para difundir mensajes, puesto que la cantidad de información decodificada que se puede insertar en el ADN de B subtilis no rebasa los 8 megabytes, y puede haber mutaciones en los genes de esta bacteria, por lo que partes del mensaje podrían borrarse. Estas actividades deben regularse legalmente, puesto que se puede transmitir un virus computacional, e incluso un virus de importancia médica, por no mencionar que su uso biológico puede generar proteínas quiméricas de funciones insospechadas. Agradecemos al Fís. José Luis Olivares, Dr. Jesús Ramírez y a la Dra. Leonora Olivos por su participación en la realización de esta nota. Bibliografía no especializada Sobre la boa que se comió un elefante o de cómo guardar un libro en una hebra de ADN / CIENCIORAMA 7 1. http://www.cronicasweb.com/cientificos-logran-codificar-un-libro-de- 53000-palabras- en-adn/ 2. http://news.sciencemag.org/sciencenow/2012/08/written-in-dna-code.html?ref=hp 3. http://news.sciencemag.org/sciencenow/2013/01/half-a-million-dvds-in-yourdna.html?ref=hp Bibliografía 1. “Next-Generation digital information storage in DNA”. 2012. Church MG, Gao Y, Kosuri S., Science 28., vol 337, no. 6102, p 1628. 2. N. Yachie, K. Sekiyama, J. Sugahara, Y. Ohashi, M. Tomita, “Alignment-based approach for durable data storage into living organisms”. Biotechnol. Prog. 23, 501 (2007) 3. C. Bancroft, T. Bowler, B. Bloom, C. T. Clelland, “Long-term storage of information in DNA. Science 293, 1763 (2001) Sobre la boa que se comió un elefante o de cómo guardar un libro en una hebra de ADN / CIENCIORAMA 8