C/ Eduardo Primo Yúfera, 3 (junto Oceanográfico) · 46012 VALENCIA (Spain) · Tel: +34 96 328 96 80 - Fax: +34 96 328 97 01 / www.cipf.es / CIF G-46/923421 Los resultados de este trabajo se han publicado en la revista BMC Bioinformatics EL LABORATORIO DEL DR. DOPAZO DEL CIPF DESARROLLA LA PRIMERA HERRAMIENTA DE SECUENCIACIÓN DE NANOPOROS A GRAN ESCALA El Dr. Joaquín Dopazo desarrolla herramientas bioinformáticas que permiten la escalar el manejo de datos en las nuevas tecnologías de secuenciación de nanoporos de forma casi ilimitada. El auge de estas nuevas tecnologías de secuenciación en tiempo real va a causar un problema de saturación de datos que se resuelve con las herramienta “HPG Pore” desarrollada Valencia (29/02/2016).- El Laboratorio de Genómica de Sistemas del Centro de Investigación Príncipe Felipe (CIPF), que dirige el Dr. Joaquín Dopazo, acaba de publicar en la revista BMC Bioinformatics, el artículo "HPG pore: an efficient and scalable framework for nanopore sequencing data", que explica el conjunto de herramientas "HPG Pore", que tiene como objetivo explorar y analizar de manera sencilla el creciente volumen de información de secuenciación que las tecnologías de nanoporos están generando. Dentro de las nuevas tecnologías de secuenciación hay una verdaderamente novedosa que es la de los nanoporos. En ella, se fuerza a pasar al ADN por una estructura artificial que es parecida a los poros que hay en la superficie de las bacterias. El pequeño tamaño de estos poros hace que que al pasar la secuencia de ADN a través suyo cada nucleótido componente (las conocidas letras A, T, G y C) provoque unas distorsiones características, que se traducen en unos cambios eléctricos medibles. De esta manera se puede virtualmente “leer” la secuencia de nucleótidos en tiempo real. El dispositivo que hace estas lecturas es del tamaño de un teléfono móvil pequeño y se conecta por un puerto USB a un ordenador. El uso masivo de esta tecnología colapsará en un futuro próximo los sistemas actuales de procesamiento de datos. Este trabajo presenta la primera solución para el manejo de este tipo de datos que es realmente escalable y puede procesar el creciente volumen de secuencias que se generará. El proyecto "HPG pore" desarrollado por el Laboratorio del Dr. Dopazo es la primera herramienta bioinformática escalable que estudia los datos de secuenciación de nanoporos que se puede ejecutar en equipos individuales, así como en sistemas de almacenamiento distribuido modernos, que funcionan con una tecnología abierta llamada Hadoop que permite el escalado virtualmente ilimitado de datos y mejores tiempos de ejecución. "HPG Pore" permite una gestión eficiente de grandes cantidades de datos constituyendo, de esta manera, una solución a las necesidades de análisis de datos en un futuro próximo, así como un modelo para la creación de nuevas herramientas con las que tratar grandes volúmenes de datos genómicos. C/ Eduardo Primo Yúfera, 3 (junto Oceanográfico) · 46012 VALENCIA (Spain) · Tel: +34 96 328 96 80 - Fax: +34 96 328 97 01 / www.cipf.es / CIF G-46/923421 Según el Dr. Dopazo, es probable que la secuenciación de nanoporos se extienda en un futuro debido a su portabilidad y a su capacidad de secuenciar largos fragmentos de moléculas de ADN sin amplificación previa. Actualmente, las herramientas existentes para el análisis de esta información solo están capacitadas para administrar proyectos pequeños y no son escalables. El desarrollo de "HPG Pore" permite la escalabilidad casi ilimitada de datos de secuenciación garantizando, de este modo, su gestión continuada en futuros escenarios. "HPG pore" está disponible en el repositorio público GitHub en http://github.com/opencb/hpg-pore Link artículo: http://www.biomedcentral.com/1471-2105/17/107 Link laboratorio: http://bioinfo.cipf.es/ Contacto: [email protected]