HPC Microprocesadores para Comunicaciones Francisco José Santana Ojeda INDICE 1. 2. Introduccion Clúster a. Caracteristicas 3. HPC a. Supercomputadoras i. Top500 ii. Ejemplos 1. Marenostrum 2. Atlante 3. Teide-HPC b. Empotrados i. Smarphones 4. Referencias Introducción La computación de alto rendimiento es aquella que proporciona una mayor capacidad de cómputo que la que se puede obtener de computadores individuales. Se apoya en tecnologías computacionales como los clusters, supercomputadores o mediante el uso de la computación paralela. La mayoría de las ideas actuales de la computación distribuida se han basado en la computación de alto rendimiento. Clúster El término clúster se aplica a los conjuntos o conglomerados de computadoras construidos mediante la utilización de hardwares comunes y que se comportan como si fuesen una única computadora. La construcción de los ordenadores del clúster es más fácil y económica debido a su flexibilidad: pueden tener todos la misma configuración de hardware y sistema operativo (clúster homogéneo), diferente rendimiento pero con arquitecturas y sistemas operativos similares (clúster semihomogéneo), o tener diferente hardware y sistema operativo (clúster heterogéneo), lo que hace más fácil y económica su construcción. Para que un clúster funcione como tal, no basta solo con conectar entre sí los ordenadores, sino que es necesario proveer un sistema de manejo del clúster, el cual se encargue de interactuar con el usuario y los procesos que corren en él para optimizar el funcionamiento. Características Nodos de cálculo Pueden ser simples ordenadores, sistemas multiprocesador o estaciones de trabajo (workstations). En informática, de forma muy general, un nodo es un punto de intersección o unión de varios elementos que confluyen en el mismo lugar. Ahora bien, dentro de la informática la palabra nodo puede referirse a conceptos diferentes según el ámbito en el que nos movamos: En redes de computadoras cada una de las máquinas es un nodo, y si la red es Internet, cada servidor constituye también un nodo. El clúster puede estar conformado por nodos dedicados o por nodos no dedicados. En un clúster con nodos dedicados, los nodos no disponen de teclado, ratón ni monitor y su uso está exclusivamente dedicado a realizar tareas relacionadas con el clúster. Mientras que, en un clúster con nodos no dedicados, los nodos disponen de teclado, ratón y monitor y su uso no está exclusivamente dedicado a realizar tareas relacionadas con el clúster, el clúster hace uso de los ciclos de reloj que el usuario del computador no está utilizando para realizar sus tareas. Cabe aclarar que a la hora de diseñar un clúster, los nodos deben tener características similares, es decir, deben guardar cierta similaridad de arquitectura y sistemas operativos, ya que si se conforma un clúster con nodos totalmente heterogéneos (existe una diferencia grande entre capacidad de procesadores, memoria, disco duro) será ineficiente debido a que el middleware delegará o asignará todos los procesos al nodo de mayor capacidad de cómputo y solo distribuirá cuando este se encuentre saturado de procesos; por eso es recomendable construir un grupo de ordenadores lo más similares posible. Sistema operativo Un sistema operativo debe ser multiproceso y multiusuario. Otras características deseables son la facilidad de uso y acceso. Un sistema operativo es un programa o conjunto de programas de computadora destinado a permitir una gestión eficaz de sus recursos. Comienza a trabajar cuando se enciende el computador, y gestiona el hardware de la máquina desde los niveles más básicos, permitiendo también la interacción con el usuario. Se puede encontrar normalmente en la mayoría de los aparatos electrónicos que utilicen microprocesadores para funcionar, ya que gracias a estos podemos entender la máquina y que ésta cumpla con sus funciones (teléfonos móviles, reproductores de DVD, radios, computadoras, etc.). Ejemplos GNU/Linux ABC GNU/Linux2 OpenMosix Unix Solaris HP-UX AIX Windows NT 2000 Server Mac OS X Xgrid Conexiones de red Los nodos de un clúster pueden conectarse mediante una simple red Ethernet con placas comunes (adaptadores de red o NICs), o utilizarse tecnologías especiales de alta velocidad como Fast Ethernet, Gigabit Ethernet Myrinet, InfiniBand, SCI, etc. Ethernet Son las redes más utilizadas en la actualidad, debido a su relativo bajo coste. No obstante, su tecnología limita el tamaño de paquete, realizan excesivas comprobaciones de error y sus protocolos no son eficientes, y sus velocidades de transmisión pueden limitar el rendimiento de los clústeres. Para aplicaciones con paralelismo de grano grueso puede suponer una solución acertada. La opción más utilizada en la actualidad es Gigabit Ethernet (1 Gbit/s), siendo emergente la solución 10 Gigabit Ethernet(10 Gbit/s). La latencia de estas tecnologías está en torno a los 30 a 100 μs, dependiendo del protocolo de comunicación empleado. Myrinet (Myrinet 2000 y Myri-10G). Su latencia es de 99 a 10 μs, y su ancho de banda es de 2 a 10 Gbit/s (para Myrinet 2000 y Myri-10G, respectivamente). InfiniBand Es una red surgida de un estándar desarrollado específicamente para realizar la comunicación en clústers. Una de sus mayores ventajas es que mediante la agregación de canales (x1, x4 y x12) permite obtener anchos de banda muy elevados. La conexión básica es de 2 Gbit/s efectivos y con ‘quad connection’ x12 alcanza los 96 Gbit/s. No obstante, los startups no son muy altos, se sitúan en torno a los 10 μs. SCI (scalable coherent interface) IEEE standard 1596-1992 Su latencia teórica es de 1,43 μs y su ancho de banda de 5333 Mbit/s bidireccional. Al poder configurarse con topologías de anillo (1D), toro (2D) e hipercubo (3D) sin necesidad de switch, se tiene una red adecuada para clústers de pequeño y mediano tamaño. Supercomputadoras Una supercomputadora o un superordenador es aquella con capacidades de cálculo muy superiores a las computadoras corrientes y que son usadas con fines específicos. Hoy día los términos de supercomputadora y superordenador están siendo reemplazados por computadora de alto desempeño y ambiente de cómputo de alto desempeño, ya que las supercomputadoras son un conjunto de poderosos ordenadores unidos entre sí para aumentar su potencia de trabajo y desempeño. Al año 2011, los superordenadores más rápidos funcionaban en aproximadamente más de 200 teraflops (que en la jerga de la computación significa que realizan más de 200 billones de operaciones por segundo). Top 500 El proyecto TOP500 es un ranking de las 500 supercomputadoras más poderosas del mundo. Esta lista está recopilada por: Hans Meuer, Universidad de Mannheim(Alemania) Jack Dongarra, Universidad de Tennessee (Knoxville) Erich Strohmaier, NERSC/Lawrence Berkeley National Laboratory Horst Simon, NERSC/Lawrence Berkeley National Laboratory El proyecto se inicia en 1993 y publica una lista actualizada cada seis meses. La primera actualización de cada año se realiza en junio, coincidiendo con la International Supercomputer Conference, y la segunda actualización se realiza en noviembre en la IEEE Supercomputer Conference. Para medir la potencia de los sistemas se utiliza el benchmark HPL, una versión portable del benchmark Linpack para ordenadores de memoria distribuida. Hay que destacar que la lista no incluye sistemas basados en computación GRID ni al supercomputador MDGRAPE-3, que alcanza un Petaflop siendo más poderoso que cualquiera de los sistemas recogidos en la lista, que no puede ejecutar el software de benchmarking utilizado al no ser un supercomputador de propósito general. Máquinas que han ocupado el número 1 NUDT Tianhe-2 ( China, Junio de 2013 - Presente). Cray Titan ( Estados Unidos, Noviembre de 2012 - Junio de 2013). IBM Sequoia ( Estados Unidos, Junio de 2012 – Noviembre de 2012). Fujitsu K computer ( Japón, Junio de 2011 – Junio de 2012) NUDT Tianhe-IA ( China, Noviembre de 2010 - Junio de 2011) Cray Jaguar ( IBM RoadRunner ( Estados Unidos, Junio de 2008 - Noviembre de 2009) IBM Blue Gene/L ( Estados Unidos, Noviembre de 2004 - Junio de 2008) NEC Earth Simulator ( Japón, Junio de 2002 - Noviembre de 2004) IBM ASCI White ( Estados Unidos, Noviembre de 2000 - Junio de 2002) Intel ASCI Red ( Estados Unidos, Junio de 1997 - Noviembre de 2000) Estados Unidos, Noviembre de 2009 - Noviembre de 2010) Hitachi CP-PACS ( Hitachi SR2201 ( Japón, Noviembre de 1996 - Junio de 1997) Japón, Junio de 1996 - Noviembre de 1996) Fujitsu Numerical Wind Tunnel ( Japón, Noviembre de 1994 - Junio de 1996) Intel Paragon XP/S140 ( Estados Unidos, Junio de 1994 - Noviembre de 1994) Fujitsu Numerical Wind Tunnel ( TMC CM-5 ( Japón, Noviembre de 1993 - Junio de 1994) Estados Unidos, Junio de 1993 - Noviembre de 1993) Rmax - La más alta puntuación medida usando el benchmark Linpack. Este es el número que se utiliza para clasificar a las computadoras. Se mide en billones de operaciones de punto de flotante por segundo, es decir, Teraflops. Rpeak - Este es el rendimiento máximo teórico del sistema. Medido en TFLOPS. Marenostrum MareNostrum es el sistema más potente de España, y uno de los más potentes de Europa, según la lista TOP500. Su mejor puesto en dicha lista es el cuarto alcanzado en noviembre de 2004, cuando aún no estaba terminada la construcción (3564 procesadores contra los 4812 que tendría finalmente). Actualmente ocupa la posición 34 en la lista de Top500 El superordenador MareNostrum, situado en el Centro Nacional de Supercomputación en Barcelona, es actualmente uno de los ordenadores más poderosos del continente y uno de los más potentes del mundo según consta en el TOP500 Supercomputing Sites. El MareNostrum comenzó a funcionar a principios de 2005 y desde entonces se ha ampliado notablemente sustituyendo los procesadores originales con procesadores a 2.3 GHz y ampliando el número de éstos. Actualmente la capacidad de cálculo del superordenador alcanza los 94 billones de operaciones por segundo (925.1 teraflops). Con 10.240 procesadores IBM PowerPC 970MP dual-core de 64 bits a 2.3 GHz dispone de un total de 124 Petabytes (PB) de capacidad de almacenamiento y 20 TiB de memoria. Como sistema operativo utiliza la distribución SuSe de Linux. Se puso en marcha el 12 de abril de 2005 presentado por la empresa IBM y por la ministra española de Educación y Ciencia María Jesús San Segundo. Desde entonces se utiliza en la investigación del genoma humano, la estructura de las proteínas y en el diseño de nuevos medicamentos, entre otros. Su uso está disponible para la comunidad científica nacional e internacional, controlada por un comité de asignación que asigna tiempo de cómputo en función de la valía de los proyectos a realizar. Atlante HPC Atlante es un Computador de Altas Prestaciones de acceso público, puesto a disposición de Grupos de I+D+i, Empresas Tecnológicas y Administraciones por el Gobierno de Canarias. Integrado en la Red Española de Supercomputación (RES) desde 2009, está gestionado por el Instituto Tecnológico de Canarias, S.A. y ubicado en el Parque Científico y Tecnológico de la Universidad de Las Palmas de Gran Canaria. Atlante es un supercomputador de memoria distribuída, compuesto por 336 núcleos de computación (cores), 672 GBytes de memoria total y un sistema de almacenamiénto paralelo de 95 TBytes. El sistema operativo es SuSe Linux y su potencia de cálculo pico es 3 TFlops, una potencia de cálculo relativamente pequeña si la comparamos con la de los supercomputadores que forman la lista del Top500. Objetivos Responder a las necesidades de supercomputación de los grupos de I+D de Canarias tanto públicos como privados. Favorecer el desarrollo de capacidades y la excelencia dentro del campo de la supercomputación y sus aplicaciones, así como la integración de los grupos de I+D canarios en redes y consorcios nacionales e internacionales de excelencia relacionados con este campo. Mejorar las opciones de acceso de los grupos de investigación canarios a los recursos de la Red Española de Supercomputación (RES) así como el aprovechamiento del tiempo disponible en los mismos. Ubicación El supercomputador, gestionado por el Instituto Tecnológico de Canarias, S.A., está ubicado en el Edificio Polivalente II del el Campus Universitario de la ULPGC en Tafira, Las Palmas de Gran Canaria. La sala se encuentra refrigerada por una instalación específica de aire acondicionado que evita que la temperatura del equipo se eleve debido al calor que desprende durante su funcionamiento. Cuenta además con un sistema de detección precoz de conatos de incendio y extinción, así como con un sistema de monitorización remoto con cámaras de vídeo y sensores (temperatura, humedad ambiental, estado de los equipos electrónicos, etc…), que, en caso de emergencia, es capaz de alertar a los administradores vía correo electrónico o SMS. Teide HPC El superordenador Teide-HPC, el segundo más potente de España y uno de los 500 mejores del mundo, entró en funcionamiento en el Instituto Tecnológico y de Energías Renovables (ITER) de Granadilla. El TEIDE HPC ha conseguido, situarse en el puesto 138 de la prestigiosa lista “TOP 500”, El Teide-HPC será capaz de alcanzar una potencia de cómputo de 370 TFLOPs (billones de operaciones en coma flotante por segundo), lo que equivaldría a la potencia de cálculo combinada de más de 10.000 ordenadores convencionales de oficina. La máquina es una pieza fundamental del proyecto ALiX para la puesta en marcha de infraestructuras orientadas a la creación de un tejido industrial en torno a la tecnología de la información y la comunicación en Tenerife. La infraestructura está diseñada de forma modular, lo que permite que tenga una capacidad de crecimiento casi ilimitada. A pesar de ello, el director del ITER, Manuel Cendagorta, explicó que el ordenador quedará obsoleto en unos cuatro años, puesto que en ese tiempo podrá construirse una máquina más potente que consuma y ocupe mucho menos espacio. Una de las características de la nueva instalación es su carácter sostenible en materia medioambiental, ya que el consumo energético del superordenador se cubrirá a través de energía procedente de paneles solares y aerogeneradores instalados en el ITER. Funcionamiento Cálculos como los del aumento o envejecimiento de la población, el impacto medioambiental de la actividad humana en la naturaleza o la predicción de los desastres naturales necesitan aparatos como el Teide–HPC, que dará una mejora en la precisión de simulaciones de modelos químicos y físicos, así como predicciones meteorológicas y análisis climáticos, mapas de la Tierra para el estudio de erupciones volcánicas y movimientos sísmicos, simulaciones aerodinámicas, modelado de interacción de moléculas en fármacos y análisis de ADN. El almacenamiento de datos en la conocida como nube digital es uno de los aspectos en los que más atrasado se encuentra España en relación con países como Estados Unidos. Otro de los objetivos del Teide–HPC es el desarrollo de esta herramienta. Este superordenador dará cobertura, además, a tres continentes y se situará como puerta de acceso al vecino africano. Sistemas Empotrados Smartphones Los Smartphones son un ejemplo de sistemas empotrados que utilizan la tecnología HPC ya que pueden ser multi-core además de poseer varios multiprocesadores en un chip. Los smarthpones alcanzan los 100 MegaFlops y en pocos años han conseguido superar la potencia de computación de los ordenadores de sobremesa de hace 10 años. Referencias http://www.laopinion.es/tenerife/2013/10/25/isla-pone-marcha-superordenadorteide/505882.html http://www.top500.org/list/2013/11/?page=2 http://atlante.itccanarias.org/conoce-atlante http://es.wikipedia.org/wiki/MareNostrum http://es.wikipedia.org/wiki/Cl%C3%BAster_(inform%C3%A1tica)#Clasificaci.C3.B3n_de_los_cl.C3. BAsteres