Almacenamiento whitepaper Sistemas Contenido 03 El concepto de Almacenamiento. 04 Glosario. 05 Tipos de Almacenamiento. 06 Storage As a Service. 08 Almacenamiento en Data Center. 09 Tendencias. 10 Recomendaciones 11 El futuro WWW.TRC.ES / WHITEPAPER / ALMACENAMIENTO 2 El concepto de Almacenamiento El almacenamiento es el concepto utilizado para definir los sistemas y dispositivos a través de los cuales se guardan los datos de un usuario. En gran medida, la información se incrementa debido a fenómenos como el cloud y el big data. Lo cierto es que hay un vertiginoso crecimiento diario de los datos. Esto convierte al almacenamiento en un elemento fundamental para proteger, respaldar y mantener disponible los datos de las empresas y para hacer más eficiente la infraestructura IT. Para conseguir una gestión inteligente, existen en el mercado compañías que se encargan de las consultoría, instalación, configuración, puesta en marcha y soporte de soluciones de almacenamiento. Según un análisis de la consultora IDC, durante el segundo semestre de 2012 el mercado del software de almacenamiento creció un 4,1%, a nivel global, generando unos ingresos de 2.580 millones de euros. El negocio de recuperación y protección de datos creció un 8,9% hasta los 960 mil millones de euros. La gestión de dispositivos y almacenamiento se incrementó 9,1% hasta los 500 millones de euros. Se espera que el presupuesto de almacenamiento sea el 30% del total de las inversiones TI de las empresas. La edición de septiembre de la revista Newsbook publicó un especial de “Almacenamiento” en el que se prevé que en los próximos 5 años el mercado crecerá en el mundo a un ritmo de 30%. De acuerdo a un informe del Enteprise Strategy Group, en 2015, se estima que la capacidad acumulada de los archivos digitales mundiales alcance los 300.000 petabytes. Todos estos cálculos reafirman que el crecimiento desmedido de la información impone el desarrollo de nuevos productos que sirvan para gestionarla, respaldarla y tener acceso de una manera más rápida y eficiente. WWW.TRC.ES / WHITEPAPER / ALMACENAMIENTO 3 Glosario Almacenamiento Primario: El que usa el CPU directamente (memoria principal, caché, etc) Almacenamiento Secundario: El CPU no accede directamente y deben almacenarse previamente en uno primario. Son discos magnéticos, ópticos cintas magnéticas, tambores magnéticos y memorias flash. Backup o copias de respaldo: Es la copia total o parcial de información importante del disco duro, bases de datos, CDs y otro medio de almacenamiento. Esta copia debe ser guardada en algún otro sistema de almacenamiento masivo, como ser discos duros, CDs, DVDs o cintas magnéticas (DDS, Travan, AIT, SRL, DLT y VXA). Se utilizan para tener una o más copias de información considerada importante y así poder recuperarla, en caso de pérdida del original. Planes de contingencia: Una pérdida masiva de datos puede traducirse en la paralización del negocio e incluso la quiebra. La reducción tanto de su RPO (Recovery Print Objective) como RTO (Recovery Time Objective) se consigue implantando soluciones de contingencia y continuidad de negocio, mediante la integración de herramientas de backup. Deduplicación: Es una tecnología de reducción de información orientada a eliminar datos redundantes en un sistema de almacenamiento de datos, guardando solo una instancia de cada elemento, con el objetivo de reducir el espacio de almacenamiento y el consumo de ancho de banda de red. Compresión de datos: Aumenta la eficiencia del sistema de almacenamiento y resulta en la reducción del coste del almacenamiento de datos, tal como se representa por $/TB. Cifrado: Codificación de datos en sistemas de almacenamiento. RAID (Redundant Array of Inexpensive Disks): Significa conjunto redundante de discos independientes. Es un sistema que nos permite gestionar varios discos duros dentro de un dispositivo como si fuera uno solo, y la diferencia entre los distintos niveles de RAID está en el modo en el que se comporta el equipo a la hora de manejar los datos. Pérdida física de datos: Los datos desaparecen de la plataforma (CD, cinta...) Pérdida lógica de datos: Eliminación de archivos (por error, por virus...) Gestión del ciclo de vida de la información: El concepto de ILM (Information Lifecycle Management) consiste en gestionar la información, determinando dónde y cómo debe estar guardada para, además de garantizar un buen acceso, optimizar la capacidad del entorno de almacenamiento. ILM es una estrategia que le ayuda mantener un bajo coste total de la propiedad (TCO) y aumentar el valor para su negocio. WWW.TRC.ES / WHITEPAPER / ALMACENAMIENTO 4 Tipos de almacenamiento DAS: Recomendado para pequeñas empresas o como solución de almacenamiento departamental para archivo de ficheros y/o backup en modo local. NAS: En la red NAS un único dispositivo se conecta a las redes de datos, basadas en TCP/IP, a través de interfaces Ethernet y los datos se comparten entre los usuarios de la red. Se utiliza en entornos que requieren tratar un gran volumen de ficheros de pequeño tamaño. Los dispositivos de almacenamiento, que podríamos llamar ready NAS, se conectan directamente a la red local de la empresa pudiendo ser éstos accedidos por servidores y/o estaciones de trabajo a través de LAN tanto a local como en remoto. SAN: En este caso los dispositivos de almacenamiento están conectados a una red de alta velocidad dedicada utilizando tecnología de fibra óptica. Los usuarios acceden a los dispositivos de almacenamientos a través de la red de forma individualizada. Constituye una solución óptima para empresas que requieran un alto rendimiento, manejen un gran volumen de información y precisen frecuentes tareas de protección de datos. IP SAN: Presenta las mismas funcionalidades y ventajas que SAN, pero a un coste inferior y con mayor flexibilidad al tratarse de dispositivos que funcionarán como parte de las redes Ethernet actuales. HÍBRIDO NAS – SAN: Opción a tener en cuenta por organizaciones que precisen tanto soluciones NAS como SAN. Instalando sistemas híbridos las tareas de gestión y mantenimiento se verán simplificadas y los costes operativos reducidos. CLOUD STORAGE: Se trata de una solución del tipo “almacenamiento como servicio” en el que los sistemas de almacenamiento están distribuidos por “la nube”. (Por tratarse de una tendencia en alza, se trata en profundidad más adelante en este documento) WWW.TRC.ES / WHITEPAPER / ALMACENAMIENTO 5 Storage as a service: STaaS Almacenamiento como servicio El incremento de los datos ha puesto a las empresas a buscar opciones que les permitan guardar su información crítica sin que esto le implique el crecimiento físico de sus infraestructuras ni un coste exorbitado y que les proporcione acceso a lecto-escritura en tiempo real y la capacidad de crecer. El almacenamiento como servicio (STaaS) se utiliza para solventar este tipo de retos y también proyectos de backup. El almacenamiento como servicio permite: Pago por consumo: se contrata en función de las necesidades de almacenamiento por lo que evita importantes inversiones periódicas, riesgos de infradimensionamiento, pago por el espacio que no utilizado. Seguridad: los datos viajan y se almacenan cifrados. Es necesario tener en cuenta la localización geográfica de los datos. Si se debe aplicar la LOPD, es necesario informar en el registro de los ficheros de datos si los mismos se encuentran en Europa, en EEUU u otro lugar, lo que requiere en este último caso autorización del Director de la Agencia de Protección de Datos. Redundancia: Los sistemas STaaS permiten tener distintos niveles de redundancia interna (RAID X) y además entre varios centros, dotándolos de redundancia geográfica y tolerancia a caídas. Velocidad de acceso: Los servicios STaaS incluyen distintas modalidades de disco (SSD, SAS, SATA) y, por lo tanto, distintas velocidades de acceso que se amoldan a las necesidades. El concepto de Cloud El cloud o la nube es una solución STaaS para empresas de todos sectores y dimensiones. Es un paradigma que permite ofrecer un sistema informático como un servicio a través de internet a nivel global. Hace posible que un proveedor pueda prescindir de cualquier tipo de hardware. Esto contribuye a la eficiencia energética y a un ahorro de costes importante. Tipos de Cloud Cloud Privada La infraestructura se diseña para el uso exclusivo de un cliente o usuario, no compartidos con otros clientes. En general, son entornos altamente virtualizados gestionados internamente a los que es posible acceder en forma de autoservicio. Garantiza la disponibilidad de los sistemas al 100%, porque los equipos se utilizan de forma dedicada y privada para un cliente. Cloud Personal Empresas pequeñas o incluso unipersonales así como usuarios domésticos se benefician del cloud. Se caracterizan por su sencillez de gestión, administración y mantenimiento. WWW.TRC.ES / WHITEPAPER / ALMACENAMIENTO 6 Cloud Compartida La infraestructura utilizada es compartida por los servicios de diferentes clientes. Esto no quiere decir que la privacidad de la información almacenada quede comprometida, puesto que cada cliente tiene un almacenamiento lógico protegido. Permite mejorar el rendimiento del sistema aprovechando la simultaneidad de utilización de las infraestructuras. Cloud Híbrida Empresas pequeñas o incluso unipersonales así como usuarios domésticos se benefician del cloud. Se caracterizan por su sencillez de gestión, administración y mantenimiento. Ventajas del almacenamiento en Cloud • • • • • • • • Es barato. Al basarse en el pago por uso, cloud storage elimina los gastos de capital (Capex) y los sustituye por un modelo de gastos operativos (Opex). Se consiguen ahorros en personal, ya que la gestión es responsabilidad del proveedor, así como en licencias de software. No requiere instalación. No necesita reemplazar. Tiene sistemas de backup y recuperación, sin presencia física. No requiere condiciones ambientales. No requiere a personal. No necesita energía para poder o enfriamiento. Agilidad de negocio. Dotarse de capacidad y recursos bajo demanda aporta una extraordinaria flexibilidad, escalabilidad y agilidad al negocio a un coste menor. Desventajas del almacenamiento en Cloud • • • Está limitado por el ancho de banda. Las velocidades de Internet y WAN son 10 a 100 veces más lentas que la velocidad de LAN. Presenta fallas de disponibilidad de almacenamiento. La conectividad de la red puede verse afectada por interrupciones de las redes mundiales, erupciones solares, cables subterráneos cortados y daños por satélite. • • ¿Qué tipos de datos se va a almacenar? ¿Qué tipo de almacenamiento: SAN o NAS? Al evaluar necesidades, se debe prever, a partir de los sistemas existentes de datos, cómo se verán los archivos de datos con el paso del tiempo. ¿Cómo son los términos de acuerdo de nivel de servicio SLA? ¿Qué certificaciones tiene el proveedor? ¿Quién es el dueño de los datos? ¿Dónde están los datos, en qué país, cuáles son los derechos legales? ¿Quién puede acceder a mis datos? ¿El personal del CPD? ¿El personal de limpieza? ¿Usan mis datos? Hay que asegurarse de que solo vean el desempeño y la facturación. No permitir que puedan vender la información con fines de marketing. ¿Cómo voy a hacer la migración? ¿Cómo brinda el soporte el operador? ¿Métodos de contacto en caso de fallos? Recursos de autoayuda en caso de emergencia. Análisis antes de almacenar en Cloud • • • • • • • • WWW.TRC.ES / WHITEPAPER / ALMACENAMIENTO 7 Almacenamiento en Data Center Características del Servicio Los Data Center requieren sistemas que no solo guarden la información. También requieren herramientas de monitorización, gestión y recuperación. Algunas de las características que deben cumplir son: • • • • • • Sistemas de almacenamiento de alto rendimiento. Protección de datos avanzada: imágenes (snapshots), replicación remota síncrona y asíncrona con soporte para grupos de consistencia. Integración con sistemas operativos como z/OS o Enterprise UNIX. Aprovisionamiento dinámico y reclamación de espacio para lograr eficiencia de la capacidad. Amplia escalabilidad del rendimiento y la capacidad. Sistemas altamente fiables y disponibles. Estrategia Las empresas deben diseñar estrategias de almacenamiento para facilitar el manejo y la gobernanza de los datos. No se debe comprar productos y soluciones sin haber dibujado el esquema de cómo se quieren guardar los datos. El Data Center requiere un sistema que no solo aloje la información. Debe cumplir requisitos que abarquen, al menos, las necesidades siguientes: Reducir el riesgo: La protección de la información debe incorporar una deduplicación eficaz de las tecnologías para las copias de seguridad y la recuperación ante desastres que se hagan en alta velocidad. Sacar más valor de la información: Capacidades de retención y análisis de la información para unos procesos de archivo y búsqueda rápidos y eficaces, en especial, dentro de los masivos fondos de contenidos con datos de gran volumen. Prestación fluida de servicios de TI: Capacidad para servir información de forma sencilla y eficaz con una compatibilidad total con todas las aplicaciones y tipos de datos, en entornos físicos, virtuales y en la nube Las empresas deben adoptar soluciones de almacenamiento que ofrezcan: • • • • • • • • • • Robustez. Velocidad y agilidad de proceso y de acceso a los datos. Alto rendimiento en condiciones extremas. Flexibilidad en su escalado. Versatilidad en su gestión. Fiabilidad. Alta disponibilidad. Consolidación y compartición de datos en distintas plataformas. Soporte. Seguridad. WWW.TRC.ES / WHITEPAPER / ALMACENAMIENTO 8 Tendencias Los grandes fabricantes y las consultoras hacen cálculos y aproximaciones sobre cómo evolucionará el mercado del almacenamiento para los próximos tres años. A continuación se presentan una recopilación de las tendencias del sector: La implementación de tecnologías SSD flash sustituye al almacenamiento de disco. Son memorias de estado sólido/ flash que ofrecen una lectura de datos 100 veces más rápida que las de disco, reducen el gasto en licencias e incrementan el uso de los equipos y la densidad del almacenamiento. Es una tecnología fiable y eficiente que propicia un menor consumo energético. En un informe sobre el mercado de los discos duros, Gartner estima que, en cinco años, la venta de unidades flash con respecto se multiplicará 163 veces con respecto a la actualidad. Big Data: La explosión de datos no estructurados y las aplicaciones móviles generarán una gran oportunidad para la creación de valor en los negocios. El enorme crecimiento de datos hará que sea imposible replicar o realizar una copia de seguridad por medios tradicionales. Habrá una mayor adopción de plataformas de contenidos que se preparan para el análisis de grandes cantidades de datos. Virtualización: Los dispositivos serán reemplazados por nuevas capacidades de virtualización, que eliminarán la necesidad de reiniciar el sistema. Las aplicaciones nivel 1 se virtualizan. Los esfuerzos para virtualizar aún más el Data Center continúan y se observará el aumento de la movilización de las aplicaciones de nivel 1 (ERP, bases de datos, sistemas de e-mail, OLTP etc.) hacia las plataformas de virtualización. Adopción del Cloud: Este modelo se extenderá al centro de datos para reducir los costos de adquisición de infraestructura de almacenamiento. Crecimiento: Se incrementará la necesidad de las empresas de crecer sus sistemas de almacenamiento, de manera no disruptiva. Automatización: En lugar de más disco hardware para satisfacer la capacidad bruta, los usuarios quieren automatización, gestión automática del almacenamiento, escalabilidad, rápido aprovisionamiento, gran rendimiento, y los altos niveles de continuidad del negocio. La arquitectura del software de almacenamiento es más importante que el hardware. En adelante, las tecnologías TI necesitarán incorporar el software de almacenamiento definitivamente como un elemento esencial de los data centers. Se crea la necesidad de un hipervisor de almacenamiento: El hipervisor tiene que virtualizar los recursos de almacenamiento para lograr: agilidad, eficiencia y flexibilidad. Eficiencia: Habrá un mayor enfoque en tecnologías que contribuyan a la eficiencia, tales como la virtualización y aprovisionamiento dinámico o por niveles. Consolidación: Los clientes se centrarán en la convergencia de servidores, plataformas de almacenamiento, redes y aplicaciones. Transparencia: Las aplicaciones y la infraestructura serán más transparentes entre sí. Eficiencia energética: Las demandas de ahorro en consumo de energía y la obligación de disminuir la huella de carbono se incrementa. WWW.TRC.ES / WHITEPAPER / ALMACENAMIENTO 9 Recomendaciones La consultora IDC estima que, entre 2013 y 2020, los departamentos de TI de las empresas tendrán 10 veces más servidores tanto físicos como virtuales para administrar 50 veces más información, debido a que la cantidad de datos que se genera a nivel mundial se duplica cada año. El acelerado crecimiento de los datos está aumentando los costos y creando complejidades y riesgos sin precedentes en todo tipo y tamaño de organizaciones. Parece inminente que las empresas deben integrar su negocio con la gestión del almacenamiento para poder enfrentar el incremento de los datos. Los grandes fabricantes recomiendan Facilitar la nube. El cloud contribuye a la agilidad de los proceso. Esto permite entregar más servicios de valor agregado a usuarios de negocio. Además reduce o eliminar los gastos de capital. Archivar primero. Al archivar los datos estructurados para reducir la carga en almacenamiento primario, las organizaciones pueden mejorar la gobernabilidad de datos, y así limitar la extensión de espacio y reducir los costos generales de almacenamiento en más de 25%. Virtualizar más. Colocar más cargas de trabajo en menos sistemas. Al hacerlo se consigue mejorar la eficiencia, un manejo simplificado y costos reducidos de energía y refrigeración. Distribuir la eficiencia en TI. Centralizar los datos y reducir los requisitos de recursos TI. Se simplifica la administración, aumenta la protección de datos y se educir el riesgo de pérdida o mal manejo de datos. WWW.TRC.ES / WHITEPAPER / ALMACENAMIENTO 10 El futuro. El cristal de Superman La evolución del almacenamiento ha sido acelerada y la innovación en el área no para. Este documento técnico no quiere especular sobre el futuro de las tecnologías. Sin embargo, os dejamos una noticia publicada en medios de todo el mundo en la que se explica cómo podría ser el almacenamiento en los tiempos por venir. En julio de 2013, investigadores de la Universidad de Southampton en el Reino Unido grabaron de manera exitosa una copia digital de 300KB de un archivo de texto en un vidrio nanoestructurado en 5D, usando un láser de pulso ultrarrápido e intenso. El archivo fue escrito en tres capas de puntos nanoestructurados separados por cinco micrómetros (cinco millonésimas de metro). Los científicos usaron un láser que emite pulsos de luz en femtosegundos (una milbillonésima parte de un segundo). El láser 5D de lectura/escritura puede grabar hasta un estimado de 360TB/disco de capacidad de datos en un vidrio nanoestructurado con capacidad de estabilidad térmica de hasta mil grados Celsius, y un tiempo de vida útil prácticamente ilimitado. Llamaron al vidrio el “cristal de memoria Superman”, aludiendo a los “cristales de memoria” usados en las películas de Superman para almacenar la historia y el conocimiento colectivo de la civilización del planeta Kriptón. Grabaron mediante nanoestructuras autoensambladas creadas en cristal de cuarzo, que, según los investigadores, pueden almacenar vastas cantidades de datos por más de un millón de años. La codificación de la información se produce en cinco dimensiones que incluyen el tamaño y la orientación, además de las tres posiciones dimensionales de estas nanoestructuras. Las estructuras autoensambladas cambian la forma en que la luz viaja a través del vidrio, modificando la polarización de la luz que puede ser leída mediante la combinación de un microscopio óptico y un polarizador, similar al que se encuentra en los anteojos para sol de Polaroid. WWW.TRC.ES / WHITEPAPER / ALMACENAMIENTO 11 Sedes Red oficinas TRC SEDE CENTRAL PAÍS VASCO TRC MADRID GALICIA Albasanz, 25 28037. Madrid CASTILLA-LEÓN i+D [email protected] CASTILLA-LA MANCHA 91 267 01 00 MADRID SEDE CENTRAL LEVANTE TRC. CASTILLA-LEÓN TRC. CASTILLA-LA MANCHA TRC. GALICIA Parque Tec. del Boecillo Ed. Centro. Módulo 108. 47151 Boecillo. Valladolid. Parque Tec. de Guadalajara Av. de Buendía, 11. 19005 Guadalajara. Edificio CITEXVI Parque Científico y Tecnológico Universitario de Vigo. Local 24. 1ª Planta. 36310 Vigo. Pontevedra. [email protected] [email protected] [email protected] 983 54 82 64 / 66 986 35 81 05 TRC. LEVANTE TRC. PAÍS VASCO [email protected] [email protected]