Validación de laboratorio Informe EMC Data Domain y Avamar Eficiencia y rendimiento para la protección de datos de VMware Por Kerry Dolan, analista de laboratorio Octubre de 2015 © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 2 Contenido Introducción .................................................................................................................................................. 3 Antecedentes............................................................................................................................................................ 3 Validación de ESG Lab................................................................................................................................... 6 Facilidad de integración............................................................................................................................................ 6 Rendimiento y eficiencia .......................................................................................................................................... 9 Puntos destacados de la validación de ESG Lab ......................................................................................... 17 Temas que deben tenerse en cuenta ......................................................................................................... 17 La gran verdad ............................................................................................................................................ 18 Apéndice ..................................................................................................................................................... 20 Informes de ESG Lab El objetivo de los informes de ESG Lab es educar a los profesionales de TI acerca de productos de tecnología del centro de datos para empresas de todos los tipos y tamaños. Los informes de ESG Lab no pretenden reemplazar el proceso de evaluación que se debe llevar a cabo antes de tomar decisiones de compra, sino proporcionar información valiosa de estas tecnologías emergentes. Nuestro objetivo es analizar algunas de las características/funciones más valiosas de los productos, mostrar cómo se pueden utilizar para resolver los problemas reales de los clientes e identificar las áreas que necesitan mejoras. La perspectiva de terceros expertos de ESG Lab se basa en nuestras propias pruebas prácticas, así como en entrevistas con clientes que utilizan los productos en ambientes de producción. Este informe de ESG Lab fue patrocinado por EMC. Todos los nombres de marcas comerciales son propiedad de sus respectivas empresas. La información incluida en esta publicación se obtuvo por medio de fuentes que The Enterprise Strategy Group (ESG) considera confiables, pero no está garantizada por ESG. Esta publicación puede contener opiniones de ESG que están sujetas a cambios periódicos. Los derechos de esta publicación pertenecen a The Enterprise Strategy Group, Inc. Cualquier reproducción o redistribución de esta publicación, en su totalidad o en parte, ya sea en formato impreso, electrónico o de otro tipo, a personas no autorizadas para recibirla sin el consentimiento expreso de The Enterprise Strategy Group, Inc., constituye una violación de las leyes de derechos de autor de los Estados Unidos y estará sujeta a una acción por daños civiles y, en caso de ser pertinente, a un juicio penal. Si tiene consultas, comuníquese con ESG Client Relations llamando al 508-482-0188. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 3 Introducción El presente informe documenta las pruebas prácticas y la validación de una solución de protección de datos de EMC para los ambientes virtuales que usan Avamar Virtual Edition con un sistema Data Domain, y se enfoca en la facilidad de integración, en la eficiencia, en la escalabilidad y en el rendimiento de respaldo/restauración. Antecedentes De acuerdo con la investigación de ESG, durante los últimos cinco años, los profesionales de TI han identificado constantemente la mejora de los procesos de respaldo y recuperación de datos, la administración del crecimiento de datos y el aumento del uso de virtualización de servidores entre sus principales prioridades de TI. En la encuesta 2015 IT Spending Intentions Survey de ESG, solo se mencionaron con más frecuencia las iniciativas de seguridad de la información (consulte la figura 1).1 Uno de los retos para las organizaciones es que el crecimiento de datos tiene un gran impacto en el respaldo y en la recuperación de datos: Los volúmenes de datos en constante expansión prolongan las ventanas de respaldo y los tiempos de recuperación, generalmente hasta el punto de interferir con las actividades de producción, mientras demandan cantidades crecientes de almacenamiento de back-end. Figura 1. Las 10 prioridades de TI más mencionadas de 2015 Top 10 most IT priorities the next durante 12 months. (Percent of Las 10important prioridades de TI másover importantes los próximos 12respondents, meses. N=601, ten responses accepted) (Porcentaje de encuestados, N = 601, se aceptan diez respuestas) Iniciativas Information de seguridad security de la información initiatives 34 % 34% Mejora dedata los procesos de respaldo y Improving backup and recovery 26 % 26% data Administración delManaging crecimiento degrowth datos 26% 26 % recuperación de datos Increasing use of serverde virtualization Mayor uso de virtualización servidores 25% 25 % Desktop virtualization 25% 25 % Using cloud infrastructurede services Uso de servicios de infraestructura nube 25% 25 % Virtualización de escritorio Iniciativas de cumplimiento normas Regulatory compliancedeinitiatives 24 % 24% Programas de continuidad del negocio o Business continuity/disaster recovery recuperación de programs desastres 23% 23 % Building a “private cloud” infrastructure Creación de una infraestructura de “nube privada” 22 % 22% collaboration capabilities Mejora deImproving las funcionalidades de colaboración 22% 22 % 00% % 10% 10 % 20% 20 % 30% 30 % 40%% 40 Fuente: Enterprise Strategy Group, 2015. Además, muchas organizaciones tienen dificultades para encontrar la mejor opción para proteger sus máquinas virtuales (VM) de VMware en constante crecimiento. Cada máquina virtual requiere un trabajo de respaldo individual, que puede ser difícil a escala. Las soluciones de respaldo tradicionales luchan con los recursos compartidos de las máquinas virtuales y, como consecuencia, ponen en riesgo los SLA. Los respaldos de las máquinas virtuales, generalmente, incluyen SO, aplicaciones y datos en archivos redundantes. Las enormes cantidades de datos suelen generar respaldos que no se pueden completar durante las ventanas de respaldo sin 1 Fuente: Informe de investigación de ESG, 2015 IT Spending Intentions Survey, febrero de 2015. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 4 dejar algunas máquinas virtuales sin protección, y administrar todos esos respaldos puede ser algo muy complicado en términos de operación. Otro reto es que la ejecución de respaldos virtuales y físicos separados da lugar a más servidores, almacenamiento y software para comprar y administrar, lo cual aumenta los costos y la complejidad. EMC Data Domain y Avamar Esta solución de protección de datos de EMC combina el software de respaldo/recuperación simple y eficiente de Avamar con el rendimiento, la escala y la eficiencia del sistema Data Domain. Data Domain Los sistemas Data Domain son dispositivos de almacenamiento con protección especialmente diseñados y altamente escalables que proporcionan deduplicación de alta velocidad para respaldo y archiving, y replicación para la recuperación de desastres. La familia de modelos puede escalar hasta 86.4 PB de capacidad lógica. La deduplicación de longitud variable maximiza las tasas de deduplicación, ya que reduce los requisitos de almacenamiento para archivo y de respaldo en un promedio de 10 a 30 veces, lo que hace que Data Domain sea una alternativa rentable respecto de otras cintas o dispositivos de respaldo. Estos sistemas proporcionan un objetivo para una amplia variedad de cargas de trabajo de archiving y respaldo empresarial, lo que incluye máquinas virtuales, bases de datos, mainframe, sistemas IBM i, NAS, correo electrónico, big data, aplicaciones de administración de contenido y oficinas remotas. Los sistemas Data Domain son compatibles con datos de archivo y de respaldo simultáneamente, lo que elimina la necesidad de comprar y administrar una plataforma de almacenamiento diferente para el archiving, y también permite la deduplicación global en los datos de respaldo y de archivo. Se incorpora el multiusuario seguro en Data Domain Operating System (DD OS), lo que permite la protección de datos como servicio en función de la nube híbrida para empresas o proveedores de servicios. La instalación simple y la administración sencilla garantizan gastos operacionales más bajos. Los sistemas Data Domain cuentan con la arquitectura de invulnerabilidad de datos de EMC Data Domain para lograr la máxima confiabilidad e integridad de datos, mediante la verificación en línea de escritura y lectura, y la recuperación automática de errores de I/O durante la recopilación y la recuperación. Esto garantiza que el respaldo y la recuperación se completen de manera satisfactoria. Data Domain proporciona una amplia variedad de opciones de respaldo gracias a su compatibilidad con NFS, CIFS, VTL, NDMP y Data Domain Boost; este último se integra con aplicaciones empresariales y de respaldo para acelerar considerablemente los respaldos y reducir la utilización de la red. Avamar El software de respaldo de Avamar ofrece respaldos completos diarios con deduplicación de longitud variable para los ambientes VMware, así como para aplicaciones críticas de negocios, NAS, escritorios/laptops y oficinas remotas. Avamar puede implementarse con un dispositivo físico para los metadatos o mediante el dispositivo Avamar Virtual Edition, como se utilizó en esta prueba. Cuando se combina Avamar con Data Domain, el código DD Boost incluido en el cliente Avamar se utiliza con el fin de distribuir partes del procesamiento de deduplicación para el lado del cliente, lo que reduce los datos de respaldo y requiere menos ancho de banda. La administración web de Avamar proporciona control central a través de una implementación global; también se puede administrar mediante vSphere. Para los ambientes VMware, tanto los respaldos a nivel de huésped como a nivel de imagen son compatibles. Avamar se integra con las API de VMware vStorage para protección de datos (VADP), lo que permite respaldos a nivel de huésped sin agentes. Para los respaldos a nivel de imagen, Avamar descarga el proceso de respaldo de las máquinas virtuales de aplicaciones a varias máquinas virtuales de proxy según sea necesario, y balancea la carga de manera inteligente entre estas. Avamar también aprovecha VMware Change Block Tracking (CBT) para acelerar las operaciones de respaldo y de restauración. Después del respaldo completo inicial, Avamar transfiere únicamente los datos modificados, pero crea un punto de recuperación completa para la restauración. Este método completo sin límites ofrece un rendimiento rápido para las operaciones de restauración y de respaldo. En comparación, los métodos tradicionales requieren la reversión al respaldo completo más reciente y, luego, el almacenamiento © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 5 provisional de los respaldos incrementales subsiguientes, lo que tarda más tiempo y, a veces, afecta la confiabilidad de la recuperación. Avamar proporciona una recuperación rápida en un solo paso de todas las máquinas virtuales o de todos los archivos individuales. Además, se puede acceder instantáneamente a las imágenes de las máquinas virtuales de Avamar almacenadas en el sistema Data Domain objetivo, una técnica frecuentemente utilizada para las pruebas/el desarrollo y la validación de la recuperación. Las máquinas virtuales se pueden ejecutar directamente en Data Domain para su uso inmediato, mientras que la máquina virtual en ejecución se transfiere de vuelta a la ubicación original en segundo plano a través de vMotion. Solución probada: EMC Data Domain y Avamar ESG Lab probó una solución de protección de datos de EMC que incluía Data Domain y Avamar con el ambiente virtual alojado en un arreglo de almacenamiento todo flash EMC XtremIO. La figura 2 proporciona una descripción general conceptual de la solución. A la izquierda, un hipervisor VMware ESX aloja varias máquinas virtuales de aplicaciones, la máquina virtual de Avamar Virtual Edition y máquinas virtuales de proxy. El tablero de Avamar Administrator se muestra en la parte superior. Una máquina virtual de proxy aprovecha VMware CBT para identificar los datos modificados. Con el aprovechamiento de DD Boost, las partes del proceso de deduplicación de Data Domain se distribuyen a Avamar, donde la deduplicación del lado del cliente garantiza solo el envío de los datos únicos desde el cliente Avamar hasta Data Domain. El sistema Data Domain altamente escalable puede funcionar simultáneamente como objetivo para otras cargas de trabajo de archiving y de respaldo, como se muestra a la derecha. Para esta prueba, se utilizó XtremIO como la plataforma de almacenamiento del lado del cliente para eliminar la posibilidad de un cuello de botella de almacenamiento. Figura 2. Descripción general de la solución: EMC Avamar y Data Domain Avamar Administrator Metadatos VM 1 VM 2 VM de Máquinas virtuales del proxy Avamar VE Respaldo de RMAN VMware ESXi Respaldo LAN LAN Respaldo de mainframe VADP/CBT VMDK VM1 VMDK VM2 Data Domain © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Archiving Validación de laboratorio: EMC Data Domain y Avamar 6 Validación de ESG Lab ESG Lab llevó a cabo pruebas prácticas y auditorías de pruebas realizadas en uno de los laboratorios de EMC de Hopkinton, Massachusetts. Las pruebas se diseñaron para demostrar la facilidad de integración de Avamar y Data Domain, la eficiencia de la capacidad y del uso de CPU, y el rendimiento de respaldo y restauración, todo con un enfoque en los respaldos de VMware. Facilidad de integración Los sistemas EMC Avamar y EMC Data Domain son extremadamente simples de integrar, lo que permite que las organizaciones aprovechen la escalabilidad y la protección integrada de Data Domain para los respaldos de Avamar. ESG Lab auditó el procedimiento de integración, que se llevó a cabo en unos pocos pasos y en menos de cinco minutos. Prueba de ESG Lab Mediante un sistema Data Domain DD4500 encendido y conectado a la red, el primer paso fue agregar el sistema Data Domain para que Avamar utilizara como objetivo. El aprovisionamiento se puede realizar completamente dentro de la consola de administración de Avamar Administrator, sin tener que ejecutar la GUI o la CLI de Data Domain System Manager. La GUI de Avamar Administrator en la figura 3 (izquierda) muestra la pestaña Server, que indica las configuraciones del sistema de back-end. La esquina superior derecha de la pantalla muestra un servidor Avamar disponible para la capacidad de back-end. Figura 3. Adición del sistema Data Domain a través de la consola de Avamar Administrator El próximo paso fue hacer clic en la pestaña Server, seleccionar la pestaña Server Management y, luego, seleccionar Add Data Domain System (figura 3, a la derecha). En la pestaña System, se agregó el nombre de sistema calificado (dd4500a), así como las credenciales y el nombre de cuenta de DD Boost (que se crearon durante © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 7 la configuración de dd4500a). Esto autenticó el sistema objetivo, y activó permisos de escritura para clientes Avamar. Un ajuste clave es la cantidad total de flujos de respaldo del cliente Avamar que se pueden ejecutar al mismo tiempo; en este caso, se activaron 270 flujos. Dado que Data Domain puede funcionar como objetivo para varias tareas de respaldo y archiving simultáneamente, es importante garantizar el equilibrio óptimo a fin de evitar que una aplicación suscriba en exceso el sistema Data Domain objetivo de forma no intencional. Luego, se agregaron detalles de SNMP para permitir que Avamar recopilara y mostrara los detalles con respecto al estado del sistema, a las alertas y a la capacidad. Una vez que se completaron estos pasos, ESG Lab pudo ver el sistema Data Domain objetivo dentro del tablero de Avamar Administrator (figura 4, arriba). Además, desde las pestañas Server/Server Management, pudimos hacer clic en el ícono dd de la barra de herramientas y ver los detalles del sistema dd4500a recientemente agregado, incluido el nombre del host, la capacidad utilizada y la disponible, los bytes protegidos, el estado de replicación, el límite de flujos, y los estados de cifrado, autenticación y monitoreo (figura 4, abajo). Figura 4. Administración de Data Domain desde la GUI de Avamar Administrator Con el dd4500a objetivo configurado adecuadamente, el último paso fue crear una política de respaldo de Avamar para las máquinas virtuales de VMware. Para el trabajo de respaldo titulado VM_Test, se seleccionó la pestaña Options. En el cuadro desplegable, seleccionamos Linux VMware Image y, luego, seleccionamos la casilla para utilizar Change Block Tracking. A continuación, hicimos clic en la casilla de verificación Store Backup on Data Domain system, seleccionamos dd4500a de la lista de objetivos disponibles e hicimos clic en OK. En este punto, el siguiente respaldo manual o calendarizado para el conjunto de datos VM_Test enviaría los datos directamente al sistema Data Domain objetivo. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 8 Figura 5. Creación de una política de respaldo Por qué es importante La flexibilidad de los centros de datos virtualizados actuales es un beneficio para los negocios, pero puede ser un gran reto para la TI y, particularmente, para los administradores de respaldo. Muchas organizaciones ejecutan sistemas aislados de infraestructura y aplicaciones de respaldo diferentes para los conjuntos de datos físicos y virtuales, o para distintas aplicaciones empresariales. Esto quita tiempo valioso, extiende las ventanas de respaldo, lo que puede interferir en las actividades de producción, y aumenta los gastos operacionales y de capital. ESG Lab validó la integración rápida y sencilla y la creación de la política para la solución combinada Avamar/Data Domain. En solo unos pocos pasos y en menos de cinco minutos, se agregó el sistema Data Domain objetivo a través de la consola de Avamar Administrator y se creó una política de respaldo de máquinas virtuales. La facilidad y la velocidad de integración hacen que sea una elección sencilla para los administradores que desean consolidar los respaldos de una amplia variedad de aplicaciones, sistemas y ubicaciones con componentes flexibles y de funciones completas de Avamar y Data Domain. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 9 Rendimiento y eficiencia El rendimiento de respaldo y restauración tiene un gran impacto en las operaciones de producción. La velocidad de los respaldos generalmente marca la diferencia entre completar el trabajo para todas las máquinas virtuales dentro de una ventana de respaldo y dejar datos desprotegidos; la capacidad de restaurar velozmente permite la reanudación rápida del negocio. La solución combinada Avamar/Data Domain ejecuta un respaldo de máquinas virtuales extremadamente eficiente, mediante la deduplicación avanzada para reducir considerablemente la cantidad de datos que se deben transferir y almacenar, lo que, a su vez, aumenta significativamente el rendimiento de respaldo. Además, el uso eficiente de los recursos de CPU del host durante los respaldos es un factor importante para los ambientes virtuales, ya que garantiza que el procesamiento de protección de datos no interfiera con las actividades de producción. Metodología de respaldo de Data Domain y Avamar Un diferenciador clave de la solución Avamar/Data Domain es la metodología de respaldo. Después de un respaldo completo inicial, solo los respaldos incrementales se realizan mediante Avamar. La integración con VMware CBT garantiza el respaldo subsiguiente solo de datos nuevos o modificados, y DD Boost garantiza solo el envío de datos únicos de Avamar a Data Domain. Los metadatos siempre se almacenan en un archivo diferente, lo que permite que Avamar busque con rapidez los datos que se desean para la recuperación. Los datos modificados que se respaldan se aplican a los datos de respaldo anteriores para crear un punto de recuperación después de cada respaldo incremental. Esto significa que cada respaldo con Avamar demora el tiempo de un respaldo incremental, pero en realidad se representa como un respaldo completo, lo que hace que la recuperación sea más rápida y eficiente. Esta funcionalidad completa y sin límites elimina la necesidad de que TI ejecute respaldos completos adicionales de manera habitual y actualice el catálogo, como hacen las aplicaciones de respaldo tradicionales (consulte la figura 6). Estos respaldos completos adicionales requieren tiempo y esfuerzo. Además, el proceso de restauración a través del método tradicional requiere revertir el respaldo completo más reciente y los respaldos incrementales subsiguientes, un proceso engorroso que puede provocar demoras y ser poco confiable. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 10 Figura 6. Método completo sin límites de Avamar/Data Domain frente al método tradicional Avamar y Data Domain Enero Respaldo completo inicial Febrero Completo sin límites Soluciones de respaldo tradicionales Enero Febrero Incrementales Respaldo completo inicial Incrementales Respaldo completo, actualización de catálogo Incrementales Respaldo completo, actualización de catálogo Incrementales Respaldo completo, actualización de catálogo Respaldo completo, actualización de catálogo Restauración y respaldo de máquinas virtuales a nivel de imagen con Avamar Debido a que Avamar está estrechamente integrado con VADP, los respaldos a nivel de imagen aprovechan las máquinas virtuales de proxy para descargar el procesamiento de respaldo y deduplicación desde las máquinas virtuales del cliente. vSphere se utiliza para conectar dinámicamente las máquinas virtuales del cliente a la máquina virtual de proxy de Avamar (con un balanceo de carga entre múltiples proxis) sin transferir datos por medio de la red, lo que permite respaldos rápidos de varias máquinas virtuales. VMware CBT acelera aún más el respaldo enviando una lista de los bloques modificados al software de Avamar. Luego, con el aprovechamiento de DD Boost, los bloques se dividen en segmentos de longitud variable y se deduplican antes de enviarlos a Data Domain. CBT también se puede utilizar para restaurar rápidamente los datos modificados a una máquina virtual existente. Avamar hace un seguimiento del estado actual de máquina virtual y de los registros de CBT, identifica qué bloques del punto de recuperación deseado deben restaurarse y los restaura rápidamente. Prueba de ESG Lab Para la prueba de rendimiento y eficiencia, ESG Lab aprovechó dos servidores VMware vCenter ESX 5.5 alojados en servidores dobles Cisco UCS 240; cada servidor UCS alojó 50 máquinas virtuales, con un total de 200 máquinas virtuales. El almacenamiento de los servidores consistió en dos módulos XtremIO con una capacidad útil de 7.56 TB cada uno. La protección de datos fue proporcionada por un dispositivo virtual Avamar Virtual Edition 7.2 y un sistema Data Domain DD4500 con una capacidad útil de 86 TB, aprovechando puertos de 10 GbE. Los datos de prueba (varios archivos de aproximadamente 1 MB cada uno) se generaron y se modificaron para el procesamiento de respaldo a través de una herramienta interna (Data Gen) y proporcionaron un conjunto de datos coherente entre varias instancias de prueba. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 11 Se emplearon tres procedimientos de prueba: Prueba de ciclo de respaldo simulado de 28 días mediante 200 máquinas virtuales. Prueba de restauración simulada mediante 31 máquinas virtuales con restauración de CBT. Prueba de escala de respaldo simulada mediante 200 máquinas virtuales. Cada máquina virtual contaba con aproximadamente 70 GB de datos, incluido el sistema operativo y los datos en archivos generados para crear datos de respaldo inicial y datos nuevos/modificados entre los respaldos. Las métricas se registraron respecto de la deduplicación, del rendimiento del tiempo de ejecución del respaldo/de la restauración, y de la CPU. Cada prueba se completó tres veces para evaluar la consistencia de los resultados. Se utilizaron pruebas prácticas y auditorías de pruebas ejecutadas anteriormente. En primer lugar, ESG Lab observó la eficiencia de capacidad que ofrece la solución Avamar/Data Domain, a partir de la prueba de ciclo de respaldo simulado de 28 días mediante 200 máquinas virtuales. Para cada ejecución de pruebas, la herramienta Data Gen creó un sistema de archivos simulado, que incluyó directorios y archivos, de aproximadamente 50 GB por máquina virtual. Se realizó un respaldo completo inicial, y a continuación, se utilizó la herramienta para generar un 4 % de datos modificados y un 0.125 % de datos nuevos por cliente. Luego, se ejecutó un respaldo incremental. Esto se ejecutó 28 veces para simular un ciclo de respaldo típico de cuatro semanas. Debido al método completo sin límites que utiliza Avamar, solo se necesita un único respaldo completo. Se completaron tres ejecuciones de pruebas con un restablecimiento completo entre estas para garantizar un ambiente limpio. ESG Lab auditó los archivos de registro de cada prueba para recopilar las estadísticas de deduplicación. Las tres ejecuciones de la prueba de respaldo completo de 28 días fueron virtualmente idénticas. En la figura 7, se muestran los datos de una iteración de prueba. Figura 7. Deduplicación durante la prueba de respaldo de 28 días Deduplicación: Prueba28-Day de respaldo deTest 28 días Deduplication: Backup 450 400 350 300 TiB TiB 250 Tasa de deduplicación Dedupe rate 72.3 x de 72.3 veces 200 150 100 50 0 Dataprotegidos Protected Datos Data Stored after Dedupe/Compression Datos almacenados después de la deduplicación/compresión Qué significan los números La cantidad de datos protegidos de máquinas virtuales fue de 402.15 TiB. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 12 La cantidad de datos almacenados en Data Domain después de la compresión y de la deduplicación fue de 5.56 TiB. La reducción de capacidad de esta prueba fue del 98.6 %, lo que genera una tasa de deduplicación de 72.3 veces. A continuación, ESG Lab analizó el rendimiento de respaldo del ciclo de respaldo de 28 días. Como se muestra en la figura 8, el respaldo inicial de 200 clientes de máquinas virtuales (de 70 GB cada una) demoró dos horas y 56 minutos en completarse. Después de esto, cada respaldo incremental con un 4 % de datos modificados y un 0.125 % de datos nuevos demoró entre 7 y 10 minutos. Figura 8. Rendimiento de respaldo 28-day Test Runtimede ejecución Prueba de respaldo de Backup: 28 días: Tiempo 200.00 180.00 160.00 Minutos Minutes 140.00 120.00 100.00 80.00 60.00 40.00 20.00 0.00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 Qué significan los números El tiempo de ejecución del respaldo completo inicial fue de 176 minutos (2:56:12). El tiempo de ejecución de los 28 respaldos incrementales fue de 8.68 minutos en promedio. A pesar de que se transfirieron solo los datos incrementales, cada punto de recuperación representa una imagen completa del cliente. El gráfico conceptual de la figura 9 demuestra la eficiencia de capacidad y las ventajas relacionadas con el tiempo de ejecución de la solución. El lado izquierdo de la figura representa las máquinas virtuales, incluida la capacidad total protegida. CBT y el procesamiento de deduplicación de la solución reducen la cantidad de datos que se deben transferir y aceleran el tiempo de ejecución del respaldo. En este caso, se transfirió un promedio de 19.8 GiB por día, lo que genera un tiempo de ejecución del respaldo diario promedio de 8.68 minutos. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 13 Figura 9. Reducción de datos y tiempo de ejecución del respaldo Prueba de respaldo de 28 días: Tiempo de ejecución del respaldo y transferencia de datos Datos protegidos: 402.15 TiB Datos almacenados: 5.56 TiB LAN Tiempo de ejecución del respaldo diario promedio: 8.68 min. Transferencia de datos diaria promedio: 19.8 GiB Luego, ESG Lab analizó los datos para una prueba de restauración a través de CBT. Después del restablecimiento completo del ambiente, se generó otro conjunto de datos de 50 GB para 31 máquinas virtuales, lo que creó máquinas virtuales de 70 GB cada una. Después de que se realizara un respaldo completo inicial, se ejecutó un solo ciclo de modificación de datos. Luego, se llevaron a cabo las restauraciones de CBT para una sola máquina virtual, para 10 máquinas virtuales de forma simultánea y, por último, para 20 máquinas virtuales de forma simultánea. Esto simula la restauración después del daño o de la reversión de los datos de las aplicaciones a un momento específico para una máquina virtual o para un grupo de máquinas virtuales. La figura 10 muestra el tiempo de ejecución de restauración promedio de las tres instancias de prueba. Figura 10. Rendimiento de restauración Tiempo de ejecución de restauración a medida que escalan los Restore Time as Clients Scale clientes Restore 20clientes Clients Restauración de 20 Restauración de 10 Restore 10clientes Clients Restauración de 11cliente Restore Client 0 2 4 6 8 10 12 14 Minutos Minutes © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. 16 18 Validación de laboratorio: EMC Data Domain y Avamar 14 Qué significan los números Solo los datos modificados, aproximadamente 1.5 GB, requirieron una restauración para cada máquina virtual. El rendimiento de restauración para un solo cliente fue de 7 minutos en promedio. El rendimiento de restauración para 10 clientes fue de 10.5 minutos en promedio. El rendimiento de restauración para 20 clientes fue de 15 minutos en promedio. Luego, ESG Lab analizó la sobrecarga de CPU necesaria para las pruebas de respaldo. El procesamiento de respaldo con la solución Avamar/Data Domain incluye deduplicación que se distribuye entre el cliente y el objetivo. ESG Lab auditó los archivos de registro para la prueba de respaldo de 28 días a fin de determinar la utilización de CPU respecto del sistema Data Domain objetivo y de los hosts de ESX. El proceso de prueba de respaldo de 28 días incluyó la limpieza automatizada y la generación de datos nuevos entre las ejecuciones de pruebas, seguidas de un respaldo completo, y luego, una serie de respaldos incrementales con datos nuevos y modificados generados entre estos respaldos incrementales. Como se muestra en la figura 11, a lo largo de la duración de la prueba, el porcentaje de utilización de CPU de Data Domain permaneció por debajo del 30 %, con un solo incremento inicial de aproximadamente el 90 % durante el primer respaldo completo. Se observaron incrementos menores durante la limpieza y el restablecimiento que se ejecutaron entre las semanas de simulación. Para los cuatro hosts de ESX, la utilización de CPU se mantuvo en un porcentaje muy bajo. Figura 11. Utilización de CPU de ESX Server y Data Domain Utilización CPU: Prueba de respaldo de 28 días CPUdel Utilization: 28-day Backup Test 100 90 80 70 Data Domain Percentage Porcentaje 60 ESX 1 50 ESX 2 40 ESX 3 30 ESX 4 20 10 0 Time Hora Qué significan los números Con respecto a la prueba de ciclo de respaldo de 28 días, la CPU de Data Domain tuvo un promedio del 23 %, con incrementos en la utilización de aproximadamente un 90 % durante el respaldo completo. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 15 Con respecto a la prueba de ciclo de respaldo de 28 días, para los cuatro hosts de ESX, la utilización de CPU tuvo un promedio de entre el 6 % y el 8 %, y nunca superó el 15 %. Por último, ESG Lab analizó el rendimiento de la solución Avamar/Data Domain durante el escalamiento de los respaldos. Después del respaldo completo inicial, se agregaron datos nuevos y modificados, y se ejecutaron 50 respaldos incrementales de máquinas virtuales de forma simultánea. Se repitió el mismo proceso con 100, 150 y 200 respaldos incrementales simultáneos. La figura 12 muestra el crecimiento de datos para cada conjunto de respaldos incrementales simultáneos y el tiempo para completarlos. Las barras de color azul oscuro muestran la cantidad inicial de datos, las barras de color celeste muestran los datos modificados para cada conjunto de máquinas virtuales, y la línea de color naranja muestra el tiempo necesario para el respaldo. Está claro que el crecimiento de datos no afectó negativamente el rendimiento de respaldo. Figura 12. Prueba de escala: Rendimiento de respaldo a medida que crecen los volúmenes de datos 11 200 10.8 180 10.6 160 10.4 140 10.2 120 10 100 9.8 80 9.6 60 9.4 40 9.2 20 9 Minutos Minutes TBs TB Scale Test:Duración Duration de of Concurrent Incremental Backups Prueba de escala: los respaldos incrementales simultáneos 0 Datos de Initialiniciales Data 200 200 VM VMs Incremental Incremental de 50 50Vms VM Datos Initial data iniciales Incremental Incremental 100 de 100 VM VMs Incremental150 de Incremental 150 VM VMs. Datos New/changed data nuevos/modificados Incremental200 de Incremental 200 VM VMs Minutos Minutes Qué significan los números El respaldo completo inicial demoró 184 minutos. El tiempo necesario para 50 respaldos incrementales simultáneos de máquinas virtuales fue de 11 minutos; para 100 simultáneos, 8 minutos; para 150 simultáneos, 8 minutos; y para 200 simultáneos, 7 minutos. No se necesitaron servidores de proxy adicionales para escalar a 200 máquinas virtuales. Si bien se probaron 200 máquinas virtuales, la deduplicación global de esta solución probablemente provocaría un aumento de rendimiento a medida que se agregan más máquinas virtuales al pool. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 16 Por qué es importante El crecimiento continuo de los volúmenes de datos reta a la TI de muchas maneras, pero, en particular, en el dominio de respaldo. Las organizaciones deben proteger y conservar los datos en caso de daño o desastre, así como abordar las exigentes iniciativas de gobierno corporativo y de cumplimiento de normas. Almacenar y conservar estos datos a largo plazo aumenta los costos. El crecimiento se exacerba debido a la proliferación de máquinas virtuales, donde los respaldos generalmente almacenan copias redundantes de sistemas operativos, aplicaciones y datos. ESG Lab validó la capacidad de la solución Avamar/Data Domain de reducir significativamente la cantidad de datos de respaldo con tecnologías de deduplicación. La deduplicación de longitud variable de Data Domain garantiza tasas de deduplicación máximas. Esto minimiza las necesidades de almacenamiento y de ancho de banda para el respaldo, lo que genera ahorros de costos y de tiempo para el negocio. Además, esto garantiza que la replicación para la recuperación de desastres se beneficiará de la misma reducción de necesidades de ancho de banda, además de los ahorros de costos y de tiempo. La prueba también validó la velocidad de respaldos simultáneos, restauraciones simultáneas y respaldos de 200 máquinas virtuales. La capacidad de utilizar las restauraciones de CBT garantiza una recuperación rápida y minimiza el impacto en su paquete de discos de protección de datos a medida que su ambiente de máquinas virtuales escala. Por último, ESG Lab validó que el procesamiento de respaldo para flujos de respaldo individuales, los flujos simultáneos y las tareas de restauración dejaron una gran cantidad de CPU disponible en el sistema Data Domain objetivo y en los hosts de ESX. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 17 Puntos destacados de la validación de ESG Lab ESG Lab quedó impresionado con la facilidad y la velocidad de integración de Avamar y Data Domain, que permite una administración consolidada para la protección de datos. Las tasas de deduplicación de datos de esta prueba demostraron la habilidad de reducir la capacidad más de 73 veces, lo que permite a las organizaciones ahorrar en términos de almacenamiento y de ancho de banda. A ESG Lab le complació observar que la utilización de CPU fue eficiente para el sistema Data Domain objetivo y para los hosts de ESXi durante todo el procesamiento de respaldo, dejando una gran cantidad de espacio libre para otras tareas. ESG Lab también valoró que cuando se necesitó un procesamiento intensivo, Data Domain descargó la mayor parte de la carga del host. La prueba de rendimiento de respaldo demostró la ventaja de velocidad de los respaldos completos sin límites con esta solución eficiente en términos de red y de capacidad. Además, ESG Lab validó que no hubo impacto en el rendimiento durante los respaldos simultáneos de máquinas virtuales, y también validó la restauración rápida y eficiente disponible cuando se utiliza VMware CBT. Temas que deben tenerse en cuenta Data Domain minimiza los requisitos de almacenamiento aprovechando la deduplicación de longitud variable, y la integración de DD Boost minimiza el ancho de banda distribuyendo las partes de la deduplicación de Data Domain a Avamar para permitir la deduplicación del lado del cliente. Esto es importante para los respaldos de máquinas virtuales, dado que generalmente contienen sistemas operativos redundantes y otros datos. La eficiencia de la utilización de CPU es importante para los hosts de ESXi que son compatibles con las aplicaciones de producción y para Data Domain que puede funcionar como objetivo para otras actividades de protección al mismo tiempo. La restauración de CBT es una excelente opción que proporciona una restauración rápida en caso de daño de los datos de una máquina virtual específica. Se debe tener en cuenta que la restauración de CBT no es efectiva para una máquina virtual completamente destruida, ya que en ese caso se deben restaurar todos los VMDK que componen la máquina virtual. Las tasas de deduplicación siempre dependen del tipo de datos que se respalda; algunos (como los datos en archivos) tienden a tener datos duplicados importantes, mientras que otros (como los videos y las imágenes) tienden a tener poca duplicación. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 18 La gran verdad Cada año, una investigación de ESG revela que las organizaciones empresariales y los mercados de rango medio colocan la mejora de la protección de datos, la administración del crecimiento de datos y el aumento de virtualización de servidores entre sus principales prioridades de TI.2 El motivo es simple: La transformación de las operaciones de producción tiene un impacto inmediato e importante en los mecanismos de protección. La tecnología pionera de VMware lanzó una revolución que ha dado lugar a la implementación de la virtualización y a la proliferación de máquinas virtuales en las organizaciones de todo el mundo; la protección de todos esos datos continúa siendo un reto. Avamar y Data Domain son soluciones de protección de datos altamente evolucionadas, y en conjunto son aún más potentes. Data Domain fue pionero en el campo de la deduplicación, pero, en este momento, su flexibilidad y escalabilidad son igualmente importantes, algo fundamental para la protección de datos de VMware, ya que las organizaciones activan rápidamente nuevas máquinas virtuales y se encuentran con cientos, e incluso miles, de máquinas virtuales para proteger. Data Domain ofrece una flexibilidad incomparable y proporciona de manera simultánea un objetivo para varias aplicaciones de respaldo diferentes; para respaldos directos de aplicaciones empresariales, como Oracle RMAN, SQL, SAP y DB2; para respaldos directos de almacenamiento primario, como VMAX3 y XtremIO; para respaldo de mainframe y sistemas IBM i; y para soluciones de archiving, como SourceOne. Asimismo, mientras que la TI puede hacer un seguimiento de todas las actividades de protección (por ejemplo, a través de EMC Data Protection Advisor), otros administradores pueden manejar sus propios respaldos (por ejemplo, los DBA pueden ejecutar RMAN, y los administradores de virtualización pueden ejecutar respaldos de máquinas virtuales). Esto distribuye el trabajo de administrar varias actividades de protección de datos sin tener que comprar y administrar paquetes de discos de infraestructuras diferentes. Data Domain también es conocido por su confiabilidad integrada; se lo conoce como un sistema “desconfiado” debido a las funciones de verificación de datos, de detección continua de fallas y de autorreparación de la arquitectura de invulnerabilidad de datos. Todas estas características hacen que sea una solución sólida para pequeñas y grandes empresas, así como para proveedores de servicios. Avamar proporciona respaldos coherentes con las máquinas virtuales y las aplicaciones, con recuperación rápida granular. También aprovecha VADP para los respaldos de VMware y está integrado con vSphere. Como Data Domain, Avamar proporciona la escalabilidad que demandan los ambientes de servidores virtuales, mediante máquinas virtuales de proxy que tienen balanceo de carga automático. La capacidad de aprovechar CBT para el respaldo y la restauración acelera el rendimiento para ambas tareas, así como también reduce la transferencia de datos en la red. Además, si bien en este proyecto no se probó, Avamar proporciona acceso instantáneo de máquinas virtuales a las imágenes almacenadas en Data Domain, lo que brinda la agilidad y la capacidad de recuperación rápida que las organizaciones necesitan en la actualidad para mantener las operaciones de producción. ESG Lab validó la combinación de Avamar y Data Domain en un escenario real para probar cómo funcionaría en el ambiente del cliente. Esto incluyó la facilidad de integrar Avamar con Data Domain, algo fundamental en el panorama de TI moderno. La prueba con 200 máquinas virtuales validó la eficiencia de la capacidad de los mecanismos dobles de deduplicación, las ventajas en cuanto al rendimiento de los respaldos incrementales, la capacidad de manejar cientos de respaldos de máquinas virtuales de forma simultánea y, a la vez, mantener un rendimiento rápido, y la capacidad de aprovechar las restauraciones de CBT para lograr una recuperación rápida. Muchas organizaciones actualmente recurren a dispositivos de respaldo integrados por dos razones clave: la facilidad de implementación, y la reducción en los gastos operacionales y de capital. Si bien técnicamente no es una solución de dispositivos integrados, la combinación de Data Domain y Avamar ofrece tasas de deduplicación más altas que los dispositivos de respaldo integrados tradicionales, así como la escalabilidad, la flexibilidad y la agilidad 2 Fuente: Informe de investigación de ESG, 2015 IT Spending Intentions Survey, febrero de 2015. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 19 necesarias para proteger todo un ambiente sin concesiones. Es una combinación potente que puede ayudar a las organizaciones a simplificar y a consolidar la protección de datos con una reducción en los costos. © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. Validación de laboratorio: EMC Data Domain y Avamar 20 Apéndice Tabla 1. Banco de prueba de ESG Lab Software de respaldo Objetivo de disco Avamar Virtual Edition 7.2 2 CPU virtuales 6 vRAM 900 GB de espacio en disco Data Domain DD4500 DD OS 5.6.0.3 4 bandejas de discos ES30-30 4 interfaces de 10 GbE (2 utilizadas en las pruebas) Virtualización Servidores VMware vCenter 5.5.2 4 servidores Cisco UCS 240 SO: SLES 12.3 Almacenamiento Red 2 EMC XtremIO, de 7.56 TB de capacidad útil cada uno 10 GbE Cómo se obtuvieron las mediciones en las pruebas Todas las pruebas se llevaron a cabo para reflejar un escenario real: respaldos diarios con una tasa de cambio realista durante un mes. Deduplicación: Las mediciones de deduplicación se extrajeron directamente de Data Domain a través de filesys show compression en los scripts que controlan los trabajos de respaldo. Se recopilaron los datos inmediatamente después de que cada trabajo de respaldo se completara y se escribiera en un archivo de registro. Rendimiento de respaldo/restauración: Se utilizó la utilidad común time de Unix/Linux para determinar cuánto tiempo demoró la ejecución de los trabajos de respaldo y de restauración. Todos los trabajos de respaldo y de restauración se ejecutaron de scripts a través de la interfaz de la línea de comandos mccli de Avamar con la utilidad time para enviar el tiempo de ejecución total de todos los trabajos de principio a fin. Durante las pruebas, los resultados se escribieron en un archivo de registro. CPU: Se recopiló información de CPU y de otros recursos del sistema para varios componentes en el ambiente de pruebas a través de EMC Data Protection Advisor. También se utilizó DPA como segundo método para verificar los resultados del tiempo de ejecución y de la deduplicación.bra © 2015, The Enterprise Strategy Group, Inc. Todos los derechos reservados. 20 Asylum Street | Milford, MA 01757 | Tel.: 508-482-0188 Fax: 508-482-0218 | www.esg-global.com