Guía de compra del almacenamiento flash

Anuncio
Guía de compra del
almacenamiento flash
2015
Guía de compra del almacenamiento flash 2015
Guía de compra del almacenamiento flash
2015
Introducción................................................................................................................................................................................ .1
Cuatro cosas que hay que saber sobre la memoria flash............................................................................................. .2
Las tres clases de productos totalmente flash................................................................................................................. .3
Lo que el almacenamiento flash puede hacer por usted.............................................................................................. .4
Disponibilidad: ¿la arquitectura está diseñada para no quedarse fuera de servicio?........................................... .4
Resistencia: ¿cómo se protegen los datos?...................................................................................................................... .5
Asequibilidad: reducción de datos, licencia de software y costes de mantenimiento......................................... .6
Sencillez de funcionamiento: Cómo dimensionar el negocio..................................................................................... .8
¿Cuál es el nivel de madurez del producto flash?........................................................................................................... .9
Conclusión.................................................................................................................................................................................10
Guía de compra del almacenamiento flash 2015
Introducción
El almacenamiento totalmente flash es una infraestructura tecnológica de nueva generación que
puede proporcionarle una ventaja competitiva a su empresa – ya que le permitirá aumentar el nivel
de productividad de sus empleados y acelerar su negocio, gracias a la reducción del tiempo de
espera de las bases de datos y las aplicaciones. El rendimiento y la eficiencia del almacenamiento
flash lo convierten en la solución ideal para simplificar los retos a los que se enfrenta actualmente la
TI y proporcionar el nivel máximo de seguridad en las iniciativas de modernización de TI – incluyendo
Cloud, móvil, análisis de Big Data e Internet de las cosas.
En 2014 vivimos un momento clave en el sector de la TI. El mercado pasó del almacenamiento
mecánico de disco a centrarse en en los productos que podríamos denominar de almacenamiento
totalmente flash. La combinación de innovación y madurez del mercado hace que resulte complicado
tomar una buena decisión en materia de compra de almacenamiento.
Es posible que todavía no haya apostado por una infraestructura flash, pero lo más probable es que
lo acabe haciendo el año que viene. Así que, ¿cómo tomará la decisión correcta? Los proveedores de
almacenamiento pueden ser desde grandes empresas consolidadas hasta startups de reciente
creación, y hay una gran variedad de tecnologías con las que quizá esté familiarizado y quizá no. El
mercado de los datos es imperfecto y puede acabar escogiendo mal. La propia memoria flash
presenta un conjunto distinto de puntos potencialmente problemáticos, lo que exige tener en cuenta
nuevas cuestiones tecnológicas y de arquitectura. Además, como los tipos de productos también son
distintos, y cada uno de ellos tiene unos puntos fuertes y unas funcionalidades únicas, ¿cómo se
puede ajustar la tecnología a los propios objetivos?
La finalidad de esta guía es proporcionar una base para evaluar y seleccionar el
almacenamiento totalmente flash para los entornos de tipo empresarial.
Incluye todas las clases de productos y explica dónde resultan más útiles, además de especificar los elementos clave de
cada uno de ellos para sortear las posibles dificultades que pueden surgir en el proceso de selección. Le diremos dónde
es fácil que le confundan los proveedores y le proporcionaremos herramientas que podrá usar para tomar la mejor decisión
posible, basándose en su entorno y sus aplicaciones. Esta guía de compra incluye:
• Lo que necesita saber sobre la memoria flash
• Las diferentes clases de almacenamiento totalmente flash
• Los criterios de compra de almacenamiento totalmente flash
El número de profesionales informáticos con experiencia práctica con el almacenamiento flash está aumentando
rápidamente, y gracias a ello hay un montón de información nueva – y a veces confusa – sobre el rendimiento, la fiabilidad y
la experiencia general con esta nueva clase de productos. Esperamos que esta guía de usuario le proporcione información
que le permita tomar la mejor decisión para su organización.
1
Guía de compra del almacenamiento flash 2015
Cuatro cosas que hay que saber sobre la memoria flash
Antes de sumergirnos en el almacenamiento totalmente flash, hay algunas características fundamentales de la memoria flash
con las que debería estar familiarizado. Vamos a suponer que ya conoce las ventajas de la memoria flash – su rendimiento y
eficiencia son ampliamente conocidos; sin embargo, la memoria flash no es como los discos mecánicos y debe tratarse de un
modo distinto para asegurar su fiabilidad y disponibilidad.
1. La memoria flash puede gastarse
La memoria flash es una tecnología de semiconductor no volátil que se diseñó en un principio para las
cámaras digitales. Las celdas flash se gastan un poco cada vez que se borran/escriben, lo que hace que
la fiabilidad suponga un reto para las aplicaciones empresariales que tienen un uso de I/O intenso. La
duración nominal de un dispositivo flash se indica en ciclos de escritura/borrado (PE en inglés). Una buena
manera de entender el desgaste de la memoria flash es compararla con una hoja de papel. Si borráramos
un mismo punto de una hoja de papel 1000 veces, seguro que al final lo romperíamos. Sin embargo,
hay formas de minimizar e incluso contrarrestar los límites PE, como el sobreaprovisionamiento y la
optimización de la escritura, dos puntos que se tratan más a fondo un poco más adelante.
En la tabla siguiente puede comprobar que el precio por GB suele corresponderse con el número de ciclos de escritura/
borrado previstos para un dispositivo flash.
2. La memoria flash está disponible en versiones distintas
SLC
eMLC
cMLC
TLC
Ciclos P/E
por celda flash
100.000
10.000
3000
300
Rendimiento
Máximo
Alto
Alto
Medio
Precio por GB
Máximo
Alto
Moderado
Bajo
Tasa de error
de bits
Bajo
Bajo
Bajo
Alto
El diseño fundamental de las celdas flash es básicamente el mismo, pero su modo de fabricación y de revisión del
rendimiento y otras características cambian radicalmente e influyen de manera decisiva en el comportamiento, el coste, el
rendimiento y la fiabilidad del sistema final al que se incorporan.
• SLC (single-level cell o celda de nivel único): en algún momento se la consideró la única forma de flash apropiada para el
almacenamiento empresarial. Se trata de un formato de flash que almacena un bit en cada celda. Como resultado de ello,
tiene la mayor fiabilidad y el coste más alto. El formato SLC ha dejado de fabricarse, en parte debido a que el éxito de los
sistemas con diseño totalmente flash ha aumentado de manera significativa la fiabilidad de las flash eMLC y cMLC.
• eMLC (enterprise multi-level cell o celda de nivel múltiple empresarial) : el formato MLC aumenta la densidad del
almacenamiento y reduce el coste por GB, almacenando dos bits en cada celda. La eMLC es una forma de MLC que
aumenta los ciclos P/E al reservar una parte importante del espacio de dirección de su flash total al sobreaprovisionamiento
(OP), es decir, un porcentaje de la memoria física total (normalmente del 28% al 50%) se reserva para sustituir las celdas
a medida que se gasten. La memoria flash eMLC suele incluir firmware de controlador avanzado para proporcionar
optimizaciones a nivel de dispositivo, como la recolección de basura (GC).
• cMLC (consumer multi-level cell o celda de nivel múltiple de consumo): el formato MLC aumenta la densidad del almacenamiento
y reduce el coste por GB almacenando dos bits en cada celda. La cMLC es la forma de MLC que se usa en la amplia mayoría de
dispositivos de consumo y en las recientes matrices de almacenamiento empresarial. El formato cMLC es la forma de memoria
flash de mayor volumen de las que se fabrican actualmente e incluye una cantidad baja de flash sobreaprovisionada (el 7% del
espacio de dirección) y un conjunto limitado de firmware de controlador con un número limitado de características.
• TLC (triple-level cell o celda de nivel triple): la novedad más reciente en el mercado de la memoria flash es el formato TLC,
que almacena 3 bits en cada celda, lo que permite que la memoria flash satisfaga mejor las necesidades relacionadas
con la capacidad de almacenamiento. La arquitectura de este formato está más expuesta a los errores de bits que la MLC,
debido a la banda más estrecha de lectura del valor del bit. Además, el formato TLC soporta cientos de ciclos de escritura,
lo que significa que se puede gastar más rápidamente que el formato MLC.
2
Guía de compra del almacenamiento flash 2015
3. La memoria flash falla de un modo distinto a los discos duros
Tanto las unidades flash como los discos duros aumentan su nivel de fallos con el tiempo; sin embargo, el cómo y el
porqué de estos fallos son muy distintos. Si ampliamos la noción del desgaste de la memoria flash y la aplicamos a las
tasas de error de bits, descubriremos que la memoria flash falla de un modo muy distinto a un disco duro.
• Los discos duros sufren errores mecánicos debidos a las vibraciones, la variación de la tensión eléctrica y el calor
excesivo. Los errores de bits del soporte suelen producirse muy cerca unos de otros – piense en un arañazo en un
LP (seguro que recuerda los discos de vinilo de 331⁄3 rpm, ¿verdad?).
• En cambio, la memoria flash tiene errores de bits debido al desgaste (ciclos PE) – el soporte simplemente se gasta
con el tiempo. El acceso se degrada con el tiempo, primero pasa a un estado de solo lectura y al final el dispositivo
falla por completo.
Además, la tasa de errores irrecuperables (UBER por sus siglas en inglés) de los discos duros permanece relativamente
constante a medida que se realizan escrituras en la unidad, mientras que con la memoria flash, el índice de errores crece
de manera exponencial a medida que aumenta el número de TB escritos. Para algunos periodos de escritura, la solución
flash tendrá una tasa de errores mucho menor, y luego aumentará drásticamente para alcanzar la tasa de las unidades
de disco duro. Esta evolución tan distinta de los errores hace que en las soluciones flash haya que aplicar sistemas de
corrección de errores únicos – sistemas que no son adecuados para las unidades de disco duro.
4. Las escrituras flash son caras, pero las lecturas son gratuitas
A diferencia de lo que ocurre con los discos duros, las lecturas y escrituras en un soporte flash son muy asimétricas, es
decir, se tarda mucho más tiempo en borrar y escribir una celda que en leerla. La consecuencia de ello es que al diseñar
la arquitectura de un sistema con flash, esta asimetría es la clave para asegurar un rendimiento elevado y predecible, ya
que el objetivo es minimizar el número de escrituras que se realicen y no preocuparse en absoluto de las lecturas.
Las tres clases de productos totalmente flash
Tarjetas PCIe en servidores
Dispositivos flash
Matrices totalmente flash
Objetivo:
Objetivo:
Objetivo:
Aceleración de una
aplicación única.
Aceleración de una aplicación
única y multi-host.
Infraestructura de almacenamiento
de nivel 1 de última generación
Características fundamentales:
Características fundamentales:
Características fundamentales:
• Uso flexible como caché
de aceleración IO o como
almacenamiento persistente.
• Combina un rendimiento muy
rápido y
una elevada capacidad.
• La mayor capacidad,
almacenamiento compartido y con
características de tipo empresarial.
• No tiene una elevada
disponibilidad: tiene que
duplicar los conjuntos de datos,
lo que dobla el coste de la
memoria flash.
• JBOF: just a bunch of flash (solo
un montón de flash).
• No es lo más rápido en términos
absolutos,
pero proporciona acceso IO en
submilisegundos.
• Resultados relativamente bajos
en cuanto a la capacidad de IO
de alcanzar el almacenamiento
compartido, lo que provoca
latencia tanto en línea como en
disco.
• Habitualmente exige una fuerte
optimización de la aplicación.
• Normalmente tiene unas
características limitadas –
y no tiene características de
almacenamiento empresarial
(NDU, HA, snapshots,
replicación, etc.).
• Denso/compacto por unidad
rack (RU)
• Capacidad: 10s de TB
• Elevada disponibilidad,
actualizaciones sin interrupciones,
snapshots y otras características
de empresa incluidas en la pila de
software.
• Ampliable a la máxima capacidad
de estas categorías.
• Capacidad: 100s de TB
• Se trata de la opción más cara
en base al coste por GB.
• Capacidad: 1s de TB
3
Guía de compra del almacenamiento flash 2015
Lo que el almacenamiento flash puede hacer por usted
Antes de continuar, hagamos un alto para fijarnos en la aplicabilidad del almacenamiento totalmente flash y en las
expectativas que podemos tener al modernizar un sistema de almacenamiento. Gracias al sistema flash podemos conseguir
numerosos beneficios en las aplicaciones – y no solo en las áreas que exigen unos elevados niveles de rendimiento.
1. Mayor rendimiento de la aplicación
El sistema flash proporciona fácilmente 10 veces más rendimiento que una unidad de disco duro, lo que permite acelerar
las aplicaciones, tanto si se trata de procesar más transacciones de datos por segundo como de reducir drásticamente el
tiempo necesario para ejecutar los procesos por lotes. La promesa de un mayor rendimiento es lo que hace que muchos
se pasen al sistema flash.
2. Capacidad de respuesta para una economía digital
La verdadera ventaja del almacenamiento flash es la latencia constante de submilisegundos, lo que hace que todas las
aplicaciones tengan una mayor capacidad de respuesta. Amazon, Microsoft, Google y Walmart afirman que esta latencia
reducida es fundamental para prolongar el compromiso del cliente, aumentar las ventas y mejorar la satisfacción del
usuario en la economía digital actual.
3. Sencillez de funcionamiento
La memoria flash puede simplificar enormemente la administración de las aplicaciones y el funcionamiento del
almacenamiento, reduciendo en gran medida y, en muchos casos, eliminando los ajustes y modificaciones de
configuración. Quienes han adoptado la tecnología flash afirman que permite ahorrar horas de trabajo del personal, que
pueden invertirse y dedicarse a iniciativas estratégicas que hagan progresar el negocio.
4. Aceleración de las iniciativas de última generación
Los directores de sistemas de información quieren obtener ventajas competitivas con iniciativas que a menudo incluyen la
seguridad, la movilidad, los análisis de Big Data y el Internet de las cosas. Flash proporciona la base que garantiza que las
iniciativas de última generación funcionen igual de bien en la fase de producción que en la fase piloto y la de prueba.
5. Eficiencia del centro de datos
Flash consume una mínima parte de la potencia y el espacio de bastidores del almacenamiento de disco. Adoptando
el sistema flash, los centros de datos consiguen una eficiencia de recursos que les permite albergar más servicios TI y
almacenar más datos de cara al futuro.
Las expectativas del sistema flash
Los precios del sistema flash están bajando drásticamente, por lo que uno debería plantearse las opciones de
almacenamiento totalmente flash como un medio para modernizar la infraestructura de almacenamiento de nivel 1 ahora y
para disponer de conjuntos de datos centrados en la capacidad o almacenamiento de nivel 2 en un futuro no muy lejano.
Y para obtener estos beneficios, hay que considerar el modo de implementación de flash y los beneficios y renuncias de cada
una de las tres formas de flash. Los apartados siguientes de esta guía tratan más a fondo los objetivos comunes del diseño de las
plataformas de almacenamiento y más en concreto la disponibilidad, la resistencia, la asequibilidad y la sencillez de funcionamiento.
Disponibilidad: ¿la arquitectura flash ha sido diseñada para
no quedarse nunca fuera de servicio?
Muchas veces, las conversaciones sobre el almacenamiento acaban tratando el tema de la arquitectura sin definir los
objetivos de negocio o el modo de conseguir los beneficios de dicha arquitectura. Y en el caso de las
matrices de almacenamiento, las conversaciones tienden a centrarse en las arquitecturas de
escalamiento vertical frente a las de escalamiento horizontal. La arquitectura de almacenamiento debe
diseñarse para que el sistema flash desbloquee y libere una arquitectura que sea capaz de aprovechar
plenamente las capacidades de la memoria flash.
Una matriz de almacenamiento tradicional puede acelerarse añadiendo flash, pero en los periodos de
fallo del controlador y de mantenimiento esto puede tener consecuencias y es posible que haya que
renunciar a algunas cosas. Por lo tanto, antes de comprar un producto es muy necesario comprender
cómo se solucionan estas situaciones operativas.
4
Guía de compra del almacenamiento flash 2015
¿Es el controlador una arquitectura sin estado?
Las aplicaciones modernas, las infraestructuras virtuales y de Cloud e incluso los servidores blade aprovechan una
arquitectura sin estado para separar la prestación del servicio de la aplicación de la infraestructura subyacente. ¿No será esto
lo ideal para el almacenamiento?
La mayoría de plataformas de almacenamiento, tanto de escalamiento vertical como de escalamiento horizontal, implementan
una arquitectura que relaciona el procesamiento de IO con el medio de almacenamiento persistente. Este modelo genera un
rendimiento inconsistente durante los fallos de hardware y las operaciones de mantenimiento, y con mucha frecuencia exige
migraciones de datos y actualizaciones de hardware.
Una arquitectura de controlador de almacenamiento sin estado separa el plano de procesamiento IO del plano de almacenamiento
de datos persistentes, proporcionando una elevada disponibilidad con operaciones sin interrupciones. Esta arquitectura permite
las actualizaciones de la plataforma de hardware, la mejora del software y la ampliación del almacenamiento sin necesidad de
reconfigurar las aplicaciones, los hosts o las redes IO – todo ello sin interrupciones ni pérdidas de rendimiento.
¿Se ve afectado el rendimiento durante un fallo?
Todos sabemos que las aplicaciones que desempeñan una función muy importante no pueden permitirse las pausas,
y sin embargo la adopción de flash aumenta los riesgos. El inconveniente del almacenamiento flash y de la latencia de
submilisegundos es el impacto que tienen en la aplicación, debido a la pérdida de rendimiento en caso de que se produzca
un fallo o haya que realizar un mantenimiento.
Una arquitectura flash tiene que reservar recursos de memoria y CPU para proporcionar el mismo rendimiento constante
durante los periodos de fallo o de mantenimiento que durante los periodos de funcionamiento normal. Un aumento de la
latencia de 5X o 10X podría ser catastrófica para una aplicación o negocio. Le recomendamos que entienda muy bien cómo
se obtiene el rendimiento cuando se produzca el inevitable fallo.
¿Cómo de invisible es una actualización no disruptiva?
La mayoría de soluciones de almacenamiento totalmente flash soportan actualmente algún tipo de actualización no
disruptiva. Algunas requieren una planificación proactiva o días de migración de datos de fondo, mientras que otras pueden
ampliarse solo si el hardware es idéntico – haciendo que los clientes queden limitados a unos modelos de hardware que
rápidamente quedan desfasados.
Determinar si se puede sustituir un controlador o un componente sin tener que dejar fuera de línea un sistema flash es solo el
principio. ¿La actualización exige que se ajusten las aplicaciones y que se reconfiguren los administradores de volumen host y el
software de múltiples rutas? Y en cuanto a la red, ¿la ampliación requiere más puertos IO para acomodar el nuevo hardware?
¿Cuánto se tarda en hacer todo esto? ¿No sería mejor que la arquitectura flash simplemente permitiera que las actualizaciones de
hardware y software se completaran de una manera no disruptiva y completamente invisible para la infraestructura circundante?
Resistencia: ¿cómo se protegen los datos?
Las características de la memoria flash, en especial su rendimiento y el número finito de ciclos PE, hacen
que sea necesario plantearse mecanismos de protección de los datos. Con el almacenamiento de disco
había que realizar cálculos complejos en los que era necesario tener en cuenta los requisitos de IO
host, las penalizaciones de escritura, los errores en los soportes y unos tiempos de reconstrucción que
estuvieran en correlación con la capacidad, todo ello con la esperanza de ajustar el rendimiento y el
objetivo de reducción de riesgos. El rendimiento del sistema flash reduce los tiempos de reconstrucción,
pero hay muchas más cosas a tener en cuenta antes de protegerlo como si fuera un disco.
¿Cuántas unidades pueden fallar al mismo tiempo?
Es necesario conocer el número de fallos simultáneos que un sistema de protección de datos puede soportar y el coste de
los recursos de protección de los datos, tanto si es RAID, duplicación de discos o codificación de borrado. Un sistema flash
hará que el impacto de los fallos sobre el rendimiento sea marginal y reducirá los tiempos de reconstrucción asociados, pero
la velocidad no sustituye una menor protección de los datos. La capacidad de los dispositivos de almacenamiento de disco
y flash se mide en terabytes (TB), así que los sistemas RAID de paridad dual se han convertido de hecho en el medio de
protección de datos empresarial para evitar los errores de bits irrecuperables y los fallos de unidades.
5
Guía de compra del almacenamiento flash 2015
¿Cuánta estructura se requiere para la protección de los datos?
La protección de los datos es algo fundamental, pero tanto los sistemas RAID basados en la paridad como las copias de
datos duplicados consumen capacidad de almacenamiento. Ser conscientes de los recursos asociados a la protección de los
datos puede ayudar a entender mejor el verdadero efecto que tiene en el coste del almacenamiento.
Si se está planteando apostar por una arquitectura basada en un servidor (con tarjetas PCIe) o por cualquier arquitectura sharednothing, tendrá que reservar la suficiente capacidad para soportar el número de fallos de dispositivo en el sistema de protección.
Lo que no se limita a una simple duplicación y podría incluir unos recursos que supondrían hasta el 67% – en una configuración
de 3 nodos que soporte dos fallos simultáneos. Este diseño supone una eficiencia máxima del hardware del 33%.
Los sistemas RAID de paridad dual diseñados para flash pueden proporcionar un elevado nivel de protección de los datos
con una capacidad auxiliar mínima – normalmente en torno al 20%. Estos diseños optimizados para flash eliminan los
múltiples IO auxiliares que son necesarios en la paridad de actualización y almacenamiento en los RAID diseñados para los
conjuntos de discos. Lo más aconsejable es evitar los sistemas de protección RAID diseñados para los discos duros, ya que
aceleran los ciclos PE en una unidad de estado sólido (SSD).
¿Soporte para las copias de seguridad snapshot y la replicación de datos?
Hasta ahora, este apartado se ha centrado en la protección de datos en caso de que se produzca un fallo en el sistema o en
un componente, pero como muchos sabemos, la mayoría de pérdidas de datos se producen como consecuencia de un error
humano.
Una característica empresarial clave del almacenamiento de Nivel 1 es la capacidad para realizar copias de seguridad
snapshot locales y replicar los datos en centros remotos para la recuperación en caso de desastre y para tener copias de
seguridad externas. Con la memoria flash estos procesos son extraordinariamente rápidos. Sin embargo, debido a la cuestión
de los ciclos PE es necesario asegurarse de que el mecanismo snapshot se basa en metadatos y no copia los datos mientras
estos se actualizan o borran.
En la mayoría de soluciones la replicación es una característica nativa, pero no es una funcionalidad universal, sobre todo en
las tarjetas PCIe flash y las aplicaciones flash. Las opciones de replicación de terceros proporcionan una replicación de datos
con soporte para entornos heterogéneos. Estas soluciones incrementan el coste total del almacenamiento, ya que incluyen
costes adicionales de licencia de software, puertos de red y hardware de replicación.
Asequibilidad: reducción de datos, licencia de software y
costes de mantenimiento
La cuestión económica juega un papel esencial a la hora de decidir si se adopta un sistema flash como
infraestructura de almacenamiento de última generación.
Para algunos, las comparativas de costes son tan sencillas como comparar los precios de adquisición, es decir,
evaluar el precio por GB bruto de capacidad de almacenamiento sin tener en cuenta la capacidad efectiva, la
licencia de software, el inevitable aumento de los costes de mantenimiento y soporte, y el coste de las
actualizaciones y migraciones para pasarse a las futuras versiones del producto. Es necesario conocer el coste
total del sistema flash durante un periodo de tiempo razonable (normalmente 5 o 6 años), ya que de lo contrario
lo más probable es que nos llevemos una gran sorpresa.
Reducción de datos: ampliación efectiva de la capacidad de almacenamiento
En el mercado se pueden encontrar diferentes métodos de reducción de datos para el almacenamiento flash – que no deben
considerarse como una lista cuantitativa de elementos que hay que ir comprobando. Estos medios, que permiten reducir los
datos, tienen un impacto significativo en el rendimiento, la eficiencia y el coste por GB de almacenamiento efectivo.
La reducción de datos puede parecer algo básico, pero sus implementaciones son tan diversas como el número de opciones
flash que hay en el mercado. Es importante conocer los beneficios probables de estas tecnologías, ya que son las que
marcan la diferencia en un presupuesto. La regla general es que cuanto más completa sea la tecnología de reducción de
datos, mayor capacidad de ahorro tendrá y mayor será la aplicabilidad de la solución a su entorno.
6
Guía de compra del almacenamiento flash 2015
Definición de las tecnologías de reducción de datos más comunes
A continuación tiene una breve descripción de las tecnologías de reducción de datos más comunes actualmente en el mercado:
• D
eduplicación de datos: asegura que solo se almacenen datos únicos en una matriz/plataforma de almacenamiento. Esto
minimiza la capacidad consumida y elimina la necesidad de escribir datos redundantes.
• Compresión de datos: reduce la capacidad necesaria para almacenar datos únicos en una matriz/plataforma de
almacenamiento. Esto minimiza la capacidad y el número de escrituras necesarias para almacenar datos únicos.
Hay que ser consciente de que aunque muchas empresas del sector incluyen el Thin Provisioning (aprovisionamiento ligero
o dinámico) entre los ahorros de costes que publicitan, el Thin Provisioning no es una tecnología de reducción de datos, sino
que es un medio dinámico para asignar capacidad de almacenamiento bajo demanda.
La reducción de datos global frente a la local y el rendimiento
Las arquitecturas de almacenamiento adaptadas a flash suelen incluir la reducción de datos como opción, debido al impacto
negativo sobre el rendimiento.
Las tecnologías de reducción de datos opcionales suelen comercializarse enfatizando que permiten que el cliente elija entre
el rendimiento máximo o la optimización de la capacidad. Pero no mencionan el hecho de que a cambio hay que sacrificar
parte del rendimiento y que esto es lo que explica que sean opcionales. Lo aconsejable es que los compradores estén muy
atentos cuando elijan las características opcionales del almacenamiento.
¿Deduplicación en línea o postproceso?
Algunas empresas del sector reducen los datos a medida que estos entran en la matriz, mientras que otras colocan
primero los datos en el flash y luego realizan el proceso de reducción de datos. En los conjuntos de discos tradicionales, la
deduplicación postproceso era la norma, ya que la reducción de datos tardaba mucho en ejecutarse y podía programarse
para minimizar su impacto sobre el rendimiento. Pero la programación de la deduplicación de datos puede provocar una
pérdida del ahorro de capacidad si no se prevé correctamente, ya que los datos pueden quedar bloqueados en los procesos
de replicación y snapshots.
Con flash, la deduplicación en línea no solo es posible, gracias al rendimiento de flash y a las nuevas arquitecturas diseñadas
para ella, sino que dicha deduplicación en línea es esencial para aumentar la fiabilidad de flash, ya que evita escrituras y
elimina ciclos PE en los datos que ya existen. El sistema en línea acaba con los retos que tradicionalmente planteaba el
almacenamiento de disco.
Deduplicación fija frente a deduplicación variable y granularidad
Las implementaciones de los sistemas de deduplicación de datos se diferencian en cuanto a la granularidad del tamaño del
bloque en que analizan los datos, y la mayoría de ellas se corresponden con una de las dos categorías existentes en base a
la arquitectura back end de la plataforma de almacenamiento, es decir, o bien tienen una longitud fija o bien variable. Cuanto
menor sea la granularidad del tamaño del bloque utilizado para analizar los datos, mayores serán la redundancia y el ahorro
de capacidad logrados.
• La deduplicación de longitud variable: proporciona el mayor nivel de granularidad y permite una redundancia que
normalmente no se identificaría con una implementación de bloque fijo a identificar. Este modelo requiere más ciclos de
CPU, pero a cambio proporciona la mayor reducción de datos posible.
• La deduplicación de datos fija: limita la granularidad del tamaño del bloque para ajustarse a la de back end. Esta forma de
implementación optimiza el rendimiento ya que limita el número de ciclos de CPU dedicados a identificar la redundancia,
pero a costa de unos niveles de reducción menores.
¿Cuántos algoritmos de compresión?
La compresión proporciona unos niveles variables de reducción de datos en función del conjunto de datos. Unos datos
responden mejor a unas formas que a otras y otros responden bien a una combinación de formas. El almacenamiento flash
que ofrece múltiples algoritmos de compresión de datos resulta más fiable a la hora de proporcionar una ventaja cuantificable
en materia de reducción de datos que los que solo tienen una única forma.
7
Guía de compra del almacenamiento flash 2015
¿Y la reducción de datos con pasarelas de almacenamiento o basadas en host?
La reducción de datos puede realizarse en aplicaciones host y a través de pasarelas que funcionan bien en host flash,
dispositivos flash y conjuntos de discos adaptados a flash. Sin embargo, estas soluciones exigen licencias de software,
puertos de red y dispositivos de hardware adicionales, por lo que aumentan el coste total del almacenamiento, lo que va en
dirección contraria al objetivo principal de la reducción de datos nativa.
La capacidad nativa de reducción de datos de la infraestructura de almacenamiento no solo elimina los costes y puntos de
gestión adicionales, sino que además proporciona unos resultados de reducción mucho mejores.
¿El software de la matriz está incluido o tiene un coste adicional?
Las empresas que proporcionan un almacenamiento tradicional suelen otorgar licencias de software de servicios de datos
(protocolos, snapshots, replicación, clonación, etc.) basándose en la capacidad, lo que muchas veces obliga a los clientes a comprar
versiones nuevas y más caras a medida que aumenta el tamaño de sus datos o que actualizan su hardware de almacenamiento.
Este modelo parece arcaico y desfasado teniendo en cuenta la rapidez a la que están creciendo los datos globalmente. Los
compradores de flash tienen que conocer muy bien el coste del software de almacenamiento asociado a una determinada
arquitectura.
¿El coste del mantenimiento y el soporte aumentan con el tiempo?
El modelo tradicional de mantenimiento y soporte del almacenamiento tiene que modernizarse. Históricamente, las empresas
suministradoras de almacenamiento aumentaban drásticamente estos costes en cuanto finalizaba el contrato inicial de soporte.
Este aumento del coste se utilizaba a modo de incentivo – o de castigo, en función del punto de vista de cada uno – para hacer
que los clientes se pasaran a un nuevo hardware por el mismo coste o a un coste menor. Este proceso es fundamentalmente
beneficioso para las ventas de estas empresas y obliga a sus clientes a realizar largas y complejas migraciones de datos.
¿Le ofrece su empresa de almacenamiento flash un programa de renovación y mantenimiento con una tarifa plana? Este
nuevos modelos han surgido últimamente y son una manera moderna de planificar los costes de almacenamiento futuros.
¿Cuál es la carga para la infraestructura de una ampliación?
Algunas matrices de almacenamiento amplían el rendimiento y la capacidad de manera independiente; otras hacen que sea
necesario ampliar por unidades fijas y definidas por el hardware que requieren nuevas fuentes de alimentación eléctrica y
múltiples puertos IO de red. Por último, la ampliación basada en servidor requiere una capacidad adicional de redundancia
para proteger los datos y proporcionar una alta disponibilidad.
Sencillez de funcionamiento: cómo dimensionar el negocio
Proporcionar servicios de almacenamiento es actualmente una labor complicada y que requiere tiempo,
en el mejor de los casos. Aunque se logren beneficios desde un punto de vista de la integración de las
aplicaciones y la automatización, el equipo encargado del almacenamiento muchas veces está perdido
debido a la enorme complejidad. El almacenamiento flash hará que el entorno sea más sencillo – pero el
grado de sencillez requiere de unos cuantos conocimientos.
¿Cuántos ajustes necesita el sistema flash?
Un sistema flash debería ser sencillo, pero ¿qué define la sencillez? ¿Una solución flash de última generación es más sencilla que
adaptar una matriz de almacenamiento en disco tradicional? Es muy difícil cuestionar aquello que uno sabe y con lo que uno se siente
cómodo; sin embargo, estar familiarizado con algo no supone necesariamente un aumento de la productividad.
Se pueden conseguir grandes avances con matrices diseñadas específicamente para flash que simplifican el funcionamiento y
aumentan la fiabilidad y el rendimiento. La mayoría de estas plataformas han simplificado el almacenamiento ajustándolo en función
de la capacidad y estableciendo políticas de protección de datos (para copias de seguridad snapshot y replicación remota).
Pregunte cómo puede eliminar flash los procesos operativos anticuados, como la definición de grupos de almacenamiento y
configuraciones RAID, los ajustes opcionales de caché, tiering, reducción de datos, etc.
8
Guía de compra del almacenamiento flash 2015
¿Cuántos ajustes de aplicaciones necesita el sistema flash?
Aunque ya disponga de flash, es muy posible que necesite ajustar su aplicación para lograr unos resultados óptimos. En
las plataformas flash con tamaños de bloque fijos, las aplicaciones necesitarán exportarse e importarse para alinearlas con
el tamaño de transferencia de IO – este proceso se recomienda habitualmente con las bases de datos OLTP, las VDI y las
infraestructuras virtuales.
¿Tiene que equilibrar la carga de su aplicación en función de los volúmenes o nodos de controlador? Algunas soluciones
flash limitan el rendimiento en base al volumen o los nodos y exigen tener en cuenta el diseño de los datos de la aplicación –
tanto ahora como en el futuro, ya que la aplicación crece.
Si está pensando en implementar un sistema flash PCIe en un host, lo más probable es que tenga que plantearse si el flash se
usará en una caché de aceleración o como almacenamiento de datos persistentes.
¿Qué integración de aplicaciones existe actualmente?
La capacidad de integración del almacenamiento permite proporcionar los recursos de un modo ágil y bajo demanda.
Estas integraciones pueden proporcionar a las organizaciones un nivel de servicios bajo demanda que anteriormente solo
estaban al alcance de ofertas de Cloud públicas. Es preferible el soporte nativo para la integración de aplicaciones que las
integraciones de terceros en base al coste y la complejidad.
¿Proporciona flash un grupo de aplicaciones programables?
El DevOps y el deseo de llegar más lejos en la integración de las propias aplicaciones y el flujo de trabajo se pueden lograr
mediante interfaces API programables. Los marcos basados en REST tienden a crear un base sólida y permiten la extensión o
la superposición de lenguajes de scripting adicionales como Python, Perl y la biblioteca C. En los entornos para Microsoft, lo
más normal es querer asegurarse la inclusión de una biblioteca SMI-S API.
¿Cuál es el nivel de madurez del producto flash?
En el mundo del almacenamiento totalmente flash, si hablamos de madurez del producto, hay una gran variedad de
situaciones. Algunos productos llevan ya algunos años en el mercado, mientras que hay otros que se anuncian pero no están
disponibles. Por ello, para elegir bien es fundamental saber si somos el primer cliente que tiene un determinado producto
entre sus manos y lo preparado que está este producto para su entorno específico.
El hecho de que un producto tenga múltiples lanzamientos – tanto de hardware como de software – puede significar que
dicho producto ha alcanzado un nivel de madurez y de éxito en el mercado y, por lo tanto, deberíamos apostar por él en vez
de hacerlo por los lanzamientos de productos 1.0 y las promesas de futuras mejoras.
Evaluaciones comparativas y certificaciones
Lamentablemente, por el momento, la mayoría de las evaluaciones comparativas que hay en el mercado están diseñadas
para medir el rendimiento de los discos mecánicos, por lo que basarse en los resultados obtenidos en la prueba de
referencia SPC-1 (del Consejo de rendimiento del almacenamiento) no le permitirá tener una visión exacta del rendimiento o
de la eficiencia de una solución flash. Además, muchas configuraciones de la plataforma informática están optimizadas para
la velocidad del disco mecánico, lo que puede hacer que muchas IO hagan cola en el servidor de manera innecesaria. Para
obtener una valoración precisa, la clave está en realizar una evaluación activa de su entorno.
Ahora bien, algunas de las evaluaciones comparativas a nivel de aplicación sí que le proporcionarán una valoración
razonablemente precisa. Por ejemplo, en el caso de la implementación de VDI, tanto VMware como Citrix tienen unas
comparativas completas que evalúan el almacenamiento basándose en el rendimiento de la aplicación a partir del
funcionamiento de varios ordenadores de sobremesa con una carga de trabajo y un ciclo de servicio típicos.
9
Guía de compra del almacenamiento flash 2015
¿Los analistas, los clientes y los competidores comparten sus opiniones?
¿Adónde se puede acudir cuando uno necesita que un tercero valide el producto de una empresa proveedora de
almacenamiento? Muy sencillo, fíjese en el mundo real para encontrar la validación externa – que suele ser mucho más fiable
que lo que una empresa dice de su propio producto.
• Los analistas del sector: muchas veces no son los más entusiastas a la hora de adoptar las tecnologías emergentes, pero
ahora parece que en conjunto están empezando a ver el almacenamiento flash como la nueva forma de almacenamiento
de Nivel-1. Hay distintos informes que valoran a las empresas del sector, sus productos y tecnologías, y es muy
recomendable incluirlos como uno de los criterios de selección.
• La experiencia de los clientes: algunos estudios, como Net Promoter Score, recopilan a gran escala las experiencias de los
clientes y con ello crean un indicador de valoración de dichas empresas y de sus productos. Las encuestas de satisfacción
de los clientes no pueden ser el criterio decisivo para tomar una decisión, pero sí que pueden utilizarse para descartar a
aquellas empresas y productos que tengan unos resultados más negativos al principio del proceso de decisión.
• El análisis de la competencia: probablemente este es el método menos habitual de validación de un producto, pero
si quiere saber qué productos están proporcionando beneficios y nuevas funcionalidades en el mercado, fíjese en la
tendencia existente entre los distintos competidores del mercado. Si dos o más de las grandes empresas del sector
publican informes negativos y proactivos referidos a un recién llegado, puede estar seguro de que ese recién llegado tiene
algo que las grandes empresas no tienen.
Conclusión
La modernización de la infraestructura de un centro de datos no es algo que se haga a menudo. Estas inversiones
estratégicas deben diseñarse para soportar una amplia variedad de usos, ya que se amortizan durante un largo periodo de
tiempo.
Gracias al almacenamiento flash las organizaciones pueden ampliar más fácilmente el tamaño de sus aplicaciones, sus
operaciones informáticas y la capacidad total de sus centros de datos. La apuesta por un sistema flash permite transformar
las organizaciones y los negocios, así como un mejor conocimiento de la información, una agilización de las operaciones y la
aceleración de la prestación de unos servicios informáticos nuevos e innovadores.
Para escoger el mejor sistema de almacenamiento flash y la mejor empresa suministradora de dicho almacenamiento flash,
un usuario final tiene que hacer las preguntas correctas no solo sobre la empresa suministradora, sino también sobre las
necesidades de la aplicación y las áreas que requieren un rendimiento adicional. Los criterios expuestos en esta guía
ayudarán al usuario final a evaluar dónde y cómo puede el almacenamiento flash mejorar el rendimiento y el coste de la
infraestructura de una empresa, lo que al final le permitirá lograr una ventaja competitiva.
¿Tiene alguna pregunta o necesita más información? Contacte con nosotros por email, escribiendo a la dirección espana@
purestorage.com, y le ayudaremos a elegir la mejor solución totalmente flash para su entorno y su carga de trabajo.
10
Pure Storage, Inc.
Twitter: @purestorageES
Pure Storage Iberia
Paseo de la castellana 141,
28046 Madrid
Tel.: 90 083 81 17
Ventas: [email protected]
Soporte: [email protected]
Prensa: [email protected]
General: [email protected]
www.purestorage.com
©2015 Pure Storage, Inc. Reservados todos los derechos. Pure Storage, Pure1 y el logotipo P son marcas comerciales de Pure Storage, Inc.
Todas
las demás
marcas comerciales
son propiedad
de sus
respectivos
propietarios.
© 2015 Pure Storage, Inc. All rights reserved. Pure Storage, Pure1, and the
P Logo
are trademarks
of Pure Storage,
Inc. All other
trademarks
are the
property of their
ps_g_flash-storage-buyers-guide_01
respective owners.
ps_g_flash-storage-buyers-guide_01
Descargar