Discos redundantes: RAID

Anuncio
RAID. DISCOS REDUDANTES
RAID DISCOS REDUNDANTES
¿Qué es RAID?
RAID acrónimo del inglés "Redundant Array of Independent Disks", significa matriz redundante
de discos independientes. Es un método de combinación de varios discos duros que trabajan en
paralelo como si de uno solo se tratara, de esta forma aumenta la velocidad de acceso y seguridad
frente a fallos del hardware. Es un modo de almacenar los mismos datos en distintos lugares, es
decir, de modo redundante en múltiples discos duros. Para el sistema operativo un sistema RAID
aparenta ser un sólo disco duro lógico. Este sistema ofrece mayor tolerancia a fallos y más altos
niveles de rendimiento que un sólo disco duro o un grupo de discos duros independientes.
Las operaciones de entrada y salida a disco son relativamente lentas, primordialmente debido a su
carácter mecánico. Una lectura o una escritura involucra, normalmente, dos operaciones. La primera
es el posicionamiento de la cabeza de lectura/ escritura y la segunda es la transferencia desde o
hacia el propio disco. Si un disco solo es capaz de entregar una tasa de transferencia dada, si
utilizamos varios discos en paralelo, por ejemplo dos deberían, teóricamente, de ofrecer el doble de
la tasa anterior, lo mismo sucedería con cualquier operación. En la práctica, sin embargo, dichos
niveles no se obtienen debido, principalmente, a la carga de trabajo inherente al control del propio
RAID.
Como se ha indicado una matriz consta de dos o más discos duros y funciona desglosando los
datos en fragmentos que se escriben en varias unidades de forma simultánea. En este método, la
información se reparte entre varios discos, usando técnicas como el entrelazado de bloques (RAID
nivel 0) o la duplicación de discos (RAID nivel 1) para proporcionar redundancia, reducir el tiempo de
acceso, y/o obtener mayor ancho de banda para leer y/o escribir, así como la posibilidad de
recuperar un sistema tras la avería de uno de los discos.
Existen dos posibilidades de realizar un sistema basado en la tecnología RAID: RAID Hardware o
RAID Software.
El RAID Software implementa los diferentes niveles de RAID en el código del S.O. que tienen que
ver con la gestión del disco. Además es menos costoso, el RAID software funciona con discos IDE y
con discos SCSI. Con las rápidas CPU de hoy en día, las prestaciones de un RAID software pueden
competir con las de un RAID hardware.
-1-
RAID. DISCOS REDUDANTES
EL RAID hardware podría ser un sistema RAID externo que se encarga de la gestión del RAID con el
controlador localizado en el subsistema externo de los discos. Existen también controladores RAID
en forma de tarjetas que se comportan como un controlador SCSI con el sistema operativo, pero
gestionan todas las comunicaciones reales entre los discos de manera autónoma. En estos casos,
basta con conectar los discos a un controlador RAID como lo haría con un controlador SCSI.
Cualquiera de las dos soluciones, software o hardware, será visualizada como un único y gran disco
virtual.
La tecnología RAID se utiliza cuando se necesitan controlar grandes cantidades de datos como en la
administración de sistemas o redes, protegiendo los datos contra el fallo de una unidad de disco
duro. Si se produce un fallo, RAID mantiene el servidor activo y en funcionamiento hasta que se
sustituya la unidad defectuosa. Esta tecnología se utiliza también con mucha frecuencia para
mejorar el rendimiento de servidores y estaciones de trabajo. Estos dos objetivos, protección de
datos y mejora del rendimiento, no se excluyen entre sí.
Tipos de RAID:
RAID ofrece varios tipo u opciones, llamados niveles RAID, cada una de las cuales proporciona un
equilibrio distinto entre tolerancia a fallos, rendimiento y coste. La elección de los diferentes niveles
de RAID depende de las necesidades del usuario en lo que respecta a factores como seguridad,
velocidad, capacidad, coste, etc. Cada nivel de RAID ofrece una combinación específica de
tolerancia a fallos (redundancia), rendimiento y coste, diseñadas para satisfacer las diferentes
necesidades de almacenamiento. La mayoría de los niveles RAID pueden satisfacer de manera
efectiva sólo uno o dos de estos criterios. No hay un nivel de RAID mejor que otro; cada uno es
apropiado para determinadas aplicaciones y entornos informáticos. De hecho, frecuentemente se
utiliza varios niveles RAID para distintas aplicaciones del mismo servidor. Oficialmente existen siete
niveles diferentes de RAID (0-6), definidos y aprobados por el el RAID Advisory Board (RAB),
aunque existen posibles combinaciones de estos niveles (10, 50, ...). Los niveles más populares son
RAID 0, 1, 0+1 y 5.
RAID 0: Disk Striping
También conocido como modo de bandas, presenta la más alta transferencia, pero sin tolerancia a
fallos.
-2-
RAID. DISCOS REDUDANTES
Los datos se desglosan en pequeños segmentos o bloques y se distribuyen entre varias unidades.
Este nivel de "array" o matriz no ofrece tolerancia al fallo ya que al no existir redundancia, RAID 0 no
ofrece ninguna protección de los datos. El fallo de cualquier disco de la matriz tendría como
resultado la pérdida de los datos y sería necesario restaurarlos desde una copia de seguridad. Por lo
tanto, RAID 0 no se ajusta realmente al acrónimo RAID. Consiste en una serie de unidades de disco
conectadas en paralelo que permiten una transferencia simultánea de datos a todos ellos, con lo que
se obtiene una gran velocidad en las operaciones de lectura y escritura. La velocidad de
transferencia de datos aumenta en relación al número de discos que forman el conjunto.
Esto representa una gran ventaja en operaciones secuenciales con ficheros de gran tamaño po lo
que representa un gran ventaja para trabajar en:

Diseño de grandes gráficos.

Grabación de grandes archivos DV mientras se conserva un rendimiento limpio del audio.

Edición de DV o video HD y se desea un flujo de trabajo continuo, sin pérdida de cuadros de
video.

Visualizar complejos objetos o efectos especiales en 3D.

Realizar operaciones de bases de datos con uso intensivo del disco.
RAID 1: Mirroring
Denominado "Mirroring" o "Duplicación" (Creación de discos en espejo) ya que cuando se escriben
datos en una unidad, también se escriben en la otra, es decir, el disco redundante es una replica
exacta del disco de datos, por lo que se conoce también como disco espejo. Al duplicar todos los
datos de una unidad o matriz en otra, se asegura la integridad de los datos y la tolerancia al fallo,
pues en caso de avería, la controladora sigue trabajando con los discos no dañados sin detener el
sistema. Los datos se pueden leer desde la unidad o matriz duplicada sin que se produzcan
interrupciones.
Para implementar una solución RAID 1 se necesita un mínimo de dos unidades y presenta las
siguientes ventajas y desventajas:
Ventajas

Mayor rendimiento en las lecturas de datos de las lecturas convencionales.

Podemos recuperar todos los datos en caso de error en unos de los discos ya que si un disco
falla el otro continua disponible.
-3-
RAID. DISCOS REDUDANTES
Desventajas

Es costoso para los grandes sistemas, ya que las unidades se deben añadir en pares para
aumentar la capacidad de almacenamiento.
RAID 0+1/ RAID 0/1 ó RAID 10
Este tipo consiste en la combinación de los sistemas anteriores que proporciona velocidad y
tolerancia al fallo simultáneamente. La información se distribuyen en bloques como el RAID 0 y
también utiliza un conjunto de discos duplicados para conseguir redundancia de datos como RAID
1, es decir, combina las ventajas de rendimiento de RAID 0 con la redundancia que aporta RAID 1
La principal desventaja es que requiere un mínimo de cuatro unidades y sólo dos de ellas se
utilizan para el almacenamiento de datos. Las unidades se deben añadir en pares cuando se
aumenta la capacidad, lo que multiplica por dos los costes de almacenamiento. La configuración
RAID 0+1 utiliza un número par de discos (4, 6, 8) creando dos bloques. Cada bloque es una copia
exacta del otro, de ahí RAID 1, y dentro de cada bloque la escritura de datos se realiza en modo
de desglose en pequeños segmentos alternos, el sistema RAID 0.
RAID 0+1 es una excelente solución para usos que requieran gran rendimiento y tolerancia a
fallos, pero no una gran capacidad. Normalmente se utiliza en entornos como servidores de
aplicaciones, que permiten a los usuarios acceder a una aplicación en el servidor y almacenar
datos en sus discos duros locales, o como los servidores web, que permiten a los usuarios entrar
en el sistema para localizar y consultar información. Este nivel de RAID es el más rápido, el más
seguro, pero por contra el más costoso de implementar.
Raid 2 : Acceso paralelo con discos especializados. Redundancia a través del código
Hamming
El RAID nivel 2 adapta la técnica comúnmente usada para detectar y corregir errores en memorias
de estado sólido. El código ECC (Error Correction Code) se intercala a través de varios discos a
nivel de bit., empleando el método Hamming (nombre de su inventor, Richard Hamming). El código
Hamming se usa tanto para detección como para corrección de errores (Error Detection and
Correction).
Este nivel cuenta con varios discos para bloques de redundancia y corrección de errores. La
división es a nivel de bits, cada byte se graba con un bit de paridad en cada uno de los discos. El
acceso es simultáneo a todas las unidades tanto en operaciones de escritura como lectura. Este
-4-
RAID. DISCOS REDUDANTES
nivel tiene un costo bastante elevado ya que necesitamos muchos discos para mantener los
códigos de error, no ha sido apenas implementado en productos comerciales, lo que también es
debido a que requiere características especiales en los discos y no usa discos estándares.
Debido a que es esencialmente una tecnología de acceso paralelo, RAID 2 está más indicado para
aplicaciones que requieran una alta tasa de transferencia y menos conveniente para aquellas otras
que requieran una alta tasa de demanda de entrada/salida
RAID 3: Sistemas de disco en paralelo con disco de paridad para corrección de errores.
Dedica un único disco al almacenamiento de información de control de paridad para corrección de
errores. La recuperación de datos se consigue calculando el O exclusivo (XOR) de la información
registrada en los otros discos, permitiendo la reconstrucción de información en caso de fallos. Se
requieren como mínimo 3 discos utilizando la capacidad de un disco para la información de control,
como hemos comentado.
Al igual que en RAID 0, los datos se dividen fragmentos que se transfieren a los discos que
funcionan en paralelo, accediendo las operaciones de entrada/salida a todos los discos al mismo
tiempo
Presenta las ventajas de alto rendimiento para aplicaciones de velocidad de transferencia alta y
que gracias al disco de paridad podemos recuperar datos. Sin embargo tiene los inconvenientes
de que si perdemos el disco de paridad perdemos toda la información redundante que tengamos
RAID 4: Sistemas de discos independientes con disco de control de errores .
Basa su tolerancia al fallo en la utilización de un disco dedicado a guardar la información de
paridad calculada a partir de los datos guardados en los otros discos como en el nivel 3, en caso
de avería de cualquiera de las unidades de disco, la información se puede reconstruir en tiempo
real mediante la realización de una operación lógica de O exclusivo. . La ventaja con el RAID 3
está en que se puede acceder a los discos de forma individual.
El RAID 4 es el indicado para el almacenamiento de archivos grandes, donde es necesario
asegurar la integridad de la información. Eso porque, en este nivel, cada operación de grabación
requiere un nuevo cálculo de paridad, dando mayor confianza al almacenamiento, aunque esto
provoca que las grabaciones de datos sean más lentas.
-5-
RAID. DISCOS REDUDANTES
RAID 5: Acceso independiente con paridad distribuida.
Este es muy semejante al nivel 4, excepto por el hecho de que el cálculo de información de paridad y
su almacenamiento alternativo por bloques se realiza en todos los discos del conjunto, con lo que se
acelera la grabación de datos ya que no es necesario acceder a un disco de paridad en cada
grabación. La información del usuario se graba por bloques y de forma alternativa en todos ellos. De
esta manera, si cualquiera de las unidades de disco falla, se puede recuperar la información en
tiempo real, sobre la marcha, mediante una simple operación de lógica de O exclusivo, sin que el
servidor deje de funcionar. En conclusión, se evita el problema de cuello de botella que plantea el
RAID 4 con el disco de comprobación, el RAID 5 no asigna un disco específico a esta misión sino
que asigna un bloque alternativo de cada disco a esta misión de escritura. Con una cantidad
suficiente de discos se puede llegar a eliminar completamente el mencionado cuello de botella
proporcionando
una
velocidad
equivalente
a
un
RAID
0.
Comparado con otros niveles RAID con tolerancia a fallos, RAID 5 ofrece la mejor relación
rendimiento-coste en un entorno con varias unidades, es especialmente indicado para trabajar con
sistemas operativos multiusuarios. Es el nivel de RAID más eficaz y el de uso preferente para las
aplicaciones de servidor básicas para la empresa.
RAID 6: Acceso independiente con doble paridad
Un RAID 6 amplía el nivel RAID 5 añadiendo otro sistema de paridad, por lo que divide los datos a
nivel de bloques y distribuye los dos bloques de paridad entre todos los miembros del conjunto, por
lo que ofrece tolerancia extremadamente alta a los fallos de disco.
Funcionamiento del RAID
Podemos decir que, RAID es básicamente un sistema que permite almacenar información en una
cantidad de discos, de tal forma que agiliza los procesos entre el ordenador y el disco. Evita la
perdida de datos de la siguiente manera:
Los discos optimizados para RAID poseen circuitos integrados que detecta si el disco esta fallando,
en cuyo caso, este circuito se encargará de sacar la información y almacenarla en los otros discos, o
si es el caso en el hot spare (repuesto), que es un disco que permanece siempre en el sistema
esperando a que otro se estropee para entrar directamente en funcionamiento.
Una de las ventajas del sistema RAID es la posibilidad, con los discos Hot Swapping (sustitución en
caliente) de conectarlos y desconectarlos en "caliente", es decir, que si un disco falla no es
necesario desconectar el sistema para remplazarlo.
-6-
Descargar