Sistemas RAID

Anuncio
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Sistemas RAID
Conceptos básicos
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Programa
●
¿Que es RAID?
●
Particularidades
●
hardware vs. software
●
Niveles de RAID
●
Comparando niveles
●
Tolerancia a fallas
●
Confiabilidad y disponibilidad
●
Implementando en Linux (algunos ejemplos)
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
¿Que es RAID?
En términos generales y partiendo de su acrónimo en ingles
Redundant Array of Independent Disks (RAID) es un sistema que
permite combinar el almacenamiento de un grupo de dispositivos
independientes, en una única unidad virtual de almacenamiento o
múltiples unidades virtuales.
dispositivo
1
+
dispositivo
2
+
dispositivo
3
.....
dispositivo
n
=
RAID
Por ejemplo se pueden combinar grupos de discos duros,
grupos de dispositivos de estado solido (solid-state drive, SDD)
o grupos de ambos!!!
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Particularidades
●
Mayor rendimiento y confiabilidad mediante lectura/escritura
simultanea de datos en múltiples dispositivos (físicos o
virtuales). Recordando que:
●
●
Dispositivos físicos → ej: Grupo de discos duros
Dispositivos virtuales → ej: Particiones en un grupo de
discos que podrían ser:
–
En un grupo completo
–
En mas de un grupo
–
En parte de un grupo
–
En parte de mas de un grupo
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Particularidades
●
●
Diferentes esquemas de
como niveles (RAID levels)
conocidos
El nivel a elegir depende de necesidades en cuanto a:
–
–
–
●
lectura/escritura
Rendimiento y redundancia
Costos de hardware
Capacidad almacenamiento (escalabilidad)
Soluciones de RAID pueden estar basadas en hardware
especializado o herramientas de software.
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Hardware vs. Software
●
●
¿hardware o software? Una de las primeras decisiones
que se debe tomar.
hardware RAID
Uso de procesadores dedicados (generalmente
ubicados en controladoras de discos) para realizar
las operaciones del arreglo.
software RAID
–
●
–
Uso del CPU del computador para realizar
operaciones del arreglo implementadas a nivel de
kernel.
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Hardware vs. Software
hardware RAID
●
●
●
El arreglo es administrado por una controladora de disco
especializado que contiene un software embebido (firmware)
para RAID .
La capa de software del computador accede a un único
dispositivo virtual de almacenamiento. El arreglo esta oculto y es
administrado por el controlador de RAID.
Las soluciones de hardware RAID pueden ser:
●
Tarjetas controladoras RAID
●
Gabinetes externos conectados a puertos SCSI, Fiber Channel, otros.
●
Gabinetes externos conectados en red (storage area network – SAN)
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Hardware vs. Software
Tarjetas controladoras
Aplicaciones
●
CPU
Datos
Escritura
●
Lectura
Controladora RAID
●
Directamente instaladas en el
computador (ej. PCI), reciben la
conexión de los dispositivos
generalmente a través de interfaces
estándar (ej. IDE, SATA, otros).
Contiene un BIOS para administración,
configuración y mantenimiento del
RAID.
Es importante asegurar que es
soportada por el OS (ej. Linux)
RAID
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Hardware vs. Software
Gabinetes externos
Gabinete RAID
Controladoras
●
Datos
●
Grupo de discos
●
RAID
16/10/12
Ethernet, SCSI o
Fiber Channel
Conectados a través de puertos
de alto rendimiento (ej. SCSI,
Fiber Channel, otros)
Aparecen como un punto de
montaje externo (no requieren
módulos especiales a nivel de
kernel)
Alto costo inicial y de
mantenimiento (generalmente
soluciones propietarias)
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Hardware vs. Software
Storage Area Networks (SAN)
●
LAN A
1 Gbps
Red de Fibra Óptica
Sistema de
Almacenamiento
●
●
Varias plataformas de almacenamiento
interconectadas a través de una red de
alta velocidad.
Conectada a diferentes partes de la LAN
aumentando el rendimiento hacia el
sistema de almacenamiento.
RAID es una parte vital de la SAN.
1 Gbps
LAN B
16/10/12
●
Se esta convirtiendo en la tendencia en
organizaciones distribuidas de gran
escala.
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Hardware vs. Software
software RAID
●
●
●
El arreglo es administrado a nivel de kernel.
El kernel mantiene la organización de los datos en varios
discos mientras presenta un solo dispositivo virtual a la capa
de aplicaciones.
Se ha popularizado en las ultimas década debido a:
●
●
Mayor capacidad de CPU a bajos costos
Muchos sistemas operativos (ej. Linux) proveen soporte y
funcionalidades de RAID como parte del software.
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Hardware vs. Software
software RAID en Linux
Aplicaciones
●
CPU
●
Conexión a discos
Escritura
Lectura
Muchas distribuciones soportan
RAID de forma nativa a nivel de
kernel.
Herramientas maduras (ej. mdadm)
que permiten crear, consultar,
sincronizar y dar mantenimiento
completo a los dispositivos RAID.
Controladora discos
(No soporta RAID)
RAID
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
●
●
●
Diferentes aplicaciones requieren implementaciones de
diferentes estructuras de RAID. Estas diferentes
estructuras se conocen como niveles.
Diferentes niveles de RAID ofrecen diversidad
compromiso entre rendimiento y redundancia.
de
La selección del nivel adecuado requiere un alto
entendimiento de las necesidades de sus aplicaciones y
usuarios (incluyendo escalabilidad).
Por ejemplo es posible que según sus necesidades deba
sacrificar rendimiento para lograr un RAID de mayor
redundancia!!!
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
Revisando conceptos
striping
●
●
●
●
Técnica de segmentación lógica de los datos que luego son
accedidos de forma secuencial en diferentes dispositivos
de almacenamiento.
Provee un mayor rendimiento en la velocidad de acceso a
los datos almacenados en múltiples dispositivos.
La falla de un dispositivo causa la perdida de todos los
datos.
Según lo anterior el porcentaje de falla es la suma del
porcentaje de falla de cada dispositivos.
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
Revisando conceptos
mirroring
●
●
●
●
Técnica en la cual se crean replicas en tiempo real del
volumen lógico de un dispositivo en otros dispositivos
físicos
Ofrece alta disponibilidad de los datos debido a las
múltiples replicas de los datos (redundancia).
De forma adicional provee mejoras en el rendimiento de
acceso a los datos (lectura) en múltiples dispositivos.
Implementaciones de esta técnica representan un alto
costo debido a la replica de cada dispositivo.
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
Revisando conceptos
parity
●
●
●
Se genera un conjunto de datos de redundancia a partir de
dos o más conjuntos de datos primarios aplicando la
función Boolena XOR (ver apéndice A)
Con los datos de redundancia se puede reconstruir los
datos de algunos de los conjuntos de datos primarios.
Aunque no implica duplicar por completo los datos
primarios, esta técnica puede ocasionar bajo rendimiento
en la velocidad de escritura en un RAID.
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
Revisando conceptos
parity
●
●
Esta técnica aplica a todo un grupo de dispositivos o a
segmentos distribuidos a través de todo el grupo de
dispositivos.
En términos de RAID hablamos de dos tipos de paridad:
–
Paridad dedicada → Los datos de paridad de dos o
más dispositivos son almacenados en un dispositivo
adicional
–
Paridad distribuida → Los datos de paridad son
distribuidos entre los dispositivos del arreglo.
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
RAID 0 (disk striping)
120 GB
●
Datos
RAID0
●
●
1
2
3
4
5
6
60 GB
60 GB
16/10/12
●
Cada dispositivo del RAID se divide en
segmentos de tamaño similar (ej. entre
8 KB a 1024 KB).
Estos segmentos son intercalados de
manera secuencial y repetida.
El espacio de almacenamiento esta
compuesto por segmentos de todo el
grupo de dispositivos.
Ofrece un alto rendimiento ya que
múltiples dispositivos son accedidos
(lectura/escritura) simultáneamente
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
RAID 0 (disk striping)
80 GB
●
Datos
RAID0
●
1
2
3
4
40 GB
60 GB
16/10/12
La cantidad total de almacenamiento es la
suma de la capacidad de todos los
dispositivos del grupo.
Se pueden usar dispositivos de diferentes
tamaños, recordando que el dispositivo de
menor tamaño limita la cantidad de
espacio usado en los demás dispositivos.
Un daño en cualquiera de los
dispositivos hará inutilizable el RAID!!!
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
RAID 3 (byte striping)
RAID 2 (bit striping)
●
●
●
Divide los datos a nivel de bits
distribuyendolos entre los
dispositivos del arreglo.
●
Hace uso de código Hamming
para el chequeo de paridad.
●
La segmentación a nivel de bits
crea un alto impacto
(lectura/escritura) en los
recursos del sistema lo que lo
hace inviable a nivel practico.
16/10/12
Divide los datos a nivel de byte
distribuyendolos entre los
dispositivos del arreglo.
De forma similar que RAID 2 la
segmentación de datos a nivel
de byte crea un alto impacto
(lectura/escritura) en los
recursos del sistema haciendo
inviable su implementación
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
RAID 1 (disk mirroring)
60 GB
●
Datos
RAID1
●
●
1
1
2
2
3
3
60 GB
60 GB
16/10/12
Todos los datos escritos son duplicados
(replica) en cada dispositivo del RAID.
Según lo anterior ofrece 100% de
redundancia.
Un alto rendimiento ya que lo conforman
múltiples dispositivos que pueden ser
accedidos (lectura) mientras uno o mas
están ocupados.
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
RAID 1 (disk mirroring)
40 GB
●
Datos
RAID1
●
1
1
2
2
●
La cantidad total de almacenamiento es
igual al tamaño del dispositivo de menor
capacidad.
El uso de dispositivos de capacidad
similar proporcionan un RAID optimo.
Es un esquema de alto costo ya que
cada dispositivo debe ser duplicado.
40 GB
60 GB
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
RAID 4
120 GB
Datos
(block striping & dedicated parity)
RAID4
●
●
1
2
P0
3
4
P1
5
6
P2
60 GB
60 GB
60 GB
16/10/12
●
Segmenta los datos a nivel de bloques
distribuyendolos entre los dispositivos del
arreglo.
Dedica por completo uno de los dispositivos
del arreglo para paridad.
Es un esquema similar a RAID2 y RAID3
pero la división en bloques evita un alto
impacto (lectura/escritura) en los recursos
del sistema.
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
120 GB
Datos
RAID 5
(block striping & distributed parity)
RAID5
●
●
1
2
P0
3
P1
4
P2
5
6
60 GB
60 GB
60 GB
16/10/12
●
Segmenta los datos a nivel de bloques
distribuyendolos entre los dispositivos del
arreglo de forma similar a RAID 4.
Distribuye los datos de paridad entre
todos los dispositivos del arreglo.
RAID 4 y RAID 5 proveen redundancia
ante la falla de un dispositivo en base a la
información de paridad.
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
RAID 6
120 GB
(block striping & distributed parity)
Datos
RAID6
●
●
1
2
P0
Q0
3
P1
Q1
4
●
P2
Q2
5
6
60 GB 60 GB 60 GB 60 GB
16/10/12
Segmenta los datos a nivel de bloques
distribuyendolos entre los dispositivos del
arreglo de forma similar a RAID 4.
Distribuye los datos de paridad entre
todos los dispositivos del arreglo de forma
similar a RAID 5.
Un segundo conjunto de datos de paridad
lo que provee redundancia ante la falla de
dos dispositivos.
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
●
●
●
Es posible incrementar el rendimiento y la redundancia de
un sistema de almacenamiento combinando diferentes
niveles de RAID, estas combinaciones se conocen como
arreglos hibridos.
La mayoría de las tarjetas controladoras, gabinetes
externos y software RAID soportan combinaciones de dos o
más niveles.
No todas las combinaciones soportadas y permitidas en
hardware y software para RAID ofrecen beneficios.
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
RAID 10
Datos
120 GB
RAID0
(striping & mirror)
●
●
RAID1
RAID1
●
1
1
2
2
3
3
4
4
5
5
6
6
60 GB
16/10/12
60 GB
A pesar de su alto costo es muy
utilizados.
Combina el rendimiento (velocidad de
acceso) de la segmentación de datos
(striping) con las propiedades de la
redundancia (mirroring).
Si un dispositivo falla ambos lados del
RAID 10 seguirán funcionando (aunque
un lado en modo degradado)
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
RAID 50
Datos
RAID0
240 GB
(striping & parity)
●
En referencia a un RAID 10:
●
RAID5
●
RAID5
●
1
3
P0
2
4
P0
5
P1
7
6
P1
8
P2
9
11
P2
10
12
120 GB
16/10/12
120 GB
●
Menor costo.
Rendimiento de lectura más bajo
(aunque sigue siendo bueno)
A nivel de escritura hay mayor
rendimiento (velocidad).
Cada RAID 5 puede soportar la
falla de un dispositivo.
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Niveles de RAID
Datos
RAID0
RAID 60
240 GB
(striping & parity)
●
En referencia a un RAID 10:
●
RAID5
RAID6
●
RAID5
RAID6
●
1
2
P0
Q0
1
2
P0
Q0
3
P1
Q1
4
3
P1
Q1
4
P2
Q2
5
6
P2
Q2
5
6
120 GB
16/10/12
120 GB
●
Menor costo.
Rendimiento de lectura más bajo
(aunque es bueno)
A nivel de escritura hay mayor
rendimiento (velocidad).
Cada RAID 6 puede soportar la
falla de dos dispositivos
(simultáneamente).
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Comparando niveles
Nivel
RAID 0
RAID 1
Tipo
Striping
(block level)
Mirroring
Dispositivos
Redundancia
Capacidad
Rendimiento
(lectura)
Rendimiento
(escritura)
N>1
0
1
N
N
N>2
N-1
1/N
N
1
N>2
1
1 – 1/N
N-1
N-1
N>2
1
1 – 1/N
N-1
N-1
N>3
2
1 – 2/N
N-2
N-2
Striping
RAID 4
(block level)
Parity
(dedicated)
Striping
RAID 5
(block level)
Parity
(distributed)
Striping
RAID 6
(block level)
Double Parity
(distributed)
N = Cantidad de dispositivos en el grupo de almacenamiento
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Comparando niveles
Nivel
Tasa de fallas
(fail rate)
Posibles Aplicaciones
RAID 0
1−(1−r)N
Almacenamiento de archivos grandes que no
requieren redundancia en tiempo real.
RAID 1
rN
Bases de datos y archivos de bajo contenido
dinamico (poca capacidad)
RAID 4
N(N−1)r2
Bases de datos, servidores de archivos, correo
electronico, contenido.
RAID 5
N(N−1)r2
Bases de datos, servidores de archivos, correo
electronico, contenido.
N(N-1)(N-2)r3
Bases de datos, servidores de archivos, correo
electronico, contenido (mayor tolerencia a fallas
que RAID 5)
RAID 6
N = Cantidad de dispositivos en el grupo de almacenamiento
r = % de error estimado por cada dispositivo del grupo de almacenamiento.
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Tolerancia a fallas
●
●
●
Uno de los beneficios de RAID es la posibilidad de manejar
fallas en los dispositivos sin detener el sistema de
almacenamiento y sin intervención de un administrador
(redundancia)
Un RAID pre-configurado con los dispositivos necesarios,
puede recuperarse de una falla por si mismo.
En este sentido es importante revisar los siguientes
conceptos:
–
Modo de degradación
–
hot spares
–
hot swap
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Tolerancia a fallas
Revisando conceptos
Modo de degradación
●
El momento en que un grupo de dispositivos falla por
cualquier razón en un RAID (con redundancia)
Cuando ocurre:
Datos
RAID1
1
2
3
16/10/12
1
2
3
●
Funcionamiento no optimo.
●
Redundancia comprometida.
●
Ocurre en RAID 1, 5, 10, 50 y 60
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Tolerancia a fallas
Revisando conceptos
hot spares
●
Esta características en niveles con soporte de redundancia
permite que RAID se recupere de una falla por si mismo.
Datos
disk 2
fail
RAID1
hot spares
1
2
3
16/10/12
1
2
3
1
2
3
●
●
●
Soporte en hardware y software
RAID.
Dispositivos extras en stand by
esperando un falla para ocupar el
lugar del dispositivo dañado.
El RAID pasa a modo degradado
mientras hot spares actua.
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Tolerancia a fallas
Revisando conceptos
hot swap
●
Esta características en niveles con soporte de redundancia
permite que en el RAID se puedan retirar dispositivos que
han fallado con el sistema operando (power on)
Generalmente se usa en caso de:
Datos
RAID1
hot swap
●
●
1
2
3
16/10/12
1
2
3
No se tiene espacio físico para instalar
dispositivos con soporte hot spares
Un dispositivo en modo hot spares esta
activo y se debe reemplazar el
dispositivo dañado previendo fallas a
futuro.
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Confiabilidad y Disponibilidad
●
Los sistemas RAID como cualquier otro puede presentar
fallas que lo desvíen de su funcionamiento normal pero:
●
–
¿Con que frecuencia ocurren estas fallas en el sistema?
–
En términos de tiempo ¿Como podemos
confiabilidad de un RAID ante posibles fallas?
medir
la
Revisemos de forma general el significado de algunos
términos relacionados como:
–
failure rate
–
mean time to data loss (MTTDL)
–
mean time to recovery (MTTR)
–
unrecoverable bit error rate (UBE)
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Confiabilidad y Disponibilidad
failure rate (Porcentaje de averiás)
En termino generales se refiere a la frecuencia con la cual un
sistema falla. En el contexto de RAID se aplican dos tipos de
porcentajes de averiás:
●
●
Falla lógica → Si perdemos un solo dispositivo del RAID y su
porcentaje esta dado por la suma del porcentaje de falla de
cada dispositivo del grupo.
Falla del sistema → Si perdemos datos en el arreglo, este
porcentaje dependen del nivel de RAID implementado.
Falla lógica = Falla del sistema en un RAID sin redundancia!!!
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Confiabilidad y Disponibilidad
mean time to data loss - MTTDL
(Tiempo promedio antes de la perdida de datos)
Tiempo promedio antes que la falla de uno o varios
dispositivos pueda ocasionar perdidas de datos en un arreglo.
En conjunto con el tiempo promedio antes que ocurra una falla
(mean time to failure - MTTF) son las dos métricas principales
de confiabilidad en un arreglo.
●
Si un arreglo no cuenta con redundancia MTTDL = MTTF
●
Si aumenta la redundancia en un arreglo MTTDL aumenta.
●
MTTDL >> MTTF para un arreglo de alta confiabilidad.
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Confiabilidad y Disponibilidad
mean time to recovery - MTTR
(Tiempo promedio de recuperación)
El tiempo que lleva recuperar un arreglo a su normal
funcionamiento luego que ocurre una falla. Este tiempo
incluiría:
●
Tiempo en sustituir un dispositivo en falla.
●
Tiempo para reconstruir el arreglo.
●
En sistemas de alta disponibilidad el MTTR disminuye con
el uso de arreglos (hardware o software RAID) que cuenten
con soporte hot spares y/o hot swap
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Confiabilidad y Disponibilidad
unrecoverable bit error rate - UBE
(Tasa de error de bit irrecuperable)
Relacionado con el tiempo en el cual un dispositivo de un
arreglo no tiene capacidad para recuperar los datos después
de aplicar en varios intentos códigos de redundancia (ej.
Codigos de Redundancia Ciclica – CRC)
En referencia a un RAID 5 o RAID 6 la UBE puede comprometer
la reconstrucción de un arreglo (con redundancia) que ha
entrado en un modo de degradación.
degradación
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Confiabilidad y Disponibilidad
●
De forma general la disponibilidad de un sistema (en
nuestro caso RAID) viene dada por la relación:
D=
●
MTTF
MTTF +MTTR
Algunos ejemplos recordando la notación de “nueves”:
16/10/12
Disponibilidad
Tiempo de apagado
90.1% (1 nueve)
36 dias/año
99% (2 nueves)
3.65 dias/año
99.9% (3 nueves)
8.76 hrs/año
99.99% (4 nueves)
52 min/año
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Implementando en Linux
Verificando que dispositivos están instalados y como están distribuidos:
# fdisk /dev/sda
Usando herramientas de RAID en Linux (ej. Debian):
# apt-get install mdadm
Creando un arreglo:
# mdadm -C /dev/md0 -a yes -l 0 -n 2 /dev/sda10 /dev/sda11
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Implementando en Linux
Dando formato a un arreglo:
# mkfs.ext3 /dev/md0
Definiendo en el arranque:
# vim /etc/fstab
/dev/md0
/usr2
ext3
defaults
0
# reboot
Monitoreo de los arreglos:
# cat /proc/mdstat
# mdadm –-detail /dev/md0
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
0
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Implementando en Linux
Chequeando el arreglo:
●
Simulando una falla en un disco:
# mdadm /dev/md0 -f /dev/sda1
●
Restableciendo una falla en un disco:
# mdadm /dev/md0 -r /dev/sda1
Mas documentación
# man mdadm
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Apéndice A
De forma sencilla y general XOR:
120 GB
Datos
Dispositivo1 -> 0 1 1 0 1 1 0 1
Dispositivo2 -> 1 1 0 1 0 1 0 0
RAID4
Aplicamos XOR y almacenamos:
Dispositivo3 -> 1 0 1 1 1 0 0 1
1
2
P0
3
4
P1
5
6
P2
60 GB
60 GB
60 GB
Si fallara el dispositivo2:
Dispositivo3 -> 1 0 1 1 1 0 0 1
Dispositivo1 -> 0 1 1 0 1 1 0 1
Resulta ->
11010100
Dispositivo2
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Alta Disponibilidad y Virtualización con soluciones de bajo costo
Referencias
●
J. Ostergaard, Software RAID HowTO.
www.kernel.org
●
LVM & software RAID.
GNS Systems
●
D. Vadala, Managing RAID on Linux.
O'Reilly
●
http://en.wikipedia.org/wiki/RAID
16/10/12
WALC 2012
Universidad Tecnológica de Panamá
Descargar