FallosSD

Anuncio
Tolerancia a Fallos
Wilmer Estevez Piratoa
J. Andrés Argumero
Falla
Es
un desperfecto causado por un
error de diseño, de programación,
daño físico, deterioro por paso del
tiempo o de fabricación.
Fallas de Componentes
Transitorias
Intermitentes
Permanentes
Transitorias
Ocurren
una vez y luego
desaparecen
Intermitentes
Este
tipo de Falla se presentan,
desaparecen luego reaparecen, etc…
Permanentes
Continua
existiendo hasta que se
arregla el componente.
Las Fallas pueden ocurrir en todos los
niveles.
Si algún componente tiene una probabilidad
p de tener una falla en un segundo dado,
la probabilidad de que no falle durante k
segundos consecutivos y después falle es:
El tiempo esperado de fallo esta dado por la
formula:
Fallas de sistema
Fallas
silentes
Fallas
Bizantinas
Sistemas
Asíncronos
Sistemas
Síncronos
Un sistema que responde siempre a un
mensaje en un tiempo limite conocido
Redundancia
De
la Información
Del
tiempo
Fisica
Tolerancia a Fallas por Replica
Activa
(Método de la Maquina de Estados)
Es una técnica muy
conocida.
Se utiliza en la Biología
Redundancia modular triple
Tolerancia mediante respaldo
primario
El objetivo es que en todo momento un
servidor es el primario y realiza todo el
trabajo. Si el primario falla el respaldo
ocupa su lugar.
Acuerdos en sistemas
defectuosos
¿La
entrega de los mensajes es
confiable?
¿Pueden fallar los procesos?
¿Son bizantinos o silentes?
¿El sistema es asíncrono o
asíncrono?
Ejemplo del ejercito bizantino:
Sistemas Distribuidos de Tiempo
Real
¿Qué son?
Tiempo Real Suave
Tiempo Real Duro
Los tres mitos:
1.
2.
3.
La escritura de controladores de
dispositivos en código ensamblador.
El computo de tiempo real es
rápido.
Las computadoras rápidas harán
que el sistema de tiempo real sea
obsoleto.
Aspectos del Diseño
Sincronización de Reloj
Sistemas activado por eventos
Sistemas activados por el tiempo
PREDICTIBILIDAD
TOLERANCIA A FALLOS
Descargar