Disponibilidad de Sistemas - Grupo de Ingeniería Telemática

Anuncio
Tema 1: Jerarquía Digital Síncrona, SDH
Disponibilidad de Sistemas
Tecnologías de red de transporte de
operadora
MÁSTER EN INGENIERÍA TELEMÁTICA
Profesor: Juan José Alcaraz Espín
Definiciones
„
Fiabilidad (Reliability):
Probabilidad de que el sistema desempeñe sus funciones durante
un tiempo determinado.
„
Disponibilidad (Availability)
Porcentaje de tiempo que el sistema está disponible
Tiempo en funcionamiento
A=
Tiempo en funcionamiento + tiempo indisponible
MTBF
A=
MTBF + MTTR
„Indisponibilidad
Tiempo medio entre fallos
Tiempo medio de la reparación
(Unavailability)
Porcentaje de tiempo que el sistema está disponible. U = 1 - A
Juan José Alcaraz
Definiciones
Función de fiabilidad
R (t )
Función de fallo
F (t ) = 1 − R(t )
f.d.p. de la función de fallo
f (t ) = dF (t ) dt
Nos da la probabilidad de que un componente esté
funcionando en es instante t.
Nos da la probabilidad de que el componente haya
sufrido un fallo desde que empezó a funcionar hasta
el instante t (incluido)
Probabilidad de fallo en un tiempo diferencial (dt) en
el instante de tiempo t
R(t) y F(t) pueden estimarse empíricamente ¿Cómo?
Juan José Alcaraz
Definiciones
Tasa (instantánea) de fallo
λ (t )
Probabilidad de fallo por unidad de tiempo de un componente que haya estado funcionando
hasta el instante t.
¿Cómo expresar este parámetro en función de las funciones que hemos ya hemos visto?
Partiendo de la definición, se trata de una probabilidad condicional:
λ (t ) = P(fallar en t | haber funcionado hasta t )
λ (t ) =
f (t )
R (t )
Juan José Alcaraz
P(A B ) =
P( A ∩ B )
P (B )
Definiciones
Relación entre
λ (t ) =
λ (t ) y R (t )
P(fallar en t | haber funcionado hasta t )
λ (t ) =
f (t )
R (t )
λ (t ) =
dF (t ) 1
dt R(t )
λ (t ) = −
dR (t ) 1
dt R (t )
Lo que hemos obtenido es una ecuación diferencial
R′(t )
−
= λ (t )
R (t )
R(t ) = e
Ln(R (t ) ) = − ∫ λ (t )dt
t
0
− ∫0t λ ( t ) dt
Cuando la tasa de fallo es constante (centro de la curva de bañera), obtenemos la
expresión más habitual de la función de fiabilidad para un componente.
R(t ) = e − λt
Una exponencial negativa
Juan José Alcaraz
Calculando MTBF
El tiempo medio entre fallos (es decir, el tiempo medio que el sistema está
funcionando) se puede medir a partir de la siguiente integral
∞
MTBF = ∫ t · f (t )dt
0
Considerar un caso con tiempo discreto
(1 día, 2 días, etc) para entenderlo mejor
Que es equivalente a
∞
MTBF = ∫ R(t )dt
0
Demostrar que esta integral equivale a la anterior,
con la condición de que R(t)t Æ 0 si t Æ ∞
Para el caso de un componente con tasa de fallo constante, el MTBF es
MTBF = ∫ e −λt dt = −
[e ]
λ
λ=
1
MTBF
∞
0
1
− λt ∞
0
=−
Juan José Alcaraz
1
λ
[0 − 1] = 1
λ
Calculando R(t) en sistemas en serie
Supongamos un sistema compuesto por N sistemas en serie
A
E1
E2
E3
EN
B
Se asume que el objetivo del sistema es llevar una señal de A a B
Llamaremos Ei al evento “dispositivo i funcionando”, es decir Ri(t) = P(Ei | t),
Para abreviar emplearemos Ri y P(Ei)
Al evento “dispositivo i no funciona”, le denominamos Ei
P (Ei ) = 1 − P (Ei ) = 1 − Ri = Qi
El evento, “sistema completo funcionando” implica que la señal llegue del punto A
al punto B.
Juan José Alcaraz
Calculando R(t) en sistemas en serie
Supongamos un sistema compuesto por N sistemas en serie
A
E1
E2
E3
EN
B
El evento “sistema no funciona”:
E = E1 ∪ E2 ∪ E3 ∪ ... ∪ E N
El sistema falla en cuanto falla algún componente o
dispositivo si están todos en serie
El operador ∪ (unión) equivale en estadística a
un “OR” lógico (“+” en álgebra de Boole)
Aplicando la regla de De Morgan:
E = E1 ∩ E2 ∩ E3 ∩ ... ∩ E N
Es decir que el sistema no funciona si no están
funcionando todos sus elementos a la vez.
El operador ∩ (intersección) equivale en estadística a
un “AND” lógico (un · en álgebra de Boole)
Juan José Alcaraz
Calculando R(t) en sistemas en serie
E = E1 ∩ E2 ∩ E3 ∩ ... ∩ E N
E = E1 ∩ E2 ∩ E3 ∩ ... ∩ E N
El sistema funciona si todos los elementos funcionan
R = ∏ Ri
P (E ) = ∏ P (Ei )
P (E ) = P (E1 ∩ E2 ∩ E3 ∩ ... ∩ E N )
i
i
Puesto que los eventos son independientes
Ri = e
Suponiendo
− λi t
R=e
−
∑ λit
i
Es sencillo obtener el MTBF de todo el sistema
∞
∞
MTBF = ∫ R(t )dt = ∫ e
0
−
∑ λi t
i
0
1
dt = −
∑ λi
i
∞
⎡ −∑i λi t ⎤
1
1
[
]
=
−
−
=
e
0
1
⎢
⎥
∑ λi
∑ λi
⎣
⎦0
i
i
Juan José Alcaraz
Calculando R(t) en sistemas en paralelo
El sistema falla si todos los elementos fallan
E1
E = E1 ∩ E2 ∩ E3 ∩ ... ∩ E N
A
P (E ) = ∏ P (Ei )
EN
i
Q = ∏ Qi
R = 1 − Q = 1 − ∏ Qi = 1 − ∏ (1 − Ri )
i
Suponiendo
B
E2
i
Ri = e − λit
(
R = 1 − ∏ 1 − e − λi t
i
Juan José Alcaraz
i
)
Calculando R(t) en sistemas serie-paralelo
1
2
A
k
E11
E12
E13
E1N
E21
E22
E23
E2N
Ek1
Ek2
Ek3
EkN
N
Fiabilidad de una rama:
Ri = ∏ Rij
Qi = 1 − Ri
j =1
k
Probabilidad de que todo el sistema falle:
B
Q = ∏ Qi
R = 1− Q
i =1
N
⎛
⎞
R = 1 − ∏ ⎜⎜1 − ∏ Rij ⎟⎟
i =1 ⎝
j =1
⎠
k
Juan José Alcaraz
Calculando R(t) en sistemas paralelo-serie
A
E11
E12
E13
E1N
E21
E22
E23
E2N
Ek1
Ek2
Ek3
EkN
R j = 1 − ∏ (1 − Rij )
k
Fiabilidad de uno de los conjuntos en paralelo:
i =1
Fiabilidad de todo el sistema:
N
N
k
⎛
⎞
R = ∏ R j = ∏ ⎜1 − ∏ (1 − Rij )⎟
j =1
j =1 ⎝
i =1
⎠
Juan José Alcaraz
B
Calculando R(t) en otras configuraciones
E1
E1
A
B
E5
E2
La estrategia para resolver este tipo de
problemas es desglosarlo en problemas
más sencillos determinados por eventos
mutuamente excluyentes.
E4
En este caso los dos eventos mutuamente excluyentes que podemos elegir son:
E5 activo y E5 inactivo
E5
E5
P ( E | E5 )
P ( E | E5 )
P ( E ) = P ( E | E5 )·P ( E5 ) + P ( E | E5 )·P ( E5 )
Juan José Alcaraz
Consideraciones sobre la redundancia
Para dar una mayor robustez a un sistema debe optarse por una configuración
que proporcione redundancia, como por ejemplo una configuración en paralelo:
E1
A
B
Se asume que la señal se transmite simultáneamente por los
dos enlaces, y en recepción se escoge la mejor señal.
E2
A este tipo de redundancia se le suele denominar redundancia simple
En ocasiones se considera también la fiabilidad del elemento decisor.
E1
R = RE R D
D
E2
RD
El elemento decisor está en serie con los
componentes anteriores.
RE
Juan José Alcaraz
Redundancia simple parcial
Para economizar, se emplea a veces la redundancia simple parcial, que consiste
en que un conjunto k de componentes proporciona redundancia a un conjunto de
N componentes que transmiten señal distintas (k < N).
Este tipo de redundancia se representa k:N
E1
E1
E1
B
A
E2
D
B
A
EN+1
E2
B
A
D
EN+1
E2
D
EN+1
Ejemplo 1:N, un elemento se pone en funcionamiento si falla alguno de los N anteriores
Los k elementos de protección no transportan señales cuando el sistema no ha sufrido
fallos. Pueden emplearse para establecer circuitos de menor prioridad
El sistema funcionará si N dispositivos funcionan
Juan José Alcaraz
R(t) en sistemas con redundancia parcial
E1
B
A
E2
D
E3
Ejercicio:
Encontrar la fórmula de R(t) para un sistema de 1:2 en el que los componentes
tienen una tasa de fallo λ y el elemento decisor tiene una tasa de fallo λD.
A partir del resultado anterior encontrar una expresión general para la fiabilidad
RT de un sistema k:N (k<N) en la que cada elemento tiene una fiabilidad R.
Juan José Alcaraz
Tipos de Redundancia
1+1
La señal se transmite simultáneamente por
dos caminos
1+1 Standby
El camino de reserva sólo se activa cuando
falla el camino principal
1+1 Hot Standby
El camino de reserva sólo se activa cuando
falla el camino principal, pero el equipo de
reserva está en funcionamiento (encendido)
1:1
El camino de reserva puede transmitir otra
señal de menor prioridad
k:N
K caminos camino hacen de reserva para N
caminos. Los equipos de reserva pueden
transmitir señales de menor prioridad
Juan José Alcaraz
Calculando la disponibilidad (A)
Disponibilidad de un sistema 1+1
El tiempo medio de reparación tiene asociado una tasa de reparación μ =
1
MTTR
El número de elementos activos en el sistema puede representarse como una
cadena de Markov
λ
0
1
μ
π 0 μ = π 1λ
π 0 ,π 1,π 2
2λ
Tasa de fallo de dos elementos
2
Elementos activos
μ
π 1 (λ + μ ) = π 0 μ + π 2 2λ
Probabilidad de estar en cada estado
Juan José Alcaraz
π 2 2λ = π 1 μ
π 0 + π1 + π 2 = 1
Calculando la disponibilidad (A)
π0 =
π 0 μ = π 1λ
π 1 (λ + μ ) = π 0 μ + π 2 2λ
π 2 2λ = π 1 μ
π1 =
λ
π
μ 1
2λ
μ
π 0 + π1 + π 2 = 1
2λ2
μ2
π2 +
2λ
μ
μ
2
+
2λ
μ
π2 =
1
2λ 2λ
+
+1
2
2
μ
2λ
μ
2
μ
2λ2
λ
λ 2λ
π1 =
π
μ μ 2
μ
π2
π2 +π2 = 1
2λ
π1 =
π0 =
+1
π0 =
μ2
2λ2
μ2
+
2λ
μ
+1
Juan José Alcaraz
Calculando la disponibilidad (A)
Disponibilidad: El sistema estará funcionando siempre que haya 1 ó 2 equipos
funcionando. Es decir, siempre que no esté en el estado 0 (0 equipos).
μ 2 + 2λμ
A= 2
μ + 2λμ + 2λ2
A = 1 − π 0 = π1 + π 2
2λ2
U = π0 =
Indisponibilidad: U = 1 − A = π 0
μ2
2λ2
μ
Para simplificar esta expresión se suele tener en cuenta que:
U≈
2λ2
μ2
Juan José Alcaraz
2
+
2λ
μ
λ << μ
+1
Calculando la disponibilidad (A)
Ejercicio
Calcular la expresión de la indisponibilidad del sistema 1+1, pero
considerando que cuando se realiza una reparación se reparan todos los
equipos estropeados, lo cual tiene el mismo coste temporal para los operarios
(les cuesta lo mismo reponer un equipo que reponer dos)
λ
0
2λ
1
μ
2
μ
Juan José Alcaraz
Descargar