Tema 1: Jerarquía Digital Síncrona, SDH Disponibilidad de Sistemas Tecnologías de red de transporte de operadora MÁSTER EN INGENIERÍA TELEMÁTICA Profesor: Juan José Alcaraz Espín Definiciones Fiabilidad (Reliability): Probabilidad de que el sistema desempeñe sus funciones durante un tiempo determinado. Disponibilidad (Availability) Porcentaje de tiempo que el sistema está disponible Tiempo en funcionamiento A= Tiempo en funcionamiento + tiempo indisponible MTBF A= MTBF + MTTR Indisponibilidad Tiempo medio entre fallos Tiempo medio de la reparación (Unavailability) Porcentaje de tiempo que el sistema está disponible. U = 1 - A Juan José Alcaraz Definiciones Función de fiabilidad R (t ) Función de fallo F (t ) = 1 − R(t ) f.d.p. de la función de fallo f (t ) = dF (t ) dt Nos da la probabilidad de que un componente esté funcionando en es instante t. Nos da la probabilidad de que el componente haya sufrido un fallo desde que empezó a funcionar hasta el instante t (incluido) Probabilidad de fallo en un tiempo diferencial (dt) en el instante de tiempo t R(t) y F(t) pueden estimarse empíricamente ¿Cómo? Juan José Alcaraz Definiciones Tasa (instantánea) de fallo λ (t ) Probabilidad de fallo por unidad de tiempo de un componente que haya estado funcionando hasta el instante t. ¿Cómo expresar este parámetro en función de las funciones que hemos ya hemos visto? Partiendo de la definición, se trata de una probabilidad condicional: λ (t ) = P(fallar en t | haber funcionado hasta t ) λ (t ) = f (t ) R (t ) Juan José Alcaraz P(A B ) = P( A ∩ B ) P (B ) Definiciones Relación entre λ (t ) = λ (t ) y R (t ) P(fallar en t | haber funcionado hasta t ) λ (t ) = f (t ) R (t ) λ (t ) = dF (t ) 1 dt R(t ) λ (t ) = − dR (t ) 1 dt R (t ) Lo que hemos obtenido es una ecuación diferencial R′(t ) − = λ (t ) R (t ) R(t ) = e Ln(R (t ) ) = − ∫ λ (t )dt t 0 − ∫0t λ ( t ) dt Cuando la tasa de fallo es constante (centro de la curva de bañera), obtenemos la expresión más habitual de la función de fiabilidad para un componente. R(t ) = e − λt Una exponencial negativa Juan José Alcaraz Calculando MTBF El tiempo medio entre fallos (es decir, el tiempo medio que el sistema está funcionando) se puede medir a partir de la siguiente integral ∞ MTBF = ∫ t · f (t )dt 0 Considerar un caso con tiempo discreto (1 día, 2 días, etc) para entenderlo mejor Que es equivalente a ∞ MTBF = ∫ R(t )dt 0 Demostrar que esta integral equivale a la anterior, con la condición de que R(t)t Æ 0 si t Æ ∞ Para el caso de un componente con tasa de fallo constante, el MTBF es MTBF = ∫ e −λt dt = − [e ] λ λ= 1 MTBF ∞ 0 1 − λt ∞ 0 =− Juan José Alcaraz 1 λ [0 − 1] = 1 λ Calculando R(t) en sistemas en serie Supongamos un sistema compuesto por N sistemas en serie A E1 E2 E3 EN B Se asume que el objetivo del sistema es llevar una señal de A a B Llamaremos Ei al evento “dispositivo i funcionando”, es decir Ri(t) = P(Ei | t), Para abreviar emplearemos Ri y P(Ei) Al evento “dispositivo i no funciona”, le denominamos Ei P (Ei ) = 1 − P (Ei ) = 1 − Ri = Qi El evento, “sistema completo funcionando” implica que la señal llegue del punto A al punto B. Juan José Alcaraz Calculando R(t) en sistemas en serie Supongamos un sistema compuesto por N sistemas en serie A E1 E2 E3 EN B El evento “sistema no funciona”: E = E1 ∪ E2 ∪ E3 ∪ ... ∪ E N El sistema falla en cuanto falla algún componente o dispositivo si están todos en serie El operador ∪ (unión) equivale en estadística a un “OR” lógico (“+” en álgebra de Boole) Aplicando la regla de De Morgan: E = E1 ∩ E2 ∩ E3 ∩ ... ∩ E N Es decir que el sistema no funciona si no están funcionando todos sus elementos a la vez. El operador ∩ (intersección) equivale en estadística a un “AND” lógico (un · en álgebra de Boole) Juan José Alcaraz Calculando R(t) en sistemas en serie E = E1 ∩ E2 ∩ E3 ∩ ... ∩ E N E = E1 ∩ E2 ∩ E3 ∩ ... ∩ E N El sistema funciona si todos los elementos funcionan R = ∏ Ri P (E ) = ∏ P (Ei ) P (E ) = P (E1 ∩ E2 ∩ E3 ∩ ... ∩ E N ) i i Puesto que los eventos son independientes Ri = e Suponiendo − λi t R=e − ∑ λit i Es sencillo obtener el MTBF de todo el sistema ∞ ∞ MTBF = ∫ R(t )dt = ∫ e 0 − ∑ λi t i 0 1 dt = − ∑ λi i ∞ ⎡ −∑i λi t ⎤ 1 1 [ ] = − − = e 0 1 ⎢ ⎥ ∑ λi ∑ λi ⎣ ⎦0 i i Juan José Alcaraz Calculando R(t) en sistemas en paralelo El sistema falla si todos los elementos fallan E1 E = E1 ∩ E2 ∩ E3 ∩ ... ∩ E N A P (E ) = ∏ P (Ei ) EN i Q = ∏ Qi R = 1 − Q = 1 − ∏ Qi = 1 − ∏ (1 − Ri ) i Suponiendo B E2 i Ri = e − λit ( R = 1 − ∏ 1 − e − λi t i Juan José Alcaraz i ) Calculando R(t) en sistemas serie-paralelo 1 2 A k E11 E12 E13 E1N E21 E22 E23 E2N Ek1 Ek2 Ek3 EkN N Fiabilidad de una rama: Ri = ∏ Rij Qi = 1 − Ri j =1 k Probabilidad de que todo el sistema falle: B Q = ∏ Qi R = 1− Q i =1 N ⎛ ⎞ R = 1 − ∏ ⎜⎜1 − ∏ Rij ⎟⎟ i =1 ⎝ j =1 ⎠ k Juan José Alcaraz Calculando R(t) en sistemas paralelo-serie A E11 E12 E13 E1N E21 E22 E23 E2N Ek1 Ek2 Ek3 EkN R j = 1 − ∏ (1 − Rij ) k Fiabilidad de uno de los conjuntos en paralelo: i =1 Fiabilidad de todo el sistema: N N k ⎛ ⎞ R = ∏ R j = ∏ ⎜1 − ∏ (1 − Rij )⎟ j =1 j =1 ⎝ i =1 ⎠ Juan José Alcaraz B Calculando R(t) en otras configuraciones E1 E1 A B E5 E2 La estrategia para resolver este tipo de problemas es desglosarlo en problemas más sencillos determinados por eventos mutuamente excluyentes. E4 En este caso los dos eventos mutuamente excluyentes que podemos elegir son: E5 activo y E5 inactivo E5 E5 P ( E | E5 ) P ( E | E5 ) P ( E ) = P ( E | E5 )·P ( E5 ) + P ( E | E5 )·P ( E5 ) Juan José Alcaraz Consideraciones sobre la redundancia Para dar una mayor robustez a un sistema debe optarse por una configuración que proporcione redundancia, como por ejemplo una configuración en paralelo: E1 A B Se asume que la señal se transmite simultáneamente por los dos enlaces, y en recepción se escoge la mejor señal. E2 A este tipo de redundancia se le suele denominar redundancia simple En ocasiones se considera también la fiabilidad del elemento decisor. E1 R = RE R D D E2 RD El elemento decisor está en serie con los componentes anteriores. RE Juan José Alcaraz Redundancia simple parcial Para economizar, se emplea a veces la redundancia simple parcial, que consiste en que un conjunto k de componentes proporciona redundancia a un conjunto de N componentes que transmiten señal distintas (k < N). Este tipo de redundancia se representa k:N E1 E1 E1 B A E2 D B A EN+1 E2 B A D EN+1 E2 D EN+1 Ejemplo 1:N, un elemento se pone en funcionamiento si falla alguno de los N anteriores Los k elementos de protección no transportan señales cuando el sistema no ha sufrido fallos. Pueden emplearse para establecer circuitos de menor prioridad El sistema funcionará si N dispositivos funcionan Juan José Alcaraz R(t) en sistemas con redundancia parcial E1 B A E2 D E3 Ejercicio: Encontrar la fórmula de R(t) para un sistema de 1:2 en el que los componentes tienen una tasa de fallo λ y el elemento decisor tiene una tasa de fallo λD. A partir del resultado anterior encontrar una expresión general para la fiabilidad RT de un sistema k:N (k<N) en la que cada elemento tiene una fiabilidad R. Juan José Alcaraz Tipos de Redundancia 1+1 La señal se transmite simultáneamente por dos caminos 1+1 Standby El camino de reserva sólo se activa cuando falla el camino principal 1+1 Hot Standby El camino de reserva sólo se activa cuando falla el camino principal, pero el equipo de reserva está en funcionamiento (encendido) 1:1 El camino de reserva puede transmitir otra señal de menor prioridad k:N K caminos camino hacen de reserva para N caminos. Los equipos de reserva pueden transmitir señales de menor prioridad Juan José Alcaraz Calculando la disponibilidad (A) Disponibilidad de un sistema 1+1 El tiempo medio de reparación tiene asociado una tasa de reparación μ = 1 MTTR El número de elementos activos en el sistema puede representarse como una cadena de Markov λ 0 1 μ π 0 μ = π 1λ π 0 ,π 1,π 2 2λ Tasa de fallo de dos elementos 2 Elementos activos μ π 1 (λ + μ ) = π 0 μ + π 2 2λ Probabilidad de estar en cada estado Juan José Alcaraz π 2 2λ = π 1 μ π 0 + π1 + π 2 = 1 Calculando la disponibilidad (A) π0 = π 0 μ = π 1λ π 1 (λ + μ ) = π 0 μ + π 2 2λ π 2 2λ = π 1 μ π1 = λ π μ 1 2λ μ π 0 + π1 + π 2 = 1 2λ2 μ2 π2 + 2λ μ μ 2 + 2λ μ π2 = 1 2λ 2λ + +1 2 2 μ 2λ μ 2 μ 2λ2 λ λ 2λ π1 = π μ μ 2 μ π2 π2 +π2 = 1 2λ π1 = π0 = +1 π0 = μ2 2λ2 μ2 + 2λ μ +1 Juan José Alcaraz Calculando la disponibilidad (A) Disponibilidad: El sistema estará funcionando siempre que haya 1 ó 2 equipos funcionando. Es decir, siempre que no esté en el estado 0 (0 equipos). μ 2 + 2λμ A= 2 μ + 2λμ + 2λ2 A = 1 − π 0 = π1 + π 2 2λ2 U = π0 = Indisponibilidad: U = 1 − A = π 0 μ2 2λ2 μ Para simplificar esta expresión se suele tener en cuenta que: U≈ 2λ2 μ2 Juan José Alcaraz 2 + 2λ μ λ << μ +1 Calculando la disponibilidad (A) Ejercicio Calcular la expresión de la indisponibilidad del sistema 1+1, pero considerando que cuando se realiza una reparación se reparan todos los equipos estropeados, lo cual tiene el mismo coste temporal para los operarios (les cuesta lo mismo reponer un equipo que reponer dos) λ 0 2λ 1 μ 2 μ Juan José Alcaraz