Técnicas para el diseño de sistemas electrónicos tolerantes a fallas (Evaluación y Cálculo de la Confiabilidad) Fulvio Corno, Maurizio Rebaudengo, Matteo Sonza Reorda Politecnico di Torino Dipartimento di Automatica e Informatica Introducción Para obtener un producto confiable se debe partir de un diseño confiable a través de: Lineas guía durante el diseño Previsión de la confiabilidad y análisis de riesgo. Mejoramiento de la confiabilidad. 2 Resumen Medidas Cuantitativas de Confiabilidad Técnicas para la evaluación de la confiabilidad. Cálculo de la confiabilidad de un sistema. 3 Resumen Medidas Cuantitativas de Confiabilidad Técnicas para la evaluación de la confiabilidad. Cálculo de la confiabilidad de un sistema. 4 Cálculo de la Confiabilidad Se analizarán algunos conceptos cuantitativos que buscan calcular la confiabilidad como característica de un objeto, a través de la función matemática de confiabilidad El objetivo es un tratado matemático que pueda definir la confiabilidad a nivel de sistema, partiendo de la confiabilidad de cada componente. 5 Confiabilidad La confiabilidad es un campo relativamente nuevo cuyo nacimiento se debe principalmente a la creciente complejidad de las tecnologías modernas y al rápido progreso de la microelectrónica. 6 Un poco de historia … Los problemas de escasa confiabilidad se hicieron evidentes en los equipos militares usados por los norteamericanos desde los años 60. Algunos estudios revelaron que: Los equipos electrónicos eran operativos sólo el 50% del tiempo. 2/3 de los equipos del ejército estaban en reparación. 7 Tasa de Falla y Función de Confiabilidad Intuitivamente: Tasa de Falla = número esperado de fallas (de un DISPOSITIVO de o de un SISTEMA) por unidad de tiempo. Función de Confiabilidad = Probabilidad de que un único componente NO esté dañado en el tiempo t Se deben proveer definiciones formales 8 Función de Confiabilidad R(t) = Probabilidad condicional de que el componente funcione correctamente durante el intervalo (t0,t), dado que en el tiempo t0 él funcionaba correctamente. 9 Derivación de la Función de Confiabilidad Se someten a prueba N componentes idénticos en el tiempo t0 Después de un tiempo t tendremos N0 componentes funcionantes (operational) y Nf componentes dañados (failed): N = NO + NF . NO (t ) NO (t ) R (t ) = = N NO (t )+ N F (t ) 10 Interpretación R(t) es la probabilidad de que el componente sobreviva al intervalo (t0, t) Prolongando el tiempo, el número de componentes funcionantes NO disminuye, como consecuencia la Función de Confiabilidad disminuye. NO (t ) R (t ) = NO (t )+ N F (t ) 11 Función de No-Confiabilidad (I) Q(t) es la probabilidad de que un componente NO sobreviva al intevalo (t0, t). Se llama también Función de Densidad de Malfuncionamiento. Los eventos Componente Componente mentarios: 12 Función de No-Confiabilidad (II) N F (t ) Q (t ) = NO (t )+ N F (t ) 13 Ritmo de Decaimiento (I) Calculamos la derivade de R(t) con respecto al tiempo N F (t ) R(t ) = 1 − Q(t ) = 1 − N dR(t ) ⎛ 1 ⎞ dN F (t ) = ⎜− ⎟ dt ⎝ N ⎠ dt dN F (t ) dR(t ) = (− N ) dt dt 14 Ritmo de Decaimiento (II) dNF/dt se puede interpretar como el número de componentes que sufren daños durante un intervalo de tiempo dt, comprendido entre t y t+dt; que equivale a la velocidad de daño en el tiempo t. dN F (t ) dR(t ) = (− N ) dt dt 15 Tasa de Daño (I) Dividiendo ambos miembros de la ecuación entre NO(t) se obtiene z(t), conocida como Función de Peligro o Tasa de Daño o Tasa de Falla N dR(t ) 1 dN F (t ) z (t ) = =− N O (t ) dt N O (t ) dt 16 Tasa de Daño (II) Siendo R=NO/N , la Tasa de Daño se puede expresar como: dR(t ) dt z (t ) = − R(t ) 17 Fórmula matemática de la Confiabilidad Manipulando e integrando se obtiene la fórmula matemática de Confiabilidad: d R (t ) z (t ) d t = − R (t ) t R ( t ) d R (t ) R d R (t ) ∫0 z (t )dt = ∫R ( 0) R (t ) = ∫1 R (t ) t ∫ z (t )dt = − ln R (t ) 0 t ⎛ R (t ) = exp ⎜ − ∫ z (t )dt ⎞⎟ ⎝ 0 ⎠ 18 Comportamiento de la Tasa de Daño z(t) no es constante sino que evoluciona atravezando 3 fases. mortalidad infantil (o peligro de asentamiento) vida útil envejecimiento En la región de vida útil: z(t) ~ constante = λ (tasa de falla) 19 Comportamiento de la Tasa de Daño Función Tasa de Falla z(t) Curva en forma de “Tina de baño” λ Tasa de Fallas Constante Fase de Mortalidad Infantil Periodo de vida útil T1 Fase Senil T2 Tiempo 20 Tasa de Daño λ Representa un tasa de daño constante en la vida útil del producto. Se expresa como el número de daños por unidad de tiempo Es conveniente hacer funcionar el sistema en la zona en la cual z(t)=λ 21 Tiempo de Misión Es la cantidad de tiempo que se necesita para garantizar que el sistema satisfaga un cierto grado de servicio. Ejemplos de tiempo de misión: Misil: pocas horas PC: 5 años Satélite: 10 años Central telefónica: 20/25 años 22 Ciclo de vida de un producto El comportamiento de la tasa de daño, en forma de tina de baño aparece sistemáticamente cada vez que se analiza por completo el ciclo de vida de un gran número de sistemas de diferente tipo: mecánicos, eléctricos, electrónicos, etc. 23 Ciclo de vida de un producto Se analizan los tres periodos separadamente. 24 Periodo de Asentamiento La tasa de daño decrece debido a que los elementos débiles se dañan. Después del tiempo T1 todos los elementos de constitución débil cesan de funcionar. 25 Daños Infantiles (I) El período de asentamiento se caracteriza por daños debidos a la calidad del proceso productivo, se atribuyen típicamente a la rotura de componentes que presentan algún defecto intrínseco. En el caso de los semiconductores: soldaduras mal hechas, contenedores no herméticos, grandes deféctos tecnológicos, … 26 Daños Infantiles (II) Estos componentes se dañan durante las primeras horas (días o meses) dado que son más débiles que los demás (mortalidad infantil) y los daños que producen se llaman Daños Infantiles (early fault). 27 Prevención de Daños Infantiles Los Daños Infantiñes relacionados con el periodo de asentamiento: Pueden ser reconocidos y eliminados fácilmente usando procedimientos (pruebas aceleradas, burn-in) que permitan forzar la manifestación del defecto intrínseco en el sistema. 28 Las Pruebas Aceleradas (I) Buscan acelerar la degradación del sistema en un tiempo dado, aumentando las condiciones de exigencia con respecto a aquellas de uso normal. Resultan válidas y significativas cuando no introducen modos o mecanísmos de daño diferentes a los que se verificarían en la condiciones de uso normal. 29 Las Pruebas Aceleradas (II) Las exigencias que se exaltan para acelerar la vida de los dispositivos pueden ser de tipo: Ambiental Eléctrico Mecánico (temperatura, humedad…) (voltaje, corriente…) (vibraciones, golpes…). 30 Burn-in Aproximadamente, la “vida operativa vivida” se duplica cada vez que la temperatura supera el 10% de la temperatura nominal de trabajo. El burn-in más utilizado es: Para aparatos: funcionamiento a 45°C de 12 a 45 horas. Para componentes: funcionamiento a 125°C por 168 horas. 31 Periodo de Vida Útil Después del asentamiento, la tasa de daño se estabiliza sobre un valor casi constante por un periodo de tiempo relativamente largo (periodo de vida útil) Este es el periodo más interesante para el usuario, porque se caracteriza por el valor más bajo de tasa de daño. 32 Daños en la Vida Útil (I) El periodo de vida útil se caracteriza por daños causados por eventos que, relacionados típicamenten con el ambiente, alcanzan incrementos imprevistos de exigencia, más allá de la resistencia máxima establecida por el diseño. 33 Daños en la vida Útil (II) Como consecuencia: Tales daños se pueden verificar durante intervalos casuales, de manera imprevista, del todo inesperada (daños casuales) Ningún asentamiento ni ningún mantenimiento es capaz de eliminarlos 34 Periodo de Desgaste La Tasa de Daño crece rápidamente. Los daños son debidos al envejecimiento progresivo de los componentes: Daños Seniles (wearout fault) 35 Daños Seniles Durante este periodo se hacen evidentes los mecanísmos de daño intrínsecos de cada tecnología e independientes de la construcción específica de cada componente. 36 Ejemplo La utilización de un sistema metálico Au-Al para la realización de soldaduras hace inevitable el hecho de que, después de algunos años (por ejemplo 10), la soldadura se despegue, debido a la formación de compuestos intermetálicos frágiles. 37 Prevención de Daños por Desgaste (I) Si la utilización del sistema no es contínua y éste se puede apagar periódicamente, es conveniente reemplazar, a intervalos regulares y de duración apropiada, los componentes accesibles que se sabe están sometidos al desgaste (mantenimiento preventivo). 38 Prevención de Daños por Desgaste (II) Si los componentes sometidos a desgaste son inaccesibles entonces deben ser diseñados larga vida, de tal forma que el desgaste suceda después del tiempo de misión. La aplicación de este segundo método comprende los sistemas de un solo intento (one shot) que se utilizan solo una vez, por ejemplo misiles o satélites. 39 Ley Exponencial de Daños Aplicando la fórmula matemática de la confiabilidad durante el periodo de vida útil, con z(t)=λ: R(t ) = e − λt R(t) 1 1/λ t 40 Medidas de Confiabilidad Más allá del comportamiento estadístico de R(t), es posible definir algunas medidas particularmente representativas del nivel de disponibilidad de un sistema. Estas medidas son válidas exclusivamente cuando z(t)=λ (Daños Casuales). 41 Tiempo Medio antes de la Falla (MTTF Mean Time To Failure) Es el tiempo previsto durante el cual el sistema funcionará antes de la primera Falla. 42 Relación entre MTTF y Confiabilidad Despreciando algunos pasos: ∞ MTTF = ∫ R(t )dt 0 Durante la vida útil: ∞ MTTF = ∫ e dt = 1 0 − λt λ 43 Relación entre MTTF y Tiempo de Misión t R(t) MTTF 0.368 MTTF / 10 0.905 MTTF / 20 0.951 MTTF / 100 0.990 MTTF / 1000 0.999 R(t) 1 1/λ=MTTF t 44 Consecuencias (I) La confiabilidad de un sistema que posee una MTTF igual al su tiempo de misión es igual a 0.368. Esto implica que: haciendo funcionar 100 dispositivos del mismo tipo, al final del tiempo de misión funcionarán ~37, mientras que ~63 se habrán dañado antes. 45 Consecuencias (II) Para obtener, al final del tiempo de misión, una confiabilidad del 99.9%, se debe garantizar un MTTF 1000 veces superior al Tiempo de Misión. 46 Sistemas Reparables (I) Se define un Sistema Reparable a aquel, después de un malfuncionamiento, se puede restablecer gracias a alguna acción de mantenimiento o reparación. 47 Sistemas Reparables (II) El mantenimiento de un Sistema Reparable se puede hacer de 2 modos: Acción Correctiva: realizada como respuesta a un malfuncionamiento Acción Preventiva: realizada para prevenir o retardar un malfuncionamiento. 48 Modelado de un Sistema Un Sistema Reparable se encuentra en 2 estados posibles: Funcionante (up) En reparación (down). Nótese que el sistema puede estar en Reparación por una Acción Correctiva o por una Acción Preventiva. 49 Tiempo Medio antes de la Reparación (MTTR Mean Time To Repair) Se define como el tiempo medio necesario para reparar el sistema. Es difícil modelarlo matemáticamente; generalmente se recurre a datos estadísticos medidos en laboratorio. 50 Tiempo Medio Entre Fallas (MTBF Mean Time Between Failure ) Es el tiempo medio que pasa entre dos fallas del sistema Es diferente al MTTF, porque el MTTF hace referencia a la Primera Falla Toma en cuenta también el tiempo de reparación Si navg es el número medio de fallas en un T periodo T, se tiene: MTBF = navg 51 Relación entre MTTF, MTBF, MTTR Se supone que las reparaciones son siempre posibles y perfectas (good as new) Luego de cada reparación, el sistema funcionará durante el MTTF Cuando el sistema falle, restará inactivo durante el MTTR Como consecuancia: MTBF = MTTF + MTTR 52 Disponibilidad Proporción de tiempo durante el cual el sistema está disponible MTTF A= MTTF +MTTR 53 Ejemplo Considerando un sistema con: MTTF = 886 horas MTTR = 25 horas A = 886/911 = 0.972 54 Resumen Medidas Cuantitativas de Confiabilidad Técnicas para la evaluación de la confiabilidad. Cálculo de la confibilidad de un sistema. 55 Calculo de la Confiabilidad de un Sistema Problema Calcular la Confiabilidad de un sistema, conociendo las tasa de daño de los componentes que lo constituyen. 56 Modelo de Previsión de Confiabilidad Expresión matemática que permite calcular un valor esperado dada la tasa de daño de un componente como función de las características tecnológicas, de las exigencias eléctricas, térmicas y ambientales en las cuales el componente trabaja. 57 Finalidad de un Modelo de Previsión Verificar el cumplimiento de los objetivos del diseño Establecer los valores contractuales Confrontar más soluciones. 58 Modelos de Previsión: los Bancos de Datos Las tasas de daño son elencadas en manuales La tasa de daño se expresa a través de un modelo que contiene todo lo conocido sobre las leyes de degradación de los componentes y la dependencia de factores importantes. 59 Condiciones Habituales de Funcionamiento La estimación correcta de la confiabilidad calculada para un sistema, depende de la exáctitud de los valores de tasa de daño adoptadas para los componentes. 60 Condiciones No Habituales de funcionamiento La Tasa de Daño sufre fuertes variaciones con la variación de los niveles de exigencia. La Tasa de Daño de los componentes electrónicos son fuertemente influenciadas por los niveles de voltaje, corriente y temperatura. 61 Valor de la Tasa de Daño El valor asumido como Tasa de Daño de los componentes se refierea un conjunto de: Condiciones de funcionamiento (ej.: valores de voltaje, corriente y temperatura). Niveles de exigencia mecánica (ej.: las vibraciones y los golpes). 62 Manuales MIL-HDBK-217: Departamento de la Defensa a partir de 1962 RDF: CNET – Francia – 1974 HRD: British Telecom – UK – 1974 RPP: Bell Core – USA – 1984 AT&T: USA – 1990 IRPH93: Italtel, CNET e BT – EU - 1993 63 MIL-HDBK-217 En el ámbito electrónico, la referencia más conocida y usada es el manual MIL-HDBK217, publicado por el Departamento de la Defensa USA en 1962 y actualizado periódicamente. De este manual es posible extraer la tasa de falla de cualquier componente electrónico bajo cualquier condición de uso. 64 MIL-HDBK-217: Objetivo Definir y mantener métodos consistentes y uniformes para estimar la confiabilidad de los sistemas electrónicos en el ámbito militar. Proveer modelos para el cálculo de tasas de daño. 65 MIL-HDBK-217 Presenta 2 métodos: Part stress analysis: presupone el conocimiento de la información detallada del sistema y por tanto se utiliza al final del diseño. Parts count: necesita menos información y se utiliza en la fase preliminar del diseño para obtener una primera estima. 66 MIL-HDBK-217: Part Stress Analysis (I) Se debe disponer de una lista detallada de las partes utilizadas en el sistema y de los esfuerzos (stress) a los cuales se somenten Hipótesis: Componentes independientes. Tasa de daño constante. 67 MIL-HDBK-217: Part Stress Analysis (II) λ p = λb πQ πE π A … λp: Tasa de daño de la componente λb: Tasa de daño base πi : Factores que modifican la tasa de daño base en función de los parámetros que pueden influenciar la confiabilidad de la parte. 68 MIL-HDBK-217: Part Stress Analysis (III) Principales factores utilizados: πQ: Factor de Calidad: depende del selección (screeining) sufrida por la parte πE: Factor Ambiental: Toma en cuenta los efectos de las condiciones ambientales (sobre la tierra, sobre una nave, al vuelo, en el espacio, sobre un misil, etc.) 69 MIL-HDBK-217: Part Stress Analysis (IV) Otros factores utilizados solo en modelos específicos: πL: Factor de Aprendizaje, tiene en cuenta la madurez de la tecnología. πT: Factor de Temperatura. πE: Factor de Aplicación πR: Factor de Potencia πS: Factor de Esfuerzo Eléctrico πC: Factor de Construcción del Contacto πS: Factor de Función. 70 MIL-HDBK-217: Ejemplo GAL (Generic Array Logic) y Microprocesadores: λp = (c1 πT + c2 πE) πQ πL 71 Ejemplo de condiciones de referencia Para la definición del factor ambiental (πE) se definen 3 clases de ambiente: Protegido climatizado No protegido Móvil πE = 0 πE = 2.5 πE = 4 72 MIL-HDBK-217: Parts Count Información necesaria: Tipo y cantidad de partes: Nivel de calidad de las partes: λ = ∑ N i (λGπ Q )i n i =1 73 Limitación de las previsiones de Confiabilidad a través de manuales Limitación de los bancos de datos que normalmente contienen poca información acerca de los mecanismos de daño. Hipotesis de tasa de daño constante. La tecnología electrónica está en constante evolución cosa que aumenta la dificultad de evaluar la confiabilidad. 74 Estimación de la Confiabilidad de un Sistema Instrumentos de software disponibles en el mercado, permiten calcular los parámetros de confiabilidad partiendo del modelo de descripción del sistema. 75 Diagrama de Bloques de Confiabilidad (RBD Reliability Block Diagram) Diagrama de eventos Muestra como el daño de cualquier componente influenciaría el desempeño del sistema. Un sistema subdividido en unidades lo suficientemente pequeñas para poder calcular la confiabilidad. 76 RBD: análisis del sistema En el diseño de un sistema cada parte puede ser: Única (el daño de tal elemento implica la falla del sistema); tales elementos son necesarios para realizar la función del sistema Repetida (el daño de una de estas las partes se compensa con el funcionamiento de sus iguales) 77 Esquema de Confiabilidad A partir del diseño se puede realizar un sistema de bloques, conocido como esquema de confiabilidad, en el cual: Los elementos únicos se conectan en serie Los elementos repetidos se conectan en paralelo. 78 Ejemplo in c1 c2 El sistema está formado por C1, C2 e C3 que son esenciales para el funcionamiento del sistema. C5 es una repetición de C4. c3 c4 c5 out 79 Sistemas Serie (I) En los sistemas Serie es suficiente con que un solo elemento se dañe para interrumpir toda la cadena. R1 R2 R3 80 Sistemas Serie (II) La probabilidad de sobrevivencia del sistema es el producto de la probabilidad de sobrevivencia de cada bloque en serie. Rs(t) = R1(t) R2(t) R3(t) = e -(λ1+λ2+λ3) t 81 Sistemas Serie (III) En un sistema Serie la confiabilidad está dada por el producto de la confiabilidad de cada bloque y la Tasa de Daño es la suma de las Tasas de Daño λs = Σ λi Rs = Π Ri 82 Ejemplo 1 Analizando una central de conmutación compuesta por 10.000 componentes y asumiendo que cada componente tenga una Tasa de Daño λ = 10-7 = 0.1 ppm/hora. La confiabilidad del sistema es: Rs = e -(10^4 10^-7) t =e - t / 1000 MTTF = 1000 horas 83 Ejemplo 2 (I) Consideremos un circuito electrónico compuesto por: 4 transistores de silicio, 10 diodos de silicio 20 resistencias de aglomerado. 10 condensadores cerámicos. 84 Ejemplo 2 (II) Supongamos además que: El cableado (circuito impreso) y las soldaduras sean 100% confiables. Que los componentes trabajan bajo sus niveles nominales de voltaje, corriente y temperatura. 85 Ejemplo 2 (III) Supongamos que las tasas de daño sean las siguientes para cada componente: diodos: transistores: resistencias: condesasdores: λd λt λr λc = = = = 0.000002 0.00001 0.000001 0.000002 86 Ejemplos 2 (IV) Para evaluar la confiabilidad del circuito se deben sumar las tasas de daño: λs = 10 λd + 4 λt + 20 λr + 10 λc λs = 0.0001 MTTF = 1 / λs = 10.000 horas 87 Sistemas Paralelo (I) Un conjunto de elementos tales que cada uno es suficiente para asegurar el funcionamiento del sistema. R1 R2 88 Sistemas Paralelo (II) Un sistema paralelo está constituidos por dos aparatos similares, uno de los cuales es redundante y entra en funcionamiento cuando el otro se daña. Un sistema paralelo se daña cuando ambos aparatos se dañan. 89 Sistemas Paralelo (III) La probabilidad de daño de un sistema paralelo se debe a la probabilidad del daño contemporáneo de cada aparato. Suponiendo que los daños en cada aparato sean independientes: Qp(t) = Q1(t) Q2(t) Q3(t) Qp(t) = [1 - e -λ1 t ] [1 - e -λ2 t ] [1 - e -λ3 t ] 90 Ejemplo Un aparato constituido por dos bloques redundantes de 10.000 componentes, posee una tasa de daño de 10-7 la probabilidad de daño del sistema es: Qs = ( 1 - e Rs = 1 – Qs -t/1000 )(1-e -t/1000 ) 91 Duplicación En un sistema duplicado: Q (t) = [1 - e -λ t ]2 = 1 - 2 e -λ t + e R(t) = 1 - Q (t) = 2 e -λ t - e –2 λ t –2 λ t ∞ MTTF = ∫ R(t )dt 0 MTTF = 1.5 / λ = 1.5 MTTF0 92 M1 Redundancia 2-de-3 M2 V M3 Como hipotesis el comparador de votos (voter) está libre de daños. La confiabilidad se determina enumerando los casos disyuntos de funcionamiento correcto. Los 3 están libres de daños (probabilidad R03) M1 y M2 funcionante, M3 dañado (probabilidad R02(1-R0)) M1 y M3 funcionante, M2 dañado (probabilidad R02(1-R0)) M2 y M3 funcionante, M1 dañado (probabilidad R02(1-R0)) R = R03 + 3R02(1-R0) = 3R02 – 2R03 = 3e-2λt – 2e-3λt MTTF = 3/2λ-2/3λ=5/6λ= 5/6 MTTF0 93 Cut Set Es el conjunto de componentes, cuyo daño provocaría unmalfuncionamiento del sistema 1 2 4 3 Cut Set: {(1,3), (2,3), (4)} 94 Tie Set Es el conjunto de componentes, cuyo funcionamiento asegura el funcionamiento del sistema. 1 2 4 3 Tie Set: {(1,2,4), (3,4)} 95 Redundancia (I) Activa: los elementos redundantes son sometidos a la misma carga que el resto de los elementos operativos, durante todo el tiempo de misión. (λR= λ0) Caliente: los elementos redundantes son sometidos a una carga más baja hasta que uno de los elementos operativos se daña (λR < λ0) Stand-by: los elementos redundantes no se somenten a ninguna carga hasta que uno de los elementos operativos se daña (λR= 0). 96 Redundancia (II) En los casos de redundancia caliente y stand-by se existe de un interruptor (switch) que permite el cambio maestro/esclavo (master/slave) en el momento en el que se presenta el daño en el maestro (master). 97 Caso de studio Calcule la confiabilidad del sistema ilustrado en la figura. A1 CS S A2 98 Descripción del sistema Los dos aparatos A1 y A2 don redundantes. Un interruptor S (accionado usando un comando de cambio CS) permite seleccionar uno de los dos aparatos. 99 Construcción del Esquema de Confiablidad Para obtener el esquema de confiabilidad se deben buscar los eventos que pueden conducir al daño del sistema. Tales eventos son: 1. Se dañan ambos, A1 y A2 2. Se daña S 3. Se dañan ambos, A1 y CS. 100 Esquema de Confiabilidad Cada uno de los eventos considerados es suficiente para bloquear el sistema, entonces se conectan confiabilísticamente en serie. Los sub-eventos que componen los eventos 1 y 3 se deben conectar en paralelo porque deben suceder los dos para que el sistema se dañe. 101 Esquema de Confiabilidad El esquema de Confiabilidad es el siguiente: λ1 λ2 λ1 λs λcs 102 Ejercicio El servidor de una base de datos necesita 315GByte de disco, tal espacio se obtiene usando 9 discos de 35GByte. Por cuestiones de desempeño, no se conectan más de 3 discos a un mismo controlador. Considere los siguientes sistemas: Sistema no tolerante a fallas: el sistema se daña cuando se daña un disco o un controlador o el servidor. Sistema tolerante a fallas: Con esta arquitectura el malfuncionamiento de un disco debido al controlador es compensado por el sistema. 103 Ejercicio (continuación) Diseñar el esquema confiabilístico Calcular las funciones de confiabilidad asumiendo los siguientes valores de MTTF: Disco, MTTFD = 200.000 horas Controlador, MTTFC = 500.000 horas Servidor, MTTFS = 25.000 horas. 104 Solución (I) Sistema no tolerante: s c1 d1 d2 d3 c2 d4 d5 d6 c3 d7 d8 d9 λs = λS + 3 λC + 9 λD = 4*10-5 + 6*10-6 + 4.5*10-5 = 9.1*10-5 MTTF = 1 / λs = 1098 horas 105 Solución (II) s Sistema tolerante: d4 d1 c1 d2 c2 d5 d6 d3 d10 d7 c2 d8 d9 c4 d11 d12 λs = λS + 4 λC + 4*6/5 λD + = 4*10-5 + 8*10-6 + 2.4*10-5 = 7.2*10-5 = 1388 horas 106