Análisis de las Posibilidades de Falla de un Sistema UPS Evaluación de la confiabilidad del Sistema UPS CleanSource® HD, con soporte por volanta rotatoria (Flywheel), en comparación con el Sistema de UPS de doble conversión con baterías Documento 115 2128 W. Braker Lane, BK12 Austin, Texas 78758-4028 w w w. a c t i v e p o w e r. c o m Objetivo Este documento presenta un análisis cuantitativo de la confiabilidad del servicio del UPS (Sistema Interrumpido de Potencia) CleanSource 750HD comparándolo con el sistema de UPS de doble conversión con un banco de baterías. El estudio cuantifica la probabilidad de falla de un sistema, bajo tres escenarios diferentes de falla - una falla prolongada de la energía comercial de duración mayor a 10 segundos, una falla de corta duración menor a 10 segundos y una falla en el equipo de soporte. El estudio también evalúa la probabilidad de falla del sistema CleanSource 750HD UPS con una fuente de energía secundaria (Opción de tiempo de operación extendido) y una fuente de almacenamiento de energía por volanta rotatoria (Flywheel), comparándolo con un sistema de doble conversión con batería. 2 Hallazgos Principales • La empresa MTechnology, Inc., concluyó que el CleanSource 750HD UPS es más confiable que el sistema de doble conversión con un banco de baterías sencillo y presenta un 80% menos de posibilidades de falla en el escenario de un corte de energía de tiempo reducido, que corresponde a un corte con duración menor a 10 segundos. • El CleanSource 750HD UPS tiene una menor posibilidad de falla en un año que un sistema de doble conversión con baterías durante una falla prolongada de energía. El CleanSource 750HD UPS reduce el riesgo de falla del sistema en más de un 21%, aunque se incluya el modo de falla más común, que es la falla por concepto de los sistemas de transferencia (ATS), sistema eléctrico principal y la falla del generador durante un corte de energía prolongado, con duración de más de 10 segundos. • En el supuesto de que ninguno de los dos sistemas esté en modo de bypass, en el momento de presentarse la falla de energía, la probabilidad de que el CleanSource 750HD UPS falle y no soporte la carga, es un 99% menor que la posibilidad de falla que tiene un sistema de doble conversión con baterías. • Durante una falla de energía de corta duración el CleanSource 750HD UPS, con la opción de tiempo de soporte extendido por baterías (modelado con un banco de baterías igual al utilizado en un sistema de doble conversión), reduce la posibilidad de falla en un 85%, comparándolo con sistema de doble conversión. • El Sistema de Transferencia Automática (ATS) es la causa de falla más probable que puede presentarse en el caso de una caída de la energía comercial de más de 10 segundos y representa aproximadamente el 37% y el 47% de las fallas del sistema aplicados a la doble conversión con baterías y al sistema CleanSource 750HD UPS respectivamente. • La causa de falla más probable en un sistema UPS de doble conversión con baterías es debida a las fallas no detectadas de las baterías, que son responsables del más del 83% de las fallas de los sistemas de doble conversión. • El estudio consideró una baja rata de casos por falla en la detección de baterías dañadas, estimando esta causa en tan sólo un promedio de 1% de todas las causas de falla de baterías, ya que asume una rutina de pruebas y mantenimiento óptima. MTechnology, Inc., considera, según su experiencia, que el escenario considerado para el mantenimiento de las baterías es el más idealizado y, por tanto, es imposible imaginar un mejor escenario para la confiabilidad de las baterías que el modelado en el estudio. 3 Resumen Active Power, Inc. seleccionó a MTechnology, Inc. (MTech) para realizar un análisis de confiabilidad de su producto CleanSource 750HD UPS comparándolo con un sistema de doble conversión con baterías. El estudio se realizó teniendo como base un análisis de confiabilidad sobre el CleanSoure UPS de Active Power realizado por Mtech en el año 2007. Nos Referimos al white paper #103 (Evaluación de la confiabilidad del sistema UPS integrado con flywheel comparado con un sistema de doble conversión con baterías) Mtech ha estado aplicando desde 1996 la ciencia de la evaluación probabilística del riesgo (conocida como PRA, por sus siglas en inglés) al análisis de los sistemas eléctricos que requieren de una alta disponibilidad, aplicable a sistemas de cómputo, proveedores de internet y otras instalaciones de misión crítica. Los clientes de Mtech incluyen fabricantes, firma de ingeniería, empresarios y usuarios de instalaciones de misión crítica; la firma tiene como clientes una amplia variedad de industrias incluyendo centros de procesamiento de datos corporativos, energía nuclear, Mtech atiende a clientes de una gran gama de industrias incluyendo centros de cómputo corporativos, centrales nucleares, sistemas en la industria de gas y petróleo, generación distribuida, investigación biomédica, aplicaciones de terapia de cáncer por aces de protones y el desarrollo de celdas de hidrógeno. El estudio incluye dos clases de falla de la energía comercial: • Falla de la energía comercial con duración mayor de 10 segundos, en donde la fuente de corriente alterna debe ser transferida a un generador mediante el conmutador de transferencia automática (ATS) el cual arranca pone en servicio al generador • Falla de la energía comercial con duración menor a 10 segundos, en donde la energía almacenada en el UPS es suficiente para soportar la carga mientras que se restablece el servicio de la energía comercial y por eso no se requiere la transferencia a un generador. Este es el escenario más común de fallas y en donde mejor se aprecia la diferencia de confiabilidad de los dos sistemas de UPS. Mtech desarrolló un modelo tipo árbol de fallas para los dos sistemas. El modelo de árbol de fallas combina los conocimientos sobre las causas de falla de la energía comercial y de los componentes de los UPS que conducen a una falla del sistema protegido; considera la frecuencia con que fallan los componentes y anticipa la duración de la reparación requerida. La información referente a la frecuencia de falla de los componentes fue obtenida de fuentes especializadas sobre estos temas, tales como el libro dorado de la IEEE y, en donde fue pertinente, fue enriquecida por la abundante experiencia que sobre el tema tiene Active Power con sus productos CleanSource UPS. Descripción del Sistema CleanSource 750HD UPS 4 El CleanSource 750HD es la solución de alta densidad de potencia de Active Power para el producto UPS basado en el flywheel, el cual tiene una capacidad de 750 kVA / 675 kW y utiliza una volanta de 1700 libras que gira a 7.700 revoluciones por minuto (RPM) para almacenar energía cinética. El UPS integra la funcionalidades de un motor, rotor flywheel y generador en un solo sistema. (Ver Figura 1 presentada más abajo). Durante la operación normal, la volanta rotatoria gira a una velocidad constante. El sistema entrega a la carga protegida la energía que acondiciona a partir de la energía comercial. Cuando se presenta una falla de la energía comercial, el sistema entrega la energía cinética almacenada en la volanta giratoria en la forma de energía eléctrica. Cuando la energía comercial es restaurada entonces el sistema transfiere la carga nuevamente a la energía comercial o al generador, si este es el caso. Figure 1: Active Power 750 kVA Encerramiento y rotor del flywheel El Sistema dispone de capacidad de acondicionamiento de energía, incluyendo regulación de voltaje y cancelación de armónicos. Mediante la combinación de un CleanSource 750HD UPS con un generador en Standby se configura un sistema de suministro permanente de potencia para proteger equipos sensibles de misión crítica contra interrupciones de corta duración y contra ausencias prolongadas del suministro de energía comercial. Los sistemas UPS CleanSource tienen en su haber más de 150 millones de horas de operación en campo en sus diferentes instalaciones alrededor del mundo. El rotor del Flywheel está dotado de la tecnología de rodamiento magnético de Active Power. Esta tecnología alivia a los rodamientos de la mayor parte del peso del Flywheel. Una bomba de vacío evacúa el aire de la cámara de la volanta y evita la pérdida de energía del flywheel por fricción con el aire. Durante la pérdida de la energía comercial, la velocidad de la volanta disminuye en la medida en que su energía cinética es transferida a la carga. La corriente regulada es aplicada a las bobinas de campo para mantener un voltaje constante durante el tiempo de trasferencia de energía. 5 El sistema provee de acondicionamiento de energía y capacidad de soporte durante las perturbaciones de voltaje. También provee la energía durante el tiempo transcurrido entre la falla de energía comercial y la disponibilidad de la energía de la planta de soporte de Standby. En la Figura 2 se muestra el diagrama unifilar esquemático simplificado del CleanSource UPS para su análisis. Inductor de Línea Contactor de Entrada Disconectador Estático Fusible del Inversor Contactor de Bypass Contactor de Salida Inductor de Filtro Volante Giratorio Convertidor de Volante Giratorio Convertidor de Salida Figure 2: Diagrama unifilar esquemático del CleanSource 750HD UPS UPS de Doble Conversión El UPS de doble conversión está basado en un módulo sencillo de rectificador – inversor con un bypass estático envolvente y un banco sencillo de baterías del tipo VRLA. Este es un modelo de alto nivel con modos de falla que incluyen falla en el rectificador, falla en el inversor, falla en los capacitores de DC, falla de los breakers y falla en el interruptor estático. En la Figura 3 se muestra un diagrama simplificado. Durante una falla de la energía en la entrada principal del UPS, la energía de soporte es tomada de las baterías hasta que la energía de entrada al UPS es reestablecida. El rectificador entonces recarga las baterías y simultáneamente alimenta el inversor con corriente directa. Cuando el sistema trabaja de esta manera, según fue diseñado, esta conmutación de fuentes de suministro al inversor es transparente para la carga. Aunque el equipo trabaja en forma efectiva, existen desventajas en el funcionamiento de los UPS de doble conversión incluyendo la baja eficiencia en su operación, debida al doble proceso de conversión desde AC a DC y después de DC a AC. Las baterías de plomo ácido son grandes y pesadas y están llenas con un producto químico corrosivo y materiales riesgosos que deben ser desechados en forma segura. Las baterías requieren de un entorno controlado. Un incremento de 10oC en la temperatura ambiente, por encima de los 25oC, reduce la expectativa de vida útil de las baterías en un 50%. Adicionalmente, las baterías tiene un modo de falla en su operación que se debe a fallas que no son detectables durante las rutinas de mantenimiento normales de estos elementos. 6 Sistema Convencional de UPS de Doble Conversión Figure 3: Diagrama unifilar esquemático de la topología de un UPS de doble conversión. Energía Comercial, conmutador de trasferencia (ATS) y generador en Standby Los dos sistemas comparados tienen una entrada sencilla para la energía comercial y un generador en Standby; estos se conectan a la entrada del UPS mediante unos tableros eléctricos y un ATS. Los diagramas unifilares esquemáticos, incluyendo la energía comercial, el generador, el ATS, los tableros eléctricos y las alternativas de los dos sistemas de UPS se muestran en las Figuras 4 y 5. 7 Figure 4: CleanSource 750HD con energía comercial y Generador en Standby 8 Figure 5: UPS de doble conversión con energía comercial y generador en Standby 9 Evaluación Probabilística del Riesgo (PRA) Introducción La Evaluación Probabilística Del Riesgo (PRA) resulta de la aplicación de unas técnicas formales usadas para evaluar la confiabilidad y la disponibilidad de sistemas complejos. El sistema PRA ha sido extendido y refinado por las industrias militares, aeroespaciales, plantas de generación nucleares, y procesos industriales altamente riesgosos. Las técnicas modernas utilizadas en PRA permiten la evaluación cuantitativa del impacto de la toma de decisiones y las políticas organizacionales y también la evaluación de aspectos ambientales, en adición del impacto de la falla de los componentes físicos de un sistema. Existen dos razones importantes para usar PRA en el análisis de sistemas de alta confiabilidad: • Limitaciones fundamentales para conocer la confiablidad mediante la observación directa de la falla de los sistemas. • La necesidad de cuantificar los riesgos para el direccionamiento racional y efectivo de los recursos. Los ofrecimientos de una disponibilidad de “seis nueves”, manera simplificada de referirse a un porcentaje promedio de operación continua de 99.9999%, son rampantes en este medio. Un breve análisis matemático indica que esto equivale a ofrecer un tiempo medio entre fallas (MTTF) en los sistemas de más de 1.200 años. Es imposible confirmar o negar esas afirmaciones mediante la observación de las instalaciones dentro del tiempo normal de vida de unas cuantas décadas. Ni los diseñadores ni los propietarios de estos equipos vivirán lo suficiente para conocer la verdad sobre este tema. Las técnicas PRA permiten el desarrollo de estimados creíbles y defendibles sobre la confiabilidad de los sistemas mediante la combinación y análisis de la información conocida sobre la frecuencia de fallas de los componentes mediante un modelo matemático. Existe amplia información disponible sobre la rata de fallas de los componentes electrónicos, eléctricos y mecánicos. Lo cálculos mediante el PRA permiten que esa información, combinada con el conocimiento de expertos sobre cómo esos componentes interactúan en un sistema particular, produzca estimados útiles sobre la rata de fallas que puede presentar un sistema complejo, aún antes de que dicho sistema sea construido. La habilidad del método PRA para estimar la rata de falla de un sistema le permite a los diseñadores y fabricantes evaluar la confiabilidad y competitividad de los diseños aún antes de construir el primer prototipo. También es una herramienta muy útil para predecir los efectos de una mejora propuesta para los equipos. Los sistemas de alta confiabilidad invariablemente utilizan sistemas redundantes, sistemas de respaldo y otras técnicas. Estas técnicas resultan en diseños muy complejos que desafían el juicio e intuición que tradicionalmente se aplican en la ingeniería. El método PRA es necesario para determinar la confiabilidad de un sistema cuya falla es tan infrecuente que la evaluación por observación directa es impráctica. También es útil cundo se trata de evitar la ocurrencia de una falla en cuanto sea posible, como ocurre con las plantas 10 nucleares. La segunda razón, y quizás la más importante para la utilización del PRA es la implicación que tiene como ayuda para la alta gerencia para la toma de decisiones. El resultado de un buen análisis mediante el PRA tiene más significado que un simple número como es el caso del tiempo medio entre fallas (MTTF) o disponibilidad. El resultado contempla tanto la posibilidad de falla (discutido más adelante) como la importancia de la contribución de cada elemento al riesgo general de falla. Es esta cuantificación del riesgo la razón más poderosa para la utilización del PRA en el análisis de sistemas de soporte de alta confiabilidad. Los resultados del análisis para el CleanSource 750HD UPS y para el UPS de doble conversión son consistentes con otros estudios anteriores realizados por centros de cómputo corporativos y por empresas fabricantes de UPS de la competencia. Los modelos de sistemas con docenas y aún miles de componentes han mostrado invariablemente que la mayoría de los riesgos de falla pueden ser atribuidos tan sólo a unos pocos elementos. Sin este conocimiento de la contribución relativa de ciertos elementos en los procesos de falla, los diseñadores y gerentes no podrían posiblemente asignar los recursos en forma efectiva. Armados con el conocimiento de que tan solo unos pocos elementos causan la mayoría de las fallas es posible asignar más recursos al mejoramiento de esos elementos. También es posible modificar los recursos asignados a algunos componentes, a algunas prácticas de mantenimiento y otros esfuerzos que pueden mostrar poca contribución a la confiabilidad del sistema. En resumen, el método PRA provee información referente a la confiabilidad de un sistema que es difícil o imposible obtener por otros métodos. Esta información permite de una manera racional y defendible la asignación de recursos para mejorar la confiabilidad de un sistema durante todas las fases del diseño, operación, mantenimiento y optimización. Disponibilidad y Probabilidad de Falla Los reportes de los resultados de Mtech se dan en término de probabilidad de falla y no de disponibilidad. La disponibilidad es una medida de la rapidez con que un sistema puede ser reparado pero no es lo más útil para comprender el riesgo de falla que pueden presentan dos sistemas que se encuentran en competencia. La principal razón para utilizar la probabilidad de falla es que el usuario final halle este criterio como el más útil. Son pocas las firmas que tienen experiencia sustancial en la aplicación de las técnicas matemáticas del PRA, pero sus ejecutivos, rutinariamente, manejan el análisis de riesgo. Muchas empresas, como las aseguradoras o las que manejan programas de recuperación de desastres basan sus decisiones en la valoración del riesgo, cuál es la probabilidad de que ocurran los eventos y cuáles son los multiplicadores que deben aplicar para medir las pérdidas por la magnitud de los daños que el estudio les permite anticipar. La mayoría de las empresas que operan centro de cómputo sufrirán pérdidas sustanciales en el evento de una sola caída de sus sistemas y por eso necesitan saber la probabilidad de que ese evento ocurra para tomar las decisiones pertinentes respecto a las inversiones adicionales u otros medios que debe utilizar para mitigar la probabilidad del riesgo. Una razón final para utilizar la probabilidad de riesgo en lugar de la disponibilidad es que la probabilidad de falla es una función del tiempo. Otros métodos de análisis como la reducción de mallas y cadenas de Markov están limitadas a rata de fallas constantes, que son frecuentemente presentadas como MTTF, que son obtenidas a partir de una rata de fallas 11 constantes, λ, por inversión: MTTF = 1/λ. Aunque esto es válido para componentes de un sistema que presentan índices de fallas constantes, los elementos redundantes con rata de fallas constantes convierten al sistema en un caso de sistema con rata de fallas variables. Esto puede inducir equivocadamente a caracterizar un sistema incorporando elementos redundantes con una rata de fallas constante. Modelo de Árbol de Fallas El análisis de árbol de fallas es una técnica utilizada para trazar los efectos de la falla de un componente o subsistema. El análisis se inicia con la falla de los sistemas. Esto determina cuáles son los subsistemas que pueden fallar para producir la falla de un sistema. Cada subsistema es evaluado en forma similar hasta que todos los caminos terminan en un cierto número de fallas, bien definidas, llamadas eventos desencadenantes. El modelo de árbol de fallas es un modelo lógico de fallas de sistemas, combinado con la rata de fallas y reparación del subsistema que produjo el evento desencadenante. La combinación de los componentes que fallan, que son suficientes para causar una falla del sistema, se denominan conjuntos mínimos de falla (Cut sets) El árbol de fallas y su conjunto de herramientas de análisis es la técnica más importante para modelar un sistema y determinar los conjuntos mínimos de falla. Las ratas de falla y reaparición para cada evento básico se utilizan para determinar la contribución relativa de cada rama del árbol a la falla total del sistema. El resultado de este análisis es el listado de los conjuntos mínimos de falla y su contribución sobre la probabilidad de falla total del sistema. Debido a que cada modelo, por simple que sea, típicamente tiene miles de conjuntos mínimo de fallas pero casi todas las fallas son causadas por muy pocos conjuntos mínimos de falla, Mtech no reporta la contribución de todos esos conjuntos mínimos de falla. Los sistemas CleanSource 750HD UPS y los UPS basados en la doble conversión fueron modelados para su comparación haciendo uso de las herramientas del programa SAPHIRE para la creación del árbol de fallas. El modelo original para el CleanSource UPS, desarrollado en el año 2008, se hizo extensivo a la época actual teniendo en cuenta las mejoras en el diseño del CleanSource 750HD UPS. El modelo original de los UPS de doble conversión se conservó tal cual ya que no ha habido mejoras significativas que impacten en la confiabilidad de esta tecnología pues el principal Cut set es el uso las baterías. Se entiende que la falla del sistema se define como aquel evento que conduce a que la carga crítica deje de recibir energía ya sea desde la energía comercial o del sistema de Standby que son las fuentes de energía consideradas. El modelo compara ambos sistemas de UPS – el CleanSource 750HD UPS de Active Power y las UPS convencionales de doble conversión y los módulos de bypass. La falla ocurre si algunos de los dos UPS fallan. Esta simplificación permite la incorporación de elementos comunes al árbol de fallas, como es el caso de la energía comercial, el generador, el ATS etc. 12 1. IEEE STD-483-1997 (the IEEE Gold Book), now replaced by IEEE Std. 2006.7-2013 Análisis del Árbol de Fallas Mtech utiliza ratas de falla de los componentes de muchas fuentes, incluyendo las publicaciones de la industria1 los datos de los fabricantes y la experiencia de Mtech con la industria de los UPS. En los casos en que Active Power suministró información de campo sobre la experiencia con su base instalada de CleanSource UPS, esta información fue utilizada para los estimados de las ratas de falla de los componentes y sus modos de falla. Mtech construyó el árbol de fallas del CleanSource 750HD UPS basado en el diagrama unifilar esquemático del producto y las aclaraciones de Active Power cuando éstas fueron requeridas por Mtech. Clases de Fallas de la Energía Comercial Para este estudio se consideran dos tipos de falla de la energía comercial. • Fallas por tiempo prolongado con duración mayor a 10 segundos en donde se requiere que la fuente de entrada sea transferida a un generador en Standby el cual requiere de un ATS para iniciar el generador y transferir la carga. • Corte de energía de corta duración, menor de 10 segundos, en donde la energía almacenada en el sistema UPS es suficiente para soportar la carga mientras que el servicio comercial se normaliza; bajo este escenario no se requiere la transferencia a generador y se magnifica la diferencia de confiabilidad de los dos sistemas de UPS. Cortes Prolongados: Mayores de 10 Segundos con Transferencia a Generador En este escenario la energía almacenada en los UPS provee la energía a la carga crítica durante un breve lapso de tiempo mientras que el generador de Standby arranca y asume la carga dependiendo para todo esto del ATS. Es importante anotar que estos apagones por más de 10 segundos son relativamente infrecuentes; el instituto de investigación para la energía eléctrica (EPRI por sus siglas en inglés) estima que los usuarios de la energía están 10 veces más expuestos a fluctuaciones de voltaje momentáneos que a un apagón completo lo cual significa que tan solo el 4% de todos los cortes de energía tienen una duración de más de 10 segundos. Los conjuntos mínimos de falla más frecuentes (top cut sets) para los UPS de doble conversión con baterías y para el CleanSource 750HD UPS están reproducidos en el apéndice (Figuras A1 y A2). Cada una de las filas de las tablas representa un tipo de falla específica, dentro de la arquitectura de los equipos, que conducen a la pérdida de alimentación del equipo crítico. Cada conjunto de probabilidades de falla se calcula a partir de las posibilidades de falla de cada componente o de la frecuencia de falla de estos elementos, como lo determina la información disponible en la industria, el libro dorado de la IEEE o la experiencia de campo de los fabricantes. El análisis del árbol de falla muestra que la falla del ATS es la causa más significativa que lleva a que el sistema de respaldo falle. La falla del ATS en su operación tiene participación en el 37% de las fallas esperadas de los sistemas de UPS de doble conversión y del 47% de las 13 fallas esperadas del sistema CleanSource 750HD UPS. Este resultado no es una acusación en contra de los sistemas de ATS. El libro dorado de la IEEE utiliza en el modelo del ATS un reporte de falla con una frecuencia de 10-5 eventos por hora, o sea un tiempo medio entre fallas de más de 100.000 horas (más de 11 años). Esto representa un comportamiento confiable para ser un equipo electromecánico complejo en servicio continuo. El ATS participa en la mayoría de los casos de falla del sistema porque es un punto común de falla. La consecuencia de la falla del ATS es casi invariablemente la falla del sistema. La Figura 6 muestra que el sistema basado en el CleanSource 750HD UPS presenta una menor probabilidad de falla por año de servicio que el sistema de UPS de doble conversión con baterías. El sistema CleanSource 750HD UPS reduce la posibilidad de falla del sistema en más de un 21%, aun incluyendo el modo de falla común producida por el ATS, los tableros eléctricos y el generador. Corte Prolongado Pf UPS Convencional CleanSource 750HD 8.58% 6.73% Figure 6: Resumen de confiabilidad de los sistemas en caso de un corte prolongado de energía Corte Breve: Menos de 10 Segundos sin Transferencia a Generador En el escenario de un corte breve, la energía almacenada en los UPS provee suficiente tiempo de soporte para superar la perturbación de energía. Dado que el 96% de todas las perturbaciones que impactan la continuidad del servicio tienen una duración de 10 segundos o menos, el comportamiento de los UPS en este escenario es determinante para evaluar la confiabilidad de la arquitectura individual de los UPS que se están comparando. El análisis del árbol de fallas no considera para este caso la falla del ATS, tableros eléctrico y generador ya que no entran en la ecuación por no ser requeridos para la continuidad del servicio. Las Figuras A3 y A4 de los apéndices muestran el resultado de los análisis de los dos sistemas. La Figura 7 muestra que CleanSource 750HD tiene una dramática baja probabilidad de fallas comparado en el UPS de doble conversión. La probabilidad de falla es 0.50% por año para la operación del CleanSource 750HD. Para el UPS de doble conversión la posibilidad de falla es de 2,46% por año, o sea 4.9 veces mayor que el CleanSource 750HD UPS. El análisis del árbol de fallas muestra que la fallas de batería pos causas detectables y no detectables son responsables del más del 83% de todas las fallas de los equipos de arquitectura de doble conversión. Se asume que la rata de fallas de las baterías corresponden a elementos bien mantenidos y que las rutinas de prueba y mantenimiento son efectivas, lo cual resulta en una baja rata de fallas. La experiencia sugiere que es muy difícil concebir un escenario en que las baterías sean más confiables que lo que el modelo predice. 14 UPS Convencional CleanSource 750HD Corte prolongado Pf 8.58% 6.73% Corte Breve Pf 2.46% 0.50% Figure 7: Resumen de la confiabilidad para cortes prolongados y para cortes breves Falla en la Respuesta del Sistema (Demand Failure) Ambos sistemas presentan este tipo de modo de fallas. En el caso de los UPS de doble conversión estas se deben a fallas de las baterías por causas no detectables. Esto significa que la falla puede no haber sido detectada durante las pruebas mensuales del sistema y finalmente se manifiestan cuando el equipo se ve exigido a soportar la carga durante una falla de la energía comercial. La rata de fallas, para este modo de falla, se asume que representa el 1% de la rata de fallas basadas en la operación de las baterías. El CleanSource 750HD UPS presenta una modo de falla de respuesta del sistema que se presenta cuando el switch de desconexión estático y el contactor de entrada fallan al abrir cuando ocurre una falla de la energía comercial. La Figura 8, que se muestra abajo, muestra la probabilidad de que cualquiera de los dos sistemas analizados presente una falla en su funcionamiento si el sistema no está en bypass al momento de presentarse la falla de la energía comercial. La probabilidad de que el CleanSource 750HD UPS no soporte la carga en el momento de fallar la energía comercial es muy baja – menos del 1% de la probabilidad que mostró el UPS de doble conversión. Corte Breve Doble Conversión CleanSource 750HD Probabilidad de falla de funcionamiento 2.05% 6.7*10-5% Figure 8: Probabilidad de falla en el funcionamiento para el sistema de UPS de doble conversión comparado con el CleanSource 750HD UPS Opción de Tiempo Extendido El CleanSource 750HD UPS ofrece la opción al usuario de utilizar un banco de baterías adicional al sistema de almacenamiento de energía flywheel. Esta combinación de dos fuentes de tecnología diferentes de almacenamiento de energía mejora la confiabilidad de sistema más allá de la típica redundancia “N+1” o ”2N” basada en la duplicación de componentes idénticos. La Figura 9 presenta el diagrama unifilar esquemático del CleanSource 750HD UPS con la opción de tiempo extendido. 15 Inductor de Línea Contactor de Entrada Contactor de Bypass Contactor de Salida Fusible del Inversor Disconectador Estático Inductor de Filtro Volante Giratorio Convertidor de Volante Giratorio Convertidor de Salida Convertidor DC/DC (Opcional) + - Fuente Alterna de DC (Opcional) Figure 9: Diagrama unifilar esquemático del CleanSource 750HD UPS con opción de tiempo extendido El uso de diferentes tecnologías provee verdadera redundancia, o “respaldo al sistema de respaldo” ya que los eventos que deshabiliten al Flywheel difícilmente afectarán a las baterías y viceversa. Los arreglos de sistemas idénticos para dar redundancia están sujetos a causas comunes de falla, en donde un simple factor ocasiona que fallen múltiples unidades al mismo tiempo (por ejemplo errores de fabricación, sensibilidad a causas ambientales etc.). Las acusas comunes de falla imponen limites muy fuertes a los beneficios de redundancia adicional. Como se indica en la Figura 10, la combinación del Flywheel y las baterías como medio de almacenamiento de energía evitan ese límite. Los cálculos de Mtech indican que la adición de un banco sencillo de baterías VRLA al CleanSource 750HD UPS reduce la no confiabilidad del sistema aproximadamente en un 30%, para el caso de interrupciones de corta duración. El resultado del análisis es conservador, ya que no se toma en cuenta el posible incremento en la vida útil de las baterías debido a que el Flywheel suplirá siempre la energía durante los cortes de energía de corta duración. Los Impulsos cortos y frecuentes de demanda de soporte de las baterías pueden reducir su tiempo de vida pero ya que este escenario depende de las características de confiabilidad de la fuente de energía comercial en cada sitio, entonces este efecto no fue considerado en el análisis. UPS Convencional CleanSource 750HD CleanSource 750HD Tiempo extendido Corte prolongado Pf 8.58% 6.73% 6.60% Corte Breve Pf 2.46% 0.50% 0.36% Figure 10: Resumen de la confiabilidad de los sistemas en escenarios de corte prolongado y corte breve y corte largo del CleanSource 750HD UPS con la opción de tiempo extendido. 16 Escenarios de Corte de Energía Como ya se mencionó, el estudio analiza la confiabilidad de las soluciones de UPS en los eventos de cortes prolongados y breves de energía comercial. Para el caso de cortes prolongados, la adición de un banco de baterías ofrecida con el CleanSource 750HD UPS como opción de tiempo extendido reduce la posibilidad de falla en un 6.6%. Para los modos de corte de energía más común, que corresponden a aquellos con duración menor a 10 segundos, el CleanSource 750HD UPS con tiempo extendido tiene una probabilidad de fallas de 0.36% por año de operación- casi 7 veces menos que la probabilidad de falla de un sistema UPS de doble conversión y 28% menos posibilidad de falla que el mismo sistema CleanSource 750HD UPS sin la opción de tiempo extendido. Falla en la Respuesta del Sistema (Demmand Failure) Como se anotó anteriormente, el CleanSource 750HD UPS y los UPS de doble conversión tienen modos de falla en su funcionamiento. El modo de falla para la doble conversión es la falla no detectable de las baterías, mientras que para el CleanSource 750HD UPS este tipo de falla se da para el caso de una falla doble del switche estático de desconexión y del contactor de entrada, para abrir ante la ocurrencia de una falla en la energía comercial. El CleanSource 750HD UPS con tiempo extendido puede presentar ambos tipos de falla de operación pero a diferencia del UPS convencional, el CleanSource 750HD UPS no presenta falla de operación aunque el Flywheel no esté operativo en el momento de la falla, a menos que, adicionalmente, las baterías presenten una falla no detectable. La falla de operación del sistema CleanSource 750HD UPS con la opción de tiempo extendido es 30% más improbable que presente este tipo de fallas que con la versión básica; o sea sin hacer uso de la opción. Corte Breve Doble Conversión Probabilidad de falla de operación 2.05% 750HD CleanSource 750HD CleanSource Tiempo extendido 6.7*10-5 % 4.8*10-5% Figure 11: Probabilidad de falla de operación para el UPS de doble conversión, el CleanSource 750HD UPS y el CleanSource 750HD UPS con la opción de tiempo extendido. Conclusión El modelo de árbol de fallas de Mtech considera dos clases diferentes de falla de la energía comercial – fallas prolongadas de más de 10 segundos de duración y fallas breves de menos de 10 segundos. 17 Durante las fallas prolongadas el ATS debe arrancar el generador y transferirle la carga. El estudio concluyó que la probabilidad de falla en este escenario es 21% menor para el caso del CleanSource 750HD UPS que para el UPS de doble conversión. La diferencia en la confiabilidad de los sistemas de UPS es mitigada por las probabilidades de falla del generador, del ATS y de los tableros eléctricos, ya que todos estos elementos deben operar para soportar la carga. Para el caso de cortes breves, menores de 10 segundos de duración, el CleanSource 750HD UPS es más confiable que un UPS de doble conversión ya que presenta un 80% menos de probabilidad de falla. EPRI reporta que el 96% de todas las fallas de energía corresponden a este escenario, lo que significa que este tipo de fallas de energía se da con una frecuencia 25 veces mayor que los cortes prolongados, esto hace que las instalaciones críticas estén más expuestas a fallar para este tipo de corte de energía comercial. Esto le da relevancia a la rata de fallas para interrupciones breves de la energía comercial. En los UPS de doble conversión con baterías el modo de falla más probable es debido a las fallas no detectables de las baterías. Se ha comprobado que la detección de celdas con problemas, en un sistema de baterías que fallarán en el próximo evento de corte, es de extrema dificultad. El sistema CleanSource 750HD UPS es de lejos el sistema más confiable, aún partiendo de la suposición muy optimista de que se realicen pruebas mensuales de las baterías y que éstas sean capaces de detectar el 99% de las fallas que pudieran presentarse en alguna de las celdas. Estimados realistas del porcentaje de fallas de las baterías, que no son detectables, resultarían en una clara ventaja para el CleanSource 750HD UPS. El beneficio clave del sistema de almacenamiento de energía electromecánico del CleanSource 750HD UPS es que su dinámica hace muy improbable la falla de operación de este sistema. El estado normal de operación del CleanSource 750HD UPS es con la volanta giratoria en movimiento permanente almacenando energía cinética. Los cambios en los parámetros que determinan el estado del sistema son inmediatos y suministran su buen o mal estado de forma confiable e inmediata antes de que ocurra un corte de energía. De otro lado, un sistema basado en baterías depende de un proceso electroquímico, que aún con el monitoreo y rutinas de mantenimiento recomendado presentan condiciones de falla no detectables. Los estudios de Mtech muestran que con el CleanSource 750HD UPS se reducen las probabilidades de falla del sistema en más de un 99%, comparándolo con el sistema de UPS de doble conversión con baterías. La nueva opción del CleanSource 750HD UPS con tiempo extendido le adiciona un nuevo elemento de confiabilidad al sistema. Esta solución provee un verdadero medio de “respaldo al sistema de respaldo” de almacenamiento de energía; esta nueva característica reduce significativamente el riesgo por una causa común de falla y ofrece una reducción significativa en la probabilidad de falla ante el evento de un corte de energía comercial, ya sea que se trate de un evento de breve duración o de duración prolongada. 18 © ® TM 2014 Active Power, Inc. All rights reserved. WP-115 Appendix - Failure Scenario Cut Sets Figure A1: Principales cut sets para ups de doble conversión y falla prolongada 19 Figure A2: Principales cut sets para ups de doble conversión y falla prolongada 20 Figure A3: Principales cut sets para ups de doble conversión y falla breve 21 Figure A4: Principales cut sets para el cleansource 750HD ups para falla breve 22 Figure A5: Principales cut sets para el cleansource 750HD ups con tiempo extendido y falla prolongada 23 Figure A6: Principales cut sets para el cleansource 750HD ups con tiempo extendido y falla breve 24