Análisis de las Posibilidades de Falla de un Sistema

Anuncio
Análisis de las Posibilidades de Falla de un Sistema UPS
Evaluación de la confiabilidad del Sistema UPS CleanSource® HD, con soporte por volanta rotatoria
(Flywheel), en comparación con el Sistema de UPS de doble conversión con baterías
Documento
115
2128 W. Braker Lane, BK12
Austin, Texas 78758-4028
w w w. a c t i v e p o w e r. c o m
Objetivo
Este documento presenta un análisis cuantitativo de la confiabilidad del servicio del UPS
(Sistema Interrumpido de Potencia) CleanSource 750HD comparándolo con el sistema de
UPS de doble conversión con un banco de baterías. El estudio cuantifica la probabilidad de
falla de un sistema, bajo tres escenarios diferentes de falla - una falla prolongada de la energía
comercial de duración mayor a 10 segundos, una falla de corta duración menor a 10 segundos
y una falla en el equipo de soporte. El estudio también evalúa la probabilidad de falla del
sistema CleanSource 750HD UPS con una fuente de energía secundaria (Opción de tiempo
de operación extendido) y una fuente de almacenamiento de energía por volanta rotatoria
(Flywheel), comparándolo con un sistema de doble conversión con batería.
2
Hallazgos Principales
• La empresa MTechnology, Inc., concluyó que el CleanSource 750HD UPS es más confiable
que el sistema de doble conversión con un banco de baterías sencillo y presenta un 80%
menos de posibilidades de falla en el escenario de un corte de energía de tiempo reducido,
que corresponde a un corte con duración menor a 10 segundos.
• El CleanSource 750HD UPS tiene una menor posibilidad de falla en un año que un sistema
de doble conversión con baterías durante una falla prolongada de energía. El CleanSource
750HD UPS reduce el riesgo de falla del sistema en más de un 21%, aunque se incluya el
modo de falla más común, que es la falla por concepto de los sistemas de transferencia (ATS),
sistema eléctrico principal y la falla del generador durante un corte de energía prolongado,
con duración de más de 10 segundos.
• En el supuesto de que ninguno de los dos sistemas esté en modo de bypass, en el momento
de presentarse la falla de energía, la probabilidad de que el CleanSource 750HD UPS falle
y no soporte la carga, es un 99% menor que la posibilidad de falla que tiene un sistema de
doble conversión con baterías.
• Durante una falla de energía de corta duración el CleanSource 750HD UPS, con la opción
de tiempo de soporte extendido por baterías (modelado con un banco de baterías igual
al utilizado en un sistema de doble conversión), reduce la posibilidad de falla en un 85%,
comparándolo con sistema de doble conversión.
• El Sistema de Transferencia Automática (ATS) es la causa de falla más probable que puede
presentarse en el caso de una caída de la energía comercial de más de 10 segundos y
representa aproximadamente el 37% y el 47% de las fallas del sistema aplicados a la doble
conversión con baterías y al sistema CleanSource 750HD UPS respectivamente.
• La causa de falla más probable en un sistema UPS de doble conversión con baterías es
debida a las fallas no detectadas de las baterías, que son responsables del más del 83% de
las fallas de los sistemas de doble conversión.
• El estudio consideró una baja rata de casos por falla en la detección de baterías dañadas,
estimando esta causa en tan sólo un promedio de 1% de todas las causas de falla de
baterías, ya que asume una rutina de pruebas y mantenimiento óptima. MTechnology, Inc.,
considera, según su experiencia, que el escenario considerado para el mantenimiento de las
baterías es el más idealizado y, por tanto, es imposible imaginar un mejor escenario para la
confiabilidad de las baterías que el modelado en el estudio.
3
Resumen
Active Power, Inc. seleccionó a MTechnology, Inc. (MTech) para realizar un análisis de
confiabilidad de su producto CleanSource 750HD UPS comparándolo con un sistema de doble
conversión con baterías. El estudio se realizó teniendo como base un análisis de confiabilidad
sobre el CleanSoure UPS de Active Power realizado por Mtech en el año 2007. Nos Referimos
al white paper #103 (Evaluación de la confiabilidad del sistema UPS integrado con flywheel
comparado con un sistema de doble conversión con baterías)
Mtech ha estado aplicando desde 1996 la ciencia de la evaluación probabilística del riesgo
(conocida como PRA, por sus siglas en inglés) al análisis de los sistemas eléctricos que
requieren de una alta disponibilidad, aplicable a sistemas de cómputo, proveedores de
internet y otras instalaciones de misión crítica. Los clientes de Mtech incluyen fabricantes,
firma de ingeniería, empresarios y usuarios de instalaciones de misión crítica; la firma tiene
como clientes una amplia variedad de industrias incluyendo centros de procesamiento de
datos corporativos, energía nuclear, Mtech atiende a clientes de una gran gama de industrias
incluyendo centros de cómputo corporativos, centrales nucleares, sistemas en la industria de
gas y petróleo, generación distribuida, investigación biomédica, aplicaciones de terapia de
cáncer por aces de protones y el desarrollo de celdas de hidrógeno.
El estudio incluye dos clases de falla de la energía comercial:
• Falla de la energía comercial con duración mayor de 10 segundos, en donde la fuente
de corriente alterna debe ser transferida a un generador mediante el conmutador de
transferencia automática (ATS) el cual arranca pone en servicio al generador
• Falla de la energía comercial con duración menor a 10 segundos, en donde la energía
almacenada en el UPS es suficiente para soportar la carga mientras que se restablece el
servicio de la energía comercial y por eso no se requiere la transferencia a un generador.
Este es el escenario más común de fallas y en donde mejor se aprecia la diferencia de
confiabilidad de los dos sistemas de UPS.
Mtech desarrolló un modelo tipo árbol de fallas para los dos sistemas. El modelo de árbol
de fallas combina los conocimientos sobre las causas de falla de la energía comercial y de
los componentes de los UPS que conducen a una falla del sistema protegido; considera la
frecuencia con que fallan los componentes y anticipa la duración de la reparación requerida.
La información referente a la frecuencia de falla de los componentes fue obtenida de fuentes
especializadas sobre estos temas, tales como el libro dorado de la IEEE y, en donde fue
pertinente, fue enriquecida por la abundante experiencia que sobre el tema tiene Active Power
con sus productos CleanSource UPS.
Descripción del Sistema
CleanSource 750HD UPS
4
El CleanSource 750HD es la solución de alta densidad de potencia de Active Power para el
producto UPS basado en el flywheel, el cual tiene una capacidad de 750 kVA / 675 kW y utiliza
una volanta de 1700 libras que gira a 7.700 revoluciones por minuto (RPM) para almacenar
energía cinética. El UPS integra la funcionalidades de un motor, rotor flywheel y generador en
un solo sistema. (Ver Figura 1 presentada más abajo).
Durante la operación normal, la volanta rotatoria gira a una velocidad constante. El sistema
entrega a la carga protegida la energía que acondiciona a partir de la energía comercial.
Cuando se presenta una falla de la energía comercial, el sistema entrega la energía cinética
almacenada en la volanta giratoria en la forma de energía eléctrica. Cuando la energía
comercial es restaurada entonces el sistema transfiere la carga nuevamente a la energía
comercial o al generador, si este es el caso.
Figure 1: Active Power 750 kVA Encerramiento y rotor del flywheel
El Sistema dispone de capacidad de acondicionamiento de energía, incluyendo regulación
de voltaje y cancelación de armónicos. Mediante la combinación de un CleanSource 750HD
UPS con un generador en Standby se configura un sistema de suministro permanente de
potencia para proteger equipos sensibles de misión crítica contra interrupciones de corta
duración y contra ausencias prolongadas del suministro de energía comercial. Los sistemas
UPS CleanSource tienen en su haber más de 150 millones de horas de operación en campo
en sus diferentes instalaciones alrededor del mundo.
El rotor del Flywheel está dotado de la tecnología de rodamiento magnético de Active Power.
Esta tecnología alivia a los rodamientos de la mayor parte del peso del Flywheel. Una bomba
de vacío evacúa el aire de la cámara de la volanta y evita la pérdida de energía del flywheel
por fricción con el aire. Durante la pérdida de la energía comercial, la velocidad de la volanta
disminuye en la medida en que su energía cinética es transferida a la carga. La corriente
regulada es aplicada a las bobinas de campo para mantener un voltaje constante durante el
tiempo de trasferencia de energía.
5
El sistema provee de acondicionamiento de energía y capacidad de soporte durante las
perturbaciones de voltaje. También provee la energía durante el tiempo transcurrido entre la
falla de energía comercial y la disponibilidad de la energía de la planta de soporte de Standby.
En la Figura 2 se muestra el diagrama unifilar esquemático simplificado del CleanSource UPS
para su análisis.
Inductor de Línea
Contactor
de Entrada
Disconectador
Estático
Fusible del
Inversor
Contactor de Bypass
Contactor
de Salida
Inductor
de Filtro
Volante
Giratorio
Convertidor de
Volante Giratorio
Convertidor de
Salida
Figure 2: Diagrama unifilar esquemático del CleanSource 750HD UPS
UPS de Doble Conversión
El UPS de doble conversión está basado en un módulo sencillo de rectificador – inversor
con un bypass estático envolvente y un banco sencillo de baterías del tipo VRLA. Este es un
modelo de alto nivel con modos de falla que incluyen falla en el rectificador, falla en el inversor,
falla en los capacitores de DC, falla de los breakers y falla en el interruptor estático. En la
Figura 3 se muestra un diagrama simplificado.
Durante una falla de la energía en la entrada principal del UPS, la energía de soporte es
tomada de las baterías hasta que la energía de entrada al UPS es reestablecida. El rectificador
entonces recarga las baterías y simultáneamente alimenta el inversor con corriente directa.
Cuando el sistema trabaja de esta manera, según fue diseñado, esta conmutación de fuentes
de suministro al inversor es transparente para la carga.
Aunque el equipo trabaja en forma efectiva, existen desventajas en el funcionamiento de
los UPS de doble conversión incluyendo la baja eficiencia en su operación, debida al doble
proceso de conversión desde AC a DC y después de DC a AC. Las baterías de plomo ácido son
grandes y pesadas y están llenas con un producto químico corrosivo y materiales riesgosos
que deben ser desechados en forma segura. Las baterías requieren de un entorno controlado.
Un incremento de 10oC en la temperatura ambiente, por encima de los 25oC, reduce la
expectativa de vida útil de las baterías en un 50%. Adicionalmente, las baterías tiene un modo
de falla en su operación que se debe a fallas que no son detectables durante las rutinas de
mantenimiento normales de estos elementos.
6
Sistema Convencional de UPS de Doble Conversión
Figure 3: Diagrama unifilar esquemático de la topología de un UPS de doble conversión.
Energía Comercial, conmutador de trasferencia (ATS) y generador en Standby
Los dos sistemas comparados tienen una entrada sencilla para la energía comercial y un
generador en Standby; estos se conectan a la entrada del UPS mediante unos tableros
eléctricos y un ATS. Los diagramas unifilares esquemáticos, incluyendo la energía comercial,
el generador, el ATS, los tableros eléctricos y las alternativas de los dos sistemas de UPS se
muestran en las Figuras 4 y 5.
7
Figure 4: CleanSource 750HD con energía comercial y Generador en Standby
8
Figure 5: UPS de doble conversión con energía comercial y generador en Standby
9
Evaluación Probabilística del Riesgo (PRA)
Introducción
La Evaluación Probabilística Del Riesgo (PRA) resulta de la aplicación de unas técnicas
formales usadas para evaluar la confiabilidad y la disponibilidad de sistemas complejos. El
sistema PRA ha sido extendido y refinado por las industrias militares, aeroespaciales, plantas
de generación nucleares, y procesos industriales altamente riesgosos. Las técnicas modernas
utilizadas en PRA permiten la evaluación cuantitativa del impacto de la toma de decisiones y
las políticas organizacionales y también la evaluación de aspectos ambientales, en adición del
impacto de la falla de los componentes físicos de un sistema.
Existen dos razones importantes para usar PRA en el análisis de sistemas de alta confiabilidad:
• Limitaciones fundamentales para conocer la confiablidad mediante la observación directa
de la falla de los sistemas.
• La necesidad de cuantificar los riesgos para el direccionamiento racional y efectivo de
los recursos.
Los ofrecimientos de una disponibilidad de “seis nueves”, manera simplificada de referirse a
un porcentaje promedio de operación continua de 99.9999%, son rampantes en este medio.
Un breve análisis matemático indica que esto equivale a ofrecer un tiempo medio entre
fallas (MTTF) en los sistemas de más de 1.200 años. Es imposible confirmar o negar esas
afirmaciones mediante la observación de las instalaciones dentro del tiempo normal de vida
de unas cuantas décadas. Ni los diseñadores ni los propietarios de estos equipos vivirán lo
suficiente para conocer la verdad sobre este tema.
Las técnicas PRA permiten el desarrollo de estimados creíbles y defendibles sobre
la confiabilidad de los sistemas mediante la combinación y análisis de la información
conocida sobre la frecuencia de fallas de los componentes mediante un modelo
matemático. Existe amplia información disponible sobre la rata de fallas de los componentes
electrónicos, eléctricos y mecánicos. Lo cálculos mediante el PRA permiten que esa información,
combinada con el conocimiento de expertos sobre cómo esos componentes interactúan en un
sistema particular, produzca estimados útiles sobre la rata de fallas que puede presentar un
sistema complejo, aún antes de que dicho sistema sea construido.
La habilidad del método PRA para estimar la rata de falla de un sistema le permite a los
diseñadores y fabricantes evaluar la confiabilidad y competitividad de los diseños aún antes
de construir el primer prototipo. También es una herramienta muy útil para predecir los efectos
de una mejora propuesta para los equipos. Los sistemas de alta confiabilidad invariablemente
utilizan sistemas redundantes, sistemas de respaldo y otras técnicas. Estas técnicas resultan
en diseños muy complejos que desafían el juicio e intuición que tradicionalmente se aplican
en la ingeniería.
El método PRA es necesario para determinar la confiabilidad de un sistema cuya falla es tan
infrecuente que la evaluación por observación directa es impráctica. También es útil cundo se
trata de evitar la ocurrencia de una falla en cuanto sea posible, como ocurre con las plantas
10
nucleares. La segunda razón, y quizás la más importante para la utilización del PRA es la
implicación que tiene como ayuda para la alta gerencia para la toma de decisiones.
El resultado de un buen análisis mediante el PRA tiene más significado que un simple número
como es el caso del tiempo medio entre fallas (MTTF) o disponibilidad. El resultado contempla
tanto la posibilidad de falla (discutido más adelante) como la importancia de la contribución
de cada elemento al riesgo general de falla. Es esta cuantificación del riesgo la razón más
poderosa para la utilización del PRA en el análisis de sistemas de soporte de alta confiabilidad.
Los resultados del análisis para el CleanSource 750HD UPS y para el UPS de doble conversión
son consistentes con otros estudios anteriores realizados por centros de cómputo corporativos
y por empresas fabricantes de UPS de la competencia. Los modelos de sistemas con docenas
y aún miles de componentes han mostrado invariablemente que la mayoría de los riesgos
de falla pueden ser atribuidos tan sólo a unos pocos elementos. Sin este conocimiento de la
contribución relativa de ciertos elementos en los procesos de falla, los diseñadores y gerentes
no podrían posiblemente asignar los recursos en forma efectiva. Armados con el conocimiento
de que tan solo unos pocos elementos causan la mayoría de las fallas es posible asignar
más recursos al mejoramiento de esos elementos. También es posible modificar los recursos
asignados a algunos componentes, a algunas prácticas de mantenimiento y otros esfuerzos
que pueden mostrar poca contribución a la confiabilidad del sistema.
En resumen, el método PRA provee información referente a la confiabilidad de un sistema
que es difícil o imposible obtener por otros métodos. Esta información permite de una manera
racional y defendible la asignación de recursos para mejorar la confiabilidad de un sistema
durante todas las fases del diseño, operación, mantenimiento y optimización.
Disponibilidad y Probabilidad de Falla
Los reportes de los resultados de Mtech se dan en término de probabilidad de falla y no de
disponibilidad. La disponibilidad es una medida de la rapidez con que un sistema puede ser
reparado pero no es lo más útil para comprender el riesgo de falla que pueden presentan dos
sistemas que se encuentran en competencia. La principal razón para utilizar la probabilidad
de falla es que el usuario final halle este criterio como el más útil. Son pocas las firmas que
tienen experiencia sustancial en la aplicación de las técnicas matemáticas del PRA, pero
sus ejecutivos, rutinariamente, manejan el análisis de riesgo. Muchas empresas, como
las aseguradoras o las que manejan programas de recuperación de desastres basan sus
decisiones en la valoración del riesgo, cuál es la probabilidad de que ocurran los eventos y
cuáles son los multiplicadores que deben aplicar para medir las pérdidas por la magnitud de
los daños que el estudio les permite anticipar. La mayoría de las empresas que operan
centro de cómputo sufrirán pérdidas sustanciales en el evento de una sola caída de sus
sistemas y por eso necesitan saber la probabilidad de que ese evento ocurra para tomar
las decisiones pertinentes respecto a las inversiones adicionales u otros medios que
debe utilizar para mitigar la probabilidad del riesgo.
Una razón final para utilizar la probabilidad de riesgo en lugar de la disponibilidad es que
la probabilidad de falla es una función del tiempo. Otros métodos de análisis como la
reducción de mallas y cadenas de Markov están limitadas a rata de fallas constantes, que
son frecuentemente presentadas como MTTF, que son obtenidas a partir de una rata de fallas
11
constantes, λ, por inversión:
MTTF = 1/λ.
Aunque esto es válido para componentes de un sistema que presentan índices de fallas
constantes, los elementos redundantes con rata de fallas constantes convierten al sistema
en un caso de sistema con rata de fallas variables. Esto puede inducir equivocadamente a
caracterizar un sistema incorporando elementos redundantes con una rata de fallas constante.
Modelo de Árbol de Fallas
El análisis de árbol de fallas es una técnica utilizada para trazar los efectos de la falla de un
componente o subsistema. El análisis se inicia con la falla de los sistemas. Esto determina
cuáles son los subsistemas que pueden fallar para producir la falla de un sistema. Cada
subsistema es evaluado en forma similar hasta que todos los caminos terminan en un cierto
número de fallas, bien definidas, llamadas eventos desencadenantes. El modelo de árbol de
fallas es un modelo lógico de fallas de sistemas, combinado con la rata de fallas y reparación
del subsistema que produjo el evento desencadenante. La combinación de los componentes
que fallan, que son suficientes para causar una falla del sistema, se denominan conjuntos
mínimos de falla (Cut sets) El árbol de fallas y su conjunto de herramientas de análisis es la
técnica más importante para modelar un sistema y determinar los conjuntos mínimos de falla.
Las ratas de falla y reaparición para cada evento básico se utilizan para determinar la
contribución relativa de cada rama del árbol a la falla total del sistema. El resultado de este
análisis es el listado de los conjuntos mínimos de falla y su contribución sobre la probabilidad
de falla total del sistema. Debido a que cada modelo, por simple que sea, típicamente tiene
miles de conjuntos mínimo de fallas pero casi todas las fallas son causadas por muy pocos
conjuntos mínimos de falla, Mtech no reporta la contribución de todos esos conjuntos mínimos
de falla.
Los sistemas CleanSource 750HD UPS y los UPS basados en la doble conversión fueron
modelados para su comparación haciendo uso de las herramientas del programa SAPHIRE
para la creación del árbol de fallas. El modelo original para el CleanSource UPS, desarrollado
en el año 2008, se hizo extensivo a la época actual teniendo en cuenta las mejoras en el
diseño del CleanSource 750HD UPS. El modelo original de los UPS de doble conversión se
conservó tal cual ya que no ha habido mejoras significativas que impacten en la confiabilidad
de esta tecnología pues el principal Cut set es el uso las baterías.
Se entiende que la falla del sistema se define como aquel evento que conduce a que la carga
crítica deje de recibir energía ya sea desde la energía comercial o del sistema de Standby que
son las fuentes de energía consideradas. El modelo compara ambos sistemas de UPS – el
CleanSource 750HD UPS de Active Power y las UPS convencionales de doble conversión y
los módulos de bypass. La falla ocurre si algunos de los dos UPS fallan. Esta simplificación
permite la incorporación de elementos comunes al árbol de fallas, como es el caso de la
energía comercial, el generador, el ATS etc.
12
1. IEEE STD-483-1997 (the IEEE Gold Book), now replaced by IEEE Std. 2006.7-2013
Análisis del Árbol de Fallas
Mtech utiliza ratas de falla de los componentes de muchas fuentes, incluyendo las publicaciones
de la industria1 los datos de los fabricantes y la experiencia de Mtech con la industria de los
UPS. En los casos en que Active Power suministró información de campo sobre la experiencia
con su base instalada de CleanSource UPS, esta información fue utilizada para los estimados
de las ratas de falla de los componentes y sus modos de falla.
Mtech construyó el árbol de fallas del CleanSource 750HD UPS basado en el diagrama unifilar
esquemático del producto y las aclaraciones de Active Power cuando éstas fueron requeridas
por Mtech.
Clases de Fallas de la Energía Comercial
Para este estudio se consideran dos tipos de falla de la energía comercial.
• Fallas por tiempo prolongado con duración mayor a 10 segundos en donde se requiere
que la fuente de entrada sea transferida a un generador en Standby el cual requiere de un ATS
para iniciar el generador y transferir la carga.
• Corte de energía de corta duración, menor de 10 segundos, en donde la energía
almacenada en el sistema UPS es suficiente para soportar la carga mientras que el servicio
comercial se normaliza; bajo este escenario no se requiere la transferencia a generador y se
magnifica la diferencia de confiabilidad de los dos sistemas de UPS.
Cortes Prolongados: Mayores de 10 Segundos con Transferencia a Generador
En este escenario la energía almacenada en los UPS provee la energía a la carga crítica
durante un breve lapso de tiempo mientras que el generador de Standby arranca y asume la
carga dependiendo para todo esto del ATS. Es importante anotar que estos apagones por más
de 10 segundos son relativamente infrecuentes; el instituto de investigación para la energía
eléctrica (EPRI por sus siglas en inglés) estima que los usuarios de la energía están 10 veces
más expuestos a fluctuaciones de voltaje momentáneos que a un apagón completo lo cual
significa que tan solo el 4% de todos los cortes de energía tienen una duración de más de 10
segundos.
Los conjuntos mínimos de falla más frecuentes (top cut sets) para los UPS de doble conversión
con baterías y para el CleanSource 750HD UPS están reproducidos en el apéndice (Figuras
A1 y A2). Cada una de las filas de las tablas representa un tipo de falla específica, dentro
de la arquitectura de los equipos, que conducen a la pérdida de alimentación del equipo
crítico. Cada conjunto de probabilidades de falla se calcula a partir de las posibilidades de
falla de cada componente o de la frecuencia de falla de estos elementos, como lo determina
la información disponible en la industria, el libro dorado de la IEEE o la experiencia de campo
de los fabricantes.
El análisis del árbol de falla muestra que la falla del ATS es la causa más significativa que lleva
a que el sistema de respaldo falle. La falla del ATS en su operación tiene participación en el
37% de las fallas esperadas de los sistemas de UPS de doble conversión y del 47% de las
13
fallas esperadas del sistema CleanSource 750HD UPS.
Este resultado no es una acusación en contra de los sistemas de ATS. El libro dorado de la
IEEE utiliza en el modelo del ATS un reporte de falla con una frecuencia de 10-5 eventos por
hora, o sea un tiempo medio entre fallas de más de 100.000 horas (más de 11 años). Esto
representa un comportamiento confiable para ser un equipo electromecánico complejo en
servicio continuo. El ATS participa en la mayoría de los casos de falla del sistema porque es
un punto común de falla. La consecuencia de la falla del ATS es casi invariablemente la falla
del sistema.
La Figura 6 muestra que el sistema basado en el CleanSource 750HD UPS presenta
una menor probabilidad de falla por año de servicio que el sistema de UPS de doble
conversión con baterías. El sistema CleanSource 750HD UPS reduce la posibilidad de
falla del sistema en más de un 21%, aun incluyendo el modo de falla común producida
por el ATS, los tableros eléctricos y el generador.
Corte Prolongado Pf
UPS Convencional
CleanSource 750HD
8.58%
6.73%
Figure 6: Resumen de confiabilidad de los sistemas en caso de un corte prolongado de energía
Corte Breve: Menos de 10 Segundos sin Transferencia a Generador
En el escenario de un corte breve, la energía almacenada en los UPS provee suficiente
tiempo de soporte para superar la perturbación de energía. Dado que el 96% de todas las
perturbaciones que impactan la continuidad del servicio tienen una duración de 10 segundos
o menos, el comportamiento de los UPS en este escenario es determinante para evaluar la
confiabilidad de la arquitectura individual de los UPS que se están comparando.
El análisis del árbol de fallas no considera para este caso la falla del ATS, tableros eléctrico
y generador ya que no entran en la ecuación por no ser requeridos para la continuidad del
servicio. Las Figuras A3 y A4 de los apéndices muestran el resultado de los análisis de los dos
sistemas.
La Figura 7 muestra que CleanSource 750HD tiene una dramática baja probabilidad de fallas
comparado en el UPS de doble conversión. La probabilidad de falla es 0.50% por año para la
operación del CleanSource 750HD. Para el UPS de doble conversión la posibilidad de falla
es de 2,46% por año, o sea 4.9 veces mayor que el CleanSource 750HD UPS.
El análisis del árbol de fallas muestra que la fallas de batería pos causas detectables y no
detectables son responsables del más del 83% de todas las fallas de los equipos de arquitectura
de doble conversión. Se asume que la rata de fallas de las baterías corresponden a elementos
bien mantenidos y que las rutinas de prueba y mantenimiento son efectivas, lo cual resulta en
una baja rata de fallas. La experiencia sugiere que es muy difícil concebir un escenario en que
las baterías sean más confiables que lo que el modelo predice.
14
UPS Convencional
CleanSource 750HD
Corte prolongado Pf
8.58%
6.73%
Corte Breve Pf
2.46%
0.50%
Figure 7: Resumen de la confiabilidad para cortes prolongados y para cortes breves
Falla en la Respuesta del Sistema (Demand Failure)
Ambos sistemas presentan este tipo de modo de fallas. En el caso de los UPS de doble
conversión estas se deben a fallas de las baterías por causas no detectables. Esto significa
que la falla puede no haber sido detectada durante las pruebas mensuales del sistema y
finalmente se manifiestan cuando el equipo se ve exigido a soportar la carga durante una falla
de la energía comercial. La rata de fallas, para este modo de falla, se asume que representa
el 1% de la rata de fallas basadas en la operación de las baterías.
El CleanSource 750HD UPS presenta una modo de falla de respuesta del sistema que se
presenta cuando el switch de desconexión estático y el contactor de entrada fallan al abrir
cuando ocurre una falla de la energía comercial.
La Figura 8, que se muestra abajo, muestra la probabilidad de que cualquiera de los dos
sistemas analizados presente una falla en su funcionamiento si el sistema no está en bypass
al momento de presentarse la falla de la energía comercial. La probabilidad de que el
CleanSource 750HD UPS no soporte la carga en el momento de fallar la energía comercial
es muy baja – menos del 1% de la probabilidad que mostró el UPS de doble conversión.
Corte Breve
Doble Conversión
CleanSource 750HD
Probabilidad de falla de
funcionamiento
2.05%
6.7*10-5%
Figure 8: Probabilidad de falla en el funcionamiento para el sistema de UPS de doble conversión comparado con el
CleanSource 750HD UPS
Opción de Tiempo Extendido
El CleanSource 750HD UPS ofrece la opción al usuario de utilizar un banco de baterías
adicional al sistema de almacenamiento de energía flywheel. Esta combinación de dos fuentes
de tecnología diferentes de almacenamiento de energía mejora la confiabilidad de sistema
más allá de la típica redundancia “N+1” o ”2N” basada en la duplicación de componentes
idénticos. La Figura 9 presenta el diagrama unifilar esquemático del CleanSource 750HD UPS
con la opción de tiempo extendido.
15
Inductor de Línea
Contactor
de Entrada
Contactor de Bypass
Contactor
de Salida
Fusible del
Inversor
Disconectador
Estático
Inductor
de Filtro
Volante
Giratorio
Convertidor de
Volante Giratorio
Convertidor de
Salida
Convertidor DC/DC
(Opcional)
+
-
Fuente Alterna de DC
(Opcional)
Figure 9: Diagrama unifilar esquemático del CleanSource 750HD UPS con opción de tiempo extendido
El uso de diferentes tecnologías provee verdadera redundancia, o “respaldo al sistema de
respaldo” ya que los eventos que deshabiliten al Flywheel difícilmente afectarán a las baterías
y viceversa. Los arreglos de sistemas idénticos para dar redundancia están sujetos a causas
comunes de falla, en donde un simple factor ocasiona que fallen múltiples unidades al mismo
tiempo (por ejemplo errores de fabricación, sensibilidad a causas ambientales etc.).
Las acusas comunes de falla imponen limites muy fuertes a los beneficios de redundancia
adicional. Como se indica en la Figura 10, la combinación del Flywheel y las baterías como
medio de almacenamiento de energía evitan ese límite. Los cálculos de Mtech indican que
la adición de un banco sencillo de baterías VRLA al CleanSource 750HD UPS reduce la no
confiabilidad del sistema aproximadamente en un 30%, para el caso de interrupciones de corta
duración. El resultado del análisis es conservador, ya que no se toma en cuenta el posible
incremento en la vida útil de las baterías debido a que el Flywheel suplirá siempre la energía
durante los cortes de energía de corta duración. Los Impulsos cortos y frecuentes de demanda
de soporte de las baterías pueden reducir su tiempo de vida pero ya que este escenario
depende de las características de confiabilidad de la fuente de energía comercial en cada sitio,
entonces este efecto no fue considerado en el análisis.
UPS Convencional
CleanSource 750HD
CleanSource 750HD
Tiempo extendido
Corte prolongado Pf
8.58%
6.73%
6.60%
Corte Breve Pf
2.46%
0.50%
0.36%
Figure 10: Resumen de la confiabilidad de los sistemas en escenarios de corte prolongado y corte breve y corte largo
del CleanSource 750HD UPS con la opción de tiempo extendido.
16
Escenarios de Corte de Energía
Como ya se mencionó, el estudio analiza la confiabilidad de las soluciones de UPS en
los eventos de cortes prolongados y breves de energía comercial. Para el caso de cortes
prolongados, la adición de un banco de baterías ofrecida con el CleanSource 750HD UPS
como opción de tiempo extendido reduce la posibilidad de falla en un 6.6%.
Para los modos de corte de energía más común, que corresponden a aquellos con
duración menor a 10 segundos, el CleanSource 750HD UPS con tiempo extendido tiene
una probabilidad de fallas de 0.36% por año de operación- casi 7 veces menos que la
probabilidad de falla de un sistema UPS de doble conversión y 28% menos posibilidad de
falla que el mismo sistema CleanSource 750HD UPS sin la opción de tiempo extendido.
Falla en la Respuesta del Sistema (Demmand Failure)
Como se anotó anteriormente, el CleanSource 750HD UPS y los UPS de doble conversión
tienen modos de falla en su funcionamiento. El modo de falla para la doble conversión es la
falla no detectable de las baterías, mientras que para el CleanSource 750HD UPS este tipo de
falla se da para el caso de una falla doble del switche estático de desconexión y del contactor
de entrada, para abrir ante la ocurrencia de una falla en la energía comercial.
El CleanSource 750HD UPS con tiempo extendido puede presentar ambos tipos de falla de
operación pero a diferencia del UPS convencional, el CleanSource 750HD UPS no presenta
falla de operación aunque el Flywheel no esté operativo en el momento de la falla, a menos
que, adicionalmente, las baterías presenten una falla no detectable. La falla de operación del
sistema CleanSource 750HD UPS con la opción de tiempo extendido es 30% más improbable
que presente este tipo de fallas que con la versión básica; o sea sin hacer uso de la opción.
Corte Breve
Doble Conversión
Probabilidad de falla de
operación
2.05%
750HD
CleanSource 750HD CleanSource
Tiempo extendido
6.7*10-5 %
4.8*10-5%
Figure 11: Probabilidad de falla de operación para el UPS de doble conversión, el CleanSource 750HD UPS y el
CleanSource 750HD UPS con la opción de tiempo extendido.
Conclusión
El modelo de árbol de fallas de Mtech considera dos clases diferentes de falla de la energía
comercial – fallas prolongadas de más de 10 segundos de duración y fallas breves de menos
de 10 segundos.
17
Durante las fallas prolongadas el ATS debe arrancar el generador y transferirle la carga.
El estudio concluyó que la probabilidad de falla en este escenario es 21% menor para el
caso del CleanSource 750HD UPS que para el UPS de doble conversión. La diferencia en la
confiabilidad de los sistemas de UPS es mitigada por las probabilidades de falla del generador,
del ATS y de los tableros eléctricos, ya que todos estos elementos deben operar para soportar
la carga.
Para el caso de cortes breves, menores de 10 segundos de duración, el CleanSource 750HD
UPS es más confiable que un UPS de doble conversión ya que presenta un 80% menos de
probabilidad de falla. EPRI reporta que el 96% de todas las fallas de energía corresponden a
este escenario, lo que significa que este tipo de fallas de energía se da con una frecuencia 25
veces mayor que los cortes prolongados, esto hace que las instalaciones críticas estén más
expuestas a fallar para este tipo de corte de energía comercial. Esto le da relevancia a la rata
de fallas para interrupciones breves de la energía comercial.
En los UPS de doble conversión con baterías el modo de falla más probable es debido a
las fallas no detectables de las baterías. Se ha comprobado que la detección de celdas con
problemas, en un sistema de baterías que fallarán en el próximo evento de corte, es de
extrema dificultad. El sistema CleanSource 750HD UPS es de lejos el sistema más confiable,
aún partiendo de la suposición muy optimista de que se realicen pruebas mensuales de las
baterías y que éstas sean capaces de detectar el 99% de las fallas que pudieran presentarse
en alguna de las celdas. Estimados realistas del porcentaje de fallas de las baterías, que no
son detectables, resultarían en una clara ventaja para el CleanSource 750HD UPS.
El beneficio clave del sistema de almacenamiento de energía electromecánico del CleanSource
750HD UPS es que su dinámica hace muy improbable la falla de operación de este sistema.
El estado normal de operación del CleanSource 750HD UPS es con la volanta giratoria en
movimiento permanente almacenando energía cinética. Los cambios en los parámetros que
determinan el estado del sistema son inmediatos y suministran su buen o mal estado de
forma confiable e inmediata antes de que ocurra un corte de energía. De otro lado, un sistema
basado en baterías depende de un proceso electroquímico, que aún con el monitoreo y rutinas
de mantenimiento recomendado presentan condiciones de falla no detectables. Los estudios
de Mtech muestran que con el CleanSource 750HD UPS se reducen las probabilidades de
falla del sistema en más de un 99%, comparándolo con el sistema de UPS de doble conversión
con baterías.
La nueva opción del CleanSource 750HD UPS con tiempo extendido le adiciona un nuevo
elemento de confiabilidad al sistema. Esta solución provee un verdadero medio de “respaldo
al sistema de respaldo” de almacenamiento de energía; esta nueva característica reduce
significativamente el riesgo por una causa común de falla y ofrece una reducción significativa
en la probabilidad de falla ante el evento de un corte de energía comercial, ya sea que se trate
de un evento de breve duración o de duración prolongada.
18
© ® TM
2014 Active Power, Inc. All rights reserved.
WP-115
Appendix - Failure Scenario Cut Sets
Figure A1: Principales cut sets para ups de doble conversión y falla prolongada
19
Figure A2: Principales cut sets para ups de doble conversión y falla prolongada
20
Figure A3: Principales cut sets para ups de doble conversión y falla breve
21
Figure A4: Principales cut sets para el cleansource 750HD ups para falla breve
22
Figure A5: Principales cut sets para el cleansource 750HD ups con tiempo extendido y falla prolongada
23
Figure A6: Principales cut sets para el cleansource 750HD ups con tiempo extendido y falla breve
24
Descargar