UTILIZACIÓN DE REDES NEURONALES PARA LA GENERACIÓN DE ANALIZADORES VIRTUALES 1 Carlos Lago YPF S.A. Centro de Tecnología Aplicada C.C.Nro. 7, 1925 Ensenada, Pcia. de Buenos Aires, Argentina e-mail: [email protected] Carlos Ruiz 2 SOTEICA S.R.L. Alvarez Thomas 796, 3 C, 1427 Buenos Aires, Argentina e-mail: [email protected] INTRODUCCIÓN El modelado mediante el uso de redes neuronales ha demostrado ser una herramienta valiosa para obtener en forma rápida y precisa mediciones de calidad de productos en línea y ofrecer una alternativa de bajo costo a los analizadores de proceso reales o modelos matemáticos rigurosos. TÉCNICAS DE MODELADO En general, se pueden aplicar tres enfoques para la construcción de modelos que describan las relaciones causa - efecto en procesos industriales. Estos son: 1. modelos mecaniísticos, 2. regresiones lineales y no lineales 3. modelado del tipo “caja negra”. Modelos mecanísticos: Están basados en las leyes físicas, planteando balances de masa y energía en estado estacionario o transitorio y tienen la forma de ecuaciones diferenciales y algebraicas. Estos modelos, también llamados de “Primeros Principios” permiten calcular las salidas de un sistema, dado un determinado conjunto de entradas. Se trata de un enfoque riguroso, requiere un buen conocimiento del proceso que se está modelando y el desarrollo de modelos relativamente complejos. 1 Trabajo presentado al II Congreso de Ingeniería de Procesos del Mercosur (ENPROMER '99), Florianópolis, Brasil, Septiembre de 1999. 2 Autor a quien debe dirigirse la correspondencia 1 Regresiones Lineales y no Lineales: En este caso, el enfoque es ajustar datos experimentales de entrada - salida a modelos empíricos. Por modelo empírico se entiende aquel que tiene una estructura definida, pero la forma de la estructura del modelo no provee una relación fundamental de la física del proceso. En el modelado empírico hay que considerar que se requiere seleccionar una estructura interna del modelo y determinar los parámetros del mismo. Una vez que la estructura es establecida, los parámetros del modelo son determinados utilizando una estrategia que busca minimizar una adecuada función del error de predicción. Modelado del tipo “caja negra”: El caso anterior requiere que la estructura del modelo sea especificada previamente. En el modelado del tipo “caja negra”, como es el caso de las redes neuronales, se obtienen modelos de estructura libre. Acá la premisa es que un sistema interconectado en paralelo, de simples elementos de procesamiento puede aprender las interrelaciones complejas que existen entre un número suficientemente grande de entradas (causas) y salidas (efectos). Una vez entrenada (esto es, ajustada), una red neuronal puede predecir salidas para un conjunto de entradas que nunca antes habían sido vistas por la red durante el proceso de entrenamiento. REDES NEURONALES Una red neuronal es una estructura computacional capaz de representar las relaciones funcionales no lineales entre variables de entrada y salida. Como se mencionaba más arriba, las redes neuronales son modelos de estructura libre, pero existen diferentes configuraciones posibles para las mismas y pueden emplearse diversos algoritmos de entrenamiento. Las redes consisten, básicamente, de un determinado número de elementos de cálculo, llamados neuronas, las cuales pueden ser dispuestas en varias capas. La primer capa, es donde se alimentan las entradas. La última capa, es donde las salidas predichas son obtenidas. Pueden existir un dado número de capas entre estas dos, llamadas capas ocultas. Típicamente se ha encontrado que una sola capa oculta es suficiente para la mayoría de las aplicaciones. Cada neurona en la capa de entrada es conectada a todas las neuronas de la capa oculta y estas a su vez son conectadas a todas las neuronas de la capa de salida por medio de una cierta función matemátíca conocida como "función de transferencia". Existe un parámetro llamado “peso de la conexión” que está asociado con cada una de estas conexiones. También se emplea para las neuronas un corrimiento o bias sobre la salida, en las capas ocultas y de entrada. Las neuronas en la capa de entrada no están asociadas con cálculos. Ellas actúan como nodos de distribución y transfieren las entradas a la capa oculta. Las neuronas en las capas oculta y de salida realizan cálculos del siguiente tipo: 2 Si Ii es la entrada desde la neurona i-th en la capa previa, Wi es el peso asociado con esta conexión particular y ? i es el bias, entonces la salida Oj, desde esta neurona en la capa de salida está dada por: Sj = ? (Wi Ii) + ? i (1) Oj = 1 / 1 + exp(-Sj) (2) En este caso se utilizó una relación sigmoidal para expresar la función de transferencia de la neurona, también podrían haberse usado otras funciones continuas como por ejemplo tangente hiperbólica. Esta es la función de transferencia de la neurona, acoplada con los pesos Wi y bias ? i, que le dan a la red neuronal la capacidad de representar un comportamiento funcional entre variables. Las entradas son alimentadas a la primer capa, las salidas de la última capa representan las salidas predichas de la red. La primer etapa en la modelización con redes neuronales es “entrenar” la misma. Durante este entrenamiento la red “aprende” adaptando los factores de peso en función de las muestras dadas en este set de datos. El aprendizaje o entrenamiento puede llevarse a cabo por diferentes medios, como ser los algoritmos de “backpropagation” (BPN) y del gradiente conjugado. Por lo general, estos algoritmos modifican los factores de peso de la red y los biases, tratando de minimizar una función del error de predicción. En la Figura 1 se muestra en forma esquemática la estructura de una neurona constituyente de la red. I1 W1 I2 W2 W3 I3 Sj ? Ii W i + B j Wn In Bj Figura 1 3 Oj f En la Figura 2 se muestra esquemáticamente la estructura de la red neuronal, indicando las capas de neuronas de entrada, ocultas y de salida. Salidas Entradas . . . . . . . . . . . . . . . . . . . . . . . . . . . Neuronas de Entrada Neuronas Ocultas Neuronas de Salida Figura 2 POR QUÉ EMPLEARLAS? Las Refinerías de Petróleo e Industrias Petroquímicas utilizan analizadores en línea en las corrientes importantes de planta, proveyendo datos para monitoreo y operación segura y óptima de las Unidades de Proceso. Estos analizadores son costosos, tanto desde su adquisición inicial como así también desde el punto de vista de mantenimiento. Además su confiabilidad es moderada o incluso baja en algunos casos. La mayoría de las aplicaciones de Control Avanzado y Optimización en Línea utilizan datos de calidad en sus modelos. En varias referencias de la literatura se encuentra mención a que los analizadores virtuales, generados mediante el uso de redes neuronales resultan mas confiables que los reales y pueden llegar a reemplazarlos con la consiguiente reducción en los costos de capital y de mantenimiento. CARACTERÍSTICAS Las redes neuronales extienden el análisis de regresión a casos donde el modelo no es conocido a priori. La forma adecuada del modelo es determinada automáticamente. Se requiere un conocimiento básico del proceso para seleccionar la estructura adecuada de entrada - salida pero: No se necesitan ni reglas ni ecuaciones. El usuario especifica las relaciones causa/efecto suministrando datos de comportamiento. Encuentra las soluciones que están implícitas en los datos: Diagnósticos en un dispositivo. Mejor condición operativa. 4 La ejecución en tiempo real es mucho mas rápida que su equivalente basado en modelos de primeros principios. CASO DE ESTUDIO Con el objetivo de evaluar la tecnología de redes neuronales, la empresa SOTEICA S.R.L. realizó un trabajo de modelado para la inferencia de la temperatura del 90 % de Destilación de la Nafta de la Unidad de Cracking Catalítico “A” de la Refinería La Plata de YPF S.A. Para ello utilizó el producto de software “NeurOnline Studio” de la firma Gensym. Los datos de planta se obtuvieron del PI Plant Historian (Excel Data Link). Inicialmente se recolectó información de 63 variables de procesos pertenecientes al período Junio-Octubre de 1998. El número de variables utilizado para el modelo inicial de la red fue de 29 pero finalmente pudo reducirse a 18 sin perder mucha fidelidad en la predicción. VARIABLES SELECCIONADAS Las siguientes variables de proceso, son las que se utilizaron para la modelización del Analizador Virtual: 1 2 3 4 5 6 7 8 9 10 Tag AI3302 FC180 FC181 FI182 FI235 FI880 FIC128 FIC183 FIC191 FIC193 Descripción MAX. NAFTA Nafta Pes . Quenc h Ris B Nafta Pes . Quenc h Ris A GOD A TK CARGA A PLANTA NAFTA A GASC VAP STRIP RX RECIC SLURRY SLUR A C403A SLUR A C403B Unidades C M3/H M3/H M3/H M3/H M3/H TN/H M3/H M3/H M3/H 11 12 13 14 15 16 17 18 19 20 Tag FIC242 FIC261 FIC264 FIC414 FIC592 FIC644 FIC679 FIC72 FIC854 FIC859 Descripción REFL INT GO P GOL A TK REFLUJO E401 VAP NOR CA2B Q GOL A SEC SLUR A C465A GOP A C-468 VAP EME CA2A CAUDAL 1 ET GOL A C-462 U nidades M3/H M3/H M3/H TN/H M3/H M3/H M3/H TN/H NM3/H M3/H 5 21 22 23 24 25 26 27 28 29 Tag FIC 863 P114 PI214 PIC291 TI208 TI313 TIC 116 TIC 130 TIC 206 Descripción SLUR A C 465B Pres Reactor P MEDIO E401 PRESION F405 GOL D E E-401 NAFTA A F405 Temp.Riser A T Riser B T CAB EZ E401 Unidades M3/H KG/CM2 KG/CM2 KG/CM2 C C C C C Los set points y salidas a válvulas no fueron utilizados, sino que se inspeccionaron durante la fase de análisis de datos. Algunas variables recolectadas fueron descartadas por estar fuera de rango o por mal funcionamiento de ciertos instrumentos. PERÍODO DE ENTRENAMIENTO SELECCIONADO De los 3 meses de datos recolectados, se seleccionó un período de 8 días para cubrir un rango adecuado de entrenamiento para el punto de destilación del 90 % (180 - 190 °C) Se configuraron 2 conjuntos de datos: Entrenamiento Validación El set de datos de entrenamiento fue depurado de datos no válidos o de períodos de inestabilidad (por ejemplo, período de inestabilidad en la presión de la fraccionadora o cualquier otra condición alejada de la correspondiente operación normal de la unidad de procesos). PREDICCIONES DEL MODELO VS. DATOS REALES 6 BENEFICIOS Medición en tiempo real de calidad de producto, emisiones y otra información importante para control y toma de decisiones. Mejorada calidad y rendimiento debido al control en tiempo real (no tiene los tiempos muertos asociados a resultados de laboratorio y Analizadores en línea reales). Reducida variabilidad durante la operación normal. Mas rápida estabilización después de cambios operacionales. Reducción en carga de trabajo del personal debido a una menor dependencia en muestreos periódicos del Laboratorio. Reducción en costos de capital y mantenimiento en Analizadores de Procesos. CONCLUSIONES Los paquetes de software comerciales, como el NeurOn-Line Studio, simplifican mucho el problema de definición y entrenamiento de la red. La obtención de un conjunto de datos apropiados para entrenamiento es la clave en un ambiente industrial debido a : Problemas operativos y ruido de procesos. Eliminación de datos no representativos (Ej. transitorios). Datos con suficiente riqueza para cubrir el espectro operativo. El conocimiento real de las operaciones es importante: Qué variables se espera que influencien el Objetivo. Dinámicas presentes en el proceso. El modelo debe ser tan simple como sea posible para reducir su dependencia de variables en falla. REFERENCIAS “Improve control with software monitoring technologies” P. B. Deshpande - S. Yerrapragada and E.F. Jacob, Hydrocarbon Processing - September 1996. “Neural Network model predicts naphtha cut point” Issam Wadi, Oil & Gas Journal Nov. 25 - 1996. “Artificial Intelligence: Starting to Realize Its Practical Promise” E. Crowe - C. Vassiliadis, Chemical Engineering Progress - January 1995. “Consider neural networks for process identification” S. Ramasamy - P. B. Deshpande - G.E. Paxton - R.P. Hajare, Hydrocarbon Processing - June - 1995. 7