SOBRE DMC (DYNAMIC MATRIX CONTROL): REVISIÓN DE UN CASO DE ESTUDIO PARA EVALUACIÓN DE PARÁMETROS (ON DMC: REVIEW OF A CASE STUDY FOR EVALUATION OF PARAMETERS) Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 Recibido: 24/11/2014 Aprobado: 12/05/2015 Luis Parraguez Universidad de Oriente, Barcelona, Venezuela [email protected] José Eduardo Rengel Universidad de Oriente, Barcelona, Venezuela [email protected] RESUMEN En este trabajo se estudian los efectos producidos por la variación de los diferentes parámetros que forman el Control Dinámico Matricial (DMC = Dynamic Matrix Control), en un sistema TITO (Two Input Two Output) con restricciones (caso de estudio). Aunque existe abundante literatura sobre el tema, algunos aspectos, especialmente relacionados con la entonación de los parámetros, todavía representan retos susceptibles de mejoras. Este estudio, llevado a cabo en forma de revisión, presenta los resultados de 819 pruebas diferentes realizadas mediante simulación indicando algunas de las fortalezas y debilidades del DMC para su aplicación en entornos industriales. Palabras claves: Control dinámico matricial, Sistema TITO, Restricciones. ABSTRACT In this work the effects of the variation of the different parameters forming the Dynamic Matrix Control (DMC) in a TITO (Two Input Two Output) system with restrictions (case study) are studied. Although there is abundant literature on the subject, some aspects, especially related to the parameters tuning, still pose challenges susceptible of improvement. This study, conducted in the form of review, presents the results of 819 different tests carried out by simulation indicating some of the strengths and weaknesses of DMC for use in industrial environments. Key-words: Dynamic Matrix Control, TITO system, Restrictions. INTRODUCCIÓN El DMC fue desarrollado hacia finales de la década del 70 del siglo pasado, por Prett, Ramaker y Cutler [1] y hasta el presente es el algoritmo del Control Predictivo Basado en Modelos de mayor aceptación en el control de procesos industriales [2], especialmente en 2 Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 la industria petroquímica [3]. Se caracteriza, aunque no de forma exclusiva, por la incorporación, dentro del algoritmo, de un modelo del proceso a controlar. El objetivo de este estudio es verificar los efectos de los diferentes parámetros del algoritmo de control en el comportamiento del sistema controlado y para tal efecto, los mismos fueron variados de forma sistemática y planificada, sin considerar la incorporación de los modelos de perturbación. CONTROL DINÁMICO MATRICIAL Modelo del Proceso El modelo del proceso empleado por DMC es la respuesta al escalón. Dado un sistema lineal invariante en el tiempo de una entrada y una salida (SISO = Single Input Single Output), los cambios en la salida, para un cambio Δu en la entrada, estarán dados por 0, g1, g 2, , g N , g N+1 , , y la misma, estable después de N tiempos de muestreo, estará dada por: N yk = g i Δu k i (1) i =1 Modelo de Predicción El modelo de predicción, sin considerar el efecto de las perturbaciones (o asumiendo éstas constantes), en un instante k para la salida hasta el instante k+p, bajo el efecto de m acciones de control, está caracterizado por: yˆ = G u + f donde ˆy = ˆyk + 1 | k , ˆyk + 2 | k ,, ˆyk + p | k T (2) es el vector p-dimensional de salidas estimadas, Δu = Δu k , Δu k + 1,, Δu k + m 1T el vector m-dimensional de incrementos de control, f = f k + 1 | k , f k + 2 | k ,, f k + p | k T el vector p-dimesional de la respuesta libre y G la matriz dinámica del sistema (p,m) representada por: g1 g 2 G gm g p 3 0 g1 g p 1 g1 g p m+1 0 0 (3) La ecuación (2) relaciona las salidas futuras del sistema con los incrementos del control, de tal suerte que será empleada para calcular las acciones necesarias en busca de alcanzar un comportamiento específico del sistema. Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 Algoritmo de Control El éxito del DMC en el campo industrial radica fundamentalmente en la aplicación relativamente simple a los casos MIMO (Multiple Input Multiple Output) con restricciones. En virtud de desarrollar esta línea se comienza por abordar, en esta subsección, un sistema SISO sin restricciones, el que posteriormente se extiende al caso MIMO con restricciones. El objetivo del DMC es llevar la salida del sistema lo más cercano posible de la referencia, en la perspectiva de errores cuadráticos mínimos, con la posibilidad de incluir una penalización sobre el esfuerzo de control. Por tanto, las variables manipuladas son seleccionadas para minimizar un objetivo cuadrático que puede considerar solamente los errores futuros: θ j ˆy k + j| k w k + j 2 p J= (4) j =1 o incorporar el esfuerzo de control J= θ j ˆy k + j|k w k + j 2 + j jΔu k + j1 2 p m j=1 j=1 (5) donde p es el horizonte de predicción, m el horizonte de control, w la referencia y θi, λi escalares no negativos que penalizan el error y el esfuerzo de control, respectivamente. Así, estos últimos constituyen parámetros de sintonización del controlador. La función de costo dada en la ecuación (5) es más común en el Control Predictivo Generalizado (GPC = Generalized Predictive Control) [4], y en el DMC se emplea generalmente con penalizaciones unitaria del error y constante a lo largo del horizonte de control, tal como: J= 2 2 ˆy k + j|k w k + j + jΔu k + j1 p m j=1 j=1 (6) Dado que la diferencia entre la salida estimada a futuro y la referencia es una medida del error futuro, ek + j = ˆyk + j | k w k + j se puede plantear: 4 (7) J= p m j=1 j=1 2 2 ek + j + λu k + j (8) Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 y haciendo: p 2 ek + j = e T e j=1 m (9) λu k + j u Λu 2 T j=1 Entonces, la función de costo se expresa como: J = e T e + u T Λu (10) Si no existen restricciones y GT ΘG + Λ es no singular, entonces la minimización de la función de costo da (ver [2], [5-9]) Λu = G T ΘG + 1 G T Θw f (11) donde y Λ son las matrices diagonales de penalización del error y el control, respectivamente. A cada instante de tiempo k se implementa el siguiente movimiento de control, Δu = d T w k fˆ k | k (12) donde: d T = 1 0 0 0 G T ΘG + Λ 1 GTΘ (13) Debido a que en todas las estrategias de control predictivo sólo el primer elemento del vector es enviado a la planta. Incorporación de Restricciones Las restricciones impuestas a un sistema limitan su zona de operación permisible. El objetivo del control predictivo con restricciones es alcanzar un punto de operación, que satisfaciendo las limitaciones, pueda permanecer "suficientemente cerca" de los límites, de manera estable y segura. 5 Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 Aunque algunos de los parámetros del DMC, tales como el período de muestreo, los horizontes de predicción y control, los coeficientes de ponderación, modelado y corrección, pudieran ser considerados restricciones, en esta parte del desarrollo el objetivo es centrarse en las llamadas "restricciones duras", es decir aquellas que bajo ninguna circunstancia pueden ser violadas. En este grupo se catalogan las restricciones a las magnitudes de las señales de entrada y salida, cota superior del incremento de control y velocidad de cambio de la acción de control. En el caso del DMC moderno [2] generalmente, pero no de forma exclusiva, se consideran: 1) Restricción en la magnitud de la señal de entrada u min u min u k u max Δu k + u k 1 u max (14) que se puede expresar como: u max u k 1( M ,1 ) I( M ,M ) u k u k 1 u min ( M ,1 ) I( M ,M ) (15) donde I es la matriz identidad. 2) Restricción al incremento de la señal de entrada Δu min Δu k Δu max (16) 3) Restricción a la velocidad de cambio en la señal de entrada v min Δu k Δu k 1 v max (17) 4) Restricción de sobrepico de la señal de salida ˆyk w k (18) 5) Restricción en la magnitud de la señal de salida y min 6 ˆyk y max (19) Como se aprecia, todas las restricciones son una función de Λu , por tanto, pueden expresarse en la forma de una inecuación matricial Au b , donde A y b son conocidos Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 en el tiempo k y contienen las expresiones de las restricciones activas, I M, M I M, M I M, M I M, M I M, M u k M ,1 I M, M G P, M G P, M G P, M Z , M u max u k 1M ,1 u min + u k 1M ,1 Δu max M,1 Δu max M,1 v max M,1 v min M,1 w k f k P,1 y max f k P,1 y min f k P,1 Z ,1 (20) donde Z es la cantidad de inecuaciones activas. A partir de la expresión para la función de costo, pero incorporando la penalización del error futuro, se puede expresar como sigue: JΔu = G Δu + f w T ΘG Δu + f w + Δu T ΛΔu (21) haciendo e f = f w , la diferencia entre la respuesta libre y la referencia suavizada, se obtiene: JΔu = G Δu + e f T ΘG Δu + e f + Δu T ΛΔu (22) que también se puede expresar como: JΔu Δu T G T ΘG + Λ Δu + Δu T G T Θe f + Δu T T G Θe f T + e Tf Θe f (23) que se corresponde con la forma estándar de expresar un problema de Programación Cuadrática, sometido a restricciones con estructura de inecuaciones: 7 min Jx = x T Hx + 2x T q + Jo Ax b Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 s.a. (24) x min x x max con x u , H = G T ΘG + Λ , q = G T Θe f , Jo = e Tf Θe f y las restricciones expresadas en la inecuación (20). Los problemas de optimización sometidos a restricciones agregan un nivel de dificultad adicional frente a los cuales se han presentado un abanico de propuestas [10]. Otro trabajo muy completo y extenso sobre optimización con restricciones, se encuentra en [11]. De cualquier manera, la optimización bajo restricciones no es un problema trivial, lo que ciertamente impone tareas más dificultosas comparadas con otros tipos de controladores clásicos. La situación, bajo algunas condiciones, se complica cuando el algoritmo de optimización no encuentra una solución en el espacio de variables acotado por las restricciones, caso conocido como "inalcanzable" (ver casos de estudio). La solución óptima es inalcanzable en el estado permanente cuando se ha definido un objetivo inalcanzable y esto es fácilmente resuelto en la fase de diseño. En régimen transitorio, aun cuando las restricciones sean razonables, pueden presentarse condiciones de inalcanzabilidad frente a perturbaciones, grandes cambios en la referencia o modificaciones "en-línea" de los límites de las variables operacionales, donde la energía de control acotada por las restricciones no es suficiente para llevar al sistema nuevamente a la zona permitida de operación. Algunas soluciones han sido propuestas y clasificadas para tratar con este tipo de dificultades [5]: 1) 2) 3) 4) Desconectar el controlador. Eliminación de restricciones. Relajación de restricciones. Cambiar los horizontes de las restricciones. Extensión al Caso Multivariable Para el caso de sistemas MIMO, se realiza una extensión del esquema SISO, donde se conserva el concepto, y las matrices y vectores deben ser adecuadamente dimensionados. Basado en la linealidad del modelo de predicción, puede aplicarse el principio de superposición para predecir las salidas futuras producidas por las diferentes entradas al sistema. El vector de salidas estará dado ahora por: 8 ˆ Y ˆy1 k + 1 | k , , yˆ 1 k + p 2 | k , , ˆy ny k + 1 | k , , ˆy ny k + p ny | k T (25) Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 el arreglo de señales de control futuras por: Δu1k ,, Δu1k + m1 1,, Δu nu k ,, Δu nu k + mnu 1T (26) f1k + 1 | k ,, f1k + p1 | k ,, f ny k + 1 | k ,, f ny k + p ny | k T (27) Δu y la respuesta libre por: F La matriz dinámica del sistema será ahora, G11 G 21 G G ny1 G1nu G 2nu G ny2 G nynu G12 G 22 (28) donde cada matriz Gij contiene los coeficientes de la i-ésima respuesta correspondientes al j-ésimo escalón de entrada. El objetivo del DMC multivariable es calcular las acciones de control futuras a lo largo del horizonte de control (M), es decir, determinar las secuencias u j k + i para j = 1 n e i = 1 M , donde n es el número de señales manipuladas, en el sentido que minimice la función de costo dada por, J q p ˆ k + j | k w k + j 2 + θ j y l =1j =1 n m 2 λ j Δu k + j 1 i =1j =1 (29) donde q es el número de salidas del sistema. La expresión anterior puede escribirse de forma compacta, de manera análoga a la obtención de la función de costo para el caso SISO, como: J = e GΔΔT ΘΘ T e GΔΔ + Δu T Λ T ΛΔu Para el caso sin restricciones la solución exacta está dada por [12]: 9 (30) Δu = G T Θ T ΘG + Λ T Λ 1 G TΘTΘ e (31) Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 CASO DE ESTUDIO El modelo del sistema MIMO, tomado de [13]: e s h 1 s v es 1 s 1 2 s 1 1 0.5 s q Pa 0 .2 s 1 0.5 s 1 2 s (32) representa un modelo simplificado de una máquina productora de papel, donde h es la altura de la pasta en el depósito (en m), v es la velocidad de salida del papel (en m/s), q es el flujo de pasta entrando a la caja contenedora de la máquina (en kg/s) y Pa es la presión de aire (en altura equivalente, m). Para diseñar el controlador DMC se obtiene el modelo de respuesta al escalón unitario, empleando un tiempo de muestreo Ts 0.5 s , como se muestra en la Figura 1. Para la reproducción de los resultados se desarrollaron una serie de programas en GNU Octave. La versión desarrollada incorpora la penalización del error y el esfuerzo de control. Pruebas y Resultados 1. Efecto combinado de los horizontes de predicción (P) y control (M) El Horizonte de Predicción debe ser suficientemente grande como para describir la dinámica del proceso, pero sin exceder el rango de la estabilización ya que sólo incrementará la carga computacional sin proporcionar información adicional relevante. Además, el Horizonte de Control debe ser menor que el de predicción ya que si bien obtiene una serie de acciones de control futuras, en principio sólo se aplicará a la planta el primer valor del vector solución. Para estudiar el efecto de estos parámetros, en la respuesta del sistema controlado, se realizaron 819 pruebas con valores en los rangos: P=[2,N-1] y M=[1,P], empleando como índice de evaluación el criterio de la integral del error cuadrado. El esfuerzo de control, la penalización del error y el factor de alisamiento se mantuvieron constantes con valores λ=1,0, θ=1,0 y α=0,0, respectivamente. Algunos resultados se muestran en la Tabla 1. 10 Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 Figura 1. Respuesta al escalón unitario Tabla 1. Efectos combinados de los horizontes de predicción y control. P M ISE1 ISE2 8 8 … 40 39 … 9 8 … 4 3 … 3 3 … 1 1 … 1,455696 1,479778 … 1,415282 1,415712 … 2,204307 2,164539 … 2,999703 2,978734 … 3,148128 3,147351 … 2,640025 2,645897 … ISE1 = Integral Square Error (para la altura); ISE2 = Integral Square Error (para la velocidad) Se observa que los errores mínimos se logran cuando [P=40,M=3], para ISE1 y [P=9,M=1], para ISE2. Si se asume como criterio único el efecto combinado de ambas integrales, entonces el mejor punto es [P=8, M=4]. Resulta evidente que un horizonte de predicción grande no mejora la calidad de la respuesta del controlador, produciendo un aumento notable de la carga computacional. Además, como no se están considerando restricciones, la mejores combinaciones ocurren con horizontes de control pequeños, resolviendo el problema de control, en algunos casos, con una visión de un solo paso hacia adelante. 11 Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 2. Efectos del factor de alisamiento de la referencia La Figura 2 muestra el resultado de la prueba al variar el factor de alisamiento desde α1,2=0,0 (referencia sin suavización) hasta α 1,2=0,9. Para el caso del controlador propuesto, los horizontes de predicción y control, el esfuerzo de control y la penalización del error se mantuvieron constantes con P=8, M=4, λ1,2=1,0 y 1,2=1,0, respectivamente. Se observa que en la medida que se agranda el factor de alisamiento la respuesta es más suave y menor el esfuerzo de control. Figura 2. Efectos del factor de alisamiento de la referencia 12 Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 3. Efectos de la penalización del esfuerzo de control La Figura 3 muestra el resultado de la prueba al variar la penalización del esfuerzo de control desde λ1,2=10 a λ1,2=0. El factor de suavización de la referencia y la penalización del error se mantuvieron constantes con α 1,2=0,0 y 1,2=1,0, respectivamente. Se observa que valores pequeños de λ hacen que aumente la acción de control, con lo cual la respuesta del sistema es más rápida. En el límite, cuando λ=0, se alcanza un controlador de "tiempo mínimo" (deadbeat). Figura 3. Efectos del factor de penalización del control 13 Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 4. Efectos de la penalización del error La Figura 4 muestra el resultado de la prueba al variar la penalización del error desde 1,2=10 a 1,2=0,1. El factor de suavización de la referencia y la penalización del esfuerzo de control se mantuvieron constantes con α 1,2=0,0 y λ1,2=1,0, respectivamente. Se observa que valores pequeños de hacen que disminuya la importancia del error en la función objetivo, produciendo una acción de control menor, con lo cual la respuesta del sistema es más lenta. Figura 4. Efectos del factor de penalización del error 14 5. Con restricciones Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 En los ejemplos anteriores las señales, tanto de entrada como de salida, se manejaron sin restricciones. En la práctica, esto no es muy real dado que todos los sistemas están sujetos a limitaciones. a. Restricción en la magnitud de la señal de entrada Una primera aproximación a la solución del problema puede consistir en calcular la acción de control óptima u(k), como si el sistema no tuviese restricciones. Luego, si u(k) viola alguna restricción, esta es saturada al límite, ya sea por el programa de control o por el actuador mismo. Esta forma de operar garantiza el cumplimiento instantáneo de la restricción, pero obvia por completo el problema futuro para las siguientes acciones de control y de la evolución del sistema. De otra manera, el caso puede abordarse como un problema de Programación Cuadrática sometido a restricciones. Pequeñas modificaciones en los programas de simulación permiten incorporar tanto restricciones por software, como programación cuadrática mediante la función qp() de Octave. Se fijaron como restricciones qlim=[0,0, 1,25] y Palim=[0,0 ,0,25]. Los resultados pueden observarse en la Figura 5. En la Figura 5 se aprecia claramente el cumplimiento de las restricciones y, además, no muestra diferencias apreciables, tanto en la salida como en la acción de control, cuando se emplea Programación Cuadrática en lugar de saturación por software. Sin embargo, todavía persiste un movimiento brusco del actuador justo en los momentos de cambio de la referencia. b. Restricción al incremento de la señal de entrada El movimiento brusco del actuador puede evitarse limitando el paso máximo de su desplazamiento en cualquier dirección al imponer restricciones al cambio o incremento de la señal de control. Para este caso, y de forma mucho más sencilla, las inecuaciones de la restricción se expresan como las cotas directas del problema de minimización. La Figura 6 muestra los resultados cuando se ha limitado el paso a un 10%. c. Restricción en la magnitud de la señal de salida La garantía de una adecuada operación del sistema, en los límites de un punto de trabajo, debe considerar también restricciones a la magnitud de la señal de salida. Para esta prueba se fijaron como referencias href =1,0, vref =1,0 y restricciones hlim =[0.0, 0,9] y vlim =[0,0, 0,6]. Los resultados pueden observarse en la Figura 7, Aquí se observa claramente el cumplimiento de las restricciones cuando se emplea Programación Cuadrática. Por otra parte, el algoritmo de software no cumple temporalmente con los requerimientos para la velocidad del papel. Esta situación no es siempre cierta, pequeñas 15 variaciones en los rangos pueden conducir a resultados completamente distintos. Un cambio en las restricciones de la velocidad vlim =[0,0, 0,7] hace que el algoritmo QP “se apague” debido a un problema de inalcanzabiblidad, Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 Figura 5. Restricción en la amplitud de la señal de control . 16 Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 Figura 6. Restricción al cambio de la señal de control 17 Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 Figura 7. Restricción a la magnitud de la señal de salida 18 Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 CONCLUSIONES Los resultados mostrados confirman, en general, el buen desempeño de DMC para el control de sistemas MIMO sometido a restricciones. No obstante, aún quedan posibilidades de trabajos futuros, tanto en el campo de la optimización con la evaluación de otras técnicas (heurísticas por ejemplo), como en la evaluación de otras particularidades de los sistemas de control industriales (robustez, manejo de perturbaciones medibles, etc.). REFERENCIAS BIBLIOGRÁFICAS [1] Prett D., Ramaker B. and Cutler C. (1979). Dynamic Matrix Control Method. United State Patent. [2] Cang D. B. (2010). Modern Predictive control. USA. CRC Press. [3] Kano M. and Ogawa M. (2010). The State of the Art in Chemical Process Control in Japan: Good Practice and Questionnaire Survey. Journal of Process Control. Vol. 20, Issue 9 (Pp. 969-982). [4] Clarke D., Mohtadi C. and Tuffs P. (1987). Generalized Predictive Control - Part. I.The Basic Algorithm. Automatica, Vol. 23, No. 2 (Pp. 137-148). [5] Camacho E. and Verlag. [6] Siouris G. (1996). An Engineering Approach to Optimal Control and Estimation Theory. USA. Wiley Interscience. [7] Snyman J. (2005). Practical Mathematical Optimization: An Introduction to Basic Optimization Theory and Classical and New Gradient-Based Algorithms. USA. Springer. [8] Kokate R. and Waghmare L.. (2011). Review of Tuning Methods of DMC and Performance Evaluation with PID Algorithms on a FOPDT Model. International Journal of Control and Automation. Vol. 4, No. 2, (Pp. 95-110). [9] Hurowitz S. (1998). Superfractionator Process Control. Ph.D. Dissertation. Chemical Engineering. Texas Tech University. USA. Bordons C. (2004). Model Predicitve Control. USA. Springer- [10] Fletcher R. (1981). Practical Methods of Optimization. Constrained Optimization. USA. John Wiley & Sons, Inc. 19 Revista Ingeniería al Día. ISSN: 2389 - 7309. Volumen 1 Edición No 2. Julio – Diciembre del 2015 [11] Gill P. and Murray W. (1974). Numerical Methods for Constrained Optimization. USA. Academic Press. [12] Shridhar R. and Cooper D. (1998). A Tuning Strategy for Unconstrained Multivariable Model Predictive Control. Industrial & Engineering Chemistry Research Journal. Vol. 37, No. 10 (Pp. 4003-4016). [13] Albertos P. and Sala A. (2004). Multivariable Control Systems: An Engineering Approach. USA. Springer-Verlag. 20