Análisis de la Estabilidad según Lyapunov de un Control Borroso en Tiempo Discreto M. Garcı́a, A. Barreiro Departamento de Ingenierı́a de Sistemas y Automática Escuela Superior de Ingenieros Industriales y de Minas Campus Universitario Lagoas-Marcosende, 36200, Vigo, España E-mail: [email protected] Resumen Este artı́culo estudia la estabilidad y robustez de sistemas de control borroso en tiempo discreto. Partiendo de un sistema continuo, ahora muestreado con un computador digital, se analiza su estabilidad mediante la teorı́a de Lyapunov. También se proporciona una medida de la estabilidad del sistema en forma de margen de ganancia. Finalmente, estos conceptos se ilustran con un servomotor como ejemplo. Palabras clave: Control borroso, teorı́a de la estabilidad de Lyapunov, control en tiempo discreto. 1 Introducción En la década de los 50 aparecieron los primeros sistemas controlados por computador [1]. Al comienzo su uso era muy limitado debido a su alto coste, gran consumo y poca fiabilidad. En los años 90, el desarrollo del microprocesador produjo que el control digital se aplicara extensamente en la industria. Por lo tanto, es muy interesante estudiar el compartamiento de un sistema continuo cuando se le aplica un muestreo con un computador. La principal caracterı́stica de la lógica borrosa [2] es su gran adaptación al tratamiento del conocimiento heurı́stico, formulado mediante reglas lingüı́sticas cualitativas. Básicamente, proporciona un método efectivo para capturar la naturaleza aproximada, inexacta e incompleta del mundo real. Sin embargo, a diferencia de lo que ocurre con los controladores tradicionales, no existe un método sistemático de diseño de controladores borrosos, ni herramientas apropiadas para tratar el problema de la estabilidad. La estabilidad de Lyapunov está relacionada con el comportamiento de las trayectorias de un sistema, cuando su estado inicial se encuentra cerca de un equilibrio. Desde el punto de vista práctico este punto es importante, ya que las perturbaciones que afectan a un sistema tienden a separarlo del equilibrio. Dentro del organigrama general de las diversas teorı́as de estabilidad, la de Lyapunov se engloba en aquella área que trata con las variables de estado del sistema, y por tanto, tiene que ver con la representación interna de los sistemas. En [4, 5, 6] se encuentran estudios completos sobre esta teorı́a. El principal objetivo del estudio de la robustez, surge cuando controladores diseñados para ser estabilizates de la planta nominal, producen acciones desestabilizadoras ante ciertas perturbaciones del modelo del sistema, y por consiguiente estos controladores no son utilizables en la práctica. La solución pasa por considerar expresamente la incertidumbre que afecta a la planta nominal. La formulación del problema que aborda este artı́culo parte en la sección 2 de un modelo nominal de la planta, con un controlador borroso diseñado para cumplir unos objetivos de prestaciones satisfactorios. Posteriormente, el control se realiza mediante muestreo con un computador digital. En la sección 3 se analiza la estabilidad de dicho sistema discreto mediante la teorı́a de Lyapunov, basándose en el método directo. En la sección 4 se desarrolla una metodologı́a para calcular el margen de robustez del control. Finalmente, todas estas ideas se aplican a un servomotor con un controlador borroso en la sección 5. 2 Definición del sistema Consideremos un sistema como el mostrado en la figura 1. La dinámica de la planta y el controlador está definida por: ẋ = f (x) + bKu = f (x) + bKH(x) = Ax + bKH(x) (1) donde x ∈ Rn es el estado de la planta, u ∈ R es la entrada controlada, f (x) ∈ Rn y b ∈ R representan la planta, y H(x) el controlador borroso. Al analizar el comportamiento de cualquier sistema fı́sico, podemos partir de un modelo aproximado lineal o modelo nominal de la planta, es decir, f (x) = Ax. Por lo tanto, podemos suponer la u x Planta Existen dos métodos de Lyapunov para el estudio de la estabilidad. El primero de ellos, también llamado indirecto, trabaja con las soluciones explı́citas de las ecuaciones diferenciales que describen el sistema. El segundo método, llamado directo, no necesita de dicha solución, por lo que es más general y se encuentra mucho más extendido. H (x ) Según Lyapunov, un sistema que posea un estado de equilibro en el origen, si existe una función escalar V (x) para el caso continuo o V (xk ) para el caso discreto, con derivas parciales continuas y que satisfaga las siguientes condiciones Figura 1: Sistema de control borroso. planta perturbada por una incertidumbre K ∈ R, que puede representar imprecisiones en el modelo o puede ser incluida para medir el margen de robustez. En el caso del margen de ganancia, K es una ganancia variable en torno al valor nominal 1. Aunque el sistema admita razonablemente un modelo lineal, el control no tiene por qué serlo. Por ejemplo, saturaciones y zonas muertas dan lugar a lazos de control no lineales. Esto es lo que sucede en el caso de los controladores borrosos, que son elementos no lineales por naturaleza [2]. El controlador ha sido diseñado sin tener en cuenta el muestreo de la planta, es decir, el sistema continuo original es estable y satisface ciertas especificaciones de control. El sistema muestreado con perı́odo h correspondiente a planta dada por la ecuación (1) es el siguiente [1]: xk+1 = Φxk + ΓKuk = Φxk + ΓKH(xk ), (2) donde Φ = Φ(h) = eAh , Z h Γ = Γ(h) = eAh b ds. 0 Deberá considerarse que el estado de equilibrio sea el origen. Si este no es el caso, siempre puede realizarse una traslación de coordenadas, de forma que el estado de equilibrio se desplace hasta el origen de coordenadas. 3 Estabilidad de Lyapunov Fue Lyapunov quien introdujo la idea de una función energı́a ficticia, denominada función de Lyapunov, aplicable a cualquier ecuación diferencial o en diferencias y tanto a sistemas lineales como a no lineales. En función del signo de la función de Lyapunov y de su derivada con respecto al tiempo, se pueden obtener conclusiones sobre el tipo de estabilidad de un estado de equilibrio. 1. V (x) o V (xk ) es definida positiva, y 2. V̇ (x) o V (xk+1 ) − V (x) es definida negativa, entonces el estado de equilibrio en el origen es uniforme y asintóticamente estable. Las definiciones anteriores dan condiciones necesarias y suficientes para sistemas lineales y condiciones sólo suficientes para sistemas no lineales, ya que en un sistema no lineal la estabilidad posee propiedades locales y no globales. Para sistemas definidos mediante la ecuación (2), utilizando funciones de Lyapunov cuadráticas, planta lineal o no lineal con su modelo aproximado f (xk ) = Axk , y controlador no lineal H(xk ), el segundo método de Lyapunov puede admitir una interpretación gráfica como la que se explica a continuación. Supuesta una función de Lyapunov cuadrática, V (xk ) = x0k P xk , con P real, simétrica y definida positiva, V (xk ) será una función de Lyapunov para el sistema considerado si V (xk ) > 0, que ya lo cumple, y si V (xk+1 ) − V (xk ) < 0. Desarrollando esta última expresión y la ecuación (2) obtenemos: V (xk+1 ) − V (xk ) = x0k+1 P xk+1 − x0k P xk = [Φxk + ΓKH(xk )]0 P [Φxk + ΓKH(xk )] − x0k P xk = x0k Φ0 P Φxk + x0k Φ0 P ΓKH(xk ) + ΓKH(xk )P Φxk + ΓKH(xk )P ΓKH(xk ) − x0 P x = x0k Φ0 P Φxk + 2ΓKP Φxk H(xk ) + Γ2 K 2 H 2 (xk )P − x0k P xk < 0 (3) Reorganizando la ecuación (3) según su dependencia del controlador borroro, el término X(xk ) es independiente, y el término Y (xk ) sı́ depende. Ası́ obtenemos: V (xk+1 ) − V (xk ) = −X(xk ) + Y (xk ) donde X(xk ) = −(x0k Φ0 P Φxk − x0k P xk ) = −x0k (Φ0 P Φ − P )xk = x0k (P − Φ0 P Φ)xk (4) e Y (xk ) Y (xk ), que da lugar a una curva; y por otra, la intersección de dicho plano con el cilindro unidad, que da lugar a una recta vertical. En la figura 3 se indican dichas intersecciones. = 2ΓKP Φxk H(xk ) +[ΓKH(xk )]2 P es decir, la superficie X(xk ) es una cota superior de la superficie Y (xk ) para cualquier valor de xk . A partir de aquı́ se proyectan los puntos de la curva de intersección sobre la recta vertical por medio de Y (xk )/ k xk k2 . Esto da lugar a un segmento para una dirección dada. Repitiendo el proceso para todas las direcciones entre 00 y 3600 , y mediante una representación equivalente a la mencionada en el párrafo anterior, se obtiene una banda plana que caracteriza totalmente a la superficie Y (xk ). Por lo tanto, si existe alguna P para la cual la curva, superficie o hipersuperficie Y (xk ) queda delimitada superiormente por X(xk ), entonces V (xk ) será función de Lyapunov y el estado de equilibrio estable. Denominando X n (θ) a la curva normalizada X(xk ), e Y n (θ) a la banda normalizada de Y (xk ), obtenidas como se ha indicado anteriormente, donde θ indica el ángulo que toma la dirección, la ecuacion (5) se transforma en El sistema para su estabilidad ha de cumplir que −X(xk ) + Y (xk ) < 0 o lo que es lo mismo X(xk ) > Y (xk ) (5) Si la dimensión del sistema es 2, X(xk ) e Y (xk ) serán superficies, por lo que para poder representar y comparar más fácilmente ambas gráficas, se ha optado por una representación plana de ambas superficies mediante el siguiente desarrollo. Supongamos que se realiza un cambio de escala en el dominio de entrada definido por λxk . Entonces la ecuación (4) se transforma en X(λxk ) X n (θ) > Y n (θ) Ambas gráficas se representan conjuntamente en la figura 4. Este tipo de representación es utilizado en la sección siguiente para verificar la estabilidad de un servomotor y su controlador borroso. X (xk) = λx0k (Φ0 P Φ − P )λxk = λ2 x0k (Φ0 P Φ − P )xk 2 = λ X(xk ) (7) θ=180º es decir, la superficie X(xk ) original se ve afectada por un cambio de escala λ2 , o lo que es lo mismo, la relación X(xk )/xk es igual a la relación X(λxk )/λ2 xk . Por lo tanto, toda la superficie X(xk ) se puede caracterizar eligiendo adecuadamente sólo una parte de ella. En particular, si se eligue un subconjunto del dominio de entrada tal que k xk k= 1, toda la superficie X(xk ) queda caracterizada por su intersección con el subconjunto elegido, que en este caso es el equivalente a un cilindro de radio unidad y origen el centro. Dicha intersección se muestra en la figura 2 y es una curva que rodea todo el cilindro, de forma que admite una representación plana, y en el eje de abscisas se representa la dirección del vector que apunta a cada uno de los puntos de la curva. Dicha dirección varı́a entre 00 y 3600 . El caso de la superficie Y (xk ) no es el mismo, ya que no cumple una relación similar a la de la ecuación (6). Lo que se hace entonces es proyectar todos los puntos de Y (xk ), que se encuentran en una dirección determinada, sobre el cilindro unidad. Es decir, existe una doble intersección: por una parte, la intersección del plano que determina la dirección especı́fica con la superficie θ=90º X (θ) n (6) x θ=270º θ=0º Figura 2: Obtención de X n (θ). θ=180º Y (θ) n Y (xk) θi θ=0º θ=270º Figura 3: Obtención de Y n (θ). Sumando ambas expresiones tenemos que X (θ) n x0k Φ0 (P + P̃ )Φxk + x0k Φ0 (P + P̃ )Γuk +u0k Γ0 (P + P̃ )Φxk + u0k Γ0 (P + P̃ )Γuk 0 −x0k (P + P̃ )xk < 0 Y (θ) n θi 0º 360º Figura 4: Representación conjunta de X n (θ) y Y n (θ). 4 Márgenes de robustez Teniendo en cuenta la sección anterior, buscaremos un método que permita calcular el margen de ganancia del sistema perturbado por una ganancia variable K. Por simplicidad volveremos a tratar un sistema de orden 2. Para que la matriz de Lyapunov correspondiente p1 p3 P = p3 p2 sea definida positiva, ha de cumplir que p1 > 0 y p1 p2 − p23 > 0 Teniendo en cuenta que si P es de Lyapunov ⇒ ⇒ λP también (8) se puede fijar p1 = 1, con lo que las condiciones anteriores se transforman en: p2 > 0 y |p3 | < √ p2 El primer paso para calcular el margen de ganancia es encontrar todas las posibles funciones de Lyapunov, es decir, todos los pares (p2 , p3 ) que cumplan la ecuación (7) para el valor nominal de la ganancia K. Se define entonces P K , como el conjunto de todas las matrices de Lyapunov representadas por los pares (p2 , p3 ) válidos para un determinado K de ganancia. Dicho conjunto posee las siguientes propiedades: • P K es convexo. Supongamos dos matrices P y P̃ que dan lugar a funciones de Lyapunov en (3), es decir: x0k Γ0 P Φxk + x0k Φ0 P Γuk +u0k Γ0 P Φxk también es una función de Lyapunov, por lo que la suma de dos matrices de Lyapunov, P + P̃ , da lugar a otra matriz de Lyapunov. Por otra parte, αP y (1 − α)P̃ , con 0 ≤ α ≤ 1, también son matrices de Lyapunov por (8), y como se acaba de comprobar, su suma, αP +(1−α)P̃ , es una matriz de Lyapunov. Esta última suma representa una combinación convexa, de forma que si P, P̃ ∈ P K , todos los puntos del segmento que une P con P̃ , también pertenenecen a P K , y son matrices de Lyapunov. • El conjunto de matrices de Lyapunov para todos los valores intermedios de la ganancia desde un mı́nimo hasta un máximo, P [Kmin Kmax ] , es igual a la intersección de los conjuntos de matrices de Lyapunov correspondientes a dichos valores mı́nimo y máximo de la ganancia, P Kmin ∩P Kmax . Dado que la ganancia multiplica a la entrada del sistema, u, la variación Kmin u ↔ Kmax u es monótona, y por tanto, para una cierta matriz P , basta verificar que es de Lyapunov en Kmin y en Kmax , para garantizar que lo es en todo el intervalo [Kmin Kmax ]. Teniendo en cuenta las propiedades anteriores, se calcula el conjunto P Kn correspondiente a la ganancia nominal Kn . A partir de aquı́ se aumenta progresivamente el valor de la ganancia y se determina el conjunto P K correspondiente. Mientras el conjunto intersección entre P Kn y P K no sea vacı́o se continúa con este proceso. Para un determinado valor de la ganancia, dicho conjunto intersección sólo estará formado por un elemento, que da lugar a una matriz que llamaremos Pm . El valor de K para dicha situación, Km , es el margen de ganancia. Para valores de K superiores al margen de ganancia, el conjunto intersección es vacı́o, y no existe ninguna combinación de (p2 , p3 ) que cumpla la condición de Lyapunov dada por (7). 5 Caso del servomotor La dinámica del servomotor utilizado en este ejemplo se rige por la siguiente expresión [3]: 0 1 0 ẋ = x+ u 0 −4 0.7 + u0k Γ0 P Γuk − x0k P xk < 0 x0k Φ0 P̃ Φxk + x0k Φ0 P̃ Γuk +u0k Γ0 P̃ Φxk + u0k Γ0 P̃ Γuk − x0k P̃ xk < 0. donde x1 corresponde a la posición, y x2 a la velocidad del motor. Las funciones de pertencia de los antecendentes y de los consecuentes del controlador de lógica borrosa son las indicadas en la N Z P -2 0 a) Z 2 N El conjunto P Kn calculado, es decir, los posibles (p2 , p3 ) que dan lugar a funciones de Lyapunov para el valor nominal Kn = 1, puede verse en la figura 6. Para el valor (0.2, 0.1), la figura 7 muestra como la curva X n (θ) acota superiormente la banda Y n (θ). P 0.4 0.35 0.3 0 b) NG NM NP Z 8 0.25 p3 -8 PP PM PG 0.2 0.15 0.1 0.05 -18 -12 -6 0 c) 6 12 18 Figura 5: Funciones de pertenencia para el servomotor: a) x1 ; b) x2 ; c) u. figura 5, y la base de reglas se representa en estructura tabular en la tabla 1. Al muestrear el sistema, por ejemplo, con un perı́odo de muestreo de h = 0.1s, la ecuación (2) del sistema discreto para el servomotor es 1 .0824 .0030 xk+1 = xk + uk 0 .6703 .0577 En primer lugar hay que caracterizar la estabilidad del equilibrio en el origen para el sistema nominal, es decir, compuesto por la planta sin perturbar o lo que es lo mismo con una K de valor nominal Kn = 1. Como hemos visto en la sección 3, la condición de estabilidad según Lyapunov se resume en la expresión (7), la cual para el sistema nominal sólo depende de la matriz P , puesto que el resto de los términos se encuentran perfectamente definidos. Es necesario por lo tanto, encontrar alguna matriz P que haga que se verifique tal expresión, para que el equilibrio en el origen sea estable. x1 \x2 N Z P N NP (u−1−1 ) NM (u0−1 ) NG (u1−1 ) Z PM (u−10 ) Z (u00 ) NM (u10 ) P PG (u−11 ) PM (u01 ) PP (u11 ) Tabla 1: Base de reglas para el servomotor. 0 0 0.1 0.2 0.3 p2 0.4 0.5 0.6 Figura 6: El conjunto RKn calculado. 0.15 0.1 0.05 0 −0.05 −0.1 −0.15 −0.2 0 1 2 3 4 5 6 7 Figura 7: X n (θ) acota superiormente la banda Y n (θ). Supuesto ahora que la ganancia variable K que perturba la planta se separa de su valor nominal, interesa conocer hasta qué valor puede llegar dicho alejamiento sin que el sistema deje de ser estable, es decir, queremos calcular el margen de ganancia. Teniendo en cuenta la interpretación de Lyapunov buscamos el margen de ganancia, que denotaremos por Km , correspondiente al máximo valor de K para el cual existe una matriz P , denominada Pm , que permita que se verifique la expresión (7). Además, para garantizar la estabilidad en todo el rango de valores de K entre el nominal y Km , la matriz Pm ha de ser tal que haga que se cumpla la ecuación (7) en todos los valores de dicho rango. El procedimiento a seguir para el cálculo del margen de ganancia es el indicado en la sección 3. Partiendo del conjunto P Kn , el valor nominal de K se aumenta en sucesivos incrementos y se determina el conjunto P K correspondiente. Este proceso continúa en tanto la intersección entre P Kn y P K no sea vacı́o. Para un determinado valor de ganancia, dicho conjunto intersección sólo estará formado por un elemento, que da lugar a una matriz que llamaremos Pm . El valor de K para dicha situación, Km , es el margen de ganancia. Por este procedimiento se consigue que la matriz Pm verifique las condiciones de Lyapunov. Para que el valor del margen de ganancia obtenido tenga una buena precisión, es necesario que los incrementos sucesivos de K sean lo suficientemente pequeños. Como se ve en la figura 8, la matriz de Luapunov correspondiente a los valores (0.14, 0.04) es matriz de Lyapunov para cualquier K, desde el nominal hasta el máximo. Finalmente, si repetimos este proceso variando el perı́odo de muestreo, buscando para cada h su Km , obtenemos la figura 9, que representa el margen de ganancia en función del perı́odo de muestreo. Para h = 0.1s, Km está muy cerca del valor obtenido para el caso continuo por [3], Km = 2.894. 0.4 0.4 0.3 0.3 K=1.25 0.2 0.1 0.1 0 0 0.2 0.4 0.6 0.4 0 0 0.2 0.4 0.6 0.6 0.2 K=2 0.4 K=1.75 0.1 0.2 0 0.2 0.4 0.6 0 0 0.2 0.4 0.6 0.8 1 Figura 8: P K para K igual a 1.25, 1.5, 1.75 y 2.0. 6 2.4 2.2 2 1.8 1.6 1.4 1.2 1 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 Figura 9: Valores ts y h para los cuales el sistema es estable. tidumbre es una ganancia variable, el margen de ganancia. Agradecimientos Este trabajo ha sido realizado dentro los proyectos DPI00-1218 y DPI02-4401 del M.C.Y.T. Referencias [2] D. Driankov, H. Hellendoorn, M. Reinfrank, (1993) An Introduction to Fuzzy Control, Springer-Verlag, Berlin. 1 0.8 0.3 0 2.6 [1] K. J. Åström, B. Wittenmark, (1997) Computer-Controlled Systems: Theory and Design, 3rd ed, Prentice-Hall, Inc, Englewood Cliffs, N. Y. K=1.5 0.2 2.8 Conclusiones En este artı́culo se ha desarrollado un procedimiento para el estudio de la estabilidad de un sistema discreto con control borroso. Hemos analizado la estabilidad del sistema nominal en ausencia de perturbaciones, para posteriormente obtener la variación máxima de la incertidumbre asociada a la planta perturbada, de forma que el sistema siga siendo estable. Dicha metodologı́a permite calcular los márgenes de robustez del sistema, y en particular, considerando que la incer- [3] A. Espada, (1996) Estabilidad y Robustez de Sistemas no Lineales de Control. Análisis y Diseño de Controladores Borrosos, Tesis Doctoral. Departamento de Ingenierı́a de Sistemas y Automática, Universidad de Vigo, España. [4] W. M. Haddad, D. S. Bernstein, (1993) “Explicit Construction of Quadratic Lyapunov Functions for the Small Gain, Positivity, Circle, and Popov Theorems and Their Application to Robust Stability Part I: ContinuousTime Theory”,Int. J. Robust and Nonlinear Control, Vol. 3, pp. 313-339. [5] J. E. Slotine, W. Li, (1991) Applied Nonlinear Control, Prentice-Hall, Inc, Englewood Cliffs, N. Y. [6] M. Vidyasagar, (1993) Nonlinear System Analysis, Prentice-Hall, Inc, Englewood Cliffs, N. Y.