U N E X P O UNIVERSIDAD NACIONAL EXPERIMENTAL POLITECNICA ANTONIO JOSE DE SUCRE VICE RECTORADO BARQUISIMETO DEPARTAMENTO DE INGENIERIA ELECTRONICA ANALISIS DE SISTEMAS LINEALES CONTINUOS EN EL ESPACIO DE ESTADO Francisco De La Cruz CAPITULO 6 DISEÑO DE SISTEMA USANDO REALIMENTACIÓN DE VARIABLES DE ESTADO EL3133 - SISTEMAS DE CONTROL II - Sección 01 Eulogio T. Pérez Ramos Marzo - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 6.0 2 Introducción La realimentación de la salida de un sistema y de sus derivadas no siempre es la mejor solución para corregir problemas de estabilidad o proporcionar al sistema ciertas características en su funcionamiento. Ese tipo de realimentación conlleva, además de cierta dificultad en los procedimientos, un aumento del orden del polinomio característico y por lo tanto de la complejidad del sistema. Una mejor alternativa consiste en realimentar adecuadamente las variables de estado del sistema ya que ellas contienen mayor y mejor información acerca de su funcionamiento y comportamiento. Por otro lado, la realimentación del vector de estado puede igualar lo conseguido realimentando y(t) y sus derivadas y mientras que lo no logrado con la realimentación de estado posiblemente no se pueda hacer de otra manera general. La realimentación de variables de estado se usa, principalmente y bajo ciertas condiciones, para la ubicación de los autovalores de lazo cerrado del sistema en localizaciones específicas, pero también se utiliza en la optimización de sistema para satisfacer índices de comportamiento de la forma ∞ J = ∫ F ( x , u) dt ο En ninguno de dichos casos se presenta las razones de la escogencia de las especificaciones (nuevas localizaciones de autovalores o índice de comportamiento) ya que su escogencia es un tópico complejo y generalmente adecuado para cursos más avanzados. Las secciones de este capítulo pueden ser descritas de la siguiente manera: la sección 6.1. presenta una aplicación de la propiedad de controlabilidad de estado que consiste en la modificación de los autovalores del sistema mediante la realimentación de variables de estado. En el caso de no disponerse de un acceso directo a esas variables, deben ser simuladas por medio de un modelo del sistema llamado observador de estado; en la sección 6.2. se estudian los observadores asintóticos los cuales son del mismo orden que el sistema que representan y en la sección 6.4. se estudian los observadores de orden reducido que, tal como lo indica su nombre, son de menor orden que el sistema original. La sección 6.3. analiza la inclusión de los observadores dentro de un sistema y se Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 3 comprueba que la realimentación del vector simulado produce los mismos efectos que se obtendrían con la realimentación del vector de estado original. Para finalizar, la sección 6.5. presenta una aplicación más del método de estabilidad de Liapunov en el diseño de reguladores que utilizan realimentación de estado para la optimización de sistemas. Una vez concluido el capítulo, el estudiante deberá estar en capacidad de: 1. Dada la representación matricial de un sistema controlable, diseñar un controlador que permita colocar los autovalores del sistema en las localizaciones deseadas. 2. Diseñar un observador de estado asintótico o de orden reducido dados la representación de un sistema observable y los autovalores del observador. 3. Utilizar las variables de estado de un observador para realimentarlas a través de un controlador. 4. Para un sistema de representación matricial conocida, determinar la entrada de control óptimo que minimice un índice de comportamiento dado. Las referencias para este capítulo son [1], [4], [5], [6], [7], [9], [10], [19] y [21]. Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 6.1. 4 Diseño de Sistemas con Autovalores Específicos Considérese el sistema escalar descrito por las ecuaciones x& =Α x + b u (6.1) y = cΤ x donde x es el vector de estado (nx1), u es la entrada escalar; y es la salida escalar; A es la matriz de planta (nxn); b y cT son respectivamente vectores (nx1) y (1xn). Tal como se indicó en el capítulo 1, la realimentación de variables de estado tiene por finalidad generar la señal de control u(t) mediante una relación, llamada ley de control, de la forma u( t ) = r ( t ) − k Τ x (6.2) donde r(t) es la señal de referencia y k =[k 1 Τ k2 L kn ] (6.3) es el vector de coeficientes de realimentación. Es de hacer notar, que se está suponiendo que las variables de estado están directamente disponibles para ser realimentadas. Cuando esto no se cumple, es necesario generar esas variables para una correcta aplicación de los resultados obtenidos. Esta generación se tratará en la próxima sección. Luego de realimentar las variables de estado según la ley de control indicada, se tiene que la representación de lazo cerrado del sistema será ( ) x& = Α − b k Τ x + b r y = cΤ x Dado que inicialmente la ecuación característica del sistema (6-1) era Versión 1.2 - Julio 98 (6-4) CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 5 Ρ(λ) = λΙ − Α = λn +a n λn −1 + K + a 2 λ+ a 1 = 0 Después de la realimentación, la ecuación característica del sistema en lazo cerrado será Ρc ( λ) = λΙ − Α + b k Τ = λn + αn λn −1 +K+α2 λ + α1 = 0 es decir, que la realimentación modifica la ecuación característica y, por supuesto, los autovalores del sistema y esa modificación dependerá de los valores de los coeficientes ki elegidos. Teorema 6-1 Si el sistema descrito por la ecuación (6-1) es controlable, entonces todos los autovalores del sistema en lazo cerrado pueden ser asignados arbitrariamente usando realimentación de variables de estado con la selección conveniente de kT . Demostración Si el sistema es controlable entonces existe una transformación de la forma x c = Ρ c x que permite transformar la ecuación (6-1) a la FCC, es decir 1 0 L 0 0 0 0 0 0 1 L 0 x& c = L L L L L x c + M u 0 0 L 1 0 0 − a1 − a2 − a3 1 L − an y =[c 1 c 2 c 3 L c n ] x c (6-5) o, en forma compacta x& c = Α c x c +b c u Τ y = cc xc (6-6) Ya que la ecuación característica y los autovalores son invariantes bajo transformaciones lineales, la ecuación característica de Ac será también Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 6 Ρ (λ) = λΙ − Α c = λn + a n λn −1 +K+ a 2 λ + a 1 = 0 La ley de control de la ecuación (6-2) se transforma a Τ −1 Τ u = r − k Ρc x c = r − k c xc (6-7) donde k Τc = k Τ Ρ −c 1 Usando el vector de realimentación Τ [ k c = k c1 k c2 L k cn ] (6-8) se obtiene la matriz de lazo cerrado (Α c − b c k cΤ ) 0 0 = L 0 − a1 − k c 1 1 0 L 0 − a 2 − k c2 0 1 L 0 − a 3 − k c31 L 0 L 0 L L L 1 L − a n − k cn Luego, la ecuación característica de lazo cerrado será Ρc (λ) = λΙ − Α c + b c k cΤ = λn + (a n + k cn )λn −1 + K + (a 2 + k c 2 )λ + (a 1 + k c 1 ) = 0 = λn + αn λn −1 +K+α2 λ + α1 = 0 donde se observa que los coeficientes α i pueden ser asignados arbitrariamente escogiendo k Τc como k c = [α1 − a1 α2 − a 2 T Versión 1.2 - Julio 98 L αn − a n ] (6-9) CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 7 T El vector k c calculado usando (6-9) corresponde a la representación FCC y el vector requerido para la representación original viene dado por k Τ = k Τc Ρ c (6-10) Aunque el teorema (6-1) establece como condición indispensable que el sistema sea controlable, es posible asignar arbitrariamente algunos autovalores en sistemas no controlables completamente. Esos autovalores puede ser determinados a partir de la representación en la forma de Jordan: los autovalores asociados a bloque de Jordan controlables pueden ser modificados ya que sobre los modos correspondientes hay influencia de la señal u(t) que se genera usando realimentación de variables de estado. Una de las principales aplicaciones de la asignación de autovalores es la “estabilización” que consiste en la sustitución de autovalores con parte real no negativa (inestables) por autovalores estables. Un sistema no controlable puede ser estabilizado si los modos incontrolables son estables y por lo tanto no requieren ser modificados. Ejemplo 6-1 Dado el sistema representado por las ecuaciones 0 0 0 1 x& = 0 −1 0 x + 1 u 0 0 −4 1 y = [1 1 1] x Transferir los autovalores a las localizaciones -2; -1+j; -1-j usando realimentación de variables de estado. Dibujar el diagrama de bloques del sistema de lazo cerrado. Ya que el sistema está representado en la forma normal, claramente se verifica que es controlable (todos los elementos de bn son diferentes de cero). La ecuación característica del sistema de lazo abierto es Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 8 Ρ (λ) = λ(λ + 1)( λ + 4) = λ3 + 5 λ2 + 4λ = 0 se tiene entonces a 1 = 0; a 2 = 4; a 3 = 5 y la matriz Α c correspondiente a la matriz diagonal dada es 0 0 1 Αc = 0 0 1 0 −4 −5 La ecuación característica deseada de lazo cerrado es Ρc (λ) = (λ + 2 )(λ + 1 − j )(λ + 1 + j ) = λ3 + 4λ2 + 6λ + 4 = 0 Luego α1 = 4 ; α2 = 6 ; α3 = 4 Usando la ecuación (6-4) se tiene k Τc = [α1 − a 1 α2 − a 2 α3 − a 3 ] k Τc = [ 4 2 −1] Dado que la matriz modal transforma Ac en la matriz diagonal, o sea Λ = Μ −1 Αc Μ entonces M puede ser vista también como la matriz de transformación Pc. Usando la matriz de Vandermonde, ya que A está en FCC, se tiene 1 Μ = Ρ c = λ1 λ21 1 λ2 λ22 1 1 1 1 λ3 = 0 −1 −4 λ23 0 1 16 Finalmente k Τ = k Τc Ρ c = [4 1 − 20] Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 9 La señal de control a utilizar será u = r − k x = r − 4 x1 − x 2 + 20 x3 T El diagrama de bloques del sistema se muestra en la figura 6-1. 1 s x1 4 r + + − 1 s +1 u − x2 y 1 1 s +4 x3 20 Figura 6-1 Diagrama de bloques del ejemplo 6-1 Ejemplo 6-2 Considérese el sistema descrito por 0 1 1 x& = x + 1 u 2 −1 Este sistema tiene autovalores λ1 = 1 (inestable) y λ 2 = −2 (estable). Es posible transformar la representación dada a la siguiente forma normal. 1 0 1 q& = q+ u 0 −2 0 El sistema no es controlable ya que el vector bn posee un elemento igual a cero. El modo Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 10 asociado a λ 2 = −2 no recibe influencia de la señal, pero el modo asociado al autovalor inestable si es controlable y es posible modificarlo. Hágase λ1 = −1 manteniendo λ 2 = −2 . La nueva ecuación característica, en función de estos autovalores será Ρc (λ) = (λ + 2 )(λ + 1) = λ2 + 3λ + 2 = 0 Por otro lado 0 1 1 Αk = Α − b k Τ = − [ k1 2 −1 1 1− k 2 −k Αk = 1 2 − k1 −1 − k 2 k2 ] y λ + k1 1 −2 ( λΙ − Α k ) = k k2 − 1 λ + 1 + k 2 donde Ρc (λ) = λΙ − Α k = λ2 + ( k 1 + k 2 + 1) λ + 2 k 1 + 2k 2 − 2 = 0 comparando con la ecuación característica deseada k1 + k 2 + 1 = 3 ´ 2 k1 + 2 k2 − 2 = 2 ó k1 + k2 = 2 2k 1 + 2 k 2 = 4 Una solución posible será k 1 = 1 ; k 2 = 1 ó k Τ = [1 1] Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 11 Si se intenta modificar ambos autovalores, por ejemplo haciendo λ1 = −1 λ 2 = −3 , la ecuación característica deseada será Ρc (λ) = ( λ + 1)( λ + 3) = λ2 + 4λ + 3 = 0 Comparando esta ecuación con λΙ − Α k = 0 k1 + k2 + 1 = 4 2k 1 + 2k 2 − 2 = 3 ó k1 + k 2 = 3 2k 1 + 2 k 2 = 5 Este conjunto de ecuaciones es incompatible y no es posible modificar ambos autovalores simultáneamente. Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 6.2 12 Diseño de Observadores de estado asintóticos La utilidad del resultado alcanzado en el diseño de sistemas usando realimentación de variables de estado dependerá de la posibilidad de obtener esas variables para realimentarlas. En muchos casos, no hay acceso directo a todas las variables de estado de un sistema y sólo pueden ser medidas sus entradas y sus salidas. En tales casos será necesario encontrar o generar un “vector sustituto” cuya realimentación proporcione los mismo efectos que se conseguirían con el vector de estado real. Un subsistema que genera un vector de estado basado en la información recibida de las entradas y salidas del sistema es el llamado observador de estado. Existen varios tipos de observadores o estimadores de estado, como también se les conoce, que se irán estudiando progresivamente. En la definición 4-3 se establece que en un sistema observable, el vector de estado puede ser construido de combinaciones lineales de la entrada, la salida y las derivadas de esas señales. Esto puede ser hecho de la forma que se indica a continuación. Considerando un sistema escalar descrito por: x& = Α x + b u y = cΤ x (6 − 11a) (6 - 11b) Derivando la ecuación de salida se tiene y& = c Τ x& = c Τ Αx + c Τ b u o Τ (6-12) Τ y& − c b u = c Α x Derivando nuevamente, y ordenando términos, se obtiene Τ Τ Τ 2 &y& − c b u& − c A b u = c Α x Repitiendo este procedimiento, se puede expresar, luego de (n-1) derivaciones, que Versión 1.2 - Julio 98 (6-13) CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado ( n −1 ) 13 ( n− 2) y − c Τ b u − K − c Τ Α ( n − 2 ) b u = c Τ Α n −1 x (6-14) Las ecuaciones (6-11b) hasta (6-14) pueden ser escritas en forma matricial, como y cΤ Τ y& − c Τ bu c Α Τ Τ &y& − c bu& − c Αbu = c Τ Α 2 x = V x KKKKK M (n −1 )KKK(nK −2 ) y − c Τ b u − K − c Τ Α n − 2 u c Τ Α n −1 (6-15) la cual puede ser resuelta para x si y sólo si la matriz V es no singular, lo cual constituye simplemente la condición de observabilidad. Resumiendo, la ecuación (6-15) indica que el vector de estado puede ser expresado por combinaciones lineales de la entrada u, la salida y sus derivadas. En la práctica, debido a la presencia de ruido, este procedimiento de diferenciación debe ser descartado por implicar grandes errores en el cálculo de x. Sin embargo, es posible utilizar un procedimiento ligeramente modificado para la generación del vector de estado sustituto por medio del observador de estado. Dado que se conoce la representación del sistema es decir, la matriz A y los vectores b y cT , es posible duplicar el sistema original tal como se muestra en la figura 6-2. u b + + ∫ x cT A b + + ∫ Sistema xe cT A Observador Versión 1.2 - Julio 98 y ye CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 14 Figura 6-2 Observador de lazo abierto Esta réplica del sistema constituye el observador de lazo abierto. Las ecuaciones que describen el observador de lazo abierto son x& e = Α x e + b u ye = cΤ xe Teóricamente el vector de estado del observador xe (vector de estado estimado u observado) será igual al vector x del sistema original si el observador posee las mismas condiciones iniciales del sistema y está manejado por la misma señal de control u. Las condiciones iniciales del sistema pueden ser conocidas si el sistema original es observable y deberán ser calculadas y fijadas en el observador de lazo abierto cada vez que se utilice, lo cual constituye un inconveniente. Por otro lado, cualquier modificación en los parámetros de los sistemas o cualquier perturbación externa provocaría una diferencia entre x y xe la cual se incrementaría con el tiempo. Por estas razones, el uso de un observador de lazo abierto no es satisfactorio en la mayoría de los casos. Cualquier diferencia entre x y xe podría ser corregida determinando el error e, entre ambos vectores, donde e = x − x e y utilizarlo como término de corrección mediante realimentación, pero recuérdese que no se tiene acceso al vector x. Una forma de obtener el error es a partir de las salidas, las cuales si están disponibles, y es posible generar una señal de error como y − ye = cΤ x − cΤ x e = cΤ e Estos señalamientos llevan al observador de lazo cerrado mostrado en la figura 6-3. En este observador la diferencia entre ambas salidas es multiplicada por un vector ke (nx1) de elementos reales constantes y realimentada a la entrada de cada integrador del observador. Como se analizará posteriormente, este error decae a cero exponencialmente de aquí que este observador se conozca como observador asintótico. Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado u b ∫ + + x cT 15 y A + ke b ∫ + + xe cT ye A Figura 6-3 Observador de lazo cerrado Las ecuaciones que describen el observador asintótico pueden obtenerse a partir de la figura 6-3 y son x& e = Α x e + b u + k e ( y − y e ) ye = cΤ xe (6-16) Nótese que cuando el error se anula, es decir, cuando el sistema y el observador responden exactamente igual, el término ( y − y e ) se anula y la ecuación (6-16) se reduce a la de un observador de lazo abierto. La ecuación de estado del observador asintótico también puede escribirse como ( ) x& e = Α − k e c Τ x e + b u + k e y (6-17) Un diagrama de bloques del observador asintótico usando la ecuación (6-17) se muestra en la figura 6-4. Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado u b x ∫ + + cT 16 y A ke b xe ∫ + + A ke cT Figura 6-4 Diagrama simplificado del observador de estado asintótico Surge ahora una pregunta, ¿Es posible escoger ke de manera que pueda reducir la diferencia entre x y xe rápidamente?. Para responderla, réstense las ecuaciones de estado del sistema y del observador. El resultado es ( x& − x& e ) = ( Α − k e c Τ )( x − x e ) (6-18) ó simplemente ( ) e& = Α − k e c Τ e (6-19) Por ser esta última ecuación del tipo autónomo, el comportamiento del error está gobernado por los autovalores de la matriz (Α − k e cΤ ) y si estos tienen parte real negativa (por ejemplo menos a) entonces la diferencia x-xe tenderá a cero a una rata exponencial e-at, lo que indica que el vector estimado xe tenderá a alcanzar el vector real x en forma asintótica de aquí el nombre de este observador. El problema del diseño de un observador asintótico radica en escoger un vector ke tal Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado que los autovalores de la matriz (Α − k e 17 ) c Τ tengan parte real negativa. Para ello se dispone del siguiente teorema. Teorema 6-2 Si el sistema escalar descrito por la ecuación (6-11) es observable, entonces es posible diseñar un observador asintótico con autovalores arbitrariamente localizados mediante la escogencia del vector Ke. Demostración: Si el sistema es observable, existe una transformación x o = Ρ ο x que permite obtener la representación en la FCO equivalente a la ecuación (6-11) es decir 0 1 x& ο = 0 M 0 y = [0 0 0 1 M 0 L L L L L 0 0 0 M 1 0 L 0 -a 1 b1 b -a 2 2 -a 3 xο + b3 u M M bn -a n (6-20) 1] xο o simplemente x& ο = Α ο xο + bο u (6-21) Τ y = cο xο Un observador asintótico que genera x ο e (estimado de xo) tendrá una ecuación de estado. ( ) Τ x& ο e = Αο −k o c o x oe + k o y +b o u k o = Ρo k e donde y Luego Versión 1.2 - Julio 98 [ k ο = k o1 k o2 k on ] Τ (6-22) CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 0 1 Τ Α o − k o c o = 0 M 0 ( 0 0 1 M 0 L L L L L 0 - (a1 + k o1 ) 0 - (a2 + k o2 ) 0 - (a3 + k o3 ) M 1 - (an + k on ) 18 (6-24) ) Ρo (λ) = λΙ − Α o − k o c Τo = 0 Po ( λ) = λn + (a n + k o n )λn −1 + L + (a 1 + k o 1 ) = 0 (6-25) Si la ecuación característica del observador en función de los autovalores deseados es Ρ o ( λ) = λn + αn λn −1 +L+α λ + α1 = 0 2 entonces α1 − a 1 α − a 2 ko = 2 M αn − a n (6-26) Se debe recalcar que el observador descrito por la ecuación (6-22) da un estimado del vector xo y para obtener el estimado del vector original se debe realizar la transformación x e = Ρ −o 1 x oe (6-27) Si el sistema original posee una representación diferente de la FCO será necesario transformarla a esta forma, calcular ko y luego determinar ke usando k e = Ρ −o 1 k o Ejemplo 6-3 Considere el sistema cuyas ecuaciones matriciales son 1 0 0 x& = x + u −1 1 1 y = [ 2 0] x Versión 1.2 - Julio 98 (6-28) CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 19 Diseñe un observador asintótico con autovalores -2, -2. La ecuación característica del sistema dado es Ρ (λ) = λ2 − λ + 1 = 0 ; a 1 = 1, a 2 = − 1 Es necesario transformar la representación dada a la FCO para ello se calcula 1 c Τ − 2 2 = 0 c Τ Α 2 0 a Ρo = 2 1 La representación FCO correspondiente será la dual de la suministrada en FCC 0 xo = 1 y = [0 −1 2 xo + u 1 0 1] x o La ecuación característica deseada del observador es Ρο (λ) = ( λ + 2) 2 = λ2 + 4λ + 4 = 0 ; α1 = 4 , α 2 = 4 Luego, usando la ecuación (6-26) α − a 1 3 ko = 1 = α2 − a 2 5 El observador deseado puede ser implementado de dos maneras: la primera, usando la ecuación (622) en cuyo caso se generará un vector estimado de xo y será necesario transformarlo en xe. La ecuación correspondiente a este caso será 0 x& oe = 1 −4 3 2 x oe + y + u −4 5 0 El diagrama de bloque de este observador se muestra en la figura 6-5 Versión 1.2 - Julio 98 (6-29) CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado u y SISTEMA 5 3 2 + 20 ∫ x01 + ∫ x02 − P o1 x e1 xe 2 −4 Figura 6-5 Estructura del observador de ecuación (6-29) La segunda alternativa consiste en “duplicar” el sistema. De esta manera, el observador estará regido por la ecuación (6-17) donde 5 / 2 K e = Ρ −o 1 K o = 4 Luego, se puede escribir −5 x& e = −9 1 0 5 / 2 xe + u + y 1 1 4 El diagrama de bloques de esta segunda alternativa aparece en la figura 6-6 Versión 1.2 - Julio 98 (6-30) CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado u SISTEMA 5 4 + ∫ xe 2 21 y 2 + ∫ x e1 −5 + x e1 xe 2 −9 Figura 6-6 Diagrama de bloques del observador de la ecuación (6-30) Cuando se dice que el observador de estado constituye una réplica del sistema original esto no debe ser tomado en el estricto sentido de las palabras. En la mayoría de los casos, un observador es un modelo que puede ser construido mediante circuitería electrónica de manera que su funcionamiento simule perfectamente hasta un sistema muy complejo que exista en la realidad con las consiguientes reducción de tamaño y costo y donde las señales (variables de estado simuladas) presentes en dicho modelo permitan controlar, a través de la realimentación correspondiente, las variables reales del proceso. Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 6.3. 22 Diseño de Sistemas usando Observadores de Estado El observador de estado se diseña con la finalidad de obtener las variables de estado no accesibles de un sistema y realimentarlas para modificar, estabilizar y optimizar el sistema. Por lo tanto, una vez obtenido el vector estimado xe se debe realimentar al sistema a través de un vector de Τ coeficientes de realimentación k . El diagrama de bloques de esta combinación observadorcontrolador se presenta en la figura 6-7. r + u b . x + + ∫ A x cT y SISTEMA + ke . b xe + + ∫ xe cT ye A T k OBSERVADOR+CONTROLADOR Figura 6-7 Combinación observador + controlador para realimentación de variables de estado Debido a que se está realimentando el vector de estado estimado xe se tiene que u = r − kΤ xe (6-31) Es necesario determinar si esta ley de control proporciona al sistema los mismos efectos que produce la realimentación del vector de estado real y si la inclusión del observador interfiere sobre el Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 23 controlador o el sistema. Para esto, se obtienen, a partir de la figura 6-7, las ecuaciones del sistema en lazo cerrado. x& = Α x − b k Τ x e + b r ( Τ ) Τ (6-32) Τ x& e = Α − k e c x e − b k x e + b r + k e c x (6-33) En forma matricial y usando un vector de estado único se puede escribir x& Α x = k c Τ & e e [ y = c x b − bk Τ + r Τ Τ Α − k e c − bk x e b (6-34) ] x 0 x e Τ Por otro lado, restando las ecuaciones (6-32) y (6-33) encontramos ( ) Τ x& − x& e = Α − k e c ( x − x e ) (6-35) en donde no hay influencia de la entrada u dada por la ecuación (6-31). Usando (6-32) y (6-35) se puede representar el sistema completo como ( x& Α − bk Τ x − x = 0 & & e [ y= c Τ ) Τ bk Τ Α− k e c ( x b + r x − x e 0 ) (6-36) ] x 0 x − xe Aplicando transformada de Laplace se encuentra que la función de transferencia del sistema en lazo cerrado viene dada por Υ ( s) = G( s ) = c Τ R (s ) o− c [ ] sΙ − Α + bk Τ 0 0 G( s ) = c (sΙ − Α + bk Τ o− c ) Τ −1 Τ − bk Τ sI − Α + k e c −1 b 0 (6-37) b Esta es exactamente la función de transferencia que se obtendría con la realimentación del vector de estado real, es decir, que la función de transferencia de lazo cerrado no depende de las características del observador empleado. Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 24 De la ecuación (6-36) se deduce que la ecuación característica del sistema en lazo cerrado es Ρο-c ( λ) = λΙ − Α + b k Τ . λΙ − Α + k e c Τ = 0 = Ρ c ( λ) . Ρο ( λ) = 0 (6-38) Se puede decir que la ecuación característica del sistema completo es igual al producto de las ecuaciones características del controlador y del observador. Esto indica que ambas ecuaciones son independientes entre sí y que los diseños del controlador y el observador pueden realizarse independientemente. Esta propiedad se conoce como la propiedad de separación del diseño del controlador - observador de estado. Ejemplo 6-4 Considérese el sistema con ecuaciones matriciales 0 x& = 0 y = [1 1 0 x + u −1 1 0] x Usando realimentación de variables de estado, transfiera los autovalores del sistema a -2±j. Asuma que las variables de estado no son accesibles, diseñe un observador asintótico con autovalores en 4. Dibuje el diagrama de bloques del sistema en lazo cerrado. El sistema está descrito en FCC, por lo tanto se tiene a 1 = 0 ; a 2 = 1. La ecuación característica deseada es Ρc ( λ) = ( λ + 2 + j ) ( λ + 2 − j ) = λ2 + 4λ + 5 = 0 de donde α1 = 5 y α2 = 4 . Luego k Τ = [α1 − a 1 α2 − a 2 ] = [5 3] Debido a que el vector x no es accesible, será necesario utilizar un vector estimado xe proporcionado por un observador con ecuación característica. Ρο (λ) = Versión 1.2 - Julio 98 (λ + 4) 2 = λ2 + 8λ + 16 = 0 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 25 Por tanto (Α − k c ) = 00 Τ e 1 k e1 − [1 0] − 1 k e2 - k = e1 - k e2 1 - 1 por consiguiente ( λΙ − Α + k e ) λ + k e1 cΤ = k e2 -1 λ + 1 con Ρο (λ) = λΙ − Α + k e c Τ = λ2 + (1 + k e1 ) λ + k e1 + k e2 Comparando las expresiones de Ρο (λ) se obtiene k e1 + k e2 = 16 1 + k e1 = 8 7 ke = 9 El diagrama de bloques se muestra es la figura 6-8 u + r + − ∫ − x2 − + 5 Versión 1.2 - Julio 98 3 x1 y + 7 + ∫ − ye 9 ∫ xe2 + ∫ x e1 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 26 Figura 6-8 Sistema en lazo cerrado del ejemplo 6-4 Diseño de Observadores de Orden Reducido 6.4. En algunas formas de representación matricial de un sistema, por ejemplo en FCC y FCO, la salida está constituida solamente por una de las variables de estado del sistema. En tales casos no será necesario estimar dicha variable, ya que se tendrá acceso directo a ella y se requerirá sólo un observador que genere las variables restantes: para un sistema de orden n se necesita diseñar un observador de orden (n-1). Este tipo de observador fue descrito por primera vez por D.G. Luenberger en 1964 y se conoce como observador de Luenberger, observador de orden (n-1) o simplemente observador de orden reducido. Para deducir la estructura del observador de orden reducido, se asumirá que se tiene un sistema observable descrito por las ecuaciones matriciales. x& = Α x + b u (6-39) y = cΤ x donde x es el vector de estado (nx1); u es la entrada escalar; y es la salida escalar, A es la matriz de planta (nxn), b y cT son respectivamente vectores (nx1) y (1xn). Es necesario transformar esta representación estándar a otra forma que tenga la particularidad de que la salida y, sea igual al último elemento del vector x es decir y = [0 0 L 0 1] x una transformación que conduce a este tipo de ecuación de salida es xο = Ρο x (6-40) que origina la representación FCO x& ο = Αο x ο + b ο u y = c Τo x ο donde Versión 1.2 - Julio 98 (6-41) CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 27 λΙ − Αο =λn + a n λn −1 + K +a 2 λ + a 1 = 0 a 2 a Ρο = 3 M 1 a3 a4 M 0 Αο = Ρο ΑΡ −o 1 1 c Τ 0 c Τ Α M M 0 c Τ Α n −1 L an L 1 M M L 0 0 1 = 0 M 0 0 0 1 M 0 L L L M L 0 - a1 0 - a 2 0 - a3 M M 1 - a n bο = Ρo b c Τo = c Τ Ρ ο−1 = [0 0 L 0 1] Es necesario hallar a partir de la ecuación (6-41) un observador con (n-1) variables que junto con la salida y simulen el vector de estado original y además debe ser posible controlar el comportamiento de dicho observador mediante la escogencia de su ecuación característica. Para deducir la estructura de ese observador, se realiza una segunda transformación basada en la ecuación característica de orden (n-1) que se desea. Supóngase que es Ρ (λ) = λn −1 + αn −1 λn − 2 +L+α2 λ + α1 = 0 (6-42) donde los coeficientes αi dependerán de los autovalores elegidos. Si se utiliza la transformación x2 = Ρ 2 x ο donde Versión 1.2 - Julio 98 (6-43) CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 28 1 0 Ρ2 = M 0 0 0 1 M 0 0 L L M L L 0 0 M 1 0 −α1 −α2 M −αn − 1 1 (6-44) 1 0 Ρ 2−1 = M 0 0 0 1 M 0 0 L L M L L 0 0 M 1 0 −α1 −α2 M −αn −1 1 (6-45) con entonces la representación (6-41) se transforma en x& 2 = Α 2 x 2 + b 2 u (6-46) y = c Τ2 x 2 donde 0 1 0 Α 2 = Ρ 2 Αο Ρ −2 1 = M 0 0 0 0 1 M 0 0 L L L M L L 0 0 0 M 0 0 -α1 -α2 -α3 M -αn-1 1 g1 g 2 g3 M g n -1 gn (6-47) b 2. = P 2 b ο c Τ2 = c Το Ρ −2 1 = [0 0 L 0 1] Un observador asintótico para el sistema descrito por la ecuación (6-46) tendría una ecuación de estado de la forma ( ) x& 2 e = Α 2 x 2 e + b 2 u + k e + c Τ2 x 2 e − y Versión 1.2 - Julio 98 (6-48) CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 29 El vector x 2 e es el estimado de x 2 . Si x 2 n se divide de manera de separar el elemento xne = y del resto del vector x re se puede escribir x& re Α e x = & ne 0 0 L 0 1 g 1 x re b r M + u g n x ne bn (6-49) La submatriz cuadrada Ae de orden (n-1) y br se consiguen al dividir convenientemente A2 y b2. El término final de la ecuación (6-48) desaparece ya que c Τ2 x 2 e = y . La variable x ne no se necesita ya que xn = y , por lo tanto puede ser eliminada de la ecuación (6-41) lo mismo que la última fila de A2 y el elemento bn quedando x& re = Αe x re + gr y + br u (6-50) ó 0 1 0 x& re = M 0 0 − α1 g1 b1 b g − α2 2 2 1 L 0 − α3 x re + y + u M M M M M M 0 L 1 − αn − 2 0 L 0 − αn −1 g n −1 bn −1 0 L 0 0 L 0 (6-51) Eliminando la última variable x2 n de la ecuación (6-46) se tiene x& r = Α e x r + g r y + b r u (6-52) Restando las ecuaciones (6-52) y 6-50) se obtiene x& r − x& re = Αe ( xr − xre ) (6-53) esta ecuación caracteriza el error y su comportamiento está determinado por la ecuación característica de Αe que viene dada por la ecuación (6-42), lo cual implica que al estructurarse Αe se estará escogiendo el comportamiento del observador. Finalmente el vector estimado de x 2 se forma agrupando xre y la salida y o sea Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 30 x re x 2e = y (6-54) Para ser utilizado en el sistema original de la ecuación (6-39) este vector estimado debe ser transformado usando x e = ( Ρ 2 Ρο ) x 2 e −1 (6-55) El vector estimado x e converge a x a la misma rata exponencial escogida para el error de la ecuación (6-53). El diagrama de bloques del sistema con un observador reducido se muestra en la figura 6-9. Se asume que la representación del sistema está dada por la ecuación (6-39). y u SISTEMA gr br + ∫ xre (P2 P0)−1 xe Ae Figura 6-9 Sistema con observador de orden reducido Ejemplo 6-5 Diseñar un observador de primer orden para el sistema del ejemplo 6-3. El autovalor del observador es λ = −2 . Versión 1.2 - Julio 98 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 31 La ecuación característica deseada es Ρ (λ) = λ + 2 = 0 Luego 1 − 2 Ρ2 = 0 1 1 2 y Ρ −2 1 = 0 1 Usando esta matriz se transforma la FCO del problema indicado en − 2 x& 2 = 1 − 7 2 x 2 + u 2 0 El observador de primer orden está descrito por la ecuación x& re = −2 x re − 7 y + 2u El vector x e se construye usando la ecuación (6-55) 0 xe = 1 2 1 3 2 xre 2 y El diagrama de bloques del observador se muestra en la figura 6-10 y u SISTEMA xe1 −7 2 + ∫ xre −2 Figura 6-10 Versión 1.2 - Julio 98 0 1/ 2 1/ 2 3/ 2 xe2 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 32 Observador de primer orden del ejemplo 6-5 La propiedad de separación también es válida para un observador de orden reducido, es decir, que este diseño se puede combinar con el diseño de un controlador sin que exista influencia de un resultado sobre otro. La realimentación del vector estimado x e producto de un observador de orden (n-1) proporciona los mismos efectos buscados con la realimentación del vector de estado original usando la ley de control u = r − k Τ x e . 6.5. Diseño del Regulador Lineal Optimo Un regulador es un sistema de control que mantiene el valor de su salida constante ante la presencia de cierto tipo de perturbaciones. Un regulador puede ser descrito mediante una ecuación de estado FE. x& = Α x + Β u (6-56) con A de orden (nxn) y B de orden (nxr), x es el vector de estado (nx1) y la entrada u es un vector (rx1). Se asume generalmente que el regulador está en reposos x = 0 y debido a una perturbación su estado puede variar x ≠ 0 . En tal caso, se debe generar una señal de control u(t) que conduzca el sistema a su estado inicial de reposo. Esta señal de control se genera mediante realimentación negativa de las variables de estado del regulador, esto es u = −Κ x (6-57) K es una matriz (rxn) de coeficientes de realimentación. Combinando las dos ecuaciones anteriores. x& = ( Α − Β Κ ) x (6-58) La velocidad de la respuesta con la que el regulador retorna al estado de reposo dependerá de los autovalores de la matriz Versión 1.2 - Julio 98 (Α − Β Κ ) , mientras más negativa sea su parte real, mayor será la CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 33 velocidad. Sin embargo, la selección de autovalores de magnitud elevada implica un gran consumo de energía al aumentar el valor de K. Por esta razón, existe un compromiso entre la velocidad de retorno al estado cero y el costo de la energía requerida. En el diseño del regulador óptimo se plantea la solución a este problema mediante la escogencia de una matriz K que minimice el índice de comportamiento. ∞ ( ) J = ∫ x Q x + u R u dt o Τ Τ (6-59) donde la matriz Q (real simétrica positiva definida o semidefinida) representa el peso o importancia de las desviaciones (error) del estado de reposo mientras que la matriz R (real simétrica positiva definida) representa el costo de la energía empleada. La escogencia de estas matrices es un tópico que escapa a los objetivos de este texto por lo cual no se presentará aquí la razón de la selección de los índices utilizados. Una manera de determinar K es procediendo tal como se hizo en el caso de optimización de parámetro usando el segundo método de Liapunov (sección 5.4). Sin embargo, ese procedimiento es complejo para sistemas de tercer orden en adelante (véase referencia [1], pág. 844). Una alternativa diferente es la siguiente. Usando la ecuación (6-57) el índice J se puede expresar como J=∫ ∞ o [x Q x + ( x Κ ) R (Κ x)] dt Τ Τ Τ ó ( ∞ ) J = ∫ x Τ Q + Κ Τ R Κ x dt o Se asume que (6-60) ( Α − Β Κ ) tiene autovalores con parte real negativa (estable), entonces, usando el teorema de estabilidad de Liapunov. − Versión 1.2 - Julio 98 ( ) ( ) d Τ x Ρ x = x Τ Q + ΚΤ R Κ x dt (6-61) CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 34 donde P (nxn) es real simétrica positiva definida. Desarrollando esta última ecuación se encuentra que ( ) − Q + Κ R Κ = ( Α − B Κ ) Ρ + Ρ( Α − B Κ ) Τ Τ (6-62) Luego la ecuación (6-60) se transforma en ∞ J =∫ x o Τ [(Α − ΒΚ ) Ρ + Ρ (Α − ΒΚ )] x dt Τ (6-63) Este último es mínimo cuando Κ = R −1 ΒΤ Ρ (6-64) Sustituyendo esta ecuación en la (6-63) se obtiene Τ −1 Τ Α Ρ + ΡΑ − ΡΒ R Β Ρ + Q = 0 (6-65) la cual se conoce como ecuación matricial de Ricatti. Resumiendo, el diseño del regulador óptimo que minimiza el índice de comportamiento J dado en la ecuación (6-59) se realiza de la manera siguiente: 1. Se resuelve la ecuación de Ricatti para determinar la matriz P. 2. Se forma la matriz K (matriz de ganancias de Ricatti) usando la ecuación (6-64). 3. Se obtiene la entrada de control óptimo u op dada por u op = − K x En el caso de no tener acceso directo al vector de estado x, éste se genera mediante uno de los observadores estudiados en las secciones anteriores. Ejemplo 6-6 Considere el sistema descrito por la ecuación 0 x& = 0 Versión 1.2 - Julio 98 1 0 x+ u 0 1 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 35 Determine la entrada de control óptimo que minimice el índice de comportamiento. J=∫ ∞ o (2 x 2 1 ) + 3 x 22 + u 22 dt A partir de J se obtiene que 2 0 Q= , R = 1 0 3 (escalar) La ecuación de Ricatti para el caso de entrada escalares Τ Τ Α Ρ + Ρ Α−Ρ br -1 b Ρ + Q = 0 Luego 0 0 Ρ11 1 0 Ρ 12 Ρ12 Ρ11 + Ρ22 Ρ12 Ρ12 0 1 Ρ11 − Ρ22 0 0 Ρ12 Ρ12 0 [1][0 1] Ρ11 Ρ22 1 Ρ12 Ρ12 2 0 + =0 Ρ22 0 3 de donde se obtienen las ecuaciones Ρ122 − 2 = 0 Ρ11 − Ρ12 Ρ22 = 0 2Ρ12 − Ρ22 + 3 = 0 Resolviendo este conjunto de ecuaciones y tomando aquellos valores de Ρ11 , Ρ12 y Ρ22 que hagan a P real simétrica positiva definida se tiene 6,21 1,41 Ρ= 1, 41 4, 41 Por consiguiente k T = r -1 bΤ Ρ = [1,41 4,41] y uop = Versión 1.2 - Julio 98 −1,41x 1 − 4,41x 2 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 36 PROBLEMAS P6-1: Las ecuaciones que describen un sistema en lazo abierto son: 0 x& = 0 1 y = [1 1 0 −2 0 0 0 1 x + 0 u 1 −3 0] x Diseñe un controlador que permita ubicar los autovalores del sistema de lazo cerrado en las localizaciones -2, -1 + j y -1-j. P6-2: Diseñe un observador asintótico para el sistema del problema anterior con un autovalor triple en -5. Dibuje el diagrama de bloques detallado del sistema de lazo cerrado incluyendo el controlador y el observador diseñados. P6-3: Se desea transferir los autovalores del siguiente sistema a las localizaciones -1, -2+j, -2-j 0 x& = 2 1 y = [1 1 0 0 0 −1 0 0 x + 0 u 1 1 1] x Diseñe un controlador que permita lograr lo indicado. P6-4: Diseñe un observador de estado asintótico que simule las variables inaccesibles del sistema P6-3. Los autovalores de este observador deben estar localizados en -3, -5+j, -5-j. P6-5: Diseñe un observador de 2do. Orden para el sistema del problema P6-3 con autovalores -2, -2. P6-6: Se desea estabilizar el sistema descrito por la ecuación: −1 x& = 0 0 Versión 1.2 - Julio 98 0 −2 0 0 0 0 x + 1 u 1 2 CAPITULO 6: Diseño de Sistemas usando Realimentación de Variables de Estado 37 Cambie el autovalor inestable λ = 2 a la localización λ = -3 utilizando realimentación de variables de estado. P6-7: Determine la ecuación característica y la función de transferencia del sistema de lazo cerrado de los problemas P6-3 y P6-4. P6-8: Considere la planta descrita por la ecuación 0 x& = 0 1 0 x+ u −1 1 Si u = − x1 − k x 2 , determine el valor de k > 0 que minimice el índice de comportamiento. J=∫ ∞ o (x 2 1 ) + 10 x22 + u 2 dt P6-9: Dado el sistema −2 x& = 0 1 1 x+ u 1 0 ¿Es posible hallar una entrada de control óptima u = [ K2 ∞ ( ) J = ∫ x Τ x + u 2 dt ? o Versión 1.2 - Julio 98 K2 ] x que minimice el índice