Lección 6 Controlabilidad y observabilidad. Estabilización 1 Eventos alcanzables y controlables Σ = (T , U, U, X, Y, ψ, η) un sistema de control arbitrario T × X= Espacio de eventos (t, x) ∈ T × X= el estado del sistema en el instante t es x Definición de controlabilidad-alcanzabilidad (a) El evento (t, x) es alcanzable desde el evento (t0 , x0 ) si existe un control u(·) ∈ U tal que ψ(t; t0 , x0 , u(·)) = x. También se dice que (t0 , x0 ) puede controlarse hasta (t, x). (b) Si x0 , x1 ∈ X, t ∈ T , (t ≥ 0) y ∃t0 , t1 ∈ T tales que t1 − t0 = t y (t1 , x1 ) es alcanzable desde (t0 , x0 ) entonces se dice que el estado x1 es alcanzable desde el estado x0 en tiempo t. También se dice que x0 es controlable hasta x1 en tiempo t. (c) El estado x1 es alcanzable desde el estado x0 (o x0 es controlable hasta x1 ) si ∃t ∈ T tal que x1 es alcanzable desde x0 en tiempo t ( o x0 es controlable hasta x1 en tiempo t). 2 Controlabilidad de sistemas lineales (dimensión finita) T ⊂ R un intervalo. X = Kn , U = Km , Y = Kp (K = R o C) ẋ(t) = A(t)x(t) + B(t)u(t) t ∈ T (Σ) y(t) = C(t)x(t) + D(t)u(t) A(·) ∈ P C(T, Rn×n ), B(·) ∈ P C(T, Rn×m ), C(·) ∈ P C(T, Rp×n ), D(·) ∈ P C(T, Rp×m ) Definición de controlabilidad de sistemas lineales (Σ) es controlable en [t0 , tf ] ⊂ T si para (x0 , x1 ) ∈ Rn × Rn existe una función de control u(·) ∈ P C([t0 , tf ], Rm ) tal que la única solución del P.C.I. ẋ(t) = A(t)x(t) + B(t)u(t) x(t0 ) = x0 cumple x(tf ) = x1 ((t0 , x0 ) es controlable a (tf , x1 ) o (tf , x1 ) es alcanzable desde (t0 , x0 )). Nota: Para sistemas continuos alcanzabilidad y controlabilidad son conceptos (matemáticamente) equivalentes. 3 Una caracterización algebraica Z t de la controlabilidad Recordemos: x(t) = Φ(t, t0 )x0 + solución del P.C.I.: Φ(t, s)B(s)u(s) ds es la única t0 ẋ(t) = A(t)x(t) + B(t)u(t) x(t0 ) = x0 Observaciones importante: Z t f Φ(tf , s)B(s)u(s) ds : u(·) ∈ U es un espacio R(tf , t0 ) = t0 vectorial, (U = P C(R, Rm )). Espacio de estados alcanzables desde (t0 , 0) en tiempo tf − t0 . (tf , x1 ) alcanzable desde (t0 , x0 ) sii x1 − Φ(tf , t0 )x0 ∈ R(t0 , tf ). ¿ Se puede caracterizar R(t0 , tf ) algebraicamente? Matriz Grammiana de controlabilidad: Z tf W (tf , t0 ) = Φ(tf , t)B(t)B(t)T Φ(tf , t)T dt t0 R(tf , t0 ) = Im(W (tf , t0 )) 4 Controlabilidad y matriz Grammiana (Σ) es controlable en [t0 , tf ] si y sólo si R(tf , t0 ) = Rn (Σ) es controlable en [t0 , tf ] si y sólo si W (t0 , tf ) es invertible. w(t) = B(t)T Φ(tf , t)T W (tf , t0 )−1 (x1 − Φ(tf , t0 )x0 ) lleva el estado x0 en t = t0 al estado x1 en t = tf , y Z tf Z tf kw(t)k2 dt ≤ ku(t)k2 dt entre todos los controles t0 t0 m u(·) ∈ P C([t0 , tf ], R ) para los que ψ(tf ; t0 , x0 , u(·)) = x1 . Interpretación: w(t) es el control que minimiza la energı́a o el consumo. 5 Un criterio más útil para la controlabilidad Cuando A(t) y B(t) son de clase C ∞ en [t0 , tf ] K0 (t) := B(t) Kj (t) := −A(t)Kj−1 (t) + K̇j−1 (t), j = 1, 2, . . . ∂j (Φ(t, s)B(s)) = Φ(t, s)Kj (s), j = 0, 1, 2, . . . ∂sj Para t ∈ T y q ≥ 0 entero Mq (t) = K0 (t) K1 (t) · · · Kq (t) . Theorem Si A(t) ∈ Fn×n y B(t) ∈ Fn×m son infinitamente diferenciables en un intervalo I ⊂ R, [t0 , tf ] ⊂ I y existen tc ∈ [t0 , tf ] y un entero q ≥ 0 tal que rang Mq (tc ) = n entonces el sistema (A(t), B(t)) es controlable en [t0 , tf ]. La condición es también necesaria cuando A(t) y B(t) son analı́ticas 6 Controlabilidad de sistemas invariantes en el tiempo ẋ(t) = Ax(t) + Bu(t) t ∈ T y(t) = Cx(t) + Du(t) Matriz de transición de estados: Φ(t, t0 ) = eA(t−t0 ) Propiedad importante basada en el Teorema de Hamilton-Cayley: eAt = α0 (t)I + α1 (t)A + · · · + αn−1 (t)An−1 Teorema Fundamental: Si BT T T B A n−1 WT = B AB · · · A B .. . B T (AT )n−1 entonces n−1 Im W (t, t0 ) = Im WT = Im B AB · · · A B , ∀t ≥ t0 T Ker W (t, t0 ) = Ker WT = Ker B AB · · · An−1 B , ∀t ≥ t0 n−1 C(A, B) = B AB · · · A B ∈ Rn×nm Matriz de controlabilidad de (Σ) (Σ) (Σ) controlable si y sólo si rang C(A, B) = n 7 Satélite en órbita geoestacionaria 1 0 0 0 1 0 0 2R0 Ω 0 0 1 x(t) + 0 2Ω 0 0 0 − R0 0 1 0 x(t) 0 3Ω2 ẋ(t) = 0 0 0 1 C(A, B) = 0 0 y(t) = 0 0 0 1 0 0 0 1 R0 2Ω − R0 0 2Ω 1 R0 0 −Ω2 2Ω − R0 0 0 2Ω 0 −Ω2 0 0 0 4 Ω2 − R0 2 Ω3 R0 0 −2 Ω3 4 Ω2 − R0 0 0 0 0 u(t) 1 R0 Más en controlsatelite.m 8 Descomposición de Kalman Teorema (Descomposición de Kalman) Si (A, B) no es controlable y rang C(A, B) = r < n, existe T ∈ Gln (R) tal que A A B1 1 2 T −1 AT = TB = 0 A3 0 donde A1 ∈ Rr×r , B1 ∈ Rr×m y (A1 , B1 ) es controlable. ż1 (t) = A1 z1 (t) + A2 z2 (t) + B1 u(t) ż2 (t) = A3 z2 (t) parte no controlable y(t) = C1 z1 (t) + C2 z2 (t) + Du(t) u(t) (z1 ) (A1 , B1 , C1 , 0) C 1 z1 y(t) + + A 2 z2 (z2 ) (A3 , 0, C2 , 0) C2 z2 9 Test PBH de controlabilidad Teorema (A, B) es controlable si y sólo si se cumple cualquiera de las dos siguientes condiciones equivalentes: (i) rang λIn − A B = n para todo λ ∈ C (ii) rang λIn − A B = n para cada valor propio de A. (i) o (ii) =Test PBH 1 . 1 Popov-Belevitch-Hautus 10 Observabilidad de los sistemas lineales Observabilidad= capacidad de determinar el estado del sistema a partir de las salidas (conocido el control). ẋ(t) = A(t)x(t) + Bu(t), t ∈ T (Σ) y(t) = C(t)x(t) + D(t)u(t) Definición de observabilidad (Σ) es observable en [t0 , tf ] si para cualquier entrada u(·) ∈ P C([t0 , tf ], Rm ) el estado inicial x(t0 ) = x0 está determinado de manera única por la salida y(t) en [t0 , tf ]. y(t) = C(t)Φ(t, t0 )x(t0 ) + Z | t C(t)Φ(t, τ )B(τ )u(τ ) dt + Du(t) {z } t0 yr (t)= respuesta forzada La respuesta forzada no juega ningún papel en la determinación de x0 = x(t0 ) a partir del conocimiento de y(·) en [t0 , tf ]. 11 Un criterio de observabilidad Si C(t)Φ(t, t0 )x1 = C(t)Φ(t, t0 )x2 en [t0 , tf ] el sistema no es observable (hay dos estados iniciales distintos que producen la misma salida). La aplicación L : Rn → C ([t0 , tf ], Rp ) es lineal y el x → C(t)Φ(t, t0 )x sistema es no observable si y sólo si Ker L 6= {0}. Ker L=subespacio de sistemas inobservables. Ker L = Ker M (tf , t0 ) donde M (tf , t0 ) es la matriz grammiana de observabilidad: Z tf M (tf , t0 ) = Φ(t, t0 )T C(t)T C(t)Φ(t, t0 ) dt t0 (Σ) es observable en [t0 , tf ] si y sólo si det M (tf , t0 ) 6= 0. El estado inicial determinado por la salida es: Z tf x(t0 ) = M (tf , t0 )−1 Φ(t, t0 )T C(t)T y(t) dt t0 12 Observabilidad de sistemas invariantes en el tiempo (Σ) ẋ(t) = Ax(t) + Bu(t) t ∈ T y(t) = Cx(t) + Du(t) Matriz fundamental de soluciones: Φ(t, t0 ) = eA(t−t0 ) Teorema Fundamental: Si C CA MT = C T AT C T · · · (AT )n−1 C T .. . CAn−1 entonces T Im M (t, t0 ) = Im MT = Im C T AT C T · · · (AT )n−1 C T , ∀t ≥ t0 Ker M (t, t0 ) = Ker MT = Ker C T AT C T · · · (AT )n−1 C T , ∀t ≥ t0 C CA O(A, C) = .. ∈ Rpn×n Matriz de observabilidad de (Σ) . CAn−1 (Σ) observable si y sólo si rang O(A, C) = n 13 Satélite en órbita geoestacionaria 1 0 0 0 1 0 0 2R0 Ω 0 0 1 x(t) + 0 2Ω 0 0 0 − R0 0 1 0 x(t) 0 3Ω2 ẋ(t) = 0 0 y(t) = 0 0 0 0 0 2Ω − R0 0 0 0 u(t) 1 R0 0 1 0 0 2 0 −4Ω 1 0 O(A, C) = 0 6Ω3 − 0 R0 Si y(t) = 1 0 0 0 x(t) el sistema no serı́a observable. 14 El problema de estabilización por feedback Planta v(t) u(t) R Σ + + y(t) w(t) Γ Controlador Planta Controlador ẋ(t) = Ax(t) + Bu(t) ż(t) = Kz(t) + Ly(t) y(t) = Cx(t) u(t) = M z(t) + F y(t) + Rv(t) Conexión: ẋ(t) = Ax(t) + BM z(t) + BF Cx(t) + BRv(t) = = (A + BF C)x(t) + BM z(t) + BRv(t) ż(t) = Kz(t) + LCx(t) Ecuaciones del sistema conectado (sistema en lazo cerrado) ẋ(t) A + BF C BM x(t) BR = + v(t). ż(t) K LC z(t) 0 Si K = 0, L = 0, M = 0: ẋ(t) = (A + BF C)x + BRv(t) feedback de salidas Feedback de estados d(t) 15 Planta Controlador v(t) K + + + + u(t) ẋ(t) = Ax(t) + Bu(t) y(t) = Cx(t) + Du(t) y(t) x(t) −F Ley de control u(t) = −F x(t) + Kv(t) Ecuaciones sistema en lazo cerrado (salidas no afectada y d(t) = 0): ẋ(t) = (A − BF )x(t) + BKv(t) Objetivos Regular la salida y(t) para que siga la señal de referencia v(t) Estabilización Respuesta a un salto o de frecuencia con propiedades especı́ficas (overshoot acotado, tiempos de subida o de ajuste determinados,. . . ) 16 ... Asignabilidad Definición (A, B) es asignable si para cualquier polinomio mónico p(λ) = λn + pn−1 λn−1 + · · · + p1 λ + p0 existe una matriz F ∈ Rm×n tal que A − BF tiene p(λ) como polinomio caracterı́stico. Teorema (Teorema de Asignación de Polos) (A, B) es controlable si y sólo si es asignable. Corolario Dado (A, B) y un polinomio mónico p(λ) de grado n, sea q(λ) el polinomio caracterı́stico de la parte incontrolable de (A, B). Entonces, existe F tal que A − BF tiene p(λ) como polinomio caracterı́stico si y sólo si q(λ)|p(λ). 17 Estabilización por feedback Definición Un sistema (A, B) se dice estabilizable por feedback si existe una matriz F tal que el sistema ẋ = (A + BF )x es estable. Observación: Por el Teorema de Asignación de Polos, si (A, B) es controlable, es estabilizable por feedback. Corolario (A, B) (quizá no controlable) es estabilizable por feedback si y sólo si los valores propios incontrolables del sistema están en el semiplano Re s < 0 18 Procedimiento para calcular la matriz de feedback (m = 1) Dado el sistema controlable (A, b) y el polinomio p(s) = sn + pn−1 sn−1 + · · · + p1 s + p0 : 1 Fórmese la matriz de controlabilidad del sistema C(A, b) 2 Calcúlese su inversa C(A, b)−1 3 Extráigase la última fila de C(A, b)−1 , digamos sT sT sT A 4 Fórmese la matriz T = .. . 5 6 sT An−1 Calcúlese el polinomio caracterı́stico de A: pa (s) = sn + an−1 sn−1 + · · · + a1 s + a0 La matriz de feedback requerida es: f T = p0 − a0 p1 − a1 · · · pn−1 − an−1 T. 19 Sistemas diferenciales no lineales (i. t.) (Σ) ẋ(t) = f (x, u), t∈T x ∈ X ⊂ Rn (estados) y u ∈ U ⊂ Rm (controles), O = X × U abierto, f ∈ C ∞ (O, Rn ). Definición (Controlabilidad global) (Σ) es (globalmente) controlable en [t0 , tf ] ⊂ T si para cada (x0 , x1 ) ∈ X × X existe u(·) ∈ U = P C([t0 , tf ], U ) tal que la solución del P.C.I. ẋ = f (x, u(t)), t ∈ [t0 , t1 ] x(t0 ) = x0 cumple x(tf ) = x1 . Referencias J. M. Coron: Control and Nonlinearity. AMS (2007) Mathematical Surveys and Monographs, vol 136. E. D. Sontag: Mathematical Control Teory. Springer-Verlag (1990). 20 Controlabilidad local de sistemas no lineales Definición (Controlabilidad local) Sea (xe , ue ) un punto de equilibrio de (Σ). Este sistema se dice localmente controlable instantaneamente en (xe , ue ) si para cada número real ε > 0 existe un número real δ > 0 tal que para cada par de puntos x0 , x1 ∈ Bδ (xe ) := {x ∈ Rn : kx − xe k < δ} existe u(·) ∈ P C([0, ε], R) tal que ku(t) − ue k < ε para todo t ∈ [0, ε] y la solución del P.C.I. ẋ = f (x, u(t)), x(0) = x0 cumple x(ε) = x1 . Una condición suficiente Sea (xe , ue ) un punto de equilibrio de ẋ = f (x, u). Si su sistema de control linealizado en (xe , ue ) es controlable entonces el sistema ẋ = f (x, u) es localmente controlable instantaneamente en (xe , ue ). 21 Estabilización de sistemas no lineales por feedback Teorema Sea (Σ) ẋ(t) = f (x(t), u(t)) un sistema continuo invariante en el tiempo de clase C 1 , con X ⊂ Rn y U ⊂ Rm abiertos. Sea (xe , ue ) un punto de equilibrio para (Σ). Sea (A, B) el sistema linealizado de (Σ) en (xe , ue ). Entonces (Σ) es exponencialmente estabilizable si y sólo si (A, B) es estabilizable. Además si F ∈ Rm×n es una matriz de feedback que estabiliza el sistema linealizado (A, B) entonces el feedback u = ue + F (x − xe ) estabiliza el sistema no lineal (Σ) exponencialmente; i.e. el sistema en lazo cerrado ẋ = f (x, ue + F (x − xe )) es exponencialmente estable. Demostración: ver Sección 2.7 de J. Zabczyk: Mathematical Control Theory: An Introduction. Birkhäuser 1992. 22