El Regulador Lineal Cuadrático

Anuncio
PS2316. Control óptimo. El regulador linear cuadrático LQR
Williams Colmenares M.
Universidad Simón Bolı́var
Departamento de Procesos y Sistemas
4 de marzo de 2006
1.
Introducción
Hasta ahora hemos presentado métodos que construyen la ley de control como una de realimentación de estados en la que, si el sistema es controlable, los polos del sistema de lazo cerrado
pueden ubicarse en cualquier locación del plano “s”. De igual forma, hemos presentado posibles
ubicaciones de los polos del sistema que aseguran una respuesta temporal predeterminada.
En este capı́tulo presentaremos un enfoque diferente a la construcción de la ley de control,
que se basa en encontrar una ley de control que minimice la suma de los esfuerzos de control y
las desviaciones de la señal de salida de su valor deseado. Este problema se conoce como el de
Control Óptimo. Pasemos ahora a formular este problema.
Considere un sistema modelado en representación de estados de la forma:
ẋ(t) = Ax(t) + Bu(t)
y(t) = Cx(t)
(1)
donde x(t) ∈ Rn y las señales de entrada y salida (u(t), y(t)) son escalares.
Se desea encontrar una ley de control uopt (t) que minimice:
Z ∞
(xT (t)Qx(t) + ru2 (t))dt
J(x, u) =
0
La solución del problema de optimización planteado, que demostraremos en el apéndice, es:
uopt (t) = −Kopt x(t) = −r −1 B T P x(t)
donde la matriz P se obtiene de la siguiente ecuación algebraica de Riccati:
AT P + P A − P Br −1 B T P + Q = 0
(2)
es decir, la ley de control óptima resulta ser una de realimentación de estados en la que la
ganancia de realimentación se obtiene de una ecuación algebraica de Riccati.
Recordemos que la función de transferencia asociada al sistema (1) es:
G(s) = C(sI − A)−1 B
1
Supongamos que Q = C T C, se puede demostrar (ver apéndice) que, si el par (A, C) es
observable, los autovalores de A − BKopt , i.e. los polos del sistema óptimo de lazo cerrado, son
las raı́ces estables de:
∆(s) = 1 + r −1 G(s)G(−s) = 0
(3)
Basándonos en este hecho podemos utilizar la estrategia de Control Óptimo para ubicar los
polos del sistema en las locaciones que salgan del Lugar de las Raı́ces (3).
2.
Caso de estudio
Retomemos el sistema que hemos venido trabajando en estos apuntes, al que le hemos añadido
un integrador (la tercera variable de estado) para asegurar rechazo perfecto de perturbaciones
estacionarias.


 



ẋ1 (t)
x1 (t)
−3 −0,25 0
0,5
 ẋ2 (t)  =  8
 +  0  u(t)
0
0   R x2 (t)
y(t)
(y(τ )dτ )
0
0,5 0
0
{z
}
|
| {z }
A
B


x
(t)
1
£
¤

0 0,5 0  R x2 (t)
y(t) =
(y(τ )dτ )

x1 (t)
£
¤
R


0 0 1
x2 (t)
y(τ )dτ =
|
{z
} R (y(τ )dτ )
C
que equivale,Ren representación entrada salida, entre la señal de control y la nueva variable de
estado (u → y), a:
2
G(s) =
2
s(s + 3s + 2)
Observe que:
G(−s) =
(−s3
−2
+ 3s2 − 2s)
El Lugar de las Raı́ces de 1 + kG(s)G(−s) se muestra en la figura (1).
Observe que, con k = 0,22, todos los polos que se obtendrı́an con la estrategia de Control
Óptimo serı́an reales (dos de ellos en -0.682) por lo que la respuesta serı́a del tipo sobreamortiguada (sin oscilación), con un tiempo de estabilización del orden de 6 s.
Tomemos Q = C T C y r = 1/k, entonces:


0 0 0
Q =  0 0 0  ; r = 4,5.
0 0 1
Resolviendo (2) se obtiene:


6,8900 2,7486 4,2426
P =  2,7486 1,1124 1,7940  ;
4,2426 1,7940 3,4170
Kopt =
2
£
0,7656 0,3054 0,4714
¤
Root Locus
6
4
Imag Axis
2
0
System: t
Gain: 0.22
Pole: −0.682
Damping: 1
Overshoot (%): 0
Frequency (rad/sec): 0.682
−2
−4
−6
−8
−6
−4
−2
0
2
4
6
8
Real Axis
Figura 1: Lugar de las Raı́ces. Ubicación de polos de ∆(s).
Los polos del sistema a lazo cerrado están en: −2,0177 y −0,6825 ± 0,0375i. El margen de
fase es de 72o y el del ganancia 21 dB.
La respuesta del sistema a lazo cerrado se muestra en la figura (2).
3
Step Response
1
0.9
0.8
0.7
Amplitude
0.6
0.5
0.4
0.3
0.2
0.1
0
0
2
4
6
8
10
12
Time (sec)
Figura 2: Lugar de las Raı́ces. Ubicación de polos de ∆(s).
4
Descargar