Control Óptimo - División de Estudios de Posgrado

Anuncio
Introducción al control óptimo
Control Óptimo
Introducción al Control Óptimo
Dr. Fernando Ornelas Tellez
Universidad Michoacana de San Nicolás de Hidalgo
División de Estudios de Posgrado
Facultad de Ingeniería Eléctrica
Morelia, Michoacan
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
1/47
Introducción al control óptimo
Contenido del Curso
1
Introducción al control óptimo
2
Cálculo de variaciones y control óptimo
3
El regulador cuadrático lineal (LQR)
4
Propiedades y diseño del LQR
5
Introducción al control adaptivo
6
Estimación de parámetros (control adaptivo)
7
Sistemas de control adaptivo con modelo de referencia
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
2/47
Introducción al control óptimo
Bibliografía
1
Desineni Subbaram Naidu, “Optimal Control Systems”, CRC
Press, 2003.
2
Brian D. O. Anderson and John B. Moore. “Optimal Control:
Linear Quadratic Methods”, Dover Publications, 2007.
3
Donald E. Kirk. “Optimal Control Theory. An introduction”,
Dover Publications Inc., 1970.
4
Huibert Kwakernaak and Raphael Sivan, “Linear Optimal
Control Systems”, John Wiley and Sons Inc., 1972.
5
Karl J. Astrom and Bjorn Wittenmark, “Adaptive Control”,
Second Edition, Addison Wesley Publishing Co., 1995.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
3/47
Introducción al control óptimo
Contenido
1
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
4/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Introducción al control óptimo
El proceso común para el diseño de controladores clásicos es
mediante un procedimiento a prueba y error hasta alcanzar un
desempeño “aceptable” [3].
Un desempeño aceptable en términos clásicos involucra:
tiempo de subida, tiempo de asentamiento, sobre-impulso,
margenes de fase y ganancia, ancho de banda, etc.
Sin embargo, para sistemas MIMO el problema de diseño se
complica considerablemente.
Por otro lado, el enfoque de control óptimo permite la
obtención de sistemas de control eficientes y con relativa
facilidad.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
5/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Sistemas dinámicos mediante variables de estado
Ventajas
Proveen de un marco para el estudio tanto de sistemas lineales
como no lineales;
Tienen interpretación física.
–
Definition
El estado de un sistema es un conjunto de cantidades x1 , x2 , ..., xn ,
las cuales si se conocen en el instante t = t0 , entonces éstas se
pueden determinar para t ≥ t0 , considerando también que se
conocen las entras aplicadas al sistema.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
6/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Clasificación de sistemas
Lineal: ẋ = Ax + Bu con salida y = Cx + Du;
No lineal: ẋ = f (x, u) con salida y = c(x, u);
Invariante en el tiempo: ẋ = Ax + Bu, ẋ = f (x, u);
Variante en el tiempo: ẋ = A(t)x + B(t)u, ẋ = f (x, u, t).
De igual forma la salida del sistema:
Lineal: y = Cx + Du;
No lineal: y = c(x, u), etc.
Invariante en el tiempo:y = Cx + Du, y = c(x, u);
Variante en el tiempo: y = C (t)x + D(t)u, y = c(x, u, t).
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
7/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Outline
1
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
8/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Optimización [1]
La optimización (obtener buenos resultados en determinado
sentido) siempre es deseable, por ejemplo, usar de forma
optima el tiempo, buen uso de cierto recurso, etc.
La optimización puede ser clasificada en estática y dinámica.
Optimizacion estática
Aborda el problema de controlar un sistema bajo condiciones en
estado estable (las variables no cambian en el tiempo). En este
caso, la planta o sistema esta descrito por ecuaciones algebraicas.
Las herramientas utilizadas son el calculo, multiplicadores de
Lagrange y programación lineal y no lineal.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
9/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Optimización
Optimizacion dinámica
Aborda el problema de controlar un sistema bajo condiciones
dinámicas (las variables del sistema cambian en el tiempo). En este
problema la planta está descrita por ecuaciones diferenciales o en
diferencias. Las técnicas utilizadas son programación dinámica,
calculo variacional y el principio de Pontriagyn.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
10/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Control óptimo
El control óptimo es en realidad el caso de la optimización dinámica.
Objetivo de Control Óptimo
Determinar acciones de control tal que una planta o proceso
satisfaga restricciones físicas y al mismo tiempo minimice (o
maximice) cierto criterio de desempeño [3].
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
11/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Outline
1
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
12/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Índice de desempeño (PI)
En el análisis de control clásico, los criterios de desempeño típicos
en el dominio del tiempo son: tiempo de subida, tiempo de asentamiento, sobre-impulso y error en estado estable. Mientras que en
el dominio de la frecuencia: margen de fase, margen de ganancia y
ancho de banda.
En teoría de control moderno, el problema de control óptimo (PCO)
es determinar un control que mueva al sistema hacia un objetivo o
siga una trayectoria, satisfaciendo un indice de desempeño, mismo
que puede evaluar diferentes intereses.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
13/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Índice de desempeño de tiempo mínimo
En este problema se está interesado en llevar al sistema de un punto
inicial arbitrario x(t0 ) a un punto final predeterminado x(tf ) en el
menor tiempo.
En este caso el índice puede plantearse como
J=
Z tf
t0
dt = tf − t0 = t ∗ .
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
14/47
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Introducción al control óptimo
Índice de desempeño de consumo óptimo de combustible
Considere el control de un avión. Sea u(t) la entrada que impulsa los
motores del avión y considere que la magnitud de tal entrada |u(t)| es
proporcional a la razón de consumo de combustible. La minimización
del consumo de combustible puede plantearse como la minimización
del siguiente índice
Z
tf
J=
|u(t)| dt
t0
o para el caso de múltiples entradas
J=
Z tf m
∑ Ri |ui (t)| dt
t0 i=1
donde Ri es un factor que pondera el consumo de la entrada i-ésima.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
15/47
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Introducción al control óptimo
Índice de desempeño de mínima energía
Considere a ui (t) como la corriente en el i-ésimo lazo de un circuito
2
eléctrico. Entonces ∑m
i=1 ui (t)ri , donde ri es la resistencia del i-ésimo
lazo, es la potencia total o la razón de gasto de energía del circuito. Si se desea minimizar la energía, se puede plantear el indice de
desempeño como
J=
Z tf m
∑ ri ui2 (t) dt
t0 i=1
o de manera general (utilizando matrices)
J=
Z tf
u T (t) R u(t) dt
t0
donde R es una matriz definida positiva.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
16/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Índice de desempeño de seguimiento de trayectorias
De manera semejante se puede considerar el problema de seguimiento, al minimizar un funcional o índice de desempeño como
J=
Z tf
e T (t) Q e(t) dt
t0
donde e(t) = x(t) − xd (t), x(t) es el valor actual del sistema y xd (t)
es el valor deseado para x(t). Q es una matriz semidefinida positiva.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
17/47
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Introducción al control óptimo
Índice de desempeño de condición final o terminal
Este problema aborda el caso del minimizar el error entre el valor
deseado xd (tf ) y la posición del sistema x(tf ). El índice podría plantearse como
J = e T (tf ) F e(tf )
donde e(tf ) = x(tf ) − xd (tf ) y F es una matriz semidefinida positiva.
Al índice anterior también se lo conoce como funcional de costo
terminal.
Índice de desempeño general
Problema de Bolza
z
T
J = e (tf ) F e(tf ) +
|
{z
}
Problema de Mayer
{
i
e (t) Q e(t) + u (t) R u(t) dt
{z
}
Z tf h
t0
|
Dr. Fernando Ornelas Tellez
}|
T
T
Problema de Lagrange
UMSNH-FIE Division de Estudios de Posgrado
18/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Índice de desempeño: comentarios adicionales
Nota
Se pueden plantear diferentes índices de desempeño que considere
otras especificaciones, sin embargo, las mencionadas previamente
(principalmente las de tipo cuadrático) resultan en soluciones
sencillas y elegantes a los problemas de control óptimo.
Se podrían considerar en una funcional de costo especificaciones como: tiempo de subida, tiempo de asentamiento, sobre-impulso, funciones no lineales tanto para el estado como para el control; sin embargo, la solución al problema de control óptimo resultaría complicada y cuya solución seguramente vendría dada de manera aproximada
utilizando algoritmos de optimización.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
19/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Outline
1
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
20/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Componentes de un problema de control óptimo
Cuando un problema está bien planteado, se tiene la mitad de su
solución.
1
La descripción (modelo matemático) del proceso a controlar.
2
Descripción de las restricciones físicas.
3
Especificación de un criterio de desempeño.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
21/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Componentes de un problema de control óptimo
El modelo matemático
El modelado de un sistema es paso importantes para un buen diseño
de control. Este proceso no es trivial. El objetivo es obtener un modelo lo más simple posible que describa adecuadamente la dinámica
del sistema.
Los sistemas que se estudiarán en este curso estarán restringidos a
ecuaciones diferenciales ordinarias.
Considerando
x1 , x2 , ..., xn
como variables de estado del proceso y
u1 , u2 , ..., um
como las entradas de control para el proceso ...
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
22/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Componentes de un problema de control óptimo
El modelo matemático
Entonces un sistema dinámico puede ser descrito por un conjunto de
n ecuaciones diferenciales de primer orden como:
ẋ1 = f1 (x1 , x2 , ..., xn , u1 , u2 , ..., um , t)
ẋ2 = f2 (x1 , x2 , ..., xn , u1 , u2 , ..., um , t)
..
.
ẋn = fn (x1 , x2 , ..., xn , u1 , u2 , ..., um , t)
donde fi es una función no lineal (o bien lineal). En forma compacta
se puede representar como
ẋ = f (x, u, t)
donde x =
x1 x2 · · ·
xn
T
Dr. Fernando Ornelas Tellez
yu=
u1 u2 · · ·
um
T
.
UMSNH-FIE Division de Estudios de Posgrado
23/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Componentes de un problema de control óptimo
El modelo matemático
Ejemplo: Aceleración/desaceleración de un carro
Se desea mover el carro a partir del punto O. La distancia del carro
desde O es denotada por d . Por facilidad, represente el carro
mediante una masa puntual que puede ser acelerada usando un
dispositivo acelerador o desacelerada usando el freno.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
24/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Componentes de un problema de control óptimo
El modelo matemático
La ecuación diferencial que describe el movimiento del carro viene
dada por
d̈ = α + β
donde α es la acción de aceleración y β representa la acción de
desaceleración. Definiendo las variables como x1 = d , x2 = ḋ , u1 = α
y u2 = β , se puede obtener una representación en espacio de estados
como
ẋ1 = x2
ẋ2 = u1 + u2
o de forma matricial ẋ = Ax + Bu, donde A =
0 0
.
1 1
Dr. Fernando Ornelas Tellez
0 1
0 0
y B=
UMSNH-FIE Division de Estudios de Posgrado
25/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Componentes de un problema de control óptimo
Restricciones físicas
Considerando el ejemplo de la aceleración/desaceleración del carro,
en seguida se describen algunas restricciones físicas:
Restricciones sobre la aceleración/desaceleración de un carro
Considere el problema de llevar al carro de la posición O al punto e.
Asuma que el carro parte del reposo y se detiene una vez alcanzado
el punto e.
Las restricciones para el estado pueden plantearse como:
x1 (t0 ) = 0, x1 (tf ) = e, x2 (t0 ) = 0 y x2 (tf ) = 0.
Considerando que el carro no puede ir hacia atrás, entonces:
0 ≤ x1 ≤ e y 0 ≤ x2 .
Los límites para la aceleración y desaceleración,
respectivamente, son: M1 > 0 y M2 > 0.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
26/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Componentes de un problema de control óptimo
Restricciones físicas
Considerando el ejemplo de la aceleración/desaceleración del carro,
en seguida se describen algunas restricciones físicas:
Restricciones sobre la aceleración/desaceleración de un carro
Considere el problema de llevar al carro de la posición O al punto e.
Asuma que el carro parte del reposo y se detiene una vez alcanzado
el punto e.
Las restricciones para el estado pueden plantearse como:
x1 (t0 ) = 0, x1 (tf ) = e, x2 (t0 ) = 0 y x2 (tf ) = 0.
Considerando que el carro no puede ir hacia atrás, entonces:
0 ≤ x1 ≤ e y 0 ≤ x2 .
Los límites para la aceleración y desaceleración,
respectivamente, son: M1 > 0 y M2 > 0.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
26/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Componentes de un problema de control óptimo
Restricciones físicas
En relación a los límites M1 y M2 , las acciones de control
deben satisfacer: 0 ≤ u1 ≤ M1 y −M2 ≤ u2 ≤ 0.
Si además, el carro cuanta con G litros de gasolina para
realizar el recorrido, se puede plantear la siguiente restricción:
Z tf
t0
[k1 u1 + k2 x2 ] dt ≤ G
la cual considera que el gasto de combustible es proporcional a
la aceleración y velocidad del carro, con constantes de
proporcionalidad k1 y k2 , respectivamente.
Definition
Una acción de control que satisface todas restricciones se dice
llamar control admisible.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
27/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Componentes de un problema de control óptimo
Restricciones físicas
En relación a los límites M1 y M2 , las acciones de control
deben satisfacer: 0 ≤ u1 ≤ M1 y −M2 ≤ u2 ≤ 0.
Si además, el carro cuanta con G litros de gasolina para
realizar el recorrido, se puede plantear la siguiente restricción:
Z tf
t0
[k1 u1 + k2 x2 ] dt ≤ G
la cual considera que el gasto de combustible es proporcional a
la aceleración y velocidad del carro, con constantes de
proporcionalidad k1 y k2 , respectivamente.
Definition
Una acción de control que satisface todas restricciones se dice
llamar control admisible.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
27/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Componentes de un problema de control óptimo
Restricciones físicas
Definition
Una trayectoria del estado la cual satisface las restricciones para el
estado para todo tiempo es llamada trayectoria admisible.
El concepto de admisible es muy importante en los sistemas de control, ya que este reduce el rango de valores que pueden tomar tanto
el estado como las acciones de control.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
28/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Componentes de un problema de control óptimo
Índice de desempeño
Para evaluar el desempeño de un sistema de control cuantitativamente, el ingeniero de control debe seleccionar un índice o medida
de desempeño.
Una estrategia de control óptimo está definida como una que minimiza (o maximiza) un índice de desempeño.
En algunos casos, plantear el indice de desempeño pude seleccionarse
para incorporar restricciones físicas, mientras que en otros problemas,
la elección del índice de desempeño es un asunto subjetivo del diseñador. Por ejemplo: “llevar al sistema de un punto A a un punto B
tan rápido como sea posible”, claramente indica que lo que se desea
minimizar el el tiempo; por otro lado, “mantener la posición y velocidad de un sistema cerca de cero can la menor cantidad de energía”
no sugiere un índice de desempeño único.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
29/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Componentes de un problema de control óptimo
Índice de desempeño
Para evaluar el desempeño de un sistema de control cuantitativamente, el ingeniero de control debe seleccionar un índice o medida
de desempeño.
Una estrategia de control óptimo está definida como una que minimiza (o maximiza) un índice de desempeño.
En algunos casos, plantear el indice de desempeño pude seleccionarse
para incorporar restricciones físicas, mientras que en otros problemas,
la elección del índice de desempeño es un asunto subjetivo del diseñador. Por ejemplo: “llevar al sistema de un punto A a un punto B
tan rápido como sea posible”, claramente indica que lo que se desea
minimizar el el tiempo; por otro lado, “mantener la posición y velocidad de un sistema cerca de cero can la menor cantidad de energía”
no sugiere un índice de desempeño único.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
29/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Componentes de un problema de control óptimo
Índice de desempeño
Ejemplo: Índice de desempeño para el carro
Suponga que el objetivo es que el carro alcance el punto e tan
rápido como sea posible.
Entonces el indice de desempeño podría plantearse como
J = tf − t0 .
Un índice de desempeño general a considerarse puede ser
J = h (x(tf ), tf ) +
Z tf
g (x, u, t) dt
t0
donde h y g son funciones escalares. El tiempo tf puede ser especificado o “libre”, dependiendo del planteamiento del problema.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
30/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Planteamiento del problema de control óptimo
Problema de control óptimo
Determinar un control admisible u ∗ el cual cause que el sistema
ẋ = f (x, u, t)
siga una trayectoria admisible x ∗ que minimice el índice de
desempeño
Z
J = h (x(tf ), tf ) +
tf
g (x, u, t) dt.
t0
u ∗ es llamado control óptimo y x ∗ una trayectoria óptima.
Comentarios adicionales: no es posible determinar con anticipación
si un control óptimo existe, y además podría no ser único.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
31/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Planteamiento del problema de control óptimo
Comentarios adicionales
Cuando se dice que u ∗ causa que el índice de desempeño es minimizado, esto significa que
J ∗ , h (x ∗ (tf ), tf ) +
≤ h (x(tf ), tf ) +
Z tf
Z
t0
tf
g (x ∗ , u ∗ , t) dt
g (x, u, t) dt
t0
para todo u y x. La desigualdad anterior establece que un control
óptimo y su trayectoria produce un valor del índice de desempeño
más pequeño o igual al índice de desempeño para cualquier otro
control admisible y su respectiva trayectoria.
Por tanto, es deseable determinar el mínimo global de J y no un
resultado de carácter local.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
32/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Planteamiento del problema de control óptimo
Comentarios adicionales
Definition
Si se encuentra una relación funcional de la forma
u ∗ = k(x, t)
para el control óptimo, entonces k es llamada ley de control óptima.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
33/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Outline
1
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
34/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Revisión histórica del desarrollo del control óptimo [1]
Cálculo de variaciones
El control óptimo, bajo la técnica de calculo de variaciones, busca
determinar una función la cual sea un extremo (máximo o mínimo) de
una funcional. Muchos científicos han contribuido a su desarrollo bajo
diferentes enfoques: cálculo de variaciones, programación dinámica
de Bellman, principio de Pontriagyn.
Se iniciará esta reseña histórica con los trabajos de Bernoulli, considerando los indicios matemáticos para dar solución al problema de
control óptimo, aunque en épocas anteriores ya se tenia el concepto
de optimizar o elegir la mejor solución a un problema.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
35/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Revisión histórica del desarrollo del control óptimo
Cálculo de variaciones
En 1699, Johannes Bernoulli (1667-1748) planteo el problema
de la braquistócrona: encontrar la trayectoria para el descenso
más rápido de una partícula entre dos puntos, no considerando
que los puntos estén sobre la horizontal o sobre la vertical.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
36/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Revisión histórica del desarrollo del control óptimo
Cálculo de variaciones
El problema de la braquistócrona inicialmente fue bosquejado
por Galileo (1564-1642) in 1638, y posteriormente fue resuelto
por Bernoulli, su hermano Jacob Bernoulli (1654-1705), por
Gottfried Leibniz (1646-1716) y de forma anónima por Isaac
Newton (1642-1727).
Leonard Euler (1707-1783) en colaboración con John
Bernoulli, y que al mismo tiempo influenciaron sobre
Joseph-Louis Lagrange (1736-1813), realizaron contribuciones
importantes al campo, quienes de forma elegante resolvieron
problemas de control óptimo usando el método de la primera
variación. Lo anterior lleva a Euler en 1755 a introducir el
concepto de cálculo de variaciones.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
37/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Revisión histórica del desarrollo del control óptimo
Cálculo de variaciones
Posteriormente, el calculo de la primera variación (condición
necesaria para la optimalidad) fue llamada ecuación de
Euler-Lagrange.
Lagrange introdujo también el método del multiplicador
(multiplicadores de Lagrange), el cual es una de las
herramientas más sólidas para resolver problemas de
optimización.
Las condiciones suficientes para la determinación de extremos
de funcionales fue desarrollado por Andrien Marie Legendre
(1752-1833) en 1786, mediante la segunda variación.
Carl Gustav Jacob Jacobi (1804-1851) en 1836 introdujo un
análisis más riguroso de las condiciones de suficiencia, misma
que posteriormente fue llamada condición de Legendre-Jacobi.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
38/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Revisión histórica del desarrollo del control óptimo
Cálculo de variaciones
Sir William Rowan Hamilton (1788-1856) realizó
contribuciones en mecánica, describiendo el movimiento de
una partícula en el espacio. En 1838 Jacobi modificó los
resultados de Hamilton, lo que llevo al desarrollo de la
ecuación de Hamilton-Jacobi.
La ecuación de Hamilton-Jacobi influencio considerablemente
en el calculo de variaciones y programación dinámica, control
optimo y áreas de la mecánica.
Adolph Mayer planteo de una manera elegante el problema
general del calculo de variaciones.
En 1913, Bolza generalizo los problemas planteados por
Lagrange y Mayer para el problema de variaciones.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
39/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Revisión histórica del desarrollo del control óptimo [1]
Teoría de control óptimo (LQR)
El LQR tiene sus orígenes en el trabajo de N. Wiener sobre
filtrado en promedio cuadrático utilizado durante la segunda
guerra mundial (1940-1945).
Wiener resolvió el problema del diseño de filtros que minimizan
un criterio
deerror cuadrático medio de la forma
J = E e 2 (t) , donde e(t) es el error y E {x} representa el
valor esperado para la variable aleatoria x.
R. Bellman in 1957 introdujo la programación dinámica para
resolver problemas de control óptimo en tiempo discreto.
La contribución más importante al control óptimo fue la de L.
S. Pontryagin (Rusia) en 1956 y su grupo, al desarrollar el
principio del máximo.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
40/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Revisión histórica del desarrollo del control óptimo
Teoría de control óptimo (LQR)
En 1960, R. E. Kalman (83 años a la fecha 2013) desarrolla la
teoría del LQR y LQG para el diseño de controladores por retro
de estado.
Kalman introdujo también la representacion en espacio de
estados para un sistema dinámico y definió la controlabilidad y
la observabilidad en ese marco.
Lo anterior derivo en el filtro de Kalman (para sistemas
discretos) y en el filtro de Kalman-Bucy (para sistemas
continuos).
La ecuación de Riccati aparece en la solución para el filtro de
Kalman y control óptimo (basado programación dinámica).
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
41/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Revisión histórica del desarrollo del control óptimo
Teoría de control óptimo (LQR)
J. F. Riccati (1676-1754) publico sus resultados en 1724,
donde describía la solución para algunas ecuaciones
diferenciales no lineales. Este resultado tomó importancia
después de más de 200 años.
El LQR, en general, no se considera como robusto ante
perturbaciones, de ahí que en los años 1980 surge el control
H∞ por G. Zames. Al control LQR también se le etiqueto como
H2 .
Control clásico y control moderno
La teoría de control clásico analiza los sistemas (SISO
particularmente) en el dominio de la frecuencia, mientras que el
control moderno trabaja en el dominio del tiempo para sistemas
SISO y MIMO, lineales y no lineales, etc.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
42/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Introducción al control óptimo
Ventajas del Control Óptimo: Caso Lineal
La estabilidad del control óptimo lineal (LQR) en lazo cerrado
es garantizada si el sistema de control cumple que: R > 0,
Q ≥ 0, el par (A, B) es estabilizable y el par (A, C ) es
detectable, donde Q = C T C [2].
El control óptimo (LQR), “por default” provee de un margen
de ganancia infinito, i.e., GM = ∞ y un margen de fase (FM)
de al menos 60◦ . Lo anterior se puede considerar como
“buenos” márgenes de estabilidad, y son propiedades de
“robustez” que todo diseño de control debería proveer. La
primera propiedad permitiría aumentar una ganancia
(teóricamente) infinita sin que el sistema se desestabilice. Por
otro lado, la segunda propiedad permite tener ciertas
variaciones paramétricas o retardos en el sistema de control,
los cuales afectarían el margen de fase del sistema, sin llegar a
desestabilizar
al sistema
de control
[2]. Division de Estudios de Posgrado
Dr. Fernando
Ornelas Tellez
UMSNH-FIE
43/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Introducción al control óptimo
Ventajas del Control Óptimo: Caso Lineal
Un LQR tiene un índice de funcionamiento (funcional de costo)
que justamente evalúa el desempeño del sistema de control.
La sintonización del LQR se hace regularmente a prueba y
error, pero cumpliendo las condiciones del punto uno, no se
afectaría la estabilidad en lazo cerrado, independientemente de
la elección de Q y R [2].
Los valores Qii y Rii son seleccionados de acuerdo a la
importancia relativa de cada variable de estado y de control.
Lo anterior permite que la selección de las matrices Q y R, sea
un método intuitivo para determinar su valor.
Existen métodos (Reglas de Bryson), que incluso permiten
incorporar restricciones para las variables de estado y de
control, mediante una elección adecuada de los valores Qii y
Rii .
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
44/47
Introducción al control óptimo
Problema de optimización y control óptimo
Índice de desempeño y las restricciones
Formulación del problema de control óptimo
Revisión histórica
Introducción al control óptimo
Ventajas del Control Óptimo: Caso Lineal
En los diseños tradicionales (ubicación de polos, por ejemplo)
para un sistema MIMO, el seleccionar la ganancia K en un
controlador u = −Kx, tiene múltiples soluciones, es decir, en
general se pueden tener varias K ’s, para ubicar los polos en el
mismo lugar. ¿Cuál ganancia es la mejor?
El control óptimo busca mover al sistema mediante una
entrada, tal que la energía necesario para lograrlo sea mínima
[3].
La solución al problema de control óptimo es sumamente
elegante y formal.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
45/47
Appendix
For Further Reading
For Further Reading I
Desineni Subbaram Naidu,
Optimal Control Systems,
CRC Press, 2003.
Brian D. O. Anderson and John B. Moore,
Optimal Control: Linear Quadratic Methods,
Dover Publications, 2007.
Donald E. Kirk,
Optimal Control Theory. An introduction,
Dover Publications, 1970.
Huibert Kwakernaak and Raphael Sivan,
Linear Optimal Control Systems,
John Wiley and Sons Inc., 1972.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
46/47
Appendix
For Further Reading
For Further Reading II
S. Someone.
On this and that.
Journal on This and That. 2(1):50–100, 2000.
Dr. Fernando Ornelas Tellez
UMSNH-FIE Division de Estudios de Posgrado
47/47
Descargar