También puede obtener el "pdf" del libro aquí.

Anuncio
Indice general
1 Introduccion al problema del control realimentado
1
1.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : :
1
1.2 Los benecios de la realimentacion : : : : : : : : : : : : : : : : : : :
2
1.3 Sensibilidad en bucle abierto y en bucle cerrado. : : : : : : : : : : : : 3
1.4 Analisis y dise~no en presencia de incertidumbres : : : : : : : : : : : : 5
1.5 Posibles planteamientos : : : : : : : : : : : : : : : : : : : : : : : : :
6
1.6 Sistemas de tiempo continuo y de tiempo discreto : : : : : : : : : : : 7
2 Control adaptativo
9
2.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : :
9
2.2 Controladores adaptativos con modelo de referencia (MRAC) : : : : : 13
2.3 Reguladores autoajustables (STR) : : : : : : : : : : : : : : : : : : : : 16
2.4 Ejemplo simple : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 17
2.5 >Porque control adaptativo? : : : : : : : : : : : : : : : : : : : : : : : 19
2.6 El problema del control adaptativo : : : : : : : : : : : : : : : : : : : 23
i
ii
Indice general
3 Algoritmo de identicacion de parametros
27
3.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 27
3.2 Modelo del sistema y de las perturbaciones : : : : : : : : : : : : : : : 28
3.3 Metodo de mnimos cuadrados : : : : : : : : : : : : : : : : : : : : : : 29
3.3.1 Caso determinista : : : : : : : : : : : : : : : : : : : : : : : : : 30
3.3.2 Caso no determinista : : : : : : : : : : : : : : : : : : : : : : : 30
3.3.3 Metodo recursivo : : : : : : : : : : : : : : : : : : : : : : : : : 32
3.4 Metodo de mnimos cuadrados extendidos y generalizados : : : : : : : 33
3.5 Aproximacion estocastica : : : : : : : : : : : : : : : : : : : : : : : : : 33
3.6 Metodo de variable instrumental : : : : : : : : : : : : : : : : : : : : : 34
3.7 Metodo de maxima verosimilitud : : : : : : : : : : : : : : : : : : : : 35
3.8 Modicaciones al algoritmo de identicacion : : : : : : : : : : : : : : 35
3.9 Algoritmos de identicacion rapidos : : : : : : : : : : : : : : : : : : : 38
3.10 Estimacion de los valores de continua : : : : : : : : : : : : : : : : : : 38
3.11 Algoritmo de identicacion propuesto : : : : : : : : : : : : : : : : : : 39
3.12 Convergencia e identicabilidad : : : : : : : : : : : : : : : : : : : : : 41
3.13 Ejemplo de identicacion : : : : : : : : : : : : : : : : : : : : : : : : : 44
4 Control adaptativo por modelo de referencia
47
4.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 47
4.2 Dise~no de controladores adaptativos : : : : : : : : : : : : : : : : : : : 48
4.2.1 Enfoque de sensibilidad : : : : : : : : : : : : : : : : : : : : : : 49
Indice general
iii
4.2.2 Metodo de Lyapunov : : : : : : : : : : : : : : : : : : : : : : : 50
4.2.3 Metodo de hiperestabilidad : : : : : : : : : : : : : : : : : : : 54
4.3 Estructura general de los sistemas adaptativos (MRAC) : : : : : : : : 55
4.4 Ejemplos ilustrativos : : : : : : : : : : : : : : : : : : : : : : : : : : : 58
4.4.1 Metodo del gradiente : : : : : : : : : : : : : : : : : : : : : : : 60
4.4.2 Metodo de Lyapunov : : : : : : : : : : : : : : : : : : : : : : : 62
4.4.3 Metodo de hiperestabilidad : : : : : : : : : : : : : : : : : : : 66
5 Reguladores autoajustables (STR)
73
5.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 73
5.2 Asignacion de polos y ceros : : : : : : : : : : : : : : : : : : : : : : : 76
5.3 Casos particulares : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 80
5.4 Prediccion optima : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 81
5.5 Regulador de mnima varianza : : : : : : : : : : : : : : : : : : : : : : 83
5.6 Control predictivo generalizado : : : : : : : : : : : : : : : : : : : : : 85
5.6.1 Formulacion del control predictivo generalizado : : : : : : : : 86
5.6.2 Consideracion de ruidos coloreados : : : : : : : : : : : : : : : 91
5.7 Controladores para plantas con parametros desconocidos : : : : : : : 92
5.8 Algoritmos con estructura explcita e implcita : : : : : : : : : : : : : 93
5.9 Propiedad de autosintona : : : : : : : : : : : : : : : : : : : : : : : : 96
5.10 Procedimiento de sntesis : : : : : : : : : : : : : : : : : : : : : : : : : 98
5.11 Ejemplos ilustrativos : : : : : : : : : : : : : : : : : : : : : : : : : : : 99
iv
Indice general
5.11.1 Ejemplo de mnima varianza : : : : : : : : : : : : : : : : : : : 99
5.11.2 Control adaptativo PI : : : : : : : : : : : : : : : : : : : : : : 100
5.11.3 Control de robot movil : : : : : : : : : : : : : : : : : : : : : : 102
6 Autoajuste y ajuste por tabla de controladores
113
6.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 113
6.2 Control PID : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 115
6.3 Metodos de respuesta transitoria : : : : : : : : : : : : : : : : : : : : 116
6.3.1 Metodo de respuesta en escalon de Ziegler-Nichols : : : : : : : 117
6.3.2 Caracterizacion de la respuesta en escalon : : : : : : : : : : : 117
6.4 Metodos basados en realimentacion con rele : : : : : : : : : : : : : : 118
6.4.1 El metodo del balance armonico : : : : : : : : : : : : : : : : : 119
6.4.2 El metodo de Ziegler-Nichols en bucle cerrado : : : : : : : : : 121
6.4.3 Oscilaciones de rele : : : : : : : : : : : : : : : : : : : : : : : : 121
6.5 Ajuste por tabla : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 123
6.6 Dise~no de reguladores con ajuste por tabla : : : : : : : : : : : : : : : 124
6.6.1 Actuador no lineal : : : : : : : : : : : : : : : : : : : : : : : : 125
6.6.2 Tanque de seccion variable : : : : : : : : : : : : : : : : : : : : 126
6.6.3 Transformacion no lineal : : : : : : : : : : : : : : : : : : : : : 129
7 Aplicacion de control adaptativo
133
7.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 133
Indice general
v
7.2 Descripcion de la planta : : : : : : : : : : : : : : : : : : : : : : : : : 134
7.3 Modelo dinamico del campo : : : : : : : : : : : : : : : : : : : : : : : 136
7.3.1 Modelo concentrado : : : : : : : : : : : : : : : : : : : : : : : 136
7.3.2 Modelo distribuido : : : : : : : : : : : : : : : : : : : : : : : : 137
7.4 Control en adelanto : : : : : : : : : : : : : : : : : : : : : : : : : : : : 140
7.5 Control en bucle cerrado : : : : : : : : : : : : : : : : : : : : : : : : : 140
7.5.1 Controlador PI : : : : : : : : : : : : : : : : : : : : : : : : : : 141
7.5.2 Controlador PI por asignacion de polos : : : : : : : : : : : : : 142
7.5.3 Controlador autoajustable : : : : : : : : : : : : : : : : : : : : 143
7.5.4 Controlador PID adaptativo : : : : : : : : : : : : : : : : : : : 144
7.5.5 Controlador predictivo generalizado : : : : : : : : : : : : : : : 146
7.5.6 Supervision : : : : : : : : : : : : : : : : : : : : : : : : : : : : 148
7.6 Estudios de simulacion : : : : : : : : : : : : : : : : : : : : : : : : : : 150
7.7 Resultados en planta : : : : : : : : : : : : : : : : : : : : : : : : : : : 152
8 El problema del control robusto
159
8.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 159
8.2 Relaciones fundamentales : : : : : : : : : : : : : : : : : : : : : : : : 163
8.3 Descripcion de las incertidumbres : : : : : : : : : : : : : : : : : : : : 171
8.4 Estabilidad robusta : : : : : : : : : : : : : : : : : : : : : : : : : : : : 176
8.5 Comportamiento robusto : : : : : : : : : : : : : : : : : : : : : : : : : 187
8.6 Robustez de plantas con fuerte ganancia direccional : : : : : : : : : : 190
vi
Indice general
9 Metodos de dise~no LTR
197
9.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 197
9.2 Propiedades del regulador LQR : : : : : : : : : : : : : : : : : : : : : 198
9.3 El controlador LQG : : : : : : : : : : : : : : : : : : : : : : : : : : : : 204
9.4 Controlador LTR basado en observador : : : : : : : : : : : : : : : : : 207
9.4.1 Metodo LQG/LTR-i : : : : : : : : : : : : : : : : : : : : : : : 207
9.4.2 Metodo LQG/LTR-o : : : : : : : : : : : : : : : : : : : : : : : 210
9.5 Controlador LTR no basado en observador : : : : : : : : : : : : : : : 212
9.6 Controlador LTR=H1 : : : : : : : : : : : : : : : : : : : : : : : : : : 221
10 Controladores H1
227
10.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 227
10.2 Justicacion del control H1 : : : : : : : : : : : : : : : : : : : : : : : 228
10.2.1 Interpretacion H1 del comportamiento nominal : : : : : : : : 228
10.2.2 Interpretacion H1 de la estabilidad robusta : : : : : : : : : : 231
10.2.3 Control H1 y la teora de juegos diferencial : : : : : : : : : : 233
10.3 Planteamiento del problema general de control : : : : : : : : : : : : : 234
10.3.1 Problema de seguimiento : : : : : : : : : : : : : : : : : : : : : 237
10.3.2 Problema de estabilidad robusta : : : : : : : : : : : : : : : : : 238
10.4 Parametrizacion de los controladores : : : : : : : : : : : : : : : : : : 239
10.4.1 El problema de ajuste del modelo : : : : : : : : : : : : : : : : 242
10.4.2 Aplicabilidad del teorema de Nehari : : : : : : : : : : : : : : : 244
Indice general
vii
10.5 Soluciones al problema de ajuste del modelo : : : : : : : : : : : : : : 246
10.5.1 El problema escalar : : : : : : : : : : : : : : : : : : : : : : : : 246
10.5.2 Optimizacion del comportamiento nominal : : : : : : : : : : : 248
10.6 Problemas de control H2; H1 en el espacio de estados : : : : : : : : : 253
10.6.1 Controlador optimo H2 : : : : : : : : : : : : : : : : : : : : : : 255
10.6.2 Relacion entre LQG/LTR y H2 : : : : : : : : : : : : : : : : : 257
10.6.3 Controlador H1 : : : : : : : : : : : : : : : : : : : : : : : : : : 259
10.6.4 Algoritmo de calculo del regulador H1 : : : : : : : : : : : : : 262
10.6.5 Ejemplos ilustrativos : : : : : : : : : : : : : : : : : : : : : : : 264
11 Aplicacion de control robusto
277
11.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 277
11.2 Descripcion de la planta : : : : : : : : : : : : : : : : : : : : : : : : : 280
11.3 Evaluacion de los controladores : : : : : : : : : : : : : : : : : : : : : 291
11.4 Dise~no de controladores LTR multivariables : : : : : : : : : : : : : : 292
11.4.1 Dise~no LTR-o : : : : : : : : : : : : : : : : : : : : : : : : : : : 293
11.4.2 Dise~no LTR-i : : : : : : : : : : : : : : : : : : : : : : : : : : : 297
11.5 Dise~no de controladores H2 y H1 multivariables : : : : : : : : : : : : 304
11.5.1 Controladores H1 para sistema de orden elevado : : : : : : : 306
11.5.2 Regulador H1 para una planta no lineal : : : : : : : : : : : : 313
11.6 Sntesis de los resultados obtenidos : : : : : : : : : : : : : : : : : : : 318
viii
Indice general
A Analisis de los sistemas de control basados en observador
321
A.1 Analisis de robustez con y sin observador : : : : : : : : : : : : : : : : 321
A.2 Condicion suciente para la recuperacion : : : : : : : : : : : : : : : : 323
A.3 Planteamiento del Metodo LQG en el Dominio de la Frecuencia : : : 325
A.4 Regulador LQG obtenido mediante ecuacion diofantica : : : : : : : : 329
B Elementos matematicos utiles en la teora de control
331
B.1 Polos y ceros de un sistema multivariable : : : : : : : : : : : : : : : : 331
B.2 Normas : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 333
B.3 Los Valores Singulares : : : : : : : : : : : : : : : : : : : : : : : : : : 334
B.4 Los Valores Propios : : : : : : : : : : : : : : : : : : : : : : : : : : : : 337
B.5 La Matriz de Ganancia Relativa : : : : : : : : : : : : : : : : : : : : : 339
C Deniciones y algoritmos relacionados con la teora H1
343
C.1 Algunas deniciones : : : : : : : : : : : : : : : : : : : : : : : : : : : 343
C.2 El operador de Riccati : : : : : : : : : : : : : : : : : : : : : : : : : : 345
C.3 El problema de aproximacion de Hankel : : : : : : : : : : : : : : : : 346
C.4 El algoritmo de Glover : : : : : : : : : : : : : : : : : : : : : : : : : : 348
Indice general
ix
x
Indice general
Prologo
Este libro pretende ser una puesta al da sobre el control de sistemas en los que no se
conoce con precision su dinamica. Para ello se aborda el problema desde dos puntos
de vista diferentes, como son las tecnicas de Control Adaptativo y las metodologas
de dise~no de Controladores Robustos.
A lo largo del libro se procede a describir ambos enfoques y se ilustran con
algunos ejemplos teoricos, as como mediante la exposicion de dos aplicaciones a
procesos reales. Los captulos 2 al 7 se dedican a las tecnicas de control adaptativo
y los captulos 8 al 11 al control robusto.
El libro esta organizado en once captulos. El primero constituye una introduccion al tema, y en el se tratan cuestiones relativas al control realimentado y
a los posibles enfoques para tener en cuenta la presencia de incertidumbres en los
sistemas reales.
El captulo segundo se dedica a una descripcion de las tecnicas de dise~no de
controladores adaptativos. Los algoritmos de identicacion de parametros se describen en el captulo 3, siendo estos una parte esencial de los sistemas de control
adaptativos.
Los captulos 4 y 5 se dedican a describir en profundidad las dos tecnicas basicas
de control adaptativo, como son, los controladores adaptativos por modelo de referencia (MRAC) y los controladores adaptativos autoajustables (STR).
En el captulo 6 se describen varias tecnicas de autoajuste y ajuste por tabla de
controladores. Estas tecnicas, sin ser consideradas por muchos autores como adaptativas, son de gran utilidad y aplicabilidad en el control de procesos industriales.
Las tecnicas descritas en los captulos 2 al 6 son aplicadas en el captulo 7, al
control de un proceso real particularmente interesante, como es el control de un
campo de colectores solares cilndrico parabolico tipo acurex, disponible en la
planta solar de Tabernas (Almera).
En el captulo 8 se hace una introduccion al problema del control robusto,
deniendose algunos conceptos clave en el estudio de la robustez de sistemas de
control. El captulo 9 se dedica a las metodologas de dise~no ltr o metodologas
de recuperacion de la funcion de transferencia. Aunque estas tecnicas fueron desarrolladas inicialmente para el controlador lqg, hoy en da han transcendido para
convertirse en tecnicas de ajuste de funciones de transferencia.
El captulo 10 se dedica a la tecnica de dise~no de controladores robustos conocida
como H1. Dado que esta metodologa esta hoy en da en permanente desarrollo,
existe una gran variedad de posibles algoritmos. En este libro se presenta el planteamiento inicial para resolver el problema de control H1, as como algunas de las
metodologas basadas en la descripcion por variables de estado.
Por ultimo, el captulo 11 se dedica a la aplicacion de los desarrollos planteados
en los captulos 8, 9 y 10 al control de un barco. Para ello, se presentan distintos desarrollos para control multivariable, haciendo especial enfasis en el grado de
robustez que se consigue, evaluado mediante distintos ndices de comportamiento.
El libro esta compuesto de material recogido de apuntes y notas impartidas
a alumnos de cursos de doctorado y de artculos publicados por los autores. El
material de este libro ha servido y sirve en la actualidad, como parte fundamental
de un curso de doctorado. El libro va dirigido a una gran variedad de personas, el
unico requisito es tener unos conocimientos basicos de la teora de control.
Agradecimientos
Los autores desean expresar su agradecimiento a las personas que de distintas formas
han hecho posible este libro. En primer lugar a Javier Aracil y Eduardo F. Camacho,
por sus valiosas sugerencias, estmulos y consejos.
Tambien deseamos expresar nuestro agradecimiento a todos los compa~neros de
los Departamentos de Ingeniera de Sistemas y Automatica de las Universidades
de Sevilla y Cadiz, especialmente a Manolo Berenguel y Carlos Bordons por sus
aportaciones en la elaboracion de pruebas en la Planta Solar de Almera. As mismo
a Julio Terron y Manuel Haro por su disponibilidad y cooperacion.
Parte del material incluido en el libro es el fruto del trabajo de investigacion
realizado, que ha sido nanciado por la cicyt y el ciemat. Deseamos expresar
nuestro agradecimiento a estas instituciones por su nanciacion.
Tambien deseamos expresar nuestro agradecimiento al departamento de Sistemas
de la Fabrica de Artillera y Sistemas de la empresa bazan en San Fernando (Cadiz)
y en especial a Francisco Gonzalez Mene, que nos motivo en el estudio y aplicacion
de las tecnicas de control robusto.
Por ultimo damos las gracias a nuestras familias por el apoyo, paciencia y tiempo,
durante la escritura del libro, sin lo cual, este libro no habra sido posible.
Sevilla, Diciembre de 1995
Francisco Rodrguez Rubio
Ing. de Sistemas y Automatica
Escuela Superior de Ingenieros
41012 - Sevilla
E-mail: [email protected]
Cadiz, Diciembre de 1995
Manuel Jesus Lopez Sanchez
Ing. de Sistemas y Automatica
Facultad de Ciencias Nauticas
11510 - Puerto Real. Cadiz
E-mail: [email protected]
Captulo 1
Introduccion al problema del
control realimentado
1.1 Introduccion
En la conguracion estandar de un sistema de control, la planta y el controlador
forman un bucle cerrado en el que cada componente ejerce una inuencia sobre
el otro. La entrada a la planta u depende a traves del controlador de la variable
controlada y, la cual a su vez depende de la entrada por la dinamica de la planta.
Este fenomeno se llama realimentacion.
La realimentacion se considera como un concepto general para controlar sistemas
tecnicos, ecologicos o sociales. Las plantas qumicas, por ejemplo, tienen cientos de
bucles para hacer que las temperaturas, presiones o ujos permanezcan en los niveles
dados a pesar de la inuencia de las se~nales externas no medibles. Controladores
multivariables mas complejos son utilizados para procesos con dos o mas se~nales
acopladas fuertemente, tales como sistemas de aire acondicionado, columnas de destilacion, plantas de generacion de energa electrica, calderas de vapor o aviones.
Pretendemos ver los sistemas realimentados desde el punto de vista del control
ingenieril, el cual tiene por mision encontrar un controlador para conseguir o mantener la estabilidad, mejorar la robustez, atenuar las perturbaciones, asegurar la
regulacion asintotica, etc. Un sistema realimentado consta de un proceso dado con
unas propiedades jas y de un controlador que puede elegirse libremente.
1
2
Los benecios de la realimentacion
1.2 Los benecios de la realimentacion
Los sistemas realimentados muestran varias propiedades importantes porque el comportamiento del sistema global esta dado por las propiedades de la interaccion de
cada una de las partes. La realimentacion hace posible estabilizar sistemas inestables, mejorar la robustez ante variaciones del comportamiento de algunas partes
del sistema, o atenuar las pertubaciones externas no medibles. Hay muchas razones
para introducir deliberadamente la realimentacion en procesos que funcionan bien.
El principal benecio de la realimentacion no puede deducirse sin la consideracion de las incertidumbres en el comportamiento de la planta. Hay dos razones
por las que la salida de la planta y, para una entrada dada u, produce una trajectoria que no esta completamente determinada previamente. Primero, la dinamica
de la planta no se conoce completamente, por lo que el modelo de la planta solo
puede considerarse como una aproximacion mas que como una descripcion exacta.
Segundo, perturbaciones desconocidas pueden inuir en el comportamiento del sistema. En este caso, la salida y no es solo la respuesta a la se~nal de control u, sino
a la perturbacion d, que es generalmente indeterminada en el sentido que puede ser
cualquier cosa dentro de un conjunto de posibles se~nales de perturbacion (gura
1.1).
e
6
r -
d
K (s)
u-
G(s)
- ?
y
-
Figura 1.1: Control en bucle cerrado
Indeterminaciones de esta clase ocurren en menor o mayor medida en todos los
problemas de control, porque a causa del proceso de modelado y dise~no, el sistema
a ser controlado tiene que ser considerado fuera de su entorno. Usualmente no es
facil saber que fenomenos tienen que ser considerados como parte de la planta o
como conexiones entre la planta y su entorno y cuales no. Bajo estas circunstancias
Introduccion al problema del control realimentado
3
es importante conocer que las principales propiedades de los sistemas realimentados
dependen solo debilmente de tales indeterminaciones. Robustez frente a elementos
de dinamicas inmodeladas y perturbaciones, pueden igualmente ser considerados
como una propiedad estructural de los sistemas realimentados. Como la se~nal de
control u es calculada por el controlador dependiendo del valor actual de y, hay que
tener en cuenta el efecto de las se~nales de control anteriores y de las perturbaciones.
Esta propiedad fundamental de los sistemas realimentados se hace evidente por
la comparacion de las conguraciones de los sistemas de control en bucle abierto
y en bucle cerrado. El control en bucle abierto esta basado en la exactitud del
modelo de la planta, dado que la se~nal de control se calcula en base al modelo. Los
efectos que resultan de las dos clases de indeterminaciones aparecen enteramente
como desviaciones de la trajectoria resultante sobre la respuesta especicada. Sin
embargo, en el control en bucle cerrado, se compara el valor actual de la salida y
con la se~nal de referencia r, y la entrada a la planta se calcula dependiendo de la
se~nal de error. Ademas de la informacion dada a priori acerca de la planta en forma
de un modelo matematico, el control realimentado usa el conocimiento acerca del
comportamiento actual de la planta y de las perturbaciones existentes, lo cual es
suministrado implcitamente por la medida del valor de y.
La introduccion de la realimentacion esta principalmente motivada por el conocimiento incompleto del sistema a ser controlado y por el efecto de las perturbaciones externas. Mas estrictamente, el uso de la realimentacion puede verse como
no justicable, si no hay indeterminaciones en el sistema, porque para sistemas no
perturbados, el control en bucle abierto produce la misma o probablemente mejor
respuesta.
1.3 Sensibilidad en bucle abierto y en bucle cerrado.
Sea un sistema cuya funcion de transferencia en bucle abierto es G(s). Si la funcion
de transferencia en bucle cerrado es T (s) se tendra que en el dominio de frecuencias
de interes, es decir, para ! 2 [0; ], siendo la frecuencia angular que dene el
ancho de banda para el que se proyecta el sistema, se tendra que,
T (s) ' 1
es decir, se pretende que en el anterior dominio de frecuencias la reproduccion de
4
Sensibilidad en bucle abierto y en bucle cerrado.
las se~nales sea lo mas el posible.
Se sabe que la relacion que liga a G(s) y a T (s) es
T (s) = 1 +G(Gs()s)
Por lo tanto, puesto que T ' 1 para todas las frecuencias de interes, se tendra que
G 1 para ! 2 [0; ]
(1:1)
Se dene la sensibilidad de un sistema, dado por su funcion de transferencia T (s),
como la variacion que sufre esta funcion de transferencia como consecuencia de la
variacion de uno de los parametros p que interviene en la misma. Se denota por
SpT la sensibilidad de la funcion de transferencia T (s) con respecto a variaciones del
parametro p. Formalmente se escribe:
on de T (s)
SpT = %%variaci
variacion de p
lo que a su vez puede escribirse
SpT = dT=T
= dT p
dp=p dp T
Supongase, que uno de los parametros que aparecen en G(s) sufre una variacion
(por envejecimiento, efecto de perturbaciones exteriores, etc.). La sensibilidad de la
funcion de transferencia en bucle cerrado T (s) a la variacion de un parametro de
G(s) sera:
1
SGT = (1 +1G)2 G
=
T 1+G
lo que habida cuenta de la expresion 1.1 conduce a SGT 1 es decir, un sistema en
bucle cerrado tiene una sensibilidad a las variaciones de los elementos que constituyen la cadena en bucle abierto mucho menor que 1.
Este resultado debe compararse con la sensibilidad de un sistema en bucle abierto
G = G1G2, que puede escribirse,
SGG1 = 1
Se concluye de lo anterior que la introduccion de la realimentacion reduce notablemente la sensibilidad del sistema con respecto a la variacion de los parametros.
Es este un resultado fundamental que justica sobradamente la introduccion de la
realimentaccion en el dise~no de sistemas de control.
Introduccion al problema del control realimentado
5
1.4 Analisis y dise~no en presencia de incertidumbres
La mayora de los metodos de analisis y dise~no para sistemas realimentados presuponen que se dispone de un modelo sucientemente exacto del proceso a controlar o
del sistema en bucle cerrado, respectivamente. En este modelo esta jado, tanto la
estructura del modelo como los parametros. Aunque algunos de los metodos hacen
algunas consideraciones sobre el efecto de las posibles incertidumbres, el tratamiento
y atenuacion de las pertubaciones no son su principal razon de ser.
Sin embargo, un enfoque mas realista para el control por realimentacion tiene
que tener en cuenta las imprecisiones del modelo, lo cual es la principal razon para
la utilizacion de la realimentacion. Otra forma de abordar el problema es tratar con
principios y metodos que nos permitan considerar explcitamente las discrepancias
entre el modelo y el proceso real. Esto es, intentar analizar y dise~nar el controlador
sin tener un modelo matematico preciso de la planta. Intentar obtener resultados
que no solo sean validos para el modelo aproximado, sino que lo sean para un rango
de modelos de la planta dados y en consecuencia para el proceso real.
La conveniencia de investigaciones teoricas sobre el analisis y dise~no de sistemas
robustos pone de maniesto que la robustez es una cuestion fundamental en los
sistemas realimentados que ha sido explorada desde hace bastante tiempo (Dorato
1987, Grimble 1994). Conforme a la declaracion de que un ingeniero encuentra una
herramienta y una solucion para cada problema, puede ser tosco, ya que muchos
bucles de control tienen que operar sin ningun modelo matematico. Las bien conocidas reglas de Ziegler y Nichols y similares, son un ejemplo obvio para un ingeniero
practico, el cual se ha basado originalmente en un modelo aproximado simple, pero
que es utilizado sucesivamente sin conrmacion del grado de aproximacion de este
tipo de modelos para el proceso bajo consideracion.
Sin embargo, sin un profundo conocimiento de los benecios de la realimentacion,
el campo de aplicaciones de los controladores lineales invariantes en el tiempo, para el
caso de desconocimiento del proceso, variable con el tiempo o no lineal, debe quedar
mucho mas limitado. Experiencias practicas y ejemplos academicos muestran que
una mera introduccion a la realimentacion no garantiza obtener los requerimientos
de robustez e insensibilidad frente a las imprecisiones del modelo. La realimentacion
debe estar relacionada con la clase y cantidad de incertidumbre del modelo y con
las propiedades que seran preservadas.
Desde el punto de vista ingenieril, las investigaciones teoricas sobre la robustez
6
Posibles planteamientos
de los sistemas realimentados, deben estar encaminadas a,
determinar las capacidades fundamentales de la realimentacion lineal para
controlar plantas con incertidumbres, y
elaborar procedimientos de analisis y dise~no practicos.
La primera tarea concierne a preguntas como: > Que incertidumbre del modelo puede
ser tolerada por el controlador lineal ? > Que estructura debe tener el controlador
? > Bajo que condiciones debe ser dise~nado el controlador para que asegure la
estabilidad (integridad) en el caso de fallo del sensor o actuador ? La segunda tarea
es claro que va hacia la explotacion sistematica de la robustez.
1.5 Posibles planteamientos
Principalmente, para el dise~no de controladores a partir de modelos de la planta que
son lineales e invariantes con el tiempo, hay dos posibles enfoques para contemplar
las incertidumbres en el modelo del sistema y las perturbaciones sobre este (Grimble
1994). El primero de ellos es utilizar un controlador adaptativo, el cual estima
los parametros y calcula la se~nal de control basandose en dichos parametros. La
metodologa de los reguladores autoajustables es la adecuada en este caso, pero
conlleva el dise~no en lnea, con el esfuerzo de calculo necesario para ello, mucho
mayor que en el caso de un regulador mas simple.
El segundo enfoque es considerar las incertidumbres del sistema en el dise~no de un
controlador jo, lo cual lleva a un esquema de control robusto, que es mas insensible a
las variaciones en los parametros y a las perturbaciones. Existen distintas losofas
para hacer esto, desde el calculo de un controlador lqg con recuperacion de la
funcion de transferencia del lqr, lo cual conduce a un controlador robusto llamado
lqg/ltr, a considerar la minimizacion de una cierta norma de una funcion de
transferencia. Las normas mas empleadas son la norma H2 y la norma H1.
Tambien estan apareciendo recientemente en la literatura enfoques combinados
de los mencionados anteriormente. Por ejemplo el dise~no de sistemas de control
robustos H1 adaptativos. Aunque estos enfoques son difciles de tratar por el momento.
A lo largo de este texto nos centraremos en algunos aspectos de ambos enfoques,
tratando de ilustrar la aplicacion al control de procesos.
Introduccion al problema del control realimentado
7
1.6 Sistemas de tiempo continuo y de tiempo
discreto
Las se~nales de interes en el control de sistemas (se~nales de control, error, salida de los
actuadores, etc.), son usualmente se~nales en tiempo continuo y las especicaciones
(ancho de banda, sobreoscilacion, tiempo de subida, etc.), se formulan tambien en
tiempo continuo. Pero dado que la tecnologa digital ofrece multiples benecios,
los sistemas de control actuales emplean tecnologa digital para la realizacion de los
controladores. Un controlador digital ejecuta basicamente tres funciones: muestrea
y cuantica una se~nal de tiempo continuo (tal como el error de seguimiento) para
obtener una se~nal digital; procesa esta se~nal digital utilizando un computador digital;
y posteriormente convierte la se~nal digital resultante a una se~nal de tiempo continuo.
Este proceso involucra sistemas de tiempo continuo y sistemas de tiempo discreto.
Los sistemas muestreados operan en tiempo continuo, pero algunas se~nales de
tiempo continuo son muestreadas en ciertos instantes de tiempo (normalmente de
forma periodica), produciendo se~nales de tiempo discreto. Por ello, los sistemas
muestreados son sistemas hbridos, que involucran ambos tipos de se~nales.
La sntesis de un controlador digital puede efectuarse de acuerdo con los tres
metodos alternativos siguientes:
Discretizacion de controladores analogicos.
Discretizacion de la planta y dise~no en tiempo discreto.
Dise~no directo utilizando la representacion en tiempo discreto.
En el primer caso se emplean los metodos basados en la utilizacion de representaciones en tiempo continuo para determinar un controlador analogico que posteriormente se discretiza (por ejemplo mediante la tranformacion bilineal), obteniendose
una descripcion del controlador como un sistema de tiempo discreto. La ventaja
de este metodo es que el dise~no se realiza en tiempo continuo donde las especicaciones se dan de forma natural. Este metodo es valido siempre y cuando el periodo
de muestreo sea lo sucientemente peque~no para que la actuacion del controlador
digital se aproxime a la del analogico. Esto lleva a que se necesite un hardware
mas potente y caro, por lo que hay que llegar a un compromiso entre el coste y la
precision del controlador aproximado.
8
Sistemas de tiempo continuo y de tiempo discreto
En el segundo caso se utilizan tecnicas especcas en tiempo discreto, contemplandose especcamente los procesos de muestreo y reconstruccion de se~nales.
En este caso se utiliza una representacion equivalente del conjunto como un sistema
de tiempo discreto. La ventaja de este metodo es su simplicidad. Por contra, el
enfoque ignora completamente que ocurre entre los instantes de muestreo, y por
otro lado las especicaciones de tiempo continuo no siempre se pueden trasladar
de forma clara a tiempo discreto. Por ultimo, si el periodo de muestreo cambia, el
controlador debe ser redise~nado.
En el tercer caso el controlador se dise~na directamente para el sistema de tiempo
discreto. La ventaja es que en este caso se resuelve el problema sin aproximaciones.
A lo largo de los proximos captulos, se describen tecnicas de dise~no de controladores tanto para sistemas en tiempo continuo como para sistemas en tiempo
discreto. En algunos casos los desarrollos teoricos estan demostrados para sistemas
continuos, no existiendo hasta el momento desarrollos equivalentes para sistemas en
tiempo discreto, siendo necesario por tanto, para la realizacion digital de estos controladores emplear el primer tratamiento de los tres mencionados. En otros casos el
planteamiento se realiza directamente para sistemas en tiempo discreto, por lo que
su realizacion es mas directa.
En otras ocasiones, debido a la naturaleza del proceso de identicacion se dispone
de una descripcion en tiempo discreto y los controladores a dise~nar estan basados
en la teora de sistemas de tiempo continuo. En este caso se calcula la aproximacion
de tiempo continuo del sistema (por ejemplo mediante la tranformacion bilineal
inversa), se dise~na el controlador y posteriormente se deshace el cambio para la
realizacion del controlador en un computador digital.
Captulo 2
Control adaptativo
2.1 Introduccion
El termino adaptativo signica cambiar el comportamiento conforme a nuevas circunstancias. Un regulador adaptativo es un regulador que puede modicar su comportamiento en respuesta a cambios en la dinamica del sistema y a las perturbaciones.
Este mismo objetivo es el de la inclusion de la realimentacion en el bucle de control,
por lo que surge la pregunta de cual es la diferencia entre control realimentado y
control adaptativo.
Existen muchas deniciones de control adaptativo, siendo una de las mas aceptadas, que control adaptativo es un tipo especial de control no lineal en el que el
estado del proceso puede ser separado en dos escalas de tiempo que evolucionan a
diferente velocidad. La escala lenta corresponde a los cambios de los parametros
y por consiguiente a la velocidad con la cual los parametros del regulador son modicados, y la escala rapida que corresponde a la dinamica del bucle ordinario de
realimentacion.
El esquema basico de control adaptativo, (Landau 1974) segun puede verse en
la gura 2.1, esta compuesto de un bucle principal de realimentacion negativa, en el
que actua al igual que en los sistemas convencionales un regulador y de otro bucle
en el que se mide un cierto ndice de funcionamiento, el cual es comparado con el
ndice deseado y se procesa el error en un mecanismo de adaptacion que ajusta los
parametros del regulador y en algunos casos actua directamente sobre la se~nal de
control. Tambien puede existir un tercer bucle dedicado a supervisar la marcha de
9
10
Introduccion
los dos bucles anteriores (Isermann 1982), en orden a asegurar la estabilidad del
sistema y a mejorar la actuacion del conjunto.
El mecanismo de adaptacion presenta una solucion en tiempo real al problema
de dise~no para sistemas con parametros conocidos, aunque como veremos mas adelante, puede ir a un tiempo de muestreo superior al correspondiente al regulador e
identicador.
La caracterstica fundamental que distingue a los sistemas adaptativos es la presencia de un bucle de control en el que se compara un ndice de funcionamiento
(Landau 1981).
?
r -
Actuacion
Deseada
?
Comparacion
Decision
6
- Controlador
Ajustable
-u 6
- Mecanismo
de
Adaptacion
Perturbacion
?
y
-
Planta
?
?
Medida del
Indice de
Actuacion
Figura 2.1: Conguracion basica de control adaptativo
Existen muchos tipos de controladores que proporcionan buenas caractersticas
de regulacion en presencia de cambios de los parametros del sistema y que segun la
denicion anterior no son realmente adaptativos, puesto que la adaptacion se realiza
en bucle abierto.
Un ejemplo muy utilizado de control adaptativo en bucle abierto es el denominado Cambio por tabla1. Consiste en la modicacion de los parametros del controlador a partir de una tabla que ha sido calculada previamente para distintos puntos
de funcionamiento, en funcion de una variable auxiliar. Un caso tpico es el control
de vuelo de un avion, cuyo regulador puede ser cambiado en funcion de la altura de
este.
1
En la terminologa inglesa se denomina Gain Scheduling
Control adaptativo
11
Mecanismo
de
Adaptacion
r
C
e - Controlador
Ajustable
6
-
Medida de
la Variable
auxiliar
u
- Planta
Medio
Ambiente
y
-
C
CW
Figura 2.2: Sistema adaptativo en bucle abierto
En la gura 2.2, se presenta esquematicamente este tipo de controladores. Se
supone que existe una fuerte relacion entre la variable auxiliar y la dinamica de
los parametros del sistema. Este tipo de adaptacion tiene la ventaja de que el
controlador puede ser cambiado muy rapidamente, dependiendo de la rapidez con
que la variable auxiliar reeje el cambio de la dinamica del proceso, siendo muy
importante la eleccion de dicha variable. Sin embargo estos reguladores consumen
mucho tiempo en la realizacion de la tabla de parametros, presentando as mismo
algunos problemas en la conmutacion de unos parametros a otros.
Segun sean dise~nados los bloques descritos anteriormente, podemos tener uno
u otro tipo de control adaptativo, pudiendose dividir principalmente en dos grupos: Controladores adaptativos con modelo de referencia (mrac) y Reguladores
autoajustables (str).
mrac y str pueden ser considerados como una aproximacion a la solucion del
problema de control adaptativo. La hipotesis que justica la aproximacion es que
para cualquier juego de valores posibles de los parametros de la planta y las perturbaciones, existe un controlador lineal con una complejidad jada, tal que el conjunto
de controlador y planta tienen caractersticas preespecicadas.
1. Los controladores adaptativos con modelo de referencia, intentan alcanzar para
una se~nal de entrada denida, un comportamiento en bucle cerrado dado por
un modelo de referencia.
2. Los reguladores adaptativos autoajustables, tratan de alcanzar un control
optimo, sujeto a un tipo de controlador y a obtener informacion del proceso y
12
Introduccion
sus se~nales.
Estas dos tecnicas han sido desarrolladas separadamente durante varios a~nos,
pudiendose demostrar su equivalencia en muchos casos. Las ventajas de mrac
estan en su rapida adaptacion para una entrada denida y en la simplicidad de
tratamiento de la estabilidad utilizando la teora de estabilidad de sistemas no lineal. Sin embargo, no se adapta convenientemente si la se~nal de entrada al sistema
tiene poca riqueza. El str tiene la ventaja de que se adapta para cualquier caso y
en particular para perturbaciones no medibles, teniendo al mismo tiempo una estructura modular, lo que hace posible la programacion por bloques, siendo facil de
realizar distintos reguladores.
En este captulo se hace una breve introduccion a las distintas variantes de control
adaptativo, describiendose las ventajes e inconvenientes de estos controladores. En
captulos posteriores se analizan con mas detalle cada uno de ellos.
Hasta la actualidad han sido propuestas varias formas de dise~no del algoritmo
de control de un sistema lineal, pudiendose clasicar estas de diferentes maneras,
siendo una posible, en funcion de que el criterio de dise~no sea optimo o no optimo,
pudiendose destacar entre ellos los siguientes :
1. Criterio optimo:
Controlador de mnima varianza de Astrom y Wittenmark 1973.
Controlador de mnima varianza generalizado de Clarke y
Gawthrop 1975,1979.
Controladores predictivos generalizados Clarke y Gawthrop 1988.
2. Criterio no optimo:
Asignacion de polos y ceros (Wellstead et al. 1979).
Asignacion de polos y ceros (Astrom y Wittenmark 1980).
Controlador en tiempo mnimo (Isermann 1981).
Regulador PID (Ortega 1982).
Control adaptativo
13
2.2 Controladores adaptativos con modelo de referencia (MRAC)
Los sistemas adaptativos con modelo de referencia fueron dise~nados primeramente
para sistemas continuos por minimizacion de un ndice de actuacion, siendo dicho
ndice la integral del error al cuadrado (Hang 1973). Esta regla de dise~no fue propuesta por Whitaker del MIT (1958), Instrumentation Laboratory, denominandose
por ello como la regla del MIT.
En cuanto a las conguraciones posibles con modelo de referencia, la mas usual
es utilizar un modelo paralelo (gura 2.3), aunque son posibles otras conguraciones
(Landau 1974, 1981), como modelo serie, serie-paralelo, etc.
Mecanismo
de
Adaptacion
CC
- Controlador
Ajustable
6
r - ?
uPlanta
BBN
de
- Modelo
Referencia
yp -
?
6
ym
Figura 2.3: Estructura con modelo de referencia (MRAC)
Existe una dualidad entre los sistemas de control adaptativo a un modelo de
referencia y el problema de identicacion con un modelo ajustable, siendo en este
caso el modelo de referencia la planta a identicar.
Dado un modelo de referencia Gm (s; p) y un sistema ajustable Ga(s; p^), el cual
se desea que siga al modelo para que el error sea nulo (o mnimo en el caso de la
presencia de perturbaciones), se dene el ndice de funcionamiento:
14
Controladores adaptativos con modelo de referencia (MRAC)
Z
J = 12 e2 dt ; e = ym ya
ym
ya
p^
salida del modelo de referencia,
salida del modelo ajustable,
parametro a ajustar.
Usando la tecnica de optimizacion del gradiente (Landau 1981) se tiene que la
regla de adaptacion es:
@J
^p(e; t) = Kgrad(J ) = K
@ p^
siendo ^p la variacion de p^ con relacion al ultimo valor calculado y K es la ganancia
de adaptacion.
La variacion del parametro ajustable con relacion al tiempo sera:
@ @J
p^_ = ddtp^ = K @t
@ p^
!
Si se asume variacion lenta de la ley de adaptacion, se puede intercambiar el
orden de las derivadas:
!
@
@J
p^_ = K @ p^ @t = K @@p^ 12 e2
p^_ = Ke @@ep^
La ley de adaptacion (2.1) representa la regla del M.I.T.
luego,
@e = @ (ym ya) = @ya
@ p^
@ p^
@ p^
a
p^_ = Ke @y
@ p^
(2:1)
Control adaptativo
15
La @ya =@ p^ es la funcion de sensibilidad del modelo ajustable con respecto al
parametro. En este caso la funcion de sensibilidad es proporcional a ym, quedando
la ley de adaptacion de la forma :
p^_ = K1 e ym
Esta regla ha sido muy popular debido a su simplicidad. Sin embargo para el
caso de ajuste de varios parametros requiere un numero elevado de funciones de
sensibilidad (tantas como parametros). Por otro lado la ganancia de adaptacion gobierna la velocidad de respuesta, si esta es muy grande el sistema puede ser inestable
y si es muy peque~na la velocidad sera muy lenta. Para obtener un buen compromiso entre velocidad de respuesta y estabilidad es necesario un laborioso estudio por
simulacion.
Otra tecnica de dise~no se fundamenta en la utilizacion del segundo metodo de
Lyapunov, el cual tiene la ventaja de que asegura la estabilidad global para cualquier
valor de la ganancia de adaptacion y cualquier tipo de entrada. La principal desventaja de este metodo es que se requiere el conocimiento del vector de estado, que no
siempre es accesible. Otra desventaja es que no es aplicable a los casos donde los
parametros del conjunto planta mas controlador no pueden ser modicados directamente.
6
-
-
w
Parte lineal
e invariante
en el tiempo
Parte no-lineal
y/o variable
en el tiempo
-
v
Figura 2.4: Separacion del sistema (Hiperestabilidad)
Landau (1981) propone una tecnica de dise~no basada en el concepto de hiperestabilidad y en la teora de estabilidad de Popov. El concepto de hiperestabilidad
esta relacionado con la estabilidad de una clase de sistemas, tales que pueden ser
16
Reguladores autoajustables (STR)
separados en dos bloques, gura 2.4. Este sistema esta formado por una parte lineal
invariante en el tiempo y otra no lineal y/o variable en el tiempo.
Si la entrada y salida de la parte no lineal estan relacionadas por la desigualdad
de Popov :
Zt
n(0; t) = v w dt Yo2; 8t > 0:
0
donde v es la entrada y w la salida e Yo2 es una constante nita positiva independiente
de t, el problema de encontrar la estabilidad absoluta de este sistema, se concreta
en averiguar las condiciones que debe de cumplir la parte lineal para que el conjunto
sea estable.
Para dise~nar la ley de adaptacion mediante esta tecnica se tienen que seguir los
pasos que se detallan a continuacion de forma resumida :
1. Transformar el sistema con modelo de referencia en uno equivalente que tenga
la estructura de la gura 2.4.
2. Encontrar la ley de adaptacion para que se cumpla la desigualdad de Popov.
3. Encontrar la parte de la ley de adaptacion que aparezca en la parte lineal para
que el conjunto del sistema sea globalmente estable.
4. Volver al sistema original y formular la ley de adaptacion explcitamente.
Una discusion extensa de esta tecnica puede encontrarse en el libro de Landau
(1981), resultando en casos particulares que la ley de adaptacion es de la forma
proporcional + integral o proporcional + integral + derivada. Con esta tecnica se
garantiza la estabilidad del conjunto, siendo su principal desventaja que a menudo
son necesarios una serie de diferenciadores.
2.3 Reguladores autoajustables (STR)
El diagrama de bloques de estos controladores se puede ver en la gura 2.5; en el se
distinguen tres partes claramente diferenciadas:
un algoritmo recursivo de estimacion de parametros
Control adaptativo
17
un mecanismo de adaptacion que desarrolla la tarea de dise~no del regulador y
un regulador con parametros ajustables.
Estos reguladores conforman una estructura suboptima basada en el principio de
separacion de las tareas de control e identicacion. El dise~no se hace de forma que
se suponen parametros conocidos y despues estos son sustituidos por sus estimados.
Desde el punto de vista del control estocastico de sistemas no lineales, es claramente un controlador que aplica el principio de equivalencia cierta (supone que los
parametros identicados coinciden con los reales).
Actuacion
Deseada
6
-
Dise~no del - Controlador
BB
- Controlador
Ajustable
Estimacion de
- la Planta
s
- Planta
s
-
BBN
Figura 2.5: Esquema del regulador autoajustable (STR)
La idea de los reguladores autoajustables puede ser aplicada a muchos problemas de control que no son formulados como un problema de control estocastico.
Dada la modularidad y la separacion del control e identicacion, pueden formarse
muchas clases de reguladores autoajustables por combinacion de diferentes metodos
de dise~no e identicadores.
2.4 Ejemplo simple
A continuacion se describe un ejemplo simple (Astrom 1980), en el que se ilustra
el problema de control adaptativo y las aproximaciones mas usuales. Supongase el
18
Ejemplo simple
sistema discreto cuya ecuacion en diferencias es de la forma:
y(t + 1) = y(t) + bu(t) + e(t)
donde y es la salida del proceso, u, la se~nal de control, e, es un ruido blanco y b, un
parametro jo.
Se quiere minimizar el criterio:
!
N
1X
2
J = Nlim
E
!1
N 1 y (t)
Cuando se conoce el parametro b, la ley de control que minimiza el criterio es:
u(t) = y(t)=b; =) y(t + 1) = e(t)
Si no se conoce el parametro b, pero se sabe que en el instante t tiene una
distribucion gausiana normal de media ^b(t) y covarianza P (t). El problema de
control que tiene en cuenta el estado, en este caso la salida y(t), ^b(t) y P (t) llevara
consigo la resolucion de la ecuacion de Bellman, que para este caso podra ser resuelta
numericamente. Este sera el problema del control Dual. Sin embargo se pueden
hacer aproximaciones, derivandose una de ellas de aplicar el principio de equivalencia
cierta, para lo cual se empleara la ley de control:
u(t) = y(t)=^b(t)
Si las estimaciones de ^b(t) son malas y llega a tomar un valor peque~no, el esfuerzo
de control puede llegar a ser muy grande. Una forma de evitar esto es utilizar el
control cauteloso siguiente:
^
u(t) = ^2 b(t) y(t)
b (t) + P (t)
El control cauteloso puede presentar algunos problemas debido a la incertidumbre
de la estimacion, dado que para P (t) >> ^b2(t), u(t) puede ser muy peque~na y al
tener poca riqueza la identicacion es pobre, con lo que se incrementa P (t), por lo
que u(t) puede llegar a ser cero. Si este control se aplica a un proceso estable, el
fenomeno se llama apagado, ya que el proceso ira a un punto de funcionamiento,
igual al que tena sin control. Si se aplica a un proceso inestable, al ser u(t) = 0,
la salida puede ser muy grande y no se podra controlar al sistema, en este caso el
fenomeno se conoce como escape.
Control adaptativo
19
2.5 >Porque control adaptativo?
Dado que un controlador adaptativo es un sistema no lineal en el que es necesario
ajustar una serie de parametros, es importante explorar bajo que circunstancias es
insuente utilizar un controlador jo y sera necesario un controlador adaptativo.
Un controlador convencional esta pensado para controlar sistemas (la mayor
parte de las veces lineales), cuyos parametros permanecen constantes. Esto es una
buena aproximacion en la mayor parte de los casos, cuando se pretende regular
un sistema en un punto jo de operacion. Cuando exiten pertubaciones, si estas
son peque~nas, dicha aproximacion continua siendo suciente para obtener un buen
control. Sin embargo, la aproximacion en torno a un punto de funcionamiento no
suele seguir siendo buena, si el punto de funcionamiento cambia.
Vamos a ver mediante algunos ejemplos, cuando es suciente un regulador jo o
cuando es necesario otro tipo de control, o un controlador adaptativo. En general
no es inmediato decidir el tipo de control que se necesitara. Es necesario estudiar
cada caso en particular antes de decidirse por el tipo de control a aplicar.
Actuador no lineal
Muchos actuadores poseen caractersticas no lineales, las cuales crean dicultades
para el control.
yr
-
e
6
Planta
Gc
u
- Valvula v- G0
y-
Figura 2.6: Diagrama de bloques de sistema realimentado
Supongase un sistema lineal (gura 2.6), con un regulador PI cuyo actuador es
una valvula con la caracterstica,
v = f (u) = u4; u 0
20
>Porque control adaptativo?
Linealizando el sistema en torno al punto de operacion estacionario, puede demostrarse que la ganancia del bucle es proporcional a la derivada de la funcion f (u).
Se deduce entonces que el sistema puede funcionar correctamente en un punto de
trabajo y pobremente en otros. Esto puede ilustrarse particularizando el sistema de
la gura 2.6 con:
1
1
G0 (s) = (s + 1)3 ; Gc(s) = K 1 + T s ; K = 0:15; Ti = 1:0
i
En la gura 2.7 puede verse la respuesta a un escalon de distinta magnitud, la cual
pone de maniesto el hecho de tener distinto comportamiento dependiendo del valor
del escalon (punto de funcionamiento).
Sistema de depositos interconectados
Otro ejemplo particularmente interesante es aquel en el que existen tanques y
tuberas largas interconectados. Supongase un sistema como el de la gura 2.8 en
el que se pretende controlar la concentracion en el segundo tanque.
La ecuacion diferencial que controla dicho proceso viene dada por:
Vm dcdt(t) = q(t) [cin(t ) c(t)]
donde,
= Vqd ; T = Vqm
que cuando se aplica la transformada de Laplace queda,
s
Gp(s) = 1 e+ Ts
sistema de primer orden en el que varan la constante de tiempo T y el retardo
asociado .
Si se simula a este sistema en bucle cerrado con un regulador PI con constantes
K = 0:5 y Ti = 1:1, puede verse que el comportamiento de este sistema vara
considerablemente con las variaciones de caudal (gura 2.9).
Con estos ejemplos se pone maniesto que existen muchos procesos que pueden
ser candidatos para aplicar control adaptativo. Si la modicacion de los parametros
Control adaptativo
21
0.4
0.3
0.2
0.1
0
0
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
1.5
1
0.5
0
0
a
8
6
4
2
0
0
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
15
10
5
0
0
b
Figura 2.7: Respuesta a diferentes escalones
22
>Porque control adaptativo?
b""b"b
Cin
Vd
Vm C
-
Figura 2.8: Sistema de tanques interconectados
1.6
1.4
1.2
cs
1
0.8
0.6
0.4
0.2
0
0
1
2
3
4
5
6
7
8
9
tiempo
Figura 2.9: Respuestas a escalon para diferentes caudales
10
Control adaptativo
23
es conocida, puede aplicarse un controlador ajustable por tabla (gain scheduling),
pero cuando existen partes del sistema cuya variacion no conocemos y no podemos
medir (por ejemplo la carga de un robot), un buen candidato es aplicar control
adaptativo identicando solo la parte que desconocemos.
2.6 El problema del control adaptativo
Los ejemplos de la seccion anterior muestran porque es necesario utilizar control
adaptativo. Ellos ponen de maniesto que los procesos industriales son bastante
complejos y la variacion de parametros no puede determinarse desde un primer
momento. Por lo tanto, puede ser ventajoso emplear esfuerzo en desarrollar controladores mas inteligentes. Un controlador mas complejo puede utilizarse para
diferentes procesos y por tanto el mayor costo en el desarrollo puede compartirse
entre las diversas aplicaciones. Sin embargo, es muy importante recordar que la utilizacion de un controlador adaptativo no sustituye el buen conocimiento del proceso
que es necesario para elegir las especicaciones, la estructura del controlador y el
metodo de dise~no.
Como se ha visto en las secciones precedentes, un controlador adaptativo debe
contener:
Una ley de control con parametros ajustables.
Caracterizacion de la respuesta del sistema en bucle cerrado (Modelo de referencia o las especicaciones para el dise~no).
Procedimiento de dise~no.
Actualizacion de parametros basado en las medidas.
Realizacion de la ley de control.
Estas partes son un poco diferentes para los distintos esquemas de control adaptativo, pero tienen muchos factores comunes.
Existe hoy en da una separacion entre la teora y la practica en control adaptativo. En teora es posible manejar situaciones idealizadas. En la practica se utilizan
algoritmos bastante complejos, que introducen reglas concretas para manejar las
24
El problema del control adaptativo
posibles dicultades encontradas durante el analisis o con la experiencia de la aplicacion.
El hecho de que haya variaciones signicativas en la respuesta en bucle abierto,
no signica necesariamente que sea necesario un controlador adaptativo. Esto puede
ilustrarse con los siguientes ejemplos.
Diferente respuesta en bucle abierto
El sistema con funcion de transferencia en bucle abierto dado por,
G0 (s) = (s + 1)(1 s + a)
con a=-0.01, 0 y 0.01, tiene una dinamica muy diferente para los valores de a (gura
2.10a). Sin embargo el sistema realimentado unitariamente da las respuestas de la
gura 2.10b.
400
300
200
100
0
0
50
100
150
200
250
300
2
4
6
8
10
12
1.5
1
0.5
0
0
Figura 2.10: Respuestas en tiempo diferentes en bucle abierto
La razon estriba en que las funciones de transferencia de los tres sistemas son
muy similares en el entorno de la frecuencia de cruce, mientras que son diferentes a
Control adaptativo
25
baja frecuencia.
Similar respuesta en bucle abierto
El sistema con funcion de transferencia en bucle abierto dado por,
sT )
G0(s) = (s + 1)(20(1
s + 20)(Ts + 1)
con T=0, 0.015 y 0.03, tiene una dinamica para los valores de T (gura 2.11a) muy
similar. Sin embargo el sistema realimentado con u = 20(yr y), da las respuesta
de la gura 2.10b.
1
0.8
0.6
0.4
0.2
0
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
2
1.5
1
0.5
0
0
Figura 2.11: Respuestas en tiempo similares en bucle abierto
Este sistema tiene un comportamiento inverso al anterior. La razon estriba en
que las funciones de transferencia de los tres sistemas son muy similares a baja
frecuencia, mientras que son bastante diferentes a alta frecuencia.
La ense~nanza a seguir de estos ejemplos es que es esencial conocer la respuesta
en frecuencia a la frecuencia de cruce deseada, para poder juzgar si las variaciones
de los parametros afectaran a la respuesta en bucle cerrado.
26
El problema del control adaptativo
Captulo 3
Algoritmo de identicacion de
parametros
3.1 Introduccion
Una parte muy importante de los sistemas adaptativos es el algoritmo de identicacion de parametros, consumiendo este la mayor parte del tiempo de calculo en cada
periodo de muestreo, y siendo muy cierta la frase de que una buena identicacion
lleva a un buen control.
La identicacion de sistemas tiene diversos signicados en la literatura cientca.
La acepcion mas usada es la dada por Sage et al. (1971), que denen la identicacion
o modelado de un sistema como el proceso de determinar un conjunto de ecuaciones
diferenciales o en diferencias, o los parametros de tales ecuaciones, que describen
un proceso fsico de acuerdo con un determinado criterio.
El modelo del proceso puede obtenerse algunas veces por consideraciones fsicas,
siendo mucho mas dicil determinar el modelo de las perturbaciones, que tienen
tanta o mas importancia. Por otro lado un proceso puede no ser representable por
un modelo matematico, siendo necesario una jerarqua de modelos complejos que
implementan hasta el mas mnimo detalle. Desde el punto de vista del dise~nador
es deseable disponer de modelos simples, aunque solo sean validos para estudios a
groso modo. Es tarea del ingeniero elegir el modelo adecuado entre la gran variedad
de modelos existentes entre un modelo simple o complejo.
27
28
Modelo del sistema y de las perturbaciones
Desde el punto de vista de procesamiento, la identicacion puede ser hecha en
lnea con el proceso o bien las medidas efectuadas son guardadas en un archivo y
posteriormente procesadas. Por otro lado, si la identicacion en lnea se hace cada
periodo de muestreo, tenemos lo que se llama\identicacion en tiempo real". Para el
caso de los sistemas adaptativos, estamos interesados en la identicacion en tiempo
real, por lo que normalmente utilizaremos la version recursiva de los algoritmos. Por
todo ello, es interesante disponer de un algoritmo de identicacion que sea adecuado
en tiempo de ejecucion y convergencia.
La identicacion de un sistema comprende las siguientes tareas :
Estudio experimental. (Adquisicion de datos).
Formulacion de un criterio.
Seleccionar la estructura del modelo.
Estimacion de los parametros.
Validacion del modelo obtenido.
A continuacion describimos los algoritmos de identicacion de parametros de sistemas lineales discretos mas utilizados y algunas modicaciones de estos, propuestas por diversos autores. Un buen artculo monograco sobre identicacion es el
de Astrom y Eykho (1971). La demostracion exhaustiva de los distintos metodos
puede encontrarse en Eykho (1974) y en otros textos clasicos, como por ejemplo
en Ljung (1987).
3.2 Modelo del sistema y de las perturbaciones
Suponemos que el sistema puede ser modelado como un proceso estable, invariante
en el tiempo y linealizable, con una sola entrada y una sola salida, por lo que puede
ser descrito por una ecuacion lineal en diferencias de la forma :
y(k) + a1 y(k 1) + + any(k n) = b1 u(k d 1) + b2 u(k d 2) + + bnu(k d n) + v(k) + c1 v(k 1) + c2 v(k 2) + + cnv(k n)
o bien en forma vectorial:
y(k) = 'T (k) + v(k)
(3:1)
Algoritmo de identicacion de parametros
29
donde:
'T (k) = ( y(k 1); y(k 2) y(k n); u(k d 1); u(k d 2) u(k d n); v(k); v(k 1); v(k 2); ::; v(k n))
T = (a1 ; a2; an; b1; b2 ; bn; c1; c2; cn)
u(k) = U (k) U1
(3.2)
y(k) = Y (k) Y1
U (k) e Y (k) son los valores de entrada y salida del sistema en el instante k, U1
es el valor medio de la se~nal de entrada, Y1 es el valor medio de la variable de
salida y v(k) es una se~nal de ruido estadsticamente independiente y estacionaria
con distribucion normal y de media nula. Asumimos que las perturbaciones pueden
ser modeladas por un proceso ARMA1 , con el mismo polinomio que el sistema. La
funcion de transferencia en z de este sistema puede escribirse como:
(z 1 ) d
C (z 1 ) v(z)
y (z ) = B
z
u
(
z
)
+
(3:3)
A(z 1 )
A(z 1 )
donde:
A(z 1 ) = 1 + a1 z 1 + a2 z 2 + :::: + anz n
(3.4)
1
1
2
n
B (z ) =
b1 z + b2 z + :::: + bnz
1
C (z ) = 1 + c1 z 1 + c2z 2 + :::: + cnz n
El primer cociente B (z 1 )=A(z 1 ) representa el modelo de la planta, y el segundo
C (z 1 )=A(z 1) representa el modelo de las perturbaciones. El conjunto planta mas
perturbaciones, se denomina modelo ARMAX2 .
3.3 Metodo de mnimos cuadrados
Este metodo es el mas popular y mas utilizado en la practica como parte fundamental de los sistemas de control adaptativo. De acuerdo con Gauss, el principio
de mnimos cuadrados consiste en buscar los parametros desconocidos de tal forma
que la suma de los cuadrados de las diferencias entre los valores observados y calculados multiplicado por un numero que mide el grado de precision, sea un mnimo.
Para poder obtener una solucion analtica, los valores calculados deben ser funciones
lineales de los parametros desconocidos.
1
2
Auto Regresive Moving Average
Auto Regresive Moving Average con una variable eXogenous
30
Metodo de mnimos cuadrados
3.3.1 Caso determinista
En un primer paso vamos a considerar que el sistema a identicar es perfectamente
determinista y que sobre el mismo no inciden perturbaciones ni ruidos de ningun
tipo. Para este caso el modelo de la seccion 3.2 se reduce a:
y(k) + a1 y(k 1) + + any(k n) = b1 u(k d 1) + b2 u(k d 2) + + bn u(k d n)
Por lo que, para encontrar los 2n parametros se necesitan realizar 2n medidas de
u(k) e y(k), con las que se puede plantear un sistema de ecuaciones lineales, donde
las incognitas son los parametros ai y bj . O sea,
y(k) = 'T (k)
y(k + 1) = 'T (k + 1)
y(k + N 1) = 'T (k + N 1)
O bien,
Yk = k donde N = 2n y cuya solucion viene dada por:
^ = k 1 Yk
3.3.2 Caso no determinista
Normalmente el sistema no es perfectamente determinista, sino que esta afectado
por ruidos. En el modelo descrito anteriormente (ecuaciones 3.3 y 3.5), para el caso
considerado se supone que C (z 1 ) = 1 , v(k) = e(k) y que el error residual e(k) es
incorrelado con los elementos de '(k), de media nula y distribucion normal, por lo
que el modelo del sistema resulta ser:
y(k) = 'T (k) ^(k) + e(k)
(3:5)
Algoritmo de identicacion de parametros
31
donde,
'T (k) = ( y(k 1); y(k 2) y(k n);
u(k d 1); u(k d 2) u(k d n)
T
(k) = (a1; a2 ; an; b1 ; b2 ; bn )
El primer termino del segundo miembro (ecuacion 3.5), puede ser interpretado
como la prediccion de un paso y^(k=k 1) de la salida y(k) con los datos disponibles
en el instante k 1, por lo que el error resulta ser la diferencia entre la salida real
y su prediccion:
e(k) = y(k) y^(k=k 1)
El metodo de mnimos cuadrados consiste en minimizar el cuadrado del error:
J=
X
k
e2k =
X
k
(yk 'Tk )2
(3:6)
O bien en forma matricial,
J = kT k
= (Yk k )T (Yk k )
= YkT Yk YkT k T Tk Yk + T Tk k Calculando la derivada e igualando a cero se obtiene:
2YkT k + 2T Tk k = 0
que resolviendo se llega a la expresion de,
^MC = (Tk k ) 1 Tk Yk
(3:7)
El desarrollo anterior se ha realizado para 2n parametros, pero es igualmente valido
para el caso de na + nb parametros.
Si el sistema esta cambiando o bien estamos identicando un sistema no lineal
en una determinada zona de trabajo y pasamos a otra, necesitamos tomar otras
medidas (N > 2n) y volver a calcular los parametros estimados. Este proceso, a la
luz de la expresion 3.7, conlleva la inversion de una matriz de dimension 2n 2n,
por lo que si la identicacion se realiza en tiempo real puede sobrepasar el tiempo
de muestreo necesario para el sistema de control.
32
Metodo de mnimos cuadrados
3.3.3 Metodo recursivo
Los metodos recursivos aprovechan parte de los calculos realizados en un paso para
el siguiente, por lo que el calculo de los parametros en un instante se realiza como,
^N +1 = ^N + correccion
(3:8)
Ademas si el sistema esta variando, (o bien se desea una actualizacion permanente
de los parametros), se suelen ponderar las medidas que se van tomando, dandole
mas peso a las mas recientes como se vera en un apartado posterior.
Para el desarrollo de la version recursiva se plantean las expresiones de los
parametros en los instantes N y N + 1 y se calcula el termino de correccion de
la expresion 3.8.
La solucion es bien conocida y conduce a los siguientes pasos (Franklin y Powell
1980):
1. Seleccionar los valores iniciales de P (k) y ^(k).
2. Obtener los nuevos valores de y(k + 1) y u(k + 1).
3. Calcular el error residual a priori :
e(k + 1) = y(k + 1) 'T (k + 1)^(k)
(3:9)
4. Calcular L(k + 1) dado por la expresion :
'(k + 1)
L(k + 1) = 1 + 'T (Pk(+k)1)
P (k)'(k + 1)
5. Calcular los nuevos parametros estimados dados por :
^(k + 1) = ^(k) + L(k + 1)e(k + 1)
(3:10)
6. Actualizar la matriz de covarianza.
P (k + 1) = (I L(k + 1)'T (k + 1))P (k)
7. Actualizar el vector de medidas '(k + 2).
8. Hacer k = k + 1 y volver al paso 2.
(3:11)
Algoritmo de identicacion de parametros
33
La estimacion de los parametros () esta dada por los valores de la estimacion
anterior corregida por un termino lineal del error entre la salida y su prediccion,
siendo L(k + 1) la ganancia de la correccion.
La ecuacion 3.10 tambien puede ser interpretada (Astrom 1980), como una cuasiNewton iteracion para minimizar e2 , donde ' = gradp(e) y el termino 'e puede ser
interpretado como el gradiente de e2 =2. La matriz de covarianza P (k) modica la direccion del gradiente y determina la longitud del paso. Tambien puede interpretarse
como un factor de ganancia que determina el cambio de la identicacion.
Cuando los residuos estan correlados, los parametros estimados pueden sufrir
desviaciones. Por otro lado el orden del sistema y el retardo deben ser conocidos
exactamente.
3.4 Metodo de mnimos cuadrados extendidos y
generalizados
En mnimos cuadrados se supone que los residuos estan incorrelados, si no es as, se
puede utilizar una version extendida, en cuyo caso se supone que los residuos estan
correlados de la forma C (z 1 )e(k), donde el polinomio C (z 1 ) tiene todos sus ceros
dentro del circulo unidad. De todo ello se deduce que utilizando el modelo 3.1 con
v^(k) = e(k) cuyo valor es calculado mediante la ecuacion 3.9, se puede identicar el
modelo de la planta y de las perturbaciones.
Por otro lado, el metodo de mnimos cuadrados generalizados se utiliza cuando
se dispone de alguna informacion acerca de las perturbaciones, como puede ser el
conocimiento del polinomio C (z 1 ) o la matriz de covarianza, en cuyo caso puede
demostrarse que se obtienen mejores resultados si la matriz N = E (vvT ), es distinta
de la identidad, minimizando en este caso el criterio J = eT N 1 e en vez de J = eT e,
que se utiliza en mnimos cuadrados.
3.5 Aproximacion estocastica
Este es un metodo de identicacion recursiva, caracterizado por su gran simplicidad.
Existen muchas versiones de este algoritmo, siendo una de ellas (Isermann 1981), la
34
Metodo de variable instrumental
que minimiza la funcion de costo:
J = 12 e2 (k)
resultando el algoritmo:
e(k + 1) = y(k + 1) 'T (k + 1)^(k)
^(k + 1) = ^(k) + W (k + 1)'(k + 1)e(k + 1)
Puede verse que el metodo es muy similar al de mnimos cuadrados, con la
diferencia del factor W (k + 1) que es de eleccion libre. Una de las formas mas
frecuentes de escoger este factor es:
W (k + 1) = Constante
(k + 1)
La desventaja del metodo, es que los parametros sufren desviaciones de los exactos y que la convergencia no es muy buena.
3.6 Metodo de variable instrumental
Si solo se esta interesado en los parametros del sistema y no en los del modelo de las
perturbaciones cuando estas estan correladas con '(k), se puede utilizar el metodo
de variable instrumental. Este metodo (Isermann 1981), sustituye el vector '(k)
por otro W (k) que es incorrelado con e(k). Dicho vector es de la forma:
W T (k) = ( h(k 1); h(k 2) h(k n); u(k d 1); u(k d 2) u(k d n))
donde h(k) = y^(k) = W T (k)^aux (k)
es la salida de un modelo auxiliar de parametros ^aux (k), sin perturbaciones. La estructura del algoritmo es igual a la de mnimos cuadrados recursivos. Los parametros
suelen ltrarse con un ltro paso bajo. La eleccion de los parametros iniciales presenta algunos problemas, por lo que suele inicializarse con los parametros estimados
por mnimos cuadrados.
Algoritmo de identicacion de parametros
35
3.7 Metodo de maxima verosimilitud
Este metodo se basa en maximizar la probabilidad de las medidas obtenidas en los
parametros ai y bi y es fuertemente no lineal en los ci . Por ello este metodo requiere
muchos mas calculos que los anteriores, siendo de aplicacion practica limitada por
este motivo.
El modelo utilizado es el dado el apartado 3.2, pudiendose estimar los parametros
del sistema y los del modelo de las perturbaciones.
3.8 Modicaciones al algoritmo de identicacion
Todos los algoritmos citados pueden darse bajo una formulacion unicada (Isermann
1981). Por otro lado se ha supuesto que los parametros del sistema son invariantes
con el tiempo, por lo que el identicador formulado tiene memoria innita, es decir,
tienen el mismo peso todas las medidas obtenidas. Sin embargo si los parametros
del sistema varian lentamente, bien por derivas o por que el sistema sea no lineal,
es conveniente reducir la memoria del identicador con el objeto de que este pueda
seguir las variaciones del sistema, ponderando las medidas de forma que tengan mas
peso las ultimas sobre las mas antiguas. Esto puede hacerse (Wellstead y Zanker
1978) esencialmente:
Introduciendo un factor de olvido (c).
Sumando una matriz positiva (R) a la matriz de covarianza (P ) del identi-
cador.
O bien por una combinacion de las dos tecnicas anteriores.
Los dos metodos consiguen que la matriz P no se haga muy peque~na, ya que en el
identicador original, esta matriz es monotonamente decreciente. El metodo mas
empleado es el del factor de olvido, que en algunos casos puede ser variable.
Inclusion de un factor de olvido
Introduciendo un factor de olvido, se consigue que el identicador tenga memoria
nita. La modicacion en concreto consiste en sustituir P (k) por P (k)=c.
36
Modicaciones al algoritmo de identicacion
Para c = 1 se tiene el algoritmo de mnimos cuadrados normal, mientras que
para c < 1 el algoritmo olvida las medidas mas antiguas. Como referencia se puede
decir que para c = 0:99 tiene una memoria de 100 pasos, siendo un rango normal de
utilizacion del factor de olvido entre 0:98 y 1, pudiendo en algunos casos especiales
disminuirse hasta 0:95. La eleccion de c es un compromiso entre una gran eliminacion
del ruido o un mejor seguimiento de la variacion de los parametros.
La funcion de costo que se minimiza por mnimos cuadrados pasa a ser:
J=
k
X
m=1
ck me2(k)
Suma de una matriz positiva
Este metodo (random walk), consiste en sumar una matriz (R) positiva a la matriz
P (k), que pasa a ser de la forma :
P (k + 1) = (I L(k + 1)'T (k + 1))P (k) + R
con ello se asegura que la matriz de covarianza permanezca limitada a un valor
superior a R.
Problemas que pueden presentarse
Si a lo largo del tiempo el punto de funcionamiento del sistema no cambia, es decir,
en este caso la excitacion es pobre, pueden aparecer algunos problemas. El producto
P (k)'(k) puede hacerse cero o muy peque~no, por lo que la expresion 3.11 se reduce
a P (k + 1) = P (k)=c. Si se utiliza un factor de olvido menor de la unidad, P (k)
puede crecer mucho, siendo por ello el identicador muy sensible a cualquier cambio
(problema de Blow up o bursts, identicador windup). Al mismo tiempo pueden
presentarse problemas numericos en P (k) (Latawiec 1983, Astrom 1983).
Para evitar el problema mencionado se han utilizado varias tecnicas, las cuales
no son excluyentes.
Posibles soluciones
1. Un metodo para evitar los problemas mencionados es utilizar un factor de
Algoritmo de identicacion de parametros
37
olvido variable (Fortescue 1981), basandose para ello en la informacion disponible,
de forma que es calculado a cada paso segun la expresion:
2
1 'T (k + 1)L(k + 1) e(k + 1)
So
Cuando el error tiende a cero, c(k) tiende a uno, por lo que puede evitarse el
problema de crecimiento de la matriz P (k). El parametro So debe buscarse
a priori, (So esta relacionado con la suma de los errores al cuadrado), pero el
identicador es menos sensible a su busqueda que a la de c(k).
Normalmente en la fase inicial de puesta en marcha del algoritmo es cuando
interesa que el factor de olvido sea peque~no, ya que es en esta fase cuando los
parametros son mas inciertos, siendo necesario que a lo largo del tiempo se
incremente al valor que deseamos tener. Esto puede conseguirse facilmente,
utilizando por ejemplo una expresion de la forma (Isermann 1981):
c(k + 1) = 1
c(k + 1) = coc(k) + cf (1 co )
con:
co < 1 y c(0) < 1
siendo el lmite de c(k + 1) cuando k tiende a innito igual a cf . La tecnica
del factor de olvido variable no elimina totalmente los problemas mencionados
anteriormente, pero disminuye la probabilidad de aparicion.
2. Otra posible solucion para evitar el crecimiento de la matriz P (k), es hacer
c(k) = 1 cuando la traza de la matriz P (k) exceda de un cierto valor (Cordero
1981).
3. Landau 1981 y Lozano 1982, proponen una estructura con dos factores de
olvido, cuya expresion es de la forma:
L(k + 1) = c1(k) PT (k)'(k + 1)
c2 (k) + ' (k + 1)P (k)'(k + 1)
P (k + 1) = (I L(k + 1)'T (k + 1)) cP ((kk))
1
donde
0 < c1(k) < 1 y 0 < c2(k) < 2;
obteniendose los mejores resultados para ganancia constante P (k) = P (0), o
bien para traza constante traza(P (k)) = traza(P (0)). Una posible solucion es
jar el cociente c1 (k)=c2(k) entre 0:8 y 1, resolviendo la ecuacion de P (k + 1)
para c1 (k) de forma que la traza de P (k + 1) sea igual a la traza de P (k) e
igual a una constante.
38
Algoritmos de identicacion rapidos
3.9 Algoritmos de identicacion rapidos
Cuando el tiempo es un factor primordial, se puede utilizar un algoritmo rapido
como por ejemplo el que sugiere Robin (1981). La idea de estos algoritmos es usar
una propiedad de invarianza. En concreto, de una iteracion a la siguiente de un
algoritmo recursivo, mucha de la informacion que se necesita en el instante k + 1 ya
se tiene en el instante k, aunque en otro lugar distinto al que se precisa. Por ello
utilizando este hecho se puede ahorrar tiempo, ya que en vez de calcular nuevamente
todos los datos, a algunos solo habra que cambiarlos de lugar, siendo menor el tiempo
de traslacion que el de calculo.
3.10 Estimacion de los valores de continua
Como se ha visto, el identicador trabaja con los valores incrementales de las se~nales
de entrada y salida con respecto a los valores de continua U1 e Y1. Por ello estos
valores deben ser calculados o cancelados. A continuacion se dan varias formas de
poder hacer esto.
Utilizacion de los incrementos de las variables
Mediante este metodo no se necesitan conocer los valores de continua ya que:
u(k) = u(k) u(k 1) = (U (k) U1) (U (k 1) U1) = U (k) U (k 1)
y(k) = y(k) y(k 1) = (Y (k) Y1) (Y (k 1) Y1) = Y (k) Y (k 1)
La expresion anterior es aplicar un ltro paso alto tanto a la entrada como a la
salida.
Calculo de los valores medios
Una forma simple de calcular U1 e Y1 es hallando su valor medio para una serie de
medidas o bien recursivamente:
Algoritmo de identicacion de parametros
1 X
M
U1 = M
u(i)
i=1
39
1 X
M
Y1 = M
y(i)
i=1
U1(k) = U1(k 1) + k1 (U (k) U1(k 1))
Y1(k) = Y1(k 1) + k1 (Y (k) Y1(k 1))
Mediante estimacion de una constante
Si se tiene descrito el sistema por la ecuacion en diferencias de la forma:
Y (k) =
a1 Y (k 1) a2Y (k 2) anY (k n) +
b1 U (k d 1) + b2U (k d 2) + + bnU (k d n)
Sustituyendo las expresiones 3.3 se obtiene:
y(k) =
a1 y(k 1) a2 y(k 2) any(k n) +
b1 u(k d 1) + b2 u(k d 2) + ::: + bnu(k d n) + K
K = (1 + a1 + a2 + :: + an)Y1 (b1 + b2 + :: + bn)U1
(3:12)
Luego extendiendo el vector p(k) con un elemento K mas y el vector de datos
'(k) con un 1, se puede estimar la constante K y jando uno de los dos valores U1
o bien Y1 se podra calcular el otro. Se obtienen buenos resultados tomando Y1
igual a la referencia y calculando U1 por la expresion 3.12.
Para estimacion de sistemas en bucle cerrado donde actua un regulador, Wittenmark (1973), recomienda sustituir y(k) por y(k) r(k) y u(k) por u(k) = u(k)
u(k 1), tanto para el identicador como para el regulador.
3.11 Algoritmo de identicacion propuesto
Dadas las buenas caractersticas de simplicidad y convergencia, el metodo de identicacion mas utilizado es el de mnimos cuadrados recursivos, normal o extendido,
40
Algoritmo de identicacion propuesto
con un factor de olvido variable y utilizando las soluciones propuestas para salvar
algunos problemas que se pueden presentar, quedando resumido en los pasos:
1. Seleccionar los valores iniciales de P (k) y ^(k).
2. Obtener los nuevos valores de y(k + 1) y u(k + 1).
3. Calcular el error residual a priori :
e(k + 1) = y(k + 1) 'T (k + 1)^(k)
4. Calcular L(k+1) dado por la expresion :
(k + 1)
L(k + 1) = c(k) + 'PT ((kk)+'1)
P (k)'(k + 1)
5. Calcular los nuevos parametros estimados dados por :
^(k + 1) = ^(k) + L(k + 1)e(k + 1)
6. Calcular el nuevo factor de olvido c(k + 1).
c(k + 1) = 1 (1 'T (k + 1)L(k + 1)) e(k S+ 1)
2
o
Si
Si
c(k + 1) < cmin Entonces c(k + 1) = cmin
c(k + 1) > 1
Entonces c(k + 1) = 1
7. Actualizar la matriz de covarianza.
W (k + 1) = (I L(k + 1)'T (k + 1))P (k) + R1
!
W
(
k
+
1)
Si tr
c(k + 1) > trmax Entonces c(k + 1) = 1
P (k + 1) = Wc((kk++1)1)
8. Actualizar el vector de medidas '(k + 2).
9. Hacer k = k + 1 y volver al paso 2.
Algoritmo de identicacion de parametros
41
3.12 Convergencia e identicabilidad
El criterio general que debe cumplir un algoritmo de identicacion es que los parametros
no sufran desviaciones, o sea, que E (^(N )) = o para N ! 1.
Para mnimos cuadrados las condiciones que se necesitan, (Isermann 1981), se
pueden resumir en :
1. El orden de los polinomios y el retardo (d) del sistema deben ser conocidos.
2. U1 e Y1 deben ser conocidos exactamente.
3. u(k) debe ser persistentemente excitada de orden n o mayor.
4. y(k) debe estar perturbada por un ruido estacionario.
5. e(k) debe ser incorrelado con los elementos de '(k).
6. E (e(k)) = 0.
7. La convergencia tambien depende de los valores de inicializacion del identicador.
Identicacion en bucle cerrado
Un sistema en bucle cerrado se dice identicable si los parametros estimados son
consistentes cuando, usando un metodo de identicacion apropiado, se tiene que:
lim E (^(N )) = o
N !1
y la salida debe ser medible.
Dado que en los sistemas de control adaptativo la identicacion se realiza con el
sistema operando en bucle cerrado, pueden aparecer problemas de identicabilidad
en ciertos parametros, cuando se utiliza un regulador lineal y no se emplean se~nales
externas de excitacion. En Isermann (1981), se plantean las condiciones de identicabilidad de un sistema actuando en bucle cerrado sin se~nales externas. Estas
condiciones estan relacionadas con los ordenes de los polinomios del sistema y del
regulador. A continuacion se exponen los resultados mas importantes.
42
Dado el sistema :
A(z
donde,
A(z
B (z
C (z
Convergencia e identicabilidad
1 )y (k + d) = B (z 1 )u(k ) + C (z 1 )e(k + d)
1)
1)
1)
(3:13)
= 1 + a1z 1 + a2z 2 + + ama z ma
=
b1 z 1 + b2 z 2 + + bmb z mb
= 1 + c1z 1 + c2 z 2 + + cmc z mc
Suponiendo que el sistema opera en bucle cerrado con un regulador de la forma:
(z 1 ) y(t)
u(t) = Q
P (z 1 )
donde,
Q(z 1 ) =
q1 z 1 + q2 z 2 + :::: + qv z v
P (z 1) = 1 + p1z 1 + p2 z 2 + :::: + pw z w
Primera condicion
Introduciendo el regulador en la ecuacion del sistema 3.13, suponiendo d = 0 y
sumando en ambos miembros de la igualdad el termino 'Sy', donde S es un polinomio
arbitrario en z 1 , se tiene que :
Ay + Sy = BQ
P y + Sy + Ce
Multiplicando por Q y operando se obtiene :
(A + S )Qy = ( SP + BQ) Q y + CQe
P
Ay = Bu + Ce
siendo,
A = (A + S )Q
B = SP + BQ
C = CQ
O sea, dado que S es arbitrario, existen muchas soluciones basadas en las medidas
de u(k), y(k) y e(k). Luego esta condicion implica que los ordenes del modelo del
proceso y de las perturbaciones deben ser conocidos con exactitud.
Algoritmo de identicacion de parametros
43
Segunda condicion
La funcion de transferencia de la salida a las perturbaciones es de la forma :
CP
1 + b01 + b0 2:: + b0r z r
y(z) =
=
e(z) AP + Bz d Q 1 + a0 1 + a0 2:: + a0l z f
Luego debe cumplirse que,
f = max(ma + w; mb + d + v)
r = mc + w
El numero de parametros a identicar es ma + mb que deben ser calculados a
partir de f , o sea , f debe ser mayor o igual a ma + mb. Dicha condicion se expresa
por:
o sea,
max(ma + w; mb + d + v) ma + mb
max(w mb; d + v ma ) 0
En dicha condicion pueden ocurrir dos casos :
1. d + v ma w mb 0
v w mb + ma d ma d
2. w mb d + v ma 0
w d + v ma + mb mb
Por otro lado para estimar los mc parametros de C (z 1 ), se necesita que r sea
mayor que mc, lo cual se cumple si se escoge por ejemplo w > 0. Si A y C tienen p
ceros comunes, estos no pueden ser identicados y la condicion 3.12 quedara como:
max(w mb; d + v ma ) p
Para hacer cumplir esta condicion, segun el caso, habra que jar algunos parametros a priori para disminuir el numero de parametros a identicar o bien habra
que aumentar el retardo (d) del sistema. Normalmente p = 0 y se considerara que
los ordenes de los polinomios son iguales a n, por lo que esta condicion se puede
expresar como:
max(w; v + d) n
44
Ejemplo de identicacion
Un ejemplo
Supongamos un sistema con orden de los polinomios A y B igual a n y que trabaja
con el regulador de mnima varianza que se describira mas adelante (apartado 5.5),
dado por:
G y(k)
u(k) = zBF
Los ordenes de los polinomios G y F son respectivamente n 1 y d, luego :
v =n 1 y w =n+d 1
De acuerdo con la condicion expresada en el apartado anterior, para que el
sistema sea identicable, el retardo debe ser mayor o igual a 1 o bien habra que jar
un parametro.
3.13 Ejemplo de identicacion
A continuacion se muestra la evolucion de los parametros identicados en bucle
abierto, del sistema dado por su funcion de transferencia:
1 + 4z 2
3
z
G(z) = 1 z 1 2z 2
cuando se le somete a una entrada aleatoria de media cero. Puede observarse en la
gura 3.1, como los parametros convergen a los valores correctos.
Algoritmo de identicacion de parametros
45
5.0
Parametros
4.0
a1
a2
b1
b2
3.0
2.0
1.0
0.0
0.0
10.0
20.0
30.0
40.0
Tiempo
50.0
Figura 3.1: Parametros identicados
60.0
70.0
46
Ejemplo de identicacion
Captulo 4
Control adaptativo por modelo de
referencia
4.1 Introduccion
Como se menciono en el captulo 2, la tecnica de control adaptativo por modelo
de referencia (mrac) fue introducida por Whitacker en 1958, siendo su forma mas
popular la mostrada en la gura 4.1.
En este esquema puede verse un controlador primario que se utiliza para obtener
el comportamiento en bucle cerrado (como en cualquier esquema de control convencional). Por otro lado como los parametros del proceso pueden ser desconocidos y
variables, es difcil encontrar un controlador jo que responda en todas las situaciones. En la tecnica mrac, la respuesta deseada a una se~nal de entrada del proceso
se especica como un modelo de referencia. El mecanismo de adaptacion mira la
salida yp del proceso y la salida ym del modelo de referencia y calcula los parametros
adecuados de forma que la diferencia tienda a cero. El mecanismo de adaptacion
puede utilizar, si estan disponibles, ademas de las se~nales de salida del proceso y del
modelo de referencia (yp, ym), las se~nales de entrada, de referencia y las variables
de estado del proceso.
En el esquema de la gura 4.1, el modelo de referencia esta colocado en paralelo
con el proceso. Este esquema es bastante usual, aunque existen diversas posibilidades, como colocarlo en serie o bien una combinacion serie-paralelo. A lo largo de
este captulo nos centraremos en la estructura paralelo.
47
48
Dise~no de controladores adaptativos
Mecanismo
de
Adaptacion
CC
- Controlador
Ajustable
6
r - ?
uPlanta
BBN
de
- Modelo
Referencia
yp
-
?
6
ym
Figura 4.1: Esquema general de MRAC paralelo
Una de las partes mas importantes en control adaptativo es el dise~no de la
ley de control. La primera ley de control adaptativo haca uso de los modelos de
sensibilidad y mas tarde de la teora de estabilidad de Lyapunov y de la teora de
hiperestabilidad de Popov. Estas ultimas garantizan la estabilidad del conjunto del
sistema, lo que las hace particularmente interesantes, convirtiendose en metodos de
dise~no estandar.
4.2 Dise~no de controladores adaptativos
Como se ha visto en la seccion anterior, un sistema de control adaptativo basicamente
esta formado por tres partes: un controlador primario, un modelo de referencia y la
ley de adaptacion. Por lo tanto para el dise~no de un sistema de control adaptativo,
sera necesario denir las tres partes. Dado que la parte que caracteriza al control
adaptativo es la ley de adaptacion, en lo que sigue, nos centraremos fundamentalmente en esta parte.
Control adaptativo por modelo de referencia
49
Controlador Primario
El controlador primario puede tener en principio cualquiera de las conguraciones
conocidas para el dise~no de controladores lineales. Sin embargo, debe cumplir la
condicion de que sea posible que el conjunto del proceso y el controlador puedan
reproducir al modelo de referencia. Este requisito, supone restricciones sobre el
orden y la estructura del controlador. Por otro lado para que pueda aplicarse una
adaptacion directa, la se~nal de control debe ser una funcion lineal de los parametros.
Modelo de referencia
El modelo de referencia, que especica el comportamiento deseado en bucle cerrado, se da usualmente en forma parametrica. La condicion mencionada anteriormente para el seguimiento del modelo de referencia, tambien condiciona en ciertos
aspectos el modelo de referencia posible, en cuanto al orden relativo del proceso
(exceso de polos). Por otro lado el modelo elegido debe ser sensible a la dinamica
del proceso, ya que si por ejemplo se elige un modelo con una dinamica muy rapida,
la se~nal de control sera muy grande causando saturaciones y no pudiendo el sistema
responder a dicha dinamica. Por ello la eleccion del modelo de referencia no es facil,
eligiendose normalmente un modelo conservador.
4.2.1 Enfoque de sensibilidad
Este metodo esta basado en el uso de los modelos de sensibilidad para adaptar los
parametros en la direccion correcta. La deduccion de este metodo comienza con el
planteamiento de un ndice de actuacion, normalmente cuadratico:
J (t + T ) =
Z t+T
t
e21 ( )d
En esta ecuacion e1 = yp ym y el ndice J se evalua sobre el periodo T jo, en el
cual los parametros permanecen constantes. En el instante (t + T ) los parametros
son ajustados en la direccion decreciente de J .
Z t+T
@e ( )
(t + T ) = (t) @@J = (t)
2e1( ) 1 d
(4:1)
@
t
debe ser una matriz cuadrada denida positiva, que representa la ganancia de
adaptacion. Usualmente es diagonal. Teniendo en cuenta que:
@e1 ( ) = @yp
@
@
50
Dise~no de controladores adaptativos
La ecuacion (4.1) queda:
(t + T ) (t) = 1 Z t+T 2e ( ) @yp d
1
T
@
t
Que en el lmite para T ! 0 da la ley de adaptacion:
d = 2 e @yp
1
dt
@
(4:2)
(4:3)
El factor @yp=@ representa la sensibilidad de la salida del proceso a las variaciones en , y puede ser generado por un modelo de sensibilidad. Como puede
observarse esta ley de adaptacion es la misma obtenida en el captulo 2, denominada como la regla del MIT.
El modelo de sensibilidad anterior se sustituye por la sensibilidad del modelo
de referencia, dado que normalmente el modelo del proceso se desconoce. Esta
suposicion se hace en base a que pasado un tiempo la respuesta del sistema converge
a la respuesta del modelo de referencia.
La principal desventaja de este metodo, es la ausencia de un criterio que garantice
la estabilidad del sistema de control. El sistema puede hacerse inestable si el modelo
de referencia no se escoge adecuadamente o si la ganancia de adaptacion se elige
demasiado grande.
4.2.2 Metodo de Lyapunov
Dado el caracter no lineal y variable en el tiempo de los sistemas adaptativos por
modelo de referencia mrac, no son validos los criterios de estabilidad de sistemas
lineales. Un metodo bien conocido es el metodo directo de Lyapunov. Este metodo
establece que un sistema tiene un equilibrio x = 0, asintoticamente estable, si existe
una funcion, llamada de Lyapunov, V (x) que satisface:
V (x)
V_ (x)
V (x)
V (0)
> 0 para x 6= 0 denida positiva
< 0 para x 6= 0 denida negativa
! 1 para jjxjj ! 1
= 0
(4.4)
Control adaptativo por modelo de referencia
51
Como la funcion de Lyapunov es similar a una funcion de energa, esta debe
decrecer con el tiempo. Utilizando este metodo en el dise~no de sistemas adaptativos,
se trasladan las especicaciones de estabilidad directamente en la ley de adaptacion,
siguiendo los pasos:
1. El primer paso es encontrar la ecuacion de error, bien en la salida (yp ym) o
en las variables de estado (xp xm ).
2. Encontrar una funcion de Lyapunov como una funcion del error entre las
se~nales y del error en los parametros ( = ^ ). En su forma mas simple esta funcion toma la forma:
V = eT Pe + T 1
Donde las matrices P y 1 deben ser denidas positivas.
3. Calcular la derivada de la funcion de Lyapunov. La derivada debe ser denida
negativa. Generalmente toma la forma:
V_ = eT Qe + algunos terminos incluyendo El primer termino garantiza que la derivada es denida negativa, por lo que,
haciendo el resto igual a cero se tiene una posible solucion. La matriz Q es
denida positiva. Las matrices P y Q, para un sistema gobernado por una
matriz A, estan relacionadas por la ecuacion de Lyapunov:
Q = AT P + PA
(4:5)
4. Haciendo el termino extra igual a cero se obtiene la ley de adaptacion. Normalmente tiene la forma:
_ = "
(4:6)
" esta directamente relacionado con el error e y es una version modicada
del vector de se~nales (referencia, salida, etc).
Ejemplo de sistema de primer orden
Considerando el sistema de la gura 4.2, donde la se~nal de control esta dada por:
u = K r, siendo K la ganancia ajustable que hay que calcular, la deduccion de la
ley de adaptacion es como sigue:
y_p = bKr yp
y_m = r ym
e_ = y_p y_m = (bK 1)r (yp ym)
(4.7)
= e + (bK 1)r
52
Dise~no de controladores adaptativos
Proceso
- K
u-
b
s+1
yp
? e
6
r -
-
1
s+1
ym
Modelo
Figura 4.2: Sistema y modelo de primer orden
Teniendo en cuenta que el termino (bK 1) es proporcional al error en el parametro,
la funcion de Lyapunov en este caso puede elegirse como:
V = e2 + 1 (bK 1)2
Su derivada resulta ser:
V_ = 2ee_ + 2b K_ (bK 1)
2b
= 2e[ e + (bK 1)r] + K_ (bK 1)
= 2e2 + 2e(bK 1)r + 2b K_ (bK 1)
(4.8)
El primer termino es negativo. As que haciendo el resto igual a cero se obtiene la
ley de adaptacion:
2b
2e(bK 1)r + K_ (bK 1) = 0 =) K_ = er = 1 er
b
En esta ley de adaptacion el parametro libre es 1 , siendo necesario conocer el signo
de b para jar el de 1.
En las guras 4.3 y 4.4 se representa una simulacion del ejemplo descrito cuando
el parametro b vale inicialmente 4 y en el instante 20 pasa a valer 2. Puede observarse
Control adaptativo por modelo de referencia
53
Salidas yp - ym
1.5
1
0.5
0
-0.5
-1
0
5
10
15
20
25
30
35
40
25
30
35
40
Tiempo
0.5
Parametro k
0.4
0.3
0.2
0.1
0
0
5
10
15
20
Tiempo
Figura 4.3: Proceso de primer orden (1 = 0:1)
Salidas yp - ym
1.5
1
0.5
0
-0.5
-1
0
5
10
15
20
25
30
35
40
25
30
35
40
Tiempo
Parametro k
0.6
0.4
0.2
0
0
5
10
15
20
Tiempo
Figura 4.4: Proceso de primer orden (1 = 0:5)
54
Dise~no de controladores adaptativos
como la adaptacion es buena en ambos casos, siendo mas rapida en el caso de la
gura 4.4, dado que la ganancia de adaptacion es superior. En lnea a trazos se
representa la salida del modelo de referencia y en lnea continua la salida del modelo
ajustable.
La principal desventaja del metodo de Lyapunov es que no es un metodo sistematico, dado que hay que encontrar la funcion de Lyapunov V adecuada en cada
caso.
4.2.3 Metodo de hiperestabilidad
Con este metodo tambien se consigue una ley de adaptacion estable. Como en el
metodo de Lyapunov, en primer lugar se formulan las ecuaciones de error. Estas
ecuaciones se dividen en una parte lineal invariable con el tiempo y otra no lineal y
variable con el tiempo. La primera parte contiene usualmente al modelo de referencia
y su salida es la se~nal de error que es utilizada para la ley de adaptacion. La segunda
parte contiene la ley de adaptacion y su salida negada es la entrada a la parte lineal.
Esta estructura se corresponde con la vista en la seccion 2.2 del captulo 2. La
teora de hiperestabilidad garantiza la estabilidad asintotica si ambas partes (lineal
y no lineal), satisfacen las condiciones de pasividad (Landau 1979):
1. La parte lineal (llamese G(s)), debe ser estrictamente positiva. Ello signica
que:
(a) G(s) debe ser real si s es real.
(b) los polos de G(s) deben tener parte real negativa, y
(c) la parte real de G(j!) de ser mayor que cero para 1 < ! < 1.
2. La parte no lineal debe cumplir la desigualdad de Popov.
Zt
0
vT w dt 2 ; 8t > 0
siendo v el vector de entrada y w el vector de salida de la parte no lineal, y 2
una constante nita positiva que no depende de t.
Control adaptativo por modelo de referencia
55
4.3 Estructura general de los sistemas adaptativos (MRAC)
Considerando de nuevo el esquema paralelo de la gura 4.1, pueden considerarse dos
posibles formas de descripcion: mediante variables de estado o bien entrada-salida.
Considerando la primera de ellas, puede escogerse el modelo de referencia como el
conjunto de ecuaciones lineales,
x_ = AM x + BM u;
x(0) = x0
(4:9)
donde x es el vector de estado y u es el vector de entrada. Este modelo se supone
estable y completamente controlable. En cuanto al modelo ajustable (planta mas
controlador), puede utilizarse la siguiente representacion,
y_ = AS (e; t)x + BS (e; t)u;
x(0) = x0 ; AS (0) = AS0; BS (0) = BS0; (4:10)
El vector de error generalizado viene dado por:
e=x y
El objetivo de dise~no, en el caso parametrico, es encontrar la ley de adaptacion
tal que las matrices de parametros AS (e; t) y BS (e; t) sean modicadas de forma que
el error tienda a cero para cualquier entrada u.
La derivada del error puede obtenerse restando las ecuaciones anteriores, donde
ademas se suma y resta el termino AM y.
e_ = x_ y_ = AM x + BM u AS (e; t)x BS (e; t)u + AM y AM y
(4:11)
pudiendose expresar como:
e_ = AM e + [AM AS (e; t)]y + [BM BS (e; t)]u
(4:12)
Si se desea que el mecanismo de adaptacion tenga memoria (lo cual es lo mas
habitual), debe considerarse la inclusion de un integrador en el mecanismo de
56
Estructura general de los sistemas adaptativos (MRAC)
ll
e
_
- l,
6
,,
e
AM y
?
6
ZZ ?
ZZ
ZZ
6ZZ
u
AM AS (0)
?
6
F (e; t) G(e; t) BM BS (0)
Figura 4.5: Representacion equivalente del modelo de error
Control adaptativo por modelo de referencia
57
adaptacion. Esto tendra el efecto de que los parametros ajustables dependeran
no solo del error en un instante sino tambien de los valores pasados. Por ello la ley
de adaptacion se dene como:
AS (e; t) = F (e; ; t) + AS (0); 0 t
BS (e; t) = G(e; ; t) + BS (0); 0 t
(4.13)
Las ecuaciones 4.12 y 4.13, pueden representarse segun la gura 4.5, sistema que
se puede descomponer en un sistema lineal y otro no lineal, al cual se le pueden
aplicar el criterio de Popov de estabilidad (o criterio de hiperestabilidad).
w -e_ 6 6
1
w
ll e
l
,
,
,
- D
AM y
?
6
SNL
ZZ?
ZZ
ZZ
6ZZ
u
v
SL
AS (0) AM
?
6
BS (0) BM
?
6
,
,
,l ll
1
2
,
,
,l ll
1
2
Figura 4.6: Sistema adaptativo por modelo de referencia paralelo
Para conseguir cumplir dicho criterio, por un lado la parte lineal se modica
a~nadiendole un termino D en serie. En cuanto a las funciones F y G, caben muchas
58
Ejemplos ilustrativos
posibilidades de eleccion, pero teniendo en cuenta que deseamos que el error en
regimen permanente sea cero, pueden elegirse de la forma:
F (e; t) =
G(e; t) =
Z1
0
Z1
0
1 (v; t)dt + 2 (v; t)
1(v; t)dt + 2(v; t)
(4.14)
La estructura nal del sistema sera la representada en la gura 4.6 donde los
parametros de dise~no seran las funciones D, 1 , 2 , 1 y 2 . La resolucion se
realiza para cada caso concreto y no de forma general, ya que el caso general resulta
bastante complicado.
4.4 Ejemplos ilustrativos
En primer lugar vamos a ver un ejemplo de control de un barco, de los dos primeros
metodos comentados y posteriormente un ejemplo del metodo de hiperestabilidad.
Generalmente, la dinamica de un barco se obtiene aplicando las leyes de Newton
al movimiento del barco. Para buques de grandes dimensiones, el movimiento en
el plano vertical puede despreciarse, dado que el efecto del balance y cabezada es
peque~no en esos casos. El movimiento es descrito generalmente por un sistema de
coordenadas jo al barco (ver gura 4.7).
Un modelo simple que describe el comportamiento dinamico de un buque puede
expresarse mediante la ecuacion diferencial (modelo de Nomoto de 3er orden):
_ t) = K 3 _ (t) + (t)
3) (t) + 1 + 1  (t) + 1 (
(4:15)
1 2
1 2
1 2
donde es el rumbo y el angulo de timon. Asumiendo condiciones iniciales nulas,
(4.15) puede escribirse como,
(s) = K (3 s + 1)
(s) s(1 s + 1)(2s + 1)
(4:16)
donde K , 1 , 2 y 3 son parametros, los cuales son funcion de la constante de
velocidad axial del barco u y de su longitud l, pudiendose expresar dichos parametros
como:
Control adaptativo por modelo de referencia
59
Ψ
δ
u
v
x
y
V
Figura 4.7: Sistema de coordenadas del barco
u
K = K0 l
!
l
i = i0 u ; i = 1; 2; 3:
(4.17)
(4.18)
En nuestro ejemplo tomaremos los siguientes parametros que corresponden a un
buque tipo carguero (Layne y Passino 1993): K0 = 3:86, 10 = 5:66, 20 = 0:38,
30 = 0:89, y l = 161 m. Tambien asumimos que el barco esta navegando en la
direccion x a una velocidad de 5 m/s.
En la navegacion de mantenimiento de rumbo, un barco solo experimenta peque~nas
desviaciones del curso marcado. De esta forma, el modelo (4.15) se obtiene de la
linealizacion de las ecuaciones de movimiento en torno a un angulo de timon de
cero grados ( = 0). Como resultado de esto, el angulo de timon no debe exceder
aproximadamente de 5o, en otro caso el modelo sera inadecuado, ya que se pondra
de maniesto el comportamiento no lineal. Para nuestro proposito, necesitamos un
modelo que sea valido para variaciones del angulo de timon superiores a los 5o, por
ello, utilizaremos el modelo propuesto por Bech y Smitt (Layne y Passino 1993).
Este modelo extendido esta dado por,
60
Ejemplos ilustrativos
_ t)) = K 3 _(t) + (t)
3) (t) + 1 + 1  (t) + 1 H ((
1 2
1 2
12
(4:19)
_ t)) es una funcion no lineal de (
_ t). La funcion H ((
_ t)) puede caldonde H ((
cularse de la relacion entre y _ en regimen permanente tal que 3) =  _ = 0.
_ puede
Un experimento conocido como el test de espiral ha demostrado que H ()
aproximarse por:
_ = a_ 3 + b_
H ()
(4:20)
donde a y b son dos valores reales constantes tal que a es siempre positivo. En
nuestro ejemplo elegiremos ambos valores de a y b como la unidad.
A continuacion vamos a presentar dos controladores adaptativos por modelo de
referencia para el sistema descrito anteriormente. Ambos utilizaran un controlador
proporcional derivativo (PD). Los metodos considerados son el metodo del gradiente y el metodo basado en el criterio de estabilidad de Lyapunov para dise~no de
controladores adaptativos.
4.4.1 Metodo del gradiente
El mecanismo de ajuste de parametros utilizando este metodo puede ser implementado mediante la conocida regla del MIT. Para ello, se utiliza la funcion de costo,
J = 21 2e (t)
(4:21)
donde
e(t) = m (t) (t)
y
d = @ J
dt
@
por lo que,
d = (t) @ e (t)
e
dt
@
Para el desarrollo de la regla del MIT para el control del barco, asumimos que
el barco puede ser modelado por un sistema lineal de segundo orden. Este modelo
Control adaptativo por modelo de referencia
61
puede obtenerse eliminando el polo del sistema correspondiente a 2 en (4.15), dado
que la dinamica asociada a este polo es mucho mayor que la resultante del polo 1 .
Por otro lado, se supone que el sistema opera con peque~nos valores de la derivada
del angulo de timon, de forma que el termino correspondiente a _ es despreciable;
quedando en ese caso que el modelo (conocido como de Nomoto) de 2o orden del
buque tiene la forma:
(t) + 1 (
_ t) = K (t)
(4:22)
1
1
El controlador PD que puede emplearse en este caso viene dado por,
_ t)
(t) = kp(r (t) (t)) kd(
(4:23)
donde kp y kd son las ganancias proporcional y derivativa respectivamente y r (t)
es la salida deseada. Sustituyendo 4.23 en 4.22 se obtiene,
!
!
!
 t) + 1 + Kkd (
_ t) + Kkp (t) = Kkp r (t)
(
1
1
1
(4:24)
cuya funcion de transferencia es,
(t) =
Kkp
s2 +
1+Kkd1
1
s+
Kkp r (t)
1
El modelo de referencia para este sistema se escoge como:
!n2
m (t) = 2
s + 2!ns + !n2 r (t)
(4:25)
(4:26)
con = 1 y !n = 0:05. Combinando 4.26 con 4.25 y calculando la derivada parcial
con respecto a kp y kd se tiene,
y
0
1
K
@ e (t) = @
1+Kkd1 Kkp A ((t) r (t))
2
@kp
s + 1 s + 1
0
1
Ks
@ e(t) = @
1+Kkd1 Kkp A (t)
2
@kd
s + 1 s + 1
(4:27)
(4:28)
62
Ejemplos ilustrativos
En general las expresiones 4.27 y 4.28 no se pueden utilizar porque los parametros
kp y kd no se conocen, pero en el caso optimo se tiene que,
!
!
Kk
1
+
Kk
d
p
2
s +
s + = s2 + 2!ns + !n2
(4:29)
1
1
Ademas el termino K=1 puede incluirse en la ganancia de adaptacion . No
obstante, esto requiere que se conozca el signo de K=1 . En general debe ser
positivo para asegurar que la adaptacion del controlador se hace en la direccion
negativa del gradiente. Para un buque de las caractersticas rese~nadas en el apartado
anterior el signo de K=1 es negativo lo cual implica que el de con K=1 incluido
debe ser negativo para asegurar la direccion negativa del gradiente. Despues de
estas aproximaciones se obtienen las ecuaciones diferenciales del controlador PD
siguientes:
!
dkp = 1
1 2
dt
s + 2!ns + !n2 ( r ) e
!
dkd = s
2 2
dt
s + 2!ns + !n2 e
(4:30)
(4:31)
donde 1 y 2 son numeros negativos. Despues de muchas simulaciones, se han
encontrado que los mejores parametros son: 1 = 0:005 y 2 = 0:1
En la gura 4.8, puede verse la evolucion de la respuesta del sistema junto con
la salida del modelo de referencia y la se~nal de referencia. En el instante de tiempo
2300 segundos se cambia la velocidad de 5 m/s a 7.5 m/s, variable que afecta en
gran medida a la dinamica del buque. Puede observarse como la salida del sistema
se va aproximando a la salida deseada conforme los parametros del controlador PD
van convergiendo a los valores optimos. En la gura 4.9 se muestran la se~nal de
control y los parametros kp y kd. La convergencia de estos ultimos es un poco lenta,
aunque como se aprecia en la gura 4.8 el seguimiento es bueno a partir de 1500
segundos.
4.4.2 Metodo de Lyapunov
A continuacion se va a resolver el mismo ejemplo anterior utilizando el metodo de
Lyapunov descrito en la seccion 4.2.2. En este caso tambien se utilizara un regulador
Control adaptativo por modelo de referencia
63
80
60
Rumbo (grados)
40
20
0
-20
-40
-60
-80
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
Tiempo (segundos)
Figura 4.8: Respuesta ante entradas en escalon
Angulo de timon
100
50
0
-50
-100
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
3500
4000
4500
5000
Tiempo (segundos)
kd - kp
0
-200
-400
0
500
1000
1500
2000
2500
3000
Tiempo (segundos)
Figura 4.9: Evolucion de la se~nal de control y de los parametros
64
Ejemplos ilustrativos
PD (4.23) y se considerara el modelo reducido (4.22). Tambien se emplearan los
mismos valores de = 1 y !n = 0:05.
Las ecuaciones que describen la dinamica del barco pueden ponerse en forma
matricial de la siguiente forma:
!
_ =

0
Kkp
1
1
!
1+Kkd
1
!
+
_
0
!
r
(4:32)
m + 0 !n2 r
_ m
(4:33)
Kkp
1
As mismo el modelo de referencia esta dado por:
!
_ m =
 m
0
!n2
1
2!n
!
!
!
La dinamica que describe la evolucion del error e(t) = m (t)
expresarse por:
_ e = Ame + (Am As(t)) + (Bm Bs(t))r
(t) puede
(4:34)
donde el subndice m y s corresponde a las matrices del modelo y del sistema
ajustable dados por las ecuaciones 4.32 y 4.33. Los vectores corresponden a:
e = [e_ e]T ;
_T
= []
El punto de equilibrio e = 0 es asintoticamente estable si se elige la ley de
adaptacion como:
A_ s(t) = P eT
(4.35)
_Bs(t) = P er
donde P es una matriz denida positiva, solucion de la ecuacion de Lyapunov ATm P +
PAm = Q < 0. Resolviendo para Q la matriz identidad se tiene que:
!
!
p
p
25
:
0125
200
:
000
11
12
P = p p = 200:000 2005:00
21 22
(4:36)
Control adaptativo por modelo de referencia
65
Por otro lado a partir de las ecuaciones 4.35 para k_ p y k_ d, se tiene la ley de
adaptacion,
k_ p =
1 (p21 e + p22 _ e)( r )
(4.37)
k_ d =
2 (p21 e + p22 _ e)_
(4.38)
donde 1 y 2 son numeros negativos. Despues de varias simulaciones, se han encontrado los valores de los parametros: 1 = 0:0005 y 2 = 0:001
80
60
Rumbo (grados)
40
20
0
-20
-40
-60
-80
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
Tiempo (segundos)
Figura 4.10: Respuesta ante entradas en escalon
En la gura 4.10, puede verse la evolucion de la respuesta del sistema junto con
la salida del modelo de referencia y la se~nal de referencia. Puede observarse como
la salida del sistema se va aproximando a la salida deseada conforme los parametros
del controlador PD van convergiendo a los valores optimos. En la gura 4.11 se
muestran la se~nal de control y los parametros kp y kd. La convergencia de estos
ultimos es un poco lenta, aunque como se aprecia en la gura 4.10 el seguimiento es
bueno a partir de 500 segundos.
66
Ejemplos ilustrativos
Angulo de timon
100
50
0
-50
-100
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
3500
4000
4500
5000
Tiempo (segundos)
kd - kp
0
-200
-400
0
500
1000
1500
2000
2500
3000
Tiempo (segundos)
Figura 4.11: Evolucion de la se~nal de control y de los parametros
4.4.3 Metodo de hiperestabilidad
Supongase el modelo de referencia y el sistema ajustable dados por:
yR =
2
u
s + a1s + a2
yA =
^
2
u
s + a1s + a2
(4.39)
(4.40)
La aplicacion del enfoque de hiperestabilidad a este caso conlleva los siguientes
pasos:
1. Transformar el sistema en la forma equivalente de dos bloques, con la parte
lineal y no lineal.
2. Encontrar la solucion de la parte de la ley de adaptacion no lineal utilizando
el criterio de Popov.
Control adaptativo por modelo de referencia
67
3. Encontrar la solucion de la parte de la ley de adaptacion correspondiente a la
parte lineal de forma que sea estrictamente positiva.
4. Realizar la ley de adaptacion.
Siguiendo estos pasos, en primer lugar restando las ecuaciones 4.40 y 4.39 se
tiene,
(1 + a1 s + a2 s2)" = [ ^("; t)]u
(4:41)
donde ^("; t), de acuerdo con la estructura general de la ley de adaptacion vendra
dado por:
Zt
^("; t) =
^(0)
(4:42)
1 (v; t; )d + 2 (v; t) + 0
siendo v la salida de la parte lineal, que es la salida del error generalizado con el
operador D. O sea, v = D(s)".
La parte derecha de la ecuacion 4.41, puede considerarse como una entrada
w1 = [ ^("; t)]u. Por lo que la parte lineal vendra denida por:
(1 + a1 s + a2 s2)" = w1
v = D(s)"
(4.43)
Si se considera la expresion dada por la ecuacion 4.42, la se~nal w1 aparece como
la salida del bloque no lineal que tiene a su vez como entrada la se~nal v. Por lo
tanto se tiene,
w = w1 = [ ^("; t)]u = u
Z t
0
^(0) 1 (v; t; )d + 2 (v; t) + (4:44)
El esquema equivalente correspondiente puede verse en la gura 4.12.
El segundo paso, corresponde a encontrar la solucion para
se verique,
Z t1
0
v w dt =
Z t1
0
vu
Z t
0
1 (v; t; )d
1
y
2
de forma que
+ 2 (v; t) + ^(0) dt 02
(4:45)
En este caso particular, para resolver la desigualdad puede descomponerse en
dos integrales I1 e I2 tales que,
68
Ejemplos ilustrativos
w
6
1
-
1
1+a1 s+a2 s2
w
e-
v
D(s)
^(0) ? HHH
6
@@ @
6
u
1
2
Figura 4.12: Esquema equivalente del ejemplo
I1 =
I2 =
Z t1
0
Z t1
0
vu
Z t
0
^(0) dt 12
1 (v; t; )d + v u 2 (v; t)dt 22
(4.46)
(4.47)
Si se hace que ambas integrales sean 0, la suma sera 0 y por lo tanto 2
para todo t 0.
Centrandonos, en primer lugar, en la integral I2 , una solucion puede ser,
2 (v; t) = k2 (t) v
u; [k2(t) 0] para todo t 0
(4:48)
A su vez de la ecuacion 4.48, pueden deducirse soluciones particulares:
Adaptacion proporcional:
2 (v; t) = k2
v u; k2 0
(4:49)
Control adaptativo por modelo de referencia
69
Adaptacion mediante rele:
{ Si se elige k2(t) = k2=jvj,
2 (v; t) = k2 (v=jv j) u = k2
signo(v) u; k2 0
(4:50)
{ Si se elige k2(t) = k2=juj,
2 (v; t) = k2
signo(u) v; k2 0
(4:51)
signo(uv); k2 0
(4:52)
{ Si se elige k2(t) = k2=juvj,
2 (v; t) = k2
Para la resolucion de la integral I1, teniendo en cuenta un resultado bien conocido
como,
Z t1
h
i
(4:53)
f_(t)k1f (t)dt = k21 f 2(t1) f 2(0) 12 k1f 2 (0); k1 0
0
puede hacerse,
f_(t) = vu
y
Zt
k1f (t) =
^(0) (4.54)
1 (v; t; )d + 0
Diferenciando con respecto a t se obtiene,
1 (v; t) = k1 vu
(4:55)
Si se elige k1 0 se cumple la condicion buscada. En conjunto la ley de adaptacion,
con la eleccion particular que se ha realizado, quedara,
^("; t) =
Zt
0
k1 v u dt + k2 v u + ^(0)
(4:56)
Considerando el producto vu como una variable, se tiene que la ley de adaptacion
(ecuacion 4.56), tiene una parte proporcional y otra integral (PI).
El tercer paso, consiste en encontrar el termino D, tal que la parte lineal GSL,
sea una funcion de transferencia estrictamente real positiva.
GSL = 1 + aDs(s+) a s2
1
2
(4:57)
70
Ejemplos ilustrativos
Para ello el modelo de referencia debe ser estable y los coecientes a1 , a2 y los
de D(s) deben ser reales. Eligiendo D(s) = d0 + d1s, puede encontrarse que,
2
Re[GSL(jw)] = d0(aa2 + (wd21)a21 + ad20w)w2
2
1
(4:58)
As que para que 4.58 sea mayor que cero para todo w real, se tiene la condicion,
d0a2 0 =) d0 0
a1 d1 d0 0 =) d1 d0=a1
(4.59)
El cuarto paso es realizar la estructura completa del sistema de control adaptativo, la cual corresponde en este a una ley de adaptacion proporcional mas integral
que puede verse en la gura 4.13. Puede observarse que en la realizacion de esta
estructura tambien es necesario un termino derivada del error. En algunos casos
puede accederse al estado completo del modelo de referencia y del modelo ajustable
por lo que podra obtenerse directamente el termino derivada sin tener que realizar
un derivador.
Control adaptativo por modelo de referencia
-
1+a1 s+a2 s2
u
-@@ 6@^
1
1+a1 s+a2 s2
^(0)- HHH
6
71
yM
-d
dt
?e r d
6
e_ - d
1
0
yA
k1 k2 r
@@ v
6@
u
Figura 4.13: MRAC con ley de adaptacion P+I
- ?
72
Ejemplos ilustrativos
Captulo 5
Reguladores autoajustables
(STR)
5.1 Introduccion
En general cuando dise~namos un controlador, este se dise~na para un punto de funcionamiento determinado del proceso. Ahora bien, si los parametros del proceso
varan con el tiempo, ya sea por derivas o desgastes de las constantes fsicas, o
bien porque el proceso es no lineal y se modica el punto de funcionamiento en el
que estamos trabajando, el controlador calculado para un punto de funcionamiento
concreto, no sera en general el adecuado para este tipo de situaciones.
Cuando nos enfrentamos con este tipo de problemas, podemos plantear una
estructura de control que ademas del bucle principal de regulacion que existe en
todo sistema de control, incorpore un segundo bucle de control, en el que a partir
de la informacion recogida del proceso y con un determinado criterio de dise~no, se
modiquen los parametros del regulador.
Como se vio en el captulo 2 sobre los controladores adaptativos, esto puede hacerse con dos planteamientos diferentes: con un modelo de referencia o bien mediante
los reguladores autoajustables1 .
En este caso, se comienza con un metodo de dise~no para sistemas con parametros
conocidos, sustituyendo posteriormente los parametros conocidos por sus estimados
1
Self-tuning regulator (STR) en la terminologa inglesa
73
74
Introduccion
y recalculando el controlador en cada paso. La aplicacion de esta idea es lo que se
conoce como el principio de equivalencia cierta.
El diagrama de bloques de estos controladores se puede ver en la gura 5.1; en
el se distinguen tres partes claramente diferenciadas:
un algoritmo recursivo de estimacion de parametros
un mecanismo de adaptacion que desarrolla la tarea de dise~no del regulador y
un regulador con parametros ajustables.
Estos reguladores conforman una estructura suboptima basada en el principio de
separacion de las tareas de control e identicacion.
Actuacion
Deseada
6
-
Dise~no del - Controlador
BB
- Controlador
Ajustable
Estimacion de
- la Planta
s
- Planta
s
-
BBN
Figura 5.1: Esquema de regulador autoajustable (STR)
La idea de los reguladores autoajustables puede ser aplicada a muchos problemas de control que no son formulados como un problema de control estocastico.
Dada la modularidad y la separacion del control e identicacion, pueden formarse
muchas clases de reguladores autoajustables por combinacion de diferentes metodos
de dise~no e identicadores.
En cuanto al modelo de la planta, supondremos en general, que sobre el sistema
actuan perturbaciones estocasticas, por lo que el proceso estara descrito por su
modelo ARMAX, de la siguiente forma:
Reguladores autoajustables (STR)
(z 1 ) z d u(k) + C (z 1 ) v(k)
y (k ) = B
A(z 1 )
A(z 1 )
75
(5:1)
donde los distintos polinomios y variables tienen el siguiente signicado:
A(z 1 ) = 1 + a1 z 1 + a2 z 2 + :::: + anz n
B (z 1 ) =
b1 z 1 + b2 z 2 + :::: + bnz n
C (z 1 ) = 1 + c1 z 1 + c2z 2 + :::: + cnz n
siendo y(k) la secuencia de salida, u(k) la se~nal de control del sistema, v(k) una
se~nal aleatoria independiente con distribucion gaussiana N (0; ), d es el retardo del
sistema y z 1 es el operador retardo tal que y(k) = z 1 y(k + 1).
En cuanto al criterio de dise~no, pueden dividirse en dos tipos, segun el planteamiento del problema sea: estocastico o no estocastico. Cuando el planteamiento es
estocastico, se consideran sistemas cuyas se~nales no se pueden conocer exactamente
y tampoco se pueden predecir.
En el dise~no con planteamiento estocastico, normalmente se minimiza un cierto
ndice de actuacion, como por ejemplo para el caso de mnima varianza, se trata de
minimizar las variaciones con respecto a cero, ya que se trata de un problema de
regulacion.
J = E fy2(k + d + 1)g
O bien puede plantearse un ndice mas general de la forma:
J = E f(Py(k + d + 1) + Qu(k) Rr(k))2 g
Mediante el planteamiento no estocastico, se considera que las perturbaciones
que inciden sobre un sistema son exactamente conocidas, pudiendose describir estos
sistemas analticamente por medio de un sistema dinamico determinista.
En este caso el ndice de actuacion se da en funcion de unas especicaciones que
debe cumplir la salida del sistema, lo que normalmente se traduce en especicar
una funcion de transferencia deseada en bucle cerrado, como es el caso de asignacion de polos. En la actualidad, se ha demostrado en numerosos casos, que ambos
planteamientos conducen a resultados similares.
76
Asignacion de polos y ceros
A continuacion se exponen algunas tecnicas de dise~no de controladores, que son
utilizadas frecuentemente en control adaptativo.
5.2 Asignacion de polos y ceros
Astrom y Wittenmark (1980) proponen una estructura de control con dise~no por
asignacion de polos como la dada en la gura 5.2. Esta estructura puede interpretarse como un compensador en adelanto y un compensador en bucle cerrado.
Tambien puede demostrarse que dicha estructura corresponde a un controlador lineal
por realimentacion del estado y a un observador. La ley de control puede dise~narse
para unos polos deseados del sistema en bucle cerrado, preservando los ceros inestables del sistema en bucle abierto.
v(k) -
w(k)-
S
6
-
1
M
C
A
-
Bz d
A
G
? y(k)
-
-
Figura 5.2: Estructura de control por asignacion de polos y ceros
El problema que se plantea consiste en hacer que la funcion de transferencia,
desde la salida a la referencia, del sistema (gura 5.2), sea de la forma:
(5:2)
y(k) = RP m z d w(k)
m
donde los polinomios Rm y Pm no tienen factores comunes y el grado de Pm es mayor
o igual a Rm. Esto permitira dar las especicaciones del problema de seguimiento
Reguladores autoajustables (STR)
77
en terminos de la respuesta deseada a una se~nal de referencia. Tambien habra que
especicar la dinamica del observador mediante el polinomio Ao .
El metodo de dise~no elegido es el de sntesis algebraica directa. La solucion
consiste basicamente en resolver una ecuacion polinomial con ciertas restricciones
en los ordenes de los polinomios para asegurar que el regulador propuesto sea causal
y con realizacion mnima.
A partir de la gura 5.2, la funcion de transferencia en bucle cerrado que se
obtiene es:
d
CM
y(k) = AMSBz
w
(k) +
(5:3)
d
+ BGz
AM + BGz d v(k)
Suponiendo que las perturbaciones son despreciables e igualando dicha ecuacion
con la 5.2, se tiene la siguiente ecuacion polinomial:
(AM + BGz d )Rm = SBPm
(5:4)
Las raices de esta ecuacion polinomial contienen las raices de los polinomios S ,
B y Pm. Si el polinomio B no esta contenido en el polinomio Rm , entonces formara
parte del regulador que cancelara estos ceros, luego para que as pueda ocurrir, los
ceros del polinomio B deben ser estables o estar contenidos en Rm .
Factorizando B como B B +, donde el superndice corresponde a los ceros
inestables y el + a los ceros estables. Haciendo tambien,
Rm = B Rm1
M = M1B +
S = AoRm1
(5.5)
introduciendolos en la ecuacion 5.4, se obtiene la expresion :
AM1 + B Gz d = Ao Pm
(5:6)
Para resolver esta ecuacion polinomial, cuyas incognitas son M1 y G, pueden
utilizarse varios metodos, como son: resolucion de un sistema de ecuaciones lineales
simultaneas, utilizacion del metodo de la matriz polinomial (Aracil 1974), o bien
como apuntan Alix et al. (1982), mediante un segundo algoritmo de identicacion,
lo que conduce a un metodo llamado cuasi-directo.
78
Asignacion de polos y ceros
La ecuacion caracterstica del bucle cerrado es de la forma:
AM + BGz d = AM1 B + + B B +Gz d = B +Ao Pm
(5:7)
luego dicha ecuacion tiene como ceros suyos, los ceros estables del sistema en bucle
abierto, los ceros del observador y los polos del modelo deseado.
La ecuacion 5.6 (5.7), tiene innitas soluciones, pudiendose obtener una solucion
unica realizable. Para ello es necesario determinar los ordenes mnimos de los polinomios para que el controlador por asignacion de polos y ceros de Astrom y Wittenmark, sea causal. El grado de un polinomio A, se escribe como grd(A).
A partir de la ecuacion 5.7, se sabe que,
max(grd(A)+ grd(M ); grd(B )+ grd(G)+ d) = grd(B +)+ grd(Ao)+ grd(Pm) (5:8)
Ademas para que el regulador sea causal debe cumplirse que,
grd(G) < grd(M ) y grd(S ) < grd(M )
(5:9)
Por otro lado para una ecuacion de la forma,
AX + BY = C
donde X e Y son las incognitas, se tiene una solucion unica, (resultado conocido del
algebra),
si grd(X ) < grd(B ) o grd(Y ) < grd(A)
A partir de (5.8) pueden ocurrir dos casos:
1. grd(A) + grd(M ) = grd(B +) + grd(Ao) + grd(Pm)
o sea, grd(M ) = grd(B +) + grd(Ao) + grd(Pm) grd(A)
y para obtener una solucion unica,
grd(G) < grd(A) tomando grd(G) < grd(A) 1
El grado del polinomio del observador puede deducirse utilizando 5.9, que
sustituyendo se tiene,
grd(Ao) > 2grd(A) grd(Pm) grd(B +) 1
Reguladores autoajustables (STR)
79
2. grd(B ) + grd(G) + d = grd(B +) + grd(Ao) + grd(Pm)
o sea, grd(G) = grd(Ao) + grd(Pm) grd(B ) d
y para obtener una solucion unica,
grd(M ) < grd(B ) + d tomando grd(M ) < grd(B ) + d 1
Sustituyendo grd(M ) = grd(M1) + grd(B +), en los dos casos nos dan las condiciones para los grados de M1 y G como:
grd(G) = grd(A) 1
grd(M1) = grd(Ao) + grd(Pm) grd(A)
(5.10)
o bien,
grd(G) = grd(Ao) + grd(Pm) grd(B ) d
grd(M1) = grd(B ) + d 1
(5.11)
- Rm z
yr (k)
d
Pm
s
w (k ) -
Rm
Pm
-
A
B
? u
-
-
G
M
e ?
6
Bz d
A
y(k) -
s
Figura 5.3: Interpretacion como modelo de referencia
La estructura del regulador dise~nado puede interpretarse como seguimiento a un
modelo de referencia de la forma dada en 5.2. Operando con la ecuacion 5.4, para
obtener S=M y sustituyendo en la expresion del regulador,
u(k) = M1 (Sw(k) Gy(k))
(5:12)
80
Casos particulares
se tiene,
A y (k + d) + G (y (k) y(k))
u(k ) = B
r
M r
(5:13)
que corresponde a la estructura de la gura 5.3.
En dicha estructura se puede observar que el regulador esta compuesto de dos
partes, un controlador en adelanto (feedforward) y un controlador en bucle cerrado.
Si la se~nal e es igual a cero, la accion del bloque G=M desaparece y la relacion que
liga la entrada con la salida es justamente el modelo de referencia 5.2. Por otro lado
es de notar que el bloque A=B no es realizable pero s lo es Rm A=PmB .
5.3 Casos particulares
Como se desprende de la deduccion anterior, para el dise~no del regulador propuesto
es necesario factorizar el polinomio B y resolver la ecuacion polinomial 5.6. Estos
pasos pueden consumir un tiempo de calculo apreciable y si se pretende que el
algoritmo funcione en lnea con el proceso (caso normal en control adaptativo), es de
gran interes considerar casos particulares en los que dichos calculos se simpliquen.
1. Cancelacion de todos los ceros del sistema.
En este caso se supone que el sistema es de fase mnima, pudiendose cancelar
todos los ceros del sistema en bucle abierto, por lo que se tiene,
B+ = B
B =1
Rm = Rm1 = K
M = M1 B
S = KAo
que sustituyendo en la ecuacion 5.6, se llega a,
AM1 + Gz d = PmAo
(5:14)
Dicha ecuacion es mas simple de resolver, sobre todo si se toman las condiciones
5.11. Este caso tambien puede verse como el controlador de Clarke y Gawthrop
si se eligen,
M1 = zF C = z 1 Ao
Q = 0
w(k) = 0
Reguladores autoajustables (STR)
81
2. No se cancela ningun cero del sistema.
Si el sistema a controlar es de fase no mnima, se supone que todos los ceros
estan fuera del circulo unidad, y se eligen los ceros del sistema en bucle cerrado
como Rm = KB , siendo K una constante, o sea,
B+ = 1
Rm = BRm1 = KB
S = KAo
B =B
M = M1
la ecuacion resultante es de la forma,
AM + BGz d = Pm Ao
5.4 Prediccion optima
El problema de control estocastico esta ntimamente ligado con el de prediccion. Por
ello vamos a desarrollar el predictor optimo (Astrom 1970, Wittenmark 1974), de d
pasos de la salida de un sistema, el cual sera necesario posterioremente.
Dado el proceso estocastico en tiempo discreto:
A(z 1 )y(k + d) = B (z 1 )u(k) + C (z 1 )v(k + d)
(5:15)
donde,
A(z 1 ) = 1 + a1 z 1 + a2 z 2 + :::: + anz n
B (z 1 ) =
b1 z 1 + b2 z 2 + :::: + bnz n
C (z 1 ) = 1 + c1 z 1 + c2z 2 + :::: + cnz n
consideramos el problema de encontrar la prediccion de la salida en el instante k + d
con la informacion disponible en el instante k, tal que la esperanza matematica de
y(k + d) y(k + d=k) al cuadrado sea mnima, siendo y(k) la secuencia de salida,
u(k) la se~nal de control del sistema y v(k) una se~nal aleatoria independiente con
distribucion gaussiana N (0; ).
82
Prediccion optima
Predictor optimo
La ecuacion del sistema 5.15 puede escribirse como :
(z 1 )
C (z 1 ) v(k + d)
y(k + d) = B
u
(
k
)
+
A(z 1 )
A(z 1 )
(5:16)
El ultimo termino de la expresion anterior es una funcion de v(k + d); v(k + d
1) v(k); v(k 1) , donde v(k + d); v(k +1) no estan disponibles en el instante
k, por ello se va a descomponer este ultimo termino, mediante la utilizacion de la
identidad:
con;
C (z 1 ) = A(z 1 )F (z 1 ) + z
(d+1) G(z 1 )
F (z 1 ) = 1 + f1z 1 + ::: + fd z d
G(z 1 ) = go + g1z 1 + ::: + gn 1z
(5.17)
(n 1)
quedando el sistema 5.16 de la forma:
(z 1 ) u(k) + F (z 1 )v(k + d) + z 1 G(z 1 ) v(k)
y(k + d) = B
A(z 1 )
A(z 1 )
(5:18)
resolviendo la ecuacion 5.16 para v(k).
1
(z 1 ) d
v(k) = CA((zz 1)) y(k) B
C (z 1 ) z u(k)
(5:19)
Sustituyendo 5.19 en 5.18 y operando con la ayuda de la identidad 5.17.
1
1
1
1
(z 1 )
1 )v (k +d)+ z G(z ) y (k ) B (z ) G(z ) z
y(k +d) = B
u
(
k
)+
F
(
z
A(z 1 )
C (z 1 )
C (z 1 ) A(z 1 )
(d+1) u(k )
1 (z 1 )
B (z 1 )F (z 1 ) u(k)
y(k + d) = F (z 1 )v(k + d) + z CG
y
(
k
)
+
(z 1 )
C (z 1 )
Reguladores autoajustables (STR)
83
Tomando la esperanza matematica del error de prediccion. (En lo que se sigue,
se omite z 1 en los polinomios para mayor claridad).
E (y(k + d) y^(k + d=k))2 =
z 1 G y(k) + BF u(k) y^(k + d=k))2 =
= E (Fv(k + d) +
C
C
1
z G y(k) + BF u(k) y^(k + d=k))2 +
= E (Fv(k + d))2 + E (
C
C
1G
BF
z
+ 2E (Fv(k + d)(
C y(k) + C u(k) y^(k + d=k)))
El ultimo termino es cero puesto que v(k + d) es independiente, y sobre el primer
termino no podemos inuir, luego la mejor prediccion de la salida se obtiene igualando a cero el segundo termino, con lo que resulta que:
1 (z 1 )
B (z 1 )F (z 1 ) u(k)
y^(k + d=k) = z CG
y
(
k
)
+
(z 1 )
C (z 1 )
O bien :
(z 1 )
zB (z 1 )F (z 1 ) u(k)
y
(
k
)
+
y^(k + d + 1=k) = G
C (z 1 )
C (z 1 )
siendo el error de prediccion,
y(k + d + 1) y^(k + d + 1=k) = F (z 1)v(k + d + 1)
5.5 Regulador de mnima varianza
Este regulador optimo pretende reducir el efecto de las perturbaciones sobre la salida. Para ello la estrategia de control consiste en calcular la se~nal de control u(k),
como una funcion de los valores disponibles en ese instante, o sea, u(k 1); u(k
2); ; y(k); y(k 1); , de tal forma que se minimice el criterio:
J = E (y2(k + d=k))
Se supone que sobre el sistema actuan perturbaciones estocasticas, por lo que el
proceso estara descrito por su modelo ARMA, de la siguiente forma:
A(z 1 )y(k + d) = B (z 1 )u(k) + C (z 1 )v(k + d)
(5:20)
84
Regulador de mnima varianza
donde los distintos polinomios y variables tienen el signicado dado en el apartado
anterior. Deduciendose que la se~nal de control u(k) afecta a la salida y(k + d) pero
no antes. Utilizando la identidad,
C (z 1 ) = A(z 1 )F (z 1) + z (d+1) G(z 1 )
(5:21)
El segundo miembro de la igualdad anterior puede descomponerse, quedando la
ecuacion:
1
1
(z 1 )
1 )v (k + d) + z G(z ) v (k )
y(k + d) = B
u
(
k
)
+
F
(
z
(5:22)
A(z 1 )
A(z 1 )
Los dos ultimos terminos del lado derecho de la igualdad tienen la siguiente
interpretacion:
1. F (z 1 )v(k + d), es una combinacion lineal de las perturbaciones producidas
entre el instante k y k + d, cuyo efecto sobre la salida y(k + d) no se puede
controlar con u(k), ya que v(k + d) para d > 0, es independiente de y(k
1); y(k 2) ; u(k 1); u(k 2) 2. z 1 G(z 1 )v(k)=A(z 1), es el efecto sobre la salida de las perturbaciones anteriores a k.
Resolviendo la ecuacion 5.20 para v(k) y sustituyendo su expresion en 5.22 se obtiene:
1 G(z 1 )
F
(z 1 )B (z 1 )
z
1
y(k + d) = F (z )v(k + d) + C (z 1 ) u(k) + C (z 1 ) y(k)
Tomando la esperanza matematica en ambos miembros se tiene que:
1
E (y2(k + d)) = E (Fv(k + d))2 + E ( FB
u
(k) + z G y(k))2 +
C
C
1G
z
FB
+ 2E (Fv(k + d)(
C y(k) + C u(k)))
El ultimo termino de la expresion anterior es cero, ya que v(k + d) es independiente de los valores anteriores de y(k) y u(k), y sobre el primer termino del segundo
miembro de la ecuacion no se puede inuir, luego el mnimo se obtendra igualando
a cero el termino que queda, resultando que :
1 (z 1 )
u(k) = F (zz 1G)B
y(k)
(z 1 )
Reguladores autoajustables (STR)
o bien,
1
u(k) = zB (zG(1z)F ()z 1 ) y(k)
85
(5:23)
A la vista de las expresiones obtenidas y comparandolas con la deduccion del predictor optimo en el apartado anterior, se puede interpretar el problema del regulador
de mnima varianza, como la determinacion del predictor y buscar la se~nal de control
tal que la prediccion coincida con la salida deseada. En este caso y^(k + d=k) = 0.
5.6 Control predictivo generalizado
El Control predictivo generalizado (gpc) fue propuesto por Clarke et al. (Clarke
1987a), y se ha convertido en uno de los metodos mas populares en el ambito del Control Predictivo tanto en el mundo industrial como en el academico. Se ha empleado
con exito en numerosas aplicaciones industriales (Clarke 1988), mostrando buenas
prestaciones, a la vez que un cierto grado de robustez respecto a sobreparametrizacion
o retardos mal conocidos. Puede resolver muchos problemas de control diferentes
para un amplio campo de procesos con un numero razonable de variables de dise~no,
que son especicadas por el operario dependiendo del conocimiento previo del proceso y de los objetivos de control. Pero a pesar de este exito en la practica, este
metodo adolece de la ausencia de un analisis teorico completo que estudie la inuencia de los parametros de dise~no (horizontes, secuencias de ponderacion) sobre
la estabilidad del bucle cerrado as como de resultados de robustez.
La idea basica del gpc es calcular una secuencia de futuras acciones de control de
tal forma que minimice una funcion de coste multipaso. El ndice a minimizar es la
esperanza matematica de una funcion cuadratica que mide por un lado la distancia
entre la salida predicha del sistema y una cierta trayectoria de referencia hasta el
horizonte de prediccion, y por otro el esfuerzo de control necesario para obtener
dicha salida. Esta idea ha sido usada por Lelic y Zarrop (Lelic 1987a), y Lelic y
Wellstead (Lelic 1987b), para la obtencion de un controlador por asignacion de polos
generalizado que pertenece a la clase de los controladores de horizonte extendido y
es una extension de los bien conocidos controladores por asignacion de polos.
El Control Predictivo Generalizado tiene muchas ideas en comun con otros controladores predictivos, ya que esta basado en las mismas ideas pero posee a su vez
algunas diferencias. Como se vera mas adelante, es capaz de proporcionar una
solucion explcita (en ausencia de restricciones), puede trabajar con procesos inestables o de fase no mnima e incorpora el concepto de horizonte de control as como
86
Control predictivo generalizado
la consideracion en la funcion de coste de ponderacion de los incrementos en las acciones de control. Las diversas posibilidades disponibles para el gpc conducen a una
gran variedad de objetivos de control comparado con otras realizaciones, algunas de
las cuales pueden ser consideradas como subconjuntos o casos lmites del gpc.
5.6.1 Formulacion del control predictivo generalizado
La mayora de los procesos de una sola entrada y una sola salida (single-input singleoutput, siso), al ser considerados en torno a un determinado punto de trabajo y tras
ser linealizados, pueden ser descritos de la siguiente forma:
A(z 1 )y(t) = z d B (z 1 )u(t 1) + C (z 1 )e(t)
donde u(t) y y(t) son respectivamente la se~nal de control y la salida del proceso y
e(t) es un ruido blanco de media cero. A, B y C son los siguientes polinomios en el
operador de desplazamiento hacia atras z 1 :
A(z 1 ) = 1 + a1 z 1 + a2 z 2 + ::: + ana z na
B (z 1 ) = b0 + b1 z 1 + b2 z 2 + ::: + bnb z nb
C (z 1 ) = 1 + c1z 1 + a2z 2 + ::: + cncz nc
donde d es el tiempo muerto del sistema.
Este modelo es conocido como Autorregresivo de Media Movil (Controller AutoRegressive Moving-Average carma). En muchas aplicaciones industriales en las
que las perturbaciones son no-estacionarias resulta mas conveniente (Clarke 1987a),
el uso de un modelo carma integrado, dando lugar al carima, que viene descrito
por:
A(z 1 )y(t) = B (z 1 )z d u(t 1) + C (z 1 ) e(t)
con 4 = 1 z 1 (5:24)
4
Por simplicidad, a partir de ahora el polinomio C se va a tomar igual a 1. Notese
que en el caso de que C pueda ser truncado se puede absorber en A y B . El caso
general de ruido coloreado (C distinto de 1), es tratado mas adelante.
El algoritmo del Control Predictivo Generalizado consiste en aplicar una secuencia de se~nales de control que minimice una funcion de coste de la forma:
J (N1 ; N2; Nu) = E f
N2
X
j =N1
(j )[^y(t+j j t)
Nu
X
2
w(t+j )] + (j )[4u(t+j
j =1
1)]2g (5:25)
Reguladores autoajustables (STR)
87
donde E f.g es la esperanza matematica e y^(t + j j t) es la prediccion optima j pasos
hacia delante de la salida del proceso con datos conocidos hasta el instante t, N1
y N2 son los horizontes mnimo y maximo de coste, Nu es el horizonte de control
y (j ) y (j ) son las secuencias de ponderacion mientras que w(t + j ) es la futura
trayectoria de referencia, que se puede calcular segun se muestra en la gura 5.4.
En (Clarke 1987a) se considera (j ) igual a 1 y (j ) constante.
r(t+k)
w1(t+k)
w2 (t+k)
y(t)
t
Figura 5.4: Trajectoria de referencia
El objetivo es pues el calculo de la futura secuencia de control u(t), u(t +1),... de
tal manera que la salida futura del proceso y(t + j ) permanezca proxima a w(t + j ).
Esto se logra minimizando J (N1 ; N2; Nu).
Con la intencion de minimizar la funcion de coste, se obtendra previamente la
prediccion optima de y(t + j ) para j N1 y j N2. Considerese la siguiente
ecuacion diofantica:
1 = Ej (z 1 ) 4 A + z j Fj (z 1 )
1 = Ej (z 1 )A~ + z j Fj (z 1 )
(5.26)
Los polinomios Ej and Fj estan unicamente denidos con grados j 1 y na
respectivamente. Se pueden obtener dividiendo 1 entre A~(z 1 ) hasta que el resto
88
Control predictivo generalizado
pueda ser factorizado como z j Fj (z 1 ) . El cociente de la division es entonces el
polinomio Ej (z 1 ).
Si se multiplica la ecuacion (5.24) por Ej (z 1 ) zj 4
A~(z 1 )Ej (z 1 )y(t + j ) = Ej (z 1 )B (z 1 ) 4 u(t + j d 1) + Ej (z 1 )e(t + j()5.27)
Teniendo en cuenta (5.26), la ecuacion (5.27) queda:
(1 z j Fj (z 1 ))y(t + j ) = Ej (z 1 )B (z 1 ) 4 u(t + j d 1) + Ej (z 1 )e(t + j )
La cual puede ser escrita como
y(t + j ) = Fj (z 1 )y(t) + Ej (z 1 )B (z 1 ) 4 u(t + j d 1) + Ej (z 1 )e(t + j ) (5:28)
Al ser el grado del polinomio Ej (z 1 ) igual a j 1 los terminos del ruido en la
ecuacion (5.28) estan todos en el futuro. La mejor prediccion de y(t + j ) sera por
consiguiente:
y^(t + j j t) = Gj (z 1 ) 4 u(t + j d 1) + Fj (z 1 )y(t)
donde Gj (z 1 ) = Ej (z 1 )B (z 1 )
Resulta simple demostrar que los polinomios Ej y Fj se pueden obtener recursivamente, de forma que los nuevos valores en el paso j +1 (Ej+1 y Fj+1) sean funcion
de los del paso j . La recursividad de la ecuacion diofantica ha sido demostrada en
(Clarke 1987a). A continuacion se muestra una demostracion mas simple. Existen
otras formulaciones del gpc que no estan basadas en la recursividad de esta ecuacion
(Albertos 1989).
Considerese que los polinomios Ej y Fj se han obtenido dividiendo 1 entre A~(z 1 )
hasta que el resto haya sido factorizado como z j Fj (z 1 ) .
Con:
Fj (z 1 ) = fj;0 + fj;1z 1 + + fj;naz na
Ej (z 1 ) = ej;0 + ej;1z 1 + + ej;j 1z (j 1)
Supongase que se utiliza el mismo procedimiento para obtener Ej+1 y Fj+1, es decir, dividir 1 entre A~(z 1 ) hasta que el resto se pueda factorizar como z (j+1) Fj+1(z 1 )
con
Fj+1(z 1 ) = fj+1;0 + fj+1;1z 1 + + fj+1;naz na
Reguladores autoajustables (STR)
89
Esta claro que solamente es necesario dar un paso mas en la division para obtener
los polinomios Ej+1 y Fj+1. Donde Ej+1 vendra dado por:
Ej+1(z 1 ) = Ej (z 1 ) + ej+1;j z
j
con ej+1;j = fj;0
Los coecientes del polinomio Fj+1 se pueden expresar como:
fj+1;i = fj;i+1 fj;0 a~i+1 i = 0 na 1
El polinomio Gj+1 puede ser obtenido recursivamente como sigue:
Gj+1 = Ej+1B = (Ej + fj;0z j )B = Gj + fj;0z j B
Es decir, los primeros j coecientes de Gj+1 seran identicos a los de Gj mientras
que el resto viene dado por:
gj+1;j+i = gj;j+i + fj;0 bi
para i = 0 nb
Para resolver el gpc es necesario obtener el conjunto de se~nales de control u(t),
u(t + 1), ...,u(t + N ) que minimizan la ecuacion (5.25). Al tener el proceso un
retardo de d perodos de muestreo, la salida solo se vera inuenciada por la se~nal
u(t) despues del instante d + 1. Los valores N1 , N2 y Nu que marcan los horizontes
pueden ser denidos como N1 = d + 1, N2 = d + N y Nu = N . No tiene sentido
hacer N1 < d + 1 ya que los terminos de (5.25) solo dependeran de las se~nales de
control pasadas. Por otro lado, haciendo N1 > d + 1 los primeros puntos de la
secuencia de salida, que seran los mejor estimados, no se tendran en cuenta.
El conjunto de las j predicciones optimas:
y^(t + d + 1 j t) = Gd+1 4 u(t) + Fd+1y(t)
y^(t + d + 2 j t) = Gd+2 4 u(t + 1) + Fd+2 y(t)
...
y^(t + d + N j t) = Gd+N 4 u(t + N 1) + Fd+N y(t)
puede ser escrito en forma matricial como:
y = Gu + F(z 1 )y(t) + G0 (z 1 ) 4 u(t 1)
(5:29)
90
Control predictivo generalizado
Donde
y
G
G0(z 1 )
F(z 1 )
2 y^(t + d + 1 j t) 3
2
3
4
u(t)
66 y^(t + d + 2 j t) 77
66 4u(t + 1) 77
7
66
77
= 66
u
=
...
...
75
4
4
5
y^(t + d + N j t)
4u(t + N 1)
2 g
3
0 ::: 0
0
66 g1 g0 ::: 0 77
= 66 ..
... ... ... 775
4 .
g
g
::: g
2 N 1 N 2 z(G0 (z 1 ) g )
3
d+1
0
66
77
z2 (Gd+2 (z 1 ) g0 g1 z 1 )
6
77
= 6
...
4
5
N
1
1
(
N
1)
z (G (z ) g0 g1z
gN 1z
)
2 F (dz+N1 ) 3
66 Fdd+1
(z 1 ) 777
= 66 +2..
75
4
.
Fd+N (z 1 )
Al depender los ultimos terminos de la ecuacion (5.29) solo del pasado, pueden
agruparse en f, dando lugar a:
y = Gu + f
(5:30)
Entonces la ecuacion (5.25) puede escribirse como:
J = (Gu + f w)T (Gu + f w) + uT u
donde:
h
i
w = w(t + d + 1) w(t + d + 2) w(t + d + N ) T
La ecuacion (5.31) se puede poner como:
J = 12 uT Hu + bu + f0
donde:
H = 2(GT G + I)
b = 2(f w)T G
f0 = (f w)T (f w)
(5:31)
(5.32)
(5:33)
Reguladores autoajustables (STR)
91
El mnimo de J , siempre que no existan restricciones en la se~nal de control, puede
ser calculado igualando a cero el gradiente de J , lo cual conduce a:
u = H 1bT
(5:34)
Debido al uso de la estrategia deslizante, solo el primer elemento del vector u es aplicado realmente, repitiendo de nuevo el mismo procedimiento al siguiente instante
de muestreo. La solucion propuesta involucra la inversion (o al menos la triangularizacion) de una matriz de dimension N N , lo cual conlleva una gran carga de
calculo. El concepto ya usado en otros metodos de horizonte de control es empleado
en (Clarke 1987a) con la nalidad de reducir la cantidad de calculo, asumiendo que
las se~nales de control permaneceran en un valor constante a partir del intervalo
Nu < N . Por tanto la dimension de la matriz que hay que invertir queda reducida
a Nu Nu, quedando la carga de calculo reducida (en el caso lmite de Nu = 1, se
reduce al caso escalar, como en el epsac, (De Keyser 1985) aunque restringiendo la
optimalidad.
Para aumentar la rapidez del algoritmo, fundamental sobre todo en el caso adaptativo, en Camacho y Bordons (1994,1995), se presenta un metodo desarrollado para
la gran mayora de procesos industriales y con una carga de calculo mnima. Tambien
existen realizaciones usando redes neuronales de Hopeld para obtener algoritmos
rapidos (Quero 1990).
5.6.2 Consideracion de ruidos coloreados
Cuando el polinomio del ruido C (z 1) de la ecuacion (5.24) no es igual a 1 la
prediccion cambia ligeramente. Para calcular el predictor en esta situacion se debe
resolver la siguiente ecuacion diofantica:
C (z 1 ) = Ej (z 1 )A~(z 1 ) + z j Fj (z 1 )
(5:35)
con (Ej (z 1 )) = j
polinomio.
1 y (Fj (z 1 )) = (A~(z 1 ))
1, siendo () el grado del
Multiplicando la ecuacion (5.24) por 4Ej (z 1 ) y usando (5.35)
C (z 1 )(y(t + j ) Ej (z 1 )e(t + j )) = Ej (z 1 )B (z 1 ) 4 u(t + j 1) + Fj (z 1 )y(t)
Como los terminos de ruido estan todos en el futuro, el valor esperado para el
termino de la izquierda de la ecuacion anterior es:
92
Controladores para plantas con parametros desconocidos
E [C (z 1 )(y(t + j ) Ej (z 1 )e(t + j ))] = C (z 1 )^y(t + j jt)
El valor esperado de la salida puede ser generado por la ecuacion:
C (z 1 )^y(t + j jt) = Ej (z 1 )B (z 1 ) 4 u(t + j 1) + Fj (z 1 )y(t)
(5:36)
Notese que esta ecuacion de prediccion podra ser usada para generar las predicciones de forma recursiva. Se puede obtener una expresion explcita para la prediccion
optima de j pasos resolviendo la siguiente ecuacion diofantica:
1 = C (z 1 )Mj (z 1 ) + z j Nj (z 1 )
con (Mj (z 1 )) = j 1 y (Nj (z 1 )) = (C (z 1 )) 1.
(5:37)
Multiplicando la ecuacion (5.36) por Mj (z 1 ) y usando (5.37),
y^(t + j jt) = Mj Ej (z 1 )B (z 1 ) 4 u(t + j 1) + Mj (z 1 )Fj (z 1 )y( t) + Nj (z 1 )y(t)
que se puede expresar como:
y^(t+j jt) = G(z 1 )4u(t+j 1)+Gp(z 1 )4u(t+j 1)+(Mj (z 1 )Fj (z 1 )+Nj (z 1 ))y(t)
con (G(z 1 )) < j . Estas predicciones se pueden usar en la funcion de coste que se
minimiza de la misma forma que el caso de ruido blanco.
5.7 Controladores para plantas con parametros
desconocidos
En los apartados anteriores se han dise~nado reguladores y controladores para plantas
cuyos parametros se han supuesto conocidos. En este punto reemplazaremos esta
hipotesis por otra en que se supone que los parametros son desconocidos y constantes.
No obstante, como han demostrado experimentalmente algunos autores (Astrom
1973, Clarke et. al. 1979, Wellstead et al. 1979), estas tecnicas pueden ser aplicadas
cuando los parametros varan lentamente o bien bruscamente, pero sus valores se
mantienen constantes durante largos periodos de tiempo.
Reguladores autoajustables (STR)
93
Como se ha comentado anteriormente, la idea en que se basan los reguladores
autoajustables (STR), reside en la aplicacion del principio de equivalencia cierta.
Ello implica el utilizar un algoritmo de identicacion de parametros, y calcular los
parametros del regulador en base a suponer que los parametros estimados coinciden
con los reales.
5.8 Algoritmos con estructura explcita e implcita
Dentro de los controladores autoajustables, que aplican el principio de equivalencia
cierta, para realizar el mecanismo de adaptacion, existen basicamente dos tipos de
algoritmos, unos que identican directamente los parametros de la planta (algoritmo
con identicacion explcita), gura 5.1, y otros que mediante una reescritura del
modelo de la planta, simplican los pasos, estimandose en este caso directamente
los parametros del controlador (algoritmo con identicacion implcita), gura 5.5.
Actuacion
Deseada
6
-
-
Identicacion
modelo
reparametrizado
BB
- Controlador
Ajustable
s
- Planta
s
-
BBN
Figura 5.5: Algoritmo con identicacion implcita
Algoritmo con identicacion explcita
1. Estimar los parametros del modelo 5.20 mediante un algoritmo de identicacion de parametros, como el propuesto en el captulo 3.
94
Algoritmos con estructura explcita e implcita
2. Calcular los parametros del controlador, segun se ha visto en los apartados
anteriores, necesitandose en muchos casos resolver una ecuacion polinomial.
3. Calcular la se~nal de control con los parametros del controlador.
4. Repetir los pasos 1, 2 y 3 en cada periodo de muestreo.
Mediante este algoritmo se puede realizar un paquete de programas de control, donde
el paso 1 de identicacion sera comun para todos los controladores, cambiando cada
uno de estos bajo demanda del usuario, segun el tipo de proceso a controlar.
Algoritmo con identicacion implcita
1. Estimar los parametros del modelo reparametrizado mediante un algoritmo de
identicacion de parametros.
2. Calcular la se~nal de control con los parametros del controlador.
3. Repetir los pasos 1 y 2 en cada periodo de muestreo.
La realizacion de este algoritmo no siempre es posible, ya que para el paso 1, se necesita en cada caso particular reformular el modelo para que aparezcan directamente
los parametros del controlador.
Se ilustran estos dos tipos de algoritmos, para el caso de dise~no del controlador
con el criterio de asignacion de polos, poniendose de maniesto, que en el caso de la
identicacion implcita, la reescritura del modelo conduce a un modelo bilineal en
los parametros que entra~na una mayor dicultad para su identicacion. Tambien se
hace notar que la reescritura del modelo no siempre es posible y hay que realizarla
para cada caso en particular.
Algoritmo con identicacion explcita
Dados: Rm, Ao, Pm, d
1. Estimar A y B en el modelo,
d
y (k ) = B
A z u(k)
Reguladores autoajustables (STR)
2. Factorizar el polinomio B = B + B
3. Resolver la ecuacion siguiente para M1 y G,
AM1 + B Gz d = Ao Pm
que corresponde a un sistema de ecuaciones lineales.
4. Calcular la se~nal de control mediante,
(
1
S = Ao Rm1
u(k) = M (Sw(k) Gy(k))
M = M1 B +
95
(5:38)
5. Ir al paso 1.
Algoritmo con identicacion implcita
La ecuacion 5.38 puede reescribirse de la siguiente forma:
AM1 y(k) + B Gz d y(k) = AoPm y(k)
como por otro lado Ay(k) = Bz d u(k), lleva a,
M1 Bz d u(k) + B Gz d y(k) = AoPmy(k)
teniendo en cuenta que M = M1 B + y B = B +B , resulta:
AoPm y(k) = B z d [Mu(k) + Gy(k)]
Esta ecuacion puede verse como el modelo de un proceso, en el que los polinomios
del controlador M y G aparecen directamente. Teniendo en cuenta esto, puede
escribirse el algoritmo de control adaptativo con identicacion implcita siguiente:
Dados: Rm1 , Ao, Pm, d
1. Estimar M , G y B en el modelo,
AoPm y(k) = B z d [Mu(k) + Gy(k)]
96
Propiedad de autosintona
2. Calcular la se~nal de control mediante,
u(k) = M1 (Sw(k) Gy(k))
3. Ir al paso 1.
S = AoRm1
Hay que hacer notar que el modelo a identicar en este caso es bilineal en los
parametros, por lo que la identicacion no es trivial. Para el caso en que B = 1, o
sea que tengamos un sistema de fase mnima que tiene todos sus ceros estables, el
algoritmo se reduce notablemente, ya que la identicacion del modelo resultante no
presenta ningun problema.
Ventajas e inconvenientes de uno y otro algoritmo
En el caso de la identicacion explcita se necesitan mas calculos en cada paso.
Por otro lado se tienen directamente los parametros de la planta, lo que es particularmente interesante para poder realizar la supervision del control. As mismo,
como se ha mencionado anteriormente, permitir un unico algoritmo en el que puede
cambiarse el controlador en cada caso.
En el caso de la identicacion implcita se necesitan menos calculos en cada paso,
pero la identicacion es en general mas complicada. Se necesita reescribir el modelo
en cada caso particular, y ello no siempre es posible.
5.9 Propiedad de autosintona
Se ilustra aqu, la propiedad de autosintona de los controladores autoajustables
para el caso del regulador de mnima varianza. Este regulador que se estudio en un
apartado anterior, tiene como resultado que :
1
u(k) = zB (zG(1z)F ()z 1 ) y(k)
utilizandose la identidad :
C (z 1 ) = A(z 1 )F (z 1 ) + z
(d+1) G(z 1 )
Reguladores autoajustables (STR)
con;
F (z 1) = 1 + f1 z 1 + ::: + fd z d
G(z 1) = go + g1 z 1 + ::: + gn 1z
97
(n 1)
As mismo vimos que el modelo del sistema puede escribirse como:
(z 1 ) y(k) + zF (z 1 )B (z 1 ) u(k) + F (z 1 )v(k + d + 1)
y(k + d + 1) = G
C (z 1 )
C (z 1 )
que para el caso en que C (z 1 ) = 1, o sea, no se consideran las perturbaciones, el
algoritmo de identicacion se reduce notablemente, quedando el modelo:
y(k + d + 1) = A0 (z 1 )y(k) + B 0(z 1 )u(k) + v(k + d + 1)
donde A0 (z 1 ) es de orden n 1 y B 0(z 1 ) de orden n + d 1. Este ultimo modelo
puede utilizarse para estimar los parametros de A0 y B 0 por mnimos cuadrados y
de esta forma la ley de control de mnima varianza resulta simplemente:
A0(z 1 ) y(k)
u(k) = B
0 (z 1 )
donde
A0 (z 1 ) = a0o + a01 z 1 + ::: + a0n 1 z (n 1)
B 0 (z 1 ) = b0o + b01 z 1 + ::: + b0n+d 1 z (n+d
1)
que coincidira con el regulador calculado para el caso del conocimiento exacto de
los parametros de la planta.
Para el caso en que C (z 1 ) 6= 1, cabe esperar que los parametros sufran desviaciones, sin embargo, como veremos a continuacion, el regulador converge al regulador
calculado con parametros conocidos.
Si utilizamos el regulador:
A0 y(k)
u(k) = B
0
98
Procedimiento de sntesis
Al sustituir dicho regulador en el modelo de la planta y operando se obtiene la
funcion de transferencia en bucle cerrado de la forma:
0
CB
y(k) = AB 0 + BA0 z d v(k)
As mismo, como el control es de mnima varianza, esta funcion debe ser de la
forma:
y(k) = F (z 1)v(k)
Luego igualando las dos expresiones anteriores y reordenando la ecuacion resultante se obtiene,
0
FBA
d
C = AF + z B 0
que comparando con la identidad:
C = AF + z
(d+1) G
se obtiene la expresion del regulador obtenida anteriormente (5.23),
A0 = G
B 0 zBF
Cuando utilizamos la propiedad de autosintona podemos utilizar un algoritmo
de identicacion de mnimos cuadrados, mucho mas simple que el que sera necesario
para identicar los polinomios A,B y C del modelo original, y el regulador que se
obtiene converge al optimo.
5.10 Procedimiento de sntesis
A continuacion se dan resumidos los pasos del procedimiento a seguir para el calculo
del control, en el que se suponen conocidos los grados de los polinomios A, B y C ,
as como el retardo (d) del sistema.
1er paso :
Reguladores autoajustables (STR)
99
Identicar usando mnimos cuadrados el siguiente modelo:
y(k) = A0(z 1 )z (d+1) y(k) + B 0(z 1 )z (d+1) u(k) + e(k)
donde A0 y B 0 estan denidos por:
A0 (z 1 ) = a0o + a01 z 1 + ::: + a0n 1 z (n 1)
B 0 (z 1 ) = b0o + b01 z 1 + ::: + b0n+d 1 z (n+d 1)
e(k) es el residuo de la identicacion y b0o se ja de antemano por condiciones
de identicabilidad.
2o paso :
Calcular la se~nal de control por la expresion,
A0 (z 1 ) y(k)
u(k) = B
0 (z 1 )
Los pasos descritos anteriormente son efectuados en cada periodo de muestreo, constituyendo un procedimiento de sntesis de los controladores autoajustables.
5.11 Ejemplos ilustrativos
5.11.1 Ejemplo de mnima varianza
Dado el sistema,
y(k) + ay(k 1) = bu(k 1) + e(k) + ce(k 1)
donde a = 0:5, b = 3 y c = 0:7. El regulador de mnima varianza para este sistema
es:
u(k) = a b c y(k) = 0:4y(k)
Un regulador con esta estructura puede obtenerse empleando un algoritmo de
control adaptativo autoajustable, como el descrito en las secciones precedentes,
basado en el modelo:
y(k) + y(k 1) = u(k 1) + "(k 1)
La gura 5.6 muestra la evolucion del parametro cuando = 1. Puede verse
como este converge al valor de 0:4.
100
Ejemplos ilustrativos
0
-0.1
-0.2
parametro
-0.3
-0.4
-0.5
-0.6
-0.7
-0.8
-0.9
-1
0
50
100
150
200
250
300
350
400
tiempo
Figura 5.6: Parametro estimado
5.11.2 Control adaptativo PI
Vamos a ver un ejemplo de control adaptativo suponiendo que el sistema se modela
como un sistema de primer orden y el regulador que se va a emplear es un PI. A
partir de las entradas y salidas (u e y), se identicaran los parametros del modelo y
mediante un metodo de dise~no se actualizaran los parametros del regulador PI.
En un primer paso se utilizara como metodo de dise~no la regla de Ziegler-Nichols.
Dicha regla se basa en los parametros de la respuesta a un escalon de un sistema de
primer orden con retardo,
G(s) = 1 +Ks e d s
(5:39)
Si se elige un tiempo de muestreo (Tm ) tal que d = Tm d, el equivalente discreto
viene dado por,
1
G(z 1 ) = 1 bzaz 1 z d
(5:40)
Reguladores autoajustables (STR)
101
siendo la correspondencia entre ambas representaciones,
a = e Tm = ; = lnTma ; K = 1 b a
Luego con este sistema de control adaptativo, en primer lugar se estiman los
parametros a y b, a partir de estos se calculan y K , y aplicando las reglas de
Ziegler-Nichols, se obtendrian los parametros del regulador PI. Como dichas reglas
son para el sistema continuo, la realizacion practica, conllevara la discretizacion del
regulador PI.
Veamos otro metodo de dise~no: el basado en la tecnica de asignacion de polos.
En este caso, al igual que en el anterior, se identicara el sistema dado por 5.40
y suponiendo que estos parametros son los correctos se dise~nara un regulador PI
discreto, el cual viene dado por:
1
(5:41)
GR(z 1 ) = q01+ qz1 z1
Para el caso en que d = 0, la funcion de transferencia total del conjunto regulador
y planta en bucle cerrado viene dada por:
z + q1 =q0)
GT (z) = (z a)(zbq0 (1)
+ bq0 (z + q1 =q0)
(5:42)
Sistema de segundo orden, donde se pueden jar los dos polos (con q0 y q1 ),
aunque no se puede jar el cero.
Una forma de asignar los polos, puede ser cancelando el polo en a (puede hacerse
si el sistema es estable), con q1 =q0 = a. De esta forma solo habra que jar un
polo. La funcion de transferencia total quedara:
0
GT (z) = (z bq
1) + bq0
(5:43)
Luego si el polo deseado es p quedaran como ecuaciones del regulador adaptativo:
q0 = 1 ^ p
b
q1 = q0 a^
(5:44)
102
Ejemplos ilustrativos
A la vista de estas ecuaciones esta claro, que cuanto mayor se elija p mayor sera
el esfuerzo de control (u). Luego no puede ponerse el polo todo lo cerca del cero
que se quiera. Puede elegirse, por ejemplo como p = 0:9 a, con lo que estamos
especicando que la respuesta del sistema controlado sea mas rapida que la del
sistema original.
Puede observarse que las ecuaciones del controlador adaptativo que se obtiene
en este caso son muy simples, as como los parametros a identicar que seran a^, ^b y
un termino para evitar las componentes de continua. La ecuacion del sistema para
identicar sera:
yk = ayk 1 + buk 1 + Constante
(5:45)
5.11.3 Control de robot movil
Con este ejemplo se pretende estudiar el comportamiento de un controlador adaptativo aplicado al seguimiento de trayectorias de un robot movil. Como se vera,
el problema presenta algunas caractersticas que lo hacen adecuado para el control
adaptativo y los resultados que se obtienen parecen corroborar esta adecuacion.
Modelo del Sistema
Supongase un robot movil (vehculo) y un sistema de referencia asociado a el (ver
gura 5.7). El robot se desplaza a lo largo del eje vertical de este sistema.
Se tiene como referencia un punto objetivo que se desea alcanzar y que se supone
esta sobre la trayectoria que debe seguir el robot. Conforme el robot se desplaza a
lo largo del eje OY, debe anularse el error a lo largo del eje OX, desde la posicion
original hasta el objetivo. El desplazamiento a lo largo del eje OX se controla gracias
a las maniobras sobre la rueda de direccion del robot, que deniran la curvatura del
arco que describira en su desplazamiento.
El sistema que se desea analizar y controlar es el de la evolucion de la mencionada
distancia horizontal hasta el punto objetivo, usando como se~nal accionadora la curvatura comandada por la direccion del vehculo.
La relacion basica entre arco y angulo establece que,
dS = r d ) d = dS
Reguladores autoajustables (STR)
103
OY
objetivo
dΦ
ds
dy’
r
dΦ
OX
dx’
r
centro giro
vehiculo
Figura 5.7: Esquema de robot movil y trayectoria objetivo
donde es la curvatura ( = 1=r).
Observando la gura anterior, se pueden deducir las siguientes relaciones:
dx0 = r (1 cos d)
dy0 = r send
Como ya se ha indicado, se ha considerado un sistema de referencia ligado al
movil. Pasando a un sistema de referencia absoluto, respecto al cual, el sistema
local forma un angulo , se tiene,
dx = cos dx0 sen dy0
dy = sen dx0 + cos dy0
Si se hace la suposicion de que d es sucientemente peque~no:
send ! d;
cos d ! 1;
De forma que,
dx0 = 0;
dy0 = r d = dS ;
104
Ejemplos ilustrativos
Y, por tanto:
dx = sen dS ;
dy = cos dS ;
Introduciendo la velocidad en las ecuaciones:
dx = V sen
dt
dy = V cos dt
El sistema de interes es el que involucra el desplazamiento horizontal en funcion
de la curvatura.
dx = V sen
dt
d = V dt
Por otro lado, se asume que la curvatura real del robot se obtiene a partir de
la curvatura comandada (a la que llamaremos se~nal de control u) a traves de una
cierta dinamica que se puede expresar como:
d = 1 (u )
dt Resumiendo, el sistema dinamico que se debera controlar es:
dx = V sen
dt
d = V dt
d = 1 (u )
dt
(5.46)
Donde la se~nal de control es u(t) y la se~nal de salida es x(t).
Este sistema puede linealizarse tomando el sistema de referencia absoluto tal
que la orientacion del vehculo en todo instante () sea peque~na. Haciendo la
aproximacion del peque~no angulo, se obtiene el siguiente sistema linealizado:
dx = V dt
Reguladores autoajustables (STR)
d = V dt
d = 1 (u )
dt
105
(5.47)
Algoritmo de control
El sistema descrito resulta adecuado para el control adaptativo debido principalmente a dos motivos. En primer lugar, se trata de un sistema no lineal, por lo que el
control adaptativo posibilitara la obtencion de aproximaciones lineales apropiadas
para cada punto de trabajo y por otro lado el sistema es variable en el tiempo.
Ademas en el caso de que se pudiera linealizar mediante la mencionada aproximacion del peque~no angulo, se tratara de un sistema lineal variable, puesto que la
velocidad (V ) que aparece en las expresiones no permanece constante a lo largo del
desplazamiento del robot.
La tecnica de control que se va aplicar es Control Adaptativo Autoajustable mediante Asignacion de Polos.
El ciclo de control consta de tres pasos fundamentales:
1. Identicacion de un sistema lineal aproximado al sistema real en el punto de
trabajo actual.
2. Calculo del regulador apropiado para el sistema identicado.
3. Obtencion y aplicacion de la se~nal de control producida por el regulador, a
partir del error entre la referencia y la salida del sistema.
La identicacion se realizara por Mnimos Cuadrados Recursivos, considerando
un modelo de tercer orden de la forma:
1
1
2
3
G(z 1 ) = YU ((zz 1 )) = 1 +b1az z +1 +b2az z +2 +b3 za z 3
1
2
3
Como se ha descrito en el captulo 3 el algoritmo basico de identicacion, suele
ser insuente en las aplicaciones practicas por lo que hay que incluir una serie de
mejoras. Po ello se ha incluido un factor de olvido variable, en el rango entre 0.96
y 1. Al mismo tiempo se ha incluido acotacion inferior y superior de la matriz
106
Ejemplos ilustrativos
de covarianza. Para acotar inferiormente esta matriz se le suma una matriz R1
constante y para acotarla superiormente se ha impuesto una cota superior a la traza
de dicha matriz.
En cada ciclo del algoritmo de control, se redise~na el controlador. Se ha optado
por dise~nar el controlador usando asignacion de polos y forzando a que el sistema
completo resultante en bucle cerrado posea error estacionario nulo. En la gura 5.8
se puede observar la disposicion de este controlador.
r
T
e
1
S
u
B
A
x
R
Figura 5.8: Estructura del controlador
En el metodo de asignacion de polos se pretende que el sistema en bucle cerrado,
incluyendo al controlador, posea una dinamica especicada. Para ello se exige que
la funcion de transferencia posea un denominador igual a un polinomio deseado
P (z 1 ). La funcion de transferencia del bucle cerrado de la gura 5.8 es:
1
1
GBC (z 1 ) = A(z 1 ) ST(z(z 1) )+BB(z(z )1 ) R(z 1 )
y se desea que tenga la forma:
P (1) B (z 1 )
GBCd(z 1 ) = B
(1) P (z 1 )
En este caso el sistema resultante no incluye ceros adicionales a los de la planta
(como ocurre en otras variantes del metodo de asignacion de polos), y tampoco se
intenta cancelar ninguno de los ceros del sistema original (esto signica que el metodo
sera aplicable con independencia de que el sistema original posea ceros inestables).
Por ultimo, se exige que el sistema tenga ganancia estatica unitaria.
Los polinomios R(z 1 ); S (z 1 ) se obtienen resolviendo la ecuacion polinomica:
A(z 1 ) S (z 1 ) + B (z 1 ) R(z 1 ) = P (z 1)
Reguladores autoajustables (STR)
107
Ademas, como ya se ha indicado, se desea un integrador en el paso directo para
garantizar que el error estacionario sea cero. Para ello, se exige que S (z 1) sea de
la forma:
S (z 1 ) = (1 z 1 ) S 0 (z 1 )
(5:48)
T (z 1 ) debe cumplir:
P (1) = A(1) S (1) + B (1) R(1)
T (1) = B
(1)
B (1)
Aplicando (5.48), resulta que S (1) = 0, con lo cual, T (1) = R(1).
Para especicar el polinomio deseado P (z 1 ) se ha optado por indicar directamente los polos deseados y asignarlos en funcion de los del sistema original. En
primer lugar, se ha realizado la identicacion del sistema dinamico del robot movil,
resultando que los polos son:
p0 = 1:0012 + 0:0233i; p1 = 1:0012 0:0233i; p2 = 0:8163
Los polos deseados se especican en:
p0 = 0:8 + 0:0233i; p1 = 0:8 0:0233i; p2 = 0:8163
Con estos valores se consiguen unos buenos margenes de estabilidad, que se
estiman en:
M 39:27 grados
MG 6:98 dB
Se ha supuesto que en el sistema existe una saturacion debida al actuador y/o
convertidores, por lo que esta debe tenerse en cuenta en el controlador. Es decir,
que a la se~nal uk obtenida a partir del regulador se le aplica: uk = satura(uk ). De
esta forma, el regulador usara los valores exactos que se aplicaron al sistema. En la
gura 5.9 se expone el esquema completo del sistema de control implementado.
Simulaciones Realizadas
Los parametros del modelo utilizado han sido:
108
Ejemplos ilustrativos
1
Actuacion
Deseada
r
T
1
rAux
P
Diseño
Controlador
1
S
e
B
A
Identificador
u
Planta
x
1
xAux
R
1
Figura 5.9: Bucle de control completo
Periodo de muestreo: h = 0:3 s
Velocidad inicial: V = 1:2 m=s. En el caso de las simulaciones que se hagan
con velocidad constante, este sera el valor que tenga la velocidad durante toda
la simulacion.
Constante de tiempo del control de la curvatura: = 5 h
Saturacion de la se~nal de control: usat = 10
En la mayora de los casos, se ha utilizado como entrada de referencia una
sucesion de pulsos positivos o negativos, de amplitud y anchura aleatorias dentro de
unos rangos. Como estimacion inicial del sistema, se usa una identicacion hecha
previamente para el sistema linealizado.
En la gura 5.10 se muestra el resultado para el caso de usar un controlador
jo, considerando que el sistema es lineal pero variable. La velocidad se vara en
escalones de amplitud 0.1. Se puede observar que cuando la velocidad se distancia
signicativamente de la inicial, no se consigue un control aceptable.
Reguladores autoajustables (STR)
109
5
Referencia
Salida
Velocidad
4
3
2
1
0
−1
−2
−3
−4
−5
0
100
200
300
400
500
600
700
800
900
1000
Figura 5.10: Sistema lineal variable con controlador jo
En la gura 5.11 se muestra el resultado para el caso de control adaptativo con el
algoritmo de identicacion completo comentado previamente. Puede observarse que
el comportamiento del sistema es bastante bueno. A ttulo ilustrativo, se muestra
en la gura 5.12 la evolucion de los coecientes del numerador de la funcion de
transferencia identicada.
Para forzar mas la variacion del sistema, se sometio a la velocidad a un crecimiento continuo en forma de rampa de pendiente 0.01. En la gura 5.13, se puede
observar el resultado con el regulador adaptativo.
Por ultimo se comprueba el comportamiento del controlador frente a la presencia
tanto de la no-linealidad como de la variacion de la velocidad. En la gura 5.14,
se muestra la respuesta del sistema variando la velocidad, como ya se hizo anteriormente en forma de rampa con pendiente 0.01. Puede apreciarse que, el considerar
ambas caractersticas, no afecta signicativamente al comportamiento del sistema.
En este caso la referencia son escalones con un ltro de primer orden para suavizar
la se~nal de referencia, ello tiene como consecuencia que el punto de trabajo cambie
mas suavemente.
110
Ejemplos ilustrativos
10
Referencia
Salida
Velocidad
5
0
−5
0
100
200
300
400
500
600
700
800
900
1000
Figura 5.11: Sistema lineal variable con control adaptativo
b1
b2
b3
0.3
0.25
0.2
0.15
0.1
0.05
0
−0.05
−0.1
−0.15
−0.2
0
100
200
300
400
500
600
700
800
900
1000
Figura 5.12: Evolucion de algunos de los parametros identicados
Reguladores autoajustables (STR)
111
12
Referencia
Salida
Velocidad
10
8
6
4
2
0
−2
−4
0
100
200
300
400
500
600
700
800
900
1000
Figura 5.13: Sistema lineal variable con control adaptativo
10
Referencia
Salida
Velocidad
8
6
4
2
0
−2
−4
−6
−8
−10
0
100
200
300
400
500
600
700
800
Figura 5.14: Sistema no lineal variable.
900
1000
112
Ejemplos ilustrativos
Captulo 6
Autoajuste y ajuste por tabla de
controladores
6.1 Introduccion
Los esquemas de control adaptativos como mrac y str necesitan de informacion
a priori acerca de la dinamica del proceso. Es importante conocer las escalas de
tiempo, las cuales son crticas para determinar los intervalos de muestreo y ltros.
La importancia de la informacion a priori tambien aparecio en conexion con intentos
de desarrollar tecnicas para ajuste automatico de reguladores PID. Tales reguladores
son usados para sistemas de control con un amplio rango de constantes de tiempo.
Desde el punto de vista del usuario sera ideal disponer de una funcion mediante
la cual el regulador pudiera ser ajustado. Aunque los esquemas adaptativos convencionales parecen ser herramientas ideales para el ajuste automatico, resultaron
inadecuadas porque requeran conocimiento previo de las escalas de tiempo.
Los reguladores simples (como PIDs), con dos o mas parametros pueden ser ajustados manualmente si no hay demasiada interaccion entre los diferentes parametros,
pero el ajuste manual no es posible para reguladores mas complejos.
Tradicionalmente, el ajuste de tales reguladores ha tomado la via de la modelizacion o identicacion y dise~no del regulador. Esto requiere un consumo de tiempo
elevado, ademas de ser un procedimiento costoso, que solo puede ser aplicado a sistemas crticos en tama~no o en importancia o a sistemas que van a ser manufacturados
113
114
Introduccion
en grandes cantidades.
Algunos fabricantes estan incorporando funciones de autoajuste en sus reguladores, que obtienen la informacion a priori que requiere todo especialista para poder
ajustar un regulador manualmente, y con ello llegan a realizar un ajuste automatico
de los parametros del regulador.
Todas las tecnicas adaptativas pueden ser usadas para el ajuste automatico de
controladores. En tales aplicaciones, el bucle de adaptacion opera durante un tiempo
y puede conmutarse entre este y el controlador jo. Normalmente se a~naden se~nales
de perturbacion para mejorar la estimacion de los parametros. El regulador adaptativo esta operativo hasta que el funcionamiento es satisfactorio, entonces el bucle
de adaptacion es desconectado y el sistema se deja correr con los parametros jos
del regulador.
El autoajuste puede ser considerado como un camino conveniente para incorporar
modelado y dise~no automatico en un regulador. Simplica el uso del regulador y
ampla la clase de problemas en que los metodos de dise~no automatico pueden ser
usados con un coste razonable.
Como se comento en el captulo 2, otra alternativa a los sistemas de control
adaptativos son los controladores ajustables por tabla. En muchas situaciones se
sabe como cambia la dinamica de un proceso con las condiciones de operacion del
mismo. Una fuente de cambio en la dinamica pueden ser las no linealidades que se
presentan, es entonces posible cambiar los parametros del controlador observando
las condiciones de operacion del proceso.
Esta idea recibe el nombre de ajuste por tabla (en la terminologa inglesa, gain
sheduling), y consiste en una realimentacion no lineal que cambia los parametros en
funcion de las condiciones de operacion de una manera previamente programada.
La idea de relacionar los parametros del controlador a variables auxiliares no
es reciente, pero el hardware necesario para implementarlo facilmente no ha estado
disponible hasta hace poco tiempo. El ajuste por tabla es muy costoso llevarlo
a cabo con tecnicas analogicas, sin embargo es facil de implementar en sistemas
controlados por computadoras, con un software adecuado.
Esta tecnica es muy buena para compensar las variaciones de los parametros del
proceso o de no linealidades conocidas. Es controvertido si un sistema con ajuste
por tabla puede ser considerado como sistema adaptativo, porque los parametros se
cambian en bucle abierto. Es un metodo muy adecuado para manejar las variaciones
Autoajuste y ajuste por tabla de controladores
115
de parametros en sistemas de control de vuelo.
A continuacion se van a comentar algunas de las tecnicas de ajuste de controladores que pueden utilizarse para obtener aproximaciones de los procesos dinamicos.
Los metodos pueden utilizarse para ajuste automatico de reguladores del tipo PID o
como preajustes para algoritmos de control adaptativos mas sosticados. As mismo
se comentara la tecnica de ajuste por tabla y se ilustrara mediante algunos ejemplos.
6.2 Control PID
Muchos problemas de control pueden ser manejados muy bien mediante controladores PID. Este algoritmo es muy conocido y es un estandar para el control de
procesos. La version academica del algoritmo es:
Zt
u(t) = Kc e(t) + T1 e( )d + Td de
dt
i o
!
(6:1)
donde u es la variable de control, e el error denido como e = r y, donde r es el
valor de referencia, e y la salida del proceso. Los algoritmos utilizados actualmente
contienen varias modicaciones. Es practica estandar dejar que la accion derivada
solo opere sobre la variable de salida. Puede ser ventajoso dejar la parte proporcional
actuar solo una fraccion del valor de referencia. La accion derivada es sustituda por
una aproximacion que reduce la ganancia en alta frecuencia. La accion integral
tambien se modica para que no mantenga la integracion cuando la variable de
control se sature (anti-windup). Se toman precauciones para que no se produzcan
transitorios cuando el regulador se conmuta de control manual a control automatico
o cuando los parametros se cambian. Una version razonable del regulador PID puede
ser descrita por:
donde
u(t) = P (t) + I (t) + D(t)
(6.2)
P (t) = Kc(uc(t) by(t))
dI = Kc (u (t) y(t)) + 1 (v(t) u(t))
dt
Ti c
Tt
Td dD + D = K T dy
c d
N dt
dt
(6.3)
116
Metodos de respuesta transitoria
El ultimo termino en la expresion dI=dt se introduce para mantener la integral
limitada cuando la variable de salida se satura. La variable v es una se~nal de
seguimiento, la cual es igual a la salida saturada del actuador, y el parametro Tt es
una constante de tiempo para la accion de seguimiento. Los parametros esenciales
para ser ajustados son Kc, Td y Ti. El parametro N puede ser jo; un valor tpico
es N = 10. La constante de tiempo de seguimiento es tpicamente una fraccion del
tiempo de integracion Ti.
6.3 Metodos de respuesta transitoria
Varios metodos sencillos de ajuste para controladores PID estan basados en experimentos de respuesta transitoria. Muchos procesos industriales tienen una respuesta
ante entrada en escalon del tipo mostrado en la gura 6.1. En la cual, la respuesta
63.2 %
28.3 %
t2
t1
L
T
Figura 6.1: Respuesta al escalon unitario de un proceso industrial tpico
escalon es monotona despues de un tiempo inicial. Un sistema con una respuesta
escalon de este tipo puede ser aproximado por la funcion de transferencia:
G(s) = 1 +kTs e sL
(6:4)
donde k es la ganancia estatica, L el tiempo aparente de retraso, T la constante de
tiempo aparente y a es el punto de corte de la tangente con el eje de ordenadas.
Autoajuste y ajuste por tabla de controladores
117
Hay que hacer notar que la distancia desde el origen al corte de la prolongacion de
la recta tangente a la curva (a), cumple la relacion,
a = k TL
(6:5)
6.3.1 Metodo de respuesta en escalon de Ziegler-Nichols
Una manera simple de determinar los parametros de un regulador PID basada en
los datos de respuesta en escalon fue desarrollada por Ziegler y Nichols y publicada
en 1942. El metodo usa solo dos de los parametros rese~nados anteriormente, a y L.
Los parametros del regulador se dan en la siguiente tabla.
Controlador Kc Ti Td
P
1/a
PI
0.9a 3L
PID
1.2/a 2L L/2
La regla de ajuste Ziegler-Nichols fue desarrollada a partir de simulaciones empricas
de muchos sistemas diferentes. La regla tiene el inconveniente de que se obtienen
sistemas en bucle cerrado que estan pobremente amortiguados. Sistemas con mejor
amortiguamiento pueden obtenerse por modicacion de los valores numericos de la
tabla.
Mediante el uso de parametros adicionales es posible determinar si la regla de
Ziegler-Nichols es aplicable. Si la constante de tiempo T esta determinada, una regla
emprica es establecer que la regla de Ziegler-Nichols es aplicable si 0:1 < L=T < 1.
Para valores grandes de L=T es ventajoso usar leyes de control que compensan el
tiempo muerto. Para valores peque~nos de L=T , puede obtenerse un procedimiento
mejorado con compensadores de alto-orden. Es tambien posible usar reglas de ajuste
mas sosticadas basadas en los tres parametros.
6.3.2 Caracterizacion de la respuesta en escalon
Los parametros k, L y T pueden ser determinados a partir de una construccion
graca tal como la indicada en la gura 6.1. Tal metodo es difcil de automatizar.
El parametro k puede ser obtenido de la relacion de cambios estaticos de entrada
118
Metodos basados en realimentacion con rele
y salida en regimen permanente. Hay un metodo siemple, basado en mediciones de
area, para determinar L y T (gura 6.2). Determinando el area A0 y A1 se tiene:
T + L = Ak0
y
T = eAk 1
(6.6)
(6.7)
donde e es la base del logaritmo natural. Los inconvenientes esenciales al metodo
son que puede ser difcil conocer el tama~no del escalon en la se~nal de control y
determinar si se ha alcanzado el regimen permanente. El escalon debera ser del
tama~no suciente como para que la respuesta del sistema sufra variaciones, y no
demasiado grande como probocar perturbaciones.
1
k
A0
0.5
A1
0
0
20
40
60
||
||
||
||
||
||
||
||
|
80
L+T
100
120
140
160
t
Figura 6.2: Metodo del area para la determinacion de L y T
Renamiento en linea
Si se obtiene un ajuste razonable del regulador, el amortiguamiento y la frecuencia natural del sistema en bucle cerrado pueden determinarse a partir de la respuesta
transitoria en bucle cerrado, pudiendose mejorar el ajuste del regulador.
6.4 Metodos basados en realimentacion con rele
Los principales inconvenientes de los metodos de respuesta transitoria es que son
sensibles a las perturbaciones, porque se basan en experimentos en bucle abierto. Los
metodos basados en reles evitan esta dicultad porque los experimentos necesarios
son ejecutados en bucle cerrado.
Autoajuste y ajuste por tabla de controladores
119
La idea basica es que muchos procesos tendran oscilaciones de ciclo lmite bajo
realimentacion con rele. Las propiedades esenciales del proceso pueden determinarse
de los parametros del ciclo lmite, y los parametros de un regulador PID pueden por
tanto calcularse. La gura 6.3 muestra un diagrama de bloque para la aplicacion de
este metodo. Cuando se requiere un ajuste, el conmutador se coloca en la posicion
T, lo cual signica que la realimentacion por rele es activada y el regulador PID se
desconecta. Cuando se alcanza un ciclo lmite, los parametros PID son calculados
y el controlador PID es entonces conectado al proceso. Debera usarse en primer
lugar un metodo aproximado para hacerse una idea de la informacion que puede
obtenerse de un experimento con realimentacion por rele.
- PID
r
6
A
-
T
c
!c !!
u-
Proceso
y
-
- Rele
Figura 6.3: Diagrama de bloque de autoajuste por rele
6.4.1 El metodo del balance armonico
A continuacion se va a comentar un metodo aproximado llamado metodo de balance
armonico o el metodo de la funcion descriptiva. Considerando un sistema realimentado simple, compuesto de una parte lineal con la funcion de transferencia G(s) y
la realimentacion con un rele ideal. El diagrama de bloques se muestra en la gura
6.4.
Se asume que r = 0. Una condicion de aproximacion para las oscilaciones puede
ser determinada como sigue: Asumiendo que hay un ciclo lmite con perodo Tu
y frecuencia wu = 2=Tu tal que la salida de rele es una onda simetrica periodica
cuadrada. Si la amplitud del rele es d, por expansion en serie de Fourier de la
salida de rele, se muestra que el primer armonico tiene la amplitud 4d=. Se asume
120
Metodos basados en realimentacion con rele
r
e 6
-
Rele
u-
Proceso
y
-
Figura 6.4: Sistema lineal con control por rele
ademas que los procesos dinamicos tienen caracter paso bajo y que la contribucion
del primer armonico domina la salida. La se~nal de error tiene entonces la amplitud:
(6:8)
a = 4d jG(jwu)j
La condicion para la oscilacion es tal que:
4d
1
(6:9)
argG(jwu) = y Ku = =
a jG(jwu)j
donde Ku puede interpretarse como la ganancia equivalente del rele para transmision
de se~nales sinusoidales con amplitud a. La condicion es ademas que el sistema lineal
en la gura 6.4, tenga una curva Nyquist que intersecte el eje real negativo. La
amplitud a y la frecuencia de oscilacion wu son facilmente deducibles de la ecuacion
6.9. La frecuencia del ciclo lnmite es ademas automaticamente ajustada a la frecuencia wu en la cual el proceso dinamico en bucle abierto tiene un retraso de fase de
180o. Fsicamente Ku es la ganancia que lleva el sistema al lmite de estabilidad bajo
control proporcional. Un experimento con realimentacion por rele dara ademas el
perodo y la amplitud de la funcion de transferencia en bucle abierto del proceso en
la frecuencia en la cual el retardo de fase es 180o. Hay que hacer notar tambien que
una se~nal de entrada cuyo contenido de energa esta concentrado en wu es generada
automaticamente en el experimento.
Se pueden utilizar varios renamientos o mejoras del metodo. La amplitud de
las oscilaciones del ciclo lmite pueden especicarse por introduccion de una realimentacion que ajuste la amplitud del rele. Por otro lado, una histeresis en el rele
es util para hacer al sistema menos sensible al ruido. Se va a mostrar a continuacion como determinar los parametros de un regulador PID. El metodo puede ser
insensible a las perturbaciones por comparacion y promediado de varios perodos de
oscilacion.
Autoajuste y ajuste por tabla de controladores
121
6.4.2 El metodo de Ziegler-Nichols en bucle cerrado
Una regla simple para escoger los parametros de los reguladores PID esta idealmente
emparejada a la determinacion de Ku y Tu por el metodo del rele. Los valores del
controlador estan dados en la tabla adjunta. Estos parametros dan un sistema
en bucle cerrado con amortiguamiento bajo. Sistemas con mejor amortiguamiento
pueden obtenerse por ligeras modicaciones de los valores de la tabla.
Controlador Kc
Ti
Td
P
0.5 Ku
PI
0.4 Ku 0.8 Tu
PID
0.6 Ku 0.5 Tu 0.12 Tu
Estimaciones mejoradas
A partir del experimento del rele se han obtenido solo dos parametros (Ku y
Tu). Cambiando el punto de trabajo durante el experimento es posible determinar
la ganancia estatica (k) del proceso. El producto kKu puede utilizarse para evaluar
si el ajuste del regulador PID mediante las reglas de Ziegler Nichols es adecuado.
Si 2 < kKu < 20 entonces puede utilizarse el metodo. Valores mas peque~nos
indican que se necesita una ley de control que admita compensacion del tiempo
muerto. Valores mas grandes indican que debe utilizarse un algoritmo de control
mas complejo.
6.4.3 Oscilaciones de rele
Dado que los ciclos lmites con realimentacion por rele es una idea clave de los
metodos de autoajuste por rele, es importante comprender por que un sistema lineal
oscila en estas condiciones y cuando la oscilacion es estable. Es importante tambien
tener metodos para la determinacion del perodo y la amplitud de las oscilaciones.
Considerando el sistema mostrado en la gura 6.4, e introduciendo la realizacion en
el espacio de estados de la funcion de transferencia G(s):
dx = A x + B u
dt
y = Cx
(6.10)
122
Metodos basados en realimentacion con rele
El rele puede ser descrito por:
u=
(
d; si e > 0
d; si e < 0
(6:11)
donde e = r - y.
A continuacion se va analizar el periodo del ciclo lmite. Para ello asumiendo
que el sistema denido en la gura 6.4 y las ecuaciones 6.10 y 6.11 tiene un ciclo
lmite simetrico con perodo T . El perodo T es entonces el valor mas peque~no de
T > 0 que satisface la ecuacion,
C (I + ) 1 = 0
(6:12)
donde
= eAT=2
y
=
Z T=2
0
eAsds B
Hay que hacer notar que la condicion de la ecuacion 6.12 puede escribirse tambien
como,
HT=2( 1) = 0
(6:13)
donde HT=2(z) es la funcion de transferencia impulsional obtenida cuando se muestrea
el sistema de ecuacion 6.10 con perodo T=2.
Habiendo obtenido la formula exacta de la ecuacion 6.12 para T , es posible
investigar la precision de la aproximacion de la funcion descriptiva. Considerando
el caso simetrico e introduciendo h = T=2. La funcion de transferencia impulsional
obtenida cuando se muestrea el sistema de ecuacion 6.10 con perodo h esta dada
por:
1
X
1 (1 e h(s+jnws) )G(s + jnw )
Hh(esh) = h1
s
n= 1 s + jhws
donde ws = 2=h. Haciendo sh = j
+ 2n 2
G
j h
1 j ( + 2n )
+ 2n 1
X
4
=
Im G j
=0
h
0 (1 + 2n)
Hh( 1) =
1
X
Autoajuste y ajuste por tabla de controladores
123
El primer termino de la serie da,
4 2 4
Hh( 1) Im G j h = Im G j T = 0
que es el mismo resultado para el calculo de T obtenido del analisis de la funcion
descriptiva. Esto implica que la aproximacion de la funcion descriptiva es correcta
solo si G(s) tiene un caracter de paso-bajo.
6.5 Ajuste por tabla
Algunas veces es posible encontrar variables auxiliares que correlacionan bien los
cambios en la dinamica de un proceso. Es entonces posible reducir los efectos de las
variaciones de los parametros simplemente cambiando los parametros del regulador
como funcion de las variables auxiliares.
Mecanismo
de
Adaptacion
r
C
e - Controlador
Ajustable
6
-
Medida de
la Variable
auxiliar
u
- Planta
Medio
Ambiente
y
-
CCW
Figura 6.5: Controlador ajustable por tabla
Como se observa en la gura 6.5, el ajuste por tabla puede verser por tanto
como un sistema de control realimentado, en el que las ganancias de realimentacion
son ajustadas usando una compensacion de prealimentacion. Como ejemplo, en los
sistemas de vuelo se usan como variables auxiliares el numero de Mach y la presion
dinamica, que pueden medirse mediante sensores.
El problema principal en el dise~no de sistemas con ajuste por tabla es encontrar las variables auxiliares apropiadas. Esto se hace normalmente basandose en el
124
Dise~no de reguladores con ajuste por tabla
conocimiento fsico del sistema. En control de procesos, el caudal de produccion
puede escogerse frecuentemente como variable auxiliar, puesto que las constantes de
tiempo y tiempo de retardo son inversamente proporcional a dicho caudal.
Cuando se determinan las variables auxiliares, los parametros del regulador se
calculan para un determinado numero de condiciones de operacion, usando algun
metodo de dise~no adecuado. El regulador es por tanto sintonizado o calibrado para
cada condicion de operacion. La estabilidad y actuacion del sistema son evaluados por simulacion; teniendo una atencion especial a la transicion entre diferentes
condiciones de operacion.
Algunas veces es posible obtener ajuste por tabla introduciendo las transformaciones no lineales de tal manera que el sistema transformado no depende de las
condiciones de operacion. Las medidas auxiliares se usan junto con las medidas del
proceso para calcular las variables transformadas. La variable de control transformada se calcula y se retransforma antes de ser aplicada al proceso. El regulador
resultante puede considerarse compuesto de dos transformaciones no lineales con un
regulador lineal en medio. Otras veces la transformacion se basa en las variables
obtenidas indirectamente a traves de estimacion de estados.
El ajuste por tabla tiene la ventaja de que los parametros del regulador pueden
cambiarse muy rapidamente en respuestas a los cambios del proceso. Puesto que
no existe estimacion de los parametros, la limitacion depende de como de rapido
responden las medidas auxiliares a los cambios del proceso.
6.6 Dise~no de reguladores con ajuste por tabla
Es difcil dar reglas generales para dise~nar este tipo de reguladores. La cuestion clave
es determinar las variables que pueden usarse como variables de ajuste. Es claro
que estas se~nales auxiliares deben reejar las condiciones de operacion de la planta.
Idealmente tendramos una expresion que relaciona los parametros del regulador con
las variables de ajuste. Es necesario por tanto tener una buena informacion de la
dinamica del proceso, si se utiliza el ajuste por tabla. Como ideas generales debemos
tener en cuenta:
Linealizacion de actuadores no lineales.
Ajuste por tabla basado en medida de variables auxiliares.
Autoajuste y ajuste por tabla de controladores
125
Ajuste de tiempo basado en el caudal de produccion.
Transformaciones no lineales.
6.6.1 Actuador no lineal
Considerando el sistema no lineal de la gura 2.6, comentado en el captulo 2, con
un regulador PI cuyo actuador es una valvula con la caracterstica,
v = f (u) = u4; u 0
Sea f^ 1 una aproximacion de la inversa de la caracterstica de la valvula. Para
compensar la no linealidad, la salida del regulador se lleva a traves de esta funcion
antes de ser aplicada a la valvula.
r
-- PI
6
c-
f^
1
u
- f
v-
Go
y
-
Figura 6.6: Compensacion no lineal del actuador
Esto da la relacion,
v = f (u) = f (f^ 1(c))
donde c es la salida del regulador PI. La funcion f (f^ 1(c)) debera tener menos
variacion en ganancia que f . Si f^ 1 es la inversa exacta, entonces v = c.
Si consideramos que f (u) = u4 puede ser aproximada por dos lineas: una
conectando los puntos (0,0) y (1.3,3), y otra conectando este punto y el (2,16),
entonces tenemos la gura 6.7. en donde
f
1 (c) =
(
0:433c
0c3
0:0538c + 1:139 3 c 16
126
Dise~no de reguladores con ajuste por tabla
v
20
15
10
5
0
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
u
Figura 6.7: Caracterstica no lineal de la valvula
La gura 6.8 muestra los cambios en la se~nal de referencia en cuatro condiciones
de operacion diferentes cuando utilizamos la aproximacion de la inversa de la valvula.
Al comparar las respuestas con el sistema sin compensar de la gura 2.7, se
observa una considerable mejora en la respuesta del sistema. Con esta mejora es
posible hacer al proceso mas insensible a la nolinealidad de la valvula.
Este ejemplo nos muestra una idea muy util y simple para compensar no linealidades conocidas. En la practica es a menudo suciente aproximar la no linealidad
mediante unos poco segmentos lineales. Hay varios controladores comerciales que
pueden hacer esta clase de compensacion.
6.6.2 Tanque de seccion variable
Consideremos un tanque donde la seccion A varia con la altura h. El modelo es,
d (A(h)h) = q aq2gh
i
dt
donde qi es el ujo de entrada y a es la seccion de la tubera de salida. Si qi es la
entrada y h la salida del sistema, el modelo linealizado en un punto de operacion,
qin0 y h0 , viene dado por la funcion de transferencia,
G(s) = s + donde
= A(1h0)
Autoajuste y ajuste por tabla de controladores
127
0.4
0.3
0.2
0.1
0
0
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
80
90
100
1
0.5
0
0
6
4
2
0
0
10
5
0
0
Figura 6.8: Respuesta a escalon del sistema compensado
128
Dise~no de reguladores con ajuste por tabla
Un controlador PI del tanque viene dado por,
Z
1
u(t) = K e(t) + T (e )d
i
donde
K = 2! y
Ti = 2!!2 Esto nos da un sistema de bucle cerrado con una frecuencia natural ! y un
amortiguamiento relativo .
Introduciendo las expresiones de y se tiene el siguiente controlador ajustable
por tabla,
0
K = 2!A(h0) 2qhin0
0
Ti = 2! = 2A(hq0in)h0 !2
Los valores numericos son frecuentemente tal que 2!, por lo que las
expresiones pueden simplicarse entonces a:
K = 2!A(h0)
Ti = 2!
En este caso, es por tanto suciente hacer la ganancia proporcional a la seccion
del tanque. En la gura 6.9 se muestra la respuesta de este regulador para un tanque
piramidal con seccion variable igual a hl.
Este ejemplo pone de maniesto que algunas veces se pueden medir una o dos
variables en un proceso y usarlas como entradas para el ajuste de la ganancia. Frecuentemente no es tan facil como aparece en este ejemplo, determinar los parametros
del controlador como funcion de las variables medidas. El dise~no del regulador debe
entonces rehacerse para diferentes puntos de trabajo del proceso. Tambien debe tenerse cuidado con las se~nales que se miden por si tienen ruidos, en este caso pueden
ltrarse antes de ser utilizadas como variables de ajuste.
Autoajuste y ajuste por tabla de controladores
129
1
0.9
0.8
0.7
0.6
0.5
0
10
20
30
40
50
60
70
80
90
10
20
30
40
50
60
70
80
90
0.7
0.6
0.5
0.4
0.3
0
Figura 6.9: Respuesta del sistema en diferentes puntos de trabajo
6.6.3 Transformacion no lineal
Es de gran interes encontrar las transformaciones que hacen al sistema transformado
lineal e independiente de las condiciones de operacion. En algunos procesos esto
puede hacerse mediante escalas de tiempos. Todos los procesos asociados con el
ujo de material tienen esta propiedad: molinos rodantes, bandas transportadoras,
ujo en tuberas, etc.
Un sistema de la forma
x(t) = f (x(t)) + g(x(t))u(t)
puede ser transformado en un sistema lineal, con tal de que todos los estados del
sistema puedan ser medidos y darse las condiciones de observabilidad generalizada.
El dise~no se hace en primer lugar transformando el sistema en un sistema lineal
jo. La transformacion es generalmente no lineal y depende de los estados del
proceso. Entonces se dise~na un regulador para el modelo transformado, y las se~nales
de control del modelo son retransformadas en las se~nales de control originales. El
resultado es un controlador no lineal de tipo especial, que puede ser interpretado
130
Dise~no de reguladores con ajuste por tabla
como un controlador de ajuste por tabla. El controlador se construye a partir del
conocimiento acerca de las no linealidades en el modelo.
Transformacion no lineal de segundo orden
Consideremos el sistema,
dx1 = f (x ; x )
1 1 2
dt
dx2 = f (x ; x ; u)
2 1 2
dt
Supongamos que las variables de estado pueden ser medidas y que queremos
encontrar una realimentacion tal que la respuesta de la variable x1 a al se~nal de
mando viene dada por la funcion de transferencia,
!2
G(s) = s2 + 2&!s
(5)
(6:14)
+ !2
Introduciendo nuevas coordenadas z1 y z2 denidas como,
z1 = x1
1
z2 = dx
dt = f1 (x1 ; x2)
y la nueva se~nal de control v, denida por
v = F (x1; x2 ; u) = @@((xf1 )) f1 + @@((xf1 )) f2
(6:15)
1
2
De estas transformaciones resulta un sistema lineal,
dz1 = z
2
dt
dz2 = v
(6.16)
dt
Facilmente se observa que la realimentacion lineal
v = !2(uc z1 ) 2&!z2
(6:17)
da la funcion de transferencia en bucle cerrado (6.14) de uc a z1 = x1 para el sistema
lineal de la ecuacion (6.16), se continua para transformar a las variables originales.
De las ecuaciones (6.15) y (6.17) se tiene para las variables originales:
v = F (x1 ; x2; u) = !2(uc x1 ) 2&!f1(x1 ; x2)
Autoajuste y ajuste por tabla de controladores
131
Resolviendo esta ecuacion para u se obtiene la realimentacion deseada. Del teorema de la funcion implcita, una condicion para la solucion local es que la derivada
parcial @F
@u sea diferente de cero. La generalizacion del ejemplo requiere una solucion
al problema general de transformar un sistema no lineal en uno lineal mediante realimentacion no-lineal. Una version simple del problema tambien se da en el control
de robots industriales. En este caso la ecuacion basica puede escribirse como
J ddt'2 = Te
2
donde J es el momento de inercia, ' un angulo de una union, y Te un par que
depende de la corriente del motor, los angulos de par, y sus dos derivadas. Las
ecuaciones son por tanto de la forma considerada y la realimentacion no lineal se
obtiene determinando las corrientes que dan el par deseado. El problema se llama
transformacion de par.
132
Dise~no de reguladores con ajuste por tabla
Captulo 7
Aplicacion de control adaptativo
7.1 Introduccion
Desde la introduccion del regulador autoajustable (self-tuning) por Astrom y Wittenmark (1973), han aparecido en la literatura muchos trabajos, poniendo de maniesto las propiedades del control adaptativo (Astrom, 1983 y Landau, 1974). Estos
trabajos son en su mayor parte teoricos y aunque se han realizado algunas aplicaciones (Borisson 1976, Buchholt 1979, Kallstrom 1979, Narendra 1980, Dumont
1982, Rubio 1982, etc.), todava no esta bien aceptado a nivel industrial. En este
captulo se presenta una aplicacion de un controlador adaptativo al control de la temperatura de salida en un campo de colectores distribuidos de una Central Electrica
Termosolar (CETS).
Desde hace algun tiempo y fundamentalmente tras la crisis energetica, se ha
puesto de maniesto un creciente interes por el aprovechamiento de fuentes energeticas no exploradas hasta ahora, o que lo han sido insucientemente. Tal es el
caso de la energa solar, siendo una de las mas prometedoras las plantas electricas
termosolares.
Las Centrales Electricas Termosolares, son sistemas empleados para obtener la
energa electrica a partir de la energa solar mediante la transformacion previa de
esta en energa termica. El dise~no de este tipo de centrales no comienza hasta 1977
(Ruz y Gomez 1982), y no es hasta 1981 cuando se ponen en marcha las primeras.
133
134
Descripcion de la planta
La diferencia fundamental entre una planta convencional y una planta solar, es
que la energa primaria no puede ser manipulada por el hombre, es intermitente y
cuando se tiene, resulta cara de transformar. Por todo ello, en una planta solar se
requiere un sosticado sistema de control capaz de mantener unas especicaciones
mas rigurosas que un control clasico.
Fundamentalmente existen dos tipos de CETS, segun el numero de componentes
que transforman la energa solar en termica, si es solo uno, se denominan sistemas
de receptor central (CRS) y si cada captador dispone de su propio dispositivo de
transformacion, se denominan sistemas de colectores distribuidos (DCS). Esta aplicacion se centrara en las CETS de colectores distribuidos y particularmente en el
sistema de control necesario para conseguir un aprovechamiento optimo de la energa
disponible.
7.2 Descripcion de la planta
La central en concreto a la que se ha aplicado el control adaptativo, es la planta
SSPS situada en el municipio de Tabernas (Almera). En dicha planta se dispone
de un campo de captadores cilindroparabolicos con seguimiento solar en elevacion
del tipo ACUREX. Una fotografa de este campo puede verse en la gura 7.1.
Los tubos receptores, situados en la lnea focal, emplean el ujo solar concentrado para calentar un aceite termico, proviniente de la parte inferior de un tanque
de almacenamiento por estraticacion termica a cuya parte superior es devuelto el
aceite una vez aumentada su temperatura. El tanque esta conectado a varios sistemas para utilizar la energa almacenada en el. Tambien aprovechando el principio
de estraticacion termica, para lo cual el aceite se toma caliente de la parte superior
y se devuelve fro a la inferior. Un diagrama simplicado del campo de colectores
solares puede verse en la gura 7.2.
Como puede comprenderse, las condiciones ambientales a que esta sometida una
CETS son en general distintas de las condiciones de dise~no mencionadas. Por su
propia naturaleza, la disponibilidad de energa solar depende de la fecha y hora, de
las condiciones meteorologicas y demas perturbaciones existentes.
La planta esta sometida a perturbaciones en la energa de entrada, que pueden
ser lentas, debidas a variaciones de insolacion a la largo de un da claro, o bien
bruscas, causadas fundamentalmente por la aparicion de nubes y por variaciones de
la temperatura de entrada al campo en la puesta en marcha del sistema de conversion
Aplicacion de control adaptativo
135
Figura 7.1: Campo de colectores distribuidos ACUREX
Campo acurex
Tanque Almacenamiento
p
@
6
@
p
p
p
6
-
Bomba
XXX
H
H
A
Buer
? 6
H
H
Hacia
Generador
Vapor
o
Planta
Desalinizadora
Figura 7.2: Diagrama esquematico del campo de colectores
136
Modelo dinamico del campo
de potencia. Todas estas perturbaciones nos obligan a variar continuamente el ujo
de control, lo que a su vez provoca que el tiempo de residencia del uido en el campo
sea variable.
De todo lo expuesto, se desprende que el proceso a controlar es un sistema
fuertemente no-lineal con retardo variable en el tiempo, y por tanto desde el punto
de vista de control, en el que se considera un modelo lineal, sera un proceso con
parametros variables y retardo tambien variable.
7.3 Modelo dinamico del campo
Con el objeto de poder evaluar mas facilmente y con mas rapidez los distintos controladores posibles, es de interes disponer de un modelo dinamico de la planta, que
permita simular una gran variedad de comportamientos as como de perturbaciones.
En un primer paso se dise~no un modelo concentrado simplicado del campo,
pasandose posteriormente a un modelo de parametros distribuido que permite tener
una mayor exactitud del comportamiento del campo.
7.3.1 Modelo concentrado
Supuesta una representacion concentrada de la planta, el cambio de energa interna
del campo puede ser dada por:
_
C dT
(7:1)
dt = No RI V Pcp(T Ti ) Hl (Tm Ta)
El producto Pcp es una funcion de la temperatura y puede ser aproximado a 1924
KJ/l o C . A partir de los datos experimentales el coeciente de perdidas termicas es
de 1.05 Kw/ oC .
Para identicar el resto de los parametros pueden utilizarse varios metodos,
sometiendo al campo a varios tests. En este caso se ha sometido al campo a una
se~nal cuadrada y los datos tomados se han utilizado para ajustarlos al modelo dado
anteriormente, mediante un metodo de mnimos cuadrados conocido como el metodo
de Powell (Camacho 1977). Del resultado de la identicacion, se estima el parametro
C=2267 Kw/ oC y NoR = 1322m2.
Aplicacion de control adaptativo
137
7.3.2 Modelo distribuido
El campo Acurex esta formado por colectores solares distribuidos del tipo Acurex,
modelo 3001. Estos colectores son parabolicos y con seguimiento del sol en un solo
eje (elevacion). El campo esta dispuesto en 20 las de colectores, las cuales forman
10 lazos paralelos. En total en el campo hay 480 modulos orientados de este a oeste
y la supercie total de espejos es 2674 m2 .
Los tubos receptores, situados en la lnea focal, emplean el ujo solar concentrado para calentar un aceite termico, proveniente de la parte inferior de un tanque
de almacenamiento por estraticacion termica a cuya parte superior es devuelto
el aceite caliente. El tanque puede almacenar, en el punto de dise~no, 2.7 Mwth
de energa en aceite termico proveniente de los campos de colectores distribuidos.
El tanque esta conectado con un generador de vapor o una planta desalinizadora,
tambien aprovechando el principio de estraticacion termica. El aceite se toma a
elevada temperatura de la parte superior del tanque, se enfra al ceder su calor, y
se devuelve frio a la parte inferior.
El colector Acurex posee una supercie parabolica para concentrar la radiacion
solar directa sobre el tubo receptor, que esta localizado en la zona focal de la
parabola. El aceite termico es bombeado a traves de la tubera receptora y recoge
el calor transferido a traves de las paredes del tubo.
El sistema esta provisto con un sistema de seguimiento del sol que mueve los espejos alrededor de un eje paralelo a aquel en el que se situa la tuberia. El mecanismo
de seguimiento puede alcanzar tres posibles estados:
Seguimiento ('track'): El mecanismo sigue el sol y los colectores enfocan sobre
la tuberia.
Desenfocado ('desteer'): El mecanismo sigue el sol, pero desenfoca el colector
varios grados, de forma que el tubo receptor se situa fuera de la zona focal y
el uido no se calienta.
Bocabajo ('stow'): El mecanismo lleva al colector a una posicion invertida, no
existiendo nigun tipo de seguimiento del sol. A este estado se llega al nal del
da o si una alarma grave se produce.
Un bucle ACUREX esta formado por cuatro colectores de doce modulos, conectados en serie de forma apropiada. El bucle tiene 172 m. de longitud, siendo de 142
138
Modelo dinamico del campo
m. la parte activa del bucle y el resto 30 m. pasiva. Debido a la complejidad del
sistema y a la existencia de no-linealidades, se ha desarrollado un modelo numerico
para la simulacion de dicho sistema, habiendose hecho las siguientes hipotesis:
Las propiedades del aceite son consideradas como funciones de la temperatura,
varian con el tiempo y el espacio.
El ujo incidente de calor en cada seccion se supone que es circunferencialmente
uniforme e igual al valor medio.
Las variaciones de temperatura radial en la pared del tubo son despreciadas.
Esta suposicion es razonable para una pared na que tiene una buena conductividad termica.
El ujo de aceite y la irradiancia son consideradas como funciones del tiempo
y en cada instante son las mismas en cada momento. (Se supone uido incomprensible).
Las perdidas por conduccion de calor axial en ambos lados de la pared y del
uido son despreciadas. La conduccion axial en el tubo debe ser peque~na ya
que la pared es na, teniendo una alta resistencia termica. En el uido la
conduccion axial es relativamente peque~na porque la conductividad del aceite
es pobre.
Con las hipotesis anteriores y aplicando la conservacion de la energa en el tubo
de metal de un volumen de control de longitud dx sobre un intervalo de tiempo dt,
se tiene:
m CmAm @T@tm = InoD HlG(Tm Ta ) LHt (Tm Tf )
(7:2)
Similarmente para un elemento de uido:
f
f Cf Af @T
+ f Cf V_ @Tf = LHt (Tm Tf )
@t
@x
(7:3)
En la ecuaciones anteriores el subndice m se reere al metal y el f al uido y:
c
A
T
=
=
=
=
densidad
calor especco
area transversal
temperatura
Aplicacion de control adaptativo
I
no
H1
D
Ht
G
L
V_
=
=
=
=
=
=
=
=
139
irradiacion
coeciente de reectividad
funcion de las peerdidas metal-ambiente
anchura espejos
coeciente de transmision metal uido
Diametro exterior del tubo
Diametro interior del tubo
caudal de aceite
Las ecuaciones que describen el comportamiento en un elemento pasivo son similares, excepto que la entrada de energa solar es cero y el coeciente de perdidas
es mucho menor.
Estas ecuaciones han sido resueltas utilizando un procedimiento iterativo en
diferencias nitas. Las temperaturas del uido y del tubo absorbedor son calculadas
para cada intervalo de tiempo y para cada elemento de longitud. La longitud de cada
segmento es de 1 m y el intervalo de integracion es de 0,5 segundos. Este intervalo de
integracion se ha elegido como un compromiso entre el tiempo de calculo necesario
y la precision obtenida.
Se ha elegido un algoritmo en dos etapas para resolver las ecuaciones de las
temperaturas. En la primera etapa se calculan las temperaturas del uido y del
metal suponiendo que el uido este en regimen estacionario. En la segunda etapa la
temperatura del uido es corregida en funcion de la energa neta transportada por
el uido.
1a Etapa
Tm (n; k) = Tm (n; k 1) + R Ct A (InoD Hl G(Tm (n; k 1) Ta )
m m m
LHt1 (Tm (n; k 1) T1f (n; k 1))
Tf (n; k) = T1f (n; k 1) + RHtC1 At (Tm (n; k 1) T1f (n; k 1))
f f f
2a Etapa
t (T (n; k) T (n 1; k))
T1f (n; k) = Tf (n; k 1) AV f
f
f x
140
Control en adelanto
En estas ecuaciones en diferencias, Tf (n; k) y Tm (n; k) son las temperaturas en
el segmento n durante el intervalo de tiempo k. T1f es la temperatura del uidos
antes de la correccion mientras que Tf es la temperatura del uido despues de la
correccion.
A partir de datos reales de la planta se han determinado las distintas constantes
y coecientes que aparecen en las ecuaciones anteriores, siendo ajustados muchos de
ellos a funciones polinomiales de la temperatura, mediante un metodo de mnimos
cuadrados.
7.4 Control en adelanto
A partir de la representacion concentrada de la planta, ecuacion 7.1, se tiene en el
regimen permanente:
l (Tm Ta )
V_ = No RIPc (H
p Tr Ti )
Esta ultima ecuacion puede ser aproximada por:
V_ = K1TRI TK2
r
i
Esta expresion constituye el calculo del ujo como funcion de la temperatura
de referencia, temperatura de entrada, reectancia y de la irradiancia, siendo utilizada para el control en adelanto (feedforward). Las constantes K1 y K2 , han sido
determinadas experimentalmente, teniendo los valores de K1 = 0:93 y K2 = 155
(Carmona, 1983).
7.5 Control en bucle cerrado
Es necesario compensar el error que pueda producirse mediante un regulador en bucle
cerrado. Dado que el ujo calculado en bucle abierto, es una buena estimacion, el
valor de la se~nal de control del bucle cerrado se ha saturado a mas, menos un 20%
del valor de bucle abierto, con ello se consigue mejor estabilidad en los transitorios,
ya que se ha reducido la banda de regulacion.
Aplicacion de control adaptativo
temp. entrada (Tin)
3
eP.I.
- 6 ? ?
Tref-
Mecanismo
Adaptacion
141
u - Compensacion us
Serie
?
Radiacion
? ?
- Planta
Identicador
To = y-
?
Figura 7.3: Estructura de control con compensacion serie
7.5.1 Controlador PI
La planta en consideracion presenta un retardo muy grande (del orden de 2 a 8
minutos), y variable con el ujo de entrada. Para este tipo de sistemas en que el
retardo es mucho mayor que el orden del sistema, puede considerarse (Isermann,
1981) un tipo particular de controlador.
Suponiendo que la planta se modela por la ecuacion y(k) = bu(k d), donde d
es el retardo en perodos de muestreo y b la ganancia del sistema, el controlador que
resulta por control en tiempo mnimo tiene por expresion:
u(k) = u(k d) + e(k)=b
(7:4)
Si en vez de utilizar este controlador directamente, se aproxima un regulador P.I.
para que tenga la misma respuesta, se obtiene:
u(k) = u(k 1) + qoe(k) + qie(k 1)
(7:5)
donde :
qo = 1=(2b)
qi = qo (d 2)=d
(7.6)
Para este regulador, puede demostrarse (Isermann, 1981), que es menos sensible
al error en la exactitud del retardo, por ello resulta mas conveniente su utilizacon
142
Control en bucle cerrado
que el controlador 7.4, dada las caracteristicas del proceso. Por todo ello en el
bucle de realimentacion se ha utilizado un P.I. Tambien ha de tenerse en cuenta que
cuando exista un error en la determinacion del retardo, es mejor considerarlo mayor
del que se prevea, en orden a asegurar la estabilidad.
7.5.2 Controlador PI por asignacion de polos
Desde el punto de vista de dise~no del controlador adaptativo autoajustable, el proceso puede modelarse como un sistema de primer orden, que relaciona los cambios
en el ujo de aceite con la temperatura de salida. Observando la respuesta al escalon
obtenida de la planta, indica que en tiempo contnuo, puede aproximarse por una
funcion de transferencia de primer orden con un retardo:
(7:7)
g(s) = (1 +Ks) e sd
El retardo d , constante de tiempo y ganancia K del sistema varia con el ujo
de aceite y en el punto de operacion a bajo ujo el retardo es aproximadamente el
doble que el retardo a ujo maximo. Puede verse (Rubio 1989), que un camino para
adaptar esta variacion en el tiempo de retardo es usar un modelo de la forma,
bo + b1 z 1 ) z 2
g(z) = ((1
(7:8)
az 1 )
El perodo de muestreo se escoge igual al tiempo de retardo mnimo. De esta
forma el mnimo retardo esta representado por el modelo con el parametro b1 = 0.
Cuando b0 = 0, el modelo representa el maximo tiempo de retardo de dos perodos.
Para los valores del tiempo de retardo donde d no sea un multiplo entero del perodo
de muestreo, por ejemplo T < d < 2T , el factor (bo + b1 z 1 ) actua como una
aproximacion discreta de Pade de primer orden del retardo. Basado en este modelo
se dise~na el siguiente algoritmo autoajustable por asignacion de polos.
La funcion de transferencia de un controlador PI viene dada por:
g1 z 1 )
k(z) = go(1
(1 z 1 )
(7:9)
Escogiendo el cero del controlador que cancele el polo de la planta, o sea haciendo
a = g1, El polinomio caracterstico en bucle cerrado, P (z), es de la forma:
P (z) = z3 z2 + goboz + gob1
Aplicacion de control adaptativo
143
Si al sistema en bucle cerrado se le especica que tenga un polo en z = A,
entonces del polinomio caracterstico P (z) evaluado en A, se deduce que go hay que
elegirlo tal que:
2 (1 A)
go = A
(7:10)
(bo A + b1)
Entonces conociendo a; bo and b1 del modelo, los parametros del controlador go
y g1 pueden calcularse especicando un polo dominante en bucle cerrado en z = A.
Analizando P(z) puede deducirse la localizacion de los otros dos polos del sistema.
P (z) = [z2 (1 A)z + gobo A(1 A)](z A)
A partir del lugar de las raices del sistema, se tiene que aparte del polo en z = A,
el sistema tendra otros dos polos reales, uno negativo y otro positivo. Resolviendo
P(z) se puede validar la localizacion de estos polos, comprobandose que efectivamente corresponden a modos que decaen rapidamente y que el polo en z = A es el
polo dominante.
Algunos valores tpicos de simulaciones han sido:
A
g0
0:9 a 1:539
0:95 a 1:2398
g1
1:3851
1:1778
Los coecientes del regulador g0 y g1 se saturan para evitar sobreoscilaciones en
las ocasiones en que el identicador no funcione correctamente, debido al paso de
nubes u otras perturbaciones.
7.5.3 Controlador autoajustable
Se ha desarrollado un algoritmo de control adaptativo autoajustable, version explcita
mediante el metodo de asignacion de polos desarrollado en la seccion anterior. Los
parametros del modelo del sistema se determinan en lnea mediante el metodo de
mnimos cuadrados recursivos. El algoritmo de estimacion de parametros incorpora
factorizacion UDU (Bierman 1977) y factor de olvido variable (Fortescue 1981). La
funcion de transferencia en z del modelo puede representarse mediante la ecuacion
en diferencias de la forma:
y(n) = a y(n 1) + bo u(n 2) + b1 u(n 3) + d
144
Control en bucle cerrado
El termino d es una constante introducida para tener en cuenta los valores medios
de las se~nales de entrada y salida. Las perturbaciones del sistema son tales que puede
emplearse un modelo determinista.
Desde el punto de vista de la identicacion el sistema anterior tiene cuatro
parametros a determinar: [a bo b1 d].
Un rasgo particular del sistema es que se necesita incluir un termino de adelanto
en el bucle de control. El modelo de la planta descrito esta basado en la relacion
entre los cambios de la temperatura de salida y los cambios en el ujo de aceite.
Pero la temperatura de salida de la planta esta inuida por los cambios de otras
variables del sistema, tales como, la irradiancia solar y la temperatura de entrada
del aceite. Si cualquiera de estas variables cambia durante la fase de indenticacion,
ello introduce un cambio en la salida del sistema que no esta motivado por cambios
en el ujo, por que las variaciones que se produciran en los parametros estimados
seran innecesarias y el modelo se desajustara.
Dado que la irradiacion solar y la temperatura de entrada pueden medirse, este
problema puede reducirse mediante la incorporacion de un termino de adelanto,
calculado para las condiciones de regimen permanente, el cual realiza un ajuste en
el ujo de entrada, encaminado a eliminar el cambio en la temperatura de salida
causado por la variacion en la irradiancia solar y la temperatura de entrada.
Si el termino en adelanto fuese perfecto los cambios en la temperatura de salida
solo serian debido a los cambios en la se~nal de entrada. Evidentemente la eliminacion
exacta de estos cambios es imposible, pero este termino reduce considerablemente
los mayores problemas inherentes en el modelo planteado y permite una mejor identicacion de los parametros de este.
La se~nal del termino en adelanto tambien produce benecios cuando hay pertubaciones en la irradiancia solar y en la temperatura de entrada, pero la principal
razon para incluir este termino es para preservar la validez del modelo del sistema
asumido en el algoritmo de control adaptativo autoajustable.
7.5.4 Controlador PID adaptativo
Se ha realizado un desarrollo teorico paralelo al del regulador P.I. por asignacion de
polos con el n de ensayar un regulador P.I.D. adaptativo.
La funcion de transferencia en el dominio del tiempo puede escribirse:
Aplicacion de control adaptativo
145
Gpid(s) = Kpid(1 + T1s + Td s)
i
Para pasar al dominio discreto se utiliza la aproximacion de Euler para el termino
integral y la rectangular hacia detras (Backward) para el derivativo (Astrom 1984).
uk = Kpid(1 + T (zTm 1) + ( Td Td )( z T1d ))
Tm + N z (NTm +Td )
i
eik = z 1 1 ek
edk =
z
z 1
ek
Td
(NTm +Td )
Para calcular los parametros caractersticos (ganancia del controlador, tiempo
integral y derivativo) se han utilizado las reglas de Ziegler-Nichols (Z-N) en bucle
abierto. Los dos mecanismos de adaptacion usados han sido:
1. Usar tiempos integral y derivativo jos, adaptando solo la ganancia del controlador (dado que no se puede con un modelo del sistema de primer orden estimar el retardo puro), pero tomandola un cuarto (para evitar comportamiento
oscilatorio) de la usada por el metodo de Z-N en bucle abierto.
2. Se adapta la ganancia, tiempo integral y derivativo a~nadiendo un cero a la
funcion de transferencia para estimar un retardo variable, como se indica en
(Camacho 1992).
b0 + b1 z 1 )
g(z) = z 2 ((1
az 1 )
Dado que el perodo de muestreo se escoge igual al mnimo valor del retardo,
este se representa en el modelo con b1 = 0. Cuando b0 = 0 el modelo tiene
un retardo maximo de dos perodos de muestreo. Para valores del retardo
no multiplos enteros del perodo de muestreo, el numerador actua como una
aproximacion discreta de Pade a un retraso.
146
Control en bucle cerrado
7.5.5 Controlador predictivo generalizado
En esta seccion se expone un metodo sencillo para aplicar GPC adaptativo. Una
descripcion detallada del metodo puede encontrarse en (Camacho 1993, 1994, 1995).
Este metodo simplicado disminuye la complejidad de calculos que hay que realizar
a la hora de aplicar un controlador predictivo adaptativo. El metodo hace uso del
hecho de que un controlador predictivo generalizado da lugar a una ley de control con
pocos parametros. Estos parametros pueden ser calculados en el rango de interes de
los parametros del proceso. Se usa una funcion que aproxima los parametros reales
del controlador y que implica menor esfuerzo computacional.
Como se vio en el apartado 5.6, este controlador minimiza una funcion de coste
de la forma:
N2
X
J (N1 ; N2; N3) = E f
j =N1
(j )[^y(t + j j t) w(t + j )]2 +
N3
X
j =1
(j )[4u(t + j 1)]2g (7:11)
De acuerdo con el metodo descrito en (Camacho 1993,1995) y los requerimientos
para control adaptativo se escoge un modelo CARIMA.
(7:12)
A(z 1 )y(t) = B (z 1 )u(t 1)z d + C (z 1 ) "(t)
4
que para el caso concreto que nos ocupa, A; B y C son los polinomios:
A(z 1 ) = 1 az 1 ; B (z 1 ) = b ; C (z 1 ) = 1
Con d = 1. Este esquema permite accion integral para eliminar osets en la
se~nal de salida.
"(t)
(1 az 1 )y(t) = bz 1 u(t 1) +
(7:13)
4
Considerando el retardo d, se escogen N1 = d + 1, N2 = d + N y N3 = N . En
nuestro caso N1 = 2 y N2 = 16. El rango de posibles valores de se ha obtenido
via simulacion (Camacho 1995) y es (3 7). Si disminuye se obtienen
controladores mas rapidos.
Si y^(t + j j t) y y^(t + j 1 j t) son conocidas, como las componentes de los ruidos
estan todas en el futuro, el mejor valor esperado para y^(t + j + 1 j t) viene dado por:
y^(t + j + 1 j t) = (1 + a)^y(t + j j t) ay^(t + j 1 j t) + b 4 u(t + j 1) (7:14)
Aplicacion de control adaptativo
147
Como se deduce en (Camacho 1995), si la secuencia de referencias futuras, w(t +
j ), no se conoce y se considera igual a la referencia actual r(t), el incremento de
control 4u(t) puede escribirse como:
4 u(t) = l1 y^(t + 1 j t) + l2 y(t) + l3 r(t)
(7:15)
15
15
Donde qP = [l1l2 ] y l3 = P qj P rij .
i=1
j =1
Si las referencias futuras fueran conocidas l3 = qR sera un vector de ganancias
que las multiplicaria. Los coecientes l1 , l2, l3 ; son funciones de a; b, (i) y (i).
Si se dise~na el GPC considerando que la planta tiene ganancia estatica unidad, los
coecientes en (7.15) dependeran solo de (i) y (i) (que se suponen jos) y del
polo de la planta que variara en el caso de control adaptativo. Haciendo esto, se usa
una secuencia de ponderacion normalizada que se corregira de forma adecuada en
sistemas con ganancia estatica distinta de la unidad.
El valor de y^(t + 1 j t) se obtiene usando el predictor descrito en (7.14). El
esquema de control propuesto puede verse en la gura 7.4. Los parametros estimados
de la planta se usan para calcular los parametros del controlador (l1; l2 ; l3) via un
mecanismo de adaptacion.
Solar radiation
Inlet oil temperature
r(t)
l3
+
+ +
1 - a^
b^
+
+
FEED
PLANT
y(t)
FORWARD
-1
Z
IDENT
b^
^a
ADAPT
l2
PREDICTOR
l1
Figura 7.4: Esquema de control adaptativo
La forma estandar de calcular los parametros del controlador sera calculando
una serie de matrices y resolviendo una ecuacion matricial seguido de la generacion
de la ley de control de la ecuacion (7.15). Esto trae consigo la triangularizacion de
una matriz N N , que es prohibitivo en aplicaciones en tiempo real.
148
Control en bucle cerrado
Como se sugiere en (Camacho 1993, 1994), los coecientes del controlador se
pueden calcular por interpolacion en un conjunto de valores conocidos previos.
En el libro (Camacho 1995), se calculan estos coecientes para (i) = 1, (i) = 5
y N = 15. El polo del sistema se cambia en pasos de 0.0005 de 0.85 a 0.95, que
son los valores que garantizan la estabilidad del sistema si la identicacion de los
mismos no es muy precisa. Es importante rese~nar que como la ganancia del bucle
cerrado debe ser igual a la unidad, la suma de los tres parametros debe ser cero, y
por tanto solo dos de ellos deben ser conocidos.
En el caso de (i) = 5, (i) = 1 y para un horizonte de control de 15 los
coecientes del controlador vienen dados por:
l1 = 0:4338 0:6041^a=(1:11 a^)
l2 = 0:4063 + 0:4386^a=(1:082 a^)
l3 = l1 l2
(7.16)
Estas expresiones dan una buena aproximacion de los parametros reales del controlador (error inferior al 0.6 por ciento).
En cada perodo de muestreo el controlador adaptativo debe realizar los siguientes pasos (gura 7.4):
1. Estimar los parametros del modelo lineal a partir de entradas y salidas de la
planta.
2. Ajustar los parametros del controlador usando las expresiones obtenidas para
li (ecu. 7.16).
3. Calcular y^(t + d j t) usando el predictor (ecu. 7.14).
4. Calcular la se~nal de control usando (ecu. 7.15).
5. Supervisar el perfecto funcionamiento del control.
7.5.6 Supervision
Un requerimiento basico del algoritmo de control adaptativo es que el bucle cerrado
es estable si los parametros estimados convergen a ciertos valores. Para garantizar
Aplicacion de control adaptativo
149
dicha convergencia deben cumplirse ciertas condiciones, las cuales dependen del tipo
de perturbaciones y de si la entrada es lo sucientemente rica.
Como se ha comentado se pueden conseguir una serie de mejoras en el comportamiento del sistema en bucle cerrado si paralelamente al algoritmo se mantiene un
cierto nivel de supervision que chequee los parametros fundamentales del proceso:
los parametros estimados.
La variable de control.
La evolucion del identicador.
En el caso concreto de la planta solar las medidas tomadas son las siguientes:
1. En cuanto a la identicacion de la planta, sabemos que la ganancia del sistema es negativa e inferior a un cierto valor. Por ello la ganancia identicada
es ltrada antes de considerarla como valida, para evitar una identicacion
erronea, que se puede producir en los casos en que la irradiancia (principal
parametro de la planta que vara), disminuye y por tanto la ganancia identicada aparentemente sera positiva, dado que a una disminucion de ujo le
correspondera una disminucion de temperatura.
^b(k) < Co y ^bf (k + 1) = r^bf (k) + (1 r)^b(k + 1)
El identicador trabaja con las variaciones de temperatura y ujo con respecto a los valores de regimen permanente, estando dados estos valores por
la temperatura de referencia y por el ujo calculado por el controlador en
adelanto.
Mas concretamente, el polo estimado del sistema en bucle abierto debe variar
entre 0.85 y 0.95 y la ganancia estatica del sistema entre 0.9 y 1.2. Estos
margenes se han escogido analizando la respuesta dinamica del sistema, y son
necesarios pues si se produce una estimacion erronea de los parametros puede
llegar a hacerse inestable el proceso.
La temperatura de referencia para el control por adelanto se ltra antes de ser
usada por el identicador para cancelar dinamicas no modeladas.
Este ltro es de la forma:
tfff = 0:5 tff + 0:5 tfff
150
Estudios de simulacion
donde tff es la temperatura de referencia para el controlador por adelanto
calculada por el regulador del sistema en bucle cerrado (predictivo, etc.) y
tfff es la temperatura de referencia al control por adelanto ltrada, que es la
que se da como entrada al identicador.
2. La traza de la matriz de covarianza del identicador es chequeada en cada
instante, acotandola de la forma,
Traza de P (k) < Po =) P (k) = P (k) + R
3. La variable de control esta saturada en mas o menos un 20% del valor de
ujo calculado en bucle abierto (feedforward). Ademas se utiliza un control PI
cauteloso al comienzo del control, modicando la expresion 7.6 por:
1
qo = (2 b + traza
(P (k)) b)
4. Como se ha comentado el mecanismo de estimacion de parametros solo funciona cuando la se~nal de entrada contiene suciente informacion dinamica.
Estas consideraciones pueden tenerse en cuenta chequeando el cumplimiento
de las siguientes condiciones:
j 4u j A
kX
=0
k= N
j 4u(k) j B
Si una de estas condiciones es verdadera, se activa el identicador. En otro
caso se usa el ultimo conjunto de parametros identicados. Los valores tpicos
de A, B y N escogidos en simulacion son: A = 9, 7 B 9 y N = 5.
5. Respecto a los mecanismos de adaptacion, solo funcionan cuando los valores
estimados se encuentran contenidos en los rangos (0:85 a^ 0:95 y 0:9 k^est 1:2, donde k^est es la ganancia estimada de la planta ^b=(1 a^)) para evitar
inestabilidad en casos de no convergencia del estimador. Un controlador jo
se usa en situaciones en que no se cumplen estas condiciones (por ejemplo en
el comienzo de la operacion).
7.6 Estudios de simulacion
Se han realizado estudios de simulacion para evaluar la capacidad del modelo, la
identicacion de los parametros y la actuacion del controlador autoajustable. El
controlador se ha evaluado mediante el modelo no lineal desarrollado.
Aplicacion de control adaptativo
151
950
295
<-- Radiacion
900
grC
290
Radiacion (w/m^2)
850
800
Temperatura (grados C) -->
285
750
700
280
650
600
10
11
12
13
14
15
16
17
277
Tiempo (Horas)
Figura 7.5: Respuesta simulada a cambios de referencia con compensacion serie
La gura 7.5 corresponde a la simulacion de un perodo de 8 horas con radiacion
solar en forma senoidal con una se~nal de ruido sumada para simular peque~nas nubes
dispersas. La temperatura de referencia es una onda cuadrada con cambios entre
280 oC y 285 oC . En este caso el controlador utilizado es un PI adaptativo, como
el que se ha descrito en los apartados anteriores.
Como se ha comentado anteriormente la caracterstica dinamica del campo vara
con el ujo. Como puede verse en la gura 7.5, durante el perodo de test, el nivel de
irradiancia varia entre 600 y 900 watts=m2 . La variacion necesaria en el ujo nominal
para mantener la temperatura de salida en el rango de 280-285, se mostrara similar
a la de la irradiancia I , (un decremento en la irradiancia I , requiere un decremento
en el ujo de aceite para mantener una temperatura de salida ja y viceversa).
El tiempo de retardo se reduce y la velocidad de respuesta de la planta aumenta
con el incremento de ujo de aceite. Por lo tanto, comparando con valores bajos
de la irradiancia I , cuando la irradiancia I es alta, (correspondiendo un ujo alto),
el tiempo de retardo se reducira, as como la constante efectiva del modelo de la
planta. Esto ultimo se corresponde con un valor bajo del polo a. Puede verse como
la variacion en el polo a, en el perodo de test, sigue las variaciones en la irradiancia
I.
152
Resultados en planta
Referente a la funcion de transferencia del modelo de la planta, el valor mnimo
del retardo viene dado cuando b1 = 0, y el maximo retardo cuando b0 = 0. Por lo
tanto, el termino normalizado jb0=(b0 + b1 )j, se incrementara con un valor alto del
nivel de irradiancia, I , (incremento de ujo y decremento del tiempo de retardo).
La respuesta simulada muestra que jb0=(b0 + b1)j sigue la variacion en I , y da una
indicacion de como el modelo se acomoda a las variaciones en el tiempo de retardo.
Las variaciones de los parametros simulados muestra que para el caso de compensacion serie, se ha obtenido la tendencia esperada en los valores. Sin embargo
en el caso de compensacion en paralelo, la variacion en escalones de la temperatura de referencia provoca variaciones en el ujo que no son vistas por el estimador
y da valores erroneos de los parametros estimados. Los valores estimados de a y
jb0 =(b0 + b1 )j, varian sustancialmente, y cada cambio de referencia provoca saltos
considerables en los valores estimados y la tendencia hacia los valores correctos no
se sigue durante el perodo de test. Este efecto puede aliviarse si se introduce un
ltro al controlador en adelanto, para evitar estos cambios rapidos en la se~nal de
adelanto, correspondientes a los cambios de referencia.
7.7 Resultados en planta
Las estructuras de control mencionadas anteriormente han sido probadas en el
campo acurex de la planta solar de Tabernas (Almera), ello ha demostrado que
los controladores pueden operar en presencia de cambios en la dinamica del proceso
causados por cambios en las condiciones de operacion de la planta.
Como se ha mencionado anteriormente, el campo de colectores distribuidos puede
ser utilizado para diferentes propositos, en diferentes modos de operacion y con
condiciones de operacion variables (diferentes muestras de radiacion solar, temperatura de entrada de aceite, temperatura de referencia, etc). Todos estos factores
tienen, de esta forma, que ser tenidos en cuenta para evaluar las capacidades de las
posibles estrategias de control. Aunque los estudios de simulacion mencionados en
la seccion anterior ayudan considerablemente en esta tarea, se han realizado una
serie de tests en la planta real.
Como se ha inferido anteriormente, las caractersticas dinamicas de la planta
varian signicativamente a lo largo del rango de operacion, lo cual hace difcil obtener
un buen control con un regulador PI jo. Esto puede verse en la gura 7.6 donde la
actuacion es buena a nivel bajo de ujo (gura 7.7) de 8 litros/seg aproximadamente,
pero a alto nivel de ujo sobre 11 litros/seg la respuesta es signicativamente mas
Aplicacion de control adaptativo
153
260
Adap.
Fijo
255
Temperatura (grados C)
Adap.
250
Fijo
Fijo
245
Adap.
240
235
230
10
10.5
11
11.5
12
12.5
13
13.5
14
Tiempo (Horas)
Figura 7.6: Respuesta con regulador P.I. jo. Temperatura de salida
950
13.6
l/s
Radiacion (w/m^2)
<-- Radiacion
900
12.3
850
11
800
9.6
750
8.3
flujo (l/s) -->
700
10
10.5
11
11.5
12
12.5
13
13.5
14
7.0
Tiempo (Horas)
Figura 7.7: Respuesta con regulador P.I. jo. Irradianza y ujo.
154
Resultados en planta
oscilante y tiene mayor tiempo de establecimiento.
Las guras 7.8, 7.9 y 7.10 muestran resultados de la planta utilizando el controlador PI autoajustable con incorporacion del controlador en adelanto en serie. Los
resultados son signicativos ya que se muestra la actuacion durante unas 3 horas de
operacion cuando el nivel de irradiancia esta cambiando sustancialmente, debido a
la presencia de nubes dispersas.
Las perturbaciones injectadas son en la forma de cambios en escalones en la
temperatura de referencia. Esto genera informacion dinamica para la estimacion, as
mismo el resultado en la respuesta de la temperatura de salida sirve para demostrar
la calidad de la actuacion del sistema de control.
310
800
grC
<-- Radiacion
Radiacion (w/m^2)
700
295
280
600
500
400
300
...
..
... ................
...
.. ..
..
... ..
........
... ....... ....... .....................
.. .. ..
..
-- PI fijo
..
..
.. . ......................
.. Adaptativo
.
.
.
........ ........
....
.. . ......... ....
.
..
....
Temperatura (grados C) -->
..
.. .
....
. ... ......... ..............................
.
........
.
. .
.
.
.
...
.
..
.. .
.. .. ..... ..........
.....
...
.......
200
11.5
12
12.5
13
13.5
14
265
250
235
220
14.5
Tiempo (Horas)
Figura 7.8: Salida con control PI adaptativo
El perodo desde las 11:39 a las 12:46 corresponde a la fase de puesta en marcha
de la planta, cuando el aceite esta recirculando, y el controlador esta en perodo de
autoajuste. Despues de este perodo, se obtiene un buen seguimiento a la respuesta
en escalon, permaneciendo la temperatura de referencia muy proxima a la se~nal
de referencia, a pesar de los cambios signicativos en el nivel de irradiancia de
esta experiencia. Esto ultimo demuestra los efectos beneciosos del controlador por
adelanto en serie, el cual no solo sirve para reducir las variaciones no esperadas en
la temperatura de salida sino que tambien reduce las desviaciones erroneas en los
Aplicacion de control adaptativo
155
1.2
0.94
1.0
0.92
Polo a
<-- a
0.9
0.8
0.88
0.6
|b0/(b0+b1)| -->
0.86
0.4
0.84
0.2
0.82
11.5
12
12.5
13
13.5
14
0.0
14.5
Tiempo (Horas)
Figura 7.9: Evolucion de los parametros
b0
0.05
0
-0.05
11.5
12
12.5
13
13.5
14
14.5
13.5
14
14.5
Tiempo (Horas)
0.1
b1
0.08
0.06
0.04
0.02
0
11.5
12
12.5
13
Tiempo (Horas)
Figura 7.10: Evolucion de los parametros
156
Resultados en planta
parametros estimados.
Esto puede verse en la respuesta de los parametros estimados de la gura 7.9
en la que el parametro estimado (a), muestra cambios suaves durante el perodo
del experimento. Este sigue las variaciones experadas necesarias para igualar los
cambios en la respuesta caracterstica del sistema. Los niveles de irradiancia y la
temperatura de salida requerida determinan el ujo de aceite necesario, el cual a su
vez determina la velocidad de la respuesta del sistema y el tiempo de retardo.
Mediante los tests de control realizados en la planta, es difcil demostrar las
ventajas relativas de un controlador con respecto a otro. Dado que las condiciones
exactas de nivel de irradiancia y de temperatura de entrada nunca pueden ser reproducidas. Sin embargo, en orden a dar una indicacion de la mejora producida por
el esquema de control PI adaptativo autoajustable sobre un controlador jo tipo
PI, las condiciones de irradiancia para el test correspondiente a la gura 7.7 (para
un controlador jo PI), son aplicadas en un estudio de simulacion al controlador
autoajustable. La respuesta de la temperatura de salida para el caso adaptativo se
superpone como se muestra en la gura 7.6.
Puede verse que el regulador de parametros jo PI trabaja bien para las condiciones correspondientes al primer escalon, pero para los otros escalones, donde el
nivel de irradiacion es mayor, el comportamiento se deteriora. El controlador autoajustable por otro lado, una vez que los parametros se han ajustado, proporciona un
comportamiento mejor el cual se mantiene a pesar de los cambios en las condiciones
de operacion.
Tambien, para las condiciones del experimento de la gura 7.8, las condiciones
de irradiancia se han aplicado al modelo de simulacion incorporando el controlador
de parametros jos PI. Otra vez puede verse que el controlador jo PI, el cual
esta ajustado para las condiciones de ujo medio, tiende a oscilar cuando el nivel
de ujo es bajo, caso que se produce al nal del test cuando la temperatura de
referencia es alta (270 oC ) coincidiendo con nivel bajo de irradiancia (alrededor de
600 watts=m2 ). El esquema de control adaptativo autoajustable funciona mucho
mejor que el controlador jo, ante los cambios en la caracterstica dinamica de la
planta, que corresponden a un da de operacion con variaciones grandes del nivel de
irradiancia.
La gura 7.11 muestra la temperatura de salida del aceite y la referencia cuando
se aplica el GPC adaptativo. El valor de escogido fue 5, y, como se aprecia se
obtiene una respuesta muy rapida ante cambios en la referencia (tiempo de subida
del orden de 7 minutos). Para tener menor sobreoscilacion el factor de ponderacion
Aplicacion de control adaptativo
157
set point/outlet temperatures ( C)
190.0
180.0
170.0
160.0
11.0
11.5
12.0
12.5
13.0
local time (hours)
13.5
14.0
14.5
Figura 7.11: GPC Adaptativo: Temperatura de salida del aceite
730.0
Radiacion solar (W/m2 )
710.0
690.0
670.0
650.0
630.0
11.0
11.5
12.0
12.5
13.0
tiempo local (horas)
13.5
14.0
14.5
11.5
12.0
12.5
13.0
tiempo local (horas)
13.5
14.0
14.5
7.0
flujo de aceite (l/s)
6.5
6.0
5.5
5.0
4.5
11.0
Figura 7.12: GPC Adaptativo: Radiacion solar y caudal de aceite
158
Resultados en planta
debe aumentarse. La evolucion de la radiacion en este test se puede comprobar en la
gura 7.12. Corresponde a un da con peque~nas nubes. El caudal de aceite, cambio
desde 4.5 l/s a 7 l/s, y el controlador pudo mantener un buen comportamiento ante
cambios en la dinamica del proceso.
Debido al hecho de que las condiciones de un ensayo no se pueden reproducir
de forma exacta, para comparar el comportamiento de los esquemas de control
propuestos, se utilizaron los datos de un da de operacion con un controlador PI jo
para simular el comportamiento de todos los esquemas de control comentados.
La gura 7.13 muestra los resultados obtenidos aplicando el controlador PI jo
a la planta y los resultados obtenidos aplicando los dos controladores adaptativos
PID y el GPC. El PI jo funciona bien para las condiciones en las que fue dise~nado,
pero no muy bien fuera de ellas.
referencia/temperatura de salida (C)
260.0
temperatura de referencia
controllador PI fijo
controlador PID Z-N adaptativo
controlador Z-N PID adaptativo completo
controlador GPC adaptativo
255.0
250.0
245.0
240.0
10.2
10.7
11.2
11.7
12.2
12.7
tiempo local (horas)
13.2
13.7
Figura 7.13: PI jo, PID adaptativo y GPC adaptativo
14.2
Captulo 8
El problema del control robusto
8.1 Introduccion
Las caractersticas del dise~no de un sistema de control van a depender en gran medida, de la delidad con la que el modelo empleado describa el comportamiento del
sistema. Uno de los principios del modelado de sistemas es el de simplicacion;
consistente en que de la forma mas simple posible el modelo capte los rasgos fundamentales bajo analisis del proceso.
Un proceso real puede ser extremadamente complejo para ser descrito de forma
absolutamente precisa por un modelo matematico, en cuyo caso se habla de errores
de modelado. Si se a~nade el hecho de que se trata de describir al sistema con
un modelo lineal e invariante en el tiempo, ello implica otro conjunto de hipotesis
simplicadoras que incrementan los errores de modelado originales o residuales.
Se puede considerar por tanto, que cualquier modelo matematico de un proceso
real va a ser en mayor o menor grado impreciso, o dicho de otra forma va a contar
con incertidumbres o errores de modelado.
Si se desea controlar de manera eciente un proceso real, se debera de tener
informacion sobre las posibles fuentes de incertidumbres, evaluando su efecto sobre
el comportamiento del sistema completo.
La necesidad de cumplir unas especicaciones de dise~no cada vez mas exigentes,
ha llevado a tener en consideracion aspectos de importancia practica en el desarrollo
159
160
Introduccion
de los sistemas de control. De forma que el comportamiento del sistema se mantenga
aceptable en un ambiente realista, en el que las incertidumbres van a estar siempre
presentes.
Entre los principales factores causantes de los errores de modelado pueden destacarse:
1. Modicaciones en el punto de trabajo de la planta o con respecto al modelo
nominal.
2. Dinamica no lineal no considerada.
3. Dinamica de alta frecuencia no modelada.
4. Retardos de tiempo no contemplados.
5. Imprecisiones en los parametros, debidas al metodo de identicacion y/o modelado empleado.
Estos factores se pueden agrupar en dos grandes grupos: las incertidumbres
parametricas (1) y (5) y las estructurales (2), (3) y (4). Con respecto al conocimiento disponible sobre las causas de las incertidumbres puede distinguirse entre
incertidumbre estructurada y no estructurada.
En el caso de incertidumbre no estructurada solo se conoce que existen discrepancias entre el modelo y la planta real, y posiblemente puede conocerse tambien el
tama~no de las desviaciones de determinadas medidas entrada/salida (por ejemplo, la
discrepancia en la respuesta frecuencial causada por la dinamica de alta frecuencia
no modelada y/o diferencia en la respuesta temporal debido a la no consideracion
de un elemento no lineal).
Si se conoce de la incertidumbre que en cierta medida se debe a algunos elementos
diferenciados de la planta, en la forma de tolerancias de sus valores (por ejemplo,
la incertidumbre en el valor de un polo y/o un cero), en ese caso se trata de una
incertidumbre estructurada.
Es posible tambien, que se tenga un conocimiento parcial y separado de las
fuentes de incertidumbre, en cuyo caso tambien podra hablarse de incertidumbre
parcialmente estructurada (por ejemplo, el hecho practico de que las incertidumbres
existentes en distintos actuadores sean independientes entre s).
A la hora de plantearse el dise~no de un sistema de control robusto para un proceso
con incertidumbres, surgen una serie de cuestiones escalonadas:
El problema del control robusto
161
1. Como modelar tales procesos.
2. Como analizar el sistema de control.
3. Como dise~nar el controlador.
Para resolver los 3 puntos anteriores, se hace necesario la introduccion de nuevos
conceptos y herramientas de calculo para el analisis y dise~no de sistemas de control.
El campo de aplicacion de esta nueva disciplina denominada control robusto, abarca
todos aquellos problemas que se caractericen por considerar incertidumbres en el
modelo que sean tolerables por un controlador jo lineal e invariante en el tiempo;
limitando con aquellos que necesitan un controlador variable (control adaptativo,
control por planicacion de la ganancia).
Los objetivos de control tratan en cualquier caso, de que el controlador dise~nado
funcione bien cuando se implante en el proceso real. Este objetivo, a su vez puede
considerarse compuesto en una serie de subobjetivos. De estos, el principal es que
el sistema sea estable en lazo cerrado, para unas condiciones de trabajo dadas o
nominales. Es lo que se denomina Estabilidad Nominal (NS).
Por otro lado, una vez conseguida la estabilidad es necesario que ciertas variables
del sistema presenten un comportamiento adecuado y en algunos casos optimo respecto a una funcion de costes o ndice de comportamiento. Esto se tiene en cuenta
referenciandolo como Comportamiento Nominal (NP).
Es tambien muy importante, de cara a la aplicacion industrial, que se tenga en
cuenta en el dise~no el conocimiento que se posea de la incertidumbre en el modelo.
Otro requerimiento que se va pedir a un sistema de control es que sea estable en lazo
cerrado, para el conjunto de posibles plantas que se puedan dar como consecuencia
de la incertidumbre en el modelo de la planta. El objetivo perseguido se denomina
Estabilidad Robusta (RS).
Si ademas se considera que para todas las plantas posibles no basta con que
el sistema de control permanezca estable sino que han de cumplirse unas especicaciones de funcionamiento, se considerara que se esta aludiendo al concepto de
Comportamiento Robusto (RP).
En la gura 8.1 queda resumido el problema de dise~no y los diferentes niveles de
exigencia que se establecen sobre un sistema de control, tal y como se ha descrito
anteriormente.
El control de sistemas con incertidumbres entra dentro del campo de estudio de la
162
Introduccion
PROCESO
REAL
-
Complejo
?
Simplicaciones
?
?
Modelo
matematico
Incertidumbres
-
?
Sistema
de Control
?
Comportamiento
?
Robusto
Estabilidad
(RP)
?
Comportamiento Robusta
(RS)
?
Estabilidad Nominal
(NP)
Nominal
(NS)
Figura 8.1: Planteamiento del problema de control
El problema del control robusto
163
disciplina conocida como Control Robusto. La decada de los ochenta se considera el
perodo de desarrollo de dicha teora, pudiendose destacar entre otros los desarrollos
teoricos realizados durante este perodo: 1) Metodos H1 (Zames y Francis, 1983;
Doyle et al, 1989); 2) metodos LTR (Loop Transfer Recovery) (Doyle y Stein, 1981,
Stein y Athans, 1987); 3) metodo de dise~no IMC (Internal Model Control) (Morari
et al, 1989); 4) metodos de Kharatinov (Barmish, 1993); 5) metodo de Sntesis-
(Balas et al, 1991); 6) metodo GPC (Generalized Predictive Control) (Clarke et al,
1989); 7) metodo QFT (Quantitative Feedback Theory) (Horowitz, 1982).
Las principales aplicaciones de la teora de control robusto realizadas en los
ultimos a~nos se han llevado a cabo en las areas de control de procesos qumicos,
robotica, estructuras exibles y control de aeronaves (Dorato, 1993). Como consecuencia de los buenos resultados obtenidos, y del interes despertado en la comunidad cientca y tecnica por la nueva disciplina, han surgido diferentes paquetes de
CACSD (Dise~no de Sistemas de Control Asistido por Computador) para el dise~no
de sistemas de control robusto, como ejemplos signicativos se pueden citar: Program CC (Thompson, 1988), Robust-Control Toolbox (Chiang y Safonov, 1992)
y -Analysis and Synthesis Toolbox (Balas et al, 1991) ambos para Matlab. Este
captulo se centra en los metodos H2 , LTR y H1, habiendose empleado para el dise~no
y analisis de los controladores, los dos paquetes de CASCD citados anteriormente
en primer lugar.
8.2 Relaciones fundamentales
La calidad de un dise~no va a depender en gran manera, del grado de aproximacion
con el que se recojan, de forma matematica, los deseos de como se quiere que funcione
el sistema bajo ciertas condiciones. Y por tanto, del conocimiento que se tenga de
la planta, as como de lo que se le exija al sistema de control. Esto ultimo, quedara
reejado como las especicaciones de dise~no a cumplir por el controlador.
Relaciones fundamentales de control
Un sistema de control generico puede verse representado en la gura 8.2, donde:
G representa la planta, K el controlador, di; do las perturbaciones que afectan al
proceso, r la referencia o consigna, y la respuesta del sistema y n el ruido ligado a
las medidas de los sensores.
164
Relaciones fundamentales
r- h e
- 6
K
di
u- ?
h
G
d
o
?
- h r y-
?hn
Figura 8.2: Sistema de control y se~nales signicativas
Para caracterizar el comportamiento de un sistema de control resulta util denir
una serie de operadores, o matrices (funciones en el caso escalar) de transferencia:
Lazo Abierto o Razon de Retorno:
Li = KG
;
Lo = GK
Fi = I + Li
;
Fo = I + Lo
1
;
So = Fo 1
Ti = I Si
;
To = I So
Diferencia de Retorno:
Sensibilidad:
Si = Fi
Sensibilidad Complementaria:
Sensibilidad del Control:
N = KSo
donde los subndices fi; og hacen referencia a que el operador se dena a la entrada
o a la salida de la planta respectivamente.
Del diagrama de bloques de la gura 8.2, pueden obtenerse las siguientes funciones (matrices en el caso de sistemas multivariables) de transferencia que van a
determinar las propiedades mas relevantes a tener en cuenta para el dise~no de un
sistema de control:
El problema del control robusto
165
1. Estabilidad interna: El sistema es internamente estable si son estables (ver
apendice B.1) cada uno de los elementos de la matriz R, que relaciona los
vectores r; di con y; u, siendo:
" #
" #
y =R r
u
di
donde:
"
1
1G #
GK
(
I
+
GK
)
(
I
+
GK
)
R = K (I + GK ) 1 K (I + GK ) 1G
2. Comportamiento entrada-salida:
y = To(r n) + Sodo + So Gdi
(8:1)
e = r y
= So (r do n) SoGdi
(8.2)
3. Sensibilidad del sistema a peque~nos cambios en los parametros de la planta:
Si la funcion (matriz) de transferencia en lazo abierto L0o (s) sufre una desviacion
con respecto a la nominal Lo(s) debido a peque~nas variaciones en los parametros de la planta y/o del regulador, la correspondiente desviacion de la funcion
(matriz) de sensibilidad complementaria To(s) viene dada por (MacFarlane,
1970):
To 1(s)To(s) = So(s)Lo 1(s)Lo (s)
(8:3)
que es la generalizacion matricial de la relacion escalar de Bode (Kwakernaak,
1972):
d ln T = dT=T = S
d ln L dL=L
4. Demanda de control:
u = KSo (r n do) + Sidi
(8:4)
El conjunto de ecuaciones 8.1-8.4 resumen los benecios fundamentales y objetivos de dise~no inherentes a los sistemas de control realimentados. De ellas se
desprende la existencia de una serie de objetivos contrapuestos:
1. De 8.2, se deriva que los errores de seguimiento del sistema e en presencia de
cambios de consigna r y el efecto de perturbaciones do actuando a la salida de la
planta pueden hacerse "peque~nos", procurando que el operador de sensibilidad
So sea\peque~no" tambien (o equivalentemente Lo lo bastante grande). Para
atenuar convenientemente las perturbaciones que actuen a la entrada de la
planta di sera necesario que el producto SoG se mantenga lo menor posible.
166
Relaciones fundamentales
2. De la ecuacion 8.3, se deriva la conveniencia de mantener So (s) lo menor
posible, ( Lo (s) lo mayor posible), a n de que el efecto de peque~nas variaciones
de parametros en la planta no afecten de manera sensible al comportamiento
del sistema en lazo cerrado.
3. Sin embargo, el aumentar excesivamente la ganancia en lazo abierto (Lo) o
equivalentemente disminuir So, hace que dada la relacion existente entre So y
To se provoque un aumento de la magnitud de To , produciendo dos consecuencias negativas:
(a) Una posible amplicacion del ruido de medida n y su transmision a la
salida del sistema.
(b) Una mayor sensibilidad del sistema a los efectos de la dinamica no modelada de alta frecuencia.
4. El esfuerzo de control u requerido para rechazar las perturbaciones actuantes
sobre el sistema y conseguir una buena regulacion depende de las magnitudes
de Si; So; K . Por tanto si se pretende que u no sea excesivo sera necesario mantener So, y Si lo sucientemente bajas. Pero dado que a su vez estas dependen
inversamente de K , disminuir las primeras supone aumentar la ultima.
Se presentan pues objetivos contradictorios, debiendose llegar en cada problema
de dise~no a una solucion de compromiso. Habitualmente la dinamica inmodelada de
alta frecuencia es la que da lugar a los mayores niveles de incertidumbre. Teniendo
en cuenta que el ruido de medida suele ser tambien de alta frecuencia, y que las
caractersticas de los sistemas dinamicos pueden muy bien asemejarse a ltros pasa
bajo, una forma de resolver el problema planteado con los objetivos contrapuestos
anteriores, es procurando que cada uno se cumpla en un rango de frecuencias de
interes.
Se pueden establecer tres zonas de frecuencias, de forma que dentro de cada una
se trata de conseguir unos objetivos primordiales (ver gura 8.3):
Zona de baja frecuencia: En la que se requiere alta ganancia para conseguir:
{ Buen seguimiento de la referencia.
{ Adecuado rechazo de perturbaciones.
{ Reduccion de la sensibilidad del sistema a peque~nos cambios en los parametros de la planta.
El problema del control robusto
kLk
(db)
0
QQ
167
ZONA FRECUENCIA DE CRUCE
- Estabilidad
- Velocidad de respuesta
QQ
Q
QQ
QQ
ZONA DE BAJA FRECUENCIA
- Seguimiento de consigna
- Rechazo de perturbaciones
- Comportamiento Robusto
- Peque~nos cambios en parmetros
QQ
QQ
QQ
B
ZONA DE ALTA FRECUENCIA
- Rechazo ruido en sensores
- Estabilidad Robusta
B
BB
BB
BB
! (rad/s)
Figura 8.3: Zonas de frecuencias de interes
Zona de frecuencia intermedia: Va a ser determinante de propiedades tales
como:
{ Estabilidad y margenes de estabilidad.
{ Velocidad de respuesta y ancho de banda.
Zona de alta frecuencia: Se va a requerir baja ganancia para:
{ Rechazo del ruido de los sensores.
{ Estabilidad robusta.
Las especicaciones de control pueden darse en el dominio frecuencial. Una
forma de hacerlo es empleando funciones dependientes de la frecuencia, o de ponderacion, para acotar las magnitudes de los operadores de sensibilidad y sensibilidad
complementaria. Para el caso de un sistema escalar pueden venir dados de la forma:
j S (j!) j wS (!) y j T (j!) j wT (!) 8 !
Se pueden obtener las siguientes aproximaciones:
(
)
j
S
j
1
j L j 1 () j T j 1
168
Relaciones fundamentales
(
)
j 1
j L j 1 () jj TS j
1
Para el rango de frecuencias donde j L j 1, las propiedades del sistema en lazo
cerrado dependen crticamente del valor de la fase del lazo abierto; as se tendra
que:
jLj1
j S j 1
arg L(j!) 180
()
j T j 1
Reglas practicas para el dise~no
Las aproximaciones anteriores llevan a una serie de reglas utiles a la hora de realizar
la sntesis de un sistema de control:
Alta ganancia en lazo abierto lleva a baja sensibilidad y buenas propiedades
de rechazo de perturbaciones y seguimiento de la referencia (np).
Peque~na ganancia en lazo abierto es adecuada para que la respuesta debida al
ruido en sensores sea considerablemente baja, y para mantener la estabilidad
del sistema frente a incertidumbres en la planta (rs).
A frecuencias cercanas a la frecuencia de cruce de ganancia, la fase del sistema
debe permanecer acotada lo sucientemente alejada de 180, para proporcionar unos adecuados margenes de estabilidad y para prevenir la amplicacion
de perturbaciones y ruidos.
El conjunto de reglas anteriores constituyen la base del dise~no clasico en el dominio frecuencial (Freudenberg et al, 1988, Maciejowski, 1989), consistente en que
a partir del ajuste de la ganancia en lazo abierto se consiguen unas especicaciones
de dise~no dadas en lazo abierto y/o cerrado. Otras tecnicas realizan tambien el
proceso de ajuste en frecuencia, pero empleando directamente las funciones (matrices) de transferencia en lazo cerrado. En el captulo 9 se presentan algunas tecnicas
de ajuste de las ganancias en lazo abierto (ltr), mientras que en el captulo 10 se
describen algunos metodos para el ajuste de las ganancias en lazo cerrado (H2; H1)1 .
La tecnica de ajustar las formas de las respuestas en frecuencia de ciertas funciones (matrices)
de transferencia se conoce en general como Loop Shaping, en terminologa inglesa.
1
El problema del control robusto
169
Extension de conceptos a sistemas multivariables
El concepto de ganancia de un sistema puede extenderse a sistemas multivariables
haciendo uso de las relaciones entre las normas (ver apendice B.2) de las se~nales
vectoriales de salida y entrada al sistema.
En general, si k x k representa a cualquier norma de un vector x, se dene la
norma inducida de la matriz G por:
k
k G k= supx6=0 kkGx
xk
y en particular si se elige la norma Eucldea (de un vector complejo x):
p
k x k= xH x
(donde xH representa el vector traspuesto conjudado de x), la norma inducida de la
matriz es la norma espectral o de Hilbert:
k G ks= donde 2 es el autovalor maximo de la matriz GH G o de su traspuesta GGH , donde
GH es la matriz traspuesta conjugada de G (ver apendice B.3).
Si se tiene una matriz de transferencia G(s), con s = j!, y (0 ! 1), entonces
su norma espectral va ser una funcion de !. Por tanto la norma k G(s)u(s) k va a
depender de la direccion del vector u(s) y de la frecuencia !. Para cada valor de
frecuencia es posible hallar unas cotas de la magnitud:
k G(s)u(s) k
k u(s) k
que reemplazan el concepto de ganancia simple por el de rango de ganancias, estando
este acotado (superior e inferiormente). Estas cotas son las denominadas ganancias
principales extremas: [G(j!)], [G(j!)], que pueden calcularse a partir de los
valores singulares maximo () y mnimo () de la matriz de transferencia G(j!)
(ver apendice B.3) para cada frecuencia !.
Para el caso de un sistema multivariable, las especicaciones de dise~no pueden
darse empleando las ganancias principales extremas:
[S (j!)] wS (!)
170
Relaciones fundamentales
[T (j!)] wT (!)
donde igual que para el caso escalar, las funciones de ponderacion (wS (!); wT (!))
se eligen de forma que se tengan en cuenta los objetivos a cumplir en cada intervalo
de frecuencias de interes:
1. Baja frecuencia:
2. Frecuencia intermedia:
(S ) 1
i (T ) 1
j i(j!) j i(j!)
con mg,mf satisfactorios (ver apendice B.4).
3. Alta frecuencia:
(T ) 1
Teniendo en cuenta que para cualquier matriz arbitraria Q y su matriz unitaria I
se cumple:
maxf0; (Q)g (Q + I ) (Q) + 1
maxf0; (Q)g (Q + I ) (Q) + 1
se pueden transformar las especicaciones anteriores, empleando las ganancias principales extremas en lazo abierto:
1. A baja frecuencia:
2. A alta frecuencia:
(L) (1S ) si (L) 1
(L) (T ) si (L) 1
Las aproximaciones anteriores proporcionan una forma de transformar las especicaciones sobre (T ) y (S ), en expresiones de la matriz de transferencia en lazo
abierto (ver gura 8.4):
1=[L(j!)] wS (!)
[L(j!)] wT (!)
El problema del control robusto
171
dB
(L)
0
NP
RS
T
S-1
(L)
Figura 8.4: Correspondencia especicaciones lazo cerrado-lazo abierto
8.3 Descripcion de las incertidumbres
Un diagrama de bloques general de un sistema de control de una planta con incertidumbres queda representado en la gura 8.5, donde E representa los errores de
modelado existentes en la planta.
De las posibles formas de representar el conocimiento impreciso que se tiene en el
caso de un proceso escalar (incertidumbre tipo aditivo, multiplicativo etc.), cuando
se trata de un sistema multivariable hay que considerar algunos otros casos; pues
habra que tener en cuenta su situacion en el lazo de control. As por ejemplo, la
incertidumbre de tipo multiplicativo podra estar a la entrada o a la salida, o incluso
podran coexitir ambas simultaneamente. En cada caso habra que analizar el sistema
en concreto y tratar de plasmar los errores de modelado de la forma mas conveniente.
Las incertidumbres multiplicativas son las mas frecuentemente empleadas, debido
a que satisfacen las propiedades intuitivas de ser peque~nas a baja frecuencia (donde
el modelo de la planta nominal es generalmente bien conocido), y por otro lado son
elevadas para alta frecuencia (donde el modelo es siempre mas impreciso). Habitualmente el nivel de incertidumbre aumenta con la frecuencia, debido principalmente a
172
Descripcion de las incertidumbres
E
di
r
e
-
- 6
K
?
-
u
6
do
?
G
? -
y
?
n
Figura 8.5: Sistema de control con incertidumbres en la planta
la dinamica no modelada de alta frecuencia (sensores, actuadores, modelos de orden
reducido de la planta). Si bien, hay diversas formas de caracterizar la incertidumbre
que exista en un sistema de control, como se pasa a describir a continuacion.
La planta actual o real, G0 , puede expresarse de forma generica como:
G0 = G + G
(8:5)
donde G es el modelo nominal de la planta, y G representa la incertidumbre o
errores de modelado presentes en el sistema.
El tratamiento que se hace es considerar que el conjunto de incertidumbres que
afectan al sistema puede ser representado por una incertidumbre equivalente, que se
maniesta de alguna forma especca en un lugar localizado. En ocasiones ello no
es posible, en cuyo caso se habla de incertidumbres simultaneas (dos o mas).
Los modelos de incertidumbres mas empleados son: aditiva (iA), multiplicativa
a la entrada/salida (iMi y iMo) de la planta, de realimentacion a la planta (iRp),
como bucle realimentado a la entrada/salida de la planta (iRi, iRo), (ver gura 8.3).
A continuacion se dan las expresiones correspondientes a cada una de ellas:
1. iA:
G0 = G + E
G = E
El problema del control robusto
-E
r- e K
6
173
- ?e - G -y
r- e K - G
6
iMi
r- e K - e
6
6
6
- e?-y
iMo
E
-G
y -
r- e
6
K-e G
iRi
r- e K
-E
6
E
y -
iRp
G -e
6
E
y -
r- e K
6
iRo
iA
Figura 8.6: Algunos tipos de incertidumbres
-E
- G - ?e y-
174
2. iMi:
3. iMo:
4. iRp:
5. iRi:
6. iRo:
Descripcion de las incertidumbres
G0 = G(I + E )
G = GE
G0 = (I + E )G
G = EG
G0 = (I + GE ) 1G
G = [(I + GE ) 1 I ]G
G0 = G(I + E ) 1
G = G[(I + E ) 1 I ]
G0 = (I + E ) 1G
G = [(I + E ) 1 I ]G
En general, a la hora de la descripcion analtica de las incertidumbres en la planta
estas pueden englobarse en dos grandes grupos: estructuradas y no estructuradas.
Incertidumbres no estructuradas
Para este tipo de incertidumbre, lo que se conoce de E (s) puede consistir en una
cota de su magnitud, generalmente dependiente de la frecuencia:
[E (j!)] (!) 8 !
(8:6)
Resulta interesante de cara a posteriores analisis el factorizar E (s) en la forma:
E (s) = e(s)(s) ; [(s)] 1 8!
(8:7)
Todas estas descripciones albergan la posibilidad de acoplamiento entre distintas
fuentes de incertidumbres (por ejemplo, entre diferentes actuadores), considerando
el caso mas desfavorable (E (s) es una matriz con elementos no nulos fuera de la
diagonal principal). Pudiendo ocurrir, que se contemplen ciertas posibilidades que
El problema del control robusto
175
en la practica nunca se produzcan. Si eso ocurriera, el dise~no realizado se caracterizara por ser excesivamente conservador.
Incertidumbre estructurada
Si de alguna manera se localizan las fuentes de las incertidumbres del sistema,
se tendra una descripcion mas ajustada o estructurada de los errores de modelado.
Esta puede estar constituida a su vez por multiples incertidumbres localizadas e independientes no estructuradas (Ei(s)). Las cuales pueden corresponder a dinamicas
no modeladas de los actuadores, de los sensores, o de la propia planta. As, para
cada uno de los bloques independientes Ei(s) se realiza la factorizacion:
Ei (s) = ei(s)i (s) ; [i (s)] 1 8!
(8:8)
La incertidumbre completa E (s) del sistema queda de la forma:
E (s) = diag fEi (s)g i = 1; : : : ; p
siendo p el numero de bloques.
Los errores de modelado tambien podran consistir en imprecisiones en algunos
parametros del proceso, suponiendo en este caso una incertidumbre totalmente estructurada o parametrica. Este ultimo caso se dara por ejemplo, si existe una
incertidumbre acotada en uno o varios polos y/o ceros de la planta, as como en la
cuanticacion de los elementos de retardo.
Ejemplo: Incertidumbres aditiva y multiplicativa
Considerese un proceso en el que la dinamica de alta frecuencia no se ha considerado en el modelo nominal G, de forma que el modelo completo o real de la planta
viene dado por
s2 + 2:4s + 144)
G0(s) = G(s)Es(s); con: Es(s) = 100(
144(s2 + s + 100)
donde Es es la incertidumbre en el modelo nominal. Esta se puede interpretar a su
vez como una incertidumbre de tipo multiplicativo, aditivo, u otros. En el primer
caso se tendra:
G0 = G(1 + Em ); con Em = Es 1
176
Estabilidad robusta
10
Incertidumbre multiplicativa (dB)
0
-10
-20
-30
-40
-50
-60
-70
10 -1
10 0
10 1
10 2
rad/s
Figura 8.7: Magnitud de la incertidumbre multiplicativa
y para el caso de incertidumbre aditiva:
G = G + Ea; con Ea = G(Es 1)
En las guras 8.7 y 8.8 se muestran respectivamente las respuestas en frecuencia
(magnitudes) para cada tipo de incertidumbre. Puede verse como la incertidumbre
multiplicativa es peque~na a baja frecuencia, donde el modelo es bien conocido, y se
incrementa a medida que aumenta la frecuencia.
8.4 Estabilidad robusta
Si el sistema de control dise~nado con el modelo nominal es estable, interesa saber si
el sistema mantendra la estabilidad para cada uno de los elementos G0 del conjunto
G de plantas posibles:
G = fG0g
Para el analisis del problema anterior, es util obtener una representacion del
sistema como la de la gura 8.9.
El problema del control robusto
177
-10
Incertidumbre aditiva (dB)
-20
-30
-40
-50
-60
-70
-80
10 -1
10 0
10 1
rad/s
Figura 8.8: Magnitud de la incertidumbre aditiva
-
a
E
M
b
Figura 8.9: Sistema de interconexion
10 2
178
Estabilidad robusta
Teorema de la Peque~na Ganancia
Este teorema ha jugado un importante papel en el desarrollo de la teora del control robusto (Dorato et al, 1987), y establece una condicion suciente que garantiza
la robustez de la estabilidad de un sistema (Lunze, 1989):
Teorema: Dado el sistema representado en la gura 8.9, donde M y E repre-
sentan sistemas cuadrados (mismo numero de entradas que de salidas) y estables,
entonces el sistema en lazo cerrado sera estable si:
k EM k< 1
siendo k : k cualquier norma matricial compatible con el sistema (ver apendice B.2).
Tanto M como E pueden ser sistemas no lineales y/o invariables en el tiempo.
Sin embargo, el teorema establece solo una condicion suciente para la estabilidad
del sistema en lazo cerrado.
Particularizando para el caso de sistemas lineales e invariantes en el tiempo (lti),
el sistema de la gura 8.9 sera estable si se cumple:
[E (j!)M (j!)] < 1 8!
La idea de aplicar este teorema, para analizar la robustez de un sistema de
control con incertidumbres, se basa en el empleo de M (s) como el sistema visto por
la incertidumbre E (s). Al sistema M (s) se le denomina Sistema de Interconexion,
debido al hecho de que conecta la entrada "a" y la salida "b" de la incertidumbre
E (s).
En el caso de tratarse de sistemas lti, las se~nales externas, tales como perturbaciones y se~nales de referencia, no van a afectar a la estabilidad del sistema y de
cara al analisis de robustez solo interesa la forma de como es visto el sistema por la
incertidumbre.
Para llegar a la representacion anterior, se parte de la representacion convencional
de la planta y controlador, junto con los bloques de las incertidumbres que se tengan
localizadas, se realizan las transformaciones equivalentes necesarias de forma que el
resultado sea la separacion de la incertidumbre por un lado E (s) y del resto del
sistema M (s) (sistema de interconexion) por otro.
El problema del control robusto
179
Ejemplo: Analisis de robustez
Considerese un sistema de control con realimentacion unitaria, donde la planta nominal G y el controlador K (regulador 1) estan dados por
G(s) = s12 ; K (s) = 10(ss++51)
El modelo real de la planta (incluida la incertidumbre) viene dado por,
G0(s) = G(s)[1 + Em(s)]
siendo,
+ 0:6667)
Em (s) = s( 0s:30556
2 + s + 100
Para este caso (incertidumbre de tipo multiplicativo) el sistema de interconexion
coincide, salvo en signo, con la funcion de sensibilidad complementaria
M= T
y aplicando el teorema de la peque~na ganancia, la maxima incertidumbre admisible
o tolerable viene dada por:
j E j j M1 j = j T1 j
En la gura 8.10 se muestran tanto la incertidumbre j Em j (lnea a trazos),
as como la tolerancia del sistema de control a incertidumbres multiplicativas (lnea
continua). Como puede verse, el sistema verica la condicion exigida por el teorema
de la peque~na ganancia, y por tanto tendra una estabilidad robusta. En la gura 8.11
pueden verse las respuestas obtenidas para la planta nominal y la real, observandose
el efecto de la incertidumbre.
Si se modica el controlador (regulador 2), de modo que este sea ahora,
K (s) = 32(ss++21)
el test de la estabilidad robusta derivado del teorema de la peque~na ganancia no se
cumple, tal y como puede verse en la gura 8.12. Sin embargo, dicho teorema solo
aporta una condicion suciente, y como se observa a partir de la respuesta temporal
del sistema con la incertidumbre dada en la gura 8.13, el sistema realmente s
180
Estabilidad robusta
60
Incertidumbre y tolerancia (dB)
40
20
0
-20
-40
-60
-80
10 -1
10 0
10 1
10 2
rad/s
Figura 8.10: Tolerancia e incertidumbre multiplicativa con el regulador 1
1.4
1.2
respuestas
1
0.8
0.6
0.4
0.2
0
0
1
2
3
4
5
6
7
8
9
10
tiempo (seg)
Figura 8.11: Respuestas con regulador 1 del sistema nominal y del real
El problema del control robusto
181
60
Incertidumbre y tolerancia (dB)
40
20
0
-20
-40
-60
-80
10 -1
10 0
10 1
10 2
rad/s
Figura 8.12: Tolerancia e incertidumbre multiplicativa con el regulador 2
2.5
respuestas
2
1.5
1
0.5
0
0
1
2
3
4
5
6
7
8
9
10
tiempo (seg)
Figura 8.13: Respuestas con regulador 2 del sistema nominal y del real
182
Estabilidad robusta
verica la condicion de estabilidad robusta, ya que aunque la respuesta temporal
sea poco amortiguada, s es estable.
Si se considera E (s) una incertidumbre no estructurada y el sistema es lineal e
invariante en el tiempo, se tiene el siguiente teorema que da condiciones necesarias
y sucientes para la robustez de la estabilidad (rs) del sistema de control en lazo
cerrado (Freudenberg et al, 1988; Morari et al, 1989)
Teorema: Supuesto el sistema de interconexion M (s) estable, y que la incer-
tidumbre E (s) es de tal clase que el sistema en lazo cerrado es estable si y solo si la
proyeccion del determinante det[I M (s)E (s)] a lo largo del contorno de Nyquist D
no envuelve al origen. Entonces, el sistema en lazo cerrado sera estable para todas
las incertidumbres E (s) tales que: [E (j!)] 1 si y solamente si, se cumple alguna
de las siguientes condiciones equivalentes :
det[I M (j!)E (j!)] 6= 0 8 ! = [E (j!)] 1
, [M (j!)E (j!)] < 1 8 ! = [E (j!)] 1
, [M (j!)] < 1 8!
, kM k1 < 1
En el caso de que la incertidumbre tenga una estructura diagonal de bloques,
denida por el conjunto:
(8:9)
X = fE (s) = diag fEi(s)g = [Ei (s)] g
el analisis de la robustez de la estabilidad (rs) con el resultado del teorema anterior
puede dar un resultado potencialmente conservativo, en el sentido de que suponga
solo una condicion suciente. Se tiene sin embargo, el siguiente teorema de robustez
de la estabilidad (rs) menos conservador, al tener en cuenta la estructura de E (s)
(Morari et al, 1989; Freudenberg et al, 1988):
Teorema: Supuesto el sistema de interconexion M (s) estable, y que la in-
certidumbre E (s) es de tal clase que el sistema en lazo cerrado es estable si y solo
si la la proyeccion del determinante det[I M (s)E (s)] a lo largo del contorno de
Nyquist D no envuelve al origen. Entonces, el sistema sera estable en lazo cerrado
para todas las incertidumbres E (s) 2 X=1 si y solo si:
[M (j!)] < 1 8!
La denicion de (M ) (valor singular estructurado ssv, apendice B.3) supone
una generalizacion del radio espectral (M ) y del maximo valor singular (M ).
El problema del control robusto
183
Analisis de robustez con los valores singulares
Como se ha presentado en apartados anteriores, hay diversas causas que originan la
existencia de incertidumbre en el modelo de la planta. Siendo de interes practico
el que, a la hora de plantear las especicaciones de dise~no, se tenga en cuenta el
conocimiento que se posea sobre la incertidumbre.
El planteamiento de un metodo, para el analisis de robustez de la estabilidad de
un sistema de control, puede establecerse de modo generico como sigue:
1. Supuesta un tipo de incertidumbre en el modelo del proceso, se situa en el
lugar del lazo donde se presuma que actue o pueda quedar reejado su efecto.
2. El conocimiento que se tiene sobre la incertidumbre puede consistir en un cota
superior de la magnitud de la incertidumbre como funcion de la frecuencia (no
estructurada):
[E (j!)] < e(!)
3. Se realizan las transformaciones adecuadas para llegar a la forma estandar de
analisis (gura 8.9), con el sistema de interconexion y la incertidumbre en dos
bloques.
4. Por el teorema de la peque~na ganancia se tiene que una condicion suciente (no
necesaria) para que el sistema sea estable para ciertos niveles de incertidumbres
es que:
(EM ) < 1 8!
o tambien:
(E ) < (1M )
As por ejemplo, para una incertidumbre multiplicativa considerada a la salida
de la planta, el sistema de interconexion es: M = GK (I + GK ) 1 y el test para la
robustez se reduce a:
(E ) < [I + (L) 1 ]
Se demuestra en la practica, que los tests para robustez de la estabilidad bajo
ciertas caractersticas de la incertidumbre dan condiciones excesivamente conservadoras.
184
Estabilidad robusta
Para el caso de un sistema 2 2 el analisis con i (M ) supone implcitamente
que la incertidumbre actuante sobre el sistema sea en el caso mas desfavorable de la
forma:
caso a)
"
#
e11 (s) e12(s)
e21 (s) e22(s)
Mientras que la incertidumbre podra darse de una forma mas estructurada,
donde las incertidumbres en cada canal sean independientes entre s, sin que se
afectaran con terminos de acoplamiento:
caso b)
"
e1 (s) 0
0 e2(s)
#
O incluso que dichas incertidumbres fueran iguales en ambos canales:
caso c)
"
e(s) 0
0 e(s)
#
Tambien, en algunos casos, puede ocurrir que el conocimiento que se tenga de la
incertidumbre consista en posibles intervalos donde se encuentren los parametros con
incertidumbres del modelo del sistema, en cuyo caso se tratara de una incertidumbre
muy estructurada o parametrica:
caso d)
2
66 k..1 .0. : : :
4 . .
0 0 :::
3
0 7
... 7
5
kn
En los sistemas reales puede darse en general una combinacion de los distintos
tipos de incertidumbre, pudiendo ser considerada parte como estructurada y parte
como no estructurada. Segun el conocimiento que se posea del tipo de incertidumbre
al que este sometido el sistema, se empleara unas determinadas herramientas de
calculo para el analisis de la robustez de la estabilidad. As para estimar los niveles
(o tolerancias) de incertidumbre permitidos, para los que el sistema mantiene su
estabilidad, se propone emplear en cada caso:
El problema del control robusto
185
caso a) El valor singular maximo del sistema de interconexion (M ):
1
(M )
caso b) El valor singular estructurado de M :
1
(M )
caso c) El radio espectral de M :
1
(M )
caso d) El valor singular estructurado real de M (Packard y Doyle, 1993):
1
R(M )
Se comprueba, que el conservadurismo decrece de a) hacia d), con lo que el conocimiento (a priori) que se suministre sobre el tipo de incertidumbre existente en
el modelo del sistema va a ser de suma importancia.
Ejemplo: Robustez frente a incertidumbre parametrica
Considerese un sistema de control con realimentacion unitaria, cuya planta G y
su regulador proporcional K estan dados respectivamente por,
G(s) = s2s(s++ba) ; K (s) = k
Los valores de los parametros b; a; k se consideran constantes durante largos
perodos de tiempo, pero por otro lado son desconocidos. Estando caracterizada la
incertidumbre por los intervalos,
3 b 5; 0:5 a 0:5 5 k 15
Que puede a su vez ponerse de una forma conveniente para el calculo del sistema
de interconexion M , as como para que la incertidumbre este normalizada, es decir,
(E ) 1; 8 !
186
Estabilidad robusta
Para ello, se hace:
b = bo + b1 1; j 1 j 1; bo = 4; b1 = 1
a = ao + a1 2; j 2 j 1; ao = 0; a1 = 0:5
k = ko + k1 3; j 3 j 1; ko = 10; k1 = 5
De esta forma, el bloque de incertidumbre E es una matriz diagonal constituida
por numeros reales con valor absoluto inferior o igual a la unidad,
E = diagf1; 2 ; 3g
1.2
sv(M), mu_real(M)
1
sv(M)
0.8
0.6
0.4
mu_real(M)
0.2
0
10 -1
10 0
10 1
10 2
rad/s
Figura 8.14: Analisis de robustez para incertidumbre parametrica
Los valores de bo ; b1 ; ao; a1; ko; k1 se han incluido en M , y dado que (E ) 1, la
condicion suciente para que el sistema tenga una estabilidad robusta es que,
(M ) 1; (caso mas conservador)
o si se tiene en cuenta el caracter parametrico de la incertidumbre, la condicion es
R(M ) 1; (caso de incertidumbre parametrica)
El problema del control robusto
187
En la gura 8.14 se tienen ambos valores; observandose que mientras a partir
del analisis con (M ) no se cumple la condicion suciente de estabilidad robusta,
esta s se verica si se emplea R(M ). En el primer caso se esta considerando una
situacion excesivamente conservadora e irreal, mientras que en el segundo caso se
esta explcitamente considerando que la incertidumbre es de tipo parametrica.
8.5 Comportamiento robusto
Dentro de las especicaciones de dise~no hay que considerar el comportamiento nominal (np) deseado del sistema en lazo cerrado. Este alude a aspectos relacionados con
el rechazo a perturbaciones externas actuantes sobre el sistema, a la reduccion de
los errores de seguimiento, al esfuerzo de control y a un comportamiento adecuado
aun en el caso de peque~nas variaciones en los parametros del modelo nominal de la
planta.
Como se ha visto anteriormente, una forma analtica de expresar los requerimientos anteriores es mediante una relacion frecuencial basada en el modelo nominal de
la planta, de la forma:
[WS (j!)S (j!)] 1
(8:10)
donde WS (j!) es una funcion (matriz) de ponderacion que pone de maniesto los
perles deseados de la funcion de sensibilidad S (j!) en las distintas regiones de
frecuencia. Si el perl deseado es el mismo en todos los canales (especicacion
homogenea) entonces: WS (s) = wS (s)I y queda:
[S (j!)] j w (1j!) j
S
El problema de analisis del comportamiento robusto (rp), consiste en determinar
si el sistema en lazo cerrado satisface las especicaciones de comportamiento para
todas las posibles plantas G0(s) 2 G . Sera determinar si se cumple:
[WS (j!)S 0(j!)] 1
supuesto que se verica 8.10 para la planta nominal G(s).
Dada la representacion del sistema de la gura 8.15, en la que se tienen caracterizadas las incertidumbres por ET (s); y donde se especica un np para el sistema
nominal expresado mediante una relacion entre dos se~nales (vectores) v y w, por
188
Comportamiento robusto
ET w -
M
v-
Figura 8.15: Analisis del comportamiento robusto
medio de: v = ES 1 w. Se tiene el siguiente teorema de robustez del comportamiento
(rp) (Freudenberg et al, 1989; Morari et al, 1989):
Teorema: Dado el sistema M(s) de la gura 8.15, supuesto estable y obtenido
con el modelo nominal de la planta, sujeto a la incertidumbre ET , con (ET ) 1.
El sistema satisface la condicion de comportamiento robusto si y solo si:
(M ) < 1 8!
donde (M ) se calcula con respecto a la incertidumbre estructurada de forma diagonal E = diag fET ; ES g; siendo ES (s) una incertidumbre cticia con [ES (j!)] 1,
la cual esta relacionada con el comportamiento nominal deseado.
En el teorema anterior se realiza la transformacion del problema de rp en uno de
rs equivalente, con un bloque adicional de incertidumbre. Se hace al transformar la
especicacion de np en lazo cerrado (expresada como una relacion entre dos se~nales
w y v), en una incertidumbre cticia representada por ES (ver gura 8.16) (Doyle
1983, Morari et al. 1989, Freudenberg 1989).
Con lo expuesto hasta ahora, los requerimientos para un sistema de control
pueden escalonarse en cuatro niveles de complejidad o exigencia:
1. El primero es el mas elemental e imprescindible: la estabilidad del sistema
nominal (ns).
2. A continuacion esta el conseguir un comportamiento nominal (np) deseado.
3. El tercer objetivo consiste en gozar de una estabilidad robusta (rs).
El problema del control robusto
189
ES ET w -
E
M
v
Figura 8.16: Equivalencia entre comportamiento robusto y estabilidad robusta
4. Y nalmente, que el comportamiento deseado se mantenga aun con la existencia de incertidumbres, lo que supone un comportamiento robusto (rp).
Si se realiza una particion del sistema de interconexion (caso de rs para incertidumbres simultaneas, o rp para un tipo de incertidumbre actuando sobre la
planta):
"
#
M
M
11
12
M (s) = M M
21
22
de forma que M (s) incluye el escalado apropiado para que la incertidumbre este
normalizada: [E (s)] < 1, los objetivos anteriores pueden analizarse a partir de
M (s) empleando en cada caso (Skogestad et al, 1988; Freudenberg, 1989):
ns: M es estable
np: (M22 ) < 1 8 !
rs: Segun sea estructurada o no estructurada la incertidumbre ET :
(M11 ) < 1 o (M11 ) < 1 8 !
rp: (M ) < 1 8 !
190
Robustez de plantas con fuerte ganancia direccional
8.6 Robustez de plantas con fuerte ganancia direccional
A diferencia de los sistemas escalares, un proceso multivariable se caracteriza porque
la ganancia que el sistema maniesta para una determinada perturbacion y/o consigna va a depender de la direccion espacial que esta tenga, dado su caracter vectorial.
Potencialmente puede haber una fuerte discrepancia entre las ganancias de la
planta para dos se~nales actuando en distintos canales o lazos. Una medida de la
direccionalidad de la planta se obtiene del numero de condicion de su matriz de
transferencia G(s), denido como:
(j!)]
[G(j!)] = [[G
G(j!)]
un valor elevado de (G) implica una fuerte dependencia direccional de G.
Las matrices con elevados numeros de condicion estan numericamente mal condicionadas para el calculo de su inversa. Empleando este resultado, se dice que un
sistema esta mal condicionado para ciertas frecuencias si su matriz de transferencia,
a esas frecuencias, tiene un numero de condicion elevado. Si este es proximo a uno,
se dice que el sistema esta bien condicionado. Los valores singulares de las matrices
no son independientes de escalados, por lo que el numero de condicion de una planta
va a depender de las unidades empleadas a la entrada y a la salida de la planta.
Un controlador que compense la direccionalidad acusada de una planta, aplicando se~nales de control elevadas en la direccion donde la ganancia del sistema es
baja, puede dar buenos resultados si el modelo del proceso es muy preciso. Pero si
debido a las incertidumbres, la direccion del vector de control, de elevada magnitud,
generado no coincide exactamente con la direccion de baja ganancia de la planta,
entonces la amplicacion de las se~nales de control pueden ser mucho mayores que
las esperadas con el modelo; resultando un comportamiento nada satisfactorio del
sistema de control.
Los problemas para el control de una planta con incertidumbres y una direccionalidad acusada, se ponen especialmente de maniesto, cuando se analiza la robustez
de la estabilidad frente a incertidumbres simultaneas y/o la robustez del comportamiento del sistema de control. Como se ha visto en el apartado anterior, en
ambos casos la herramienta de analisis es el valor singular estructurado del sistema
de interconexion M (s).
El problema del control robusto
191
Cuando se tienen dos fuentes de incertidumbre separadas, o cuando se especica
un comportamiento deseado para un proceso con una incertidumbre dada, el sistema
de interconexion queda de la forma:
"
#
M
(
s
)
M
(
s
)
11
12
M (s) = M (s) M (s)
21
22
y la incertidumbre equivalente:
"
#
E
(
s
)
E
(
s
)
11
12
E (s) = E (s) E (s)
21
22
dado que si (E ) , la condicion de estabilidad robusta para el sistema es:
(M ) < 1 8 !
entonces como:
(M ) max
f(Miig
i
ocurre que el margen de estabilidad frente a incertidumbres simultaneas no va a ser
mejor que los margenes frente a cada tipo de incertidumbre actuando sola.
Resulta interesante obtener cotas de (M ) expresadas en funcion de los valores
singulares de los elementos Mij , de forma que puedan emplearse para facilitar el
dise~no y analisis. Con este objetivo, se dan los siguientes resultados (Freudenber
1989):
(M ) [(M12 )(M21 )]1=2 max f(M11 ); (M22 )g
(M ) [(M12 )(M21 )]1=2 + max f(M11 ); (M22 )g
En las ecuaciones anteriores puede verse la dependencia de la robustez del sistema
de los elementos Mij ; i 6= j . Si ocurre que:
[ (M12 )(M21 )]1=2 1
(8:11)
maxf(M11 )(M22 )g
el sistema sera mucho mas sensible a incertidumbres simultaneas que a las mismas
actuando de forma individual. Por ello, aunque se tenga garantizada la robustez
frente a cada incertidumbre individual (elementos Mii , (Mii ) < 1) pueden existir un par de peque~nas incertidumbres que actuando simultaneamente causen la
inestabilidad del sistema, siempre que:
[ (M12 )(M21 )]1=2 1
(8:12)
192
Robustez de plantas con fuerte ganancia direccional
- EI
r- h - 6
K
ES - ?h-
-r
G
- ?h
r r y-
Figura 8.17: Incertidumbres para problema de comportamiento robusto.
y por tanto:
(M ) [(M12 )(M21 )]1=2 1
Los sistemas que, al menos potencialmente, pueden llevar con mas facilidad a
la condicion anterior, son aquellos que tengan plantas mal condicionadas; especialmente si no se toman algunas precauciones a la hora del dise~no.
El problema de analizar la robustez en la estabilidad de un sistema con incertidumbres multiplicativas a la entrada y a la salida actuando simultaneamente, o
el de analisis del comportamiento robusto de un sistema con incertidumbre multiplicativa a la entrada, son especialmente crticos, y ponen de maniesto lo dicho
anteriormente.
Para el sistema de la gura 8.17 se trata de analizar la robustez en el comportamiento del sistema. Se supone que los errores de modelado de la planta pueden
expresarse como una incertidumbre multiplicativa a su entrada:
EI (s) = wI (s)I (s)
[I (j!)] 1 8!
y que la especicacion de comportamiento nominal puede expresarse mediante una
incertidumbre ctcia equivalente (ver gura 8.18):
ES (s) = wS (s)S (s)
Se obtiene que:
"
[S (j!)] 1 8!
#
" #
a1 = M b1
a2
b2
El problema del control robusto
193
a1
-
I (s)
a2
-
S (s)
M (s)
b1
b2
Figura 8.18: Problema de estabilidad robusta equivalente.
siendo el sistema de interconexion:
"
I wI
M = S TGw
o I
KSo wS
SowS
#
si G(s) es invertible, el termino M12 puede ponerse como: M12 = TI G 1. Si se
supone que los elementos M12 ; M21 cumplen las condiciones 8.11 y 8.12 se tendra
que (M ) 1, y como:
[(M )]1=2 (So wI G)(TI wS G 1) (SowI )(TI wS )(G)
se pone de maniesto el hecho de que si la planta tiene una acusada ganancia direccional ((G) elevado), la estabilidad del sistema experimentara una mayor sensibilidad a incertidumbres simultaneas.
Otras relaciones de interes, que ponen de relieve lo anterior, a la vez que tambien
incluyen el efecto de la ganancia direccional del controlador dise~nado, se dan a
continuacion (Freudenberg 1989, Morari et al. 1989):
(M ) (wS So) + (wI To )
(M ) (wI TI ) + (wS SI )
(M ) (wI TI ) + (1 + p )(wS So)
194
Robustez de plantas con fuerte ganancia direccional
q
(M ) maxf(wI TI ); (wS So)g + (wI TI )(wS So )
= min f(G); (K )g
Las expresiones anteriores pueden ayudar durante el dise~no, pero hay que tener
en cuenta que si se emplean para analizar directamente la robustez del sistema,
pueden llevar a dise~nos muy conservadores, debido a que para plantas con marcada
ganancia direccional la cota puede estar excesivamente sobre-estimada. Sera conveniente por tanto, de cara al dise~no nal, calcular el valor de (M ) de forma directa.
Ejemplo: Planta con fuerte ganancia direccional
Sea la siguiente matriz de transferencia G(s), correspondiente a un proceso multivariable compuesto de dos entradas y dos salidas
"
0:864
G(s) = 75s1+ 1 01::878
082 1:096
#
Este sistema reune especialmente las caractersticas anteriormente citadas sobre
la fuerte ganancia direccional. Con la peculiaridad de que su numero de condicion
toma un valor elevado y constante, de 141.3, para todo el rango de frecuencias. Es
pues, un ejemplo de lo que se denomina una planta mal condicionada, o sea con
valores de
(G) 1
en el rango de frecuencias de interes. En la gura 8.19 pueden verse sus ganancias
extremas o valores singulares en funcion de la frecuencia. Tambien se muestran la
parte real (curva continua) y la parte imaginaria (curva de trazos) de los elementos
de la matriz de ganancia relativa (rga) (ver apendice B.5) en la gura 8.20.
El problema del control robusto
195
20
Ganancias extremas de G
0
-20
-40
-60
-80
-100
-120
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
rad/s
Figura 8.19: Ganancias extremas para planta con fuerte ganancia direccional
40
40
RGA(G_11)
20
20
0
0
-20
-20
-40
10 -5
10 -2
10 1
10 4
-40
10 -5
RGA(G_12)
10 -2
rad/s
40
20
20
0
0
-40
10 -5
10 -2
rad/s
10 4
rad/s
40
-20
10 1
RGA(G_21)
-20
10 1
-40
10 -5
10 4
RGA(G_22)
10 -2
10 1
10 4
rad/s
Figura 8.20: Parte real e imaginaria de los elementos de la matriz de ganancia
relativa (rga).
196
Robustez de plantas con fuerte ganancia direccional
Captulo 9
Metodos de dise~no LTR
9.1 Introduccion
El metodo de dise~no de sistemas de control denominado Recuperacion de la funcion
de Transferencia del Lazo abierto (ltr),1 surgio como consecuencia del objetivo
de mejorar la robustez de los controladores basados en el procedimiento Lineal
Cuadratico Gaussiano (lqg) (Doyle y Stein, 1979). Posteriormente, la teora en
torno a ltr ha transcendido de sus orgenes, constituyendo una metodologa de
dise~no sistematica y exible para sistemas de control tanto escalares como multivariables. Durante la decada de los ochenta tuvo su epoca de desarrollo e implantacion
(Athans, 1986; Stein y Athans, 1987; Maciejowski, 1985), y sigue siendo un tema
de investigacion y estudio (Zhang y Freudenberg, 1993; Saberi et al, 1993; Saeki,
1992).
Como se ha presentado en el captulo anterior, las especicaciones de dise~no
pueden plantearse en el dominio de la frecuencia. En este captulo se trata el problema del ajuste de las ganancia del sistema en lazo abierto, a n que cumplan unas
especicaciones de dise~no dadas. El metodo de dise~no basado en la teora lqg, junto
con un procedimiento para recuperar cierta funcion de transferencia en lazo abierto
especicada, constituye la tecnica conocida como lqg/ltr.
Un controlador basado en observador (cbo) cumple el Principio de Separacion,
proporcionando a la hora del dise~no la division de este en dos problemas independientes:
1
Loop Transfer Recovery en terminologa inglesa
197
198
Propiedades del regulador LQR
1. Dise~no del controlador por realimentacion de estados.
2. Dise~no del observador para reconstruir el estado a partir de la medida de la
respuesta del sistema.
Por tanto, si el sistema de control con realimentacion de estados (lqsf)2 es
estable en lazo cerrado y tiene un comportamiento nominal adecuado, ello garantiza las mismas propiedades para el sistema nominal con cbo. Sin embargo, con
la presencia de incertidumbres en el modelo, el regulador con el vector de estados estimado (lqsef)3 no lleva necesariamente al mismo comportamiento obtenido
por realimentacion de estados, as como tambien puede haber un deterioro de las
propiedades de robustez con respecto al regulador lqsf (Doyle y Stein, 1981).
Surge de esta forma, la motivacion de desarrollar estructuras de control basadas
en observador (cbo), u otras no basadas en observador (cnbo), que mantengan o
al menos conserven la parte esencial, de las propiedades que caracterizan al dise~no
basado en la realimentacion de estados (lqsf), o a su problema dual, el ltro de
Kalman (kbf).
En este captulo se presentan dos estructuras empleadas en el dise~no ltr. Una
basada en observador (cbo) y otra no basada en observador (cnbo).
9.2 Propiedades del regulador LQR
Como se ha visto en el captulo 8, para un proceso que pueda describirse por un
modelo lineal e invariante en el tiempo, el comportamiento del sistema en lazo
cerrado y su robustez van a depender de ciertas funciones (matrices) de transferencia
asociadas al sistema de control, tales como la funcion de sensibilidad S (s) y su
complementaria T (s). A la vez, como se ha descrito en el captulo anterior, estas
se pueden expresar a partir de la funcion (matriz) de transferencia en lazo abierto
L(s).
Basado en lo anterior, una manera de formular las especicaciones de dise~no consiste en denir la funcion (matriz) de transferencia en lazo abierto deseada (ftlad)
Lt (s). El problema sera encontrar un controlador con una estructura determinada
que proporcione la ftlad.
2
3
linear quadratic state feedback en la terminologa inglesa.
linear quadratic state estimated feedback en la terminologa inglesa.
Metodos de dise~no LTR
199
En la literatura se han sugerido dos metodos para obtener Lt (s) que proporcionan unas caractersticas muy aceptables. Una se basa en el empleo de la teora de
control optimo cuadratico (lqr), y la otra esta basada en la teora del ltro Kalman
(kbf). La ventaja esgrimida para el empleo de estos metodos es que el sistema
adquiere, de forma automatica, ciertas propiedades muy estimables desde el punto
de vista del comportamiento nominal y de la robustez de la estabilidad.
Obtencion de la ftlad a traves de lqr
Suponiendo que se conoce un modelo de la planta, expresado en el espacio de
estados por el conjunto de ecuaciones:
x_ = A x + B u
y = Cx
(9.1)
donde se supone tambien, que las ecuaciones anteriores incluyen posibles escalados
y/o ampliaciones realizadas sobre el modelo de la planta, a fn de adecuarla para el
dise~no.
El comportamiento deseado del sistema puede especicarse de forma conveniente
mediante la optimizacion de una funcion de coste J . Si se dene el vector:
z = Mx
en el que sus componentes son combinaciones lineales de las variables de estado (M
es una matriz constante de dimensiones adecuadas); y las matrices de ponderacion:
Q = QT 0 Rc = RcT > 0
se trata de minimizar:
Z1
J =
(zT Qz + uT Rcu)dt
0
Z1
=
(xT M T QMx + uT Rcu)dt
(9.2)
0
El problema anterior es el llamado lqr, cuya solucion es de la forma:
u = Kcx
denominandose a Kc matriz de realimentacion de estados. A partir de la solucion
Pc de la ecuacion algebraica de Riccati de control (AREc) siguiente:
AT Pc + PcA PcBRc 1 B T Pc + Qc = 0
(9:3)
200
Propiedades del regulador LQR
G(s)
r -as B
- 6
b s
(s)
Kc C
y
-
x
Figura 9.1: Estructura regulador lqr (lqsf)
con
se obtiene:
siendo:
Qc = M T QM
Kc = Rc 1B T Pc
Pc = PcT 0
El problema tendra solucion Pc y sera unica, si el par (A; B ) es estabilizable
(todos los modos inestables son controlables).
Se dene Hc(s), como la funcion (matriz) de transferencia en lazo abierto entre
la entrada a la planta y la se~nal de retorno. Es la relacion entre la se~nal que entra
por el punto\a" y la que retorna por el punto\b" de la gura 9.1. Se denomina
Funcion de Relacion del Retorno o de Lazo Abierto:
Hc(s) = Kc(s)B
donde: (s) = (sI A) 1 , y la correspondiente Funcion de Diferencia del Retorno:
Fc(s) = I + Hc(s)
A partir de la ecuacion AREc y de algunas manipulaciones algebraicas (MacFarlane 1979), se obtiene:
FcT ( s)RcFc(s) = Rc + GTc ( s)QGc(s)
con:
Gc(s) = M (sI A) 1B
(9:4)
Metodos de dise~no LTR
201
En el caso de que:
Rc = I
se obtiene:
FcT ( s)Fc(s) I
(9:5)
mostrando Safonov y Athans (1977) que la desigualdad anterior garantiza para el
sistema un margen de fase (MF) mnimo de 60 (se admite un cambio de fase de
al menos 60 simultaneamente en cada canal sin que produzca la inestabilidad del
sistema), un margen de ganancia (MG) innito (frente a variaciones en forma de
valor real > 1, o modicacion de la ganancia en continua, generados de forma
simultanea en todos los canales sin que el sistema pierda su estabilidad nominal)
y un margen de tolerancia para reduccion de la ganancia (TRG) de hasta 6db
(reduccion simultanea de la ganancia 0:5 < 1, o sea de hasta el 50% de su valor
nominal, en cada canal sin que desestabilice al sistema de control).
De 9.5 se desprende que:
y por tanto:
como:
se tendra que:
i (FcH Fc) 1
(FcH Fc) 1
(FcH Fc) (FcH )(Fc) = 2(Fc)
2 (Fc) 1 ) (Fc) 1
dada la relacion Si = Fc 1, y teniendo en cuenta la propiedad de los valores singulares
de una matriz no singular P
(P 1) = (1P )
se obtiene:
(Si) 1
(9:6)
lo cual tiene la interpretacion fsica en el caso escalar, de que el sistema no amplicara
las perturbaciones actuantes a la salida de la planta.
Por otro lado teniendo en cuenta que:
Ti(s) = I Si(s)
con lo que:
(Ti) (I ) + (Fc 1)
1 + (1F )
c
1 + 1=1 = 2
(9.7)
202
Propiedades del regulador LQR
La desigualdad 9.7, puede interpretarse como una medida de la robustez de la
estabilidad para el caso de incertidumbre multiplicativa no estructurada existente a
la entrada de la planta. De forma que, a partir del teorema de peque~na ganancia
(ver captulo 8), una condicion suciente para que el sistema permanezca estable
para una incertidumbre no estructurada E (s) es que:
(E ) (1T )
i
ya que en este caso, M (s) = Ti(s), y por tanto:
(E ) 21
lo que fsicamente equivale a decir que el sistema de control puede aceptar hasta un
50% de incertidumbre relativa en la planta, manteniendo la estabilidad.
Otra caracterstica de Hc(s) es que para algun par de numeros reales f; !og se
cumple:
(Hc) ! ; 8 ! > !o
lo que se traduce en la propiedad de una cada de la ganancia del sistema de
20 db=dec a alta frecuencia.
En resumen, puede decirse que el controlador lqr tiene las siguientes propiedades:
Ley de control optima.
Amplios margenes de fase (MF) y ganancia (MG), (TRG).
Robustez de la estabilidad (rs) frente a incertidumbres de tipo multiplicativo
situadas a la entrada de la planta.
Respuesta en frecuencia en lazo abierto con una pendiente de cada suave a
alta frecuencia.
Las propiedades anteriores son todas, salvo la ultima, muy atractivas para un
sistema de control. Sera deseable ademas, si ello fuera posible, que manteniendo las
tres primeras casi sin alteracion, se consiguiera un aumento de la pendiente de cada
a alta frecuencia. Es en esa zona donde se maniestan fundamentalmente los errores
de modelado, con lo que se reforzara la robustez frente a la dinamica inmodelada
de alta frecuencia.
Metodos de dise~no LTR
203
Ajuste de las ganancias principales
Como se ha visto para el problema lqr la matriz de transferencia de diferencia
de retorno Fc(s) cumple la igualdad 9.4; si se supone, sin perdida de generalidad
(bastara con escalar la entrada al sistema), que Rc = I , queda:
FcT ( s)Fc(s) = Rc + GTc ( s)QGc (s)=
de la cual se deduce que (Doyle et al. 1981, Maciejouski 1989):
"
#1=2
2
i (Fc) = 1 + i (Q1=2 Gc)
(9:8)
y de esta se obtienen las siguientes expresiones para los valores singulares extremos:
#
1
=
2
(Fc
1 + (Q Gc)
#
"
1
1
=
2
(Fc ) = 1 + (Q Gc)
1) =
"
1=2
1=2
De las ecuaciones anteriores se deriva la posibilidad de modicar los valores
singulares o ganancias principales de Fc 1 = Si, actuando sobre la matriz Q y el
escalar . Si en el rango de frecuencias de interes ! 2 D! se cumple:
(Hc) 1
la expresion 9.8 se reduce a:
i (Hc) i (Qp Gc)
1=2
(9:9)
la relacion 9.9 puede emplearse para realizar ajustes de Hc(s) en una doble vertiente:
a) El valor del parametro modica de forma simultanea todas las ganancias
principales.
b) La matriz Q puede emplearse para modicar solo una de las ganancias principales dejando el resto inalteradas, por medio del empleo de las propiedades
de los valores y vectores singulares (ver apendice B.3).
204
El controlador LQG
Ajuste de i (Hc) para un\i" dado
Dado el producto de matrices de orden m p
Q1=2 Gc(j!)
para una frecuencia particular ! = !1 , es posible descomponerla en sus valores
singulares:
r
X
Q1=2 Gc(j!1) = U V H = uii viH ; r = minfm; pg
i=1
si se modica Q1=2 en la forma:
Q1=2 = Q1=2 (I + uj uHj )
teniendo en cuenta la propiedad de los vectores singulares
uj uHi
se obtiene:
=
(
0 si i 6= j
1 si i = j
)
Q1=2 Gc(j!1) = (PI + uj uHj ) Pri=1 uii viH
= ri6=j uiiviH + (1 + )uj j vjH
con lo que unicamente se modica la ganancia principal j que pasa de j a (1+ )j .
Por tanto, bajo la hipotesis 9.9 se tiene una forma explcita de manipular los i(Hc)
de forma independiente o unilateral para un\i" dado.
9.3 El controlador LQG
El regulador lineal cuadratico gausiano (lqg) es un procedimiento basicamente formulado en el dominio temporal, y con tratamiento en lazo cerrado. Sin embargo,
puede tambien plantearse como un procedimiento de optimizacion en el dominio frecuencial, tal y como se presenta en esta seccion, as como siguiendo el enfoque dado
en el apendice A.3. En este apartado se describe en primer lugar el procedimiento
de dise~no lqg, y a continuacion se pasa al principal interes de este captulo: los
metodos de dise~no de control robusto denominados en general ltr. Se realiza para
ello una formulacion en el espacio de estados, y un tratamiento en el dominio de la
frecuencia a la hora de formular los objetivos de dise~no.
Metodos de dise~no LTR
r- i
- 6
205
us
-
sy -
Planta
u^
Kc
s
(s)
-
?i
B
Ko
i
6-
C
Figura 9.2: Estructura regulador lqg/ltr-i
Si el sistema se encuentra sometido a perturbaciones estocasticas y/o el vector
de estado no es accesible, se emplea un observador para estimar los estados. Caso
de elegir como observador el ltro de Kalman (kbf), se denomina al metodo lqg.
Este tiene la ventaja de que minimiza la varianza del error de estimacion a partir
de la caracterizacion de los ruidos, de los que se suponen conocidas las matrices de
covarianza. En la gura 9.2 se muestra la estructura del controlador lqg.
Si el modelo de la planta junto con las perturbaciones estocasticas se puede
representar por el conjunto de ecuaciones:
x_ = A x + B u + v1
y = C x + v2
(9.10)
siendo v1 ; v2 realizaciones de ruido blanco gausiano caracterizados por:
E [v1 ; v1T ] = W 0 ; E [v2; v2T ] = Ro > 0 ; E [v1 ; v2T ] = 0
donde W; ; Ro son conocidos, estimados o elegidos de forma arbitraria de cara al
dise~no del observador.
La solucion del problema lqg se hace dividiendolo en dos subproblemas independientes (Principio de Separacion) (Gopal, 1982):
1. El problema de control: resuelto como lqr. Suponiendo que el vector de
estados estimado coincide con el del proceso.
206
El controlador LQG
2. Y el problema del observador: resuelto como kbf.
Para un modelo exacto de la planta, la estabilidad del sistema controlado por realimentacion de estados (lqr, o tambien nombrado como lqsf) garantizara tambien
la del sistema empleando el vector de estados estimado (lqsef).
Para resolver el subproblema del observador (ltro Kalman):
x^_ = A x^ + B u + Ko (y y^)
y^ = C x^
(9.11)
se necesita encontrar la matriz de ganancia del observador Ko. Para ello se resuelve
la ecuacion algebraica de Riccati del observador (AREo):
APo + PoAT PoC T Ro 1CPo + Qo = 0
con:
Qo = V1
T
(9:12)
; Ko = PoC T Ro 1
Para (A; C ) detectable (todos los modos inestables son observables) hay una
solucion Po unica de 9.12, con Po = PoT 0
De las ecuaciones del modelo de la planta 9.1, del observador 9.11, y la ley de
control:
u = Kcx^
se puede denir el error de estimacion :
= x x^
resultando
" # "
#" #
x_ = A BKc BKc
x
_
0
A Ko C lo que indica que los polos del sistema en lazo cerrado son la union de los polos
correspondientes a la ley de control (lqr) y los polos del observador (kbf).
El compensador lqg queda:
K (s) = Kc(sI A + BKc + KoC ) 1 Ko
y la ftla denida a la entrada de la planta:
L(s) = K (s)G(s)
(9:13)
Metodos de dise~no LTR
207
Es un hecho remarcado en la literatura, que el empleo de estimadores de estados
puede deteriorar la robustez del sistema, as como su comportamiento en lazo cerrado
si no se tienen modelos muy precisos de la planta.
La circunstancia de tratar de mejorar la robustez de un sistema lqg fue lo
que originalmente provoco el desarrollo de la metodologa lqg/ltr. Al incluir el
estimador de estados, potencialmente pueden deteriorarse las propiedades del control
lqr, o lo que es lo mismo de la ftla (L(s)) con respecto a la ftlad (Lt (s)).
9.4 Controlador LTR basado en observador
Como se describe en el captulo 8, las especicaciones de dise~no pueden realizarse
a traves de expresiones o cotas para ciertas funciones (matrices) de transferencia
en lazo abierto (ftla). Dependiendo de en que puntos se denan tales ftla, normalmente a la entrada o a la salida de la planta, se empleara una estrategia de
dise~no diferente. El metodo se denominara lqg/ltr-i, si se considera a la entrada
de la planta, y lqg/ltr-o si es a la salida, o tambien conocidos como metodos ltr
basados en observador, por derivarse tales metodos de la teora relacionada con los
reguladores lqg, la cual emplea un ltro de Kalman (observador de estado) para
estimar el vector de estado.
9.4.1 Metodo LQG/LTR-i
Existen diferentes metodos para realizar la llamada recuperacion de la funcion de
transferencia en lazo abierto (Saberi et al, 1993), en este apartado se emplea el
procedimiento introducido por Doyle y Stein (1979); y que consiste en modicar
los parametros libres de dise~no del observador, de forma que la ftla recupere las
caractersticas frecuenciales de la ftlad. Esto se consigue, en el caso de sistemas
de fase mnima (todos sus ceros se encuentran en el semiplano izquierdo), haciendo
depender la matriz de covarianza del ruido en el proceso de un parametro escalar\q",
llamado ganancia de recuperacion (gain recovery):
Qo = Qo + qZ
siendo Z = Z T 0 una matriz arbitraria. Para el caso de sistema de fase mnima
(ver apendice A.2), se demuestra (Stein y Athans, 1987) que:
1
qlim
!1 K (s)G(s) = Kc(sI A) B = Hc(s)
208
Controlador LTR basado en observador
El controlador lqg/ltr: K (s), sustituye la dinamica de la planta por la dinamica
deseada, y denida por Hc(s). Los ceros de K (s) corresponden a los ceros de Hc(s),
y algunos de sus polos se emplean para cancelar los ceros de la planta G(s). Es
por esto, que el metodo solo garantiza una recuperacion asintotica para plantas
con modelos inversos estables. La presencia de ceros inestables tiene el efecto de
limitar las caractersticas del comportamiento obtenible, independientemente de la
metodologa de dise~no que se emplee. Sin embargo, si los ceros inestables de la
planta estan lo sucientemente alejados del ancho de banda del sistema de control,
entonces es posible una recuperacion parcial en el rango de frecuencias de interes,
y a efectos practicos la presencia de tales ceros no afectan de manera sensible a la
robustez y comportamiento del sistema a baja frecuencia.
Es posible, que para alcanzar un nivel de recuperacion deseado, las demandas
del controlador sean excesivamente elevadas. Para un sistema con peque~nos errores
de modelado ello no es crtico, sin embargo para sistemas donde las incertidumbres
juegan un importante papel, puede darse el caso extremo de que se provoque la
inestabilidad del sistema de control. Basado en esta idea, se han propuesto por
diferentes autores (Athans, 1986; Lopez y Rubio, 1994) controladores lqg con recuperacion parcial (zonas de baja y media frecuencia) (ltr-i), el cual exhibira unas
caractersticas de comportamiento similares al lqg en el rango de frecuencias de
interes, y que adicionalmente presenta unas mejores propiedades de robustez frente
a la presencia de dinamica inmodelada de alta frecuencia.
Ejemplo: Dise~nos lqr, lqg, lqg/ltr
Sea el sistema dado por las siguientes ecuaciones:
x_ = Ax + Bu + w
y = Cx + v
donde las matrices A, B , C , y vienen dadas por:
!
!
0
1
0
A= 3 4 ; B= 1 ; C= 2 1 ;
=
35
61
!
Dicho sistema corresponde a una funcion de transferencia de la forma:
+2
G(s) = uy((ss)) = (s +s1)(
s + 3)
Se considera en primer lugar el control lqr. Para ello se trata de encontrar el
regulador optimo que minimice el siguiente criterio cuadratico o funcion de coste:
Z1
J = (xT M T Mx + u2) dt
0
Metodos de dise~no LTR
209
donde se emplean:
M = 52:915 8:944 ; Rc = 1; Q = diagf1; 1g
Con estos datos puede ser calculado el regulador lineal cuadratico (lqr), bien a
partir de la descripcion por variables de estado, tal y como se detalla a lo largo de
este captulo, o mediante el uso de funciones de transferencia, como se describe en el
apendice A. Siguiendo el primer metodo, y resolviendo la correspondiente ecuacion
de Riccati de control se tendra que la matriz de realimentacion de estados es,
Kc = [ 50 10 ]
Las correspondientes funciones de transferencia implicadas en el desarrollo son
respectivamente:
s + 52:915
Gc(s) = M (s)B = 8(:944
s + 1)(s + 3)
50 + 10s
Hc(s) = (s +
1)(s + 3)
La funcion de transferencia correspondiente al bucle cerrado se obtiene de la
expresion general:
Gbc(s) = C (sI A + BKc) 1B
o en el caso de tratarse de un sistema de simple entrada-salida, tambien puede
obtenerse de,
(9:14)
Gbc(s) = 1 +GG(s)(s) = s2 +s14+s2+ 53
c
Con este regulador lqr se cumplen las especicaciones del sistema en bucle
cerrado (regulador optimo, que situa los polos del sistema en lazo cerrado en las
posiciones 7:0 2:0j ), y la funcion de transferencia del bucle abierto Hc(s), tiene
como era de esperar muy buenas caracteristicas de robustez: margen de fase de 86
y margen de ganancia innito. Sin embargo, si el estado no es accesible es necesario
dise~nar un observador de estado o ltro de Kalman para estimarlo, con lo cual
se obtiene el correspondiente controlador lqg. Para ello se tendran las siguientes
matrices de covarianza:
Qo = T ; Ro = 1
que tras resolver la correspondiente ecuacion algebraica de Riccati se obtiene la
matriz de ganancia del ltro de Kalman Ko. Una vez conocidas Kc y Ko , el regulador
se puede obtener de forma general a partir de la expresion,
K (s) = Kc(sI A + BKc + Ko C ) 1Ko
210
de donde se obtiene:
Controlador LTR basado en observador
s + 2:6)
K (s) = (s 1000(
18:66)(s + 42:7)
Si se calcula la funcion de transferencia en bucle cerrado con el regulador lqg,
se obtiene la misma obtenida anteriormente (ecuacion 9.14), dado que la inclusion
del observador no modica el lazo cerrado del sistema de control. Sin embargo, si se
analiza la funcion de transferencia en lazo abierto K (s)G(s), se obtiene un margen
de fase de 15 y un margen de ganancia de 1:9 db. Los cuales son sensiblemente
inferiores a los obtenidos con el regulador lqr. Por lo que la robustez del sistema
con el regulador lqg sufre un serio deterioro.
A n de mejorar la robustez, a continuacion se dise~na un regulador lqg/ltr.
Para ello, se modica la matriz de covarianza en la forma:
Qo = T + qBB T
Para dise~nar el regulador lqg/ltr se va incrementando q desde cero (regulador
lqg) hasta un valor razonable para tener un compromiso entre la estimacion y la
robustez. Este proceso se puede ver en la gura 9.3, donde se representa el diagrama
de Nyquist de la funcion de transferencia en bucle abierto para distintos valores del
parametro q; as mismo en la tabla adjunta se dan los valores de los margenes de
estabilidad obtenidos en cada caso.
Margen de
Margen de
q ganancia (db) fase (grados)
0
-1.9
15.0
100
-2.6
20.0
500
-5.2
32.5
1000
-8.0
42.5
10000
1
74.5
9.4.2 Metodo LQG/LTR-o
La tecnica consiste en explotar la dualidad existente entre los problemas lqr y kbf.
Esta lleva a demostrar que si se establecen las equivalencias:
AT ! A ; C T ! B
BT ! C ;
!M
V1 ! Q
; Ro ! Rc
Metodos de dise~no LTR
211
1
0.5
q=100
q=0
Imag G(jw)
0
q=500
-0.5
q=1000
-1
q=10000
-1.5
Glqr
-2
-3
-2.5
-2
-1.5
-1
-0.5
0
Real G(jw)
Figura 9.3: Diagrama de Nyquist para diferentes q
la funcion (matriz) de transferencia en lazo abierto del observador (kbf):
Ho (s) = C (sI A) 1Ko = C (s)Ko
goza de las mismas propiedades analizadas para el controlador lqr. Con la diferencia, de que ahora se presentan para una ftlad denida a la salida de la planta en
vez de la entrada (ver gura 9.4).
Para el caso de planta de fase mnima se conseguira la recuperacion asintotica
r-as Ko
- 6
(s)
C
Figura 9.4: Estructura de Ho (s) (kbf)
bs
y-
212
Controlador LTR no basado en observador
r-
m -
6 -6
B ?
Ko - m
(s)
-Kc
Planta
y-
C
Figura 9.5: Estructura regulador lqg/ltr-o
de la ftlad a la salida de la planta:
qlim
!1 G(s)K (s) = C (sI
A) 1 Ko = Ho(s)
donde ahora el parametro\q" (ganancia de recuperacion) se emplea para modicar
la matriz de ponderacion del estado, Qc en 9.2, de la forma:
Qc = Qc + qZ
siendo Z = Z T 0 una matriz arbitraria. En la gura 9.5 se muestra la estructura
del regulador lqg/ltr-o.
9.5 Controlador LTR no basado en observador
El compensador obtenido con el metodo lqg/ltr-i tiene la forma 9.13, la ftla
tomada a la entrada es: L(s) = K (s)G(s), y la ftlad especicada es: Lt (s) =
Hc(s). El error entre ambas (error de recuperacion):
E (s) = Lt (s) L(s)
(9:15)
puede expresarse como:
E (s) = N (s)[I + N (s)] 1[I + Hc(s)]
Se dene el nivel de recuperacion como el tama~no de E (s):
[E (s)]
(9:16)
(9:17)
Metodos de dise~no LTR
213
El error de recuperacion se anula si y solo si:
N (s) = 0 ; 8 !
siendo:
N (s) = Kc(sI A + KoC ) 1 B
(9:18)
En ese caso, se dice que se produce una recuperacion exacta de la ftlad a la
entrada de la planta (eLTRi). En otro caso, se dira que la recuperacion ha sido solo
aproximada (aLTRi), si el tama~no de N (s) se hace sucientemente peque~no para
cualquier !. Se tratara de encontrar una matriz Ko(q) que consiga:
N (s) = Kc(sI A + Ko(q)C ) 1B ! 0
(9:19)
Para mantener la independencia entre los dise~nos de la realimentacion de estados y
el observador, para una matriz Kc dada, se cumplira la relacion 9.19 si:
(sI A + Ko(q)C ) 1B ! 0
q ! 1
Se puede comprobar, que a medida que el parametro\q" aumenta, tambien lo hace
el tama~no de Ko(q), de forma que:
si q ! 1 entonces kKo(q)kF ! 1
donde se dene:
q
kKokF = traza(KoKoT )
La dependencia anterior ocasiona que para conseguir una recuperacion aproximada con [N (s)] lo sucientemente peque~no, tenga a veces que aumentar Ko
excesivamente, provocando un incremento del ancho de banda del compensador, lo
cual va a ser contraproducente en algunas situaciones practicas.
Si se considera u^ la se~nal a la salida del compensador, y u(s) la se~nal de control
de entrada a la planta, puede obtenerse:
u^(s) = N (s)u(s) Kc(sI A + KoC ) 1 y(s)
Motivado por la relacion anterior y dado que la condicion de eLTRi se consigue
anulando N (s), o equivalentemente haciendo que u^(s) no dependa explcitamente de
u(s), Chen y col. (Chen et al. 1991) desarrollan una estructura para controlador no
basada en observador (cnbo), donde la se~nal que genera el controlador no depende
214
Controlador LTR no basado en observador
r
-j
- 6
u
u^
Kc
xc
y
Planta
(s)
-
Ko
-
j
6-
C
Figura 9.6: Estructura del cnbo ltr-i
de manera explcita de la se~nal de control a la planta (ver gura 9.6). Se elimina
de esta forma la dependencia de la matriz de distribucion B de la se~nal de control,
caracterstica de las estructuras convencionales basadas en observador.
Las ecuaciones descriptivas del cnbo son:
x_ c = (A KoC )xc + Koy
yc = Kcxc
u^ = yc
(9.20)
y equivalentemente la representacion entrada-salida:
K (s) = Kc(sI A + KoC ) 1Ko
(9:21)
Si se compara su estructura con la cbo (ecuacion 9.13), se comprueba que
unicamente dieren en que no aparece el termino BKc.
Para obtener Ko y Kc se pueden resolver de forma similar a la realizada con el
controlador basado en observador convencional. El controlador se desea estable, de
forma que hay que examinar los autovalores i(A Ko C ) para cada Ko obtenido
Metodos de dise~no LTR
215
durante el proceso de dise~no. Para este regulador no se cumple el principio de
separacion, por lo que para garantizar la estabilidad del sistema nominal en lazo
cerrado se analiza si la matriz:
"
#
A
K
C
K
C
o
o
Alc =
BKc A
cumple:
Re[i(Alc)] < 0
Se demuestra (Chen et al. 1991), que existe un valor de la ganancia de recuperacion qo tal que 8q qo , el sistema nominal en lazo cerrado y el controlador son
asintoticamente estables.
El error de recuperacion 9.15 obtenido con el cnbo es:
Ec(s) = N (s)
(9:22)
Si se toma la misma matriz Ko para cnbo y cbo, y se comparan 9.16 y 9.22,
se obtiene que el nivel de recuperacion (9.17) obtenido para el primero es superior.
As, si se cumple:
[Lt (s)] 1 8! 2 D!
y se supone un cierto nivel de recuperacion:
[N (s)] 1
siendo Lt (s) = Hc(s) y D! la region de frecuencias de interes. La relacion entre el
error de recuperacion del cbo (E (s)) y del cnbo (Ec(s)) se obtiene de:
(E ) = [M (I + M ) 1 (I + Hc)]
(M ) [(I + M ) 1 ](I + Hc)
= (M ) (I + Hc) = (Ec)(I + Hc)
(I + M )
(I + M )
(Ec)[(M()H+c)1 1] (Ec)1(Hc) (Ec)
concluyendo:
(E ) (Ec) 8 ! 2 D!
Se obtiene que un cnbo consigue mayor nivel de recuperacion que empleando un
cbo para el mismo valor de Ko (q ) (y por tanto para el mismo valor de la ganancia
216
Controlador LTR no basado en observador
B
r-
- 6
Ko
?
xc
-
(
s
)
-Kc
u
Planta
y-
Figura 9.7: Estructura ltr-o (cnbo)
de recuperacion\q"). Una consecuencia inmediata de gran utilidad practica, es que
para un mismo grado de recuperacion el cnbo necesita matrices Ko con tama~nos
(kKokF ) menores que los obtenidos con el cbo; y consecuentemente el regulador
tendra un ancho de banda menor, protegiendo de esa forma al sistema de demandas
de control excesivas, y en algunos casos de la posible saturacion de los actuadores.
Otra ventaja consiste en que de esa forma se evita la amplicacion innecesaria del
ruido de medida; y nalmente una mayor robustez frente a la dinamica no modelada
de alta frecuencia.
En el desarrollo anterior se ha analizado la sntesis ltr-i con el cnbo. Tambien
es posible realizar un dise~no ltr-o especicando una ftlad a la salida de la planta.
En este caso la estructura del regulador es la representada en la gura 9.7, con las
ecuaciones descriptivas del cnbo ltr-o dadas por:
x_ c = (A BKc)xc + Ko(y r)
yc = Kcxc
u = yc
(9.23)
y la representacion entrada-salida del regulador:
K (s) = Kc(sI A + BKc)Ko
Si se compara con la estructura cbo (ecuacion 9.13), se comprueba que unicamente
dieren en que no aparece el termino KoC . Representa el caso dual del regulador
Metodos de dise~no LTR
217
ltr-i (cnbo), por lo que los resultados anteriores obtenidos para este, son igualmente validos (Saberi et al, 1993).
Como se comenta brevemente en la introduccion y se ha planteado a lo largo
de la exposicion de este captulo, el procedimiento ltr constituye una metodologa
de dise~no sistematica que ha transcendido de sus orgenes, y aunque por tradicion
sigue denominandose lqg/ltr, se ha independizado del problema lqg. Dado que,
el metodo ltr consiste en denitiva en especicar una funcion (matriz) de transferencia en lazo abierto (que cumpla las especicaciones de dise~no deseadas), y a
traves del ajuste de uno de los parametros de dise~no se realiza la recuperacion o
aproximacion de la ftlad por medio de un regulador ltr.
Ejemplo: Dise~no ltr-i con estructura no basada en observador
A continuacion se comparan las recuperaciones obtenidas mediante un regulador lqg/ltr-i convencional (cbo), y un regulador ltr-i no basado en observador
(cnbo), para el mismo ejemplo visto anteriormente. Para ello, se parte del mismo
sistema dado en el ejemplo anterior. El procedimiento de recuperacion, al igual
que antes se indicara, consiste en hacer depender la matriz de covarianza Qo del
parametro q, o tambien llamado ganancia de recuperacion, en la forma
Qo =
T
+ qBB T
El regulador lqg/ltr-i convencional se obtiene de,
K (s) = Kc(sI A + BKc + Ko C ) 1Ko
mientras que el regulador ltr-i con estructura no basada en observador esta dado
por,
K (s) = Kc(sI A + KoC ) 1Ko
Los niveles de recuperacion, o grados de aproximacion a la funcion de transferencia en lazo abierto obtenida con el regulador lqr, conseguidos por ambos reguladores
(cbo y cnbo) pueden verse en las guras 9.8 a 9.13, para diferentes valores de q
(las curvas continuas corresponden al control lqr, y las de trazos al ltr). Puede
verse como la recuperacion obtenida con el cnob es sensiblemente superior al cbo.
Ello genera una consecuencia positiva de cara a la robustez frente a la dinamica
inmodelada de alta frecuencia, as como la menor sensibilidad frente a las perturbaciones. Ya que a medida que aumenta q se incrementa la ganancia del observador
y consecuentemente el ancho de banda del regulador. De forma que para alcanzar
218
Controlador LTR no basado en observador
40
CBO q= 0
40
20
mag(L) (db)
mag(L) (db)
20
0
-20
-40
-60
10 -3
0
-20
-40
10 0
-60
10 -3
10 3
0
0
-50
-50
-100
-150
10 0
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200
10 -3
CNBO q= 0
-100
-150
-200
10 -3
10 3
w (rad/s)
10 0
10 3
w (rad/s)
Figura 9.8: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q1
CBO q= 500
50
mag(L) (db)
mag(L) (db)
50
0
-50
-100
10 -3
10 0
0
-50
-100
10 -3
10 3
0
0
-50
-50
-100
-150
10 0
w (rad/s)
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200
10 -3
CNBO q= 500
10 3
-100
-150
-200
10 -3
10 0
10 3
w (rad/s)
Figura 9.9: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q2
Metodos de dise~no LTR
CBO q= 2500
50
mag(L) (db)
mag(L) (db)
50
219
0
-50
-100
10 -3
10 0
0
-50
-100
10 -3
10 3
0
0
-50
-50
-100
-150
10 0
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200
10 -3
CNBO q= 2500
-100
-150
-200
10 -3
10 3
w (rad/s)
10 0
10 3
w (rad/s)
Figura 9.10: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q3
CBO q= 3600
50
mag(L) (db)
mag(L) (db)
50
0
-50
-100
10 -3
10 0
0
-50
-100
10 -3
10 3
0
0
-100
-100
-200
-300
10 0
w (rad/s)
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-400
10 -3
CNBO q= 3600
10 3
-200
-300
-400
10 -3
10 0
10 3
w (rad/s)
Figura 9.11: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q4
220
Controlador LTR no basado en observador
40
CBO q= 25000
40
20
mag(L) (db)
mag(L) (db)
20
0
-20
-40
-60
10 -3
0
-20
-40
10 0
-60
10 -3
10 3
0
0
-50
-50
-100
-150
10 0
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200
10 -3
CNBO q= 25000
-100
-150
-200
10 -3
10 3
w (rad/s)
10 0
10 3
w (rad/s)
Figura 9.12: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q5
40
CBO q= 1e+005
40
20
mag(L) (db)
mag(L) (db)
20
0
-20
-40
-60
10 -3
0
-20
-40
10 0
-60
10 -3
10 3
0
0
-50
-50
-100
-150
10 0
w (rad/s)
10 0
10 3
w (rad/s)
fase(L) (gr)
fase(L) (gr)
w (rad/s)
-200
10 -3
CNBO q= 1e+005
10 3
-100
-150
-200
10 -3
10 0
10 3
w (rad/s)
Figura 9.13: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q6
Metodos de dise~no LTR
221
- E (s)
a
r
- Lt (s) - ?j rb L(s)
Figura 9.14: El error de recuperacion como una incertidumbre aditiva
una recuperacion adecuada, sea necesario incrementar de forma excesiva el valor del
parametro q o ganancia de recuperacion.
Se extrae por tanto del analisis anterior, que la ventaja basica del regulador ltr
(cnbo) es que consigue una aproximacion o recuperacion mejor que un regulador
lqg/ltr (cbo) para un mismo valor de q . Lo cual tiene mucha relevancia de cara
a la implementacion fsica del regulador en un ambiente real.
9.6 Controlador
LT R=H
1
En el captulo siguiente se trata ampliamente la teora relacionada con el control H1.
Sin embargo, a continuacion se plantea un problema particularmente interesante: se
trata de encontrar un regulador lqg/ltr-i, tal que una medida de la aproximacion
de la respuesta en frecuencia en lazo abierto conseguida por el regulador ltr al lqr
este acotada superiormente. Dicha medida se va a caracterizar mediante una cota
H1, tal y como se describe a continuacion.
En este apartado se presenta un procedimiento para obtener un controlador
lqg/ltr que consigue aproximar la respuesta en frecuencia en lazo abierto (ftla)
a una especicada (ftlad), con un determinado grado de aproximacion o de re-
cuperacion. La solucion se obtiene resolviendo un problema de control suboptimo
H1. Como ya se ha descrito en este captulo, el procedimiento lqg/ltr-i consiste
en encontrar un controlador K (s) que consiga acercar a la ftla: L(s) = K (s)G(s)
a una ftlad: Lt (s) = Hc(s) dada.
Controlador LTR=H1
222
Para el analisis del problema de la recuperacion, puede interpretarse a L(s) como
si se tratara de Lt (s) con una incertidumbre aditiva (ver gura 9.14):
E (s) = L(s) Lt (s)
Se dene el grado de recuperacion (Saeki 1992), como:
E = kE (s)[I + Lt (s)] 1k1
(9:24)
Si se emplea un cbo, se obtiene un error de recuperacion que puede expresarse:
E (s) = Kc(sI A + BKc + KoC ) 1B [I + Hc(s)]
(9:25)
como se desea que E (s) sea lo menor posible (al menos en el rango de frecuencias de
interes), se puede plantear el problema de conseguir un grado de recuperacion por
debajo de un mnimo deseable E , y expresarlo como una cota H1.
Teniendo en cuenta la denicion 9.24 y la expresion 9.25 queda:
E = kKc(sI A + BKc + Ko C ) 1B [I + Hc(s)][I + Hc(s)] 1k1 < E
lo que equivale a encontrar una matriz Ko (q) que satisfaga:
kKc(sI A + BKc + KoC ) 1B k1 < E
(9:26)
(9:27)
Para obtener la solucion del problema anterior, se tiene el siguiente teorema
(Saeki, 1992):
Teorema: Existe una matriz Ko, que satisface la ecuacion 9.27, si y solo si la
ecuacion algebraica de Riccati:
(A BKc)X + X (A BKc)T X ( 1 C T C 12 KcT Kc)X + Q + BB T = 0 (9:28)
E
tiene una solucion X = X T > 0, para un numero real > 0, lo sucientemente
peque~no y una matriz arbitraria Q = QT > 0. Obteniendose como solucion:
Ko = 21 XC T
El papel desempe~nado por es similar al de 1=q2 en el procedimiento de recuperacion descrito en apartados anteriores. El resultado anterior es valido tanto para
plantas de fase mnima as como para plantas de fase no mnima. A continuacion se
da un procedimiento a seguir para el calculo del regulador LTR=H1:
Metodos de dise~no LTR
223
1. Se elige una matriz arbitraria simetrica denida positiva Q, un valor de E
dentro del intervalo
0 < E < 1
y un valor lo sucientemente peque~no de = 1 > 0
2. Se resuelve la ecuacion de Riccati 9.28.
3. Si su solucion X no es denida positiva se incrementa el valor de E y se
vuelve al paso 2.
4. Si X es denida positiva se resuelve la ecuacion 9.28 para distintos valores de
2 (0; 1 ), para todos los cuales la ecuacion de Riccati tiene solucion denida
positiva.
5. Se elige la matriz Ko para un valor de del intervalo anterior, para el cual se
obtiene el valor inferior de la norma de Frobenius de la matriz Ko ,
q
kK kF = traza (KoT Ko)
Con el procedimiento anterior, se consigue el grado de recuperacion deseado, a
la vez que se evita incrementar el tama~no de Ko , y con ello el que el ancho de banda
aumente en exceso, protegiendo por tanto al sistema frente a la dinamica inmodelada de alta frecuencia, de las perturbaciones y ruidos de medida de los sensores.
Ejemplo: Controlador LTR=H1
Se van a considerar dos casos, el primero correspondiente a una planta de fase
mnima (caso 1), y el segundo (caso 2) que trata con una planta de fase no mnima;
a n de ver la validez del procedimiento para ambos tipos de plantas.
Para ambos casos se emplea,
A=
"
#
" #
0 1 ; B= 0
3 4
1
la matriz de realimentacion de estados es Kc = [ 50 10 ], y la matriz Q se elige de
la forma,
"
#
1
0
Q= 0 1
Controlador LTR=H1
224
Para caso 1 (fase mmina):
h
i
C = 2 1 ; y se elige E = 0:1
Para caso2 (fase no mnima):
h
C= 2
i
0:1 ; y se elige E = 0:35
En las guras 9.15 y 9.16 se muestra la dependencia de la norma de Frobenius
de la matriz de ganancia del observador Ko en funcion del parametro . Para todos
los valores de mostrados en dichas guras se consiguen respectivamente
E < 0:1 (fase mnima)
E < 0:35 (fase no mnima)
Sin embargo, se elige el valor de para el que se obtiene el valor de kKokF inferior.
Y por tanto, el regulador consigue el objetivo prejado, pero con un ancho de banda
inferior; protegiendo as al sistema frente a las incertidumbres, perturbaciones y
ruidos que afectan a la planta.
Metodos de dise~no LTR
225
1600
1400
Norma de Frobenius de Ko
1200
1000
800
600
400
200
0
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
x10 -5
epsilon
Figura 9.15: Norma de Frobenius en funcion de para sistema de fase mnima
x10 5
4.4
Norma de Frobenius de Ko
4.2
4
3.8
3.6
3.4
3.2
3
1
2
3
4
5
epsilon
6
7
8
9
x10 -9
Figura 9.16: Norma de Frobenius en funcion de para sistema de fase no mnima
226
Controlador LTR=H1
Captulo 10
Controladores H1
10.1 Introduccion
Como se ha descrito en el captulo 8, una forma de establecer las especicaciones de
dise~no, consiste en la minimizacion de determinada funcion de coste formulada en el
dominio frecuencial. Dos medidas de comportamiento, ampliamente empleadas en
los problemas de control optimo y robusto, son las normas H2 y H1. La solucion
al problema de control de optimizacion H2 (tambien denominado de Wiener-Hopf)
fue desarrollada durante las decadas de los 60 y 70; mientras que el dise~no con H1
se inicio en el decenio de los 80 y continua aun su desarrollo.
La formulacion del problema de control optimo H1 fue realizada por Zames en
1981 para el caso escalar y basada en una representacion entrada-salida, obteniendo
la solucion del problema en 1984 (Zames y Francis, 1984). Posteriormente los mismos
autores obtienen la solucion para el caso multivariable.
Los primeros algoritmos para la resolucion de los problemas H1, desarrollados
desde 1984 a 1988, tenan el inconveniente de que el controlador obtenido era, en
general, de un orden elevado (Francis, 1987) comparado con el de la planta, por
lo que como paso previo a la implementacion fsica del regulador era conveniente
realizar un intenso trabajo para obtener reguladores de menor dimension.
Es a partir del trabajo de Doyle y colaboradores (1989), cuando se da un fuerte
impulso para la solucion algortmica de los problemas de control H1, obteniendose
un controlador de la misma dimension que la planta ampliada, o tambien deno227
Justicacion del control H1
228
minada planta generalizada, (constituida por el modelo del proceso junto con las
matrices de ponderacion que constituyen las especicaciones de dise~no). Con ello,
da comienzo la llamada segunda generacion de algoritmos en el espacio de estados
de la teora H1. Caracterizada por el planteamiento del problema de optimizacion
formulado en el espacio de estados y resuelto, de forma mas simple, a partir de
dos ecuaciones algebraicas de Riccati desacopladas. En este captulo se tratan en
primer lugar las tecnicas inicialmente desarrolladas para la solucion de los problemas
de control H1, pasando a continuacion a describir las tecnicas basadas en el espacio
de estados.
10.2 Justicacion del control
1
H
En este apartado se trata de justicar la utilidad del control H1 en la teora de
control. Para ello, se ha elegido el planteamiento de dos problemas de control
esenciales: el problema del comportamiento nominal optimo, y el problema de la
estabilidad robusta. En ambos casos, y a n de simplicar la exposicion, as como
para que el lector familiarizado con la teora clasica de control lo encuentre mas
ameno, se trata en ambos casos el problema escalar. Tambien se presenta la conexion
entre la teora de juegos diferencial y el control H1.
10.2.1 Interpretacion H1 del comportamiento nominal
El metodo de optimizacion de sistemas de control H1 esta relacionado con la minimizacion del valor de pico de la respuesta en frecuencia de cierta funcion en bucle
cerrado. Para aclarar y profundizar en el signicado de la aseveracion anterior,
considerese el ejemplo del sistema basico de control de la gura 10.1; donde la planta
tiene la funcion de transferencia G(s) y el controlador K (s), la se~nal d representa
las perturbaciones actuando sobre el sistema y la se~nal y la salida del sistema.
A partir de la gura 10.1, puede obtenerse la dependencia de la respuesta del
sistema y la variable de control, con el resto de variables que actuan sobre el sistema.
Queda:
y(s) = T (s) r(s) + S (s) d(s) T (s) n(s)
(10.1)
u(s) = K (s) S (s) [r(s) n(s) d(s)]
(10.2)
Como puede verse en la ecuacion 10.1, la funcion de sensibilidad S caracteriza
Controladores H1
6
r -
229
d
K (s)
u-
- ?
G(s)
y
-
6
n
Figura 10.1: Estructura de un sistema de control convencional
el comportamiento del sistema de control con respecto a las perturbaciones (d). Un
problema de dise~no puede consistir en obtener un controlador K que consiga un
rechazo o atenuacion considerable de las perturbaciones,
S0
al menos en la zona de frecuencias de actuacion de la perturbacion.
El problema original considerado por Zames (1981) consiste en encontrar un
compensador K que haga al sistema de control estable y minimice el valor de pico
denido como,
k S k1= max
(10:3)
! jS (j! )j
Dado que para algunas funciones el valor de pico puede no existir, se reemplaza
este por el supremo o menor de las cotas superiores, as que,
jjS jj1 = sup
jS (j!)j
!
(10:4)
En general, para el caso multivariable, signica minimizar el supremo del valor
singular maximo.
k S k1= sup [S (j!)]
!
La justicacion de este problema reside en que si el valor de pico de la funcion de
sensibilidad es peque~no, entonces la magnitud de S necesariamente es peque~na para
Justicacion del control H1
230
todas las frecuencias, y por tanto las perturbaciones seran atenuadas para todas
las frecuencias. La minimizacion de jjS jj1 es la optimizacion del peor caso, porque
ello equivale a la minimizacion del efecto sobre la salida de la peor perturbacion (es
decir, una perturbacion armonica a la frecuencia donde jS j tiene el valor de pico).
El problema del peor caso tiene una interpretacion matematica muy signicativa,
tal y como se expone a continuacion. Supuesto que la pertubacion d es desconocida
para las frecuencias de interes, pero tiene energa nita, el valor,
jjdjj2 =
sZ 1
1
jd(t)j2dt
(10:5)
se conoce como la norma-2 de la perturbacion d. La energa de d es el cuadrado de
la norma-2. Entonces, la norma jjS jj del sistema S con entrada d y salida y inducida
por la norma-2, se dene como,
(10:6)
jjS jj = sup jjjjdyjjjj2
d:jjdjj2<1
2
De aqu, se deriva que la norma esta directamente relacionada con la ganancia
de energa para la entrada con la distribucion frecuencial peor posible. Utilizando
el teorema de Parseval se llega a que,
jjS jj = jjS jj1
(10:7)
Por ello, el valor de pico es precisamente la norma del sistema inducida por las
normas-2 sobre las se~nales de entrada y salida. La norma es conocida como norma-1
del sistema.
La optimizacion del peor caso sugiere un paradigma de la teora de juegos: el
dise~nador desea determinar el compensador K que ofrece la mejor proteccion contra
la peor pertubacion que se puede dar u ocurrir sobre el sistema. Esto explica porque
en algunos trabajos teoricos la optimizacion H1 es tratada desde el punto de vista
de la teora de juegos diferencial.
Si se realiza una breve reexion, se observa que la minimizacion de jjS jj1 como
tal no es una herramienta util de dise~no. La respuesta en frecuencia de cada planta
y compensador fsico decrece a alta frecuencia. Esto signica que a menudo la
sensibilidad S puede hacerse peque~na a baja frecuencia pero eventualmente tiende
a un valor asintotico a alta frecuencia. Por ello, un valor peque~no de S a baja
frecuencia no se reeja en el valor de pico, pero es de considerable importancia para
Controladores H1
231
las especicaciones del sistema de control. Por esta razon, es habitual introducir
una funcion de peso dependiente de la frecuencia W y considerar la minimizacion
de,
jjWS jj1 = sup jW (j!)S (j!)j
(10:8)
!
La forma habitual de elegir W es que sea grande a baja frecuencia, y vaya
decreciendo a medida que aumente la frecuencia. El problema de minimizacion
de la sensibilidad ponderada as denido, tiene ciertos aspectos interesantes. Sin
embargo, no tiene en cuenta las limitaciones fsicas en la variable de control del
sistema. Por lo que habra que modicar la funcion de coste a minimizar, de forma
que ello se tuviera en consideracion.
10.2.2 Interpretacion H1 de la estabilidad robusta
A continuacion se ilustra la conexion entre la minimizacion del valor de pico y el
dise~no para obtener una estabilidad robusta. Para ello se va a considerar el diagrama
de Nyquist mostrado en la gura 10.2, que corresponde a la funcion en lazo abierto
L = GK de un sistema de control escalar generico como el de la gura 10.1. En
particular, se analiza si el sistema realimentado permanece estable bajo la existencia
de una incertidumbre que modica la funcion de transferencia desde su valor nominal
Lo al valor actual o real L.
En el desarrollo siguiente se supone que el sistema es estable en bucle abierto (o
sea, L representa a un sistema estable). Tambien se asume que el sistema nominal
en lazo cerrado esta bien dise~nado, en el sentido de que es estable. Por lo que el
diagrama de Nyquist del sistema nominal, Lo, no rodea al punto crtico ( 1; 0j ) del
plano complejo. El sistema real sera tambien estable en lazo cerrado si el correspondiente diagrama de Nyquist de L tampoco rodea a dicho punto. Se demuestra
que el diagrama de Nyquist no rodea al punto -1 si,
jL(j!) Lo(j!)j < jLo (j!) + 1j 8 ! 2 < :
(10:9)
Esto es equivalente a,
jL(j!) Lo(j!)j : jLo(j!)j < 1 8 ! 2 < :
(10:10)
Lo(j!)
jLo (j!) + 1j
Deniendo la funcion de sensibilidad complementaria To del sistema nominal en
bucle cerrado como,
To = 1 So = 1 1 +1 L = 1 +LoL
(10:11)
o
o
Justicacion del control H1
232
Im
(-1,0j)
Re
(0,0)
Lo (jw)
L(jw)
Figura 10.2: Interpretacion de la estabilidad robusta con el diagrama de Nyquist
siendo So la funcion de sensibilidad nominal. Entonces, a partir de la ecuacion
(10.10) se tendra que si,
jL(j!) Lo(j!)j :jT (j!)j < 1; 8 !
o
L (j!)
o
(10:12)
el sistema con incertidumbre (o sistema real) sera estable en bucle cerrado.
El factor jL(j!) Lo (j!)j=jLo(j!)j en esta expresion, representa el tama~no relativo de la incertidumbre frente al valor nominal Lo . Supuesto que este valor relativo
es una funcion de la frecuencia y que al menos se conoce una cota de la misma dada
por,
jL(j!) Lo(j!)j jW (j!)j; 8 !
(10:13)
T
jLo(j!)j
Entonces,
jL(j!) Lo(j!)j jT (j!)j =
o
Lo (j!)
=
jL(j!) Lo (j!)j=jLo(j!)j jW (j!)T (j!)j < jW (j!)T (j!)j
T
o
T
o
jWT (j!)j
(10:14)
Controladores H1
233
de aqu, si se cumple,
jWT (j!)To(j!)j < 1; 8 ! 2 < :
(10:15)
por (10.12) el sistema en bucle cerrado es estable para toda incertidumbre limitada
por (10.13). Se puede demostrar que la condicion (10.13) es una condicion necesaria
y suciente para la estabilidad robusta del sistema (Morari et al. 1989).
Se ha obtenido la condicion (10.15) bajo la hipotesis de que el sistema en bucle
abierto es estable. Puede probarse que tambien es valida para sistemas inestables
en bucle abierto, con tal de que el sistema nominal y el pertubado en bucle abierto
tengan el mismo numero de polos en la parte derecha del plano complejo.
Utilizando la notacion de normas introducida anteriormente la condicion para
estabilidad robusta puede reescribirse como,
jjWT (j!)To(j!)jj1 < 1;
(10:16)
Esto demuestra explicitamente la relevancia de la norma-1, o sea el valor del
pico de la respuesta en frecuencia para caracterizar la robustez. Como se ha visto en
el procedimiento seguido, el criterio del valor de pico surge en este caso del criterio
de estabilidad de Nyquist, el cual restringe el diagrama de Nyquist de la funcion de
bucle abierto a no cortar el punto -1 del plano complejo.
Por tanto, para que un sistema tenga garantizada la estabilidad robusta sera
suciente que se dise~ne de forma que jjWT To jj1 sea menor que uno. Un posible
problema que se puede plantear es el de minimizacion de la norma jjWT Tojj1 con
respecto a todos los compensadores que estabilizan al sistema en bucle cerrado como
un problema de optimizacion de la estabilidad robusta. Sin embargo, la estabilidad
raramente es el unico objetivo de dise~no, por lo que en la funcion de coste a minimizar
aparecen otros elementos que hacen alusion a otros subobjetivos, como por ejemplo
al comportamiento nominal deseado.
10.2.3 Control H1 y la teora de juegos diferencial
Como se ha mencionado anteriormente, el problema de control H1 esta estrechamente relacionado con la teora de juegos diferencial. Para verlo, debemos pensar en
el dise~nador por un lado, y en el medio ambiente por otro, como si de dos jugadores
se trataran. El objetivo del dise~nador es elegir un controlador que estabilice al sistema y sea optimo con respecto a un criterio dado; mientras que el medio exterior
234
Planteamiento del problema general de control
tiene como objetivo el desbaratar o hacer fracasar la estrategia del dise~nador, por
medio de la eleccion de la perturbacion peor posible que actue sobre la planta a
controlar. As, se dene un ndice de comportamiento
J (K; w) =
Z1
0
(zT z 2wT w)dt
siendo K el regulador, w la perturbacion actuante sobre el sistema tal que w 2 H2
(ver apendice C.1), z una medida para evaluar el comportamiento en lazo cerrado
del sistema, y un parametro arbitrario. La solucion, si existe, dara un controlador
optimo K que estabiliza al sistema de control para la peor perturbacion w 2 H2
actuante sobre el sistema.
10.3 Planteamiento del problema general de control
En el captulo 8 se ha planteado la necesidad de que a la hora de dar las especicaciones de dise~no, se hagan de forma que se planteen unos requerimientos fsicamente
realizables. Determinadas exigencias de dise~no se pueden plantear como un problema de optimizacion en el dominio frecuencial, a traves del empleo de unas funciones (matrices) de ponderacion, que suponga una solucion de compromiso para el
conjunto de objetivos contrapuestos que aparecen en todo problema de control.
Considerese el diagrama de bloques de la gura 10.3, donde el conjunto de se~nales
actuantes sobre el sistema: r; di; do; n, quedan caracterizadas o ponderadas en frecuencia respectivamente por:
Wr (j!); Wdi (j!); Wdo (j!); Wn(j!)
En dicho diagrama ademas se incluyen las medidas ponderadas de las se~nales de
error (e), control (u) y se~nal a controlar (y), empleando respectivamente,
WS (j!); WU (j!); WT (j!)
El conjunto de funciones (matrices) de ponderacion junto con la planta y regulador puede transformarse en un diagrama de bloques equivalente mas compacto,
como el de la gura 10.4.
Controladores H1
235
?di
?do
Wdi
r-
e
Wr - mr
-6
u- ?
mt
K
Wdo
- ?m r y-
G
WT
z3
?m W n
n
? z2
WU -
? z
WS 1Figura 10.3: Ponderaciones en frecuencia de vectores de entrada y salida
r-
Wr
n-
Wn
do - W
-h
6
-h
6
e
r
?
- WS -z1
- WU -z2
do
-h 6
di - W
di
G
u
-
- ?h yr- WT -z3
P
e
K
Figura 10.4: Estructura general para problemas de control H1; H2.
236
Planteamiento del problema general de control
A partir del sistema dado en la gura 10.5, se plantea el siguiente problema de
dise~no: obtener un regulador ( K ) que minimice algun tipo de medida 1 de la
funcion (matriz) de transferencia Tzw ,
z = Tzw w
que relaciona el vector de salida z (vector de se~nales requeridas para caracterizar el
comportamiento del sistema en lazo cerrado),
z = [z1 z2 z3 ]T
z1 = WS e
con el vector de entrada w
z2 = WU u
z3 = WT y
w = [r n do di]T
A partir de las expresiones dadas en el captulo 8, que relacionan: e; u; y con
r; n; do; di, y del diagrama de bloques de la gura 10.4 se obtiene:
2 3 2
32 r 3
WS SoWr
WS SoWn
WS SoWdo
WS SoGWdi 6 n 7
64 zz12 75 = 64 W
KS
W
W
K
S
W
W
KS
W
WU Si Wdi 75 664 d 775
U
o r
U o o n
U
o do
o
WT To Wr
WT To Wn
WT SoWdo
WT So GWdi
z3
di
Si solo se considera r, con Wr = I y WU = 0, queda:
"
# "
#
z1 = WS So r
z3
WT To
de forma similar, si se considera unicamente do, queda:
"
# "
#
z1 = WS So d
z3
WT To o
y en estos casos, el problema de optimizacion es conocido como: problema de sensibilidad mixta (Green y Limebeer, 1995).
Se puede obtener una particion de la planta generalizada P de la siguiente forma
"
P = PP11 PP12
21
22
1
#
Las normas mas empleadas en control son las normas H2 , y H1 , ver apendice B.2
Controladores H1
237
wu
- P (s)
ze
K (s) Figura 10.5: Planta generalizada y regulador
donde se tiene que
z = P11w + P12u
e = P21w + P22u
u = Ke
(10.17)
y al sustituir queda:
z = [P11 + P12K (I P22 K ) 1P21 ]w
Por tanto, se tiene la funcion (matriz) de transferencia que relaciona z con w:
z = Tzw w
donde la funcion (matriz) de transferencia
Tzw = P11 + P12K (I P22 K ) 1P21
se conoce como transformacion lineal fraccionaria (lft)2. A partir de esta relacion
se plantea el problema estandar: encontrar un regulador K (que sea propio) que
minimice la norma H1 de la funcion (matriz) de transferencia que relaciona w con
z, bajo la restriccion de que K estabilice a P (en el sentido de que consiga un
sistema de control con estabilidad interna). A continuacion se dan dos ejemplos de
problemas de control tpicos, y como estos pueden transformarse en el problema de
control estandar de la gura 10.5.
10.3.1 Problema de seguimiento
En primer lugar se describe el problema de seguimiento de la se~nal de referencia.
Sea el sistema de la gura 10.6, en el que se presenta el problema de minimizar la
: Linear Fractional Transformation, en terminologa inglesa.
2 lft
238
Planteamiento del problema general de control
w- W
r - K1
-j u - G
6
y
-
K2 Figura 10.6: Planta generalizada para problema de seguimiento
siguiente funcion de costes:
(kr yk22 + kuk22)1=2
donde es un parametro de ajuste, que pondera la magnitud de control, de manera
que al disminuirlo aumenta el ancho de banda del sistema de control.
La equivalencia con el problema estandar se puede establecer a partir de las
siguientes relaciones:
" #
h
i
e = yr ; K = K1 K2
"
# "
#
r
y
Ww
Gu
z = u =
u
# " # " #
"
W w+ 0 u
=
e = Ww
G
0
Gu
que al identicar terminos con la expresion general de P (s) dada en la ecuacion
10.17 queda:
"
#
"
#
" #
" #
W
G
W
P11 = 0 ; P12 = ; P21 = 0 ; P22 = G0
10.3.2 Problema de estabilidad robusta
Otro problema tpico es el que plantea una estabilidad robusta del sistema de control.
Sea el sistema de la gura 10.7, para el que la incertidumbre en la planta esta
caracterizada de la forma:
G0 = G + G; kG(j!)k <j E (j!) j; 8!
Controladores H1
239
r-
j 6
y -
G
K Figura 10.7: Planta generalizada para problema de estabilidad robusta
Si se aplica el teorema de la peque~na ganancia, la condicion para que el sistema
sea estable para todo el conjunto de plantas es:
kEK (I + GK ) 1 k1 1
comparando esta condicion con la forma del problema estandar,
Tzw= = P11 + P12 K (I P22 K ) 1P21
e identicando terminos, queda que en este caso la planta generalizada es,
"
P = OI EIG
#
10.4 Parametrizacion de los controladores
En primer lugar se va a introducir el concepto de factorizacion coprima. Para el
caso de dos polinomios f (s); g(s), se dice que son coprimos entre s, si su maximo
comun divisor es 1. A su vez esto ocurre si existen sendos polinomios x(s); y(s) tales
que se verica la condicion de Bezout o ecuacion diofantica:
f (s)x(s) + g(s)y(s) = 1
Extendiendo este concepto a matrices F (s); G(s) 2 RH1 (ver apendice C), se
dice que son coprimas por la derecha, si tienen el mismo numero de columnas y
existen las matrices X (s); Y (s) 2 RH1 tales que:
"
#
F
[X Y ] G = XF + Y G = I
240
Parametrizacion de los controladores
lo que equivale a decir que la matriz [F G]T es invertible por la izquierda en RH1.
De forma similar se dene coprima por la izquierda: Las matrices F; G tienen el
mismo numero de las, y existen X; Y 2 RH1, tales que:
"
#
X
[F G] Y = FX + GY = I
se dice entonces que la matriz [F G] es invertible por la derecha en RH1.
Si G(s) es una matriz de transferencia propia, una factorizacion coprima por la
derecha de G es una factorizacion de la forma:
G(s) = N (s)M 1 (s)
donde N y M son matrices coprimas entre s en RH1. Igualmente, se obtiene la
factorizacion coprima por la izquierda:
G(s) = M^ 1 (s)N^ (s)
Se demuestra que para cada matriz de transferencia G(s) se cumple:
^
G = NM = M^ 1 N;
1
#
" ^
#"
X Y^ M Y = I
N X
N^ M^
lo que constituye una doble factorizacion coprima de G. A continuacion se dan
sendos algoritmos para obtener las factorizaciones coprimas anteriores.
Factorizacion coprima por la derecha.
1. Se tiene una realizacion en el espacio de estados de G:
G(s) (A; B; C; D); con: (A; B ) estabilizable y (C; A) detectable
2. Se calcula una matriz Kc que haga que A + BKc sea estable.
3. Se calculan las matrices
Ac = A + BKc; Cc = C + DKc
Controladores H1
241
4. Se obtienen la siguientes realizaciones de M; N :
M (s) [Ac; B; Kc; I ]; N (s) [Ac; B; Cc; D]
5. Finalmente,
G(s) = N (s)M 1 (s)
Factorizacion coprima por la izquierda.
1. Se tiene una realizacion en el espacio de estados de G:
G(s) (A; B; C; D); con: (A; B ) estabilizable y (C; A) detectable
2. Se calcula Ko tal que A + KoC sea estable.
3. Se calculan las matrices
Ao = A + Ko C; Bo = B + Ko D
^ N^ :
4. Se obtienen las siguientes realizaciones de M;
M^ (s) [Ao; Ko; C; I ]; N^ (s) [Ao ; Bo; C; D]
5. Finalmente,
G(s) = M^ 1 (s)N^ (s)
El resto de matrices de la doble factorizacion coprima de G estan dadas por:
X (s) [Ac; Ko ; Co; I ]; Y (s) [Ac; Ko ; Kc; O]
X^ (s) [Ao ; Bo; Kc; I ]; Y^ (s) [Ao; Ko ; Kc; O]
Dada la planta generalizada P del problema estandar, la cual se supone propia:
" ^
^ #" M Y #
X
Y
1
1
^
^
P = NM = M N;
N X =I
N^ M^
y un regulador K , cuya factorizacion coprima esta dada por
K = UV 1 = V^ 1 U^
242
Parametrizacion de los controladores
una forma de determinar si K estabiliza a la planta P es vericando si se cumple:
"
#
M U 2 RH
1
N V
o equivalentemente,
" ^ ^#
M U 2 RH
1
N^ V^
El conjunto de reguladores K que estabilizan a la planta P se pueden parametrizar
en funcion de una funcion (matriz) de transferencia Q 2 RH1, de la forma:
K = (Y MQ)(X NQ) 1 = (X^ QN^ ) 1(Y^ QM^ )
Para el caso especial, P 2 RH1, se tendra que:
N = N^ = P; X^ = M = I; X = M^ = I; Y = O; Y^ = O
y por tanto,
K = Q(I PQ) 1 = (I QP ) 1Q
Se puede demostrar (Francis 1987), que K estabiliza a P si y solo si K estabiliza
a P22 (siendo esta estrictamente propia). Por ello, a continuacion se emplea dicho
resultado. Si se realiza la doble factorizacion coprima de P22 ,
" ^
#"
#
^
X
Y
M
Y
2
2
2
2
1
1
P22 = N2 M2 = M^ 2 N^2 ;
N2 X2 = I
N^2 M^ 2
se tendra que el conjunto de reguladores que estabilizan a P22 vendra dado por:
K = (Y2 M2 Q)(X2 N2 Q) 1 = (X^2 QN^2 ) 1 (Y^2 QM^ 2 )
(10:18)
10.4.1 El problema de ajuste del modelo
Si se denen las siguientes funciones (matrices) de transferencia:
T1 = P11 + P12M2 Y^2P21 ; T2 = P12 M2; T3 = M^ 2 P21
se demuestra que T1; T2 ; T3 2 RH1, y para K dado por la expresion 10.18, la
funcion (matriz) de transferencia que relaciona z con w en el problema estandar
sera:
Tzw = T1 T2 QT3
Controladores H1
243
- T1
w
- T3
- Q
- T2
?j z6
Figura 10.8: Interpretacion del problema de ajuste del modelo (M-M).
y el objetivo de minimizar kTzw k1 corresponde a un problema de ajuste o aproximacion de modelos (M-M)3 .
En la gura 10.8 se hace una interpretacion del problema M-M, donde T1 es el
modelo a ajustar, T2 y T3 estan dados, o son conocidos, y Q 2 RH1 hay que
encontrarlo, de forma que se realice el mejor ajuste a partir de la minimizacion de
la norma H1 del error de ajuste:
kT1 T2 QT3 k1
Si se comparan las expresiones del problema estandar,
z = [P11 + P12K (I P22 K ) 1P21 ]w
y del ajuste del modelo (ver gura 10.8),
z = [T1 T2QT3 ]w
se tienen las siguientes equivalencias:
P11 = T1; P12 = T2 ; P22 = O; T3 = P21 ; K = Q
Por tanto, dado un problema de dise~no, lo primero sera transformarlo a la forma
del problema estandar, y a continuacion identicar las funciones (matrices) de transferencia T1 ; T2; T3 que corresponden al problema M-M. A continuacion se da el algoritmo cT1T2T3P para obtener T1 ; T2; T3 a partir del problema estandar:
1. Se obtiene una realizacion mnima de la planta generalizada.
P (s) (Ap; Bp; Cp; Dp)
3
Model Matching en terminologa inglesa (M-M).
244
Parametrizacion de los controladores
2. Segun las dimensiones de w; u; z; e se particiona en la forma
Bp = [B1 B2 ];
CpT
"
11 D12
= [C1 C2]; Dp = D
D21 D22
#
con D22 = 0, dado que P22 es estrictamente propia.
3. Se calculan T1; T2 ; T3:
T1(s) (A0; B 0 ; C 0; D11 ); T2 (s) (Ac; B2; C1 + D12 Kc; D12)
T3 (s) (Ao; B1 + Ko D21; C2; D21 )
con
Ac = Ap + B2Kc; Ao = Ap + KoC2; C 0 = [C1 + D12 Kc
"
#
"
#
A
B
K
B
c
2
c
1
0
0
A= O A
; B = B +K D
o
1
D12 Kc]
o 21
10.4.2 Aplicabilidad del teorema de Nehari
En esta seccion se presenta el teorema de Nehari, el cual juega un importante papel
en la solucion de los problemas H1. Como se vera a continuacion, este teorema
establece un resultado empleando para ello la norma de Hankel. La norma de Hankel
de un sistema F (s) (A; B; C; D) , la cual se representa mediante kF kH o tambien
por medio de k F k, se puede obtener a partir de los grammianos de controlabilidad
Wc y observabilidad Wo del sistema F (s). Para dicho calculo se siguen los siguientes
pasos:
1. Para calcular Wc se resuelve la ecuacion de Lyapunov,
AWc + WcAT = BB T
2. Con la siguiente ecuacion de Lyapunov se obtiene Wo.
AT Wo + WoA = C T C
3. Finalmente se calcula
q
k F k = j max (WcWo ) j
Controladores H1
245
El teorema de Nehari es de gran utilidad para resolver los problemas de optimizacion H1. Este teorema determina el grado de aproximacion entre dos funciones
o matrices de transferencia; donde una de ellas R 2 L1 (es propia y sin polos en
el eje imaginario), y la otra X 2 H1 (es propia y estable). Para una funcion o
matriz de transferencia R 2 L1 se dene la distancia en H1 como:
dist(R; H1) = inf fkR X k1 : X 2 H1; R 2 L1g
En terminos de sistemas, se trata de aproximar un sistema inestable R(s) por
otro estable X (s). El teorema de Nehari establece que existe una matriz de
transferencia X 2 H1, para una matriz de transferencia dada R 2 L1 , que satisface:
kR X k1 = k Rk
Se deriva que si para una R 2 RL1 dada, se obtiene una factorizacion de la
forma,
R(s) = R1 (s) + R2(s)
donde R1 es estrictamente propia y analtica en Re s 0, y R2 es propia y analtica
en Re s 0, entonces se cumple que,
R
=
R1
O sea, se hace una expansion en fracciones parciales donde R1 contiene la parte
inestable y R2 la parte estable de R; y posteriormente se emplea R1 para calcular,
dist(R; H1) = k Rk = k
As por ejemplo, si se tiene,
R1 k
2
1
4
66 s2 1
R(s) = 4
1
s+1
2
s s+1 s 1
3
77
5
y se realiza una expansion en fracciones parciales, quedan:
3
2 0:5
2 0:5 3
0 7
66 s 1
4
R1 (s) = 4
1
2 75 ; R2(s) = 4 s +0 1 1 5
s2 s + 1 s 1
246
Soluciones al problema de ajuste del modelo
Una realizacion de R1(s) (A; B; C; D) es:
22 2 1 03
21 03
"
66 1 0 0 0 77
66 0 0 77
A = 64 0 1 0 0 75 ; B = 64 0 0 75 ; C = 00:5
0 0 0 1
0 2
0:5 0:5 0
1
1 1
#
Para obtener los grammianos, Wc y Wo; de R1 se resuelven las ecuaciones de
Lyapunov correspondientes, obteniendose nalmente que
dist(R; H1) = k Rk = k
R1 k1
q
= j max (WcWo) j = 1:2695
Hasta ahora, se ha obtenido la aproximacion alcanzable, por el teorema de Nehari, pero no se ha tratado el problema de calcular X .
10.5 Soluciones al problema de ajuste del modelo
En este apartado se tratan las soluciones al problema de encontrar una Q 2 RH1
que minimice el error de ajuste kT1 T2 QT3 k1 para unas T1 ; T2; T3 jadas. O sea,
se aborda el problema de encontrar:
= inf fkT1 T2QT3 k1 : Q 2 RH1g
10.5.1 El problema escalar
Se considera a continuacion el planteamiento realizado para el caso escalar; para el
que s es conmutativo el producto de funciones de transferencia, por lo que se puede
poner T1 T2 T3 Q, y por tanto, sin perdida de generalidad, basta con considerar el
caso T3 = 1 (pues en otro caso se llama al producto T2 T3 como T2 ):
inf fkT1 T2 Qk1g
El caso trivial corresponde a la solucion Q = T1=T2 , solo valida si T1 es estable,
y T2 es de fase mnima. Si T2 tiene un unico cero inestable z1 , la solucion tambien
Controladores H1
247
es sencilla, obteniendose en ese caso:
Q(s) = T1 (s)T (sT)1 (z1 ) ; kT1 T2 Qk1 =j T1 (z1 ) j
2
Una funcion de transferencia T (s) 2 RH1, se dice que es interior (inner) si
T ( s)T (s) = 1
Por ejemplo,
1;
1 s 1 s + s2
s + 1 ; 1 + s + s2
son funciones de transferencia interiores. Los ceros de una funcion de transferencia
interior caen todos dentro del semiplano complejo de la derecha, Re s > 0, de ah
que se le de el adjetivo de interior. Se dice que una funcion de transferencia es
exterior (outer) si no tiene ceros en Re s > 0 (o sea que quedan en el exterior de
dicho semiplano complejo de la derecha). Desde el punto de vista de sistemas, una
funcion de transferencia interior es un sistema estable de fase no mnima y pasa-todo
con ganancia unidad; y una exterior es estable y de fase mnima.
Toda funcion (matriz) de transferencia T 2 RH1 tiene una factorizacion
T = TiTo
siendo Ti interior y To exterior. Para obtenerlas se pueden emplear por ejemplo
las funciones\iofr.m y iofc.m" para Matlab de Robust Control Toolbox (Chiang y
Safonov, 1992), o las funciones\inner y outer" del Program CC (Thompson, 1988).
Para resolver el caso general, se transforma el problema de la siguiente forma:
kT1 T2Qk1 = kR X k1
con
R = T2i 1T1 2 RL1 ; X = T2o Q 2 RH1
donde se ha obtenido la factorizacion T2 = T2i T2o , siendo T2i una funcion de transferencia interior y T2o una exterior (conviene tener en cuenta que T2i fsicamente
equivale a un ltro pasa-todo de ganancia unidad).
Aplicando el teorema de Nehari, se obtiene que,
= inf fkR X k1 : R 2 RL1; X 2 RH1g = k Rk
248
Soluciones al problema de ajuste del modelo
A continuacion se da un algoritmo (alfaQ) para calcular y el optimo Q(s),
para el caso escalar:
kT1 T2 Qk1; con: T2
T2T3 ; o tambien si: T3 = 1
1. Realizar la factorizacion interior-exterior de T2,
T2 = T2i T2o
2. Calcular,
R = T2i 1T1
se obtiene una realizacion mnima,
R(s) (A; B; C; D)
3. Se resuelven las ecuaciones de Lyapunov,
AWc + WcAT = BB T
AT Wo + WoA = C T C
4. Se obtiene el valor propio maximo, del producto de grammianos WcWo , y su
correspondiente vector propio v.
5. Calcular,
f (s) (A; v; C; 0); g(s) = ( AT ; 1Wov; B T ; 0); X = R f=g
6. Se obtienen,
=j j; Q = T2o1X
Una vez calculado Q, se puede obtener el regulador optimo K a partir de la
ecuacion 10.18.
10.5.2 Optimizacion del comportamiento nominal
A n de ver la aplicabilidad de los resultados y metodos anteriores se plantea el
problema de conseguir una especicacion de comportamiento nominal (np) dada.
Controladores H1
249
w-
j
6
z
- G
K
-
Figura 10.9: Problema de comportamiento nominal.
Sea el sistema de la gura 10.9, en la que se emplea una nomenclatura para las
se~nales de acuerdo con la empleada en el problema estandar. As, se tiene que,
z = Sw; S = =1 1 + GK
Se plantea el problema de conseguir un seguimiento adecuado, al menos en el
rango de frecuencias [0; !1]. Para ello se propone la siguiente especicacion:
j S (j!) j< ; 8 ! 2 [0; !1]
as por ejemplo, con = 0:01 se requiere un error de seguimiento inferior al 1%
en dicho rango de frecuencias. Esto mismo se puede realizar de forma aproximada
empleando una funcion de ponderacion W y la condicion
kWS k1 < (10:19)
Una posible eleccion para W es la siguiente:
1
W (s) = (0:01w11 s + 1)k
(0:1w1 s + 1)
k
Teniendo en cuenta la forma general del problema estandar, se tiene que P22 =
G, ya que:
z = w y = Gu
e = w Gu
u = Ke
y por tanto,
"
#
1
G
P= 1 G
250
Soluciones al problema de ajuste del modelo
Si se realiza una factorizacion coprima de P22 ,
P22 = N=M; MX NY = 1
los reguladores que estabilizan al sistema vendran dados por,
K = YX MQ
NQ ; Q 2 RH1
al sustituir en S se obtiene,
S = MX MNQ
con lo que el problema de comportamiento nominal 10.19 equivale a
kT1 T2Qk1 < con: T1 = WMX; T2 = WMN . Se tratara de obtener un valor de = inf fkT1 T2Qk1 : Q 2 RH1
tal que < , dependiendo el valor de del exponente k de W (s); por lo que se
indicara por k .
Algoritmo (KNP)
A continuacion se da un para resolver este problema de np.
1. Realizar la factorizacion coprima de G:
G = N=M; MX NY = 1
2. Se dene la funcion de ponderacion,
1 s + 1)k
(0
:
01
w
1
W (s) =
(0:1w1 1s + 1)k
se toma inicialmente el valor k = 1.
3. Se obtiene
T1 = WMX; T2 = WMN; V (s) = (s + 1)l
donde el exponente l es el grado relativo de G.
Controladores H1
4. Se sustituye T2
k ,
251
T2V , y por medio del algoritmo alfaQ, ya descrito, calcula
k = minfkT1 T2 Q1k1 : Q1 2 RH1
Si k , se incrementa k en uno, y se vuelve al paso 3. En otro caso,
continuar.
5. Por medio del algoritmo alfaQ, calcular Q1 2 RH1, tal que,
k = kT1 T2Q1 k1
6. Se calcula nalmente el regulador,
a
K = YX MQ
NQa
con Qa(s) = V (s)Q1 (s)=(0:1w1 1s + 1)l.
Ejemplo:
Con el siguiente ejemplo, se ilustra el procedimiento anterior para una planta de
fase no mnima
s 2)
G(s) = (s (+s 1)(1)(
s2 + s + 1)
Para las especicaciones de comportamiento nominal se emplean w1 = 0:01; =
0:1 ( 20 db). Por tanto, se desea conseguir un error de seguimiento inferior al 10%
para se~nales de referencia con ancho de banda inferior a 0:01 rad/s.
1. Como la planta es estable, se toman:
N = G; M = 1; X = 1; Y = 1
2. Se elige
3. Se calculan
s + 1 k
W (s) = 10s + 1
s + 1 k
T1(s) = 10s + 1 ; V (s) = s + 1
k
s 2)
T2 (s) = 10ss++11 (s (+s 1)(1)(
s2 + s + 1)
252
Soluciones al problema de ajuste del modelo
4. Se obtienen: 1 = 0:2299; 2 = 0:0511, y por tanto 2 < ; k = 2.
5. Se calcula
0:3613)(s2 + s + 1)
Q1(s) = 6:114 (s +
(s + 4:656)(s + 1)2
6. Y nalmente
:3613)(s2 + s + 1)
Qa (s) = 6:114 (s(s++4:0656)(
s + 1)(10s + 1)
(s + 0:3613)(s + 1)(s2 + s + 1)
K (s) = 0:6114 (s + 0:004698)(
s + 0:5280)(s2 + 5:612s + 9:599)
En la gura 10.10 pueden verse las magnitudes de las funciones de sensibilidad
j S (j!) j y sensibilidad complementaria j T (j!) j obtenidas; la respuesta temporal
para consigna escalon unidad se tiene en la gura 10.11, puede comprobarse el
comportamiento de fase no mnima que presenta el sistema.
5
0
Sensibilidad
-5
magnitud (dB)
-10
-15
-20
-25
-30
Sensibilidad complementaria
-35
-40
-45
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
rad/s
Figura 10.10: Magnitudes de j S (j!) j; j T (j!) j, problema de np
Controladores H1
253
1
respuesta lazo cerrado
0.8
0.6
0.4
0.2
0
-0.2
0
10
20
30
40
50
60
70
80
segundos
Figura 10.11: Respuesta temporal a escalon unidad, problema de np
10.6 Problemas de control
de estados
2
1
H ;H
en el espacio
En la primera parte de este captulo se ha presentado una forma de resolver el problema de control H1 para el caso de sistemas de una entrada y una salida (planta escalar), el cual sigue el tratamiento original realizado por Francis (1987). Igualmente,
siguiendo un procedimiento similar, aunque bastante mas elaborado y complejo, es
posible obtener los correspondientes algoritmos para resolver el problema multivariable. Si bien, para ello resulta mas ventajoso emplear el tratamiento en el espacio
de estados que se presenta a continuacion; el cual es general y valido independientemente del caracter escalar o vectorial de la planta a controlar, consituyendo un
metodo mas compacto.
A pesar de ello, se ha comenzado este captulo con el procedimiento entradasalida descrito en los apartados anteriores; a n de presentar los orgenes del problema, as como el planteamiento seguido para su resolucion. Se trata con ello que
el lector se situe ante el problema de control H1 con una perspectiva que va desde
su enfoque clasico al planteamiento actual.
Problemas de control H2; H1 en el espacio de estados
254
Los algoritmos desarrollados en el espacio de estado se caracterizan en general por
estar basados en la solucion de dos ecuaciones algebraicas de Riccati desacopladas,
partiendo de las matrices de estado de la planta ampliada o generalizada. A partir
del trabajo de Doyle et al.(1989) se inicia la etapa actual del desarrollo de algoritmos
para la resolucion de los problemas de control H1.
Considerese una realizacion en el espacio de estados de la planta ampliada P (s)
(ver gura 10.5) expresada como:
x_p = Apxp + B1 w + B2u
z = C1 x + D11 w + D12u
e = C2 x + D21 w + D22u
(10.20)
o en forma abreviada como,
P (s) (Ap; Bp; Cp; Dp)
con,
Bp = [B1 B2 ] ; CpT = [C1 C2]
"
#
D
D
11
12
Dp = D D
21
22
De forma general, el problema de dise~no se puede expresar de la siguiente forma:
dado el sistema de la gura 10.5, se tratara de encontrar un regulador K (s) 4 ,
asintoticamente estable que haga al sistema en lazo cerrado Tzw internamente estable
y que minimice la norma H2 (problema H2) o la norma H1 (problema H1) de Tzw .
En el tratamiento que hacen Doyle et al.(1989) de ambos problemas (H2; H1),
en el espacio de estados se tienen en cuenta algunas suposiciones, que sirven para
simplicar la formulacion, y van a constituir las hipotesis de trabajo del problema
de control optimo H1 que a continuacion se desarrolla.
Las condiciones supuestas para las matrices de estado de la planta ampliada P (s)
son las siguientes:
1. Los pares (Ap; B1) y (Ap; B2 ) son estabilizables.
2. Los pares (C1; Ap) y (C2 ; Ap) son detectables.
Los controladores racionales propios, detectables y estabilizables que dotan al sistema en lazo
cerrado de estabilidad interna son denominados controladores admisibles.
4
Controladores H1
255
3. D12T C1 = 0 y D12T D12 = I
4. B1D21T = 0 y D21D21T = I
5. D11 = 0 y D22 = 0
Las suposiciones (1) y (2) garantizan la existencia de la solucion de las ecuaciones
de Riccati de control y del observador. La suposicion (3) implica la ortogonalidad
entre C1 x y D12 u, lo cual en la formulacion de un problema lqg implica que la
funcion de costes no tendra ponderacion cruzada entre el estado x y la entrada
de control u, a la vez que la matriz de ponderacion del vector de control sera la
matriz unidad. La (4) equivale a la (3) para las matrices de covarianza de los ruidos
actuantes sobre el proceso y sobre la medida (ruido en sensores). La suposicion
(5) se hace para simplicar la formulacion, y no supone perdida de generalidad, ya
que un problema determinado puede transformarse en uno equivalente que satisfaga
tales requerimientos (Green y Limebeer, 1995, Safonov et al.1989).
10.6.1 Controlador optimo H2
Como se ha descrito en el apartado anterior, una forma de expresar algunas de las
especicaciones de dise~no es mediante la minimizacion de la norma H2 de la funcion
(matriz) de transferencia Tzw . O expresado en terminos de se~nales: se trata de
encontrar un controlador K (s) asintoticamente estable que estabilice al sistema en
lazo cerrado y que minimice la norma H2 de la se~nal de respuesta del sistema a una
se~nal de entrada caracterizada por ser ruido blanco con intensidad unidad. Esto
expresado en forma analtica supone la minimizacion de la funcion de coste:
Z1
T ( j! )T (j! )]d! = kT k2
JH2 = 21 traza[Tzw
(10:21)
zw
zw 2
0
Una forma de calcular la norma H2 es mediante:
kTzw k22 = traza(CT WcCTT ) = traza(BTT WoBT )
(10:22)
donde las matrices (AT ; BT ; CT ; DT ) determinan una realizacion en el espacio de
estados del sistema Tzw ; y las matrices Wc y Wo son sus respectivos grammianos
de controlabilidad y observabilidad. Estos se pueden obtener resolviendo las correspondientes ecuaciones de Lyapunov:
AT Wc + WcATT + BT BTT = 0
Problemas de control H2; H1 en el espacio de estados
256
ATT Wo + WoAT + CTT CT = 0
El controlador optimo K (s) que minimiza kTzw k2 se calcula resolviendo el par
de ecuaciones algebraicas de Riccati independientes:
ATp X2 + X2 Ap X2 B2B2T X2 C1T C1 = 0
(10:23)
ApY2 + Y2ATp Y2C2T C2Y2 B1 B1T = 0
(10:24)
que teniendo en cuenta la denicion del operador de Riccati (ver apendice C.2)
puede ponerse de forma equivalente como:
X2 = Ric(HX 2)
Y2 = Ric(HY 2 )
siendo las matrices Hamiltonianas asociadas:
"
T #
A
B
B
p
2
2
HX 2 = C T C
ATp
1 1
HY 2 =
"
ATp
B1 B1T
C2T C2T
Ap
#
A partir de las soluciones X2; Y2 respectivas de 10.23 y 10.24 se tiene el compensador optimo:
K (s) = Kc(sI Ap + B2Kc + KoC2) 1 Ko
(10:25)
donde:
Kc = B2T X2 ; Ko = Y2C2T
son las matrices de realimentacion de estados y de ganancia del observador, en la
estructura convencional del controlador lqg.
El mnimo de JH2 se obtiene de :
min kTzw k22 = kGcB1k22 + kKcGok22 = kGcKo k22 + kC1Gok22
con:
Gc(s) = (C1 + D12 Kc)(sI Ap B2Kc) 1
Go(s) = (sI Ap KoC2 ) 1(B1 + Ko D21)
(10:26)
Controladores H1
257
10.6.2 Relacion entre LQG/LTR y H2
Los problemas de dise~nos lqg/ltr-i y lqg/ltr-o pueden interpretarse como dos
casos particulares del problema de optimizacion H2 de sensibilidad mixta (Stein et
al. 1987). A continuacion de pone de maniesto dicha correspondencia.
Considerese la planta a controlar G(s) representada por las ecuaciones de estado
x_ = Ax + Bu + v1
y = Cx + Iv2
z = Mx
donde: G(s) = C (s)B; (s) = (sI A) 1 y los ruidos sobre el proceso
(v1) y sobre los sensores (v2) se consideran ruidos gausianos con intensidad unidad
e incorrelados entre s. Un regulador optimo lqg minimiza la funcion de coste
)
( ZT
1
T
2
T
(10:27)
JLQG = E T (z z + u u)dt
0
Teniendo en cuenta que se tienen las siguientes relaciones
"
# "
# 2 u(s) 3
y(s) = G(s) C (s) I 64 v (s) 75
1
z(s)
M (s)B M (s) 0
v (s)
2
u(s) = K (s)y(s)
" #
" #
z = T v1
zw v
u
2
"
#
T
T
11
12
Tzw = T T
21 22
se obtiene:
donde,
con,
T11
T12
T21
T22
(10:28)
= M (s) M (s)K (s)[I + G(s)K (s)] 1C (s)
= M (s)BK (s)[I + G(s)K (s)] 1
= K (s)[I + G(s)K (s)] 1C (s)
= K (s)[IG(s)K (s)] 1
Sustituyendo la ecuacion 10.28 en la 10.27 y teniendo en cuenta el teorema de
Parseval (Stein y Athans, 1987) se obtiene que la funcion de coste dada en 10.27 se
Problemas de control H2; H1 en el espacio de estados
258
puede expresar en el dominio de la frecuencia como
1 Z1
H ]d!
JLQG = 2 tr [Tzw Tzw
0
Lo cual establece la relacion entre los problemas de optimizacion H2 y lqg. A
continuacion se avanza mas en dicha relacion, estableciendose las condiciones bajo
las cuales el problema de dise~no lqg/ltr se puede transformar en un problema de
control optimo H2 de sensibilidad mixta.
Caso lqg/ltr-i. Si se consideran las siguientes condiciones:
W (s) = M (s)B (1=)
= B
0
queda:
Tzw (s)
"
# "
#
W (s)[I + K (s)G(s)] 1 0 = W (s)Si(s) 0
[I + K (s)G(s)]1K (s)G(s) 0
Ti (s) 0
A partir de lo cual se concluye que el problema lqg/ltr-i equivale a un
problema de sensibilidad mixta H2 .
Caso lqg/ltr-o. Si se consideran las siguentes condiciones:
W (s) = C (s) (1=)
M = C
0
queda:
T (s)
Tzw
"
#
"
[I + G(s)K (s)] 1W (s) 0 = So(s)W (s) 0
G(s)K (s)[I + G(s)K (s)]1 0
To (s) 0
#
Y por tanto, al igual que para el caso anterior, tambien se obtiene que el
problema lqg/ltr-o equivale a un problema de sensibilidad mixta H2 .
Controladores H1
259
10.6.3 Controlador H1
En un determinado problema de control, puede que se este interesado en minimizar
el maximo alcanzable por la respuesta frecuencial de Tzw , en vez de minimizar algun
tipo de promedio, como se hace en la optimizacion H2 . En ese caso, se plantea un
problema de optimizacion H1, en el que se trata de obtener el mnimo de:
kTzw k1 = sup
(Tzw )
!
(10:29)
Para contrastar los problemas H1 y H2 , considerese el caso monovariable (escalar) en el que se tenga:
kTzw k1 esto equivale a que para una se~nal w con kwkrms 1, el sistema dara una respuesta
z = Tzw w tal que kTzw wkrms ; mientras que si:
kTzuk2 ello equivale a que para una se~nal particular w de ruido blanco de intensidad unidad,
el sistema dara una respuesta z = Tzw w con kTzw wkrms . Por lo tanto un
problema de minimizacion H1 es mas general que uno H2, al abarcar el primero la
posibilidad de una gama mas amplia de se~nales de entrada.
Otra distincion la supone el hecho de que H2 minimiza el valor cuadratico medio
de la magnitud sobre todas las frecuencias, no haciendo alusion directa alguna a
la existencia de posibles picos de peque~na anchura (resonancias pronunciadas pero
muy estrechas), pues su efecto sobre el calculo del promedio sera poco apreciable.
Sin embargo, la optimizacion H1 es el maximo de esos posibles picos el que tiene
en cuenta (Stoorvogel, 1992).
Para remarcar el aspecto distintivo entre los reguladores H2 y H1, a continuacion
se va a utilizar el problema de sensibilidad mixta anteriormente denido. Como se
describe en el captulo 8, a partir de la relacion:
(WS So ) 1
se especica un comportamiento nominal deseado (np) y con:
(WT To) 1
Problemas de control H2; H1 en el espacio de estados
260
se especica una robustez de la estabilidad (rs) del sistema de control frente a
incertidumbres multiplicativas situadas a la salida de la planta. 5
Una forma de que se veriquen simultaneamente las desigualdades anteriores es
haciendo que se cumpla:
WS So
kTzw k1 = W
T To
1
1
(10:30)
El regulador optimo H1 minimizara dicho valor, mientras que el regulador
optimo H2 minimizara la norma kTzw k2 ; por lo que el primero trata directamente
con el problema de maximizar la robustez del sistema de control, y de ah su atractivo
y utilidad en los problemas de control robusto.
El calculo de la norma H1 se puede hacer directamente a partir de su denicion
(10.29), o de forma indirecta. As, si se tiene una realizacion de Tzw dada por las
matrices (AT ; BT ; CT ; DT ), se dene la matriz Hamiltoniana asociada H como:
H=
"
AT BT BTT = 2
CTT CT
ATT
#
y se establecen las siguientes equivalencias (Doyle et al. 1989):
1. Tzw cumple:
kTzw k1 < (10:31)
2. H no tiene autovalores en el eje imaginario.
3. H 2 dom (Ric) (ver apendice C.2)
4. H 2 dom (Ric) y Ric(Tzw ) > 0 si (C; A) es observable.
Teniendo en cuenta (1) y (2) se puede derivar un metodo para calcular kTzw k1:
1. Se selecciona un escalar > 0.
2. Se forma la matriz H y se testea si tiene autovalores en el eje imaginario.
3. Se aumenta o disminuye de acuerdo con el resultado del paso 2.
5
En ese caso el sistema de interconexion coincide con la funcion de sensibilidad complementaria:
M (s) = To (s) (ver captulo 8).
Controladores H1
261
4. Se repite el proceso, iterando con hasta encontrar un valor crtico o que con
cierta precision cumpla la condicion del paso 2, en ese caso se consigue una
cota ajustada kTzw k1 < o.
Para encontrar un controlador asintoticamente estable K (s), que consiga kTzw k1 <
, se resuelven el par de ecuaciones algebraicas de Riccati siguientes (Doyle et al,
1989):
ATp X1 + X1Ap X1[(1= 2)B1B1T B2 B2T ]X1 + C1T C1 = 0
(10:32)
ApY1 + Y1ATp Y1[(1= )2C1T C1 C2T C2]Y1 + B1 B1T = 0
(10:33)
o teniendo en cuenta la denicion del operador de Riccati (ver apendice C.2):
X1 = Ric(HX 1)
Y1 = Ric(HY 1)
con las matrices Hamiltonianas asociadas:
"
2 )B B T B B T #
A
(1
=
p
1 1
2 2
HX 1 = C T C
ATp
1 1
HY 1 =
"
ATp (1= 2)C1T C1 C2T C2
B1 C1T
Ap
#
El controlador resultante es:
K (s) = Kc[sI Ap (1= 2)B1B1T X1 B2Kc ZKoC2] 1 Ko
(10:34)
donde:
Kc = B2T X1; Ko = Y1C2T ; Z = [I (1= 2)Y1X1] 1; K1 = B1 B1T X1(1= 2)
El compensador 10.34 consigue kTzw k1 < , sin embargo la solucion no sera valida
(es decir: el sistema en lazo cerrado no sera asintoticamente estable) a menos que
se cumplan las condiciones siguientes:
X1 0
Y1 0
j max (X1Y1) j < 2
(10.35)
262
Problemas de control H2; H1 en el espacio de estados
Aunque no sea tan evidente como en el caso H2 , el controlador H1 tiene una
estructura constituida por una realimentacion de estados y un observador (ver gura
10.12). La dinamica del compensador queda descrita por el conjunto de ecuaciones:
x^_ = Apx^ + B2 u + ZKo (^y y) + B1w^
y^ = C2x^
u = Kcx^
(10.36)
2
T
w^ = (1= )B1 X1x^
donde Kc representa la matriz de realimentacion de estados, ZKo la matriz de
ganancia del observador y w^ supone un estimado de la peor perturbacion que pudiera
darse sobre el sistema, en el sentido de que maximizara la magnitud (Doyle et al,
1989):
kzk22 2kwk22
El calculo para obtener la solucion de un problema de optimizacion H1 requiere
un proceso iterativo, iniciandose con un valor inicial para el parametro , probando
si se cumplen todas las condiciones necesarias (10.31,10.35) y modicandolo hasta
encontrar una solucion adecuada. El proceso de busqueda puede terminar con el
valor mnimo min, o en una solucion suboptima (o > min).
10.6.4 Algoritmo de calculo del regulador H1
A la hora de aplicar el algoritmo de calculo del regulador H1 anteriormente descrito,
pueden aparecer algunos problemas numericos que diculten o hagan imposible su
resolucion. Por ello, se han desarrollado, y aun se siguen desarrollando en la actualidad, diferentes algoritmos de calculo que tratan de mejorar y facilitar la resolucion
numerica de las ecuaciones. En la bibiliografa especializada pueden encontrarse
diferentes opciones para dicho calculo (Green y Limebeer, 1995). A continuacion se
da un algoritmo alternativo al descrito anteriormente, que mejora las propiedades
numericas para el calculo del controlador H1.
La ley de control se obtiene de
u = Kcx^
y el estimador del estado se calcula a partir de las ecuaciones
x^_ = Apx^ + B2 u + B1w^ + Z1Ko (y y^)
Controladores H1
263
B2 r
? x^
- ZK -
-
(
s
)
Kc
p
o
6
6
6
-
u
- G(s)
y
-
K1 C2 Figura 10.12: Estructura del controlador H1
w^ = B1T X1x^(1= 2)
y^ = C2 x^ + D21 B1T X1x^(1= 2)
Las matrices Kc; Ko; Z1 se obtienen respectivamente de,
Kc = D120 (B2T X1 + D12T C1 );
D120 = (D12T D12 )
1
Ko = (Y1C2T + B1 D21T )D210 ; D210 = (D21 D21T )
Z1 = (I 2 Y1X1) 1
1
Las matrices X1; Y1 son soluciones de las correspondientes ecuaciones de Riccati, o de forma equivalente (ver apendice C.2):
"
donde,
0 DT C1 2 B1 B T B2 D0 B T #
A
B
D
p
2
12
12
1
12 2
X1 = Ric
C10T C10
(Ap B2 D120 D12T C1 )T
"
T D0 C2 )T 2 C T C1 C T D0 C2 #
(
A
B
D
p
1
21 21
1
2 21
Y1 = Ric
B10 D10T
(Ap B1 D21T D210 C2)
C10 = (I D12 D120 D12T )C1; B10 = B1(I D21T D210 D21 )
Problemas de control H2; H1 en el espacio de estados
264
Finalmente, se dan las matrices del regulador K ,
K (s) [Ar ; Br ; Cr ; Dr ]
con,
Ar = Ap B2Kc Z1Ko C2 + 2(B1 B1T Z1Ko D21B1T )X1
Br = Z1Ko; Cr = Kc; Dr = 0
as como la realizacion de Tzw :
" # "
#" # "
#
x_ =
Ap
B2 Kc x +
B1
Z1Ko C2 T22
x^
Z1KoD21 w
x^_
" # "
# "
#
z = C1 D12 Kc + 0 w
y
C2
0
D21
donde se tiene que,
T22 = Ap B2Kc + 2B1 B1T X1 Z1Ko(C2 + 2 D21 B1T X1)
10.6.5 Ejemplos ilustrativos
Ejemplo: Dise~no H1 de sistema doble integrador
Sea el sistema compuesto por la planta nominal a controlar (gura 10.13),
G(s) = s12 = uy((ss))
la perturbacion d, y el ruido de medida n actuantes sobre el sistema, cuyo conjunto
queda descrito por las ecuaciones siguientes:
x_ 1 = d + u
x_ 2 = x1
y = x2 + n
Se desea dise~nar un regulador H1 que consiga atenuar el efecto de d y n sobre el
sistema, a la vez que la se~nal de control no tome valores excesivos a n de evitar en lo
posible la saturacion de los actuadores. Para lo cual, se incluira la se~nal de control,
junto con la propia variable de estado x2 , en las variables empleadas para evaluar
Controladores H1
265
d
?
-
u
- 1
s
x1 - 1
s
x2
-
?
y n
Figura 10.13: Diagrama de bloques
w
-
6
- 1
s
s x2- ?
x1 - 1
s
s
u
K (s)
y
Figura 10.14: Diagrama de bloques para H1
-
z
Problemas de control H2; H1 en el espacio de estados
266
el comportamiento del sistema en lazo cerrado; o sea, como elementos de z. Por lo
que los respectivos vectores w; z implicados en los desarrollos teoricos comentados
anteriormente (gura 10.14), son en este caso:
" #
" #
d
w = n ; z = xu2
Para la eleccion realizada, queda que las matrices que componen la realizacion
de la planta generalizada son de la forma:
2
66 01
6
P (s) = 66 0
64 0
0
0
1
0
0 1
O sea,
Ap =
B1 =
C1 =
D11 =
D21 =
"
"
"
"
h
0 0
1 0
1
0
0
0
0
0
0
0
0
1
1
0
0
1
0
3
77
77
77
5
#
#
1 0 ;
0 0
#
0 1 ;
0 0
#
0 0 ;
0 0
i
0 1 ;
2 3
1
6
B2 = 4 75
0
h
i
C2 = 0 1
" #
D12 = 01
h i
D22 = 0
Siguiento los pasos dados en este apartado, y tras un proceso iterativo de busqueda
para el valor de , se obtiene que el algoritmo da una solucion factible para = 2:62,
el cual esta proximo pero no coincide con el valor optimo. Para obtener el optimo
se pueden emplear algoritmos mas sosticados; tales y como se dan en el Robust
Control Toolbox (funcion\hinfsyn"), o en el -Synthesis Toolbox (funcion\hinfopt"),
para Matlab. Para = 2:62 se obtiene el siguiente regulador H1:
Controladores H1
267
:3(s + 0:39)
K (s) = (s +578
2:33)(s + 220:72)
que equivale basicamente a un compensador de adelanto con un polo situado a alta
frecuencia, incluido para mejorar la robustez del sistema. Para este regulador se
obtienen: un margen de fase de 44.6 grados, un margen de ganancia de 44.3 db, y
un porcentaje de incertidumbre multiplicativa tolerable (1/max(T )) del 70%.
Para analizar el comportamiento del controlador dise~nado frente a la dinamica
inmodelada, se considera que la planta real viene dada por
G0 = G(1 + Em)
con,
s + 0:6667)
Em (s) = s( 0:s30556
2 + s + 100
80
Tolerancia e incertidumbre (dB)
60
40
Tolerancia
20
0
-20
-40
Incertidumbre multiplicativa
-60
-80
10 -1
10 0
10 1
10 2
rad/s
Figura 10.15: Incertidumbre tolerable e incertidumbre existente
En la gura 10.15 se muestran el nivel de tolerancia a incertidumbre multiplicativa del sistema de control, as como la magnitud de Em (j!). La respuesta temporal
Problemas de control H2; H1 en el espacio de estados
268
1.4
1.2
respuesta
1
0.8
0.6
0.4
0.2
0
0
2
4
6
8
10
12
14
tiempo (seg)
Figura 10.16: Comportamientos con planta nominal y planta real
puede verse en la gura 10.16, en la que se muestra el comportamiento para el modelo nominal de la planta G, y para el modelo real G0. Como puede verse, en este
caso el efecto de la dinamica inmodelada es muy poco apreciable, cosa que pone
de maniesto la robustez del comportamiento del sistema de control, al menos para
este tipo de incertidumbre.
Ejemplo: Dise~no de controladores H2; H1 de tiempo discreto
En este ejemplo se plantea el problema de controlar una planta, cuyo modelo
matematico es de tiempo continuo G(s), por medio de un regulador de tiempo
discreto K (z), empleando un perodo de muestreo de Tm = 0:01 segundos. En la
gura 10.17 se muestra el diagrama de bloques del sistema de control.
El procedimiento de dise~no empleado sigue los pasos siguientes:
1. Se obtiene un modelo discreto de la planta G(z), empleando para ello la aproximacion del mantenedor de orden cero (ZOH).
Controladores H1
r -i
6 Tm
269
K (z)
Tm
ZHO
G(s)
y -
Figura 10.17: Controlador H1 de tiempo discreto
2. Se realiza la transformacion bilineal inversa, obteniendose un sistema continuo
en el plano-w G(w).
3. Se dise~na el controlador H2; H1, obteniendo K (w)
4. Se emplea la transformacion bilineal para obtener el regulador equivalente de
tiempo discreto K (z).
En forma sintetica, dicho proceso de dise~no consiste en:
1
G(s) ZOH
! G(z) bilin! G(w) H2;H!1 K (w) bilin
! K (z )
donde el operador bilin empleado realiza una trasformacion del plano w al plano z
consistente en:
w = T2(z(z +1)1)
m
La transformacion inversa bilin 1 se emplea para dise~nar un regulador de tiempo
discreto con tecnicas de tiempo continuo en el plano-w.
La funcion de transferencia de la planta a controlar es,
G(s) = s3 + 30s2 +900
700s + 1000
En la gura 10.18 pueden verse las respuestas en frecuencia de G(s) y G(w) para
un perodo de muestreo de Tm = 0:01 seg:
Las especicaciones de dise~no para el sistema de control son:
Problemas de control H2; H1 en el espacio de estados
270
50
0
|G(w)|
|G(s)|, |G(w)| (db)
-50
-100
|G(s)|
-150
-200
-250
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.18: Respuestas en frecuencia de G(s)yG(w)
Especicacion de comportamiento nominal (NP): reduccion de la sensibilidad
de al menos 1=100 hasta una frecuencia de aproximadamente 1 rad=seg. Lo
anterior puede conseguirse mediante una funcion de ponderacion WS de la
forma,
s + 1)2
WS 1 = 0(:01(
s=30 + 1)2
Especicacion de estabilidad robusta (RS): un ancho de banda de unos 30 rad=s,
una tolerancia a incertidumbre multiplicativa superior al 32 %, y una cada de
j T j inferior a 20 db para frecuencias superiores a 2000 rad=s. Estas especicaciones se pueden tener en cuenta eligiendo una funcion de ponderacion WT
de la forma,
s=300 + 1)
WT 1(s) = 3:16(
(s=10 + 1)
El parametro empleado en WS tiene el sentido fsico de que al aumentarlo se
impone al sistema de control una especicacion de np mas exigente (un valor inferior
de j S j a baja frecuencia). El proceso de dise~no consiste en jar WT y variar , de
forma que se cumpla la condicion de estabilidad robusta, as como que se optimice
el comportamiento nominal simultaneamente para el valor mayor de posible. En
la gura 10.19 se muestran las formas de WT 1 y WS 1 para = 1:5.
Controladores H1
271
20
10
|1/W_S|, |1/W_T| (db)
0
-10
|1/W_T|
-20
-30
|1/W_S|
-40
-50
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.19: Respuesta en frecuencia de funciones de ponderacion inversas
WS 1; WT 1
Se plantea por tanto un problema de control H1 de sensibilidad mixta (np +
rs):
W
S
S
kTzw k1 = W T < 1
(10:37)
T
1
Se inicia el proceso de dise~no con = 1, obteniendose un regulador H1 para el
que se cumplen las especicaciones de dise~no. A n de mejorar las prestaciones del
regulador, se inicia un proceso iterativo dando valores al parametro . Se concluye
nalmente, que el objetivo de dise~no 10.37 se verica con un regulador H1 para un
valor de hasta = 1:5, no cumpliendose para un regulador H2. En la gura 10.20
pueden compararse las respuestas en frecuencia de Tzw para ambos reguladores.
Como puede comprobarse, el regulador H2 no consigue el objetivo kTzw k1 < 1,
mientras s se alcanza con el regulador H1.
En las guras 10.21, 10.22, 10.23 y 10.24 se muestran respectivamente las respuestas en frecuencia de WS 1 con S , WT 1 con T , para el regulador H2 y el H1.
Finalmente en la gura 10.25 se muestra la curva de Nichols (de la funcion de transferencia en lazo abierto L = GK ) obtenida con el regulador H1. A partir de ella,
puede obtenerse que el controlador dise~nado proporciona un margen de ganancia de
Problemas de control H2; H1 en el espacio de estados
272
4
H_2
2
0
|T_zw| (db)
-2
-4
H_inf
-6
-8
-10
-12
-14
-16
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.20: Respuesta en frecuencia de Tzw para reguladores H2 y H1
12 decibelios, y un margen de fase de 43 grados. Por otro lado, a partir de 1= j T j
se obtiene una tolerancia a incertidumbre multiplicativa superior al 60 % en el peor
de los casos. El regulador H1 obtenido, K (z), es de orden 6, el mismo de la planta
generalizada. Ya que la planta a controlar es de orden 3, la funcion de ponderacion
WS es de orden 2, y WT es de primer orden.
z6 40:2747z5 + 13:4628z4 + 35:544z3 31:404z2 + 3:7234z + 2:2497
K (z) = 16:7016
z6 1:5311z5 + 0:1799z4 + 0:2894z3 + 0:0413z2 + 0:0169z + 0:0037
En las guras 10.26 y 10.27 se muestran respectivamente la se~nal de control y la
respuesta obtenida con el regulador H1.
Controladores H1
273
20
|1/W_S|
10
|S|, |1/W_S| (db)
0
|S|
-10
-20
-30
-40
-50
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.21: Magnitudes de WS 1 y S para regulador H2
20
10
0
|T|, |1/W_T| (db)
|T|
-10
|1/W_T|
-20
-30
-40
-50
-60
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.22: Magnitudes de WT 1 y T para regulador H2
Problemas de control H2; H1 en el espacio de estados
274
20
|1/W_S|
10
|S|, |1/W_S| (db)
0
|S|
-10
-20
-30
-40
-50
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.23: Magnitudes de WS 1 y S para regulador H1
20
10
0
|T|, |1/W_T| (db)
|T|
-10
|1/W_T|
-20
-30
-40
-50
-60
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
10 5
rad/s
Figura 10.24: Magnitudes de WT 1 y T para regulador H1
Controladores H1
275
60
40
|L| (db)
20
0
-20
-40
-60
-80
-450
-400
-350
-300
-250
-200
-150
-100
-50
0
arg(L) (gra)
Figura 10.25: Curva de Nichols para regulador H1
20
15
10
control
5
0
-5
-10
-15
-20
5
10
15
20
25
30
35
40
45
50
muestras (Tm=0.01 seg.)
Figura 10.26: Se~nal de control para cambio en escalon unidad, con regulador H1
Problemas de control H2; H1 en el espacio de estados
276
1.4
1.2
respuesta
1
0.8
0.6
0.4
0.2
0
5
10
15
20
25
30
35
40
45
50
muestras (Tm=0.01 seg.)
Figura 10.27: Respuesta a escalon unidad, con regulador H1
Captulo 11
Aplicacion de control robusto
11.1 Introduccion
Hasta la decada de los ochenta las aplicaciones de las tecnicas de control moderno en
los buques haba sido algo bastante inusual. A pesar de la amplia aceptacion y exitos
conseguidos en otras ramas de la ingeniera (probablemente el contrapunto sea la industria aeronautica), donde los avances de la teora de control han sido rapidamente
incorporados en la busqueda de la mejora del funcionamiento y seguridad.
Las razones de la inercia presentada por la industria naval hay que buscarlas en
diversos factores, tales como: la mayor duracion de los barcos comparados con los
aviones, la resistencia a intentar nuevas tecnicas cuando los metodos tradicionales
han demostrado tener un funcionamiento valido, as como la cada en la industria
de construccion naval, entre otros.
En muchos casos, la innovacion ha consistido en la sustitucion directa de los
antiguos sistemas de control analogicos por otros equivalentes digitales, y el aprovechamiento de la potencia de computacion del ordenador empleado, para incorporar
o mejorar tareas de monitorizacion y alarma; mas que para explotar los benecios
que podra reportar el empleo de algoritmos de control avanzado.
Los primeros autopilotos para el guiado automatico de barcos eran simples dispositivos en los que el error de rumbo se utilizaba para producir una orden al servosistema del timon proporcional al error del rumbo. Posteriormente se modico
incluyendo el efecto derivativo para mejorar la respuesta transitoria y el efecto inte277
278
Introduccion
gral para corregir los errores estacionarios debidos a las perturbaciones ambientales.
Debido a su simplicidad, abilidad y bajo coste, los autopilotos pid aun se
mantienen en la mayora de barcos. Uno de los principales inconvenientes es la
necesidad de sintonizacion por parte del operador, para adaptarse al cambio de
condiciones de navegacion.
Ha sido el perodo de nales de los setenta y durante la decada de los ochenta,
cuando la mejora del sistema de control de los buques ha experimentado un notable
incremento en investigacion y desarrollo. La justicacion se debe primordialmente
a razones tales como:
1. Las elevadas subidas del precio del petroleo y la busqueda de la reduccion del
coste en los transportes.
2. La exigencia de mejora en la seguridad del transporte martimo.
3. La transferencia tecnologica acelerada por los recientes avances de la microelectronica, informatica y telecomunicaciones.
4. El exito obtenido en otras ramas de la industria, en la aplicacion de los ultimos
desarrollos de la teora de control.
El impulso proporcionado en la ultima decada se pone de maniesto, en el hecho
de que todos los buques de nueva construccion incorporan un sistema automatico
mas o menos sosticado para el control del rumbo.
Por otro lado, ha demostrado ser de gran utilidad, tanto para buques de la
Marina Mercante como para los de la Armada, el que adicionalmente al problema
del control del rumbo de un buque (escalar o monovariable), se considere el empleo
de sistemas activos de estabilizacion para la regulacion del movimiento de balance;
lo cual da lugar a un problema de control multivariable (sistema con dos entradas
y dos salidas). Si bien en la mayora de sistemas instalados a bordo se tratan como
dos problemas de control independientes, en el sentido de que los reguladores se
dise~nan de forma independiente entre s, sin tener en cuenta el caracter vectorial de
la planta.
El problema del control de un buque puede interpretarse segun la losofa del
control robusto, dado la gran cantidad de factores que van a inuir en la incertidumbre del modelo de la planta. La dinamica de un buque va a depender de una serie
de factores, entre los que cabe destacar (Lopez et al, 1995):
Aplicacion de control robusto
279
Velocidad
de crucero
Condiciones
de carga
?
?
Dinamica
del buque
6
Perturbaciones
ambientales
6
Otros
factores
Figura 11.1: Factores que afectan a un buque
1. Velocidad de crucero.
2. Estado de carga.
3. Estado del mar, vientos y corrientes.
4. Profundidad.
5. Densidad del agua del mar.
Un sistema de control ecaz ha de tener en cuenta los errores de modelado que
se pueden acumular debido al efecto de diferentes factores. Por lo que el analisis de
robustez del sistema es esencial, dadas las diversas circunstancias que van a inuir
sobre la dinamica de la planta y por tanto sobre el comportamiento del sistema de
control. En este captulo se describen los dise~nos de controladores LTR, H2 y H1
multivariables para el control del rumbo y balance de un buque, proponiendose un
conjunto de indicadores de robustez para su evaluacion.
280
Descripcion de la planta
11.2 Descripcion de la planta
La complejidad de la dinamica de un buque, as como el alto coste economico y de
tiempo para la realizacion de pruebas de mar experimentales, puso de maniesto
la necesidad del empleo de modelos que captaran el comportamiento de un barco
en diversas condiciones de navegacion. A partir de nales de los setenta el empleo
de modelos matematicos hizo que se avanzara en el dise~no y aplicacion de nuevos
sistemas de control en la industria naval, gracias a los avances conseguidos en los
computadores digitales empleados para realizar las simulaciones.
A partir de las leyes de la mecanica, para un solido rgido con seis grados de libertad (3 rotaciones y 3 traslaciones), se pueden obtener las ecuaciones que gobiernan
el movimiento de un buque, referidas a un sistema de referencia jado en el propio
barco:
Para la traslacion (fuerzas):
X = m[u_ + qw rv xG (q2 + r2) + yG(pq r_) + zG (pr + q_)]
Y = m[v_ + ru pw yG(r2 + p2) + zG (qr p_) + xG (qp + r_)]
Z = m[w_ + pv qu zG(p2 + q2) + xG (rp q_) + yG(rq + p_)]
(11.1)
y para el giro (pares o momentos de fuerza):
K = Ixp_ + (Iz Iy )qr + m[yG(w_ + pv qu) zG (u_ + ru pw)]
M = Iy q_ + (Ix Iz )rp + m[zG (u_ + qw rv) xG(w_ + pv qu)]
N = Iz r_ + (Iy Ix)pq + m[xG (v_ + ru pw) yG(u_ + qw rv)]
(11.2)
El sistema de referencia esta situado en el buque y no tiene por que coincidir
con el centro de gravedad del mismo (a veces se emplea el centro de simetra). Las
magnitudes que aparecen en las ecuaciones anteriores son:
m: masa del barco.
Ix; Iy ; Iz : momentos de inercia respecto a cada eje coordenado.
xG ; yG; zG: posicion del centro de masas.
; ; : angulos de giro respecto a los ejes coordenados (x; y; z).
r = _ ; p = ;_ q = _: velocidades angulares respecto a los tres ejes.
Aplicacion de control robusto
281
u; v; w: componentes del vector velocidad referidos a los ejes coordenados
(x; y; z). Tambien se emplean como: Vx = u; Vy = v; Vz = w.
X; Y; Z : componentes en cada eje de las fuerzas actuantes sobre el barco.
K; M; N : componentes en cada eje de los pares o momentos actuantes sobre
el buque.
En las guras (11.2),(11.3) y (11.4) se muestra el signicado fsico de las variables
mas signicativas del modelo.
Z
X
Y
Figura 11.2: Sistema con 6 grados de libertad
Si solo se consideran el desplazamiento en el plano horizontal y los giros respecto
a los ejes (x; z), el sistema se reduce a un problema de cuatro grados de libertad.
Las ecuaciones del movimiento quedan en ese caso:
2 (1 X 00 )
66 0 G
64 0
0
0
(1 Yv_00 )
(zG00 + Kvv00_ )
(x00G Nv00_ )
0
L(zG00 + Yp_00 )
00 K 00 )
L(kxx
p_
00
L(zG x00G + Np00_ )
3 2 u_ 3 2 X
tot
L(x00G Yr_00 ) 777 666 v_ 777 = 666 Ytot
L(zG00 x00G + Kr00_ ) 5 4 p_ 5 4 Ktot
Ntot
r_
L(kzz002 Nr00_ )
0
3
77
75
(11:3)
282
Descripcion de la planta
Vx
V
Vy
Figura 11.3: Variables: ; ; u = Vx; v = Vy ; V
Figura 11.4: Variables: ; Aplicacion de control robusto
283
Donde el subndice \tot" indica las fuerzas y pares totales actuando sobre el casco,
debidos a los efectos: hidrodinamicos, viento, olas y corriente; y el resto de variables
son las magnitudes fsicas del buque as como sus coecientes hidrodinamicos.
Para buques de grandes dimensiones, la consideracion anterior es razonable, ya
que los movimientos mas signicativos son los que afectan al gobierno del barco
(rumbo y movimiento en el plano), y al movimiento de balance (giro con respecto
a un eje axial al buque); despreciandose el desplazamiento vertical y el giro con
respecto a un eje transversal conocido como movimiento de cabeceo. En ese caso, el
modelo, desde el punto de vista del control, se caracteriza por una o dos entradas de
control (angulos de timon y aletas estabilizadoras) y dos salidas (angulos de rumbo
y balance); tratandose por tanto de un sistema multivariable. Si unicamente se esta
interesado en el control del rumbo (por ejemplo, para el caso de grandes petroleros,
en los que el movimiento de balance es menos apreciable), el modelo matematico se
reduce a un sistema escalar de una entrada y una salida (ver ejemplo del control del
rumbo dado en el captulo 4, apartado 4.4).
Entre las razones que justican el empleo de sistemas de control del movimiento
de balance pueden destacarse:
1. Medida de seguridad en navegacion; ya que un corrimiento o desplazamiento
de la carga, causado por un angulo de escora excesivo, puede poner en serio
peligro la estabilidad del buque.
2. No tener que desviarse en exceso de una ruta dada debido a unas condiciones
ambientales adversas.
3. Mejora en las condiciones de trabajo de la tripulacion.
4. Aumento de la comodidad del pasaje, en su caso.
5. Conseguir una plataforma estable adecuada, para el disparo y aterrizaje a
bordo, en los buques de la Armada.
Para ello, se pueden emplear diferentes tecnicas: 1) sistemas de depositos o
tanques de agua; 2) utilizacion del timon como sistema de estabilizacion del balance
(rrs); y 3) la que ha resultado ser mas ecaz, al menos para velocidades superiores
a 12 nudos, que utiliza supercies de control o aletas estabilizadoras.
Al considerar el problema de control de los angulos de rumbo ( ) y balance (),
empleando como variables de control los angulos de timon () y de las aletas (),
se plantea un problema de control de un sistema multivariable. En determinados
284
Descripcion de la planta
angulo de
estabilizadores ()
angulo de
balance ()
-
-
BUQUE
angulo de
timon ()
-
-
angulo de
rumbo ( )
Figura 11.5: Componentes de entrada-salida del problema multivariable
buques, existe una fuerte interaccion entre las distintas variables de entrada y salida,
por lo que el empleo de dos controladores independientes puede no dar buenos
resultados. En ese caso, si se quiere conseguir un buen comportamiento, se hace
aconsejable el empleo de tecnicas de control de sistemas multivariables.
Desde el punto de vista del control de un buque se puede decir que hay dos condiciones de navegacion bien diferenciadas (Lopez et al, 1995). La primera, se trata del
caso en que el problema es el realizar una determinada maniobra que conlleve esfuerzos grandes y prolongados de las variables de control (timon y aletas estabilizadoras), en cuyo caso los efectos no lineales dominan el comportamiento del sistema.
La otra, se da en situaciones de mantenimiento del rumbo, o cuando el proceso de
regulacion para un cambio de consigna requiere unas desviaciones de las supercies
de control (pala de timon y aletas estabilizadoras) que no sean excesivas en tiempo
y magnitud. Bajo dichas condiciones el sistema se puede aproximar por un modelo lineal. Ello puede hacerse linealizando las ecuaciones del movimiento en torno
a una solucion estacionaria, para unas condiciones nominales de funcionamiento.
Otra posible forma es realizando una identicacion de la planta por algunos de los
metodos dados en el captulo 3; o una identicacion en el dominio de la frecuencia,
como se hizo para obtener el modelo matematico lineal mlmv19 que se describe a
continuacion.
Para ilustrar el dise~no de controladores multivariables, se emplean los modelos
lineales o linealizados multivariables (dos entradas y dos salidas) para unas condiciones de operacion de dos buques. Se emplean por un lado el modelo matematico
que denominaremos mlmv19 (modelo lineal de orden elevado obtenido por identicacion); y por otro modelo no lineal y variable en el tiempo que llamaremos modnl.
En el primer caso, (mlmv19) el modelo matematico corresponde a un buque
Aplicacion de control robusto
285
(s) s
- G11 (s) - m(s-)
6
- G12 (s)
(s)
s - G22(s) - m(s-)
6
- G21 (s)
Figura 11.6: Diagrama de bloque del sistema multivariable
tipo fragata para unas condiciones nominales de funcionamiento y una velocidad de
18 nudos1 . Fue obtenido por (Freeman et al, 1982) empleando tecnicas de respuesta
en frecuencia, a partir de las cuales se obtuvieron las cuatro funciones de transferencia (G11 ; G12; G21 ; G22) que caracterizan la matriz de transferencia del sistema
multivariable.
Las ecuaciones descriptivas de la planta vienen dadas por:
"
# "
#"
#
(s) = G11 (s) G12(s) (s)
(s)
G21 (s) G22(s) (s)
(11:4)
:92(1:54s2 + 0:976s + 0:0077)
G11(s) = (19:84s4 + 24:34s19
3 + 7:69s2 + 5:34s + 0:234)(s2 + 3:645s + 13:28)
:916(0:965s2 + 0:61s 0:176)
G12(s) = (15:66s4 + 21:32s13
3 + 6:87s2 + 3:81s + 0:193)(s2 + 9:402s + 7:952)
0:1
G21(s) = (s2 + 3:645s + 13
:28)(21:5s2 + s)
G22(s) = (s2 + 9:402s +0:74266
:952)(18:1s2 + s)
La variable a controlar y1 corresponde al angulo de balance , la variable a
controlar y2 es el angulo de rumbo , la variable de control u1 corresponde al angulo
1
Navegacion: 1 Nudo = 1852 metros/hora.
286
Descripcion de la planta
de aletas estabilizadoras , y la variable de control u2 corresponde al angulo de
timon .
Dado que una realizacion mnima en el espacio de estados de este modelo es de
dimension elevada (diecinueve), se va a emplear un modelo de orden reducido de la
planta, a n de obtener un controlador de menor dimension y para hacer un analisis
posterior de la robustez del sistema de control frente a la dinamica inmodelada de
alta frecuencia (debida en este caso a la diferencia entre el modelo de orden completo
y el modelo de orden reducido). Si se calculan los valores singulares de Hankel del
modelo completo de la planta:
Hi para: i = 1; 2; : : : ; 19
se obtiene que:
H 7 < 0:1H 6
y dado que Hi+1 Hi , se elige un modelo reducido de sexto orden. En la gura 11.7
se muestran las ganancias principales del modelo completo y del modelo reducido,
como puede verse se consigue una buena aproximacion hasta una frecuencia de 3
radianes/segundo. Dado que esta frecuencia va a ser muy superior al ancho de banda
del sistema en lazo cerrado, puede considerarse una aproximacion aceptable en el
rango de frecuencias de interes.
Las matrices de estado obtenidas para el modelo reducido de la planta son:
0 0:049 0:015 0:255 0:442 0:986 0:094 1
B
0:012 0:279 0:211 0:632 0:112 0:357 C
CC
B
B
CC
B
0
:
010
0
:
151
0
:
228
0
:
443
0
:
182
0
:
555
A = B
B
0:092 0:482 0:213 0:118 0:896 0:017 C
C
B
B
@ 0:053 0:179 0:080 0:067 0:569 0:117 CA
0:001 0:203 0:307 0:010 0:034 0:178
!
0
:
001
0
:
001
0
:
013
0
:
004
0
:
039
0
:
017
T
B =
0:025 0:035 0:031 0:102 0:106 0:033
C =
0:011
0:023
0:796
0:001
0:478
0:001
1:149
0:001
0:113
0:000
0:480
0:000
!
Para la sntesis del regulador se emplea el modelo reducido, sin embargo la evaluacion de la respuesta temporal se realiza con el modelo de orden completo. En la
gura 11.8 se muestra el numero de condicion, (G), de la planta, a partir del cual
puede comprobarse que la planta tiene una fuerte direccionalidad en la ganancia,
puesto que (G) 1 para todas las frecuencias (ver captulo 8).
Aplicacion de control robusto
287
100
50
sv (db)
0
G
-50
Gp
-100
Gp
-150
-200
10 -4
10 -3
10 -2
10 -1
10 0
10 1
G
10 2
w (rad/s)
Figura 11.7: Respuestas en frecuencia de modelos completo (Gp) y reducido (G)
100
90
80
70
k(G)
60
50
40
30
20
10
0
10 -3
10 -2
10 -1
w (rad/s)
Figura 11.8: Numero de condicion de la planta
10 0
288
Descripcion de la planta
En el segundo caso (modnl), el modelo matematico corresponde al desarrollado
por (Kallstrom et al, 1982), y corresponde a un buque mercante del tipo ro/ropasajeros. Este modelo es multivariable, no lineal y variable en el tiempo, sirviendo
para caracterizar el comportamiento del buque tanto en operacion de mantenimiento
de rumbo, como en grandes maniobras. La validacion experimental de este modelo
fue realizada de forma exhaustiva por sus autores, ajustando sus parametros hasta
conseguir una excelente correspondencia entre los resultados experimentales y las
simulaciones.
Por ello, se puede considerar el modnl como un buen banco de pruebas para
evaluar los dise~nos de sistemas de control desarrollados tanto escalares como multivariables (Lopez y Rubio, 1995a; Messer y Grimble, 1992; Kallstrom et al, 1982). Las
expresiones correspondientes a cada uno de los terminos que aparecen en la ecuacion
11.3, correspondientes a los pares y fuerzas debidos a los factores hidrodinamicos y
las perturbaciones ambientales, pueden encontrarse en (Kallstrom et al, 1982; Lopez,
1994).
Los angulos de timon y aletas que se generan como magnitudes de mando
a traves de un controlador, ya sea automatico o manual, han de ser ejecutados por
las respectivas maquinas del timon y de las aletas estabilizadoras. Las dinamicas de
estos dispositivos se modelan como sistemas de primer orden, dados por:
_ = (c )=R ; j _ j _max ; j j max
_ = (c )=F ; j _ j _ max ; j j max
siendo c y c los angulos de mando de consigna que se remiten como orden a la
sala de maquinas (con las constantes de tiempo R y F ).
Para mostrar la naturaleza no lineal del modnl, se presentan a continuacion
algunas pruebas de simulacion. En las guras 11.9 y 11.10 puede verse la perdida
sustancial de velocidad que experimenta el sistema si se somete a una prolongada
activacion de la variable de control (angulo de timon). En dichas guras se muestran la derivada del rumbo (o velocidad angular) r, y la velocidad V , para angulos
de timon de 20 y 10 grados respectivamente. Se representan as mismo el angulo de
balance , y su derivada p. La velocidad nominal o de crucero inicial es en ambos
casos de 15 nudos. Se observa, que a mayor angulo de timon mayor es la perdida de
velocidad. Y dado que la dinamica del buque depende fuertemente y de forma no
lineal de dicha velocidad, as como tambien de otras magnitudes,
_ ; ; ;_ ; se tendra que durante dicha operacion el sistema tendra un comportamiento no
lineal y variable en el tiempo.
Aplicacion de control robusto
289
0
8
V (m/s)
r (grad/seg)
-0.2
-0.4
-0.6
7
6
-0.8
-1
0
5
0
500
8
0.6
6
0.4
4
2
0
-2
500
t (seg)
p (grad/s)
fi (grad)
t (seg)
0.2
0
-0.2
0
-0.4
0
500
t (seg)
500
t (seg)
Figura 11.9: r(t); V (t); (t); p(t) para = 20; V = 15 nudos
0
8
V (m/s)
r (grad/seg)
7
-0.5
-1
6
5
4
-1.5
0
3
0
500
t (seg)
1
15
p (grad/s)
fi (grad)
10
5
0
-5
500
t (seg)
0
500
t (seg)
0.5
0
-0.5
0
500
t (seg)
Figura 11.10: r(t); V (t); (t); p(t) para = 10; V = 7:72 m=s
290
Descripcion de la planta
polos
(seg)
0
-0.02825 0.30494j 3.27
-0.0081
123.17
-0.1403
7.12
Tabla 11.1: Polos y constantes de tiempo de modnl linealizado para V = 7:72m=s
Para realizar el dise~no de los reguladores es necesario que se disponga de un
modelo lineal de la planta. Para ello, el modnl se linealiza en torno a la solucion
estacionaria
u = V; v = r = = p = = = 0
donde V es la velocidad de crucero.
A continuacion se dan las matrices de una representacion de estado del modelo
(modnl) linealizado para una velocidad V = 15 nudos, as como la tabla 11.1
con los polos y constantes de tiempo ( ) asociados (no se considera la dinamica
de los actuadores). Como puede verse el sistema tiene un par de polos complejos
conjugados muy poco amortiguados.
0
0:02720
B
B
B 0:00250
0:00128
A=B
B
B
0
@
0:15048
0:04043
0:00129
1
0
0
0
0:06466
B
B
0:01426
B
B
B = B 0:0007
B
0
@
0
0:1747
0:01319
0:00554
0
0
0:00443
0:39268
0:13732
0
1
1
CC
CC
CC ;
A
0:26255
0:09381
0:00204
0
0
0
BB 00
B
CT = B
BB 0
@1
0
0
0
0
0 1
0
0
0
0
0
1
CC
CC
CC
A
1
CC
CC
CC
A
Aplicacion de control robusto
291
11.3 Evaluacion de los controladores
Cuando se realiza el dise~no de un regulador utilizando para ello algun criterio de optimizacion, o siguiendo una determinada tecnica, conviene evaluar las caractersticas
de dicho regulador frente a diferentes indicadores de comportamiento y robustez,
que proporcionen una vision mas global de las prestaciones del regulador. A continuacion se proponen un conjunto de indicadores para evaluar los dise~nos que se
realicen.
Analisis de la respuesta temporal y se~nales de control.
Caracterizacion del rechazo de las perturbaciones actuantes a la salida (do) y
a la entrada (di) de la planta, por medio de:
Ido = [So (j!)];
Idi = [SoG(j!)]
Indicador de Comportamiento Nominal (una medida del grado de recuperacion
a una frecuencia ! = !o dada):
(
o )] [L(j!o )]
INP = min [[LL((j!
;
t j!o )] [Lt (j!o )]
)
Margenes de Estabilidad (extension al caso multivariable de los margenes de
fase y ganancia clasicos, se emplean para ello los valores propios, i de la
matriz de transferencia en lazo abierto):
MG = min
fMG(i )g ;
i
MF = min
fMF (i )g
i
En el caso de un sistema multivariable, los margenes de fase y ganancia as
obtenidos no proporcionan la utilidad que tienen en el caso de los sistemas
escalares para caracterizar la robustez del sistema. Pero s pueden utilizarse
como indicadores de robustez cualitativos (Lunze, 1989; Doyle y Stein, 1981),
en el sentido de que si se obtienen valores poco satisfactorios de MG y MF,
ello sera indicativo de la falta de robustez.
Indicadores de Estabilidad Robusta (estimacion del tanto por ciento de incertidumbre tolerable para la que el sistema mantiene su estabilidad):
2
El subndice\i" indica que se trata de un indicador con respecto a incertidumbre de tipo
multiplicativo que se considera reejada a la entrada de la planta, mientras que con el subndice\o"
se indica que se considera a la salida.
2
292
Dise~no de controladores LTR multivariables
{ Incertidumbre multiplicativa no estructurada: 3
I11i : M = Ti ; I11o : M = To
min
! f1= [M (j! )]g 100%
{ Incertidumbre multiplicativa con estructura diagonal:
I12i : M = Ti ; I12o : M = To
min
! f1=[M (j! )]g 100%
{ Incertidumbres multiplicativas simultaneas con estructuras diagonales:
I1s : min
! f1=[M (j! )]g 100%
"
#
T
S
K
i
i
M= SG T
o
o
Indicadores de Comportamiento Robusto (estima el tanto por ciento de incertidumbre de tipo multiplicativo con estructura diagonal tolerable para la
que el sistema cumple una especicacion de comportamiento dada de la forma
(So WS ) 1):
"
#
T
KS
W
i
o
S
I3i : M = SoG SoWS
"
#
T
T
W
o
o
S
I3o : M = So To WS
min
! f1=[M (j! )]g 100%
11.4 Dise~no de controladores LTR multivariables
En este apartado se realiza el dise~no de controladores LTR (LTR-o y LTR-i) con
la estructura convencional, as como para la estructura no basada en observador,
ambas descritas en el captulo 9.
representan los valores singulares extremos, y el valor singular estructurado. M representa el sistema de interconexion correspondiente a cada caso.
3 ; Aplicacion de control robusto
293
11.4.1 Dise~no LTR-o
Para el dise~no del regulador se sigue el procedimiento descrito en el captulo 9.
El parametro\q" (ganancia de recuperacion) se incrementa solo lo necesario para
realizar una recuperacion aceptable en el rango de frecuencias de interes del sistema
(zonas de baja y media frecuencia). As se evita incrementar la sensibilidad del
sistema a la dinamica no modelada de alta frecuencia (rs), y se aproximan las
especicaciones de dise~no (np). Se desea que el sistema consiga un buen rechazo
de las perturbaciones y unos errores de seguimiento lo sucientemente peque~nos
(aproximacion de la accion integral). Para ello, se toman los siguientes parametros
de dise~no:
"
#
"
#
10
0
0
:
9817
0
:
1342
T
Ro = 0 1 ; Qo = a W a ; W = 0:1342 0:0184
Rc = I2; Qc = CaT Ca ; Ca = [C O2]; BaT = [B O2]
"
#
"
#
A
B
O
n
2
Aa = O
;
; q = q1 = 103
a= I
I
2n
22
22
donde Aa ; Ba y Ca son las matrices de la planta ampliada.
En la gura 11.11 se muestran las ganancias principales de L(s) para el controlador lqg/ltr-o (cbo); como puede verse, el controlador no consigue una recuperacion adecuada. Si se incrementa q hasta 1000q1, se obtiene el nivel de recuperacion deseado a baja frecuencia, pero a costa de un incremento en el ancho de
banda del regulador. Esto produce como consecuencia que las ordenes generadas
por el controlador sean de magnitudes mayores, con lo que se puede provocar la saturacion de los actuadores de una forma mas frecuente, una mayor sensibilidad a las
incertidumbres y a las perturbaciones ambientales, as como la posible generacion
de ordenes de control irrealizables fsicamente por el sistema.
Si se emplea un controlador ltr-o (cnbo) con los mismos parametros de dise~no
dados arriba, se observa la mejora en el grado de recuperacion conseguida a baja
frecuencia con respecto al cbo ( gura 11.12); puede comprobarse que es el mismo
que el obtenido con la estructura estandar (cbo) para q = 1000q1. El efecto de
incrementar el valor de q puede verse al comparar las guras 11.13 y 11.14, donde
se muestran las respuestas temporales y demandas de control para ambos controladores: cbo, q = 1000q1 y cnbo, q = q1.
En la gura 11.15 se puede observar como el regulador dise~nado cumple las
especicaciones deseadas para el rechazo de las perturbaciones actuantes tanto a la
salida (i (So)), como a la entrada (i (SoG)) de la planta. En la misma gura se
294
Dise~no de controladores LTR multivariables
150
KBF
100
sv(L) (db)
50
LTR
KBF
LTR
0
KBF
-50
q=1000 (cbo)
-100
-150
10 -5
LTR
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
w (rad/s)
Figura 11.11: Valores singulares de Ho(s) y L(s), para q = q1 = 103, cbo
150
100
sv(L) (db)
50
0
KBF
-50
q=1000 (cnbo)
LTR
-100
-150
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
w (rad/s)
Figura 11.12: Valores singulares de Ho(s) y L(s), para q = q1 = 103, cnbo
Aplicacion de control robusto
295
8
y2
y (gra)
6
4
y1
2
0
-2
0
50
100
150
200
250
300
t (seg)
60
q=1e6, (cbo)
u (gra)
40
u1
20
0
u2
-20
-40
0
10
20
30
40
50
60
70
80
90
100
t (seg)
Figura 11.13: Respuesta temporal para cbo, q = 103q1
8
y2
y (gra)
6
4
2
y1
0
-2
50
0
100
150
200
250
300
t (seg)
60
u (gra)
40
q=1e3, (cnbo)
u1
20
0
u2
-20
-40
0
10
20
30
40
50
60
70
80
90
t (seg)
Figura 11.14: Respuesta temporal para cnbo, q = q1
100
Dise~no de controladores LTR multivariables
20
20
0
0
sv(SoG) (db)
sv(So) (db)
296
-20
-40
-60
-80
10 -5
-20
-40
-60
10 -2
-80
10 -5
10 1
rad/s
60
1/[sv(M),ssv(M)] (db)
1/[sv(M),ssv(M)] (db)
10 1
rad/s
60
40
20
iMies
0
iMi
-20
10 -5
10 -2
10 -2
10 1
40
iMoes
20
iMo
0
-20
10 -5
rad/s
10 -2
10 1
rad/s
Figura 11.15: Caracterstica rechazo perturbaciones y niveles de incertidumbre tolerables
representan tambien unas estimaciones de las tolerancias del sistema de control a
incertidumbres de tipo multiplicativo, que se den a la entrada (iMi) o a la salida de
la planta (iMo) respectivamente. Para incertidumbre no estructurada se representa:
1=[M (j!)]
y para el caso de incertidumbres con estructura diagonal (a la entrada de la planta
puede corresponder a la dinamica no modelada de los actuadores: iMies, y si se
considera a la salida de la planta se podra representar la dinamica de los sensores
(iMoes), se representa:
1=[M (j!)]
donde M (j!) es el sistema de interconexion. Con 1=[M (j!)] se obtienen unas
estimaciones de las tolerancias a las incertidumbres mayores que con 1=[M (j!)],
o lo que es lo mismo: se obtiene una estimacion de la robustez de la estabilidad
superior. Esto es logico, al suponer la primera una condicion menos conservativa
que la ultima. Puede comprobarse tambien, que el sistema es mas robusto frente a
incertidumbres situadas a la salida de la planta que frente a incertidumbres situadas
a la entrada; ello es consecuencia de que el dise~no realizado es ltr-o.
En la tabla 11.2 se resumen los valores de los indicadores de robustez consegui-
Aplicacion de control robusto
Controlador
cbo: q = 1000q1
cnbo: q = q1
297
I11i I12i I11o I12o I1s MG MF I3o I3i
% % % % % db gra % %
23.0 27.5 76.1 76.1 22.0 26.9 59.8 38.3 24.5
25.3 62.1 74.9 74.9 34.3 18.9 51.8 53.5 40.9
Tabla 11.2: Indicadores de robustez de los controladores LTR-o (mlmv19)
dos por ambos controladores ltr-o para el mismo grado de recuperacion (inp) 4.
Finalmente, se puede realizar una implementacion del regulador en tiempo discreto,
empleando un perodo de muestreo de hasta 1 segundo, con el cual el regulador de
tiempo discreto proporciona un comportamiento en lazo cerrado equivalente al de
tiempo continuo.
11.4.2 Dise~no LTR-i
En este apartado se presentan los resultados de simulacion obtenidos con el modelo
no lineal multivariable; a n de evaluar los controladores que se dise~nan a partir de
modelos linealizados para distintas condiciones de trabajo. En la seccion anterior se
ha realizado un dise~no ltr-o, en esta se hace uno ltr-i, para as ilustrar aplicaciones
de ambas metodologas. Una discusion mas amplia sobre el dise~no y analisis de
reguladores ltr-i para distintas condiciones de funcionamiento puede encontrarse
en (Lopez, 1994; Lopez y Rubio, 1995a).
Con el modelo linealizado de la planta (modnl) para una velocidad de V =
15 nudos y los parametros de dise~no:
#
"
#
"
0
:
1
0
10
0
T
Rc = 0 1 Qc = C QC Q = 0 1
Ro = I2 Qo = BB T q = 106
se obtiene un regulador lqg/ltr-i. En la gura 11.16 se tiene la respuesta obtenida
con el modelo lineal, que puede compararse con la obtenida para el modelo no lineal
dada en la gura 11.17.
El controlador se ha calculado para una condicion de trabajo dada, por lo que
interesa ver el comportamiento del sistema en otras condiciones diferentes. Esto se
Los valores de la tabla 11.2 estan expresados: MF en grados, MG en decibelios y el resto de
indicadores en tanto por ciento de incertidumbre tolerable.
4
298
Dise~no de controladores LTR multivariables
8
y2
y (gra)
6
4
2
y1
0
-2
0
20
40
60
80
100
120
140
160
180
200
120
140
160
180
200
t (seg)
10
u2
u (gra)
5
0
u1
-5
-10
0
20
40
60
80
100
t (seg)
Figura 11.16: Respuesta con modelo linealizado de modnl
8
y (gra)
6
y2
4
2
y1
0
-2
0
20
40
60
80
100
120
140
160
180
200
120
140
160
180
200
t (seg)
10
u (gra)
5
u2
0
u1
-5
-10
0
20
40
60
80
100
t (seg)
Figura 11.17: Respuesta con modelo no lineal (modnl)
Aplicacion de control robusto
299
hace analizando las respuestas temporales del sistema a cambio de consigna tipo
escalon de 5 grados, para velocidades de crucero de V1 = 10 nudos y V2 = 21 nudos
respectivamente, que se muestran en la gura 11.18. Como puede verse, ambas
respuestas son satisfactorias.
4
0.4
0.2
V2
roll (deg)
heading (deg)
6
V1
2
V2
0
V1
-0.2
0
0
50
100
150
-0.4
0
200
50
t (sec)
V2
fin (deg)
rudder (deg)
0
-2
V1
-4
0
150
200
150
200
2
2
-6
100
t (sec)
50
100
t (sec)
150
200
0
V2
V1
-2
-4
0
50
100
t (sec)
Figura 11.18: Respuestas temporales para diferentes condiciones de navegacion
Se ha visto que, para excursiones moderadas del vector de control, el sistema no
lineal (modnl) responde adecuadamente con el regulador lineal dise~nado. Sin embargo, el modelo es fuertemente no lineal, por ello se trata de evaluar al controlador
en una situacion en la que los efectos no lineales dominen el comportamiento del
sistema. Esta circunstancia se da en el caso de grandes cambios de consigna, en los
que el vector de control puede llegar a saturarse o tomar valores elevados, durante
perodos de tiempo relativamente largos; con las consiguientes perdidas de velocidad
y cambios en la planta que ello produce.
En la gura 11.19 se muestra la respuesta del sistema para un cambio de consigna
de 180 grados; como puede verse, el comportamiento es excelente: no produce una
sobreoscilacion apreciable y la interaccion con la otra variable a controlar es muy
baja, si se compara con los resultados obtenidos para la misma maniobra empleando
un controlador monovariable (ver gura 11.20). La importancia de este controlador
estriba en que al reducir el angulo de inclinacion o balance (tambien denominado de
300
Dise~no de controladores LTR multivariables
200
40
150
20
u2 (gra)
y2 (gra)
escora) durante la maniobra, se mejora la robustez del sistema frente a un angulo de
escora excesivo, que circunstancialmente puede a su vez provocar un desplazamiento
de la carga y por tanto un fuerte cambio en las caractersticas que determinan la
estabilidad del buque, aumentando el peligro de vuelco.
100
50
0
-20
0
0
500
-40
0
1000
t (seg)
500
1000
t (seg)
40
20
u1 (gra)
y1 (gra)
10
0
-20
-10
0
0
500
t (seg)
1000
-40
0
500
1000
t (seg)
Figura 11.19: Respuesta modnl controlador multivariable, ltr-i
El regulador anterior se ha desarrollado para conseguir un funcionamiento adecuado para cambios en la referencia. Como ya se ha dicho, otra importante condicion
de funcionamiento se reere a la situacion de mantenimiento del rumbo y reduccion
del movimiento de balance. La exigencia anterior no esta garantizada en presencia
de perturbaciones para el controlador LTR-i anterior (ver gura 11.21). En dicha
gura se muestran las tolerancias a incertidumbres y la caracterstica en frecuencia
para el rechazo de las perturbaciones que se den tanto a la entrada como a la salida
de la planta.
El comportamiento esperado del sistema frente a perturbaciones, se puede determinar a partir de las respuestas en frecuencia de So(s)G(s) y So(s), dadas en
la gura 11.21; de la que se deduce que las perturbaciones no van a ser atenuadas
independientemente de la direccion en que estas se den. Para ello se propone modicar las matrices de ponderacion y ampliar el modelo de la planta para el dise~no del
controlador ltr-i; incorporando una caracterstica de alta ganancia en lazo abierto
301
200
40
150
20
u2 (gra)
y2 (gra)
Aplicacion de control robusto
100
50
0
-20
0
0
500
-40
0
1000
t (seg)
500
1000
t (seg)
40
20
u1 (gra)
y1 (gra)
10
0
-20
-10
0
0
500
1000
-40
0
t (seg)
500
1000
t (seg)
Figura 11.20: Respuesta modnl controlador monovariable
a baja frecuencia (aproximacion de la accion integral).
Para ello se emplea un modelo linealizado de la planta para una velocidad de
crucero de 21 nudos. Los parametros de dise~no tomados para el regulador ltr-i 5
son los siguientes:
!
!
B
C
T
Aa =
; Ba = O
; Ca = O
22
22
"
#
1
0
Rc = 5 0 1 Qc = MaT QMa
"
#
"
#
100
0
0
:
1
0
Q = 0 1 Ma = C 0 0:1
= Ba
Ro = I2 Qo = T ; q = 106
donde las matrices Aa ; Ba y Ca corresponden al modelo de la planta ampliada utilizado para el calculo del regulador.
A On2
C O22
!
Se emplea la version no basada en observador, dado que a baja frecuencia se produce una
recuperacion del lazo abierto sensiblemente superior que con un regulador lqg/ltr-i estandar.
5
302
Dise~no de controladores LTR multivariables
80
1/sv_max(M) (db)
1/sv_max(M) (db)
80
60
40
iMi
20
0
-20
10 -4
10 -1
60
40
20
0
-20
10 -4
10 2
10 -1
10 2
w (rad/s)
20
20
0
0
sv(SoG) (db)
sv(So) (db)
w (rad/s)
-20
-40
-60
-80
10 -4
iMo
-20
-40
-60
10 -1
w (rad/s)
10 2
-80
10 -4
10 -1
10 2
w (rad/s)
Figura 11.21: Caractersticas de la tolerancia a incertidumbres y rechazo de las
perturbaciones
En la gura 11.22 se muestran los valores singulares extremos de So(j!) y
So (j!)G(j!). Como puede verse, [So (j!)G(j!)] < 1 ( 4:96db) para toda !;
as mismo, [So (j!)G(j!)] y [So(j!)] son ambos lo sucientemente peque~nos en
la zona de baja frecuencia, como es deseable. Con este controlador se obtienen
los siguientes indicadores de robustez: I11i = 62%; I12i = 70%; I11o = 61%; I12o =
63%; I1s = 38%.
La gura 11.23 muestra las respuestas temporales del sistema para el controlador LTR-i (NOBC) multivariable, y para un controlador que no tiene en cuenta el
caracter vectorial de la planta. En las simulaciones se emplea una altura signicativa
de olas de 4m y un angulo de incidencia de 45 relativo al curso de referencia del
buque. Puede verse que hay una mejora notable en la reduccion del movimiento del
balance si se emplea el controlador LTR-i multivariable.
La gura 11.24 muestra el rumbo (heading) y el balance (roll) para condiciones de
velocidad no nominales (18 nudos y 16:5 nudos); se observa que el comportamiento
es adecuado, lo cual representa otra prueba de la robustez del controlador dise~nado.
Debido a las dinamicas asociadas a la planta y a los reguladores, estos se pueden
implementar directamente en un computador digital con un perodo de muestreo de
Aplicacion de control robusto
303
80
1/sv_max(M) (db)
1/sv_max(M) (db)
80
60
40
iMi
20
0
-20
10 -4
10 -1
60
40
20
0
-20
10 -4
10 2
10 -1
10 2
w (rad/s)
20
20
0
0
sv(SoG) (db)
sv(So) (db)
w (rad/s)
-20
-40
-60
-80
10 -4
iMo
-20
-40
-60
10 -1
-80
10 -4
10 2
w (rad/s)
10 -1
10 2
w (rad/s)
Figura 11.22: Caractersticas de la tolerancia a incertidumbres y rechazo de las
perturbaciones
10
10
SISO controller
SISO controller
heading (deg)
roll (deg)
5
0
-5
-10
0
5
0
-5
-10
0
500
t (sec)
10
10
MIMO controller
MIMO controller
heading (deg)
5
roll (deg)
500
t (sec)
0
-5
-10
0
500
t (sec)
5
0
-5
-10
0
500
t (sec)
Figura 11.23: Operacion con rumbo constante bajo accion de las olas
Dise~no de controladores H2 y H1 multivariables
10
10
5
5
heading (deg)
roll (deg)
304
0
-5
-10
0
0
-5
-10
0
500
10
10
5
5
0
-5
-10
0
500
t (sec), V=9.5m/s
heading (deg)
roll (deg)
t (sec), V=9.5m/s
500
0
-5
-10
0
t (sec), V=8m/s
500
t (sec), V=8m/s
Figura 11.24: Comportamiento para condiciones de trabajo no nominales
0:1 segundos, sin tener en cuenta de una manera explcita el caracter muestreado del
sistema de control. Todas las implementaciones de los algoritmos LTR-i empleados
en las simulaciones con el modelo no lineal (modnl) se realizan de esta forma (Lopez
y Rubio, 1995a). Otra posibilidad sera utilizar un regulador de tiempo discreto
equivalente, empleando por ejemplo un perodo de muestreo de 0.5 segundos.
11.5 Dise~no de controladores
riables
2
H
y
1
H
multiva-
Para obtener un conjunto (WH ) de matrices de ponderacion implicadas en los problemas de dise~no H2 y H1 (ver captulo 10):
WH = fWS (s); WU (s); WT (s); Wr (s); Wn(s); Wdo (s); Wdi (s)g
(11:5)
que den una solucion fsicamente realizable y satisfactoria, se pueden emplear dos
procedimientos:
Aplicacion de control robusto
305
1. Empezar sin informacion previa sobre la dicultad del problema de dise~no a
tratar, e interpretar las especicaciones de dise~no en el dominio frecuencial
como elementos de WH . Ensayar distintas combinaciones, hasta conseguir
unos resultados adecuados.
2. Comenzar a partir de unos resultados previos, obtenidos con alguna tecnica
de dise~no, que pongan de maniesto la dicultad del problema de control, den
una interpretacion en frecuencia de los resultados y sirvan para sugerir posibles
mejoras, a partir de una adecuada seleccion de los elementos de WH .
En este captulo se emplea el segundo procedimiento, de forma que se aprovechan
los resultados de una primera fase de dise~no de un controlador ltr, a partir de
los cuales se sugieren los elementos de WH , comparando nalmente los resultados
obtenidos por los reguladores ltr, H2 y H1.
La metodologa de dise~no propuesta tiene dos etapas o fases. La primera fase es
opcional y consiste en el dise~no de un controlador H2. En la segunda fase se obtiene
un regulador H1 basado en los resultados de la primera etapa. Si as se considera,
solo se realiza la segunda etapa (Lopez y Rubio, 1995c; Lopez 1994). El algoritmo
propuesto sigue los siguientes pasos:
1. Seleccionar los elementos de WH .
2. Resolver el problema del regulador optimo H2 (captulo 10).
3. Ver si las respuestas temporal y frecuencial son adecuadas (analizar los indicadores de comportamiento y robustez); si no es as, se vuelve al paso 1.
4. Calcular el valor 2:
kTzw k1 = 2
5. Hacer: = 2
6. Resolver el problema del regulador H1 para el valor de (ver captulo 10).
7. Si no se encuentra solucion para el valor de empleado, se toma uno mayor
y se vuelve al paso 6. Para encontrar el valor de para el que se consigue el
regulador optimo H1, se puede emplear, por ejemplo, el metodo de la biseccion
como procedimiento iterativo de busqueda del optimo.
8. Calcular el valor 1:
kTzw k1 = 1
306
Dise~no de controladores H2 y H1 multivariables
9. Ver si las respuestas temporal y frecuencial son adecuadas; si no es as, se
aumenta el valor de y se vuelve al paso 6.
10. Disminuir el valor de y volver al paso 6.
El proceso iterativo anterior, se interrumpe cuando se llega al valor optimo
= opt, o a un valor de > opt, para el que al disminuir su valor el regulador H1
obtenido no da una respuesta temporal adecuada (por ejemplo: un excesivo aumento
de la magnitud de control comparado con el regulador H2 previo); o si ocurre que aun
a pesar de disminuir el valor de kTzw k1, el controlador obtenido tiene globalmente
unos indicadores de robustez menos satisfactorios. Puede igualmente darse el caso,
de que al calcular el regulador H1 optimo directamente empleando algunas de las
funciones que tienen incorporadas los paquetes de programas de Dise~no de Sistemas
de Control por Computador (cacsd), tales como Program CC, y Robust Control
Toolbox, sea necesario el empleo de un regulador suboptimo que de mejores caractersticas de robustez globales. De ah la importancia del conjunto de indicadores
de robustez propuesto (Lopez, 1994).
11.5.1 Controladores H1 para sistema de orden elevado
Se plantea el problema de obtener el dise~no de controladores H2 y H1, a n de
realizar un analisis comparativo entre ellos y con los resultados anteriores obtenidos
con los reguladores LTR-o. Para realizar los dise~nos se emplea el modelo de orden
reducido (sexto orden) obtenido para el modelo mlmv19 descrito anteriormente, el
cual es de orden diecinueve. Una vez obtenidos los reguladores se evaluan con el
modelo de orden completo del buque.
En primer lugar se plantea el problema de optimizacion de sensibilidad mixta
descrito en el captulo 10. Para seleccionar las funciones de ponderacion: WS (s) y
WT (s), se utilizan como ayuda los perles (respuestas en frecuencia) de la ftlad
empleados para el dise~no ltr. O en otro caso, se parte simplemente de las especicaciones de dise~no sin disponer de dise~nos anteriores. Tras algunos ensayos, se toma
para la especicacion del comportamiento nominal (np):
2
3:1623s + 9:0 10
6
s + 0:09
WS 1(s) = 664
0
6
3
0
77
3:1623s + 4:510 6 75
s + 0:045
Aplicacion de control robusto
307
y como funcion de ponderacion de la funcion de sensibilidad complementaria To(s):
2 3:1623s + 1500
3
0
6
7
WT 1(s) = 64 3162:3s + 474:34 3:1623s + 750 75
0
3162:3s + 237:17
en la gura 11.25 se muestran ambas funciones (matrices) de ponderacion, las cuales
reejan las especicaciones de dise~no en el dominio de la frecuencia.
80
70
W_S
sv(W_S),sv(W_T) (db)
60
50
40
W_T
30
20
10
0
-10
-20
10 -6
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
rad/s
Figura 11.25: Respuestas en frecuencia de WS y WT
Se calcula el regulador optimo H2 (sensibilidad mixta) de la forma descrita en el
captulo 10. Este regulador consigue:
kTzw (j!)k1 2 = 0:566
El valor = 2 se utiliza como valor de partida para resolver el problema de optimizacion H1. Empleando un proceso iterativo para el calculo del regulador H1, se
obtiene:
kTzw (j!)k1 = o = 0:480
Dado que o < 2, se consigue una mejora con respecto al regulador H2 anterior, en
el sentido de que se verica la desigualdad
kTzw k1 1
Dise~no de controladores H2 y H1 multivariables
308
con mas holgura. Las respuestas temporales de ambos reguladores, para un cambio
tipo escalon de [0; 5]T grados en la referencia, son muy similares; en la gura 11.26
se muestran para el regulador H1.
6
y2
y (gra)
4
2
0
y1
-2
0
20
40
60
80
100
120
140
160
180
200
60
70
80
90
100
t (seg)
60
u (gra)
40
u1
20
0
u2
-20
-40
0
10
20
30
40
50
t (seg)
Figura 11.26: Respuesta temporal controlador H1 (sensibilidad mixta)
Como se describe en el captulo 8, la responsabilidad de la atenuacion de las
perturbaciones que actuen sobre la planta, y de conseguir un seguimiento adecuado
a cambios de referencia, recae sobre las matrices de transferencia So(s) y So(s)G(s).
En la gura 11.27 se tienen los valores singulares de ambas para el controlador H1
(sensibilidad mixta). El comportamiento de So es totalmente satisfactorio,
[So(j!)] 1;
a baja frecuencia
como era de esperar del planteamiento hecho con el problema de sensibilidad mixta.
Sin embargo, no ocurre lo mismo con SoG; dado que segun se deduce de la gura
11.27, se pueden dar perturbaciones vectoriales, actuantes a la entrada de la planta,
que no sean atenuadas por el sistema.
Para conseguir una caracterstica similar a la del controlador ltr-o dise~nado
en la seccion anterior, se modica la funcion de coste de modo que Tzw incluya un
termino que pondere tambien al factor SoG, puesto que de lo visto en el captulo 8
Aplicacion de control robusto
309
20
sv(So) (db)
0
-20
-40
-60
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 0
10 1
10 2
w (rad/s)
sv(SoG) (db)
50
0
-50
-100
-150
10 -5
10 -4
10 -3
10 -2
10 -1
w (rad/s)
Figura 11.27: So y So G para controlador H1 (sensibilidad mixta)
se obtiene que el vector de error entre la referencia y la respuesta del sistema viene
dado por,
e = r y
= So (r do n) SoGdi
En el planteamiento general del problema de optimizacion realizado en el captulo
10, se considera el caso particular:
"
# "
#"
#
z1(s) = WS (s)So(s) WS (s)So(s)G(s)Wdi (s)
r(s)
z3(s)
WT (s)To (s) WT (s)So(s)G(s)Wdi (s)
di(s)
donde Wdi (s) se elige de forma que se especique, con los elementos (1,2) y (2,2) de
Tzw , el objetivo de conseguir como resultado un controlador que a baja frecuencia
satisfaga:
[So (j!)G(j!)] 1
(11:6)
Este objetivo puede alcanzarse (ver gura 11.30) tomando las siguientes matrices
Dise~no de controladores H2 y H1 multivariables
310
de ponderacion:
Wdi (s) = s +1 1 I
2
2
0
66 3:1623ss++72:210
:2768 10 5
WS (s) = 64
s + 3:6 10 2
0
3:1623s + 1:1384
2 3162:3s + 379:47
3 10
0
6
7
WT (s) = 64 3:1623s + 1200 3162:3s + 189:74 75
0
3:1623s + 600
5
3
77
75
En las guras 11.28 y 11.29 se muestran respectivamente las funciones de ponderacion WS , WT , as como WS Wdi y WT Wdi , para el caso del problema de rechazo
a las perturbaciones.
80
70
W_S
sv(W_S),sv(W_T) (db)
60
50
40
30
W_T
20
10
0
-10
-20
10 -6
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
rad/s
Figura 11.28: Respuestas en frecuencia de WS y WT
Con el regulador H2 se obtiene kTzw k1 = 1:533; mientras que el regulador H1,
consigue kTzw k1 = 1:195. En la gura 11.31 se muestra la respuesta temporal del
sistema con el controlador H1 para un cambio de consigna [0; 5]T grados.
Si se calculan los indicadores de robustez propuestos para los controladores
Aplicacion de control robusto
311
60
W_S W_di
sv(W_S W_di),sv(W_T W_di) (db)
40
20
W_T W_di
0
-20
-40
-60
-80
10 -6
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 3
10 4
rad/s
Figura 11.29: Respuestas en frecuencia de WS Wdi y WT Wdi
sv(So) (db)
50
0
-50
-100
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 0
10 1
10 2
w (rad/s)
sv(SoG) (db)
50
0
-50
-100
-150
10 -5
10 -4
10 -3
10 -2
10 -1
w (rad/s)
Figura 11.30: So y SoG controlador H1
Dise~no de controladores H2 y H1 multivariables
312
8
y2
y (gra)
6
4
2
y1
0
-2
0
50
100
150
200
250
300
200
250
300
t (seg)
60
u (gra)
40
u1
20
0
u2
-20
-40
0
50
100
150
t (seg)
Figura 11.31: Respuesta temporal controlador H1
dise~nados, se obtienen los resultados que se resumen en la tabla 11.3. Los valores de la tabla estan expresados: MF en grados, MG en decibelios y el resto en
tanto por ciento de incertidumbre tolerable.
I11i
%
H2 (s. mixta) 37
H1 (s. mixta) 45.2
H2
42.1
H1
31.7
Controlador
I12i
%
82.4
86.3
45.8
39.8
I11o
%
100
100
72.9
74.4
I12o
%
100
100
74.1
74.4
I1s
%
42.5
44.5
34.8
28.8
MG
db
37.6
72.1
12.3
9.1
MF
gra
74.9
80.6
58.7
58.2
I3o
%
68.1
73.5
51.8
52.3
I3i
%
51.0
55.6
37.9
33.2
Tabla 11.3: Indicadores de robustez de los controladores H2 y H1 (mlmv19)
Aplicacion de control robusto
313
11.5.2 Regulador H1 para una planta no lineal
En este apartado se va a dise~nar un controlador H1 para el modnl, cuyos objetivos
son: 1) obtener un rechazo adecuado de las perturbaciones ambientales (las cuales se
maniestan a la entrada y a la salida de la planta), y 2) una estabilidad robusta para
ciertos niveles de incertidumbre. Para ello, como se ha justicado en el apartado
anterior, se toma la siguiente matriz de transferencia:
"
WS (s)So(s) WS (s)So(s)G(s)Wdi (s)
Tzw = W
T (s)To (s) WT (s)So (s)G(s)Wdi (s)
#
y por tanto, en la funcion de coste,
kTzw k1
aparecen de manera explcita las matrices de transferencia So y SoG; las cuales son
como ya se ha indicado, las responsables directas que determinan la atenuacion de las
perturbaciones que actuen sobre la planta. Las respectivas matrices de ponderacion
(dependientes de la frecuencia) WS ; Wdi se eligen para conseguir tales objetivos. El
termino WT To se emplea para tener en cuenta la incertidumbre en el modelo de la
planta, y se elige de forma que se consiga una tolerancia a incertidumbres de tipo
multiplicativo de un 50% en el peor caso.
El modelo de la planta es no lineal, sin embargo para hacer el dise~no se emplea
un modelo linealizado, y posteriormente el controlador se prueba con el modelo
matematico no lineal. El regulador obtenido es suboptimo para las condiciones de
operacion para las que se ha realizado la linealizacion, por ello no esta garantizado
para el conjunto de puntos en su vecindad debido a la dinamica no lineal del sistema.
Sin embargo, el controlador se dise~na con unas buenas propiedades de robustez,
siendo los resultados obtenidos por simulacion satisfactorios.
Para una velocidad de crucero de 21 nudos se eligen (tras algunos ensayos, y
ayudado de los resultados obtenidos con el regulador ltr-i dise~nado en la seccion
anterior) las siguientes matrices de transferencia de ponderacion:
2
s + 0:072
66 3:1623s + 2:2768 10
WS (s) = 4
0
Wdi (s) = s +1 1 I
5
0
s + 3:6 10 2
3:1623s + 1:1384 10
5
3
77
5
314
Dise~no de controladores H2 y H1 multivariables
2 3162:3s + 379:47
0
6
WT (s) = 64 3:1623s + 1200 3162:3s + 189:74
0
3:1623s + 600
3
77
5
Con las cuales, el regulador H2 obtiene kTzw k1 = 1:046, y el H1 reduce dicho
valor a kTzw k1 = 0:91. En la gura 11.32 se muestran las respuestas en frecuencia
de [So(j!)] y [So (j!)G(j!)]; como puede comprobarse, ambas magnitudes son lo
sucientemente peque~nas en el rango de baja frecuencia. La gura 11.33 muestra
los niveles estimados de incertidumbre multiplicativa no estructurada tolerables por
el sistema a la entrada de la planta (iMi), y a la salida (iMo). Esta gura representa 1=(M ), donde M es el sistema de interconexcion para cada tipo particular
de incertidumbre. Si se trata de incertidumbre no estructurada, de la gura 11.33
se desprende que para el caso de incertidumbre multiplicativa situada a la entrada
de la planta Ei (donde G0 = G(I + Ei)), esta no causara la inestabilidad del sistema, siempre que kEik1 < 0:56 (o sea, que el sistema permite hasta un 56% de
incertidumbre relativa).
Igualmente, para el caso en que la incertidumbre este a la salida Eo (tal que
= (I + Eo )G) se obtiene que kEok1 < 0:66 (lo cual supone un 66% de incertidumbre tolerable en el caso mas desfavorable). Si se analiza la robustez del sistema
con respecto a incertidumbres estructuradas (estructura diagonal), se obtienen respectivamente unas tolerancias del 62% y 67% respectivamente, lo cual implica una
estimacion menos conservativa, ya que en estos casos se emplea 1=(M ), donde
(M ) es el valor singular estructurado de M .
G0
Para evaluar el comportamiento del controlador dise~nado frente a las perturbaciones ambientales, el sistema se somete a unas condiciones de navegacion caracterizadas por una altura signicativa de olas de 4m, corriente de 2m=s, y viento
con velocidad de 20m=s, actuando las perturbaciones en una direccion de 45 grados
relativa al curso de referencia del buque. Las respuestas temporales obtenidas se
muestran en las guras 11.34 y 11.35, en las que se puede comparar el comportamiento obtenido con el regulador H1 multivariable, y un controlador escalar que
no considera la naturaleza multivariable de la planta. Puede comprobarse que con
el regulador H1 se obtiene una mejora considerable en la reduccion del movimiento
de balance, as como en el mantenimiento del rumbo.
En la gura 11.36 se muestra el comportamiento obtenido con el mismo controlador para una velocidad de crucero de 18 nudos, diferente a la nominal empleada
para el dise~no. Para la implementacion del regulador en un computador digital se
emplea un controlador de tiempo discreto equivalente con un perodo de muestreo
Aplicacion de control robusto
315
sv(So) (db)
50
0
-50
-100
-150
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 2
10 0
10 1
10 2
w (rad/s)
sv(SoG) (db)
50
0
-50
-100
-150
10 -5
10 -4
10 -3
10 -2
10 -1
w (rad/s)
Figura 11.32: [So(j!)] y [So(j!)G(j!)]
1/sv(M) (db)
40
20
Multiplicativa a la entrada (iMi)
0
10 -5
10 -4
10 -3
10 -2
10 -1
10 0
10 1
10 -1
10 0
10 1
w (rad/s)
1/sv(M) (db)
40
Multiplicativa a la salida (iMo)
20
0
10 -5
10 -4
10 -3
10 -2
w (rad/s)
Figura 11.33: Tolerancias a incertidumbres (1=[M (j!)])
Dise~no de controladores H2 y H1 multivariables
316
5
heading (deg)
Controlador SISO
0
-5
0
50
100
150
200
250
300
350
400
450
500
300
350
400
450
500
t (sec)
5
heading (deg)
Controlador MIMO
0
-5
0
50
100
150
200
250
t (sec)
Figura 11.34: Rumbo para controladores SISO y MIMO
15
Controlador SISO
roll (deg)
10
5
0
-5
0
50
100
150
200
250
300
350
400
450
500
300
350
400
450
500
t (sec)
15
Controlador MIMO
roll (deg)
10
5
0
-5
0
50
100
150
200
250
t (sec)
Figura 11.35: Movimiento de balance para controladores SISO y MIMO
Aplicacion de control robusto
I11i
%
1: LTR-i 68.5
2: LTR-i 62.3
3: H2 52.3
4: H1 56.2
Contrl
I12i
%
78.7
69.8
58.3
61.9
317
I11o
%
60.7
60.5
63.7
67.3
I12o
%
71.7
63.1
63.7
67.3
I1s
%
44.4
37.6
31.3
33.5
MG
db
25.8
27.6
17.8
11.5
MF I3o I3i
gra % %
66.7 59.5 52.1 53.1
46 49.7 39.7
50.3 53.2 42.6
Tabla 11.4: Indicadores de robustez de los controladores para modnl
de 0:1 segundos (se utiliza para ello la transformacion bilineal, ver captulo 10). Se
emplea este perodo con el criterio de obtener unas respuestas temporales del sistema
en lazo cerrado equivalentes para el regulador de tiempo continuo y el de tiempo
discreto. En la tabla 11.4 se resumen los indicadores de robustez de los controladores
dise~nados para el modelo no lineal (modnl).
heading (deg)
5
0
-5
0
50
100
150
200
250
300
350
400
450
500
300
350
400
450
500
t (sec)
15
roll (deg)
10
5
0
-5
0
50
100
150
200
250
t (sec)
Figura 11.36: Comportamiento para condicion no nominal
318
Sntesis de los resultados obtenidos
11.6 Sntesis de los resultados obtenidos
En este apartado se trata de resumir y remarcar los principales resultados obtenidos
en los estudios llevados a cabo. De ello cabe destacar:
1. Se han realizado diversos dise~nos para el control de un sistema multivariable,
como es el control del rumbo y balance de un buque.
2. Para evaluar los diferentes dise~nos LTR, H2 y H1 se ha propuesto un conjunto
de indicadores de comportamiento y robustez.
3. El problema de dise~no de un sistema de control multivariable es sensiblemente
mas complejo que el de un sistema escalar. Sin embargo, los algoritmos empleados para resolver tales problemas se realizan en el espacio de estados y son
independientes de la dimension y caracter vectorial o escalar de la planta. Sin
embargo puede ser necesario emplear un metodo de calculo alternativo en algunos de los pasos intermedios del algoritmo, debido a los problemas numericos
que aparecen con mayor frecuencia en el caso de sistemas multivariables y/o
en sistemas de dimension elevada.
4. Se han empleado las metodologas LTR-i y LTR-o, en sus versiones de estructura basada en observador (cbo), o convencional, y no basada en observador
(cnbo). Mostrandose que para un mismo nivel de recuperacion es aconsejable,
en general, el empleo de la ultima, siempre que el sistema en lazo abierto presente elevada ganancia a baja frecuencia.
Ya que, para un nivel de recuperacion dado, proporciona unos reguladores mas
robustos y mas realizables desde un punto de vista de la aplicacion industrial.
En otro caso (para controladores que no aproximen la accion integral, como los
empleados para obtener respuestas sin sobre-oscilacion apreciable a cambios de
consigna tipo escalon), la estructura cbo se caracteriza por conseguir mejores
propiedades de robustez.
5. La eleccion de la sntesis LTR-i o de la LTR-o, va a depender de las especicaciones de dise~no y de que en cada caso concreto la eleccion de una de ellas sea
mas propicia para satisfacer tales especicaciones. As, si se conoce a priori
que los efectos de las incertidumbres del sistema pueden quedar reejados a la
salida de la planta, o si esta tiene mas salidas que entradas, sera mas ventajoso
emplear la metodologa LTR-o. Mientras que si la planta tiene mas entradas
que salidas y/o la incertidumbre puede considerarse que queda reejada a la
entrada de la planta, resulta mas aconsejable utilizar el metodo LTR-i.
Aplicacion de control robusto
319
6. El metodo de dise~no seguido para los reguladores H2 y H1, calcula en primera
fase un regulador H2, a partir del cual se obtiene el H1, con el que se consigue
disminuir el valor de la funcion de coste kTzw k1 obtenido con el dise~no H2.
La robustez del sistema, en general, mejora para el controlador H1, pero en
cada caso hay que examinarla, antes de decidir entre los reguladores H2 y H1.
7. Un regulador H1 suboptimo puede proporcionar unas propiedades de robustez
y comportamiento globalmente mas satisfactorias que el regulador H1 optimo.
8. Los resultados del empleo de una u otra metodologa de dise~no, van a depender
en gran manera de diversos factores:
(a) De los requerimientos de control que se precisen.
(b) Del modo en que estos se expresen de forma matematica.
(c) De la experiencia que se tenga a la hora de seleccionar los parametros de
dise~no.
(d) De seguir un procedimiento iterativo sistematico que simplique el dise~no
y reduzca el numero de iteraciones.
Se han obtenido buenos resultados con cada una de las metodologas analizadas: LTR, H2 y H1.
9. Se ha comprobado, al menos para los casos analizados, que un controlador H1 con prestaciones similares a un controlador LTR, requiere una dimension mayor, necesita perodos de muestreo sensiblemente inferiores y posee
propiedades numericas menos favorables; por lo que desde un punto de vista
practico, y en determinados casos concretos, podra ser mas recomendable el
empleo de controladores ltr (Lopez y Rubio, 1995b).
La metodologa H1 aborda de una forma explcita las especicaciones del sistema en lazo cerrado y los niveles de incertidumbre que el sistema de control
debe soportar, por lo que resulta mas simple la formulacion de ciertos problemas de control robusto. La metodologa LTR consiste sin embargo, en un
procedimiento indirecto, ya que trata con las funciones (matrices) de transferencia en lazo abierto, no pudiendose expresar de manera directa (a partir
de las matrices de ponderacion empleadas para el dise~no) los niveles de incertidumbre tolerables, teniendo que calcularse estos a posteriori. Por otro
lado, la metodologa H1 junto con el procedimiento de dise~no conocido como
sntesis- (Balas et al, 1991) puede proporcionar de forma directa reguladores
con un comportamiento robusto.
320
Sntesis de los resultados obtenidos
En general, se puede decir que ningun metodo proporciona la solucion total al
problema de dise~no; ya que con tecnicas diferentes, y con distintos grados de sosticacion, pueden obtenerse resultados similares. En cada caso particular habra que
determinar a partir de las caractersticas del sistema a controlar y de las exigencias
de dise~no, cual es la metodologa que proporciona los mejores resultados. Resulta
por tanto de interes el desarrollo de metodos iterativos informatizados para el ajuste
y seleccion automatizada de los parametros de dise~no, en funcion de unas especicaciones realizadas por el operador (cosa que no siempre es sencilla, especialmente
en el caso de sistemas multivariables). Integrando diferentes tecnicas de control robusto en un sistema que ofrezca al usuario la posibilidad de comparar y decidir la
estrategia de control que pueda conseguir mejores resultados, o que mejor se adapte
al problema concreto de dise~no.
Hay que remarcar que la teora de control en torno a los metodos H1 esta en
continua evolucion, as como el desarrollo de tecnicas de dise~no de controladores
multi-objetivos, tales como la conocida por H2=H1; existiendo la en actualidad
grandes esfuerzos de investigacion en torno a tales metodos (Doyle et al. 1994,
Haddad et al, 1994; Rotea et al, 1991; Stoorvogel, 1992; Khargonekar et al, 1991;
Green y Limebeer, 1995; Grimble, 1994).
Apendice A
Analisis de los sistemas de control
basados en observador
A.1 Analisis de robustez con y sin observador
Sea un sistema de control por realimentacion del vector de estado, y el correspondiente sistema que emplea un observador para estimar el estado del proceso, tal como
muestran las guras A.1 y A.2 respectivamente. Entre los esquemas correspondientes
de estas guras (Doyle y Stein, 1979), se cumplen las siguientes propiedades:
1. La funcion de transferencia de los bucles cerrados es la misma en ambos casos.
2. La funcion de transferencia en bucle abierto abriendo en el esquema de la
G(s)
r -as B
- 6
b s
(s)
Kc C
-
x
Figura A.1: Realimentacion del vector de estado
321
y
322
Analisis de robustez con y sin observador
r
0
- j u (1)t (2)t u - 6
-
u^
Kc
y
Planta
-
B
?j
(s)
-
Ko
j
6
C
Figura A.2: Diagrama del controlador LQG
gura A.2 por el punto (1) es la misma. En efecto:
en la gura A.1, u = Kc x = KcB u0
en la gura A.2, u = Kc x^ = KcB u0
ya que x^ = Bu0, al tener los dos sistemas (planta y observador) la misma
se~nal de entrada.
3. Las funciones de transferencia abriendo en el esquema completo (A.2) por (2)
son diferentes. Se puede demostrar que solo son iguales si se modica Ko ,
pasando a depender de un parametro q y tendiendo este a innito. Ello se
demostrara en la proxima seccion.
El hecho de que sean distintos en este caso, se debe a que la dinamica del
error del observador (y y^) es tenida en cuenta, si se rompe el bucle (o si
se introducen perturbaciones) por (2), cosa que no ocurre si se abre por (1)
(A.2).
-
Analisis de los sistemas de control basados en observador
323
A.2 Condicion suciente para la recuperacion
A continuacion se va a desarrollar la condicion suciente para que el bucle abierto
lqg tienda al lqr. A partir de la gura A.1 se tiene que la funcion de transferencia
en lazo abierto (que relaciona la se~nal que entra por el punto a y sale por el punto
b) del regulador lqr viene dada por,
Hc(s) = LLQR (s) = Kc(sI A) 1B
(A:1)
Para ello, se hacen depender las ganancias del ltro de Kalman de un determinado
parametro q. Si se cumple que:
Ko(q) = BW
(A:2)
lim
q!1 q
siendo W cualquier matriz no singular entonces; el bucle abierto lqg se aproxima
asintoticamente al lqr.
En efecto, la funcion de transferencia de bucle abierto con observador viene dada
por,
LLQG = Kc(sI A + BKc + KoC ) 1Ko C B
(A:3)
Si se hace = (sI A + BKc) 1 y teniendo en cuenta el lema de inversion de
matrices,
(A + BCD) 1 = A 1 A 1 B (C 1 + DA 1 B ) 1DA 1
(A:4)
dicha expresion, puede ser escrita como:
LLQG = Kc[ Ko(1 + C Ko) 1 C ]Ko C B =
= [KcKo KcKo(1 + C Ko) 1 C Ko] C B =
= [KcKo(1 (1 + C Ko) 1 )C Ko] C B =
= KcKo(1 + C Ko) 1 C B
(A.5)
Si en esta ultima expresion se aplica la condicion de recuperacion dada por la
expresion (A.2), se tiene,
LLQG = KcqBW (1 + C qBW ) 1 C B
que cuando se hace tender q a innito se reduce a:
LLQG = KcBW (C BW ) 1 C B
324
Condicion suciente para la recuperacion
Aplicando a esta ultima expresion, nuevamente el lema de inversion de matrices
(A.4) y sustituyendo por su valor se llega a,
LLQG =
=
=
=
KcBW (C BW ) 1 C B =
KcBW (1 + KcB ) 1 [C BW (1 + KcB ) 1 ]
KcBW (C BW ) 1 C B =
KcB
1
C B =
Luego la expresion nal que se obtiene es,
LLQG(s) = KcB
la cual es identica a la expresion (A.1) correspondiente a LLQR (s). Con esto queda
demostrada la convergencia al tender el parametro q a innito, de las funciones de
transferencia en bucle abierto, cuando se tiene una estructura de realimentacion
directa del estado o con un observador (ltro de Kalman).
Para que Ko cumpla la condicion de recuperacion se tendra que introducir alguna
modicacion en el ltro de Kalman. Para ello, se dise~na el ltro de Kalman con unas
matrices de covarianzas cticias. Se tomaran:
Q = Qo + q2 BV B T
R = Ro
(A.6)
(A.7)
siendo V cualquier matriz no singular y donde Qo y Ro son las matrices de covarianzas nominales de w y v; y q es un parametro escalar conocido como ganancia de
recuperacion.
Con estas modicaciones se calcula el ltro de Kalman:
Ko = PC T R 1
AP + PAT + Q PC T R 1CP = 0
(A:8)
(A:9)
Introduciendo las anteriores matrices de covarianzas en la ecuacion (A.9), resulta:
AP + PAT + Qo + q2BV B T PC T R 1CP = 0
(A:10)
Analisis de los sistemas de control basados en observador
y dividiendo la expresion por q2 se llega a,
A qP2 + qP2 AT + Qq2o + BV B T q2( qP2 )C T R 1C ( qP2 ) = 0
325
(A:11)
Hay que destacar el hecho de que en la anterior ecuacion (A.11), existen dos tipos
de variables: q, que es el parametro cuyo valor se modica para recuperar la funcion
de transferencia, y la matriz P , de la cual dependen los valores de las ganancias
del ltro de Kalman y que solo puede ser encontrada una vez asignado a q un valor
determinado.
Por tanto, si se hace tender q a innito se tendra:
! BV B T
q2( qP2 )C T R 1 C ( qP2 ) q!1
y teniendo en cuenta el valor de Ko (ecuacion A.8), se tiene:
Ko(q)RKoT (q) q!1
! BV B T
q2
que descomponiendo lo anterior se llega a:
1 1 1
Ko(q) q!1
2 2
!
B
V
| (R{z ) } = BW
q
W
Se cumple, por tanto, la condicion de recuperacion (ecuacion A.2).
Se calculara, por tanto, el ltro de Kalman a partir de la matriz de covarianza
modicada, de este modo, a medida que se aumente el valor del parametro q mas
cerca se estara de la funcion de transferencia en bucle abierto del lqr. Al hacer
esto, se pierde precision en la estimacion del estado, ya que se esta calculando el
ltro de Kalman con unas covarianzas cticias, sin embargo, se gana en robustez.
A.3 Planteamiento del Metodo LQG en el Dominio de la Frecuencia
La ecuacion de Riccati se puede interpretar en el dominio de la frecuencia, de forma
que proporcione expresiones en terminos de funciones de transferencia. Sea el sis-
326
Planteamiento del Metodo LQG en el Dominio de la Frecuencia
tema,
x_ = Ax + Bu
(A:12)
donde u es de dimension 1 por simplicidad, y sometido al criterio de funcionamiento:
J=
Z1
0
(xT Qcx + u2) dt
(A:13)
Se supone r = 1 sin perdida de generalidad, ya que puede ser englobado en los
elementos de la matriz Qc. La ecuacion de Riccati correspondiente viene dada por:
AT Pc + PcA PcBR 1B T Pc + Qc = 0
que a su vez puede ser reordenada de la forma:
Pc A AT Pc = Qc PcBB T Pc
Sumando y restando sPc al primer miembro se tiene:
Pc(sI A) + ( sI AT )Pc = Qc PcBB T Pc
que llamando (s) = (sI A) 1 conduce a:
Pc 1 (s) + T 1 ( s)Pc = Qc KcT Kc
Premultiplicando por B T T ( s) y postmultiplicando por (s)B se llega a:
B T T ( s)Pc | 1 ({z
s)(s}) B + B T | T ( s){zT 1 ( s)} Pc(s)B =
I
I
T
B T T ( s)[Qc KcT Kc](s)BB T T ( s) P|{z}
cB + B
| {zP}c (s)B =
B T T ( s)Qc(s)B B T T (
Kc
KcT
s)KcT Kc(s)B
Analisis de los sistemas de control basados en observador
327
La funcion de transferencia en bucle abierto cuando se aplica la ley de control
lqr es Hc = Kc (s)B = B T T (s)KcT , luego la anterior expresion se puede escribir:
HcT ( s) + Hc(s) = B T T ( s)Qc(s)B HcT ( s)Hc(s)
(A:14)
que a su vez se puede reescribir de la forma:
[1 + HcT ( s)][1 + Hc(s)] = 1 + B T T ( s)Qc (s)B
(A:15)
Se dene: Fc(s) 1 + Hc(s), y Fc(s) se conoce como la funcion de diferencias
del retorno.
Ahora supongase el segundo miembro de (A.15) factorizado de la forma (factorizacion espectral):
1 + B T T ( s)Qc(s)B = c(s)c( s)
(A:16)
se tiene entonces que (A.15) se puede reescribir:
Fc(s)Fc( s) = c(s)c( s)
y por tanto:
Fc(s) = c(s)
con lo que se llega a la expresion que da la funcion de transferencia del sistema en
bucle abierto, con la realimentacion de las variables de estado:
Hc(s) = c(s) 1
Observese que mediante la factorizacion espectral anterior se ha resuelto la
ecuacion de Riccati al determinar c(s). En efecto se ha obtenido Hc (s), lo cual
es equivalente a determinar Kc, ya que ambas vienen relacionadas por la expresion
Hc(s) = KcB . Es decir, manipulando exclusivamente funciones de transferencia
se llega a determinar la solucion al problema lqr.
Una vez demostrado lo anterior se puede comprobar lo que se haba armado
sobre la robustez de los reguladores lqr.
Si se factoriza Qc de la forma Qc = M T M y se hace s = j! en la ecuacion de
Riccati (A.15) se obtiene:
328
Planteamiento del Metodo LQG en el Dominio de la Frecuencia
j 1 + Hc(j!) j2= 1+ j M (j!)B j2
de donde:
k1 + Hc(j!)k > 1
(A:17)
Si se interpreta esta condicion en el plano polar, la curva de Hc(j!) no puede
entrar dentro de un crculo de centro ( 1; 0) y radio 1, por lo que se asegura un
margen de fase mayor de 60 grados y un margen de ganancia innito.
Un desarrollo analogo para el problema de la observacion llevara a un resultado
del mismo tipo. Para el ltro de Kalman se tiene que la matriz de ganancia del
observador esta dada por,
Ko = PoC T
obteniendose esta de la ecuacion de Riccati:
APo + PoAT + Qo PoC T CPo = 0
Si se dene la funcion de transferencia en bucle abierto del observador como la
que resulta de cortar el bucle del ltro de Kalman por el punto (1) en la gura A.2,
se tendra:
Ho = C Ko
(A:18)
Y efectuando un desarrollo similar al realizado para el control se llegara a:
Ho(s) = o (s) 1
con:
o (s)o( s) = 1 + C (s)QoT ( s)C T
(A:19)
Lo que se obtiene no es Ko, sino Ho(s), pero ambos resultados, como se ha visto,
son equivalentes.
Procedimiento de calculo
De lo desarrollado en esta seccion se puede resumir que mediante la manipulacion
de funciones de transferencias, se llega a resolver el problema lqg. El procedimiento
sera especicar la matriz Qc en forma factorizada como Qc = M T M , lo cual es
equivalente a especicar la funcion de transferencia Gc(s) = M (s)B . A partir de
Analisis de los sistemas de control basados en observador
329
esta funcion de transferencia y mediante la factorizacion de la ecuacion de diferencias
del retorno:
[1 + HcT ( s)][1 + Hc(s)] = 1 + GTc ( s)Gc(s)
(A:20)
se puede llegar a deducir Hc(s), funcion de transferencia de bucle abierto del lqr.
De forma analoga, especicando la matriz Qo en forma factorizada como Qo =
o bien especicar la funcion de transferencia Go(s) = C (s) , y mediante la
factorizacion de la ecuacion de diferencias del retorno:
[1 + Ho(s)][1 + HoT ( s)] = 1 + Go (s)GTo ( s)
(A:21)
se puede calcular Ho(s).
T
Con estas dos funciones de transferencia: Hc(s); Ho(s), se pueden calcular las
ganancias de la ley de control y del ltro de Kalman Kc y Ko, ya que estan directamente relacionadas por las expresiones (A.1) y (A.18) rese~nadas anteriormente.
A.4 Regulador LQG obtenido mediante ecuacion
diofantica
A continuacion se deduce una ecuacion diofantica, que puede ser utilizada como
alternativa para obtener la expresion del regulador lqg. Este regulador a partir de
la (ecuacion A.3) viene dado por,
GR (s) = Kc(sI A + BKc + KoC ) 1Ko
(A:22)
que operando como se ha visto en la seccion (A.2), se llega a la expresion (A.5) de
la funcion de transferencia en bucle abierto, y por tanto para el regulador sera,
GR(s) = KcKo(1 + C Ko) 1
(A:23)
Utilizando nuevamente el lema de inversion de matrices (A.4) se obtiene la expresion:
GR (s) = [KcKo KcB (1 + C B ) 1 KcKo ](1 + C Ko) 1
(A:24)
que llamando kk(s) = KcKo , y teniendo en cuenta las expresiones de Gc (A.1) y
Go (A.18), puede escribirse,
GR (s) = [kk Gc(1 + Gc) 1 kk](1 + C Ko) 1 =
= [kk(1 Gc(1 + Gc) 1)][1 + C Ko C B (1 + Gc) 1kcKo] 1 =
= kk(1 + Gc) 1[1 + Go Gp(1 + Gc) 1 kk] 1
(A.25)
330
Regulador LQG obtenido mediante ecuacion diofantica
GR(s) = 1 + G + G +kkG G G kk
c
o
c o
p
GR(s) = (1 + G )(1 +kkG ) G kk
c
o
p
(A:26)
(A:27)
Esta expresion da una relacion en terminos de funciones de transferencia para
el regulador lqg. Si se expresan las funciones de transferencia deseadas Gdc y Gdo
como cociente de dos polinomios en s, y sustituyendo en la expresion (A.27) se tiene:
Gdc(s) = nd1((ss)) y Gdo (s) = nd((ss))
1
(A:28)
(s)
kk(s)d1(s)
nr (s) (A:29)
GR (s) = (s) kk
=
=
c(s)o (s) n(s)kk(s)d1(s) dr (s)
c
o (s) n(s)kk(s)
d
(
s
)
d1(s)d(s)
d(s)
donde c(s) es el factor positivo procedente de la factorizacion del termino derecho
de la ecuacion (A.20) y o(s) el correspondiente a la ecuacion (A.21).
A partir de la ecuacion (A.29), se puede llegar a la ecuacion diofantica que
permite obtener la expresion del regulador mediante la manipulacion de polinomios
en s, donde nr (s) y dr (s) son las incognitas. En efecto, haciendo nr (s) = kk(s)d1(s),
se tiene:
c(s)o(s) = dr (s) d(s) + n(s) nr (s)
(A:30)
Apendice B
Elementos matematicos utiles en
la teora de control
B.1 Polos y ceros de un sistema multivariable
Sea un sistema lineal e invariante en el tiempo (slit) descrito por el conjunto de
ecuaciones:
x_ (t) = Ax(t) + Bu(t)
y(t) = Cx(t) + Du(t)
(B.1)
donde x 2 <n es el vector de estados, y 2 <p es el vector de medidas y u 2
<m es el vector de control. Siendo A; B; C; D matrices constantes de dimensiones
compatibles.
Se denen los polos del sistema como los autovalores o valores propios de la
matriz A.
Supuesto que:
El conjunto de matrices (A; B; C; D) constituyen una realizacion mnima de
la matriz de transferencia de la planta G(s).
El numero de salidas no es inferior al de entradas: p m.
se denen los ceros de transmision del sistema B.1 como el conjunto de numeros
331
332
Polos y ceros de un sistema multivariable
complejos z, los cuales satisfacen la siguiente desigualdad (Zhang y Freudenberg,
1990):
"
#
zI
A
B
rango
C D <n+m
siendo la multiplicidad de z igual a su multiplicidad algebraica.
Si el sistema G(s) tiene algun cero en el semiplano complejo derecho se dice que
es de fase no mnima; en caso contrario de fase mnima.
El sistema B.1 es estable si y solamente si todos sus polos estan en el semiplano
complejo de la izquierda.
Criterio de Nyquist generalizado
A traves de los autovalores del sistema en lazo cerrado se determina si un sistema
de control es estable. Igualmente, esto se podra inferir a partir de la aplicacion
del teorema de Nyquist. Para sistemas multivariables tiene la siguiente expresion
(MacFarlane, 1977):
r
X
i=1
N ( 1; i[L(s)]; D) = Pol
donde:
L(s) matriz de transferencia en lazo abierto de dimensiones r r.
D contorno semicircular de Nyquist, de radio innito que envuelve al semiplano
complejo derecho, y que evita los polos de L(s) en el eje imaginario rodeandolos
con semicrculos de radio innitesimal.
Pol numero de polos inestables de L(s).
N numero de vueltas en sentido horario del lugar de Nyquist en torno al punto
( 1; 0).
i autovalores o valores propios.
Elementos matematicos utiles en la teora de control
333
B.2 Normas
Se dene una norma k : k en un espacio vectorial V (denido sobre un conjunto con
estructura de cuerpo C ), como una operacion con las propiedades:
kvk
kvk
k v k
kv+w k
> 0 8v 2 V; v 6= 0
= 0,v=0
= j jk v k 8 2 C; v 2 V
k v k + k w k 8v; w 2 V
Sea C el conjunto de los numeros complejos. Para V = C n, se dene la norma-p
para el vector v = (v1; : : : ; vn) 2 V como:
k v kp= (j v1 jp + : : : + j vn jp)1=p
Las tres normas mas utilizadas son para p = 1; 2; 1, con:
k v k1= max
j vi j
i
Si se trata de V = C nn los elementos de V seran las matrices complejas M de
orden n. Algunas normas usuales son:
sX X
1. Norma de Frobenius:
k M kF =
2. Norma 1:
k M k1= max
j
3. Norma 1:
k M k1= max
i
4. Norma espectral:
k M k2 = max
(M H M )
i i
r
i
j
X
i
X
j
j mij j2
j mij j
j mij j
Algunas relaciones utiles son:
k M k22 k M k2F = traza(M H M ) n k M k22
334
Los Valores Singulares
Una norma matricial que satisfaga la condicion:
k MN k k M kk N k
se denomina compatible. Se tiene una cota inferior para cualquier norma matricial
compatible:
(M ) k M k
donde (M ) es el radio espectral de M :
(M ) = max
j i(M ) j
i
Se dene la norma inducida de la matriz M como:
k
k M k= sup kkMv
vk
v6=0
La norma inducida tiene las siguientes propiedades:
1. k Mv k k M k k v k
2. k M k = j j k M k
3. k M + N k k M k k N k
4. k MN k k M k k N k
B.3 Los Valores Singulares
Los valores singulares (sv) de una matriz G se denen como :
q
i (G) = i(GH G) i = 1; 2; : : : ; k
donde i representa un autovalor y k = min(r; m); siendo m el numero de columnas
de G y r su numero de las.
Si los valores singulares se ordenan de forma que i i+1 , los valores singulares
extremos seran:
= 1 = k
Elementos matematicos utiles en la teora de control
335
La descomposicion en valores singulares (svd) de una matriz G queda de la
forma:
!
0
G = (U1 U2) 0 0 (V1 V2)H
G = USV h =
con:
n
X
uiviH i
i=1
Gvi = iui
uHi G = vihi
S = diag[1 ; 2; : : : ; n]
V = [v1 ; v2; : : : ; vn]
U = [u1; u2; : : : ; un]
UU H = I; V V H = I
Los valores singulares son los elementos de la diagonal principal de S , las columnas de la matriz U son los denominados vectores singulares por la izquierda (o
tambien direcciones principales de salida) y las de V son conocidos como vectores
singulares por la derecha (o direcciones principales de entrada).
Algunas propiedades utiles de los valores singulares son:
1.
k Gx k
(G) = max
x6=0 k x k
2.
k Gx k
(G) = min
x6=0 k x k
3.
(G) j i (G) j (G)
4. Si G es no singular:
(G) = (G1 1)
5. Si G es no singular:
(G) = (G1 1)
6.
(G) =j j (G)
7.
(G + H ) (G) + (H )
8.
(GH ) (G)(H )
336
Los Valores Singulares
9.
10.
11.
12.
(G) (H ) (G + H ) (G) + (H )
p
maxf(G); (H )g (GH ) 2 maxf(G); (H )g
n
X
i2 = Traza(GhG)
i=1
max
j gi;j j (G) n max
j gi;j j
i;j
i;j
Valor Singular Estructurado
Se dene el valor singular estructurado (ssv) (Doyle, 1982) de una matriz M ,
como la inversa del valor singular maximo de una matriz E que anule el determinante
det (I ME ), y cero en otro caso. O sea:
1
(M ) = min
f = det (I ME ) = 0 para algun E 2 X g
Donde X es el conjunto de matrices caracterizado por una determinada estructura diagonal de bloques Ei estables:
X = fE = diag fEig = [Ei ] g
(B:2)
La denicion de (M ) supone una generalizacion del radio espectral (M ) =
max (M ), y del maximo valor singular (M ). En el caso particular donde se dene
X de la forma:
X=1 = fE = I = j j 1g
se tiene que (M ) = (M ) . Y si ocurre que E es una matriz que no tiene estructura
diagonal de bloques, entonces (M ) = (M ).
Algunas propiedades utiles del valor singular estructurado son:
1. Para la matriz unidad I :
2. Para todo escalar :
3. Acotamiento:
(I ) = 1
(M ) =j j (M )
(M ) (M ) (M )
Elementos matematicos utiles en la teora de control
337
4. Para A; B matrices cuadradas:
(AB ) (A)(B )
5. Para cualquier E 2 X :
(E ) = (E )
6. Sea D el conjunto de matrices reales diagonales positivas: D = diag fdiIig,
donde el tama~no de cada bloque (diIi) coincide con el de los bloques Ei . Si
D 2 D y E 2 X , entonces DED 1 2 X , cumpliendose que:
(DMD 1) = (M )
de lo anterior, y teniendo en cuenta la propiedad 3 se obtiene:
(M ) (DMD 1) 8D 2 D
7. A partir de la propiedad anterior se deriva un metodo para el calculo de una
cota de (M ):
(M ) Dinf
(DMD 1)
2D
Se demuestra, que la igualdad se alcanza hasta un maximo de tres bloques.
Para un numero mayor de bloques se consigue una cota ajustada (Morari et
al, 1989; Thompson, 1988).
B.4 Los Valores Propios
Los valores singulares de matrices de funciones racionales (Matrices de Transferencia) no son funciones analticas, por lo que a diferencia del caso escalar no se tiene
una expresion analtica que relacione la ganancia y la fase del sistema (Freudenberg
et al, 1988).
Para el caso de sistema escalar de fase mnima se tiene que cuando j KG j 1
(zona proxima a frecuencia de cruce de ganancia !c) se tiene que:
j 1 + KG jj 1 + (KG) 1 j 2 j sen(( + )=2) j
siendo + el margen de fase (mf) del sistema.
Los autovalores de un sistema multivariable s satisfacen las propiedades matematicas requeridas, pero no se relacionan directamente con la calidad del dise~no en
lazo cerrado y no estan denidos para matrices de transferencias no cuadradas.
338
Los Valores Propios
A pesar de ello, para el caso de sistema multivariable se desarrollan unas relaciones similares a las anteriores, empleando los valores propios de las matrices de
transferencia I + GK y I + (GK ) 1. Teniendo en cuenta que para cualquier matriz
cuadrada Q:
(Q) j (Q) j (Q)
se pueden acotar superiormente al valor singular mnimo e inferiormente al valor
singular maximo.
Para un sistema con matriz de transferencia G cuadrada se realiza la factorizacion
o descomposicion en valores caractersticos (cvd) dada por:
G = W W 1
donde las columnas de W son los autovectores (o vectores propios) de G y es una
matriz diagonal formada por los autovalores (o valores propios) de G:
= diag fig
Se obtienen unas propiedades muy utiles y sencillas de manejar:
i[I + GK ] = 1 + i(GK )
i [I + (GK ) 1] = 1 + 1=i(GK )
As, cuando j i (GK ) j= 1 para algun i y ! = !c se tiene:
j i(I + GK ) j=j i[I + (GK ) 1] j= 2 j sen[( + i )=2] j
que es analoga, para cada i, a la obtenida en el caso escalar.
Por tanto, como j i j acota a , se puede emplear el valor de ( + i ) como
argumento para evaluar un dise~no, ya que si + i es peque~no en la zona de cruce,
el sistema exhibira una robustez pobre (Doyle y Stein, 1981).
Generalizacion de los conceptos de Margenes de Estabilidad
El analisis con los i(j!) da un conocimiento sobre la estabilidad del sistema.
Pueden extenderse los conceptos escalares de margen de ganancia (MG) y margen
de fase (MF) para el caso vectorial deniendo:
MG = min
fMG(i )g ; MF = min
fMF (i )g
i
i
Elementos matematicos utiles en la teora de control
339
donde para cada i[L(j!)] se obtiene un diagrama de Nyquist (escalar) as como
unos margenes de estabilidad (MGi ; MFi ) asociados.
Hay que tener en cuenta que en el caso multivariable la existencia de unos
margenes de fase y ganancia (tal y como se denen arriba) excelentes, no va a
indicar necesariamente (a diferencia de lo que ocurre en el caso escalar) que el sistema tenga una robustez tambien excelente. Sin embargo, s se puede armar lo
contrario: si se obtienen unos margenes de estabilidad (MF; MG) inaceptables, ello
sera indicativo de que la robustez del sistema no es satisfactoria (Doyle y Stein,
1981). Es por ello que algunos autores los caliquen como indicadores de robustez
cualitativos (Lunze, 1989).
B.5 La Matriz de Ganancia Relativa
En algunos casos la incertidumbre o errores de modelado de un sistema pueden
describirse en terminos de las incertidumbres de los elementos de la matriz de transferencia, por ejemplo como producto de una identicacion experimental.
Si G(j!) es la matriz de transferencia de un sistema, esta se hara singular a una
frecuencia ! si se produce un cambio relativo de 1=ij (j!) en su elemento gij (j!)
(Postlethwaite et al, 1993), y no se hara singular mientras se cumpla:
1
j gij0 (j!) gij (j!) j< (j!
)
ij
Los valores ij (j!) son los elementos de la matriz [G(j!)] llamada Matriz de
Ganancia Relativa (rga), obteniendose de:
[G(j!)] = G(j!): (G(j!) 1)T
donde : indica producto elemento a elemento (o de Schur) de dos matrices.
Por tanto, los elementos de rga dan una medida directa de la sensibilidad a
la incertidumbre en el sistema elemento a elemento. Matrices con valores elevados
de los elementos de rga se haran singulares para peque~nos errores relativos en sus
elementos.
Se verican las propiedades siguientes:
1.
X
X
ij = ij = 1
i
j
340
La Matriz de Ganancia Relativa
2. Independencia de escalados. Para dos matrices reales y diagonales D1 ; D2 se
cumple:
(D1 GD2) = (G)
3. Al menos para sistemas con dos entradas y dos salidas se verica:
k (G) km (1G) k (G) km
donde (G) es el numero de condicion de G o relacion entre sus valores singulares extremos para cada frecuencia !:
(j!)]
[G(j!)] = [[G
G(j!)]
Se cumple que:
k (G) km = 2 maxfk (G) k1; k (G) k1g
Dado que va a depender de las unidades que se empleen para representar al
sistema, existen unas para las que toma su valor mnimo . Se consigue si se
escala la planta de forma adecuada por un par de matrices reales diagonales
D1 ; D2:
(G) = Dmin
(D1GD2)
;D
1 2
Se tendra por tanto que un sistema con un elevado tendra tambien un valor
grande de los elementos de RGA. E igualmente sistemas con altos elementos de
RGA tendran tambien elevados valores de . En este caso se dice que la planta
esta mal condicionada, lo que implicara en general algunos problemas adicionales
para realizar su control (Morari et al. 1989), as como una mayor sensibilidad a las
incertidumbres relativas en sus elementos de la matriz de transferencia del sistema.
Otro aspecto importante a tener en cuenta en el analisis de robustez consiste en
que la rga tambien sirve como indicador de la robustez del sistema a incertidumbres
multiplicativas diagonales que se presenten a la entrada de la planta. Como es el
caso de las incertidumbres independientes debidas a la dinamica no modelada de los
actuadores. En ese caso, la incertidumbre E (s) se representa:
E (s) = diagfei(s)g
y la planta real G0 estara relacionada con la nominal G por:
G0(s) = G(s)[I + E (s)]
Elementos matematicos utiles en la teora de control
341
La matriz de transferencia en lazo abierto real queda:
G0K = G(I + E )K = GK (I + K 1EK )
o de forma equivalente:
G0K = G(I + E )K = (I + GEG 1)GK
Las matrices de error correspondientes a cada expresion anterior a su vez pueden
ponerse como:
X
(K 1EK )ii = ji(K )ej
j
(GEG 1 )ii =
X
j
ij (G)ej
Si tanto la planta G, como el controlador K tienen valores elevados en los elementos de RGA, el sistema de control sera especialmente sensible a incertidumbres
tipo multiplicativo situadas a la entrada de la planta. Lo anterior se dara por ejemplo para una planta mal condicionada en caso de emplear un controlador que realice
una inversion de la planta en determinadas frecuencias para conseguir reducir la
interaccion entre los diferentes canales o lazos de control del sistema.
342
La Matriz de Ganancia Relativa
Apendice C
Deniciones y algoritmos
relacionados con la teora H1
C.1 Algunas deniciones
A continuacion se denen los espacios de Hardy H2 y H1, los cuales son ampliamente tratados en los temas relacionados con las teoras de control optimo y robusto
H2; H1, as como en problemas mixtos H2=H1. En primer lugar se denen para el
caso del problema escalar.
El espacio de Hardy H1 consiste en el conjunto de funciones F (s) de la variable
compleja s = + j!, las cuales son analticas y estan acotadas en el semiplano
complejo de la derecha, Re s > 0. Se dene la norma H1 de F como:
kF k1 = supfj F (s) j: Re s > 0g
Dado que en la teora de control se trabaja con funciones y matrices de transferencia
con coecientes reales, se dene el subconjunto,
RH1 H1
En este caso, y empleando el teorema del modulo maximo (Churchill et al, 1978;
Spiegel, 1971), basta con emplear s = j!, y por tanto:
kF k1 = supfj F (j!) j: ! 2 <g
El espacio de Hardy H2 consiste en el conjunto de funciones F (s) de la variable
343
344
Algunas deniciones
compleja s = + j!, las cuales son analticas en el semiplano complejo de la derecha
(Re s > 0), y que satisfacen la condicion,
1
kF k22 = sup
>0 2
Z1
1
j F ( + j!) j2 d! < 1
Y limitandose al caso de coecientes reales (espacio RH2), se tiene que para
calcular la norma H2 , basta con integrar a lo largo del eje imaginario s = j!:
kF k22
1 Z1
=
j F (j!) j2 d!
2 1
Para el caso vectorial, se denen de forma similar empleando las deniciones
para sistemas multivariables de norma H2 y norma H1:
kF k22 = 21
Z1
0
traza[F T ( j!)F (j!)]d!
[F (j!)]
kF k1 = sup
!
En la bibliografa relacionada con la teora de control H1 se emplea una determinada nomenclatura para indicar los diferentes conjuntos que se utilizan. A
continuacion se presenta un resumen de esta, a n de identicar de forma sencilla y
directa cada uno de dichos conjuntos (Francis, 1987):
L2 : Conjunto de funciones (matrices) de transferencias estrictamente propias y sin
polos en el eje imaginario.
H2 : Conjunto de funciones (matrices) de transferencias estrictamente propias y
estables.
L1 : Conjunto de funciones (matrices) de transferencias propias y sin polos en el
eje imaginario.
H1 : Conjunto de funciones (matrices) de transferencias propias y estables.
Deniciones y algoritmos relacionados con la teora H1
345
RL2 : Conjunto de funciones (matrices) de transferencias con coecientes reales,
estrictamente propias y sin polos en el eje imaginario.
RH2 : Conjunto de funciones (matrices) de transferencias con coecientes reales,
estrictamente propias y estables.
RL1 : Conjunto de funciones (matrices) de transferencias con coecientes reales,
propias y sin polos en el eje imaginario.
RH1 : Conjunto de funciones (matrices) de transferencias con coecientes reales,
propias y estables.
C.2 El operador de Riccati
Sean A; Q; R matrices cuadradas de dimension n, con R y Q simetricas. Se dene
la matriz Hamiltoniana asociada como:
"
#
A
R
H = Q AT
Si se supone que H no tiene autovalores en el eje imaginario, y que existe una
matriz T que hace la siguiente particion:
T 1HT =
"
A11 A12
0 A22
#
(C:1)
con la propiedad de que la matriz A11 tiene todos sus autovalores con parte real
negativa; y que a su vez T puede ponerse como:
T =
entonces la matriz
"
T11 T12
T21 T22
#
(C:2)
X = T21 T111
estara determinada de forma unica por H . O dicho de otra forma, se puede establecer una correspondencia o funcion (denominada tambien operador de Riccati),
representada por Ric, entre el conjunto de matrices Hamiltonianas fH g y el conjunto
de matrices fX g:
X = Ric (H )
346
El problema de aproximacion de Hankel
el dominio de esta funcion se representa por dom (Ric), y consta del conjunto de
matrices Hamiltonianas H que no tienen autovalores en el eje imaginario, y para las
que existe una matriz de transformacion T que particiona a H en la forma dada por
la ecuacion C.1, con todos los autovalores de A11 con parte real negativa.
Se tiene ademas que la matriz X es simetrica, y resulta ser la solucion de la
ecuacion algebraica de Riccati (Doyle et al. 1989):
AT X + XA + XRX Q = 0
por lo que se suele decir que H es la matriz Hamiltoniana asociada a la ecuacion
algebraica de Riccati anterior.
C.3 El problema de aproximacion de Hankel
A continuacion se describe otro planteamiento del problema de ajuste del modelo
(M-M), basado en el problema de aproximacion de Hankel; y que es la base del
algoritmo de Doyle y Glover para resolver el problema H1 en el espacio de estados,
as como otros algoritmos relacionados con problemas H1.
Se plantea el problema de minimizar,
kT1 + T2QT3 k1
Segun las dimensiones relativas de T1; T2 ; T3 se pueden dar varias situaciones conocidas como problemas de uno, dos y cuatro bloques respectivamente. En primer
lugar se va a considerar el caso en que se supone que T1 ; T2 son matrices cuadradas,
o que T1 tiene mas columnas que las, y T2 mas las que columnas. En cuyo caso
se denomina problema de un bloque. En ese caso, se supone que se cumple,
T1T1 = I; T2T2 = I
(C:3)
Teniendo en cuenta las propiedades de una matriz A,
(A) = (A); (XAY ) = (A)
(C:4)
para X; Y funciones (matrices) de transferencia pasa-todo, se obtiene que (problema
de un bloque)
kT1 + T2 QT3 k1 = kT3T1T2 + Q k1 = kN + Q k1
Deniciones y algoritmos relacionados con la teora H1
347
Dado que Q es estable, Q sera inestable, y se demuestra que
N = T3T1T2
es tambien estable. El problema de aproximar una funcion (matriz) de transferencia
conocida estable ,N , por una inestable, Q , es similar al problema de Nehari descrito
en el captulo 10, y se conoce como problema de aproximacion de Hankel.
Puede darse el caso que T1 tenga mas las que columnas, o que T2 tenga mas
columnas que las, en cuyo caso el problema se complica, ya que no es posible hacer
que se cumplan las igualdades dadas en C.3. Sin embargo, es posible encontrar
sendas matrices T1? ; T2? tales que cumplan:
"
# "
#
T1 = T1 = I;
T1?
T1?
"
# "
#
T2 = T2 = I
T2?
T2?
teniendo en cuenta las propiedades dadas en C.4, se llega a,
"
12
kT1 + T2 QT3 k1 = N11N+21 Q N
N22
#
1
que corresponde a la forma general del denominado problema de cuatro bloques que
aparece en la literatura sobre la teora de control H1. Se tiene que,
N11 = T2T1T3 ; N12 = T2T1 T3?
N21 = T2? T1T3 ; N22 = T2? T1T3?
En el caso especial en que T21 es cuadrada, o tiene mas las que columnas, el
problema se simplica quedando:
"
#
N
+
Q
11
kT1 + T2 QT3 k1 = N21 1
de igual forma, si T2 es cuadrada, o tiene mas columnas que las, queda el problema
reducido a
h
i
kT1 + T2 QT3 k1 = N11 + Q N12 1
Los dos problemas anteriores se conocen como problemas de dos bloques. Por
tanto, a la hora de resolver el problema de aproximacion de Hankel, se pueden dar
cuatro situaciones: dos correspondientes a los problemas de dos bloques, una al
problema de cuatro bloques, y otra al problema de un bloque (Maciejowski, 1989).
348
El algoritmo de Glover
C.4 El algoritmo de Glover
A continuacion se da el algoritmo desarrollado por Glover (Glover, 1984) para resolver el problema de aproximacion de Hankel. De forma generica este se puede
expresar de la siguiente forma:
min kN + Y k1; Y; N 2 RH1
Q2RH1
En lo que sigue, se supone que N es una matriz de transferencia cuadrada, y
caso de no serlo se ampliara esta con las o columnas de ceros hasta que as fuera.
Paso 1. Se obtiene una realizacion de N (s) (Ab ; Bb; Cb; Db), tal que las ecuaciones de Lyapunov
tengan la misma solucion
Ab + ATb = Bb BbT
ATb + Ab = CbT Cb
"
#
I
0
i
= 0 ; 1 = diag f2 ; ; ng; 1 2 n > 0
1
Para obtener dicha realizacion (denominada realizacion balanceada), se puede
emplear el siguiente algoritmo:
1. Se parte de una realizacion de N (s) (A; B; C; D).
2. Se resuelven las ecuaciones de Lyapunov para (A; B; C; D), obteniendo
las soluciones respectivas P y Q.
3. Se obtiene una factorizacion Q = RT R, empleando por ejemplo el metodo
de Cholesky (Press et al, 1990).
4. Se realiza la descomposicion en valores singulares siguiente,
RPRT = U 2 U T
5. Se obtiene nalmente la realizacion deseada
(Ab; Bb; Cb; Db) = (TAT 1; TB; CT 1; D)
donde T = 1=2 U T R.
Deniciones y algoritmos relacionados con la teora H1
349
Paso 2. Se obtiene una particion de A; B; C conforme con la forma obtenida de en el paso 1.
"
#
" #
A
A
11
12
1 ; C =h C C i
Ab = A A ; Bb = B
1
2
b
B2
21
22
y se toman:
= 21 12I1 ; UU T = I
tal que B1 = C1T U .
Paso 3. Se calcula la solucion optima al problema de aproximacion de Hankel, que
viene dada por la realizacion,
Yopt = ( A^T ; C^ T ; B^ T ; D^ T )
donde sus matrices se obtienen de:
A^ =
1 ( 2 AT + A 1 22 1
1 22
1 C2T UB2T ); B^ =
1 ( B + C T U )
1 2
1 2
C^ = C2 1 1 UB2T ; D^ = D + 1 U
La teora y resultados de la aproximacion de Hankel tiene un gran numero de
aplicaciones, ademas de para la resolucion de los problemas de control H1. La
principal es la aproximacion de modelos de gran dimension en el espacio de estados
por otros mas simples o modelos reducidos.
Frecuentemente, en muchos problemas H1, se plantea el encontrar una funcion
(matriz) de transferencia Y que satisfaga
kN + Y k1 y no siempre se trata de obtener la solucion optima Yopt; en ese caso se habla de
solucion suboptima. Sin embargo, existira una Y que satisfaga dicho requerimiento
si y solo si 1 . Una forma de obtener dicha solucion suboptima es por medio de
la realizacion:
Ysubopt(s) (A ; B ; C ; D )
con
A = 1( 2 ATb + Ab )
B =
1 B
b;
C = Cb ; D = Db
350
El algoritmo de Glover
donde = 2 2 I . Se demuestra (Safonov et al, 1987) que en este caso no es
necesario obtener previamente la realizacion (Ab; Bb; Cb; Db), sino que directamente
a partir de (A; B; C; D) se resuelven las ecuaciones de Lyapunov
AP + PAT = BB T ;
y se obtiene
AT Q + QA = C T C
= QP
2I
quedando nalmente la realizacion de Ysubopt con las matrices,
A =
B =
1 QB ;
1 ( 2 AT
+ QAP )
C = CP; D = D
Referencias
[1] J. Ackermann (1984), Robustness Against Sensor Failures, Automatica, Vol.
20, No. 2, pp 211-215.
[2] J. Ackermann (1993), Robust Control: Systems with Uncertain Physical
Parameters. Springer Verlag.
[3] P. Albertos and R. Ortega. On Generalized Predictive Control: Two Alternative Formulations. Automatica, Vol. 25-5, pp 753-755, 1989.
[4] F. Alix, J.M. Dion, L. Dugard and I.D. Landau (1982), Adaptive Control
of Nonminimun Phase Systems - Comparison of Several Algorithms and
Improvements. IFAC Workshop on Adaptive Control ISIS Florencia.
[5] A.C. Allison and N.J. Young (1983), Numerical Algoritms for the NevalinaPick Problem, IEEE Press, pp. 412-422.
[6] B. Anderson and J.B. Moore (1990), Optimal Control: Linear Quadratic
Methods, Prentice Hall.
[7] J. Aracil (1974), A Note on the Design of S.I.S.O. Systems. Revue
R.A.I.R.O. num. April pp 119-125.
[8] K.J. Astrom (1970) Introduction to Stochastic Control Theory, Academic
Press.
[9] K.J. Astrom and P. Eykho (1971), System Identication: A survey. Automatica Vol. 7 pp 123-162.
[10] K.J. Astrom and P.D. Wittenmark (1973), On Self-tuning Regulators. Automatica Vol. 9 pp 185-199.
[11] K.J. Astrom (1980a), Self-tuning Regulation - Design Principles and Applications. Departament of Aut. Control, Lund Institud of technology. Lund,
Sweden.
351
352
REFERENCIAS
[12] K.J. Astrom and P.D. Wittenmark (1980b), Self-tuning Controllers Based
on Pole-zero Placement. Proc. IEE Vol 127-3 pp 120-130.
[13] K.J. Astrom and B. Wittenmark (1984), Computed Controlled Systems,
Prentice-Hall.
[14] K.J. Astrom and B. Wittenmark (1989), Adaptive Control, AddisonWhesley.
[15] M. Athans (1974), Modern Control Theory, Center for Advanced Engineering Study M.I.T.
[16] M. Athans (1986), A Tutorial on the LQG/LTR Method, ACC., pp 12891296.
[17] M. Bala (1995), Finite Horizon H1 and Related Control Problems,
Birkhauser.
[18] G.J Balas, J.C. Doyle, K. Glover, A. Packard, and R. Smith (1991), Analysis and Synthesis Toolbox, Musyn Inc. and The MathWorks, Inc.
[19] E. Baeyens, J.R. Peran y E. Vidal (1994), Analisis y dise~no de sistemas de
control mediante optimizacion convexa, Informatica y Automatica, Vol. 27,
Num. 2, pp 5-21.
[20] B.R. Barmish and H.I. Kang (1993), Automatica, Vol. 29, No. 1, pp 13-35.
A Survey of Extreme Point Results for Robustness of Control Systems.
[21] R. Bitmead, M. Gevers and V. Wertz (1990), Adaptive Optimal Control.
Prentice Hall.
[22] U. Borisson and R. Syding (1976), Self-tuning Control of an Ore Crusher.
Automatica Vol. 12 pp 1-7.
[23] S.P. Boyd and C.H. Barrat (1991), Linear Controller Design, Prentice Hall.
[24] F. Buchholt and M. Kummel (1979), Self-tuning Control of a PHNeutralization Process. Automatica Vol. 15 pp 665-671.
[25] E.F. Camacho, F.R. Rubio and J.A. Gutierrez (1988), Modelling and Simulation of a Solar Power Plant with a Distributed Collectors System. Power
Systems, Modelling and Control Applications. pp 11.3.1-11.3.5, Federation
IBRA-BIRA, Septiembre, Bruselas (Belgica).
REFERENCIAS
353
[26] E.F. Camacho, F.R. Rubio and F.M. Hughes (1992), Self-tuning Control
of a Solar Power Plant with a Distributed Collector Field. IEEE Control
Systems Magazine. Vol 12, num. 2, pp 72-78.
[27] E.F. Camacho, M. Berenguel and F.R. Rubio (1994), Application of a Gain
Scheduling Generalized Predictive Controller to a Solar Power Plant, Control Engineering Practice. A Journal of IFAC, Vol 2 num. 2, pp 227-238.
[28] E.F. Camacho and C. Bordons (1995), Model Predictive Control in the Process Industry. Advances in Industrial Control Series. Springer-Verlag.
[29] R.G. Cameron (1985), The Design of Multivariable Systems, V Curso de
Automtica en la Industria, La Rabida (Huelva).
[30] R. Carmona, F.R. Rubio and E.F. Camacho (1985), Automatic Control
for Large Solar Thermal Arrays. Symposium International of Solar Energy
Society. Tokyo.
[31] J.M. Carrasco, F. Gordillo, L.G. Franquelo and F.R. Rubio (1992), Control
of Resonant Converters Using the LQG/LTR Method. Power Electronics
Specialists Conference (PESC'92), Junio, Toledo, Espa~na.
[32] R.Y. Chiang and M.G. Safonov (1992), Robust Control Toolbox. The Math
Works Inc.
[33] R.Y. Chiang and M.G. Safonov (1993), A Fixed H1 Controller for a Supermaneuverable Figther Parforming the Herbst Maneuver, Automatica, Vol.
29, No. 1, pp 111-127.
[34] B.M. Chen, A. Saberi and P. Sannuti (1991), A New Stable Compensator
Design form Exact and Approximate Loop Transfer Recovery, Automatica,
Vol. 27, No. 2, pp 257-280.
[35] B.M. Chen, A. Saberi and P. Sannuti (1992), Necessary and Sucient Conditions for a Nonminimum Phase Plant to have a Recoverable Target LoopA Stable Compensator Design form LTR, Automatica, Vol.28, No.3, pp
493-507.
[36] T. Chen and B. Francis (1995), Optimal Sampled-Data Control System ,
Springer Verlag.
[37] R.V. Churchill, J.W. Brown and R.F. Verhey (1978), Variables Complejas
y sus Aplicaciones, McGraw Hill.
[38] D.W. Clarke and P.J. Gawthrop (1975), Self-tuning Controller. Proc. IEE
Vol 122-9 pp 929-935.
354
REFERENCIAS
[39] D.W. Clarke and P.J. Gawthrop (1979), Self-tuning Control. Proc. IEE Vol
126-6 pp 633-640.
[40] D.W. Clarke, P.P. Kanjila and C. Mohtadi (1985), A Generalized LQG
Aproach to Self-Tuning Control, Part I and Part II, Int J. Control, pp
1509-1523, pp 1525-1544.
[41] D.W. Clarke, C. Mothadi and P.S. Tus (1987), Generalized Predictive Control. Parts I and II, Automatica, Vol. 23, No. 2 pp 137-160
[42] D.W. Clarke (1988), Application of Generalized Predictive Control to Industrial Processes, IEEE Control Systems Magazine, Vol. 122, pp 49-55.
[43] A.O. Cordero and D.Q. Mayne (1981), Deterministic convergence of a Regulator with Variable Forgetting Factor. Proc. IEE Vol 128-1 pp 19-23.
[44] S. Dormido y J.M. Cruz (1993), Fundamentos de Control Robusto, Curso
AEIA, Isla Cristina (Huelva).
[45] R.M.C. De Keyser and A.R. Van Cuawenberghe (1985), Extended Prediction
Self-adaptive Control, IFAC Symp. on Identication and System Parameter
Estimation, York, pp. 1317-1322.
[46] J.C. Doyle and G. Stein (1979), Robustness with Observers, IEEE Trans.
on Automatic Control, Vol AC-24, num. 4, pp 607-611.
[47] J.C. Doyle and G. Stein (1981), Multivariable Feedback Design: Concepts
for a Classical/Modern Synthesis, IEEE Trans. on Automatic Control, Vol
AC-26, num. 1, pp 4-16.
[48] J.C. Doyle (1982), Analysis of Feedback Systems with Structured Uncertainties, IEE Proc., Vol. 129, No. 6, pp 242-250
[49] J.C. Doyle (1983), Synthesis of Robust Controllers and Filters, IEEE Proc.
22nd Conf. Decision Control, pp 109-114.
[50] J.C. Doyle, K. Glover, P.P. Khargonekar, and B.A. Francis (1989), StateSpace Solutions to Standard H2 and H1 Control Problems, Transactions on
Automatic Control, Vol. 34, No. 8, pp 831-846.
[51] J.C. Doyle, B.A. Francis, and A.R. Tannenbaum (1992), Feedback Control
Theory, Macmillan Publishing Company.
[52] J.C. Doyle, K. Zhou, K. Glover and B. Bodenheimer (1994), Mixed H2
and H1 Performance Objetives II: Optimal Control; I: Robust Performance
Analysis, IEEE Trans. on Automatic Control, Vol 39, num. 8, pp 1564-1587.
REFERENCIAS
355
[53] P. Dorato (1987), Robust Control. IEEE Press.
[54] P. Dorato, R. Tempo, and G. Muscato (1993), Bibliography on Robust Control, Automatica, Vol, 29, No.1, pp 201-213.
[55] G.A. Dumont (1982), Self-tuning Control of a Chip Rener Motor Load.
Automatica Vol. 18-3 pp 307-314.
[56] P. Eykho (1974), System Identication, Parameter and State Estimation.
J. Wiley and Sons: London.
[57] D.F. Enns (1984), Model Reduction with Balanced Realizations: An Error
Bound and a Frequency Weighted Generalization, Proc. Conf. on Decision
and Control.
[58] M.P. Ford, J.M. Maciejowski and J.M. Boyle (1988), Multivariable Frequency Domain Toolbox. Cambridge Control Ltd.
[59] T.R. Fortescue, L.S. Kershenbaum and B.E. Ydstie (1981), Implementation
of Regulators with Variable Forgetting Factors. Automatica Vol. 17-6 pp
831-835.
[60] B.A. Francis, and G. Zames (1984), On H1-Optimal Sensitivity Theory
form SISO Feedback Systems, IEEE Transactions on Automatic Control,
Vol. AC-29, No.1, pp 888-899.
[61] B.A. Francis (1987), A course in H1 Control Theory. Lecture Notes in
Control and Information Sciencies, Vol. 88, Springer Verlag.
[62] D.J. Freeman, R. Whalley and M.G. Waugh (1982), Ship Motion and Computer Control, Fourth International Symposium on Ship Operation Automation, Genova (Italy).
[63] J.S. Freudenberg (1989), Analysis and Design for Ill-conditioned plants.
Part 1: Lower Bounds on the Sturctured Singular Value; Part 2: Directionally Uniform Weightings and an Example, Int. J. Control, Vol. 49, No. 3,
pp 851-903.
[64] J.S. Freudenberg (1993), Algebraic Versus Analytic Design limitations Imposed by Ill-Conditioned Plants, IEEE Trans. Automat. Contr., Vol. 38, No.
4.
[65] J.S. Freudenberg and D.P. Looze (1986), An Analysis of H1 Optimization
Design Methods, IEEE Trans. Automat. Contr., Vol. AC-31, No. 3, pp 194200.
356
REFERENCIAS
[66] J.S. Freudenberg, D.P. Looze (1988), Frequency Domain Properties of
Scalar and Multivariable Feedback Systems. Springer-Verlag.
[67] K. Glover (1984), All Optimal Hankel-Norm Approximations of Linear Multivariable Systems and their L1 Errors Bounds, Int. J. Control, Vol.39, No.
6, pp 1115-1193
[68] K. Glover and D. Mcfarlane (1989), Robust Stabilization of Normalized Coprime Factor Plant Descriptions with H1-Bounded Uncertainty, Transactions on Automatic Control, Vol. 34, No. 8.
[69] M. Gopal (1982), Modern Control System Theory, Whiley.
[70] F. Gordillo y F.R. Rubio (1991), Aplicacion de las Tecnicas lqg/ltr en
Control Adaptativo. Jornadas de Control Inteligente, Sevilla, Enero.
[71] F. Gordillo and F.R. Rubio (1991), Self-tuning Controller with LQG/LTR
Structure. European Control Conference (ECC 91). pp 2159-2163, Julio,
Grenoble, Francia.
[72] M. Green and D.J.N. Limebeer (1994), Linear Robust Control. Prentice
Hall.
[73] M.J. Grimble (1994), Robust Industrial Control: Optimal Design Aproach
for Polynomial Systems. Prentice Hall.
[74] J.A. Gutierrez, E.F. Camacho, F.R. Rubio and R. Carmona (1986), Fully
Automation of a Distributed Collectors Field of a Solar Power Plant. Components, Instruments and Techniques for Low Cost Automation and Applications. (LCA'86), pp 381-386, Ed. P. Albertos y J.A. de la Puente,
Pergamon Press.
[75] W.H. Haddad, D.S. Bernstein and Y.W. Wang (1994), Disipative H2=H1
Controller Synthesis, IEEE Trans. on Automatic Control, Vol. 39, No. 4,
pp. 827-831.
[76] C.C. Hang and P.C. Parks (1973), Comparative Studies of Model Reference
Adaptive Control Systems. IEEE T.A.C. Vol AC 18-5 pp 419-428.
[77] I. Horowitz (1982), Quantitative Feedback Theory, Proceedings of the Institution of Electrical Engineers, Part D, 129, pp 215-226.
[78] The Institue of Measurement and Control (1991), Robust Control System
Design using H1 and Related Methods. March, 1991, Cambridge University,
U.K.
REFERENCIAS
357
[79] R. Isermann (1980), Practical Aspects of Process Identication, Automatica
Vol. 16 pp 575-587.
[80] R. Isermann (1981), Digital Control Systems. Springer-Verlag New York.
[81] R. Isermann (1982), Parameter Adaptive Control Algorithms. A Tutorial.
Automatica Vol. 18-5 pp 513-528.
[82] R. Isermann, K.H. Lachmann and D. Matko (1992), Adaptive Control Systems, Prentice Hall.
[83] R.E. Kalman (1964), When Is a Linear Control System Optimal?, Journal
of Basic Engineering. Trans. of the ASME, pp 51-60.
[84] C.G. Kallstrom, K.J. Astrom, N.E. Thorell, J. Eriksson and L. Sten (1979),
Adaptive Autopilots for Tankers. Automatica Vol. 15 pp 241-254.
[85] C.G. Kallstrom and P. Ottosson (1982), The Generation and Control of
Roll Motion of Ships in Close Turns, Fourth International Symposium on
Ship Operation Automation, Genova (Italy).
[86] H. Kaufman, I. Bar-Kana and K. Sobel (1994), Direct Adaptive Control
Algorithms: Theory and Applications, Springer-Verlag.
[87] P.P. Khargonekar and M. Rotea (1991), Mixed H2=H1 control: A convex
optimization approach, IEEE Trans. Automat. Control, 36 (7), pp 824-837.
[88] H. Kwakernaak (1993), Robust Control and H1 -Optimization-Tutorial Paper Automatica, Vol. 29, No. 2, pp 255-273.
[89] H. Kwakernaak and R. Sivan (1972), Linear Optimal Control Systems,
Wiley-Interscience.
[90] H. Kwakernaak and R. Sivan (1991), Signal and Systems, Prentice Hall.
[91] I.D. Landau (1974), A Survey of Model Reference Adaptive Techniques Theory and Applications. Automatica, Vol. 10 pp 353-379.
[92] I.D. Landau (1979), Adaptive Control - The Model Reference Approach.
Control and Systems Theory Vol 8. Marcel Dekker, Inc.
[93] I.D. Landau (1981a), Model Reference Adaptive Control and Stochastic Regulators : A Unied Approach. Trans. of ASME Vol 103 pp 404-416.
[94] I.D. Landau and Lozano, R. (1981b), Unication of Discrete Time Explicit
Model Reference Adaptive Control Designs. Automatica Vol. 17-4 pp 593611.
358
REFERENCIAS
[95] I.D. Landau (1982), Combining Model Reference Adaptive Controllers and
Stochastic Regulators. Automatica Vol. 18-1 pp 77-84.
[96] I.D. Landau (1990), System Identicacion and Control Design, Prentice
Hall.
[97] K. Latawiec and M. Chyra (1983), On Low Frecuency and Long-run Eects
in Control. Automatica Vol. 19 pp 419-424.
[98] J.R. Layne and K.M. Passino (1993), Fuzzy Model Reference Learning Control for Cargo Ship Steering, IEEE Control Systems Magazine, pp 23-34.
[99] A.J. Laub and J.N. Little (1986), Control System ToolBox, The MathWorks,
Inc.
[100] N.A. Lehtomaki, N.R. Sandell and M. Athans (1981), Robustness Results
in Linear-Quadratic Gaussian Based Multivariable Control Designs. IEEE
Transactions on Automatic Control, Vol. AC-26, No.1, pp 75-92.
[101] N.A. Lehtomaki and D.A. Castanon (1984), Robustness and Modeling Error
Characterization, IEEE Transactions on Automatic Control, Vol. AC-29,
No. 3, pp 212-220.
[102] D.J. N. Limebeer, E.M. Kasenally and J.D. Perkins (1993), On the Design
of Robust Two Degree of Freedom Controllers, Automatica, Vol. 29, No. 1,
pp 157-168.
[103] L. Ljung (1985), On the Estimation of Transfer Functions, Automatica,
Vol. 21, No. 6.
[104] L. Ljung (1986), System Identication ToolBox, The MathWorks, Inc.
[105] L. Ljung (1987), System Identication: Theory for the User, Prentice Hall.
[106] M.A. Lelic and P.E. Wellstead (1987a), Generalized Pole Placement Self
Tuning Controller. Part I. Basic Algorithm, Int. J. Control, Vol. 46-2, pp
547-568.
[107] M.A. Lelic and P.E. Wellstead (1987b), Generalized Polo Placement Self
Tuning Controller. Part II. Application to Robot Manipulator Control, Int.
J. Control, Vol. 46-2, pp 569-601.
[108] M.J. Lopez and F.R. Rubio (1992), LQG/LTR Control of Ship Steering
Autopilots, IEEE International Symposium on Intelligent Control (ISIC92), pp 447-450, August, Glasgow, Scotland, U.K.
REFERENCIAS
359
[109] M.J. Lopez y F.R. Rubio (1994), Metodologas de Dise~no ltr. Jornadas de
Automatica, Malaga, Octubre.
[110] M.J. Lopez and F.R. Rubio (1994), Design Multivariable Control for a Ship
Based on Robust Methodology, IEEE International Conference on Control
Applications (CCA-94), pp 833-838, August, Glasgow, Scotland, U.K.
[111] M.J. Lopez (1994), Analisis y Dise~no de Controladores Robustos. Aplicacion
al control de un buque. Tesis Doctoral. Universidad de Sevilla.
[112] M.J. Lopez and F.R. Rubio (1995a), Comparison between Multivariable H1
and LTR Controllers for a Ship, CAMS '95, Control Aplications in Marine
Systems, (IFAC). Tronhein, Norway
[113] M.J. Lopez and F.R. Rubio (1995b), Multivariable Robust LTR-i Controller
for a Ship, CAMS '95, Control Aplications in Marine Systems, (IFAC).
Tronhein, Norway
[114] M.J. Lopez and F.R. Rubio (1995c), H1 Multivariable Design Methodology
for a Ship, European Control Conference ECC 95. Roma (Italy).
[115] M.J. Lopez and F.R. Rubio (1995d), Gain Scheduling LQG/LTR Controller
of Ship Steering Autopilots, European Control Conference ECC 95. Roma
(Italy).
[116] M.J. Lopez y F.R. Rubio (1995f), Mejora de la robustez de controladores
LQG/LTR. Aplicacion a un sistema multivariable. Aceptado para publicacion en Revista de Informatica y Automatica.
[117] M.J. Lopez, A.P. Consegliere y J. Terron (1995), Tecnicas de modelado,
simulacion e identicacion de la dinamica de un buque por computador. A
publicar por el servicio de publicaciones de la Universidad de Cadiz.
[118] J. Lunze (1989), Robust Multivariable Feedback Control. Prentice Hall.
[119] A.G.J. MacFarlane (1970), Return-dierence and return-ratio matrices and
their use in analysis and design of multivariable feedback control systems.
Proc. IEE, vol. 117, No. 10, pp 2037-2049.
[120] A.G.J. MacFarlane and N. Karcanias (1976), Poles and Zeros of Linear
Multivariable Systems: a Survey of the Algebraic, Geometric and ComplexVariable Theory, Int. J. Control, Vol. 24, No. 1, pp 33-74.
[121] A.G.J. MacFarlane and I. Postlethwaite (1977), The Generalized Nyquist
Stability Criterion and Multivariable Root Loci, Int. J. Control, Vol. 24, No.
1, pp 81-127.
360
REFERENCIAS
[122] J.M. Maciejowski (1985), Asymptotic Recovery for Discrete-Time Systems,
IEEE Trans. Automat. Contr., Vol AC-30, No. 6, pp 602-605.
[123] J.M. Maciejowski (1989), Multivariable Feedback Design. Adison Wesley.
[124] R.J. Martin, L. Valavani and M. Athans (1986), Multivariable Control of a
Submersible Using the LQG/LTR Methodology, ACC., pp 1313-1324.
[125] The MathWorks, Inc. (1990), Matlab for MS-DOS Personal Computers.
User's Guide.
[126] J.M. Mendel (1987), Lessons in Digital Estimation Theory, Prentice Hall.
[127] A.C. Messer and M.J. Grimble (1992), Robust Track Keeping Control,
CAMS'92 ,IFAC, Genova (Italy).
[128] B.C. Moore (1981), Principal Component Analysis in Linear Systems, IEEE
Trans. Automat. Contr., Vol. AC-26.
[129] M. Morari and E. Zariou (1989), Robust Process Control, Prentice Hall.
[130] A.N. Moser (1993), Designing Controllers for Flexible Structures with H1=
Synthesis, IEEE Control Systems, Vol. 13, No. 2, pp 79-89.
[131] D. Mustafa and K. Glover (1991), Controller Reduction by H1 Balanced
Truncation, IEEE Trans. on Automatic Control, Vol. 36, No. 6, pp 668-682.
[132] K.S. Narendra and R.V. Monopoli (1980), Applications of Adaptive Control.
Academic Press.
[133] K.S. Narendra and A.M. Annaswamy (1989), Stable Adaptive Systems,
Prentice Hall.
[134] G.C. Newton, L.A. Gould, J.F. Kaiser (1957), Analytical Design of Linear
Feedback Controls, Wile & Sons.
[135] R. Ortega (1982), On PID Self-tuning. Proc. of the IFAC Software for Computer Control (SOCOCO), Madrid.
[136] A. Packard and J. Doyle (1993), The Complex Structured Singular Value,
Automatica, Vol. 29, No. 1
[137] G.K.H. Pang and A.G.J. MacFarlane (1987), An Expert Systems Approach
to Computer-Aided Design of Multivariable Systems, Springer-Verlag.
REFERENCIAS
361
[138] I. Postlethwaite and S. Skogestad (1993), Robust multivariable Control Using H1 Methods: Analysis, Design and Industrial Applications, Essays on
Control, ECC-93, pp 271-330.
[139] W.H. Press, B.P. Flannery, S.A. Teukolsky and W.T. Vetterling (1990),
Numerical Recipes: The Art of Scientic Computing.
[140] J.M. Quero and E.F. Camacho (1990), Neural Generalized Predictive Controllers. Proc. of the IEEE International Conference on System Engineering,
Pittsburg, pp 160-163.
[141] L.R. Ray (1993), Stability Robustness of Uncertain LQG/LTR Systems,
IEEE Trans. on Automatic Control, Vol. 38, No. 2, pp 304-308.
[142] A.J. Robins and P.E. Wellstead (1981), Recursive Systems Identication
Using Fast Algorithms. I.J. of Control Vol 33-3 pp 455-480.
[143] H.H. Rosenbrock (1974), Computer- Aided Control System Design.
[144] M.A. Rotea and P.P. Khargonekar (1991), H2 -Optimal Control with an H1
-constraint:The State Feedback Case, Automatica, Vol.27, No.2, pp 307-316.
[145] M.A. Rotea (1993), The Generalized H2 Control Problem, Automatica, Vol.
29, No. 2, pp 373-385.
[146] F.R. Rubio, E.F. Camacho, J. Aracil, L.G. Franquelo and J.M.G. Provost
(1982), Studies for the Application of an Adaptive Controller to Hydroturbine Generators. Software for Computer Control (SOCOCO), pp 425-430,
Ed. G. Ferrate y E.A. Puente, Pergamon Press.
[147] F.R. Rubio y E.F. Camacho (1984), Control Adaptativo del Campo de Colectores Distribuidos de una Planta Solar. Automatica en la Industria. pp 131135, Ed. M. Silva, Publicacion IFAC, Zaragoza, Nov.
[148] F.R. Rubio, E.F. Camacho y R. Carmona (1985), Control Adaptativo del
Campo de Colectores Distribuidos (ACUREX) de la Planta Solar SSPS de
Almera. Regulacion y Mando Automatico Vol XIX, num. 145 pp 139-143.
[149] F.R. Rubio, J. Aracil and E.F. Camacho (1985), Chaotic Motion in an
Adaptive Control System. International Journal of Control, Ed. A.G.J. Macfarlane, Taylor and Francis, Vol 42-2, pp 353-360.
[150] F.R. Rubio y E.F. Camacho (1985), Identicacion Reducida de Sistemas
Lineales. Actas de las VI Jornadas de Automatica, pp 27-49, Valladolid.
362
REFERENCIAS
[151] F.R. Rubio (1985), Control Adaptativo de Procesos Industriales. Aplicacion
a una Central Solar. Tesis Doctoral.
[152] F.R. Rubio, E.F. Camacho and R. Carmona (1985), Application of a Selftuning Regulator to a Solar Power Plant. 7th Conference on Digital Computer Applications to Process Control, pp 263-269, Sept. Viena (Austria).
[153] F.R. Rubio, R. Carmona and E.F. Camacho (1986), Adaptive Control of
The ACUREX Field. The IEA/SSPS Solar Thermal Power Plants, Vol 2,
pp 5.2.1-5.2.18, Ed. P. Kesserlring and C.S. Selvage, Springer-Verlag.
[154] F.R. Rubio (1987), Programa de Ayuda al Dise~no de Controladores Adaptativos. Automatica e Instrumentacion. Revista de Control Industrial. num.
174, pp 299-305.
[155] F.R. Rubio, R. Sanz, E.F. Camacho and A. Ollero (1987), Studies on Expert
Self-tuning Control of Distributed Collector Fields. AI, Expert Systems and
Languages in Modelling and Simulation. pp 231-236, Ed. R. Huber y C.
Kulikowski, IMACS Publication, Junio, Barcelona (Espa~na).
[156] F.R. Rubio, F.M. Hughes and E.F. Camacho (1989), Self-tuning PI Control
of a Solar Power Plant. Adaptive Systems in Control and Signal Processing.
pp 335-340, Ed. M.J. Grimble, IFAC Publication, Abril, Glasgow.
[157] F.R. Rubio and J. Aracil (1990), Classiccal/Modern Design of a Tracking
Control System. IEEE International Conference on Systems Engineering.
pp 156-159, Agosto, Pittsburgh, PA.
[158] F.R. Rubio y J. Aracil (1992), De vuelta al Diagrama de Bode pasando por
el Control Optimo. Revista de Informatica y Automatica, Vol 25 num. 2,
pp 5-16.
[159] F.R. Rubio and M.J. Lopez (1993), Adaptive Optimal Control of Ship Steering Autopilots, 12th World Congress International Federation of Automatic
Control (IFAC-93), Vol. 5, pp 413-416, 18-23 July, Sydney, Australia.
[160] V. Ruiz y C. Gomez (1982), Centrales Electricas Termosolares. Energas
Renovables y Medio Ambiente. Editado por el Centro de Ordenacion del
Territorio y Medio Ambiente del Ministerio de Obras Publicas y Urbanismo.
Madrid.
[161] A. Saberi, and P. Sannuti (1990), Observer Design for Loop Transfer Recovery for Uncertain Dynamical Systems. IEEE Trans. On Automatic Control,
Vol. 35, No. 8, pp 878-896.
REFERENCIAS
363
[162] A. Saberi, B.M. Chen, and P. Sannuti (1993), Loop Transfer Recovery:
Analysis and Design. Springer-Verlag.
[163] M. Saeki (1992), H1=LTR Procedure with Specied Degree of Recovery,
Automatica, Vol. 28, No. 3, pp 509-517.
[164] M.G. Safonov, and M. Athans (1977), Gain and Phase Margin for Multiloop
LQG Regulators, IEEE Transaction on Automatic Control, Vol. AC-22, No.
2, pp 415-422.
[165] M.G. Safonov, A.J. Laub and G.L. Hartmann (1981), Feedback Properties of
Multivariable Systems: The Role and Use of the Return Dierence Matrix,
IEEE Trans. Automat. Contr., Vol AC-26, No. 1, pp 47-65.
[166] M.G. Safonov and R.Y. Chiang (1987), A Schur Method for Balanced model
Reduction, Proc. Conf. on Decision and Control.
[167] M.G. Safonov, D.J.N. Limebeer and R.Y. Chiang (1989), Simplifying the
H1 Theory via Loop Shifting, Matrix Pencil and Descriptor Concepts, Int.
J. Control, 50, 6, pp 2467-2488.
[168] S. Sastry and M. Bodson (1989), Adaptive Control. Stability, Convergence,
and Robustness, Prentice Hall.
[169] B. Shahian and M. Hassul (1992), Computer-Aided Control Systems Design
Using Matlab, Prentice-Hall.
[170] D.E. Seborg, T.F. Edgar and D.M. Mellichamp (1989), Process Dynamics
and Control. John Wiley and Sons.
[171] U. Shaked (1986), Guaranteed stability margin for the discrete-time linear
quadratic optimal regulator, IEEE Trans. Automat. Contr., Vol. AC-31.
[172] S. Skogestad, M. Morari, and J.C. Doyle (1988), Robust Control of IllConditioned Plants: High-Purity Distillation, IEEE Transactions on Automatic Control, vol. 33, No 12., pp 1092-1105.
[173] M.R. Spiegel (1971), Variable Compleja, McGraw Hill.
[174] G. Stein and M. Athans (1987), The LQR/LTR Procedure for Multivariable
Feedback Control Design, IEEE Transactions on Automatic Control, Vol.
AC-32, No.2, pp 105-113.
[175] G. Stein and J.D. Doyle (1991), Beyond Singular Values and Loop Shapes,
J. Guidance, Vol. 14, No. 1, pp 5-16.
364
REFERENCIAS
[176] A. Stoorvogel (1992), The H1 Control Problem, Prentice Hall.
[177] P.M. Thompson (1988a), Program CC's Implementation of the Wiener-Hopf
LQG optimal control problem, Optimal Control Applications and Methods,
Vol. 8, 63-89.
[178] P.M. Thompson (1988b), Program CC, Tutorial and User's Guide, Control
Systems Technology, Inc.
[179] P.E. Wellstead and P. Zanker (1978), The Techniquest of Self-tuning. Control Systems Centre, Report 432.
[180] P.E. Wellstead, J.M. Edmunds, D. Prager and P. Zanker (1979a), Selftuning Pole-cero Assignment Regulators. Control Systems Centre Report
404. (Also in I.J. of Control Vol 30-1 pp 1-26).
[181] P.E. Wellstead and P. Zanker (1979b), Servo Self-tuning. Control System
Centre, Report 419. (Also in I.J. of Control Vol 30-1 pp 27-36).
[182] H.P. Whitaker, J. Yamron and A. Kezer (1958), Design of Model-Reference
Adaptive Control Systems for Aircraft. Report R-164 Intrumentation Laboratory, M.I.T., Cambridge. (Referenciado en Astrom 1983).
[183] B. Wittenmark and K.J. Astrom (1984), Practical Issues on the Implementation of Self-tuning Control. Automatica Vol. 20-5 pp 595-605.
[184] D.C. Youla, J.J. Bongiorno and H.A. Jabr (1976), Modern Wiener-Hopf
Design of Optimal Controllers. Part I: The Single-Input-Output Case. Part
II: The Multivariable Case. IEEE Trans. Automat. Contr., Vol. AC-21, No.
1, pp 3-13, No. 3, pp 319-338.
[185] S.D. O'Young, and B.A. Francis (1986), Optimal Performance and Robust
Stabilization, Automatica, Vol. 22 No. 2., pp 171-183.
[186] G. Zames (1963), Functional Analysis Applied to Non-linear Feedback Systems, IEEE Trans. Circuit Theory, pp 392-404.
[187] G. Zames (1981), Feedback and Optimal Sensitivity: Model Reference Transformations, Multiplicative Seminorms, and Approximate Inverses, IEEE
Trans. Automat. Control, Vol. AC-26, No. 2, pp 301-320.
[188] G. Zames and B.A. Francis (1983), Feedback, Minimax Sensitivity, and Optimal Robustness, IEEE Trans. Automat. Contr., Vol.AC-28, No. 5, pp 585601.
REFERENCIAS
365
[189] Z. Zhang and J.S. Freudenberg (1990), Loop Transfer Recovery for Nonminimum Phase Plants, IEEE Trans. Automat. Contr., Vol. 35, No. 5, pp
547-553.
[190] Z. Zhang and J.S. Freudenberg (1993), Discrete-time Loop Transfer Recovery for Systems whith Nonminimum Phase Zeros and Time Delays, Automatica, Vol. 35, No. 2, pp 351-363.
[191] K. Zhou (1992), Comparision Between H2 and H1 Controllers, IEEE Trans.
on Automatic Control, Vol. 37, No. 8, pp. 1261-1265.
Descargar