Centro Nacional de Investigación y Desarrollo Tecnológico

Anuncio
cnológico
Subsecretaría de Educación Superior
Dirección General de Educación Superior Tecnológica
Coordinación Sectorial Académica
Dirección de Estudios de Posgrado e Investigación
Centro Nacional de Investigación
y Desarrollo Tecnológico
Subdirección Académica
Departamento de Ingeniería Electrónica
TESIS DE MAESTRÍA EN CIENCIAS
Caracterización de la Salida Plana para Sistemas Lineales Usando
Matrices Polinomiales Aplicada a Planeación de Trayectoria con
Incertidumbre Paramétrica
presentada por
Ing. Marisol Cervantes Bobadilla
como requisito para la obtención del grado de
Maestra en Ciencias en Ingeniería Electrónica
Director de tesis
Dr. Alejandro Rodríguez Palacios
Codirector de tesis
Dr. Carlos Daniel García Beltrán
Cuernavaca, Morelos, México. Julio de 2013.
Dedicatoria
Dedico esta tesis a mi jarnielito,
Te amo mi hombrecito,
Eres mi vida.
A mi jarnielote,
le diste a mi vida la felicidad
que hacía falta.
A mis padres, Telesforo y Olivia,
por ser los mejores,
y apoyarme incondicionalmente.
Este logro es de ustedes.
Agradecimientos
A mi Jarnielito, tu eres mi gran motivo por el cual superarme, gracias mi amor
por todo este tiempo que no te pude dedicar. Te amo mi pequeñito guapo.
A mi Jarnielote, muchísimas gracias por apoyarme en esta aventura, sin tu
ayuda y compañía, hubiese sido muy difícil culminar esta etapa. Gracias por
darme ánimos para salir adelante.
A mis padres, muchas gracias por su apoyo incondicional, consejos, valores
inculcados. No existen palabras que describan mi agradecimiento hacia ustedes.
Sin ustedes, no lo hubiese logrado. Gracias por apoyarme siempre y darme la
fuerza para salir adelante en los momentos más difíciles, sobre todo por nunca
dejar que me derrumbara.
Al doctor Alejandro Rodríguez palacios por dirigirme a lo largo de esta tesis.
Muchas gracias por todas las enseñanzas, comentarios, consejos y apoyo. Le
agradezco su enorme paciencia, por darme los ánimos para concluir este ciclo,
pero sobre todo muchísimas gracias por su amistad.
A mis revisores Dr. Gerardo Vicente Guerrero Ramírez, Dr. Marco Antonio
Oliver Salazar, por su atención y tiempo, por sus observaciones,
recomendaciones, comentarios que enriquecieron este trabajo.
A mis profesores Dr. Gerardo Vicente Guerrero Ramírez,
Dr. Manuel
Adam Medina, Dr. Carlos Manuel Astorga Zaragoza, Dr. Gerardo Vela Valdez,
Dr. Carlos Daniel García Beltrán, Dr. Alejandro Rodríguez Palacios, Dr. Víctor
Manuel Alvarado Martínez, M. C. Pedro Rafael Mendoza Escobar, M. C. José
Martín Gómez, M. C. Guadalupe Madrigal Espinoza, por sus enseñanzas.
Al doctor Manuel Adam Medina, por su amistad, consejos y apoyo. Muchas
gracias por su confianza.
A la Lic. Patricia Armas, por sus enseñanzas con el idioma inglés, su amistad,
confianza y las grandes charlas que compartimos.
A Lorena Ruiz por su tiempo y preocupación en el proceso de nuestra
documentación.
Agradezco al CENIDET, por permitirme seguir creciendo profesionalmente.
A todo el personal que labora en el CENIDET, por todas las atenciones prestadas
durante mi estancia.
Finalmente, al Consejo Nacional de Ciencia y Tecnología (CONACYT) por el
apoyo económico que me brindo, sin el cual, difícilmente este proyecto hubiese
podido concretarse.
… A todos ustedes muchísimas gracias…
Marisol Cervantes Bobadilla.
Resumen
Platitud diferencial es una propiedad estructural que poseen algunos sistemas dinámicos.
Un sistema plano tiene la propiedad de platitud diferencial. La formulación precisa de
platitud diferencial en el contexto de sistemas de control se debe a Michel Fliess y sus
colaboradores: Jean Lévine, Philippe Martin y Pierre Rouchon [Fliess, et al., 1995].
Limitándose a los sistemas lineales invariantes en el tiempo, se tiene que estos sistemas
son planos sí, y sólo si, son controlables [Fliess, et al., 1995]. Una salida plana es una
salida generalizada particular que tiene la propiedad de que todas las curvas integrales
del sistema se pueden expresar como funciones suaves de las componentes de esta salida
plana y de un número …nito, a determinar, de sus derivadas temporales sucesivas. Sin
embargo, al parecer, aún no se tiene disponible un método general que encuentre todas
las posibles salidas planas y las parametrice.
Uno de los problemas principales en la teoría de control, es el de planeación y seguimiento de trayectoria. El cual se re…ere al hecho de generar una trayectoria que la dinámica del
sistema debe de seguir, desde un punto inicial hasta un punto …nal prescritos. Platitud
diferencial simpli…ca la tarea de planeación de trayectoria debido a que si se de…ne una
trayectoria para la salida plana, se puede obtener la evolución de las otras variables del
sistema sin resolver ninguna ecuación diferencial.
La motivación de esta tesis es aplicar la metodología de [Levine-Nguyen, 2003] a un
caso de estudio para caracterizar la salida plana. Una vez determinada la salida plana, se
realiza planeación y seguimiento de trayectoria con el sistema en condiciones nominales.
Se analiza su respuesta y si es factible, entonces se incluye incertidumbre en los parámetros
del sistema y se evalúa si la salida plana obtenida para el sistema en condiciones nominales
aún es efectiva en el caso de incertidumbre en los parámetros. Además, se determina si
es posible realizar seguimiento de trayectoria. Finalmente se establece heurísticamente su
margen de robustez.
Resumen
Abstract
Di¤erential ‡atness is a structural property possessed by some dynamical systems. A
planar system has the property of di¤erential ‡atness. The precise formulation of di¤erential ‡atness in the context of control systems is due to Michel Fliess and colleagues:
Jean Lévine, Philippe Martin and Pierre Rouchon [Fliess, et al., 1995].
Limiting itself to linear time-invariant systems, we have that these systems are ‡at if,
and only if, they are controllable [Fliess, et al., 1995]. Flat output is a output generalized
particularly which has the property that all the integral curves of the system can be
expressed as soft functions of the components of the ‡at output and a …nite number, to
determine of their time successive derivatives. However, apparently not yet have available
a general method to …nd all possible the ‡at outputs and the parameterize.
One of the main problems in control theory, is the trajectory planning. Which refers to
the fact generate a trajectory that the system dynamics must follow, from a starting point
to an endpoint prescribed. Di¤erential ‡atness simpli…es the task of trajectory planning
because if you de…ne a trajectory to the ‡at output, one can obtain the evolution of the
other variables of the system without solving any di¤erential equation.
The motivation of this thesis is to apply the methodology of [Levine-Nguyen, 2003] to
a case study to characterize the ‡at output. Once determined the ‡at output is performed
trajectory planning with the system at nominal conditions. We analyze your response and
if feasible, then it includes uncertainty in the system parameters and evaluates whether
the ‡at output obtained for the system at nominal conditions is e¤ective even in the case
of parameter uncertainty. Furthermore, it determines whether it is possible trajectory
tracking. …nally Heuristically establishes its robustness margin.
ÍNDICE GENERAL
ÍNDICE GENERAL
Índice general
Índice de …guras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
iii
Índice de tablas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii
9
Notación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix
9
Introducción
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1. Capítulo 1. Antecedentes y motivación . . . . . . . . . . . . . . . . . . . . . . .
5
1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.2. Estado del arte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.2.1. Platitud diferencial . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.2.2. Sistemas mecánicos: Arreglo motorizado y sistema de vibración mecánico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3. Propuesta de solución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.1. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . 14
1.3.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3.3. Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4. Organización de la tesis
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2. Capítulo 2. Fundamentos teóricos . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2. Sistemas no lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3. Sistemas lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3.1. Sistemas monovariables en representación de función de transferencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3.2. Sistemas monovariables en representación de espacio de estado. . . 21
2.3.3. Sistemas multivariables en representación de espacio de estado. . . . 24
2.3.4. Sistemas multivariables en representación matricial polinomial . . . 25
2.4. Planeación y seguimiento de trayectoria . . . . . . . . . . . . . . . . . . . . 29
2.4.1. Curva de Bézier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5. Matrices polinomiales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.1. Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.2. Matrices polinomiales . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3
i
ÍNDICE GENERAL
ÍNDICE GENERAL
2.5.3. Forma de Smith . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.5.4. Identidad de Bezout . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3. Capítulo 3. Caracterización de la salida plana para sistemas lineales usando
matrices polinomiales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2. Sobre platitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3. Caracterización de la salida plana para sistemas lineales invariantes en el
tiempo en forma matricial polinomial . . . . . . . . . . . . . . . . . . . . . 42
4. Capítulo 4. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.1.1. Sistemas mecánicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2. Caso de estudio: Arreglo motorizado de alta precisión . . . . . . . . . . . . 50
4.2.1. Caso nominal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.2.2. Caso con incertidumbre paramétrica . . . . . . . . . . . . . . . . . 65
4.2.3. Lazo cerrado del sistema utilizando un controlador tipo PID . . . . 76
4.3. Caso de estudio: Sistema de vibración mecánico . . . . . . . . . . . . . . . 82
4.3.1. Caso nominal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.3.2. Caso con incertidumbre paramétrica . . . . . . . . . . . . . . . . . 94
5. Capítulo 5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.2. Aportaciones de la tesis
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
5.3. Trabajos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
Apéndice
107
A. Interpolación polinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
B. Documentación de los programas utilizados. . . . . . . . . . . . . . . . . . . . . 111
B.1. Arreglo motorizado de alta precisión . . . . . . . . . . . . . . . . . . . . . 111
B.2. Sistema de vibración mecánico . . . . . . . . . . . . . . . . . . . . . . . . . 115
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
ii
4
ÍNDICE DE FIGURAS
ÍNDICE DE FIGURAS
Índice de …guras
1.1. Arreglo motorizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.1. Correspondencia entre las trayectorias del sistema y curvas arbitrarias. . . 30
2.2. Curva de Bézier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.1. Arreglo motorizado de alta precisión. . . . . . . . . . . . . . . . . . . . . . 51
4.2. Movimiento cortante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.3. Foco estable o sumidero . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.4. Esquema de control prealimentado basado en platitud diferencial. . . . . . 63
4.5. Respuesta del sistema en condiciones nominales. (a) Seguimiento de trayectoria en condiciones nominales. (b) Parametrización diferencial de xB : . .
64
4.6. Error de seguimiento, cuerpo móvil. . . . . . . . . . . . . . . . . . . . . . . 64
4.7. Variación numérica de la masa del cuerpo móvil. (a) Seguimiento de trayectoria con incertidumbre. (b) Parametrización de xB con incertidumbre. . . 66
4.8. Error de seguimiento con incertidumbre en la masa del cuerpo móvil . . . . 67
4.9. Variación numérica máxima admisible para la masa del cuerpo móvil. (a)
Seguimiento de trayectoria con incertidumbre. (b) Parametrización de xB
con incertidumbre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.10. Error de seguimiento con la variación numérica máxima admisible en la
masa del cuerpo móvil. (a) Error de seguimiento con incertidumbre en la
masa del cuerpo móvil. (b) Zoom del error de seguimiento. . . . . . . . . . 69
4.11. Respuesta del sistema con una variación numérica para la masa de la
base. (a) Seguimiento de trayectoria con incertidumbre en mB . (b) Parametrización diferencial con incertidumbre en mB . . . . . . . . . . . . . . . 70
4.12. Error de seguimiento con una variación numérica en la masa de la base . . 70
4.13. Respuesta del sistema con una variación numérica para la constante de
rigidez. (a) Seguimiento de trayectoria con incertidumbre en k. (b) Parametrización diferencial con incertidumbre en k. . . . . . . . . . . . . . . . 71
4.14. Error de seguimiento con una variación numérica en la constante de rigidez 72
5
iii
ÍNDICE DE FIGURAS
ÍNDICE DE FIGURAS
4.15. Respuesta del sistema con una variación numérica para el coe…ciente de
fricción viscosa. (a) Seguimiento de trayectoria con incertidumbre en r. (b)
Parametrización diferencial con incertidumbre en r. . . . . . . . . . . . . . 73
4.16. Error de seguimiento con una variación numérica en el coe…ciente de fricción
viscosa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.17. Respuesta del sistema con una variación numérica en todos los parámetros.
(a) Seguimiento de trayectoria con incertidumbre en todos los parámetros.
(b) Parametrización diferencial con incertidumbre en todos los parámetros.
74
4.18. Error de seguimiento con una variación numérica en todos los parámetros.
75
4.19. Esquema de control en lazo cerrado. . . . . . . . . . . . . . . . . . . . . . . 77
4.20. Seguimiento de trayectoria en lazo cerrado. . . . . . . . . . . . . . . . . . . 78
4.21. Error de seguimiento en lazo cerrado. . . . . . . . . . . . . . . . . . . . . . 78
4.22. Seguimiento de trayectoria en lazo cerrado con incertidumbre. . . . . . . . 79
4.23. Error de seguimiento en lazo cerrado con incertidumbre paramétrica. . . . 80
4.24. Seguimiento de trayectoria en lazo cerrado con incertidumbre en todos los
parámetros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.25. Error de seguimiento en lazo cerrado utilizando el controlador combinado. . 81
4.26. Sistema de vibración mecánico. . . . . . . . . . . . . . . . . . . . . . . . . 82
4.27. Diagrama de simulación sistema de vibración mecánico. . . . . . . . . . . . 92
4.28. Respuesta del sistema en condiciones nominales. (a) Seguimiento de trayectoria en condiciones nominales para x1 . (b) Seguimiento de trayectoria en
condiciones nominales para x2
. . . . . . . . . . . . . . . . . . . . . . . . 93
4.29. Respuesta del sistema con incertidumbre en la masa 1. (a) Seguimiento de
trayectoria para x1 con incertidumbre en el parámetro m1 . (b) Seguimiento
de trayectoria para x2 con incertidumbre en el parámetro m1 .
. . . . . . . 95
4.30. Respuesta del sistema con incertidumbre en la masa 2. (a) Seguimiento de
trayectoria para x1 con incertidumbre en el parámetro m2 . (b) Seguimiento
de trayectoria para x2 con incertidumbre en el parámetro m2 .
iv
6
. . . . . . . 96
ÍNDICE DE FIGURAS
ÍNDICE DE FIGURAS
4.31. Respuesta del sistema con incertidumbre máxima admitida en la masa 2.
(a) Seguimiento de trayectoria para x1 con incertidumbre en el parámetro
m2 . (b) Seguimiento de trayectoria para x2 con incertidumbre en el parámetro
m2 .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.32. Respuesta del sistema con incertidumbre en el resorte. (a) Seguimiento de
trayectoria para x1 con incertidumbre en el parámetro k1 . (b) Seguimiento
de trayectoria para x2 con incertidumbre en el parámetro k1 . . . . . . . . . 98
4.33. Respuesta del sistema con incertidumbre en el resorte 2. (a) Seguimiento de
trayectoria para x1 con incertidumbre en el parámetro k2 . (b) Seguimiento
de trayectoria para x2 con incertidumbre en el parámetro k2 . . . . . . . . . 99
4.34. Respuesta del sistema con incertidumbre máxima admitida en el resorte 2.
(a) Seguimiento de trayectoria para x1 con incertidumbre en el parámetro
k2 . (b) Seguimiento de trayectoria para x2 con incertidumbre en el parámetro
k2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.35. Respuesta del sistema con incertidumbre en el coe…ciente de fricción viscosa. (a) Seguimiento de trayectoria x1 con incertidumbre en el parámetro
c. (b) Seguimiento de trayectoria x2 con incertidumbre en el parámetro c. . 101
B.1. Esquema de simulación arreglo motorizado de alta precisión. . . . . . . . . 111
B.2. Programación de la parametrización de la entrada. . . . . . . . . . . . . . . 114
B.3. Programación de la parametrización del estado. . . . . . . . . . . . . . . . 114
B.4. Programación del modelo matemático del sistema. . . . . . . . . . . . . . . 115
B.5. Esquema de simulación sistema de vibración mecánico. . . . . . . . . . . . 115
B.6. Programación de la parametrización de las variables del estado en términos
de la salida plana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
B.7. Programación de la parametrización de la entrada en términos de la salida
plana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
B.8. Programación del modelo matemático del sistema de vibración mecánico. . 118
Índice de …guras
7
v
ÍNDICE DE TABLAS
ÍNDICE DE TABLAS
Índice de tablas
4.1. valores nominales de los parámetros del sistema . . . . . . . . . . . . . . . 63
4.2. Valores nominales y cotas mínimas y máximas de los parámetros del sistema 66
4.3. Variación numérica de los parámetros del sistema . . . . . . . . . . . . . . 74
4.4. Valores de sintonización para el controlador tipo PID. . . . . . . . . . . . . 76
4.5. Valores de los parámetros con variación numérica . . . . . . . . . . . . . . 80
4.6. Valores nominales de los parámetros del sistema de vibración mecánico . . 92
4.7. Valores con variación numérica de los parámetros del sistema de vibración
mecánico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
8
vii
Notación.
Notación
MIMO Múltiples entradas múltiples salidas.
SISO
Una entrada una salida.
:= Igualdad por de…nición.
i 2 n Conjunto i 2 f1; 2;
; ng.
(x) Función escalar.
x 2 Rn Vector columna del estado n-dimensional.
u 2 Rm Vector de entrada de dimensión m.
R Campo de los números reales.
A Matriz de dimensión n
Matriz de dimensión n
n.
n.
Kc Matriz de controlabilidad de Kalman.
Salida plana.
f
:
f; f ; : : : ; f q Indica las derivadas de la salida plana.
g Campo vectorial suave.
P0 ; : : : ; Pn Nodos o puntos de control de la curva de Bézier.
t0 ; tf Tiempo inicial y …nal respectivamente de la curva de Bézier.
ix9
Introducción
Introducción
Los antecesores de la noción de platitud son E. Cartan y D. Hilbert en el contexto
de conjuntos subdeterminados de ecuaciones diferenciales. En su trabajo ellos buscaban
transformaciones de coordenadas no lineales en el espacio y en el tiempo que transformaran
al sistema estudiado en uno fácilmente integrable, o un conjunto particular de variables
que parametrizaran completamente a las soluciones del sistema sin resolver las ecuaciones
diferenciales. La formulación precisa de platitud diferencial en el contexto de sistemas de
control se debe a Michel Fliess y sus colaboradores: Jean Lévine, Philippe Martin y Pierre
Rouchon [Fliess, et al., 1995].
Platitud diferencial es una propiedad estructural que poseen algunos sistemas dinámicos. Un sistema plano tiene la propiedad de platitud diferencial. Extiende la noción de
controlabilidad de sistemas lineales invariantes en el tiempo a sistemas no lineales. Los sistemas planos tienen una salida plana (…cticia) que parametriza diferencialmente al estado
y a la entrada.
Platitud diferencial está estrechamente relacionada con linealización por retroalimentación mediante retroalimentación dinámica del estado. Para sistemas no lineales generales
no se sabe cómo obtener la salida plana. Para sistemas lineales controlables se puede
determinar la salida plana explícitamente; si un sistema lineal es controlable entonces es
plano.
Limitándose a los sistemas lineales, invariantes en el tiempo, se tienen los siguientes
resultados para las representaciones más comunes:
En representación de función de transferencia, el sistema es plano si los polinomios del
numerador y denominador son coprimos.
En representación de espacio de estado se tiene que el sistema es plano si es controlable.
En representación matricial polinomial, el sistema es plano si las matrices polinomiales
son coprimas por la izquierda.
La identi…cación de la salida plana en un sistema lineal es de particular importancia
ya que la parametrización diferencial correspondiente asociada con la salida plana permite
reducir cualquier problema de seguimiento de trayectoria o estabilización a un problema
correspondiente de…nido en términos de esa salida plana.
1
Introducción
Uno de los problemas principales en la teoría de control, es el de planeación y seguimiento de trayectoria. El cual, se re…ere al hecho de generar una trayectoria que la dinámica
del sistema debe de seguir, desde un punto inicial hasta un punto …nal prescritos. Si
un sistema es plano, entonces se puede utilizar la propiedad de platitud diferencial para
generar trayectorias de soluciones nominales fácilmente.
La propiedad de platitud diferencial simpli…ca la tarea de planeación de movimiento
debido a que si se de…ne una trayectoria de la variable de salida, conocida como salida
plana, se puede obtener la evolución de las otras variables del sistema (x; u) sin resolver
ninguna ecuación diferencial del sistema.
Para el problema de planeación de trayectorias se emplea con frecuencia el método de
la curva de Bézier, debido a que son curvas paramétricas, adaptables, suaves y continuamente diferenciales,este último es un requisito necesario para el diseño de controladores
basados en platitud diferencial. La curva de Bézier es un sistema desarrollado por el Dr.
Pierre Bézier en la década de 1960. Otros métodos menos utilizados son la interpolación
polinomial, como es la interpolación de diferencias divididas de newton, la interpolación
mediante B-spline, la interpolación de Lagrange, entre otras.
Para este trabajo tesis es de gran importancia la caracterización de la salida plana para
sistemas lineales invariantes en el tiempo en representación matricial polinomial propuesta
por [Levine-Nguyen, 2003]. Debido a que la motivación principal es aplicar la metodología
de [Levine-Nguyen, 2003] a un caso de estudio para caracterizar la salida plana, una vez
determinada la salida plana, se realiza planeación y seguimiento de trayectoria con el
sistema en condiciones nominales. Se analiza su respuesta y si es factible, entonces se
incluye incertidumbre en los parámetros del sistema y se evalúa si la salida plana obtenida
para el sistema en condiciones nominales aún es efectiva en el caso de incertidumbre en
los parámetros. Además, se determina si es posible realizar seguimiento de trayectoria.
Finalmente se establece heurísticamente su margen de robustez.
El primer caso de estudio es un arreglo motorizado de alta precisión. El sistema se
utiliza para realizar el desplazamiento de un cuerpo móvil sin fricción a lo largo de un carril
…jo sobre la base, la cual está montada elásticamente al piso, mediante un amortiguador y
un resorte. Un motor eléctrico aplica una fuerza al cuerpo móvil con el …n de desplazarlo
sobre la base.
2
Introducción
Para este sistema se obtuvo la salida plana de acuerdo a la metodología propuesta
por [Levine-Nguyen, 2003], en su representación matricial polinomial. Posteriormente se
realizó planeación y seguimiento de trayectoria con el sistema en condiciones nominales,
utilizando una curva de Bézier. Debido a que el seguimiento de trayectoria se efectuó
satisfactoriamente, entonces se procedió a analizar su respuesta incluyendo incertidumbre
en los parámetros, utilizando el controlador prealimentado basado en platitud que se
diseñó para el sistema en condiciones nominales, se determinó que era posible realizar
seguimiento de trayectoria, y se estableció heurísticamente su margen de robustez.
Además, sólo con …nes comparativos se obtuvo la salida plana del sistema empleando
la representación en espacio de estado. Finalmente, se diseñó un controlador combinado
en condiciones nominales, el cual consta de un controlador prealimentado basado en platitud diferencial y un controlador retroalimentado tipo PID. Se analizó su respuesta y se
comparó con el controlador prealimentado puro deducido de platitud diferencial.
El segundo caso de estudio es un sistema de vibración mecánico. Estos sistemas se utilizan para solucionar problemas de vibraciones en: mesas de calibración de instrumentos,
sistemas de suspensión de vehículos, control de estructuras ‡exibles, etc.
A este sistema se le obtuvo la salida plana siguiendo la metodología propuesta por
[Levine-Nguyen, 2003] en representación matricial polinomial. Se realizó planeación y
seguimiento de trayectoria con el sistema en condiciones nominales. Debido a que el
seguimiento de trayectoria se efectuó satisfactoriamente, se analizó su respuesta incluyendo incertidumbre en los parámetros empleando el controlador prealimentado deducido a
partir de platitud diferencial diseñado para el sistema en condiciones nominales, se determinó que aún se podía hacer seguimiento de trayectoria y estableció heurísticamente su
margen de robustez.
3
4
Capítulo 1. Antecedentes y motivación
1. Capítulo 1. Antecedentes y motivación
1.1. Introducción
Platitud diferencial es una propiedad de algunos sistemas dinámicos controlados, permite simpli…car la tarea de planeación de trayectoria, sin resolver ecuaciones diferenciales,
mientras que opcionalmente simpli…ca el problema del diseño de un controlador realimentado o de un conjunto de sistemas lineales invariantes en el tiempo desacoplados.
Platitud permite una parametrización completa de todas las variables del sistema,
(estado, entradas, salidas) en términos de un conjunto …nito de variables independientes,
a las que se les llama salidas planas, y un número …nito de sus derivadas en el tiempo.
El número de salidas planas es igual al número de entradas de control. En términos
generales, las salidas planas son variables internas del sistema y, por consiguiente, están
en función del estado y de un número …nito de derivadas de los componentes de la entrada
[Fliess, et al., 1995].
Uno de los problemas principales en la teoría de control, es el de planeación y seguimiento de trayectoria. El cual, se re…ere al hecho de generar una trayectoria que la dinámica
del sistema debe de seguir, desde un punto inicial hasta un punto …nal prescritos.
Una ventaja de platitud es que tanto las tareas de planeación de trayectorias y especi…cación del controlador se vuelven relativamente simples. La propiedad de platitud
entonces se relaciona con el hecho de que toda trayectoria integral del sistema está en
correspondencia uno a uno (biyectiva) suave, con una curva algebraica que pertenece a
un espacio de dimensión m: el espacio de las salidas planas. Como consecuencia, las trayectorias deseadas que se especi…can para las salidas planas, determinan unívocamente
las trayectorias del estado y el comportamiento nominal de las entradas de control. De
manera general, este conjunto de salidas …cticias representa un conjunto clave de variables
físicas medibles [Fliess et al., 1999].
La identi…cación de la salida plana en un sistema lineal es de particular importancia
ya que la parametrización diferencial correspondiente asociada con la salida plana permite
reducir cualquier problema de seguimiento de trayectoria o estabilización a un problema
correspondiente de…nido en términos de esa salida plana.
5
Capítulo 1. Antecedentes y motivación
Hasta el momento se presentó seguimiento de trayectoria con el sistema en condiciones
nominales. Sin embargo, en todo sistema siempre existirá incertidumbre, por lo cual, es
lo más deseable es que el seguimiento de trayectoria se realice satisfactoriamente aún en
presencia de incertidumbre.
Particularizando en los sistemas lineales, se tiene que estos sistemas son planos si y
sólo si son controlables. Existen metodologías establecidas para obtener la salida plana de
acuerdo a la representación del sistema que se utilice. Esta tesis se enfoca al estudio de la
metodología propuesta por [Levine-Nguyen, 2003] para caracterizar la salida plana para
sistemas lineales invariantes en el tiempo en forma matricial polinomial. Sin embargo, se
tiene que esta metodología es para sistemas lineales invariantes en el tiempo en condiciones
nominales. Entonces la pregunta es ¿Esta metodología es efectiva aún en presencia de
incertidumbre?
Esta tesis se enfoca en aplicar los resultados y metodología de [Levine-Nguyen, 2003],
a dos casos de estudio, analizar la respuesta del sistema en condiciones nominales, y
si es factible, incluir incertidumbre paramétrica. Analizar si esta metodología propuesta
para sistemas lineales nominales, es efectiva aún en presencia de incertidumbre en sus
parámetros. Finalmente se determina heurísticamente su margen de robustez.
Es imposible capturar perfectamente todos los detalles del comportamiento real de un
proceso de forma matemática. Esto obedece a la existencia inevitable de incertidumbre, la
cual puede poner en peligro el logro de los objetivos del sistema de control. En el modelo de
un proceso la incertidumbre está presente debido a: la reducción del orden del sistema,
la linealización (todo sistema físico es inherentemente no lineal), que no se considera
dinámica de alta frecuencia, el desconocimiento del valor numérico de los parámetros, etc.
Como representantes de incertidumbre en los sistemas se tienen: un conocimiento pobre
de la planta, parámetros inciertos o que varían lentamente, no linealidades tales como
histéresis o fricción, errores o condiciones iniciales desconocidas, ruido aditivo interno,
etc.
6
Capítulo 1. Antecedentes y motivación
1.2. Estado del arte
1.2.1. Platitud diferencial
Platitud diferencial es una propiedad de algunos sistemas dinámicos controlados que
permite simpli…car la tarea de planeación y seguimiento de trayectoria, sin resolver ecuaciones diferenciales. De manera general, platitud es equivalente a controlabilidad, y por
lo tanto, la mayoría de los sistemas de interés exhibirán esta característica. Puesto que
controlabilidad se relaciona fuertemente con poder lograr que la trayectoria del estado del
sistema, haga razonablemente lo que se requiera y que su naturaleza permita dentro de
un intervalo …nito de tiempo, entonces platitud se relacionará con poder planear fuera
de línea trayectorias de estado factibles y diseñar los controladores correspondientes que
hagan que el estado del sistema siga precisamente esas trayectorias [Sira-Ramírez, 2004].
Se considera a E. Cartan y D. Hilbert como los antecesores del concepto de platitud
diferencial en el contexto de conjuntos de ecuaciones diferenciales [Sira-Ramírez, 2004]. En
su trabajo, buscaban transformaciones no lineales de coordenadas espaciales y temporales
que convirtieran al sistema en estudio en uno fácilmente integrable.
Michel Fliess y sus colegas: Jean Levine, Philippe Martin y Pierre Rouchon fueron los
primeros en de…nir platitud diferencial en el contexto de control automático usando el
formalismo del algebra diferencial [Fliess, et al., 1995]. Introdujeron los sistemas planos
que son equivalentes a sistemas lineales mediante un tipo especial de retroalimentación
(endógena). El marco matemático de esta contribución es el Álgebra Diferencial. También,
presentan las conexiones entre el problema de planeación de trayectorias, platitud y la
forma canónica de controlabilidad de Brunovsky. En particular, muestran que aún para
sistemas lineales invariantes en el tiempo, platitud puede ser muy útil para el diseño de
trayectoria de referencia (o prealimentación).
Las formulaciones algebraica y geométrica estuvieron motivadas por la teoría algebraica de sistemas lineales basada en módulos que reportó Fliess en 1990 [Fliess, 1990].
En [Van Nieuwstadt, et al., 1994] se brinda una formulación de platitud diferencial en
términos de equivalencia absoluta entre sistemas diferenciales exteriores. Se muestra que
en el caso de sistemas de control de una sola entrada, un sistema es diferencialmente plano
si y sólo si es linealizable por retroalimentación mediante retroalimentación estática del
7
Capítulo 1. Antecedentes y motivación
estado.
Platitud se relaciona con el problema general de equivalencia de sistemas. Como consecuencia, platitud está relacionada con linealización por retroalimentación del estado
debido a que los sistemas no lineales que son linealizables por esta técnica son planos
[Fliess et al., 1999].
Hagenmayer y Delaleau en [Hagenmeyer-Delaleau, 2003] proponen una estrategia para
sistemas no lineales a la que denominan linealización exacta prealimentada con la que
obtienen un controlador de seguimiento de trayectoria formado por dos partes: una prealimentada basada en platitud diferencial y la otra por retroalimentación.
A partir de la aparición de platitud diferencial en la teoría de control, se ha incrementado la aplicación de sistemas planos para la solución de problemas de control. Cabe
mencionar que diversas clases de sistemas utilizados en la teoría de control son sistemas
planos. De hecho, cualquier sistema no lineal que se puede transformar en un sistema
lineal por un cambio de coordenadas, por retroalimentación estática del estado o por
retroalimentación dinámica, es un sistema plano. En cambio para los sistemas lineales se
tiene que si el sistema es controlable entonces es plano.
En [Murray et al., 1995] se presenta la aplicación de técnicas de platitud diferencial
para sistemas de control mecánicos (Lagrangianos). Se muestra cómo las propiedades de
inercia y simetría están relacionadas con platitud diferencial. Para el caso especial de este
tipo de sistemas de control, se presenta mucha más información en el aspecto matemático
y geométrico, se exploran las implicaciones y características de esta clase de sistemas. Se
desarrollan diversos ejemplos los cuales ilustran la teoría general y se presenta un catálogo
detallado de sistemas mecánicos planos diferencialmente.
En [Suryawan] se analiza el problema de planeación de trayectoria en lazo abierto
para sistemas lineales y sistemas polinomiales con restricciones. Se propone una parametrización B-spline para la salida plana. Usando esta parametrización, el problema de
trayectoria restringida se puede convertir en un problema de planeación cuadrática simple.
Un resultado importante es que la parametrización B-spline (abreviatura de spline básica)
usada proporciona resultados exactos para sistemas lineales continuos en el tiempo. Los
resultados numéricos se detallan mediante el ejemplo de un arreglo motorizado de alta
precisión [Levine-Nguyen, 2003].
8
Capítulo 1. Antecedentes y motivación
En [Henrion, 2003] se presenta un problema de planeación de trayectoria en lazo abierto para sistemas lineales con restricciones acotadas que se originan por saturaciones o
limitaciones físicas. Se muestra que este problema de control se puede reformular como
un problema de interpolación polinomial restringido que admite una formulación como
desigualdades matriciales lineales convexas (LMI).
En [Mahadevan, 2001] se propone un esquema de optimización de trayectorias basado
en la propiedad de platitud diferencial, donde el problema de optimización dinámica se
transforma en un problema de programación no lineal de dimensión menor a través del
uso de las salidas planas.
Platitud diferencial no sólo se puede aplicar en sistemas lineales y no lineales, sino
también en sistemas lineales variantes en el tiempo, en [Fliess, 1998] se utilizó la forma
canónica Brunovsky para sistemas lineales variantes en el tiempo utilizando la teoría de
las …ltraciones. Una descripción más detallada de las implicaciones del enfoque teórico de
módulos en la estructura de estos sistemas y su desacoplamiento se puede encontrar en
Fliess [Fliess, 1990]. Algunos sistemas a los que se les ha aplicado platitud son el péndulo
invertido y el convertidor de potencia cd a cd.
En [Morillo, 2001] se desarrolla un método para generar trayectorias en sistemas no
lineales de control que presentan la propiedad de platitud diferencial. Sin embargo, este
método se restringe sólo a sistemas no lineales que son linealizables por retroalimentación
estática.
Platitud se ha explorado menos para sistemas lineales y no lineales en tiempo discreto
que para sus homólogos en tiempo continuo. Sin embargo, ha surgido cierto interés en
el tema en los últimos años. El enfoque algebraico diferencial de sistemas en tiempo
discreto se encuentra en un artículo de Fliess [Fliess, 1992]. La propiedad fundamental
de platitud, en los sistemas de tiempo discreto, es análoga a su contraparte en tiempo
continuo: permite una parametrización en diferencias de todas las variables del sistema,
incluyendo las entradas, en términos de un conjunto especial de variables independientes,
llamadas las salidas planas.
La propiedad de platitud también se puede encontrar en una variedad de sistemas
descritos por ecuaciones diferenciales lineales con retardo y por ecuaciones diferenciales
parciales. Se ha aplicado platitud para sistemas lineales de dimensión in…nita como el
9
Capítulo 1. Antecedentes y motivación
reactor tubular, la barra ‡exible con masa en un extremo, el reactor químico, el tanque
de agua, entre otros.
En [Fliess, et al., 1995] se explora la noción de la carencia de platitud a través de
algunos de ejemplos físicos, tales como el péndulo Kapitsa, bola y viga, entre otros.
En [Sira-Ramírez, 2004] se examina y explota la propiedad de platitud diferencial en
una variedad de sistemas dinámicos controlados. Se explora desde la clase más elemental
de sistemas hasta la clase más compleja. La idea es resaltar la ventaja predominante de
la propiedad de platitud y la sencillez de su uso.
En [Levine, 2009], proporciona las herramientas matemáticas para comprender la noción de platitud diferencial. Se presenta platitud diferencial desde el punto de vista geométrico, en el marco de geometría diferencial exterior, en el marco de jets de orden in…nito
y de equivalencia entre los sistemas dinámicos de control. También se describe la relación
existente entre platitud y controlabilidad, así como platitud y linealización.
Platitud simpli…ca el problema de planeación y seguimiento de trayectoria y facilita
la tarea del diseño de controladores. Además, platitud se puede combinar ventajosamente
con muchas otras áreas y metodologías del arsenal de los sistemas de control: platitud y
pasividad, platitud y modos deslizantes, platitud y Control óptimo, son algunas de las
posibilidades que se han explorado con resultados satisfactorios que no se han obtenido
usando solamente con las técnicas originales [Sira-Ramírez, 2004].
Como trabajos previos realizados en Cenidet acerca de platitud diferencial, existen
cuatro tesis de maestría terminadas en Cenidet: En [Silva, 2008] se realiza detección y
estimación de fallas a un motor de inducción utilizando el enfoque algebraico diferencial.
Toledo [Toledo, 2010] presenta un sistema de control por platitud diferencial a un sistema eoloeléctrico. En [Suriano, 2012] se aborda el problema de fallas en un rodamiento
magnético desde el enfoque de platitud diferencial. En [López, 2013] se presenta la aplicación del concepto de linealización exacta prealimentada basada en platitud diferencial
con incertidumbre paramétrica.
10
Capítulo 1. Antecedentes y motivación
1.2.2. Sistemas mecánicos: Arreglo motorizado y sistema de vibración mecánico
Los sistemas mecánicos son aquellos sistemas constituidos fundamentalmente por componentes, dispositivos o elementos que tienen como función especí…ca transformar o transmitir el movimiento desde las fuentes que lo generan, al transformar distintos tipos de
energía. Se caracterizan por presentar elementos o piezas sólidos, con el objeto de realizar
movimientos por acción o efecto de una fuerza.
Arreglo motorizado
Se trata de un dispositivo para desplazar un cuerpo que se mueve sobre una base
montada elásticamente con respecto al piso. Dicho dispositivo comprende, además del
cuerpo móvil y la base, un actuador controlable, por ejemplo un motor eléctrico, destinado
a producir un desplazamiento lineal del cuerpo móvil en la base. La base se sujeta al piso
a través de soportes elásticos con el …n de aislarla de las vibraciones procedentes del piso.
Figura 1.1: Arreglo motorizado
Cuando el cuerpo móvil se encuentra en sus fases de aceleración y desaceleración, la
base se somete a la reacción de la fuerza aplicada al cuerpo móvil por el actuador. Esta
fuerza de reacción excita a la base causando que oscile sobre sus soportes. Esto perturba la
posición relativa del cuerpo móvil con respecto a la base, y tiene un efecto muy perjudicial
sobre la precisión del dispositivo.
11
Capítulo 1. Antecedentes y motivación
Este error en la posición relativa del cuerpo móvil permanece después de …nalizar su
desplazamiento y no desaparece hasta que la base se estabiliza (lo cual tiene lugar mucho
más tarde). Se conocen varias soluciones para superar este inconveniente. Algunas de ellas
son:
Inmovilizar a la base durante las fases de aceleración y desaceleración utilizando un
sistema de bloqueo, por ejemplo un sistema de cierre electromagnético, montado en
paralelo con los soportes elásticos. Esta solución, impide que los montajes aíslen a
la base de la vibración durante las fases de aceleración y desaceleración.
Cancelar el efecto producido por la fuerza generada por el actuador, proporcionando
un actuador adicional montado entre la base y el piso y que genera una fuerza
adicional de la misma amplitud pero de sentido opuesto.
Desplazar un cuerpo móvil adicional en la base con un desplazamiento similar pero
de sentido opuesto con respecto al desplazamiento del cuerpo móvil.
Sin embargo, ninguna de estas soluciones conocidas es satisfactoria debido a su baja
e…cacia y además todos ellos requieren medios adicionales (sistema de bloqueo, accionador
adicional, cuerpo móvil adicional) que, en particular, aumentan la complejidad, el costo
y el volumen del dispositivo.
El dispositivo de la Figura 1.1 supera estos inconvenientes. Debido a que realiza un
desplazamiento del cuerpo móvil extremadamente preciso sobre una base, la cual está
montada elásticamente al piso, dicho cuerpo móvil se desplaza linealmente en términos
de la distancia y el tiempo, bajo la acción de una fuerza controlable.
Este dispositivo se puede aplicar, por ejemplo, en las tablas XY de alta velocidad utilizados en microelectrónica, en máquinas de herramientas, en transportadores, en robots,
etcetera [Levine-Nguyen, 2002].
12
Capítulo 1. Antecedentes y motivación
Sistema de vibración mecánico
El monitoreo de vibraciones tuvo su origen hace más de 40 años [La…ta, 1968]. El
objetivo inicial era medir las amplitudes máximas de los equipos. Posteriormente se utilizó
para poder detectar el desbalanceamiento de un equipo; todo esto mediante métodos muy
artesanales y primitivos. No fue hasta el desarrollo de la informática y de la electrónica
que se tuvo acceso a componentes cada vez más pequeños y versátiles, con los cuales se
podían medir las amplitudes y detectar el desbalanceamiento con mayor precisión, rapidez
y facilidad [La…ta, 1968].
El control de vibraciones en sistemas mecánicos se ha tratado extensamente en los
últimos años [Daza, 2007]. Los sistemas de vibración mecánico se utilizan para solucionar
problemas de vibraciones en: mesas de calibración de instrumentos, sistemas de suspensión
de vehículos, bases para maquinarias, control de estructuras ‡exibles, entre otras.
En términos muy simples una vibración es un movimiento oscilatorio de pequeña
amplitud. El movimiento vibratorio o vibración es la variación o cambio de con…guración
de un sistema con relación al tiempo, en torno a una posición de equilibrio estable. Su
característica fundamental es que es periódico, siendo frecuente el movimiento armónico
simple, por lo que este movimiento adquiere una singular importancia en los estudios
vibratorios [Daza, 2007].
Los sistemas mecánicos al someterse a la acción de fuerzas variables con el tiempo,
principalmente periódicas, responden variando su posición de equilibrio estable y, como consecuencia, presentan cambios de con…guración que perturban su funcionamiento
normal, presentan molestias al personal que los maneja y acortan la vida útil de los
mecanismos.
Las vibraciones son libres cuando no existen fuerzas o acciones exteriores directamente
aplicadas al sistema a lo largo del tiempo.
Las vibraciones son forzadas cuando existen acciones o excitaciones directamente aplicadas al sistema a lo largo del tiempo, además de las fuerzas o momentos internos.
Tanto las vibraciones libres como las forzadas pueden subdividirse, dependiendo de la
existencia o no de fuerzas resistentes que amortiguan el movimiento vibratorio, en:
Sin amortiguamiento. No existe resistencia pasiva al movimiento del sistema.
13
Capítulo 1. Antecedentes y motivación
Con amortiguamiento. Existen resistencias pasivas al movimiento del sistema, es
decir, fuerzas o momentos disipativos que amortiguan el movimiento vibracional.
1.3. Propuesta de solución
1.3.1. Planteamiento del problema
Limitándose a los sistemas lineales invariantes en el tiempo, se tiene que estos sistemas
son planos sí, y sólo si, son controlables [Fliess, et al., 1995]. Una salida plana es una
salida generalizada particular que tiene la propiedad de que todas las curvas integrales
del sistema se pueden expresar como funciones suaves de las componentes de esta salida
plana y de un número …nito, a determinar, de sus derivadas temporales sucesivas. Sin
embargo, al parecer, aún no se tiene disponible un método general que encuentre todas
las posibles salidas planas y las parametrice.
En [Levine-Nguyen, 2003] se propone una caracterización directa de las matrices que
expresan a las variables del sistema en función de una salida plana lineal y sus derivadas
temporales. Resultado que es adecuado para planeación de trayectoria ya que, en este caso,
no se requieren las relaciones inversas que expresan a las coordenadas de la salida plana en
términos de las variables del sistema. Se usa la representación matricial polinomial para el
sistema porque, entre otras razones, las propiedades estructurales del mismo, tales como
platitud, se pueden describir adecuadamente en el contexto del álgebra de polinomios.
La motivación principal de esta tesis es: aplicar los resultados y la metodología de
[Levine-Nguyen, 2003] para caracterizar salidas planas para sistemas lineales nominales
invariantes en el tiempo en representación matricial polinomial a dos casos de estudio
con incertidumbre paramétrica; determinar si esta metodología se puede emplear en la
planeación de trayectorias y establecer heurísticamente su margen de robustez.
14
Capítulo 1. Antecedentes y motivación
1.3.2. Objetivos
Objetivo general
Analizar la metodología de [Levine-Nguyen, 2003] para caracterizar la salida plana
lineal para sistemas lineales nominales invariantes en el tiempo en forma matricial polinomial para un caso de estudio con incertidumbre paramétrica y estudiar su efecto en la
planeación de trayectoria.
Objetivos especí…cos
Comprender el concepto de platitud diferencial.
Asimilar la noción de planeación de trayectorias usando platitud diferencial.
Estudiar la metodología desarrollada en [Levine-Nguyen, 2003].
Analizar el alcance de esta metodología en un caso de estudio con incertidumbre
paramétrica.
Determinar heurísticamente el margen de robustez de esta metodología para ese
caso estudio.
1.3.3. Hipótesis
Es posible utilizar la caracterización de la salida plana de sistemas lineales nominales
invariantes en el tiempo en representación matricial polinomial cuando hay incertidumbre
paramétrica y planear y seguir una trayectoria.
1.4. Organización de la tesis
El documento se divide en cinco capítulos, a continuación se describe brevemente el
contenido de cada uno.
En el Capítulo 2, se presenta la noción de platitud diferencial para sistemas no lineales
en su forma más general, y para sistemas lineales en sus representaciones más comunes,
como son función de transferencia, espacio de estado y matricial polinomial. Se de…nen
también las condiciones para determinar si un sistema dinámico es plano. Se muestra
15
Capítulo 1. Antecedentes y motivación
la conexión existente de platitud diferencial con planeación y seguimiento de trayectoria.
Se presentan los conceptos básicos acerca de matrices polinomiales, como requisito para
la metodología de la caracterización de las salidas planas en forma matricial polinomial
[Levine-Nguyen, 2003].
En el Capítulo 3 se muestra la metodología del artículo sobre el cual se fundamenta
esta tesis, se presenta la caracterización de la salida plana para sistemas lineales usando matrices polinomiales, la motivación principal es aplicar esta metodología y determinar heurísticamente su margen de robustez en dos casos de estudio con incertidumbre
paramétrica.
En el Capítulo 4 se presentan las pruebas de simulación y el análisis de los resultados
obtenidos para dos casos de estudio los cuales son sistemas mecánicos. El primer caso de
estudio es un arreglo motorizado de alta precisión. Cabe mencionar que este dispositivo se
encuentra patentado. En este caso se obtuvo la salida plana de acuerdo a la metodología
de [Levine-Nguyen, 2003] en su representación matricial polinomial, también se obtuvo
la salida plana en su representación en espacio de estado esto con …nes comparativos. Se
analizó su respuesta en condiciones nominales y posteriormente se procedió a analizar su
respuesta en el caso con incertidumbre paramétrica, todo esto se realizó con el sistema
nominal en lazo abierto con prealimentación pura deducida de platitud diferencial. Además
se diseñó un controlador combinado nominal, es decir, prealimentado mediante platitud
diferencial más retroalimentado con un controlador tipo PID, esto sólo con el …n de
comparar su respuesta con la del controlador en lazo abierto con prealimentación.
El segundo caso de estudio es un sistema de vibración mecánico. A este sistema se le
obtuvo la salida plana en su representación matricial polinomial, y con …nes comparativos
se obtuvo también en su representación de espacio de estado y función de transferencia.
Se analizó su respuesta en condiciones nominales, en lazo abierto con el controlador prealimentado puro deducido de platitud diferencial. Por último se analizó su respuesta en el
caso de incertidumbre paramétrica, se determinó heurísticamente su margen de robustez.
Finalmente en el Capítulo 5, se muestran las conclusiones generales de este trabajo de
tesis, así como las propuestas para trabajos futuros.
16
Capítulo 2. Fundamentos teóricos
2. Capítulo 2. Fundamentos teóricos
2.1. Introducción
En este capítulo se presenta la noción de platitud diferencial para sistemas dinámicos
en sus representaciones matemáticas más comunes: entrada-salida, variable de estado y
matricial polinomial para sistemas lineales y variable de estado para sistemas no lineales.
La propiedad de platitud diferencial simpli…ca la tarea de planeación de movimiento,
debido a que si se de…ne una trayectoria para la salida plana, entonces se puede obtener
la evolución de las otras variables sin resolver ninguna ecuación diferencial. En esta tesis se
optó por utilizar una curva de Bézier para planeación de trayectorias, debido a la relativa
facilidad de su uso.
Platitud1 diferencial es una propiedad de algunos sistemas dinámicos controlados que
permite simpli…car las tareas de planeación de trayectorias, sin resolver las ecuaciones
diferenciales. De manera general, platitud es equivalente a controlabilidad, y por lo tanto,
la mayoría de los sistemas de interés exhibirán esta característica.
Finalmente se presentan los fundamentos matemáticos que sustentan la caracterización de la salida plana en forma matricial polinomial, según la metodología expuesta
en [Levine-Nguyen, 2003].
2.2. Sistemas no lineales
En esta sección se estudia la propiedad de platitud para sistemas no lineales de una
entrada y una salida. Se dice que un sistema no lineal de una entrada y una salida es
plano diferencialmente si existe una función diferencial del estado, llamada salida plana,
tal que todas las variables del sistema (estado, entrada, salida) se puedan expresar como
funciones diferenciales de dicha salida plana.
Platitud no es otra forma de realizar linealización por retroalimentación para sistemas
no lineales. De hecho, es una propiedad estructural del sistema que permite establecer
1
El término original surge del francés platitude, en inglés se traduce como ‡atness, sin embargo, no
existe una traducción directa al castellano, se pueden utilizar planidad, platitud o aplanamiento. Basta
con decir que el concepto se re…ere a calidad de plano.
17
Capítulo 2. Fundamentos teóricos
todas las características principales, que son necesarias para la aplicación de una técnica
de diseño de un controlador retroalimentado en particular.
Considérese a los sistemas no lineales de una entrada en su forma general
x = g (x; u) ;
x 2 Rn ;
u2R
(2.1)
donde g = (g1 ; : : : ; gn ) es un campo vectorial suave en función de x y de u, el rango de la
matriz Jacobiana, con respecto a u, @g=@u es 1.
De…nición 2.1 [Fliess, et al., 1995] En general, se dice que
es una función diferencial
de x si
=
donde
x; x; x; : : : ; x(
)
(2.2)
es un entero …nito.
Una función diferencial del estado x es una función del estado y un número …nito de
las derivadas en el tiempo de la entrada.
=
x; u; u; u; : : : ; u(
1)
(2.3)
De…nición 2.2 [Fliess, et al., 1995] Un sistema de la forma (2.1) se dice que es plano
diferencialmente si existe una función diferencial de estado x, que se denota por y, y se
da mediante
y = h x; u; u; u; : : : ; u(
)
(2.4)
tal que el sistema inverso de x = f (x; u), con u como entrada y y como la salida, no
tenga ninguna dinámica.
Un sistema es plano si existe cierta salida arti…cial, tal que dicha salida parametrice
diferencialmente a todas las variables del sistema. Esto signi…ca que el estado, las entradas y las variables de salida originales en el sistema se pueden escribir como funciones
diferenciales de la salida plana y, es decir,
18
Capítulo 2. Fundamentos teóricos
donde
x = A y; y; y; : : : ; y (
)
u = B(y; y; y; : : : ; y (
+1)
(2.5)
(2.6)
)
es un entero.
La relación entre los sistemas planos de una entrada con sistemas linealizables mediante
retroalimentación estática del estado es que ambos conceptos son equivalentes.
El resultado principal para sistemas no lineales de una entrada se resume en el teorema
siguiente.
Teorema 2.1 [Fliess et al., 1999] Un sistema no lineal de una entrada de la forma x =
f (x; u), con x 2 Rn y u 2 R, es plano diferencialmente si, y sólo si, es linealizable por
retroalimentación del estado.
Supóngase que el sistema es linealizable por retroalimentación. Esto signi…ca que existe
un difeomor…smo, z =
(x), y una transformación de coordenadas de la entrada u =
(x; v), tal que el sistema transformado es lineal y controlable. Se asume, sin pérdida de
generalidad, que dicho sistema transformado está en la forma canónica de Brunovsky
z 1 = z2
z 2 = z3
..
.
(2.7)
zn = v
Entonces, se puede decir que y = z1 es la salida plana. De hecho, el vector z =
(z1 ; : : : ; zn ) tiene por componentes a y y a n
z = y; y; y; : : : ; y
(n 1)
. Por lo tanto, x =
1
1 de sus derivadas temporales sucesivas
(z), se parametriza diferencialmente por y
y por u. Se tiene que
x =
u =
1
y; y; y; : : : ; y (n
1
1)
y; y; y; : : : ; y (n
1)
; y (n)
19
Capítulo 2. Fundamentos teóricos
y el sistema es plano.
2.3. Sistemas lineales
En cuanto a los sistemas lineales, la conexión entre platitud y controlabilidad se enuncia en la siguiente proposición.
Proposición 2.1 [Fliess, et al., 1995] Un sistema lineal invariante en el tiempo es diferencialmente plano sí, y solo si, es controlable.
La identi…cación de la salida plana en un sistema lineal es de particular importancia ya
que la parametrización diferencial correspondiente, asociada con la salida plana permite
reducir cualquier problema de seguimiento de trayectoria o estabilización a un problema
correspondiente de…nido en términos de esa salida plana.
2.3.1. Sistemas monovariables en representación de función de transferencia.
Considere un sistema lineal invariante en el tiempo monovariable2 representado en
forma de función de transferencia:
y(s) =
n(s)
u(s)
d(s)
(2.8)
Se dice que un sistema SISO es plano diferencialmente, si existe una variable endógena,
llamada salida plana, denotada por f , tal que la entrada u y la salida y puedan expresarse
como una combinación lineal de la salida plana y un número …nito de sus derivadas en el
tiempo. Usualmente se dice que la salida plana parametriza diferencialmente a todas las
variables del sistema.
Se sabe que el sistema es controlable, sí y solo si, los polinomios n(s) y d(s) son
coprimos, es decir, que no tienen factores comunes. En tal caso, el Teorema de Bezout
establece que existen polinomios a(s) y b(s), tales que la siguiente identidad se satisface
para todo s 2 C
2
20
a (s) n(s) + b (s) d(s) = 1
SISO, single input-single output, por sus siglas en inglés.
(2.9)
Capítulo 2. Fundamentos teóricos
Implícitamente se de…ne a f (s) como una nueva variable
f (s) =
1
u(s)
d(s)
(2.10)
La entrada u(s) y la salida y(s) del sistema pueden escribirse en términos de f (s)
como
y(s) = n(s)f (s)
(2.11)
u(s) = d(s)f (s)
Multiplicando ambos lados de (2.9) por f (s) se obtiene
(2.12)
f (s) = a(s)y(s) + b(s)u(s)
Evidentemente, f cali…ca como una salida plana. Se resume este resultado en la siguiente proposición.
Proposición 2.2 [Sira-Ramírez, 2004] Un sistema lineal, invariante en el tiempo, de una
entrada y una salida, en representación de función de transferencia, es plano diferencialmente sí, y solo si, los polinomios del numerador y denominador son coprimos. En otras
palabras, un sistema lineal, en la forma de función de transferencia, es plano sí, y solo
si, es controlable.
2.3.2. Sistemas monovariables en representación de espacio de estado.
A partir de la aparición de la representación en espacio de estado de Kalman, los
sistemas dinámicos lineales se dan en la forma de una ecuación matricial, diferencial y de
primer orden:
x = Ax + bu;
x 2 Rn ;
con A como una matriz constante de n
u 2 R;
A 2 Rn
n
;
b 2 Rn
1
(2.13)
n y b como un vector de orden n con entradas
constantes.
21
Capítulo 2. Fundamentos teóricos
El polinomio característico de la matriz constante A, dado en la variable compleja s
es
A (s)
= sn +
n 1s
n 1
+
+
1s
+
0
Se propone una transformación de coordenadas de la forma z = T x, con T como la
inversa de la matriz de controlabilidad de Kalman
T = b Ab ::: An 1 b
1
El sistema en las nuevas coordenadas, z, resulta como
z = z + u,
= T AT
1
,
= Tb
donde
2
6
6
6
6
6
=6
6
6
6
6
4
0 0 0
0
0
1 0 0
0
1
0
..
.
Eligiendo a f como la n
1
..
.
0
0
.. . . ..
. .
.
2
..
.
0 0 0
0
n 2
0 0 0
1
n 1
3
2
7
7
7
7
7
7,
7
7
7
7
5
6
6
6
6
=6
6
6
4
1
3
7
7
7
7
7
7
0 7
5
0
0
..
.
sima coordenada de estado, f = zn parametriza completa-
mente a las variables de estado transformadas, y por lo tanto, a las variables originales x,
así como a la entrada u. Las variables transformadas y la entrada u se pueden escribir en
términos de f y un número …nito de sus derivadas sucesivas en el tiempo.
zn
1
zn
2
= f+
n 1f
= f+
..
.
n 1f
z1 = f (n
1)
u = fn +
22
+
+
n 1f
n 1f
n 2f
(n 2)
(n 1)
+
+
+
+
0f
1f
Capítulo 2. Fundamentos teóricos
Como consecuencia, todo el estado original x se puede parametrizar en términos de la
salida plana f y un número …nito de sus derivadas sucesivas en el tiempo, además f = zn
es la salida plana. Entonces se tiene:
Proposición 2.3 [Sira-Ramírez, 2004] La salida plana de un sistema lineal y controlable,
en la representación de espacio de estado (2.13), se obtiene mediante la combinación lineal
de las variables del estado que se obtiene del último renglón de la inversa de la matriz de
controlabilidad de Kalman [b; Ab; :::; An 1 b] ; es decir:
f = [0 0 ::: 1] b Ab ::: An 1 b
1
(2.14)
x
En un sistema lineal SISO, la salida plana siempre puede hacerse depender solamente
de las variables del estado del sistema. Además, la salida plana se obtiene de manera
unívoca en este tipo de representación.
Supóngase por el momento que la salida plana f solamente es función del vector de
estado. Además, debido a que el sistema es lineal, asúmase que f es una función lineal
del vector de estado x,
(2.15)
f= x
para cierto vector
de orden 1
n. Ahora el problema de encontrar la salida plana es
cómo elegir dicho vector .
Considere el siguiente vector de derivadas de f a lo largo de las trayectorias de (2.13)
f =
x
f =
x = Ax + bu
f =
A2 x + Abu + bu
..
.
f (n
1)
=
An 1 x + An 2 bu +
+ bun
2
(2.16)
En notación matricial este conjunto de relaciones se representa como
23
Capítulo 2. Fundamentos teóricos
2
6
6
6
6
6
6
6
6
4
3
f
f
f
..
.
f (n
1)
2
7 6
7 6
7 6
7 6
7=6
7 6
7 6
7 4
5
3
A
A2
..
.
An
1
2
7
6
7
6
7
6
7
6
7x + 6
7
6
7
6
5
4
0
0
0
b
0
Ab
..
.
b
..
.
An 2 b
An 3 b
..
.
32
u
76
6
0 7
76 u
76
0 76 u
6 .
.. 7
6 .
. 7
54 .
b
un 2
3
7
7
7
7
7
7
7
5
(2.17)
Puesto que se tiene que poder obtener a x sólo en términos de f y de sus derivadas
temporales, todas las entradas en la matriz que relaciona a f , y a sus derivadas, con u y
sus derivadas, deben desaparecer.
Entonces, se tiene que
satisface
b = 0;
es decir,
Ab = 0;
;
An 2 b = 0
(2.18)
es ortogonal a cada vector columna en la matriz de controlabilidad de rango
completo, excepto al último, con el cuál debe alinearse ( An 1 b 6= 0). De lo contrario,
sería ortogonal al conjunto de vectores linealmente independientes en Rn y esto signi…caría
que
sería cero, lo cual es imposible.
2.3.3. Sistemas multivariables en representación de espacio de estado.
Para el caso de sistemas lineales multivariables3 en espacio de estado se extienden los
resultados del caso SISO previo. La propiedad de platitud está íntimamente relacionada
con la controlabilidad del sistema.
Considere el sistema multivariable, lineal y controlable
x = Ax + Bu;
x 2 Rn ;
u 2 Rm ;
A 2 Rn
n
;
B 2 Rn
m
(2.19)
donde la matriz B es de rango completo m y sus columnas son los vectores b1 ; : : : ; bm . El
sistema (2.19) es controlable si la matriz de controlabilidad de Kalman
Kc = B; AB; : : : ; An 1 B
3
24
MIMO, multiple inputs-multiple outputs, por sus siglas en inglés.
(2.20)
Capítulo 2. Fundamentos teóricos
es de rango completo n.
La controlabilidad del sistema implica que de la matriz de controlabilidad de Kalman,
se puede extraer la siguiente matriz Cc , de n
Cc = b1 ; Ab1 ; : : : ; A
con
1
1
b1 ; b2 ; Ab2 ; : : : ; A
n y de rango completo
2
1
b2 ; : : : ; bm ; Abm ; : : : ; A
m
1
bm
(2.21)
i,
i = 1; : : : ; m. Estos son los índices de controlabilidad de Kronecker del sistema que
P
satisfacen: i i = n. En la construcción de Cc , primero se incluyen todas las columnas
de B, se elimina de la colección de columnas retenidas un vector columna de la forma
A j bj , para cualquier j, con 1
j
m, siempre que A j bj 2 Im (Kc ). Si no es así, se
retiene el vector A j bj y se procede así sucesivamente hasta que se obtengan n columnas
linealmente independientes en el conjunto.
Con base en lo anterior, las salidas planas se obtienen mediante la siguiente expresión:
3
2
6 .1 7 1
. 7
f =6
4 . 5 Cc x
(2.22)
m
con
j; i
= 1; : : : ; m que son los vectores renglón de n componentes de la forma
j
con 1 en la posición
Pj
i=1
= [0; : : : ; 0; : : : ; 0; 1; 0; : : : ; 0]
(2.23)
i.
Nótese que la obtención de la salida plana para el caso multivariable no es única.
2.3.4. Sistemas multivariables en representación matricial polinomial
Otra forma de representar a los sistemas lineales invariantes en el tiempo es mediante
la representación matricial polinomial, para sistemas cuadrados y sistemas rectangulares.
El vínculo entre controlabilidad y platitud de sistemas lineales multivariables se puede
extender a los sistemas cuadrados, es decir, sistemas con el mismo número de entradas y
salidas.
Siguiendo a [Fliess-Marquez, 2000], una representación de estos sistemas, en términos
de matrices polinomiales, está dada por:
25
Capítulo 2. Fundamentos teóricos
0
con det Q(s) 6= 0:
1
0
y1 (s)
u1 (s)
B . C
B
..
B
. C
Q(s) B
.
@ . A = P(s) @
ym (s)
um (s)
1
C
C
A
(2.24)
Se dice que una matriz polinomial cuadrada es unimodular si su determinante es una
constante diferente de cero. De manera equivalente, P(s) es unimodular si existe una
matriz polinomial cuadrada R(s) tal que, R(s)P(s) = I. A R(s) se le llama la inversa
por la izquierda de P(s).
Dos matrices Q(s) y P(s) son coprimas por la izquierda (derecha), si no tienen factores
comunes no triviales en la matriz izquierda (derecha).
Dos matrices polinomiales cuadradas P(s), Q(s) son coprimas por la izquierda sí, y
solo si satisfacen la identidad de Bezout, es decir, existen matrices no singulares cuadradas
S(s) y T (s) tal que
P(s)S(s) + Q(s)T (s) = I
(2.25)
Dos matrices polinomiales cuadradas A(s) y B(s) son coprimas por la derecha sí, y
solo si existen dos matrices cuadradas no singulares M(s) y N (s) tales que se satisface
la identidad de Bezout:
M(s)A(s) + N (s)B(s) = I
(2.26)
El sistema lineal entrada-salida descrito en (2.24) es controlable sí, y solo si las matrices
polinomiales Q(s) y P(s) son coprimas por la izquierda.
Un sistema lineal cuadrado entrada-salida, con salida y y entrada u es controlable sí,
y solo si existe un vector , tal que el sistema tiene la siguiente representación coprima
por la derecha
y(s) = A(s) (s);
u(s) = B(s) (s)
(2.27)
con A(s) y B(s) matrices cuadradas no singulares coprimas por la derecha, Compárese
este resultado (2.27) con la parametrización equivalente de la entrada y la salida en la
26
Capítulo 2. Fundamentos teóricos
representación de función de transferencia (2.11).
Un sistema MIMO cuadrado de la forma (2.24) exhibe al vector
la salida plana. Note que
como el vector de
satisface las siguientes propiedades:
1. La “dimensión”de
es igual a la “dimensión”del vector u.
2. Los componentes de
son independientes. Esto signi…ca que no satisfacen ningu-
na relación algebraica, ni son soluciones de ecuaciones diferenciales, las cuales son
independientes de las variables del sistema.
3. Todas las variables del sistema (entradas u y salidas y) se parametrizan diferencialmente en términos de .
4. El vector
se genera endógenamente por las entradas, salidas y un número …nito
de sus derivadas en el tiempo.
Las primeras tres propiedades se establecen directamente a partir de las propiedades
de la representación coprima por la derecha. Para veri…car la última propiedad, note,
que si A(s) y B(s) son coprimas por la derecha, entonces existen matrices cuadradas no
singulares M(s) y N (s) tales que se satisface la identidad de Bezout (2.26).
Multiplicando por la derecha a la identidad de Bezout por el vector , se tiene:
M(s)A(s) (s) + N (s)B(s) (s) = (s)
Lo cual, en virtud de las relaciones en (2.27), se obtiene la siguiente expresión para
en términos de y y u
(s) = M(s)y(s) + N (s)u(s)
Esto muestra que el vector
se genera endógenamente. Compare este desarrollo con el
obtenido en (2.12) para la representación en función de transferencia.
El resultado general, respecto a la identi…cación natural del vector de la salida plana
con el vector de la salida del sistema, y, se muestra a continuación, este resultado se
encuentra en el trabajo de Fliess y Márquez [Fliess-Marquez, 2000].
27
Capítulo 2. Fundamentos teóricos
Para un sistema cuadrado de la forma:
2
y1 (s)
6
6 y2 (s)
Q(s) 6
6 ..
4 .
ym (s)
3
2
u1 (s)
7
6
7
6 u (s)
7 = P(s) 6 2
..
7
6
.
5
4
um (s)
3
7
7
7
7
5
el vector y cali…ca como la salida plana sí, y sólo si se satisfacen las siguientes dos condiciones:
1. El sistema es controlable, es decir, Q(s) y P(s) son coprimas por la izquierda.
2. La matriz P(s) es unimodular.
Como se puede observar la determinación de la salida plana mediante la representación
matricial polinomial, se extiende de los resultados obtenidos en la representación de función de transferencia.
Sistemas rectangulares en representación matricial polinomial
Para evaluar la propiedad de platitud en sistemas lineales multivariables no cuadrados
con m entradas y p salidas, se puede reducir al caso de sistemas cuadrados. Para ello se
tiene que los sistemas en la descripción matricial polinomial son sistemas de la forma:
D(s)
= N (s)u
y = Q(s) + W (s)u
(2.28)
donde todas las matrices tienen como entradas a polinomios en la variable compleja s
y tienen dimensiones apropiadas. La controlabilidad del sistema (2.28) es una propiedad
estructural respecto a la relación entre la entrada u y el vector . El resultado se enuncia
en la siguiente proposición.
Proposición 2.4 [Fliess-Marquez, 2000] El sistema (2.28) es controlable sí y sólo si
las matrices D(s) y N (s) son coprimas por la izquierda.
28
Capítulo 2. Fundamentos teóricos
Para sistemas lineales, dados en la forma (2.28), el vector
cali…ca como la salida
plana si las siguientes condiciones se satisfacen:
El sistema es controlable, es decir, D(s) y N (s) son coprimas por la izquierda, y
La dimensión del vector
es m y la matriz N (s) es unimodular, es decir, existe una
matriz polinomial cuadrada R(s) tal que, R(s)N (s) = I.
Este resultado que se puede encontrar en Fliess y Márquez [Fliess-Marquez, 2000],
implica que todas las variables del sistema se pueden expresar en términos del vector
y
de un número …nito de sus derivadas en el tiempo. En efecto
u(s) = R(s)D(s) (s)
y(s) = [Q(s) + W (s)R(s)D(s)] (s)
El vector
se generó endógenamente, porque depende de las entradas, las salidas y de
un número …nito de sus derivadas en el tiempo.
2.4. Planeación y seguimiento de trayectoria
La noción de generación de trayectoria o planeación de movimiento, corresponde a lo
que intuitivamente entendemos por la preparación de un plan de vuelo. Más precisamente,
consiste en la generación fuera de línea de una trayectoria y las acciones de control asociadas que la generan. Esta trayectoria se genera a partir de un punto inicial hasta un
punto …nal previstos, en lazo abierto, es decir, basada en el conocimiento sólo del modelo
del sistema, en el caso ideal en que las perturbaciones estén ausentes. A esta trayectoria
se la llama, a menudo, de referencia o trayectoria nominal.
La propiedad de platitud diferencial simpli…ca la tarea de planeación de movimiento
debido a que si se de…ne una trayectoria de la variable de salida, conocida como salida
plana, se puede obtener la evolución de las otras variables del sistema (x; u) sin resolver
ninguna ecuación diferencial del sistema.
Si se quiere construir una trayectoria cuya condición inicial y …nal estén especi…cadas,
es su…ciente calcular la trayectoria de la salida plana correspondiente, con lo cual ya no
29
Capítulo 2. Fundamentos teóricos
es necesario resolver las ecuaciones diferenciales del sistema. Es decir, si un sistema es
plano, entonces tiene una salida plana, tal que ésta parametriza a todas las variables del
sistema, entonces, si se especi…can los valores iniciales y …nales de x y u (que inicie desde
x(0) = x0 en el tiempo 0 con el control inicial u(0) = u0 , y que …nalice en x(tf ) = xtf con
el control …nal u(tf ) = utf ), por la suprayectividad de las funciones
x =
(f; f ; f ; :::; f (q) )
u =
(f; f ; f ; :::; f (q+1) )
y
se pueden encontrar los valores iniciales y …nales de f y sus derivadas con respecto al
tiempo, es decir, de f; f ; : : : ; f q+1 .
Una interpretación geométrica de platitud diferencial, adecuada a planeación de trayectoria es que las funciones que relacionan las variables del estado con la salida plana,
constituyen un difeomor…smo, por un lado, entre el espacio del estado y las entradas,
y por otro lado, en el espacio de la salida plana. Este difeomor…smo establece una correspondencia entre las trayectorias del sistema t 7! x(t), t 7! u(t) y las curvas libres o
algebraicas t 7! f (t). A esta correspondencia se le denomina equivalencia en el sentido de
Lie-Bäcklund [Fliess et al., 1999]. En la Figura 2.1 se muestra la representación grá…ca
de esta equivalencia.
Figura 2.1: Correspondencia entre las trayectorias del sistema y curvas arbitrarias.
Las curvas algebraicas deben satisfacer las condiciones iniciales establecidas para las
30
Capítulo 2. Fundamentos teóricos
trayectorias t 7! x(t), t 7! u(t). En el espacio de la salida plana, el problema de encontrar
estas curvas algebraicas t 7! f (t) es sencillo, por lo que, una vez parametrizada esta f (t),
solo bastará con proyectarlas hacia el espacio del estado y de las entradas para obtener
las trayectorias t 7! x(t), t 7! u(t) deseadas.
El problema de planeación y generación de trayectorias se resuelve al encontrar una
trayectoria t 7! f (t) que sea diferenciable q + 1 veces y tal que satisfaga la condición
inicial y …nal especi…cada. Así, las trayectorias del sistema t 7! x(t), t 7! u(t) se deducen
de la salida plana y sus derivadas hasta el orden q + 1. Además esta salida t 7! f (t) no
necesita satisfacer ninguna ecuación diferencial, entonces se puede calcular mediante una
interpolación polinomial (véase Anexo A) o por una curva de Bézier.
2.4.1. Curva de Bézier
Para el problema de planeación de trayectorias se emplea con frecuencia el método de
la curva de Bézier.
La curva de Bézier es un sistema desarrollado por el Dr. Pierre Bézier en la década
de 1960 para el trazado de dibujos técnicos, en el diseño aeronáutico y de automóviles.
Son curvas paramétricas, adaptables y suaves, se utilizan principalmente en interpolación,
aproximación, ajuste de curvas y representación de objetos. Además, las curvas de Bézier
son curvas continuamente diferenciales, requisito necesario para el diseño de controladores
basados en platitud diferencial.
La curva de Bézier une dos puntos mediante una curva suave, la Figura 2.2 muestra
un ejemplo de una curva de Bézier
Figura 2.2: Curva de Bézier
Como se observa, los elementos esenciales de una curva de Bézier son: Los puntos P0 ,
P1 , P2 , P3 llamados nodos o puntos de control, a la …gura que forman esos nodos se le
31
Capítulo 2. Fundamentos teóricos
llama polígono de control, y a los puntos Qi mediante los cuales se puede modi…car la
forma de la curva, se les denomina puntos intermedios. El número de lados que tenga
el polígono de control representa el grado de la curva. Una curva de Bézier pasa por el
primer y último punto de control, y es tangente al polígono de control en estos puntos
…nales. Una curva de Bézier se de…ne como sigue [Sederberg, 2007]:
B(t) =
8
>
>
>
>
n
< X
>
>
>
>
:
P0
n!
i!(n i)!
t1 t
t1 t0
;
n i
t t0
t1 t0
t < t0
i
Pi ; t0 < t < tf
i=0
pf
;
t > tf
donde P0 , Pf son los valores inicial y …nal, respectivamente; t0 , tf el tiempo inicial y …nal,
y n es el orden de la curva. Este tipo de curva se utiliza para el problema particular de
llevar a un sistema dinámico de un estado inicial en reposo a otro estado …nal en reposo,
mejor conocido como problema de control reposo a reposo (rest-to-rest).
En esta tesis se eligió utilizar una curva de Bézier debido a la relativa facilidad en
su construcción y en la modi…cación de sus parámetros. Esto, en comparación con otras
técnicas de interpolación polinomial, como es la interpolación de diferencias divididas
de newton, la interpolación mediante B-spline, la interpolación de Lagrange, entre otras
(véase el Anexo A).
2.5. Matrices polinomiales
En esta sección se presentan algunas de…niciones acerca de polinomios así como sus
operaciones básicas, esto con el …n de entender con mayor facilidad a las matrices polinomiales, las cuales son matrices cuyas entradas son polinomios. Se muestran las operaciones
básicas para matrices polinomiales, la forma de Smith y la identidad de Bezout.
2.5.1. Polinomios
Sea F un campo, por ejemplo, de los números reales R, de los números complejos C,
de los números racionales W, de funciones racionales W (s), de la variable compleja s, etc.
Se le llama polinomio a w(s) en la variable compleja s sobre el campo F, donde los
32
Capítulo 2. Fundamentos teóricos
ai 2 F para i = 0; 1; : : : ; n son los coe…cientes de este polinomio [Kaczorek, 2007].
w(s) =
n
X
ai s i = a0 + a1 s + : : : + an s n
(2.29)
i=0
El conjunto de polinomios (2.29) sobre el campo F se denotará por F [s].
Si an 6= 0, se dice que w(s) tiene grado n y se denota como deg w(s), es decir, n =
deg w(s):
Si an = 1, se dice que el polinomio es mónico.
Si ai = 0, se llama polinomio cero, para i = 0; 1; : : : ; n .
A a0 se le llama término independiente.
Dados dos polinomios
w1 (s) = a0 + a1 s + : : : + an sn
w2 (s) = b0 + b1 s + : : : + bm sm
se de…ne la suma de polinomios como
8 P
Pn
m
i
i
>
; n>m
(a
+
b
)s
+
>
i
i
i=m+1 ai s
i=0
<
Pn
i
(w1 + w2 ) (s) := w1 (s) + w2 (s) =
; n=m
i=0 (ai + bi ) s
>
P
P
>
m
n
:
i
i
; m>n
i=n+1 bi s
i=0 (ai + bi ) s +
Si n > m, entonces la suma es un polinomio de grado n.
(2.30)
9
>
>
=
>
>
;
(2.31)
Si m > n, entonces la suma es un polinomio de grado m.
Si n = m y an + bn 6= 0, entonces la suma es un polinomio de grado n
Si n = m y an + bn = 0 la suma es un polinomio de grado menor que n.
Entonces se tiene
deg [w1 (s) + w2 (s)]
max [deg [w1 (s)] ; deg [w2 (s)]]
Se le llama producto de un polinomio y un escalar
(un escalar puede considerarse
como un polinomio de grado cero) al polinomio cuyos coe…cientes son producto de los
coe…cientes ai y del escalar , es decir
w(s) =
n
X
ai si
i=0
33
Capítulo 2. Fundamentos teóricos
Se de…ne la multiplicación de dos polinomios de la siguiente forma
(w1 w2 ) (s) := w1 (s)w2 (s) =
m+n
X
X
ai b j s k
(2.32)
k=0 i+j=k
se tiene que deg [w1 (s)w2 (s)] = n + m, puesto que an bm 6= 0 para an 6= 0, bm 6= 0:
Sea w2 (s) un polinomio no nulo y n > m, entonces existen exactamente dos polinomios
q(s) y r(s) tales que
w1 (s) = w2 (s)q(s) + r(s)
donde
deg [r(s)] < deg [w2 (s)] = m
El polinomio q(s) se le denomina parte entera cuando r(s) 6= 0 y cociente cuando
r(s) = 0, y r(s) es el residuo.
Si r(s) = 0, entonces w1 (s) = w2 (s)q(s); se dice entonces que el polinomio w1 (s) es
divisible sin residuo por el polinomio w2 (s), o equivalentemente, que el polinomio w2 (s)
divide sin residuo al polinomio w1 (s), lo cual se denota por w1 (s) j w2 (s).
Considérese los polinomios en (2.30), se dice que el polinomio d(s) es un divisor común
de los polinomios w1 (s) y w2 (s) si existen los polinomios w1 (s) y w2 (s) tales que
w1 (s) = d(s)w1 (s),
w2 (s) = d(s)w2 (s)
Al polinomio dm (s) se le llama máximo común divisor (MCD) de los polinomios w1 (s)
y w2 (s), si cada divisor común de esos polinomios es un divisor del polinomio dm (s). Un
MCD dm (s) de los polinomios w1 (s) y w2 (s) se determina únicamente hasta la multiplicación por un factor constante y satisface la igualdad
dm (s) = w1 (s)m1 (s) + w2 (s)m2 (s)
(2.33)
donde m1 (s) y m2 (s) son polinomios, los cuales se determinan utilizando el algoritmo de
Euclides o el método de operaciones elementales.
34
Capítulo 2. Fundamentos teóricos
La esencia del algoritmo de Euclides es el siguiente: Usando la división de polinomios
se determina la secuencia de polinomios q1 ; q2 ; : : : ; qk y r1 ; r2 ; : : : ; rk satisfaciendo las siguientes propiedades:
8
>
w1 = w2 q1 + r1
>
>
>
>
>
w2 = r1 q2 + r2
>
>
>
< r =r q +r
1
2 3
3
>
>
>
>
>
>
r k 2 = r k 1 qk + r k
>
>
>
:
rk 1 = rk qk+1
9
>
>
>
>
>
>
>
>
>
=
(2.34)
>
>
>
>
>
>
>
>
>
;
Se detienen los cálculos cuando se obtiene el último residuo diferente de cero rk y rk
es divisible sin residuo por rk . Con r1 ; r2 ; : : : ; rk
1
1
eliminados de (2.34) se obtiene (2.33)
para dm (s) = rk . Así el último residuo diferente de cero rk es el MCD de los polinomios
w1 (s) y w2 (s).
2.5.2. Matrices polinomiales
Una matriz cuyos elementos son polinomios sobre el campo F se le llama matriz polinomial sobre el campo F o simplemente matriz polinomial [Kaczorek, 2007].
2
3
d11 (s) : : : d1n (s)
7
6
..
..
..
7,
dij (s) 2 F(s)
D(s) = [dij (s)] i=1;:::;m = 6
.
.
.
4
5
j=1;:::;n
dm1(s) : : : dmn(s)
El orden de la matriz polinomial se denota por m
polinomiales de orden m
(2.35)
n. Un conjunto de matrices
n sobre un campo F se denota por Fm
n
[s].
La siguiente matriz es un ejemplo de una matriz polinomial de 2
2 sobre el campo
de los números reales.
Do (s) =
"
s2 + 2s + 1
2
s+2
2
2s + s + 3 3s + s
3
#
2 R2
2
[s]
Las matrices polinomiales del mismo orden se pueden sumar y multiplicar con las
operaciones habituales de suma y producto de matrices; y en cada caso se obtiene otra
35
Capítulo 2. Fundamentos teóricos
matriz polinomial. Dadas dos matrices polinomiales
D(s) = [dij (s)] i=1;:::;m =
j=1;:::;n
E(s) = [eij (s)] i=1;:::;m =
j=1;:::;n
q
X
k=0
t
X
Dk s k
(2.36)
Ek sk
k=0
de igual orden m
n se de…ne su suma de la siguiente manera
9
8 P
Pq
t
k
k
>
>
(D
+
E
)
s
+
D
s
;
q
>
t
>
>
k
k
k
k=t+1
=
< k=0 P
q
k
D(s)+E(s) = [dij (s) + eij (s)] i=1;:::;m =
; q=t
k=0 (Dk + Ek ) s
j=1;:::;n
>
>
>
>
;
: Pq (D + E ) sk + Pt
k
E
s
;
q
<
t
k
k
k=q+1 k
k=0
(2.37)
Si q = t y Dq + Eq 6= 0, entonces la suma en (2.37) es una matriz polinomial de orden
q, y si Dq + Eq = 0, entonces el orden de la matriz polinomial no es mayor que q. Así se
tiene
deg [D(s) + E(s)]
max [deg [D(s)] ; deg [E(s)]]
Se le llama producto de la matriz polinomial (2.35) y el escalar
, a una matriz
polinomial donde cada entrada es el producto de una entrada de la matriz (2.35) y el
escalar , es decir
D(s) = [ dij (s)] i=1;:::;m
j=1;:::;n
donde
6= 0, se tiene que deg [ D(s)] = deg [D(s)].
La multiplicación de dos matrices polinomiales puede llevarse a cabo si y sólo si el
número de columnas de la primera matriz (2.35) es igual al número de …las de la segunda
matriz.
D(s) = [dij (s)] i=1;:::;m =
j=1;:::;n
E(s) = [eij (s)] i=1;:::;n =
j=1;:::;p
q
X
k=0
t
X
Dk sk
Ek sk
k=0
Una matriz polinomial de la forma
G(s) = [gij (s)] i=1;:::;m = D(s)E(s) =
j=1;:::;p
q+t
X
k=0
36
G k sk
Capítulo 2. Fundamentos teóricos
se le denomina producto de matrices polinomiales, donde
Gk =
k
X
Dl Ek
l
k = 0; 1; : : : ; q + t
(2.38)
l=0
(Dl = 0, l > q, El = 0, l > t)
Para (2.38) se tiene la siguiente relación
deg [D(s)E(s)] = deg [D(s)] + deg [E(s)] ;
Si al menos una de las matrices es regular
deg [D(s)E(s)]
Para cualquier otro caso
deg [D(s)] + deg [E(s)] ;
De…nición 2.3 [Kaczorek, 2007] Se dice que una matriz polinomial D(s) es una matriz
unimodular si su determinante es una constante direfente de cero. Claramente, la inversa
de una matriz unimodular es también una matriz unimodular.
De…nición 2.4 [Kaczorek, 2007] Una operación elemental sobre una matriz polinomial puede ser una de las siguientes tres operaciones:
intercambio de dos …las o dos columnas;
multiplicación de una …la o una columna por una constante;
suma de una …la (columna) a otra …la (columna).
De…nición 2.5 [Kaczorek, 2007] Una matriz elemental izquierda (derecha) es una matriz tal que, cuando se multiplica por la izquierda (derecha) a una matriz polinomial, entonces se cumple una operación elemental por …la (columna) sobre la matriz polinomial.
Todas las matrices elementales son unimodulares.
De…nición 2.6 [Kaczorek, 2007] Dos matrices polinomiales D(s) y E(s) son matrices equivalentes, si existen conjuntos de matrices elementales izquierdos y derechos,
fL1 (s); L2 (s); : : : ; Lk1 (s)g y fR1 (s); R2 (s); : : : ; Rk2 g, respectivamente, tales que
D(s) = Lk1 (s)
L2 (s)L1 (s)E(s)R1 (s)R2 (s)
Rk2 (s)
De…nición 2.7 [Kaczorek, 2007] Dos matrices polinomiales V (s) y W (s) que tienen el
mismo número de columnas (…las) son coprimas por la izquierda (derecha) si todos los
factores comunes derechos (izquierdos) son matrices unimodulares.
37
Capítulo 2. Fundamentos teóricos
2.5.3. Forma de Smith
El siguiente resultado proporciona una forma canónica, conocida como forma de Smith,
para matrices polinomiales bajo una transformación unimodular.
Teorema 2.2 [Levine-Nguyen, 2003] sea P 2 Fn
tonces existen matrices unimodulares U 2 Fn
p1 ; : : : ; p 2 F [s] tales que pi divide a
2
p1
6
6 0
6
P =V 6 .
6 ..
4
0
n
m
[s], y sea
[s] y V 2 Fm
m
pi+1 para todo i = 1; : : : ;
3
0
0
7
..
7
. 0
0
7
7U
..
7
0 p
.
5
0
0(n ) (m )
Además, para todo i = 1; : : : ; , sea
mónico para todos los subdeterminantes i
i,
, el rango de P . En[s] y polinomios mónicos
1 y tal que
denotado como el máximo común divisor
i de P . Entonces, pi se determina únicamente
por
i
= p1 ; : : : ; p i
Las matrices unimodulares V (izquierda) y U (derecha) se obtienen en la práctica como
producto de matrices unimodulares correspondientes a las siguientes acciones elementales
izquierdas y derechas:
Las acciones derechas consisten en permutar dos columnas, multiplicar una columna
por un número real diferente de cero, o sumar la j
por un polinomio arbitrario de la i
esima columna multiplicada
esima columna, para i y j arbitrarios;
Las acciones izquierdas consisten, análogamente en permutar dos …las, multiplicar
una …la por un número real diferente de cero, o sumar la j
por un polinomio arbitrario de la i
esima …la multiplicada
esima …la, para i y j arbitrarios.
El algoritmo para transformar a la matriz P (s) del teorema 2.2 consiste en
1. Permutar …las y columnas para colocar el elemento de grado menor en la posición
superior izquierda, denotada por p1;1 (s).
38
Capítulo 2. Fundamentos teóricos
2. Dividir todos los elementos restantes p1;k (s) (respectivamente pk;1 (s)) de la nueva
primera …la (respectivamente primera columna) por p1;1 (s).
3. Si uno de los residuos es diferente de cero, digamos ri;k (s) (respectivamente rk;1 (s)),
se resta la columna correspondiente (respectivamente …la) a la primer columna (respectivamente …la) multiplicada por el cociente correspondiente q1;k (s) de…nida por la
división Euclidiana p1;k (s) = p1;1 (s)q1;k (s) + r1:k (s) (respectivamente qk;1 (s) de…nida
por pk;1 (s) = p1;1 (s)qk;1 (s) + rk:1 (s)).
4. Se continúa reduciendo el grado del elemento en la posición superior izquierda hasta
que todos los residuos sean cero.
5. Entonces multiplicando todas las columnas por los cocientes correspondientes q1;k (s),
k = 2; : : : ; v (respectivamente las …las por qk;1 (s), k = 2; : : : ; u), la primera …la se
convierte en (p1;1 (s); 0; : : : ; 0) y la primera columna (p1;1 (s); 0; : : : ; 0)T .
6. Se aplica el mismo algoritmo para la segunda …la y así sucesivamente.
7. Para cada transformación de …las y columnas corresponde una matriz unimodular
elemental izquierda o derecha.
8. Finalmente se obtiene la matriz unimodular V (respectivamente U ) como producto
de todas las matrices unimodulares elementales izquierdas (respectivamente derechas) construidas.
2.5.4. Identidad de Bezout
Sean A y B dos matrices polinomiales con el mismo número de …las (respectivamente
columnas). Se dice que B es un divisor izquierdo (respectivamente derecho) de A si existe
una matriz polinomial Q tal que A = BQ (A = QB). Por lo tanto, se dice que A es
múltiplo de B por la izquierda (respectivamente derecha).
Se dice que la matriz polinomial R es un divisor común izquierdo (respectivamente
derecho) de las matrices polinomiales A y B si, y sólo si R es un divisor izquierdo (respectivamente derecho) de A y B. Además, R es el máximo común divisor (MCD) izquierdo
39
Capítulo 2. Fundamentos teóricos
(respectivamente derecho) de A y B si es un múltiplo derecho (respectivamente izquierdo)
de cualquier otro divisor común izquierdo (respectivamente derecho) de A y B.
Si el MCD izquierdo (respectivamente derecho) R es la matriz identidad, se dice que
A y B son coprimas por la izquierda (respectivamente derecha).
Teorema 2.3 (Identidad de Bezout) La matriz polinomial R es el MCD izquierdo
(respectivamente derecho) de A y B si, y sólo si existen dos matrices polinomiales X
y Y tales que AX + BY = R (respectivamente XA + Y B = R).
En este capítulo se presentó la noción de platitud para sistemas lineales en diferentes
representaciones, así como también se describió como la propiedad de platitud diferencial
simpli…ca las tareas de planeación de movimiento y seguimiento de trayectoria. Algunas
de las técnicas más utilizadas para planear movimiento son la curva o polinomio de Bézier
y la interpolación polinomial, cabe reiterar que en este trabajo de tesis se está utilizando
la curva de Bézier para planeación de movimiento.
Finalmente se abordó la herramienta matemática necesaria para el enfoque matricial
polinomial que se utiliza en la caracterización de la salida plana de [Levine-Nguyen, 2003],
la cual se presentará detalladamente en el capítulo siguiente.
40
Capítulo 3. Caracterización de la salida plana para sistemas lineales usando
matrices polinomiales.
3. Capítulo 3. Caracterización de la salida plana para sistemas
lineales usando matrices polinomiales.
3.1. Introducción
En este capítulo se muestra la metodología desarrollada por [Levine-Nguyen, 2003].
Es muy importante mencionar que esta es la base sobre la cual se sustenta la tesis, la
motivación principal es aplicar los resultados expuestos en [Levine-Nguyen, 2003], analizar
el alcance de esta metodología en dos casos de estudio con incertidumbre paramétrica y
determinar heurísticamente el margen de robustez de esta metodología para esos casos de
estudio.
3.2. Sobre platitud
Se dice que un sistema es plano diferencialmente si existe un conjunto de variables
independientes llamadas salidas planas tal que todas las variables del sistema (incluyendo
las variables de entrada) son función de la salida plana y un número …nito de sus derivadas
sucesivas en el tiempo. Más precisamente, el sistema
x = g (x; u)
(3.1)
donde g = (g1 ; : : : ; gn ) es un campo vectorial suave en función de x y de u con x 2 Rn y
u 2 Rm , es plano diferencialmente si se puede encontrar un conjunto de variables llamadas
salidas planas, f 2 Rm , dado por4 :
f = h x; u; u; u; :::; u(p) ;
(3.2)
con h una función suave y p una m-ada …nita de enteros, tal que:
4
x =
f; f ; f ; :::; f (q)
(3.3)
u =
f; f ; f ; :::; f (q+1)
(3.4)
Se utilizará la notación u(k) ; x(k) ; f (k) ; ::: para la derivada de orden k con respecto al tiempo de u; x;
f , respectivamente.
41
Capítulo 3. Caracterización de la salida plana para sistemas lineales usando
matrices polinomiales.
con
y ; funciones suaves, q una m-ada …nita de enteros, y tal que las ecuaciones del
sistema
d
dt
f; f ; f ; :::; f (q+1)
f; f ; f ; :::; f (q) ;
=f
f; f ; f ; :::; f (q+1)
se cumplan.
Como resultado general se tiene que para los sistemas no lineales descritos en la forma
(3.1), son planos diferencialmente si existe un conjunto de variables f de manera que: f
y sus derivadas sucesivas en el tiempo f; f ; f ; ::: son independientes.
La salida plana f es función de x; u y posiblemente de un número …nito de las derivadas
en el tiempo de las componentes de u. Se puede expresar a x y a u como funciones de
las componentes de f y de un número …nito de sus derivadas temporales. Al conjunto de
variables f con estas propiedades se le denomina salida plana [Levine, 2006].
Centrando la atención en los sistemas lineales, de acuerdo con [Fliess, et al., 1995],
[Fliess et al., 1999] se tiene el siguiente resultado.
Proposición 3.1 Un sistema lineal es plano si, y sólo si es controlable.
3.3. Caracterización de la salida plana para sistemas lineales invariantes en el
tiempo en forma matricial polinomial
A continuación se muestra la metodología para determinar la salida plana de sistemas lineales invariantes en el tiempo en representación matricial polinomial reportada
en [Levine-Nguyen, 2003].
Considérese un sistema lineal en la representación matricial polinomial siguiente:
A(s)x = Bu
donde: s =
d
,
dt
A(s) es una matriz de n
n cuyas entradas son polinomios en la variable
formal s y B es una matriz constante de n
u 2 Rm .
(3.5)
m de rango m con 1
m < n, x 2 Rn ;
El sistema (3.5) se asume controlable, es decir que A(s) y B son coprimas. Note que x,
en (3.5), no es un estado completo del sistema, sino un estado parcial de n componentes.
42
Capítulo 3. Caracterización de la salida plana para sistemas lineales usando
matrices polinomiales.
En general, n es más pequeña que la dimensión N de una realización en espacio de estado
alcanzable.
Se llama salida plana lineal a la salida f de…nida en (3.2) como
f = h(x; u; u; u; :::; u(p) )
con h lineal y con
;
lineales de…nidas en (3.3) y (3.4) como x =
(f; f ; f ; :::; f (q) ) y
u = (f; f ; f ; :::; f (q+1) ) , es decir:
xi =
qj
m X
X
(k)
i;j;k fj ;
i = 1; :::; n
(k)
i;j;k fj ;
i = 1; :::; m
j=1 k=0
ui =
j +1
m qX
X
(3.6)
j=1 k=0
y f es una combinación de x, u y un número …nito de las derivadas sucesivas de u:
En el lenguaje de las matrices polinomiales, (3.6) se reescribe como:
x = P (s)f
u = Q(s)f
(3.7)
donde: P es una matriz polinomial de s de orden n
m y Q es una matriz polinomial de
s de orden m
m.
A las matrices P y Q que satisfacen (3.7) se les llama matrices que de…nen a la salida
plana f . El resultado principal de este capítulo es el siguiente.
Teorema 3.1 [Levine-Nguyen, 2003] La variable f = (f1 ; :::; fm ) es una salida plana
lineal del sistema (3.5) sí, y solo si las matrices P y Q están dadas por:
C T A(s)P (s) = 0
(3.8)
A(s)P (s) = BQ(s)
(3.9)
donde: C es una matriz arbitraria de rango n
m ortogonal a B; es decir C T B = 0; P (s)
y Q(s) son de rango m para todo (s), y coprimas por la derecha.
43
Capítulo 3. Caracterización de la salida plana para sistemas lineales usando
matrices polinomiales.
Además, una salida plana lineal ‘f ’del sistema controlable (3.5) siempre existe (y por
lo tanto las matrices P y Q también existen). La solución P (s) en (3.8) está de…nida
hasta por la multiplicación a la derecha por una matriz unimodular de m m. Una posible
elección de Q(s) es:
Q(s) = (B T B ) 1 B T A(s)P (s)
(3.10)
El sistema lineal de entrada-salida descrito por (3.5) es controlable sí, y sólo si las
matrices polinomiales A(s) y B(s) son coprimas. Este resultado, se puede encontrar en
Ilchmann [Ilchman, 1985], y en Vidyasagar [Vidyasagar, 1987].
Esbozo de la prueba del Teorema
Suponga que y es una salida plana lineal. Entonces x y u se pueden expresar como en
(3.7), si combinamos (3.5) y (3.7) entonces obtenemos (3.9):
A(s)P (s) = BQ(s)
Debido a que B es de rango m, existe una matriz constante C de n
rango n
T
m tal que C B = 0n
m;m .
Donde 0n
m;m
(n
m) y de
denota a una matriz de (n
m)
m
cuyas entradas son todas cero.
Como consecuencia, multiplicando por la izquierda a (3.5) por C T , P (s) satisface:
C T A(s)P (s)y = 0n
(3.11)
m;1
para toda función en el tiempo m-dimensional suave y, lo cual implica que C T A(s)P (s)y =
0n
m;m ,
con lo expuesto anteriormente se comprueba (3.8) y (3.9).
Utilizando nuevamente el hecho de que y es una salida plana lineal, se debe satisfacer
(3.12)
y = X(s)x + Y (s)u
para las matrices polinomiales apropiadas. X(s) de orden m
n y Y (s) de orden m
m.
De esta manera, sustituyendo las expresiones de x y de u de (3.7), se obtiene
I = X(s)P (s) + Y (s)Q(s)
44
(3.13)
Capítulo 3. Caracterización de la salida plana para sistemas lineales usando
matrices polinomiales.
con lo cual, de acuerdo a la identidad de Bezout, signi…ca que P (s) y Q(s) son coprimas
por la derecha.
Recíprocamente, sean P (s) y Q(s) dados por (3.8) y (3.9), con P (s) y Q(s) coprimas
por la derecha. Por la identidad de Bezout, Existen dos matrices polinomiales X(s) y
Y (s) que satisfacen
(3.14)
X(s)P (s) + Y (s)Q(s) = I
multiplicando por la derecha por y, se obtiene
(3.15)
X(s)P (s)y + Y (s)Q(s)y = y
puesto que x = P (s)f y u = Q(s)f , despejando a P (s) y Q(s) respectivamente y
sustituyendo en (3.15), se obtiene
(3.16)
y = X(s)x + Y (s)u
(3.17)
A(s)x = A(s)P (s)y = BQ(s)y = Bu
con lo cual se prueba que y es una salida plana lineal.
Ahora se debe probar la existencia de (3.8). De acuerdo al Teorema 2.2 C T A(s) se
puede descomponer en la forma de Smith. Es decir, existen dos matrices unimodulares
V (s) 2 GLn
que
m
(k [s]) y U (s) 2 GLn (k [s]) y una matriz polinomial diagonal
V (s)C T A(s)U (s) = ( (s) j 0n
(3.18)
m;m )
b (s) j U
e (s) ; donde U
b (s) es de orden n
con la descomposición U (s) = U
es de orden n
(n
m, (3.18) se puede escribir como
b (s) =
V (s)C T A(s)U
(s);
e (s) = 0n
V (s)C T A(s)U
Sea P0 (s) una matriz unimodular arbitraria de m
P (s) = U
0n m;m
P0 (s)
b (s) j U
e (s)
= U
Entonces, de acuerdo con (3.19)
(s) tales
m;m
e (s)
m) y U
(3.19)
m, se tiene que
0n m;m
P0 (s)
e (s)P0 (s)
=U
e (s)P0 (s) = 0
V (s)C T A(s)P (s) = V (s)C T A(s)U
45
Capítulo 3. Caracterización de la salida plana para sistemas lineales usando
matrices polinomiales.
como V (s) es unimodular, C T A(s)P (s) = 0, lo cual signi…ca que P (s) es una solución de
e (s) es una
(3.8) para toda matriz unimodular P0 (s) de orden m m. Además, ya que U
submatriz de la matriz unimodular U (s), sus columnas son linealmente independientes
para todo s y en consecuencia U (s) es de rango m para todo s.
En este capítulo se presentó la caracterización de la salida plana para sistemas lineales
invariantes en el tiempo en forma matricial polinomial. El teorema anterior ofrece una
manera efectiva de calcular P y Q. La matriz P puede ser cualquier solución de (3.8) de
rango m para todo s y Q se deduce de (3.10). Note que la descomposición de Smith sólo
se utiliza para la prueba del teorema, más no se necesita en la práctica y sólo se presentó
para probar la existencia de P .
En el siguiente capítulo se aplicará esta metodología en dos casos de estudio: el arreglo
motorizado de alta precisión y el sistema de vibración mecánico, primero se analiza su
respuesta en estado nominal, posteriormente se analizará si esta metodología es efectiva
aún en presencia de incertidumbre en los parámetros.
46
Capítulo 4. Resultados.
4. Capítulo 4. Resultados
4.1. Introducción
De los diferentes métodos para sistemas lineales invariantes en el tiempo para determinar la salida plana, reportados en la literatura, en el capítulo anterior se presentó
la metodología propuesta por [Levine-Nguyen, 2003], la cual caracteriza la salida plana
para sistemas lineales invariantes en el tiempo en su representación en forma matricial
polinomial.
El objetivo principal de esta tesis es analizar la metodología de [Levine-Nguyen, 2003]
para caracterizar la salida plana lineal para sistemas lineales nominales invariantes en el
tiempo en forma matricial a un caso de estudio con incertidumbre paramétrica y estudiar
su efecto en planeación de trayectoria.
Además del caso de estudio especi…cado en el objetivo, se implementó el mismo análisis a otro caso de estudio, se analizó su respuesta en condiciones nominales realizando
seguimiento de trayectoria y, se introdujo incertidumbre en los parámetros, utilizando el
sistema nominal y se estudió su efecto en planeación y seguimiento de trayectoria, por
último se determinó heurísticamente su margen de robustez.
El primer caso de estudio es un arreglo motorizado de alta precisión el cual se utiliza para el desplazamiento de un cuerpo móvil, por ejemplo un carro móvil, sobre una
base. Este arreglo se emplea en las tablas XY de alta velocidad para microelectrónica, en
transportadores y en robots, entre otros.
Para este sistema siguiendo la metodología de [Levine-Nguyen, 2003]; a partir de su
modelo matemático se describe en su representación matricial polinomial y utilizando el
Teorema 3.1 se obtuvo la salida plana. Posteriormente se realizó planeación y seguimiento de trayectoria con el sistema en condiciones nominales, utilizando para este caso una
curva de Bézier, se analizó la respuesta del sistema en condiciones nominales. Luego se
analizó su respuesta incluyendo incertidumbre en los parámetros utilizando el controlador
prealimentado basado en platitud diferencial que se diseñó para el sistema en condiciones
nominales, y se determinó heurísticamente su margen de robustez. Sólo con …nes comparativos se obtuvo la salida plana del sistema empleando la representación en espacio
de estado. Finalmente, se diseñó un controlador combinado en condiciones nominales, el
47
Capítulo 4. Resultados.
cual consta de un controlador prealimentado basado en platitud diferencial y un controlador retroalimentado tipo PID. Se analizó su respuesta y se comparó con el controlador
prealimentado puro deducido de platitud diferencial.
El segundo caso de estudio es un sistema de vibración mecánico. Estos sistemas se utilizan para solucionar problemas de vibraciones en: mesas de calibración de instrumentos,
sistemas de suspensión de vehículos, control de estructuras ‡exibles, etc.
Siguiendo la metodología de [Levine-Nguyen, 2003]; se obtiene la descripción del sistema en su representación matricial polinomial y utilizando el Teorema 3.1 se determinó
la salida plana del sistema en su representación matricial polinomial. Una vez determinada la salida plana, se realizó planeación y seguimiento de trayectoria con el sistema
en condiciones nominales, utilizando una curva tipo Bézier. Se analizó la respuesta del
sistema en condiciones nominales. Posteriormente se analizó su respuesta incluyendo incertidumbre en los parámetros empleando el controlador prealimentado deducido a partir
de platitud diferencial diseñado para el sistema en condiciones nominales, y se determinó
heurísticamente su margen de robustez. Con …nes comparativos se obtuvo la salida plana
del sistema en su representación de espacio de estado y función de transferencia
Como se ha mencionado, en los dos casos de estudio se incluye incertidumbre paramétrica. El tipo de incertidumbre utilizada se le llama incertidumbre paramétrica estructurada
la cual tiene las siguientes propiedades
Estructura conocida.
Parámetros pertenecientes a intervalos:
i
=
0i
+ ei;
ei 2 [ i;
i] ;
i = 1; 2; : : : ; q
Ningún sistema matemático puede modelar exactamente a un sistema físico real; siempre habrá incertidumbre. Incertidumbre se re…ere al desconocimiento del valor numérico
exacto de los parámetros. En el modelo de un proceso la incertidumbre está presente debido a: la reducción del orden del sistema, la linealización (todo sistema físico es inherentemente no lineal), que no se considera la dinámica de alta frecuencia, el desconocimiento
del valor numérico de los parámetros, etc.
48
Capítulo 4. Resultados.
4.1.1. Sistemas mecánicos
Debido a que los casos de estudio a tratar son sistemas mecánicos, entonces se dará
una breve explicación de las de…niciones básicas para entender el funcionamiento de este
tipo de sistemas. Como requisito necesario para la obtención del modelo matemático se
requiere de un conocimiento de las leyes físicas que rigen al sistema.
Los sistemas mecánicos son aquellos sistemas constituidos fundamentalmente por componentes, dispositivos o elementos que tienen como función especí…ca transformar o transmitir el movimiento desde las fuentes que lo generan, al transformar distintos tipos de
energía.
El movimiento de elementos mecánicos se puede describir en varias dimensiones como
de traslación, rotación y sus combinaciones. Las ecuaciones que gobiernan el movimiento de sistemas mecánicos están formuladas directa o indirectamente mediante la ley de
movimiento de Newton.
El movimiento de traslación se de…ne como un movimiento que se realiza a lo largo de
una línea recta. Las variables que se utilizan para describir el movimiento de translación
son aceleración, velocidad y desplazamiento. La ley de movimiento de Newton establece
que la suma algebraica de las fuerzas que actúan sobre un cuerpo rígido en una dirección
dada es igual al producto de la masa del cuerpo por su aceleración en la misma dirección.
La ley se puede expresar como:
X
f uerzas = M a
donde M denota a la masa y a la aceleración en la dirección considerada. En general,
para el movimiento de traslación, los siguientes elementos están involucrados.
1. Masa. La masa es la propiedad de un elemento de almacenar energía cinética del
movimiento de traslación.
2. Resorte lineal. Un resorte está considerado como un elemento que almacena energía
potencial. Todos los resortes en la vida real son, de alguna manera, no lineales. Sin
embargo, si la deformación del resorte es pequeña, de acuerdo con la ley de Hooke
se tiene que la cantidad de estiramiento o de compresión (cambio de longitud), es
49
Capítulo 4. Resultados.
directamente proporcional a la fuerza aplicada, F = kx; donde k es la constante del
resorte, o rigidez
3. Fricción viscosa. La fricción viscosa representa una fuerza que es una relación lineal
entre la fuerza aplicada y la velocidad. El elemento de fricción viscosa se representa
como un amortiguador. La expresión matemática es F = r dx
donde r es el coe…ciente
dt
de fricción viscosa.
4.2. Caso de estudio: Arreglo motorizado de alta precisión
Este sistema es un arreglo motorizado de alta precisión5 que está registrado en Estados
Unidos con la patente número US 6,438,461 B1 y con fecha de registro: 20.08.2002.
El sistema es un dispositivo que comprende:
Una base montada elásticamente al piso, mediante un resorte y un amortiguador;
Un cuerpo móvil que se desplaza linealmente sin fricción a lo largo de un carril …jo
en una base
Un actuador controlable el cual aplica una fuerza al cuerpo móvil con el …n de
desplazarlo sobre la base.
El sistema está diseñado para realizar el desplazamiento de un cuerpo móvil sin fricción
a lo largo de un carril …jo sobre la base, la cual está montada elásticamente al piso,
mediante un amortiguador y un resorte, con el …n de aislar a la base de las vibraciones
procedentes del piso. Un actuador controlable (motor eléctrico) aplica una fuerza F al
cuerpo móvil con el …n de desplazarlo sobre la base, ver Figura 4.1.
El sistema funciona tal manera que se obtiene un desplazamiento y posicionamiento
preciso (particularmente en lo que respecta a la duración prescrita y a la distancia del
desplazamiento) del cuerpo móvil en un marco de referencia independiente y asociado al
piso.
5
En adelante con el …n de simpli…car, al arreglo motorizado de alta precisión se le llamará simplemente
el sistema
50
Capítulo 4. Resultados.
Figura 4.1: Arreglo motorizado de alta precisión.
Al mismo tiempo el sistema supera los problemas causados a la base ya que ésta
comienza a oscilar cuando el cuerpo móvil acelera y desacelera. De modo que por lo
menos la base permanezca inmóvil al …nal del desplazamiento del cuerpo móvil. Por lo
tanto, debido a que la base queda inmovilizada al …nal del desplazamiento, no perturba
el posicionamiento del cuerpo móvil.
Este sistema se utiliza principalmente en las tablas XY de alta velocidad para microelectrónica, transportadores, robots, máquinas de corte, los gra…cadores, entre otros.
El cuerpo móvil tiene una masa M y se desplaza sin fricción sobre una base de masa
MB . La base descansa elásticamente sobre el piso mediante un resorte con constante de
rigidez k y un amortiguador con coe…ciente de fricción viscosa r. Las variables del sistema
son:
x : la posición del centro de masa del cuerpo móvil,
xB : la posición del centro de masa de la base,
F : la fuerza aplicada al cuerpo móvil (es la entrada de control).
De acuerdo con la ley de movimiento de Newton, se tiene que la ecuación de fuerzas
del sistema puede escribirse como:
Mx = F
0
MB x B =
F
kxB
r xB
(4.1)
Por lo tanto se tiene que (4.1) es el modelo matemático que representa al sistema físico
51
Capítulo 4. Resultados.
utilizado en este trabajo. Una vez obtenido el modelo matemático se lleva a su forma
matricial polinomial y se aplica la metodología propuesta por [Levine-Nguyen, 2003] para
caracterizar la salida plana del sistema y posteriormente planear la trayectoria deseada.
También, se obtiene la salida plana en la representación de variables del estado, esto con
el …n de comparar las dos representaciones (matricial polinomial y variables del estado).
Salida plana del sistema en su representación matricial polinomial
En este apartado se presenta el desarrollo de la metodología en forma matricial polinomial para obtener la salida plana del sistema. Es importante resaltar que esta representación es la que se utiliza como base para este trabajo de tesis.
De acuerdo con el modelo matemático del sistema, se le aplica la transformada de
Laplace a (4.1) y se obtiene
S 2 M x(s) = F (s)
0
S 2 MB xB (s) + SrxB (s) + kxB (s) =
(4.2)
F (s)
y acomodando en forma matricial A(s)x = Bu se tiene:
"
M s2
0
0
s2 MB + sr + k
0
#"
x
xB
#
=
"
1
1
#
F
(4.3)
Como se observa, (4.3) tiene la forma de (3.5), es decir está en la representación matricial polinomial. Nótese que esta descripción involucra matrices de orden menor (n = 2) ya
que en su representación en espacio de estado equivalente sería de orden n = 4 (como se
mostrará más adelante). De acuerdo con el Teorema 3.1, se calcula la matriz C; arbitraria,
ortogonal a B es decir, C T B = 0. De (4.3)
B=
52
"
b1
b2
#
=
"
1
1
#
Capítulo 4. Resultados.
"
luego, la matriz C ortogonal a B es C =
C =
"
CT B =
h
1
1
b2
b1
#
#
1 1
"
h
CT =
y
i
, esto es
1
1
#
1 1
=1
i
(4.4)
1=0
De acuerdo con el Teorema 3.1, una salida plana se obtiene calculando P (s) utilizando
(3.8), es decir, C T A(s)P (s) = 0. Así:
1 2 0
s MB + sr + k
k
1
P2 (s) =
M s2
k
P1 (s) =
(4.5)
Una vez obtenida P (s); (4.5) se sustituye en (3.10) para obtener Q(s):
Q(s) = (B T B) 1 B T A(s)P (s)
Q(s) =
h
Q(s) =
h
1
1
2
1
1
2
i
i
"
"
1
1
#!
1
h
1
1
i
M s2
0
0
s2 MB + sr + k
0
"
M s2
0
0
s2 MB + sr + k
#"
1
k
0
0
s2 MB + sr + k
1
k
(M s2 )
#
P (s)
#
1
0
M s2 s2 MB + sr + k
(4.6)
k
Ahora, para veri…car que P (s) y Q(s) sean las correctas, se comprueba que se cumple
Q(s) =
(3.9), esto es que A(s)P (s) = BQ(s); y usando (4.3), (4.5) y (4.6) se veri…ca la igualdad
como se muestra a continuación
#
"
#"
0
1
2
s
M
+
sr
+
k
M s2
0
B
k
0
0
2
1
k
s MB + sr + k
"
1
M s2
k
1
M s2
k
(M s )
0
s2 MB + sr + k
0
2
s2 MB + sr + k
#
=
"
=
"
1
M s2
k
1
M s2
k
1
1
#
1
0
M s2 s2 MB + sr + k
k
0
s2 MB + sr + k
0
s2 MB + sr + k
#
(4.7)
53
Capítulo 4. Resultados.
De acuerdo con lo anterior, se puede caracterizar la salida plana lineal f en el lenguaje
de las matrices polinomiales como en (3.7). Luego, se calcula x = P (s)f utilizando a
(4.5) se tiene
"
#
x
xB
=
"
1
k
0
s2 MB + sr + k
1
k
(M s2 )
#
[f ]
aplicando la transformada de Laplace inversa, L 1 ; se obtiene la parametrización del
estado en términos de la salida plana y sus derivadas temporales, con lo que se tiene
0
MB
r
x =
f + f +f
k
k
M
xB =
f
k
(4.8)
(4.9)
De manera similar, utilizando a (4.6), se determina a u = Q(s)f
u=
1
0
M s2 s2 MB + sr + k
k
f
se le aplica la transformada de Laplace inversa, L 1 , para obtener así la parametrización
de la entrada en términos de la salida plana y sus derivadas temporales, lo que se muestra
enseguida
u=
1
M
k
0
MB f (4) + rf + k f
(4.10)
Finalmente, derivando (4.8) y (4.9), y despejando a f se obtiene la salida plana lineal
para el arreglo motorizado:
f =x
r
1
x+
k
M
0
MB
r2
k
0
xB
rMB
xB
kM
(4.11)
La intención principal es utilizar los resultados obtenidos para realizar planeación de
trayectoria utilizando una curva de Bézier.
Salida plana del arreglo motorizado en representación de espacio de estado.
Para …nes comparativos, se realiza el cálculo de la salida plana del sistema en su
representación de espacio de estado.
54
Capítulo 4. Resultados.
Un conjunto de variables de estado para el sistema (4.1) puede ser
x 1 = x x3 = x B
x 2 = x x4 = x B
Tomando a la entrada u como la fuerza, (4.1) se reescribe ahora en términos de las
variables del estado:
F
M
1
F
=
0 (
MB
x2 =
x4
La representación
2
x1
6
6 x2
6
6 x
4 3
x4
matricial
3 2
0
7 6
7 6
0
7=6
7 6
0
5 6
4
0
kx3
del sistema (4.12) en
32
1
0
0
76
0
0
0 7
76
76
0
0
1 76
54
k
r
0
0
0
M
M
B
B
(4.12)
rx4 )
variables del estado x = Ax + bu es:
3
3 2
0
x1
7
7 6
6 1 7
x2 7
7
M
7+6
(4.13)
6
7u
7
6
7
0
x3 5 4
5
x4
donde A es la matriz de coe…cientes del sistema de orden 4
1
0
MB
4y b es la matriz columna
de entrada.
De acuerdo con la Proposición 2.1, se debe veri…car que el sistema es controlable. Para
esto se calcula la matriz de controlabilidad Cc = [b Ab A2 b A3 b] ; se determina que sea
de rango completo:
2
6
6
6
Cc = 6
6
6
4
0
1
M
0
0
1
M
0
0
0
0
1
0
MB
1
0
MB
r
0
MB2
r
0
MB2
0
kMB r 2
0
MB3
0
r
kMB r2
0
MB3
0
2kMB +r 2
04
MB
3
7
7
7
7;
7
7
5
rank(Cc ) = 4
(4.14)
La matriz de controlabilidad es de rango completo, entonces el sistema es controlable
y por lo tanto es plano. Ahora se procede a obtener su inversa:
2
0
M
0
0
6
6 M
0
0
0
6
0
0
0
Cc 1 = 6
2
2
2
0 kM
2kMB r
B r
6 M r M kMB2 r
r
M
2
2
B
k
k
k
k
4
0
0
0
0
2
0 kM
MB
MB
MB2
B r
M k
M r k 2 MB k 2
r k2
3
7
7
7
7
7
5
(4.15)
55
Capítulo 4. Resultados.
De acuerdo con la Proposición 2.3, la hsalida plana
se obtiene mediante cualquier múltiplo
i
escalar de la combinación lineal f =
f =
h
2
0
M
0
0
6
i6 M
0
0
0
6
0
0
0
0 0 0 1 6
2
2
0
2kMB r
kMB r 2
6 M r M kMB2 r
r
M
B
k
k
k2
k2
4
0
0
0
0
2
0 kM
MB
MB
MB2
B r
M k
M r k 2 MB k 2
r k2
0
=
Cc 1 x, que en este caso es:
0 1
M MB
x1
k
0
0
0
0
M rMB
kMB2 MB r2
x
+
x3
2
k2
k2
rMB2
x4
k2
32
x1
3
76
76 x 7
76 2 7
7
76
7 4 x3 7
5
5
x4
(4.16)
Por lo tanto, para el sistema, la salida plana es
0
f = x1
0
kMB r2
r
x2 +
x3
k
kM
M
r B x4
kM
(4.17)
Como se puede observar (4.11) y (4.17) son iguales, no importa que representación
se emplee, ya sea en espacio de estado o en la representación matricial polinomial. Sin
embargo los cálculos son relativamente más fáciles de realizar utilizando la representación
matricial polinomial, esto se debe principalmente a que se obtienen matrices de menor
orden que con su representación en espacio de estado equivalente.
Luego, es posible obtener la parametrización diferencial de las variables del estado y
de las entradas del sistema en términos de dicha salida plana.
Para ello, calculamos las siguientes cuatro derivadas en el tiempo de la salida plana:
0
f = x2 +
M
r
x3 + B x4
M
M
k
x3
M
k
f =
x4
M
u + kx3 + rx4
f (4) = k
0
M MB
f =
(4.18)
A partir de estas relaciones se obtienen las variables del estado como funciones diferen56
Capítulo 4. Resultados.
ciables de la salida plana, reacomodando (4.17) y (4.18) se tiene
2
1
6
6
6 0
6
6 0
4
0
0
0
M
r kMB
0
MB
M
0
kMB r 2
kM
r
M
k
M
0
0
k
M
r
k
1
0
32
3
2
f
3
x
76 1 7 6
7
76 x 7 6 f 7
76 2 7 6
7
=6
76
7
7
7 4 x3 5 6 f 7
5
4
5
x4
f (3)
(4.19)
despejando al vector x de (4.19), se obtiene al estado como función diferencial de la salida
plana:
0
x1
x2
x3
x4
M
r
= f + f + Bf
k
k
0
r
MB
f
=f+ f+
k
k
M
=
f
k
M
=
f
k
(4.20)
La entrada de control se obtiene como función de las variables del estado, y por
consiguiente como función de la salida plana y sus derivadas en el tiempo:
0
M MB (4) M r (3)
u=
f +
f + M f (2)
k
k
(4.21)
En conclusión, se tiene que la parametrización del estado y de la entrada en términos
de la salida plana y de sus derivadas temporales resulta ser la misma que se obtuvo para
la representación matricial polinomial, ya sea que se utilice la metodología de espacio
de estado o la metodología matricial polinomial. Pero como se puede observar los cálculos para caracterizar la salida plana mediante la representación matricial polinomial son
mucho más fáciles de realizar que con su contraparte en variables del estado.
Como se mencionó anteriormente este desarrollo solo se realizó con el …n de resaltar
las ventajas que tiene la representación matricial polinomial respecto a la representación
en variables del estado. Para realizar planeación y seguimiento de trayectoria se utilizan
los resultados obtenidos en la representación matricial polinomial.
57
Capítulo 4. Resultados.
Eigenvalores del sistema
De acuerdo con la representación en espacio de estado del sistema (4.13), se tiene que
la matriz A es
2
0 1
6
6 0 0
6
A=6
6 0 0
4
0 0
3
0
0
0
0
0
1
k
0
MB
r
0
MB
7
7
7
7
7
5
nótese que A es una matriz diagonal por bloques, con bloques diagonales
2
3
#
"
0
1
0 1
5
A2 = 4
A1 =
k
r
0
0
0 0
M
M
B
B
0
donde MB = 450kg , k = 6.3955 105 , r = 1.1875 104 , sustituyendo se tiene
#
#
"
"
0
1
0 1
A2 =
A1 =
1421: 2
31.7
0 0
El polinomio característico
) es el producto de los polinomios característicos de
A(
cada uno de los bloques diagonales, es decir,
) = det(A1
I) =
2
A2 (
) = det(A2
I) =
2
2
) =
4
=
La traza de la matriz A1 es
1
)=
A1 (
A(
discriminante es
A(
=
2
1
2
A1 (
)
+ 31.7 + 1421.2
+ 31.7
3
+ 1421. 2
2
:= tr [A1 ] = 0; el determinante es
4 = 0. Por lo tanto, las raíces de
1;2
De acuerdo al discriminante
A2 (
+ 31.7 + 1421.2
los eigenvalores de A1 se obtienen de
58
)
=
1h
2
p
2
4
i
A1 (
1
:= jA1 j = 0, el
) y, en consecuencia,
Capítulo 4. Resultados.
a)
2
4 > 0 se tienen 2 raíces reales distintas
b)
2
4 < 0 se tienen 2 raíces complejas conjugadas
c)
2
4 = 0 se tiene una raíz real repetida
Para la matriz A1 se tiene que
= 0, entonces se trata de una raíz real repetida, y
los eigenvalores son
p i
1h
0
0 =0
1;2 =
2
En términos de la traza de A1 , el determinante de A1 , el discriminante y los eigen-
valores, se determina el retrato fase del sistema. Entonces debido a que
1
= 0 y
1
= 0,
1
= 0,
= 0, se tiene un movimiento cortante, para el caso de un movimiento
1;2
cortante se tienen múltiples puntos de equilibrio. En la Figura 4.2 se muestra el retrato
fase del subsistema correspondiente a A1 . El conjunto de puntos de equilibrio es el eje x
Figura 4.2: Movimiento cortante
Para el bloque correspondiente a la matriz A2 ; la traza es
determinante es
2
:= jA2 j = 1421.2, el discriminante es
2
=
2
2
2
:= tr [A2 ] =
4
2
=
31.7; el
4679.91.
De acuerdo al discriminante se tienen 2 raíces complejas conjugadas. Por lo tanto, las
raíces de
A2 (
) y en consecuencia, los eigenvalores se expresan por
p
1
31.7
4679.9
3;4 =
2
15.85 34.20i
3;4 =
59
Capítulo 4. Resultados.
En términos de la traza, el determinante, el discriminante y los eigenvalores, se determina el retrato fase del sistema, entonces debido a que
2
=
4679.91 y
3;4
=
15.85
2
=
31.7,
2
= 1421.2,
34.20i se tiene un foco estable o sumidero en el origen,
el punto de equilibrio del sistema se encuentra en el origen. En la Figura 4.3 se muestra
el retrato fase del subsistema del sistema.
Figura 4.3: Foco estable o sumidero
En la Figura 4.3 se tiene un Foco estable o sumidero. Las trayectorias se enrollan
siguiendo espirales logarítmicas hacia el origen, que es el punto de equilibrio.
Planeación y seguimiento de trayectoria
Con la parametrización diferencial de la entrada, se obtiene de manera directa el
diseño del controlador prealimentado y el seguimiento de trayectoria. Se quiere generar
un desplazamiento del sistema en estado estable a otro con la posición …nal en estado
estable. En términos del sistema se desea generar un desplazamiento del cuerpo móvil en
estado estable a otro con la posición …nal del cuerpo móvil y la base en estado estable.
Es su…ciente generar una trayectoria polinomial para f con respecto al tiempo, mediante
un polinomio de Bézier del siguiente tipo:
p(t) =
n
X
i=0
60
n!
i!(n i)!
tf
tf
t
t0
n i
t
tf
t0
t0
i
Pi
(4.22)
Capítulo 4. Resultados.
donde n es el grado del polinomio, el cual se obtiene de acuerdo a las condiciones iniciales
y …nales, es decir:
f (t0 ) = x0 f (t0 ) = 0 f (t0 ) = 0 f (t0 ) = 0 f (4) (t0 ) = 0
f (t1 ) = x1 f (t1 ) = 0 f (t1 ) = 0 f (t1 ) = 0 f (4) (t1 ) = 0
Debido a que tenemos 10 condiciones iniciales y …nales, el grado del polinomio es igual
a 9. Los valores de P y t son los siguientes: P0 = 0; Pf = 20; t0 = 0; tf = 0.2; es decir,
se desea que la trayectoria de referencia conduzca al sistema de un estado estable inicial
(P0 = 0mm); a un estado estable …nal (Pf = 20mm); en un tiempo de t0 = 0; a t1 = 0.2s:
Los puntos de control Pi se determinan de la siguiente forma:
Si el grado n del polinomio es par, entonces
; i = 0; 1; : : : ; n2
Pi = P0
Pi = P0 +
(Pf P0 )
2
Pi = Pf
; i = ( n2 ) + 1
; i=
( n2 )
(4.23)
+ 2; : : : ; n
Si el grado n del polinomio es impar, entonces
Pi = P0 ; i = 0; 1; : : : ; n+1
2
Pi = Pf ; i = ( n+1
) + 1; : : : ; n
2
De acuerdo con los datos anteriores y sustituyendo estos valores en (4.22), para este
caso el polinomio de Bézier es:
f (t) =
9
X
i=0
9!
i!(9 i)!
0.2 t
0.2
9 i
t
0.2
i
Pi
(4.24)
desarrollando la sumatoria de (4.24) se obtiene el siguiente polinomio:
f (t) = 1
107 t6 315
675t + 18563t2 + 42185t3
(4.25)
Luego, la señal de control nominal se obtiene de (4.10) en términos de (4.25) como
sigue:
u =
1
M
k
0
MB f
(4)
+ rf + kf
(4.26)
61
Capítulo 4. Resultados.
De la misma manera, usando (4.8) y (4.9) se obtienen a x y xB como:
0
MB
r
=
f + f +f
k
k
M
=
f
k
x
xB
(4.27)
y así se logra la parametrización del estado y de la entrada en términos de la salida plana.
Una vez obtenida u , se sustituye en (4.3) como la entrada de control, para formar el
lazo de prealimentación
"
M s2
0
0
0
s2 MB + sr + k
#"
x
xB
#
=
"
1
1
#
u
(4.28)
Con esto se tiene como resultado un sistema en condiciones nominales en lazo abierto
con un controlador prealimentado. Como se puede observar es posible realizar planeación
de trayectoria utilizando la salida plana del sistema en condiciones nominales caracterizada
mediante la metodología matricial polinomial. Con esto se puede realizar el estudio del
sistema en condiciones nominales y con incertidumbre paramétrica. Entonces primero se
analiza la respuesta del sistema en condiciones nominales mediante simulaciones realizadas
en MATLAB
R
y, posteriormente, se analiza la respuesta del sistema cuando se varían
numéricamente de los parámetros.
4.2.1. Caso nominal
Para realizar el análisis de la respuesta del sistema en condiciones nominales, se realizó la simulación de la implementación de este sistema de control en lazo abierto en
SIMULINK
R
de MATLAB
R
y se muestra en la Figura 4.4. Se observa en los bloques
de color magenta la construcción de la curva algebraica, mediante una curva de Bézier, la
cual conforma la planeación de la trayectoria deseada. Tambien se muestran las derivadas
sucesivas en el tiempo de la salida plana; en los bloques de color azul se tiene la parametrización de la entrada u dada por (4.26), del estado parcial (x; xB ) dado por (4.27),
obtenidas mediante la metodología matricial polinomial, y el modelo matemático del sistema en representación matricial polinomial se muestra en color amarillo.
62
Capítulo 4. Resultados.
Figura 4.4: Esquema de control prealimentado basado en platitud diferencial.
En la Tabla 4.1 se muestran los valores numéricos nominales de los parámetros del
sistema tomados de [Levine-Nguyen, 2003].
Tabla 4.1: valores nominales de los parámetros del sistema
Parámetro
Valor nominal
Masa (M )
25kg
0
MB
450kg
Cte. de rigidez (k)
6.3955
105
Coef. de fricción viscosa (r)
1.1875
104
El objetivo de control del sistema consiste en llevar al cuerpo móvil de un estado inicial (0 m) a un estado …nal de (0.02 m), en un tiempo de 0 a 0.2 segundos
[Levine-Nguyen, 2002], y de acuerdo con los datos de fabricación de este tipo de sistemas de Aerotech el error máximo tolerado en la posición …nal del cuerpo móvil es de
3 m.
En la Figura 4.5 se muestran las respuestas de las variables x y xB con respecto al
tiempo del sistema en lazo abierto con el control prealimentado construido usando platitud
diferencial.
63
Capítulo 4. Resultados.
(a)
(b)
Figura 4.5: Respuesta del sistema en condiciones nominales. (a) Seguimiento de
trayectoria en condiciones nominales. (b) Parametrización diferencial de xB :
La Figura 4.5a muestra que el control prealimentado puro deducido de platitud diferencial es su…ciente para realizar un seguimiento de trayectoria satisfactorio en condiciones
nominales, mientras que en la Figura 4.5b se muestra que la variable xB posee una forma
muy similar a su parametrización xB : Esto hace que platitud diferencial sea una herramienta valiosa para predecir el comportamiento de las variables del sistema mediante la
parametrización diferencial.
Figura 4.6: Error de seguimiento, cuerpo móvil.
En la Figura 4.6 se muestra el error de seguimiento en condiciones nominales de la
variable x correspondiente a la posición del centro de masa del cuerpo móvil. Observe
64
Capítulo 4. Resultados.
10 4 m. Además al …nal
que el error de seguimiento posee una magnitud inferior a 4.6
del desplazamiento se observa que se tiene un error de posicionamiento cero, lo que indica
que el cuerpo móvil llegó a la posición deseada.
Debido a que se tiene un seguimiento de trayectoria del sistema satisfactorio en condiciones nominales, entonces se procedió a realizar la variación numérica de los parámetros
para determinar si el control en lazo abierto diseñado para el sistema en condiciones nominales, aún puede hacer seguimiento de trayectoria cuando hay incertidumbre en los
parámetros.
4.2.2. Caso con incertidumbre paramétrica
Como se observó, la caracterización de la salida plana mediante la metodología matricial polinomial resultó ser efectiva en condiciones nominales. Entonces, se procedió a
realizar una variación numérica de los parámetros experimentalmente, con la …nalidad de
determinar si esta caracterización diseñada para el sistema en condiciones nominales es
robusta, heurísticamente, ante incertidumbre en los parámetros.
Se de…ne a
2 Rq como el vector de parámetros del sistema, se considera que los
parámetros son constantes en el tiempo pero desconocidos:
i
donde
0
=
0i
+ ei;
ei 2 [ i;
i] ;
i = 1; 2; : : : ; q
es el valor nominal del vector de parámetros.
;
son los valores mínimo y
máximo admisibles de los parámetros, establecidos heurísticamente, es decir, mediante
variaciones paramétricas realizadas en simulación, tomando en cuenta el cumplimiento de
los objetivos de control para este sistema, principalmente a la velocidad y precisión. En la
siguiente tabla se muestran los valores numéricos de los parámetros nominales así como
sus cotas mínima y máxima.
65
Capítulo 4. Resultados.
Tabla 4.2: Valores nominales y cotas mínimas y máximas de los parámetros del sistema
Parámetro
Valor nominal
Masa (M )
25kg
0.25kg
+0.25kg
Masa (MB )
450kg
45kg
+45kg
Cte. de rigidez (k)
6.3955
105
63.95
103
+63.95
103
Coef. de fricción viscosa (r)
1.1875
104
1.188
103
+1.188
103
0
Masa M =
1
De acuerdo a las características del sistema, principalmente en lo que concierne a
la velocidad y a la precisión, y dado que el error máximo de posicionamiento …nal del
cuerpo móvil es de
3 m; que equivale a 3
10 6 m, se tiene que el parámetro más
signi…cativo para este sistema es la masa del cuerpo móvil. Para mostrar cómo la incertidumbre en el parámetro “M ”afecta el comportamiento del sistema considerablemente,
en la Figura 4.7 se muestra la respuesta del sistema con un intervalo de variación de
e 1 = [ 0.25kg ; +0.25kg ] sobre el valor nominal del parámetro. Físicamente quiere decir
que la masa del cuerpo móvil tiene una incertidumbre en su valor nominal de
equivalente al
250gr
1 % de su valor nominal.
(a)
(b)
Figura 4.7: Variación numérica de la masa del cuerpo móvil. (a) Seguimiento de trayectoria
con incertidumbre. (b) Parametrización de xB con incertidumbre.
66
Capítulo 4. Resultados.
En la Figura 4.7a se observa que el seguimiento de trayectoria se realiza aceptablemente. Sin embargo, debido a la precisión que se requiere que cumpla el sistema, con una
variación numérica de
1 % en la masa del cuerpo móvil, ya no cumple con la condición
de error máximo de posicionamiento. Esto es, si el peso real de la masa es menor a su valor
nominal, es decir 24.75kg (en verde), el cuerpo móvil recorre una distancia mayor a 20mm
en 0.2 segundos. En caso contrario, si el peso real de la masa es mayor al valor nominal, es
decir 25.25kg (en rojo), entonces el cuerpo móvil no alcanza a llegar a la posición deseada
de 20mm en 0.2 segundos. Cabe destacar que, a pesar de dicha variación numérica el controlador prealimentado puro deducido de platitud diferencial sigue haciendo el esfuerzo
de seguir de cerca la trayectoria deseada. En la Figura 4.7b se muestran los movimientos
oscilatorios que tiene la base. Como se observa, la parametrización de xB se realiza de una
forma aceptable. Sin embargo la condición de que la base permanezca inmóvil al …nal del
desplazamiento del cuerpo móvil no se cumple satisfactoriamente.
En la Figura 4.8 se muestra el error de seguimiento del centro de masa del cuerpo
móvil. Como se puede observar, el error de seguimiento tiene una magnitud máxima
aproximadamente de 5.2 10 4 , y al …nal del desplazamiento se tiene un error de 2 10 4 ,
el cual es mayor a 3 m.
Figura 4.8: Error de seguimiento con incertidumbre en la masa del cuerpo móvil
.
Debido a que no se cumple con la condición
de precisión que requiere el sistema, se
realizaron pruebas heurísticas para determinar el margen máximo de incertidumbre que
puede admitir la masa del cuerpo móvil sin que exceda el límite de error de posicionamiento
67
Capítulo 4. Resultados.
…nal. Se llegó a la conclusión de que la masa del cuerpo móvil admite un intervalo de
variación máxima de e 1 = [ 2.5
10 3 kg ; 2.5
10 3 kg ], equivalente a una incertidumbre
del valor nominal de la masa del cuerpo móvil de
2.5gr. La Figura 4.9 muestra la
respuesta del sistema ante dicha variación numérica.
(a)
(b)
Figura 4.9: Variación numérica máxima admisible para la masa del cuerpo móvil. (a)
Seguimiento de trayectoria con incertidumbre. (b) Parametrización de xB con incertidumbre.
En la Figura 4.9a se puede ver que el seguimiento de trayectoria se realiza satisfactoriamente. El error de posicionamiento …nal es de
2 m, por lo tanto se cumple con la
condición de error de posicionamiento …nal. La Figura 4.9b muestra las oscilaciones de la
base. A pesar de que la base no queda inmóvil al …nal del desplazamiento, esta oscilación
no afecta en gran medida el posicionamiento del cuerpo móvil.
En la Figura 4.10 se muestra el error de seguimiento del centro de masa del cuerpo
móvil. Se observa que el error de seguimiento tiene una magnitud máxima aproximadamente de 4.5
10 4 , sin embargo al …nal del desplazamiento se tiene un error de
el cual se puede apreciar en la Figura 4.10b.
68
2 m,
Capítulo 4. Resultados.
(a)
(b)
Figura 4.10: Error de seguimiento con la variación numérica máxima admisible en la masa
del cuerpo móvil. (a) Error de seguimiento con incertidumbre en la masa del cuerpo móvil.
(b) Zoom del error de seguimiento.
Masa de la base MB =
2
La masa de la base tiene un intervalo de incertidumbre de [ 45kg ; +45kg ] sobre su
valor nominal, esto es
2
=
02
+ e2;
e 2 2 [ 45kg ; +45kg ] ;
En la Figura 4.11 se muestra el comportamiento del sistema ante una variación sobre
el valor nominal del parámetro de la masa de la base. Físicamente, quiere decir que la
masa de la base tiene una incertidumbre en su valor nominal de
45kg.
En la Figura 4.11a se puede observar que se realiza el seguimiento de trayectoria
bastante aceptable, Parece que no se supera el límite máximo de error de posicionamiento
…nal. La Figura 4.11b muestra las oscilaciones de la base. A pesar de que la base no
queda inmóvil al …nal del desplazamiento esta oscilación no afecta en gran medida el
posicionamiento del cuerpo móvil.
En la Figura 4.12 se muestra el error de seguimiento del centro de masa del cuerpo
móvil. Se tiene que el error de posicionamiento …nal es menor a 3 m.
69
Capítulo 4. Resultados.
(a)
(b)
Figura 4.11: Respuesta del sistema con una variación numérica para la masa de la base.
(a) Seguimiento de trayectoria con incertidumbre en mB . (b) Parametrización diferencial
con incertidumbre en mB .
Figura 4.12: Error de seguimiento con una variación numérica en la masa de la base
.
Constante de rigidez k =
3
La constante de rigidez tiene un intervalo de incertidumbre [ 63.95
sobre su valor nominal
3
70
=
03
+ e3;
e 3 2 [ 63.95
103 ; +63.95
103 ] ;
103 ; +63.95
103 ]
Capítulo 4. Resultados.
En la Figura 4.13 se muestra el comportamiento del sistema ante la variación antes
mostrada sobre el valor nominal del parámetro. Físicamente, quiere decir que la constante
de rigidez tiene una incertidumbre en su valor nominal de
(a)
63.95
103 .
(b)
Figura 4.13: Respuesta del sistema con una variación numérica para la constante de
rigidez. (a) Seguimiento de trayectoria con incertidumbre en k. (b) Parametrización diferencial con incertidumbre en k.
En la Figura 4.13a se observa que se realiza un seguimiento de trayectoria muy bueno,
a pesar de la incertidumbre que se tiene en la constante de rigidez. La Figura 4.13b se
observa que la base tiende a oscilar aún más. Sin embargo, la base no queda inmóvil al
…nal del desplazamiento, pero esta oscilación no afecta en el posicionamiento del cuerpo
móvil. Como se puede observar la incertidumbre que se presenta en este parámetro no
afecta el posicionamiento del cuerpo móvil, pero si afecta a las oscilaciones de la base. Se
tiene que si el valor numérico real de la constante de rigidez es menor que su valor nominal,
es decir 5.7559
105 (en verde), la base oscila más. Caso contrario si el valor numérico
real de la constante de rigidez es mayor que su valor nominal, es decir 7.035
105 (en
rojo), entonces el resorte es más rígido lo que lleva a una oscilación menor de la base. Es
importante destacar que a pesar de dicha variación numérica no se afecta en gran medida
al posicionamiento del cuerpo móvil.
La Figura 4.14 muestra el error de seguimiento del centro de masa del cuerpo móvil.
Como se puede ver el error de seguimiento tiene una magnitud máxima aproximadamente
de 4.5
10 4 , y se tiene un error de posicionamiento …nal menor a 3 m.
71
Capítulo 4. Resultados.
Figura 4.14: Error de seguimiento con una variación numérica en la constante de rigidez
.
Coe…ciente de fricción viscosa r =
4
El Coe…ciente de fricción viscosa tiene un intervalo de incertidumbre sobre su valor
nominal de [ 1.188
4
103 ; +1.188
=
04
+ e4;
103 ], esto es
e 4 2 [ 1.188
103 ; +1.188
103 ] ;
En la Figura 4.15 se muestra el comportamiento del sistema ante la variación sobre
su valor nominal. Físicamente se tiene que el coe…ciente de fricción viscosa tiene una
incertidumbre en su valor nominal de
72
1.188
103 .
Capítulo 4. Resultados.
(a)
(b)
Figura 4.15: Respuesta del sistema con una variación numérica para el coe…ciente de fricción viscosa. (a) Seguimiento de trayectoria con incertidumbre en r. (b) Parametrización
diferencial con incertidumbre en r.
La Figura 4.16 muestra el error de seguimiento del centro de masa del cuerpo móvil.
El error de seguimiento tiene una magnitud máxima aproximadamente de 4.5
10 4 , y
se tiene un error de posicionamiento …nal es menor a 3 m.
Figura 4.16: Error de seguimiento con una variación numérica en el coe…ciente de fricción
viscosa.
73
Capítulo 4. Resultados.
Variación numérica de todos los parámetros
Por último, se realizó una variación numérica en todos los parámetros con el …n de
analizar la respuesta del sistema ante una variación numérica de todos los parámetros.
Los valores de los parámetros se muestran en la Tabla 4.3.
Tabla 4.3: Variación numérica de los parámetros del sistema
Parámetro
M
MB
k
r
Valor
26.25 kg
495 kg
6.7152 105
1.0687 104
En la Figura 4.17 se muestra el comportamiento del sistema con incertidumbre en todos
los parámetros, es importante señalar que el controlador utilizado es el que se diseñó para
el sistema en condiciones nominales.
(a)
(b)
Figura 4.17: Respuesta del sistema con una variación numérica en todos los parámetros.
(a) Seguimiento de trayectoria con incertidumbre en todos los parámetros. (b) Parametrización diferencial con incertidumbre en todos los parámetros.
En la Figura 4.17a se muestra un seguimiento de trayectoria aceptable, aún en presencia de incertidumbre en todos los parámetros del sistema simultáneamente. Sin embargo,
al parecer no se cumple con la condición de error de posicionamiento …nal del cuerpo
móvil. La Figura 4.17b se observa las oscilaciones de la base. Como es de esperarse la base
no queda inmóvil al …nal del desplazamiento, en este caso debido a que la masa del cuerpo
móvil tiene una variación mayor a la determinada anteriormente para que se mantenga
dentro del error de posicionamiento. Entonces la posición …nal del cuerpo móvil queda
74
Capítulo 4. Resultados.
fuera del límite máximo establecido. Se debe resaltar que a pesar de que no se cumple
el objetivo de exactitud de posicionamiento …nal, el controlador prealimentado puro deducido de platitud diferencial para el sistema en condiciones nominales hace el esfuerzo
de seguir la trayectoria aún en presencia de incertidumbre, de hecho sigue el per…l de la
trayectoria muy de cerca, el problema es que no cumple con el error de posicionamiento
…nal del cuerpo móvil.
La Figura 4.18 muestra el error de seguimiento el centro de masa del cuerpo móvil.
El error de seguimiento tiene una magnitud máxima aproximadamente de 5
tiene un error de posicionamiento …nal aproximadamente de 1
límite establecido de
10 4 , y se
10 4 ; el cual es mayor al
3 m.
Figura 4.18: Error de seguimiento con una variación numérica en todos los parámetros.
De acuerdo con la variación numérica de los parámetros realizada. Se tiene que el
parámetro crítico o más sensible a la incertidumbre paramétrica es la masa del cuerpo
móvil. Esto es porque sólo tolera una variación máxima de
0.01 %. Debido a esto, se
concluye que para este parámetro la caracterización de la salida plana mediante el enfoque
matricial polinomial tiene una robustez débil. Sin embargo, es importante señalar que
las trayectorias resultantes con una variación mayor a
0.01 % son muy parecidas a la
trayectoria deseada. De hecho, si siguen el per…l de la curva, sólo que no cumplen con la
restricción de posicionamiento …nal del cuerpo móvil.
Para los parámetros restantes, se tiene que la caracterización de la salida plana mediante el enfoque matricial polinomial es robusta ante incertidumbre paramétrica. Esto
es principalmente porque estos parámetros no se encuentran directamente relacionados
con el cuerpo móvil, y por este motivo prácticamente no afectan al posicionamiento de
75
Capítulo 4. Resultados.
dicho cuerpo, como se pudo observar estos parámetros se encuentran relacionados con la
masa de la base es por esta razón que las oscilaciones de la base si se ven afectadas por
la incertidumbre en esos parámetros.
4.2.3. Lazo cerrado del sistema utilizando un controlador tipo PID
Hasta ahora el sistema se ha controlado mediante un controlador prealimentado puro
en lazo abierto deducido de platitud diferencial en condiciones nominales. En esta sección
se diseña un controlador en lazo cerrado para el sistema en condiciones nominales el cual
incluye al controlador prealimentado y a un controlador PID. Esto se hace con el …n de
comparar las respuestas de ambos sistemas controlados. En la Figura 4.19 se muestra el
esquema de control desarrollado en MATLAB.
Se utilizó un controlador retroalimentado para comparar la respuesta del sistema con
los resultados obtenidos con el controlador prealimentado puro. En este caso, se utilizó
un controlador lineal tipo PID, cuya estructura es:
P
N
1
1+I +D
s
1 + N 1s
donde P es la parte proporcional, I es la parte integral, D es la parte derivativa y N es un
coe…ciente de …ltro.
El controlador PID se sintonizó con la herramienta “tune”de MATLAB, y los valores
del PID sintonizado se muestran en la Tabla 4.4.
Tabla 4.4: Valores de sintonización para el controlador tipo PID.
Parámetro
P
I
D
N
Valor
25225.846
19927.068
2912.413
212.298
Como se observa en la Tabla 4.4 las ganancias del controlador PID son altas. Esto se
debe a que el sistema físico es muy rápido. El parámetro N especi…ca el coe…ciente de
…ltro de la acción derivativa.
76
Capítulo 4. Resultados.
Figura 4.19: Esquema de control en lazo cerrado.
En la Figura 4.20 se muestra la respuesta del sistema en lazo cerrado en condiciones
nominales. Como se puede observar se tiene una respuesta de un sistema de segundo orden
subamortiguado, esto se debe a la existencia dos polos complejos conjugados, Este caso
tiene lugar cuando el factor de amortiguamiento es menor que uno (" < 1) pero positivo.
La existencia de polos con parte imaginaria determina la aparición de oscilaciones.
El controlador combinado (retroalimentado con PID y prealimentado con platitud
diferencial) no sigue a la trayectoria de referencia o nominal, de hecho como se puede
observar se pasa de la posición …nal y posteriormente llega a la posición deseada en el
tiempo deseado. Sin embargo, debido a la restricción de error de posicionamiento …nal, se
tiene que este controlador a pesar de que llega a la referencia, tiene un sobrepico el cual
se pasa de los 3 m, aunado a que no sigue a la trayectoria de referencia. Se tiene que el
controlador prealimentado puro deducido de platitud diferencial si realiza seguimiento de
trayectoria satisfactoriamente, aun en presencia de incertidumbre en sus parámetros, en
cambio el controlador combinado no realiza seguimiento de trayectoria, y a pesar de que
si llega a la referencia se tiene un sobrepico, con el cual se pasa de la posición …nal.
77
Capítulo 4. Resultados.
Figura 4.20: Seguimiento de trayectoria en lazo cerrado.
La Figura 4.20 muestra que el controlador prealimentado deducido de platitud diferencial tiene una mejor respuesta para este sistema que el controlador combinado (prealimentado + PID) ya que si puede seguir a la trayectoria y además llegar a la posición
deseada. En cambio al controlador combinado no puede seguir la trayectoria en el tiempo
establecido (de 0 a 0.2 segundos) esto puede deberse a que el sistema es muy rápido. En
la Figura 4.21 se muestra el error de seguimiento que tiene el controlador combinado.
La Figura 4.21 muestra el error de seguimiento en lazo cerrado del centro de masa
del cuerpo móvil. El error de seguimiento tiene una magnitud máxima aproximadamente
de 7
10 3 m, sin embargo al …nal del desplazamiento se puede observar que el error de
seguimiento converge a cero.
Figura 4.21: Error de seguimiento en lazo cerrado.
78
Capítulo 4. Resultados.
En el contexto de incertidumbre paramétrica se analiza la respuesta del sistema para el
parámetro más sensible a variaciones que es la masa del cuerpo móvil. Lo anterior se repite
variando numérica simultáneamente a todos los parámetros del sistema. En la Figura
4.22, se muestra una variación de la masa de +10 % de su valor nominal. Físicamente es
equivalente a aumentar 2.5kg al peso de la masa.
Figura 4.22: Seguimiento de trayectoria en lazo cerrado con incertidumbre.
Como se puede observar en la Figura 4.22, a pesar de que el controlador combinado
no sigue a la trayectoria de referencia, éste si llega a la posición deseada de 20mm, pero
se tiene de igual manera un sobrepico el cual provoca que se pase del límite de 20mm.
Más sin en cambio, el controlador prealimentado puro trata de seguir a la trayectoria pero
al …nal no logra llegar a la posición deseada debido a que el cuerpo de la masa móvil es
más pesado. En la Figura 4.23 se muestra el error de seguimiento que tiene el controlador
combinado.
79
Capítulo 4. Resultados.
Figura 4.23: Error de seguimiento en lazo cerrado con incertidumbre paramétrica.
La Figura 4.23 muestra el error de seguimiento en lazo cerrado del centro de masa del
cuerpo móvil. El error de seguimiento tiene una magnitud máxima aproximadamente de
7
10 3 m, pero al …nal del desplazamiento se puede observar que el error de seguimiento
converge a cero. En la Tabla 4.5 se muestra la variación numérica que se realizó simultáneamente a todos los parámetros.
Tabla 4.5: Valores de los parámetros con variación numérica
Parámetro
M
MB
k
r
Valor
27 kg
468 kg
5.7559 105
1.1518 104
En la Figura 4.24 se muestra la respuesta del sistema en lazo cerrado con una variación
numérica de todos los parámetros.
80
Capítulo 4. Resultados.
Figura 4.24: Seguimiento de trayectoria en lazo cerrado con incertidumbre en todos los
parámetros.
Se puede observar en la Figura 4.24, de la misma manera que el controlador prealimentado no puede hacer frente a una variación numérica de todos los parámetros, sin
embargo, trata de seguir a la trayectoria nominal. En cambio, el controlador combinado,
a pesar de que no sigue a la trayectoria nominal, si llega a la posición deseada aun variando numéricamente en todos los parámetros, pero con un sobrepico. En la Figura 4.25
se muestra el error de seguimiento que tiene el controlador combinado.
Figura 4.25: Error de seguimiento en lazo cerrado utilizando el controlador combinado.
La Figura 4.25 muestra el error de seguimiento en lazo cerrado del centro de masa del
cuerpo móvil. El error de seguimiento tiene una magnitud máxima aproximadamente de
7
10 3 m. Sin embargo, al …nal del desplazamiento se puede observar que el error de
seguimiento converge a cero.
81
Capítulo 4. Resultados.
En conclusión, se tiene que el controlador combinado no puede hacer el seguimiento de
la trayectoria de referencia. Esto es debido a que el sistema es muy rápido. Sin embargo,
cabe resaltar que este controlador si llega a la posición deseada al …nal del desplazamiento,
aún en presencia de incertidumbre paramétrica. Pero, debido a que la respuesta de este
controlador es de un sistema de segundo orden subamortiguado, en la trayectoria que
realiza a partir del segundo 0.16 se pasa de la posición …nal deseada.
4.3. Caso de estudio: Sistema de vibración mecánico
En los últimos años se ha tratado extensamente el control de vibraciones en sistemas
mecánicos. Estos sistemas se utilizan para solucionar problemas de vibraciones en: mesas
de calibración de instrumentos, sistemas de suspensión de vehículos, control de estructuras
‡exibles y muchas otras.
Figura 4.26: Sistema de vibración mecánico.
De acuerdo con la ley de movimiento de Newton, se tiene que la ecuación de fuerzas
del sistema puede escribirse como:
m1 x1 =
m2 x2 = u
82
k2 x 1
k1 (x1
k1 (x2
x1 )
x2 )
c(x1
c x2
x1
x2 )
(4.29)
Capítulo 4. Resultados.
Se tiene entonces que (4.29) es el modelo matemático que representa al sistema físico.
Una vez obtenido se lleva al modelo matemático a su forma matricial polinomial y se
aplica la metodología propuesta por [Levine-Nguyen, 2003] para obtener la salida plana
del sistema. Posteriormente se le aplica planeación de trayectoria utilizando una curva
de Bézier. Se analiza la respuesta del sistema en condiciones nominales. Si es factible,
entonces se incluye incertidumbre paramétrica y se analiza la respuesta del sistema, con
el …n de veri…car si el controlador diseñado para el sistema en condiciones nominales aún
funciona cuando se tiene incertidumbre en los parámetros. También se obtiene la salida
plana del sistema en la representación de variables del estado y en función de transferencia
con el …n de comparar las representaciones.
83
Capítulo 4. Resultados.
Salida plana del sistema en su representación matricial polinomial
En este apartado se presenta el desarrollo de la metodología en forma matricial polinomial para obtener la salida plana del sistema.
De acuerdo con el modelo matemático del sistema, se le aplica la transformada de
Laplace a (4.29)
(k2 + k1 ) x1 (s)
scx2 (s) + s2 m1 x1 (s) = 0
k1 x2 (s) + scx1 (s)
s2 m2 x2 (s) + k1 x2 (s)
k1 x1 (s) + scx2 (s)
scx1 (s) = u(s)
(4.30)
agrupando términos de (4.30) se tiene
k2 + k1 + sc + s2 m1 x1 (s) + [ k1
sc] x2 (s) = 0
sc] x1 (s) + s2 m2 + k1 + sc x2 (s) = u(s)
[ k1
(4.31)
y acomodando en forma matricial A(s)x = Bu :
"
k2 + k1 + sc + s2 m1
k1
k1
sc
s2 m2 + k1 + sc
sc
#"
x1 (s)
x2 (s)
#
=
"
0
1
#
u(s)
(4.32)
Como se puede observar, (4.32) tiene la forma de (3.5), esto quiere decir que se encuentra en la representación matricial polinomial. Véase que esta descripción involucra
matrices de orden menor (n = 2) ya que con su equivalente representación en espacio
de estado sería de orden n = 4. De acuerdo con el Teorema 3.1,
" se#calcula
" la
# matriz C;
b1
0
arbitraria, ortogonal a B es decir, C T B = 0. De (4.32) B =
=
. Luego, la
1
b2
"
#
b2
matriz C ortogonal a B es C =
, esto es
b1
84
C =
"
CT B =
h
1
0
#
1 0
CT =
y
i
"
0
1
#
h
1 0
=0+0=0
i
(4.33)
Capítulo 4. Resultados.
De acuerdo con el Teorema 3.1, una salida plana se obtiene calculando P (s) utilizando
(3.8), es decir, C T A(s)P (s) = 0. Así:
p1 = (k1 + cs)
m 1 s2
p2 =
cs
k1
(4.34)
k2
Una vez obtenida P (s); (4.34) se sustituye en (3.10) para obtener
1
Q(s) = B T B
Q(s) =
Q(s) =
Q(s) =
h
h
0 1
0 1
i
i
"
"
0
1
#!
1
h
0 1
i
B T A(s)P (s)
A(s)P (s)
k2 + k1 + sc + s2 m1
k1
m2 s2 + cs + k1
k1
sc
s2 m2 + k1 + sc
sc
m1 s2 + cs + k1 + k2
#"
(k1 + cs)
(m1 s2 + cs + k1 + k2 )
(k1 + cs)2
#
(4.35)
Ahora, para veri…car que P (s) y Q(s) sean las correctas, se comprueba que se cumple
(3.9), esto es que A(s)P (s) = BQ(s); y usando (4.32), (4.34) y (4.35) se veri…ca la igualdad
como se muestra a continuación
"
k2 + k1 + sc + s2 m1
k1
k1
donde
sc
sc
s2 m2 + k1 + sc
#"
(k1 + cs)
( m 1 s2
= (m2 s2 + cs + k1 ) (m1 s2 + cs + k1 + k2 )
cs
k1
#
k2 )
" #
0
=
=
"
"
0
1
0
#
#
(k1 + cs)2 :
De acuerdo con lo anterior, se puede caracterizar la salida plana lineal f en el lenguaje
de las matrices polinomiales como en (3.7). Luego, se calcula x = P (s)f utilizando a
(4.34) se tiene
x=
"
(k1 + cs)
( m 1 s2
cs
k1
k2 )
#
f (s)
85
Capítulo 4. Resultados.
aplicando la transformada de Laplace inversa, L 1 ; se obtiene la parametrización del
estado en términos de la salida plana y sus derivadas temporales
x1 = k1 f + cf
(4.36)
x2 = (k1 + k2 ) f + cf + m1 f
(4.37)
De manera similar se determina a u = Q(s)f , utilizando a (4.35)
u = k1 k2 + ck2 s + (k1 m1 + k1 m2 + k2 m2 ) s2 + (cm1 + cm2 ) s3 + s4 m1 m2 f (s) (4.38)
aplicando la transformada de Laplace inversa, L
1
a (4.38), se obtiene la parametrización
de la entrada en términos de la salida plana y sus derivadas temporales
u = k1 k2 f + ck2 sf + (k1 m1 + k1 m2 + k2 m2 ) f
+ (cm1 + cm2 ) f + s4 m1 m2 f (4)
Finalmente, derivando (4.36) y (4.37), y despejando a f se obtiene la salida plana
lineal para el vibrador mecanico:
f = k1 m 1
c2 x1
cm1 x1 + c2 x2
La intención principal es utilizar los resultados obtenidos para realizar planeación de
trayectoria, mediante una curva de Bézier.
Salida plana del sistema en su representación de espacio de estado
Para …nes comparativos, se realiza el cálculo de la salida plana del sistema en su
representación de espacio de estado.
Un conjunto de variables de estado para el sistema (4.29) puede ser x1ss = x1 , x2ss =
x1 ; x3ss = x2 y x4ss = x2 : Tomando a la entrada u como la fuerza, (4.29) se reescribe
ahora en términos de las variables del estado:
k1
c
k2
x1ss
(x1ss x3ss )
(x2ss x4ss )
m1
m1
m1
u
k1
c
=
(x3ss x1ss )
(x4ss x2ss )
m2 m2
m2
x2 =
x4
86
(4.39)
Capítulo 4. Resultados.
La representación matricial del sistema (4.39) en variables del estado x = Ax + bu es:
2
x1
3
2
0
6
7 6
6 x2 7 6
6
7 6
6 x 7=6
4 3 5 4
x4
1
k1 +k2
m1
c
m1
0
0
k1
m2
c
m2
0
0
k1
m1
c
m1
0
1
k1
m2
c
m2
32
x1ss
76
7 6 x2ss
76
76 x
5 4 3ss
x4ss
3
2
0
3
7 6
7
7 6 0 7
7+6
7
7 6 0 7u
5 4
5
(4.40)
1
m2
donde A es la matriz de coe…cientes del sistema y b es la matriz columna de entrada.
De acuerdo con la Proposición 2.1, se debe veri…car que el sistema es controlable. Para
esto se calcula la matriz de controlabilidad Cc = [b Ab A2 b A3 b] ; se determina que sea
de rango completo y se obtiene su inversa:
2
0
0
6
6 0
6
Cc = 6
6 0
4
c
m1 m2
1
m2
c
m22
1
m2
donde
24
44
Cc
1
donde
= c
2
ck2
+
c2
m1 m2
24
c2 m1 +c2 m2 k1 m1 m2
m32 m1
c
m22
2
k1
+ m1cm2
m2
2 m +c2 m
1
2 2k1 m1 m2
m42 m21
k1 m1 +c2
m1 m2
k12 m1 +c2 k2
m2
31
( k1 m 1 + c 2 )
=c
c2 m1 +c2 m2 k1 m1 m2
m22 m21
44
3
7
7
7
7 , rank(Cc ) = 4
7
5
c2 m21 +c2 m22 +2c2 m1 m2 2k1 m1 m22 2k1 m21 m2 k2 m1 m22
,
m32 m31
c (m1 + m2 ) c
31
c2
m22
1
m2
=
6
6
=6
6
4
c2
m21
1
m2
c
m1 m2
k1
m1
:
1
k12 m
m2
0
c2 m1 +c2 m2 k1 m1 m2
m2
cm1
2
c3 mk1 m
2
k12 m1 +c2 k2
m1
2
2
c c m1 +c mm12m2k1 m1 m2
2
c
k12 m1 +c2 k2
m1
0
0
0
3
7
7
7 (4.41)
7
5
k1 m21 c2 m1 c2 m2 +2k1 m1 m2 +k2 m1 m2
.
m1 m2
Se tiene que la matriz de controlabilidad es de rango completo, entonces el sistema es
controlable y por lo tanto es plano. De acuerdo con la Proposición 2.3, la hsalida plana
se
i
1
obtiene mediante cualquier múltiplo escalar de la combinación lineal f = 0 1 Cc x,
87
Capítulo 4. Resultados.
que en este caso es:
f =
=
h
2
k1 m1 +c2
m1 m2
k12 m1 +c2 k2
m2
i6
6
0 0 0 1 6
6
4
k1 m 1
donde
31
2
c3 mk1 m
2
k12 m1 +c2 k2
m1
c2 m1 +c2 m2 k1 m1 m2
c
m1 m2
2
0
31
32
( k1 m 1 + c 2 )
cm1
c
k12 m1 +c2 k2
m1
0
0
0
32
x1ss
76
7 6 x2ss
76
76 x
5 4 3ss
x4ss
3
7
7
7
7
5
cm1 x2ss + c2 x3ss
c2 x1ss
=c
1
k12 m
m2
ck2
k1 m21 c2 m1 c2 m2 +2k1 m1 m2 +k2 m1 m2
,
m1 m2
32
=
c2 m1 +c2 m2 k1 m1 m2
:
m2
Por lo tanto, para el sistema, la salida plana es
f = k1 m 1
c2 x1ss
cm1 x2ss + c2 x3ss
Luego, es posible obtener la parametrización diferencial de las variables del estado y
de las entradas del sistema en términos de dicha salida plana
x1ss = k1 f + cf
x2ss = k1 f + cf
x3ss = (k1 + k2 ) f + cf + m1 f
x4ss = (k1 + k2 ) f + cf + m1 f
(4.42)
La entrada de control se obtiene como función de las variables del estado, y por
consiguiente como función de la salida plana y sus derivadas en el tiempo:
u = k1 k2 f + ck2 sf + (k1 m1 + k1 m2 + k2 m2 ) f + (cm1 + cm2 ) f + s4 m1 m2 f (4)
Salida plana del sistema en su representación de función de transferencia
La representación de este sistema en representación de función de transferencia es
y(s) =
s4 m
1 m2
+
s3
(cm1 + cm2 ) +
s2
k1 cs
u(s)
(k1 m1 + k1 m2 + k2 m2 ) + sck2 + k1 k2
como se puede observar se tiene la forma y(s) =
n(s)
u(s),
d(s)
donde
n(s) = k1 cs
d(s) = s4 m1 m2 + s3 (cm1 + cm2 ) + s2 (k1 m1 + k1 m2 + k2 m2 ) + sck2 + k1 k2
88
Capítulo 4. Resultados.
El sistema es controlable por que los polinomios del numerador y denominador son
coprimos, es decir, no tienen factores comunes.
Se de…ne a la salida plana f (s) como f (s) =
f (s) =
1
u(s),
d(s)
entonces se tiene
1
u(s)
s4 m1 m2 + s3 (cm1 + cm2 ) + s2 (k1 m1 + k1 m2 + k2 m2 ) + sck2 + k1 k2
Reescribiendo a y(s) en términos de f (s) como sigue y(s) = n(s)f (s)
y(s) = (k1 + cs) f (s)
= k1 f (s) + csf (s)
aplicando L
1
se tiene
y(t) = k1 f (t) + cf (t)
Reescribiendo a u(s) en términos de f (s), u(s) = d(s)f (s)
u(s) =
s4 m1 m2 + s3 (cm1 + cm2 ) + s2 (k1 m1 + k1 m2 + k2 m2 ) + sck2 + k1 k2 f (s)
= s4 m1 m2 f (s) + s3 (cm1 + cm2 ) f (s) + s2 (k1 m1 + k1 m2 + k2 m2 ) f (s)
+sck2 f (s) + k1 k2 f (s)
aplicando L
1
se tiene
000
00
u(t) = f (4) (t)m1 m2 + f (t) (cm1 + cm2 ) + f (t) (k1 m1 + k1 m2 + k2 m2 )
0
+f (t)ck2 + f (t)k1 k2
Planeación y seguimiento de trayectoria
Con la parametrización diferencial de la entrada, se obtiene de manera directa el
diseño del controlador prealimentado y el seguimiento de trayectoria. Se propone una
acción de control en dos fases: Primero, forzar al sistema a seguir una referencia constante
de la salida plana cuyo valor será f0 : El efecto de esta primera fase es eliminar todas las
oscilaciones en el sistema. Cuando el sistema mecánico ha sido estabilizado a unos valores
de desplazamiento constante y de velocidad cero, el estado es entonces forzado a moverse
suavemente hacia el origen de coordenadas. Esta segunda fase se realiza, forzando la salida
89
Capítulo 4. Resultados.
plana f a seguir una adecuada trayectoria la cual lleva a f de un valor constante f0 a cero
en el intervalo de tiempo [t0 ; tf ]. Note, que si f es forzada a cero, todas las variables de
estado son llevadas a un equilibrio en el origen. Es su…ciente con generar una trayectoria
polinomial para f con respecto al tiempo, mediante un polinomio de Bézier del siguiente
tipo:
P (t) =
8
>
>
>
>
n
< X
>
>
>
>
:
P0
t1 t
t1 t0
n!
i!(n i)!
;
n i
t t0
t1 t0
t < t0
i
Pi ; t0 < t < tf
i=0
pf
;
t > tf
el cual se parametriza con los siguientes valores: P0 = 0:1; Pf = 0; t0 = 7; tf = 12; n = 9,
los puntos de control Pi se determinan de acuerdo a (4.23) de la siguiente forma:
Si el grado n del polinomio es par, entonces
; i = 0; 1; : : : ; n2
Pi = P0
Pi = P0 +
(Pf P0 )
2
; i = ( n2 ) + 1
(4.43)
; i = ( n2 ) + 2; : : : ; n
Pi = Pf
Si el grado n del polinomio es impar, entonces
Pi = P0 ; i = 0; 1; : : : ; n+1
2
Pi = Pf ; i = ( n+1
) + 1; : : : ; n
2
Entonces el polinomio de Bézier (4.22) tiene la siguiente forma:
8
>
0:1
;
t < t0
>
>
>
9
< X
9!
12 t 9 i t 7 i
f (t) =
Pi ; t0 < t < tf
i!(9 i)!
5
5
>
>
i=0
>
>
:
0
;
t > tf
(4.44)
desarrollando la sumatoria de (4.44) obtenemos el siguiente polinomio:
f (t) = 1: 233 4
10 4 t9
+100: 82t5
90
1: 011 2
10 2 t8 + 0:364 79t7
883: 09t4 + 5108: 8t3
7: 601 3t6
18834:t2 + 40170:0t
37795
Capítulo 4. Resultados.
Luego la señal de control nominal se calcula de (4.38) en términos de f como sigue:
u = (k1 k2 ) f + ck2 f + (k1 m1 + k1 m2 + k2 m2 ) f + (cm1 + cm2 ) f + m1 m2 f
(4)
(4.45)
Usando (4.36) y (4.37) se calcula a x1 y x2 :
x 1 = k1 f + c f
(4.46)
x2 = (k1 + k2 ) f + cf + m1 f
(4.47)
y así se obtiene la parametrización del estado y de la entrada en términos de la salida
plana.
Una vez obtenida u , se sustituye en (4.32) como la entrada de control, para formar
el lazo de prealimentación
"
k2 + k1 + sc + s2 m1
k1
sc
k1
sc
s2 m2 + k1 + sc
#"
x1
x2
#
=
"
0
1
#
u
(4.48)
Con esto se obtiene un sistema en condiciones nominales en lazo abierto con un controlador prealimentado. Con esto se puede realizar el estudio del sistema con incertidumbre
paramétrica. Para la cual primero se analiza la respuesta del sistema en condiciones nominales mediante simulaciones realizadas en MATLAB
R
y posteriormente se analiza la
respuesta del sistema ante una variación numérica de los parámetros, utilizando el controlador prealimentado basado en platitud diferencial diseñado para el sistema en condiciones
nominales.
4.3.1. Caso nominal
Para realizar el análisis de la respuesta del sistema en condiciones nominales, se
simuló la implementación de este sistema de control en lazo abierto en SIMULINK
de MATLAB
R
R
y se muestra en la Figura 4.27. Se observa en el bloque en color naranja
la construcción de la curva algebraica mediante una curva de Bézier y las derivadas en
el tiempo de la salida plana; en los bloques color verde se muestra la parametrización
de las variables del estado (x1 y x2 ) en términos de la salida plana, en el bloque azul se
tiene la parametrización de la entrada u, y en el bloque color magenta se tiene el modelo
matemático del sistema en la representación matricial polinomial.
91
Capítulo 4. Resultados.
Figura 4.27: Diagrama de simulación sistema de vibración mecánico.
En la tabla 4.6 se muestran los valores numéricos nominales del sistema tomados de
[Sira-Ramírez, 2000]
Tabla 4.6: Valores nominales de los parámetros del sistema de vibración mecánico
Parámetro
Valor nominal
Masa1 (m1 )
0.5 kg
Masa 2 (m2 )
0.2 kg
Cte. de rigidez 1 (k1 )
175 [N=m]
Cte. de rigidez 2 (k2 )
450 [N=m]
h
i
N
16 m=s
Coef. de fricción viscosa (c)
El control del sistema consiste primero en eliminar todas las oscilaciones en el sistema,
y segundo en llevar al sistema a un estado …nal en el origen.
En la Figura 4.28 se muestran las respuestas de las variables x1 y x2 con respecto
al tiempo del sistema en lazo abierto con el control prealimentado construido usando
platitud diferencial.
92
Capítulo 4. Resultados.
(a)
(b)
Figura 4.28: Respuesta del sistema en condiciones nominales. (a) Seguimiento de trayectoria en condiciones nominales para x1 . (b) Seguimiento de trayectoria en condiciones
nominales para x2
La Figura 4.28 muestra la respuesta del sistema en condiciones nominales. Como se
observa el sistema tarda 6 segundos aproximadamente para eliminar las oscilaciones. Una
vez transcurrido este tiempo entonces se realiza el seguimiento de trayectoria (a partir
del segundo 7), con el …n de llevar al sistema al origen. En la Figura 4.28a se muestra
la respuesta del estado x1 , se puede ver que el control prealimentado puro deducido de
platitud diferencial es su…ciente para realizar un seguimiento de trayectoria satisfactorio
en condiciones nominales. En la Figura 4.28b se muestra la respuesta del estado x2 , de la
misma manera se pude observar que el seguimiento de trayectoria en condiciones nominales
se realiza satisfactoriamente.
Debido a que se tiene un seguimiento de trayectoria del sistema satisfactorio en condiciones nominales, entonces se procedió a realizar una variación numérica de los parámetros
para determinar si el control en lazo abierto diseñado para el sistema en condiciones nominales, aún puede hacer seguimiento de trayectoria cuando existe incertidumbre en los
parámetros.
93
Capítulo 4. Resultados.
4.3.2. Caso con incertidumbre paramétrica
Como se observó la caracterización de la salida plana mediante la metodología matricial polinomial resultó ser efectiva en condiciones nominales. Entonces, es posible realizar
una variación numérica de los parámetros con la …nalidad de determinar si esta caracterización diseñada para el sistema en condiciones nominales es robusta, heurísticamente,
con incertidumbre en los parámetros.
Se de…ne a
2 Rq como el vector de parámetros del sistema, se considera que los
parámetros son constantes en el tiempo pero desconocidos:
i
donde
0
=
0i
+ ei ;
ei 2 [ i ;
i] ;
i = 1; 2; : : : ; q
es el valor nominal del vector de parámetros.
;
son los valores mínimo y
máximo admisibles de los parámetros establecidos heurísticamente, es decir, mediante
variaciones paramétricas realizadas en simulación, tomando en cuenta el cumplimiento
de los objetivos de control para este sistema,. En la Tabla 4.7 se presentan los valores
numéricos de los parámetros nominales así como sus cotas de variación numérica mínima
y máxima.
Para realizar las simulaciones considerando incertidumbre paramétrica se utilizó el
diagrama de la Figura 4.27.
Tabla 4.7: Valores con variación numérica de los parámetros del sistema de vibración
mecánico
Parámetro
Valor nominal
i
Masa1 (m1 )
0.5 kg
0.15 kg
+0.15 kg
Masa 2 (m2 )
0.2 kg
0.06 kg
+ 0.06kg
Cte. de rigidez 1 (k1 )
175 [N=m]
35
+35 [N=m]
Cte. de rigidez 2 (k2 )
450 [N=m]
h
i
N
16 m=s
90 [N=m]
h
i
N
4 m=s
+90 [N=m]
h
i
N
+4 m=s
Coef. de fricción viscosa (c)
94
i
Capítulo 4. Resultados.
Masa 1 m1 =
1
En la Figura 4.29 se muestra la respuesta del sistema con un intervalo de variación
numérica del parámetro m1 de [ 0.15kg ; +0.15kg ] sobre su valor nominal. Físicamente
quiere decir que la masa m1 tiene una incertidumbre en su valor nominal de
equivalente al
0.15kg ,
30 % de su valor nominal.
(a)
(b)
Figura 4.29: Respuesta del sistema con incertidumbre en la masa 1. (a) Seguimiento de
trayectoria para x1 con incertidumbre en el parámetro m1 . (b) Seguimiento de trayectoria
para x2 con incertidumbre en el parámetro m1 .
En la Figura 4.29a y Figura 4.29b se observa que el seguimiento de trayectoria se
realiza, pero no en las condiciones deseadas. Esto es debido a que no se cumple con la
condición de eliminar las oscilaciones dentro de los primero 7 segundos. El sistema deja de
oscilar aproximadamente hasta el segundo 9, cabe destacar que aún con las oscilaciones
el sistema si logra seguir a la trayectoria deseada, y llegar a la posición …nal establecida.
Masa 2 m2 =
2
En la Figura 4.30 se muestra la respuesta del sistema ante un intervalo de variación
numérica del parámetro m2 de [ 0.06kg ; +0.06kg ] sobre su valor nominal. Físicamente
95
Capítulo 4. Resultados.
quiere decir que la masa m2 tiene una incertidumbre en su valor nominal de
equivalente al
0.06kg ,
30 %.
(a)
(b)
Figura 4.30: Respuesta del sistema con incertidumbre en la masa 2. (a) Seguimiento de
trayectoria para x1 con incertidumbre en el parámetro m2 . (b) Seguimiento de trayectoria
para x2 con incertidumbre en el parámetro m2 .
En la Figura 4.30a se observa que si se realiza seguimiento de trayectoria, sin embargo
no se está efectuando satisfactoriamente. Debido a que no se cumple con la condición
establecida de la eliminación de las oscilaciones, de hecho el sistema no deja de oscilar
entonces cuando se lleva al sistema al origen este no cumple con la especi…cación de velocidad cero y aceleración cero. El mismo caso ocurre en la Figura 4.30b, la cual corresponde
a la trayectoria para la variable x2 . En este caso las oscilaciones son más pequeñas pero
aun así el sistema no cumple con la condición …nal de velocidad y aceleración cero.
Debido a que no se realiza satisfactoriamente el seguimiento de trayectoria, se realizaron pruebas heurísticas para determinar el margen máximo de incertidumbre que
puede admitir la masa 2 del sistema de vibración mecánico, para que se realice un buen
seguimiento. Se llegó a la conclusión de que la masa 2 del sistema de vibración mecánico
admite un intervalo de variación máxima de [ 0.025kg ; 0.025kg ], equivalente a una incertidumbre del valor nominal de la masa 2 de
del sistema ante dicha variación numérica.
96
5 %. La Figura 4.31 muestra la respuesta
Capítulo 4. Resultados.
(a)
(b)
Figura 4.31: Respuesta del sistema con incertidumbre máxima admitida en la masa 2. (a)
Seguimiento de trayectoria para x1 con incertidumbre en el parámetro m2 . (b) Seguimiento
de trayectoria para x2 con incertidumbre en el parámetro m2 .
En la Figura 4.31a se observa que si se realiza seguimiento de trayectoria satisfactoriamente. Se cumple con la condición establecida de la eliminación de las oscilaciones. El mismo caso ocurre en la Figura 4.31b, la cual corresponde a la trayectoria
para la variable x2 . El sistema cumple con la condición …nal de velocidad y aceleración
cero. Para este parámetro se tiene que admite un margen máximo de incertidumbre de
[ 0.025kg ; 0.025kg ].
Constante de rigidez 1 k1 =
3
En la Figura 4.32 se muestra la respuesta del sistema con un intervalo de variación
numérica del parámetro k1 de
35 N
; +35 N
sobre su valor nominal. Físicamente quiere
m
m
decir que el resorte k1 tiene una incertidumbre en su valor nominal de
al
35 N
, equivalente
m
20 %.
97
Capítulo 4. Resultados.
(b)
(a)
Figura 4.32: Respuesta del sistema con incertidumbre en el resorte. (a) Seguimiento de
trayectoria para x1 con incertidumbre en el parámetro k1 . (b) Seguimiento de trayectoria
para x2 con incertidumbre en el parámetro k1 .
En la Figura 4.32a se observa que el seguimiento de trayectoria para la variable x1 se
realiza satisfactoriamente. Se tiene a aproximadamente en el segundo 7 las oscilaciones
desaparecen y se realiza el seguimiento de trayectoria, llevando al sistema a una posición …nal con velocidad y aceleración cero. En la Figura 4.32b, la cual corresponde a la
trayectoria para la variable x2 , no se está llevando a cabo el seguimiento de trayectoria.
Se tiene que si el valor real de la constante de rigidez es menor a su valor nominal, es
decir su valor real se encuentra dentro de la cota inferior se logra la eliminación de las
oscilaciones aproximadamente hasta el segundo 8. Sin embargo, no sigue la trayectoria
deseada, aunque se sigue el per…l de la curva con un desfasamiento. A pesar de esto, el
sistema si llega a la posición …nal con velocidad y aceleración cero. De la misma manera
sucede cuando el valor real de la constante de rigidez se encuentra dentro de la cota superior. El sistema no realiza el seguimiento de trayectoria, pero si se sigue el per…l de la
curva.
Constante de rigidez 2 k2 =
4
En la Figura 4.33 se muestra la respuesta del sistema con un intervalo de variación
numérica del parámetro k2 de
98
90 N
; +90 N
sobre su valor nominal. Físicamente quiere
m
m
Capítulo 4. Resultados.
decir que el resorte k2 tiene una incertidumbre en su valor nominal de
al
, equivalente
90 N
m
20 %.
(a)
(b)
Figura 4.33: Respuesta del sistema con incertidumbre en el resorte 2. (a) Seguimiento de
trayectoria para x1 con incertidumbre en el parámetro k2 . (b) Seguimiento de trayectoria
para x2 con incertidumbre en el parámetro k2 .
En las Figura 4.33a y Figura 4.33b se observa que el seguimiento de trayectoria no
se realiza satisfactoriamente. Aunque el sistema si llega a la posición …nal deseada con
velocidad y aceleración cero, esté no está siguiendo la trayectoria deseada, además no
cumple con la eliminación de las oscilaciones en el tiempo establecido. Se tiene que si
el valor real de la constante de rigidez es menor a su valor nominal, es decir su valor
real se encuentra dentro de la cota inferior se logra la eliminación de las oscilaciones
aproximadamente hasta el segundo 9. Sin embargo, no sigue la trayectoria deseada, aunque
se sigue el per…l de la curva con un desfasamiento. De la misma manera sucede cuando el
valor real de la constante de rigidez se encuentra dentro de la cota superior. Si se cumple
con la condición de eliminar las oscilaciones en el tiempo establecido. Sin embargo, el
sistema no realiza el seguimiento de trayectoria, pero si se sigue el per…l de la curva.
Debido a que no se realiza satisfactoriamente el seguimiento de trayectoria, se realizaron pruebas heurísticas para determinar el margen máximo de incertidumbre que
puede admitir el resorte 2 del sistema de vibración mecánico, para que se realice un
buen seguimiento. Se llegó a la conclusión de que el resorte 2 del sistema de vibración
99
Capítulo 4. Resultados.
mecánico admite un intervalo de variación máxima de
una incertidumbre del valor nominal del resorte de
; 2.25 N
, equivalente a
2.25 N
m
m
0.5 %. La Figura 4.34 muestra la
respuesta del sistema ante dicha variación numérica.
(a)
(b)
Figura 4.34: Respuesta del sistema con incertidumbre máxima admitida en el resorte 2. (a)
Seguimiento de trayectoria para x1 con incertidumbre en el parámetro k2 . (b) Seguimiento
de trayectoria para x2 con incertidumbre en el parámetro k2 .
En la Figura 4.34a se observa que si se realiza seguimiento de trayectoria satisfactoriamente. Se cumple con la condición establecida de la eliminación de las oscilaciones. El
mismo caso ocurre en la Figura 4.34b, la cual corresponde a la trayectoria para la variable
x2 . El sistema cumple con la condición …nal de velocidad y aceleración cero. Para este
parámetro se tiene que admite un margen máximo de incertidumbre de
Coe…ciente de fricción viscosa c =
2.25 N
; 2.25 N
.
m
m
5
En la Figura 4.35 se muestra
la respuesta
h
i del sistema con un intervalo de variación
N
N
numérica del parámetro c de
4 m=s ; +4 m=s sobre su valor nominal. Físicamente quiere
decir que el coe…ciente de fricción viscosa c tiene una incertidumbre en su valor nominal
de
100
N
4 m=s
, equivalente al
25 %.
Capítulo 4. Resultados.
(a)
(b)
Figura 4.35: Respuesta del sistema con incertidumbre en el coe…ciente de fricción viscosa.
(a) Seguimiento de trayectoria x1 con incertidumbre en el parámetro c. (b) Seguimiento
de trayectoria x2 con incertidumbre en el parámetro c.
En las Figura 4.35a y Figura 4.35b se observa que el seguimiento de trayectoria para
la variable x1 se realiza satisfactoriamente, debido a que se logra la eliminación de las
oscilaciones y el sistema llaga a su posición …nal con velocidad y aceleración cero. La
variación numérica del coe…ciente de fricción viscosa no afecta en gran medida, debido a
que se logra la eliminación de las oscilaciones y el sistema sigue a la trayectoria deseada.
En conclusión, se tiene que los parámetros más sensibles cuando se tiene presencia
de incertidumbre son la masa 2 y la constante de rigidez 2. Para la masa 2 se tiene que
el sistema trata de hacer seguimiento de trayectoria sin embargo no se logra eliminar las
oscilaciones del sistema. Teniendo como consecuencia que al llegar el sistema a su posición
…nal no se cumple con velocidad y aceleración cero. Para la constante de rigidez 2 no se
logra hacer seguimiento de trayectoria, aunque si se sigue el per…l de la curva pero con
un desfasamiento. Los parámetros restantes no se ven afectados en gran medida por la
incertidumbre en sus parámetros.
101
102
Capítulo 5. Conclusiones
5. Capítulo 5. Conclusiones
5.1. Conclusiones
En el estudio de las técnicas de control por platitud diferencial. Es importante enfatizar el hecho de que esta propiedad resultó extremadamente útil cuando se trabajó
con seguimiento de trayectorias. En la veri…cación y comprensión de platitud diferencial,
tanto para sistemas lineales SISO y MIMO, y sistemas no lineales, quedó claro que la
metodología para sistemas lineales permitió, mediante una estrategia bien de…nida, encontrar la salida plana de los sistemas. No siendo de esta manera para los sistemas no
lineales, en donde la determinación de la salida plana se realiza empleando la intuición,
el conocimiento del sistema, y ciertas consideraciones físicas.
Es importante destacar la reducción del orden de las matrices que se emplean en la
descripción matricial polinomial. Porque en su representación equivalente en variables del
estado, el orden de las matrices es mayor, teniendo como consecuencia cálculos más difíciles
de realizar. Esto debido a que en esta representación se involucra el cálculo de la matriz
de controlabilidad y su inversa. En cambio con la representación matricial polinomial los
cálculos son relativamente más fáciles de realizar. Además, es importante señalar que no
importa que metodología se utilice para determinar la salida plana (matricial polinomial
o espacio de estado), ya que ésta es la misma. Por esta razón la metodología que emplea
la representación matricial polinomial tiene una ventaja signi…cativa con respecto a la
metodología en variables del estado.
En el contexto de sistemas lineales invariantes en el tiempo utilizando la metodología
matricial polinomial se concluye que es posible emplear la estrategia de planeación y
seguimiento de trayectoria para el diseño de controladores prealimentados basados en
platitud diferencial para el arreglo motorizado de alta precisión.
Para la construcción de la curva algebraica se optó por utilizar una curva de Bézier
en lugar de la interpolación polinomial. Debido a que después del tiempo …nal establecido para la curva, en la técnica de interpolación polinomial, la curva se indetermina.
Mientras que con Bézier la curva se mantiene constante con el ultimo valor. Además, si
se desean hacer modi…caciones en las condiciones para el movimiento del sistema, con la
curva de Bézier sólo basta hacer algunas modi…caciones a su polinomio, mientas que con
103
Capítulo 5. Conclusiones
interpolación polinomial se deben volver a realizar los cálculos para obtener así una curva
nueva.
Al aplicar la variación numérica de los parámetros del arreglo motorizado de alta
precisión se determinó que el parámetro más signi…cativo es la masa del cuerpo móvil ya
que la masa está directamente relacionada con el posicionamiento. Entonces de acuerdo
a las características y especi…caciones del sistema, se tiene que la variación máxima que
soporta la masa del cuerpo móvil es de
0.01 %, lo que equivale a una incertidumbre de
2:5gr del peso del cuerpo móvil, sin embargo, con variaciones mayores a
0.01 %, el
seguimiento se sigue realizando solo que con degradación. Por lo tanto, se concluye que
para este parámetro se tiene una robustez débil.
Los parámetros restantes se encuentran directamente relacionados con las vibraciones
de la base y no con el posicionamiento del cuerpo móvil. Por lo que al realizar una variación
numérica de los mismos se obtuvo como resultado que estos parámetros prácticamente no
afectan al posicionamiento del cuerpo móvil. Pero si afectan a las vibraciones de la base
debido a que ésta sufría de vibraciones mayores ante la variación de estos parámetros,
causando con ello que la base no quedara inmóvil al …nal del desplazamiento del cuerpo
móvil. Por lo tanto se concluye que para estos parámetros el sistema es robusto ante
incertidumbre paramétrica.
Al implementar un controlador combinado (prealimentado mas PID). Es importante
reiterar que el controlador combinado se diseñó para el sistema en condiciones nominales,
y se analizó si este controlador podía hacer frente a incertidumbre paramétrica. Debido a
la rapidez del sistema se encontró que el controlador combinado no reaccionaba a tiempo
para poder realizar el seguimiento de trayectoria. Aunque, el sistema si llega a la posición
…nal deseada, no se cumple con el objetivo de seguimiento de trayectoria.
Para el sistema de vibración mecánico se obtuvo la salida plana en tres diferentes
representaciones (matricial polinomial, espacio de estado y función de transferencia), concluyendo que la salida plana es la misma. Sin embargo la metodología propuesta por
[Levine-Nguyen, 2003] resultó ser más fácil de realizar, porque los cálculos para determinar la salida plana son más fáciles, esto es debido a que se utilizan matrices de orden
menor en comparación con la representación en espacio de estado equivalente.
Para este caso de estudio se tiene que los parámetros más sensibles cuando se tiene
104
Capítulo 5. Conclusiones
presencia de incertidumbre son la masa 2 y la constante de rigidez 2. Para la masa 2 se
tiene que el sistema trata de hacer seguimiento de trayectoria sin embargo no se logra
eliminar las oscilaciones del sistema. Teniendo como consecuencia que al llegar el sistema
a su posición …nal no se cumple con velocidad y aceleración cero. Además de que no se
realiza un seguimiento de trayectoria satisfactorio. Para la constante de rigidez 2 no se
logra hacer seguimiento de trayectoria, aunque si se sigue el per…l de la curva pero esta
presenta un desfasamiento. Por lo tanto, se concluye que para estos parámetros se tiene
una robustez débil.
Los parámetros restantes no se ven afectados en gran medida por la incertidumbre en
sus parámetros. Por lo tanto se concluye que para estos parámetros el sistema es robusto
ante incertidumbre paramétrica.
5.2. Aportaciones de la tesis
De acuerdo con los resultados obtenidos, aplicando la metodología propuesta por
[Levine-Nguyen, 2003] a dos casos de estudio, se muestra que esta metodología se puede
implementar a sistemas lineales invariantes en el tiempo en los que se tiene presencia de
incertidumbre, con ciertas restricciones.
Se demostró que no importa que metodología se utilice para determinar la salida plana
para sistemas lineales invariantes en el tiempo, debido a que la salida plana resulta ser la
misma. Además los cálculos son más fáciles de realizar utilizando la metodología matricial
polinomial propuesta por [Levine-Nguyen, 2003].
Se obtuvo la salida plana para el arreglo motorizado en la representación de espacio de
estado, con el …n de demostrar las ventajas que proporciona la representación matricial
polinomial. Para el sistema de vibración mecánico se obtuvo la salida plana en sus representaciones de espacio de estado y función de transferencia, con lo cual se reiteró que la
salida plana es la misma, no importa que metodología se emplee.
Se aplicó la metodología propuesta por [Levine-Nguyen, 2003] para sistemas lineales
invariantes en el tiempo a dos casos de estudio con incertidumbre paramétrica.
Se aplicó seguimiento de trayectoria para los dos casos de estudio aun con incertidumbre en sus parámetros.
105
Capítulo 5. Conclusiones
La aportación principal de esta tesis es el análisis de robustez heurístico de la metodología propuesta por [Levine-Nguyen, 2003] incluyendo incertidumbre en sus parámetros,
aplicado a dos casos de estudio,
Se implementó un controlador combinado para el arreglo motorizado de alta precisión,
el cual consta de una parte prealimentada basada en platitud diferencial y una parte
retroalimentada mediante un controlador tipo PID. Concluyendo que el controlador combinado no puede hacer el seguimiento de la trayectoria de referencia. Esto es debido a que
el sistema es muy rápido. Para este caso de estudio se obtuvieron mejores resultados con
el controlador prealimentado puro deducido de platitud diferencial.
5.3. Trabajos futuros
Finalmente se presentan algunas propuestas de trabajos futuros
Realizar un análisis de robustez utilizando las herramientas de control robusto y análisis funcional, y determinar si la metodología propuesta por [Levine-Nguyen, 2003],
es robusta.
Estudiar y determinar qué tipo de control realimentado se puede utilizar para hacer
frente a incertidumbre paramétrica.
Proponer una metodología para la determinación de la salida plana, en la representación matricial polinomial en la que se incluya incertidumbre paramétrica.
Estudiar si es posible la realización de una generalización de la metodología propuesta por [Levine-Nguyen, 2003], en la que se incluya incertidumbre en los parámetros,
para todos sistema lineal invariante en el tiempo, o por lo menos para una familia
de éstos.
Estudiar y determinar si esta metodología se puede aplicar a sistemas lineales variantes en el tiempo y/o a algunos sistemas no lineales.
106
A. Interpolación polinomial
A. Interpolación polinomial
Otra técnica para la generación de trayectorias es la interpolación polinomial.
La fórmula general para un polinomio de n-ésimo grado es:
p(x) = a0 + a1 x + a2 x2 +
an x n
(A.1)
El problema general de la interpolación polinomial es el siguiente:
Dados n + 1 puntos distintos a
x1 < x2 < < xn+1
b de un intervalo [a; b],
llamados nodos de la interpolación, y n+1 números reales y1 ; y2 ; ; yn+1 , llamados valores
de la interpolación, se trata de encontrar una función p, en una cierta clase pre…jada de
funciones P , tal que p(xi ) = yi para i = 1; 2; : : : ; n + 1:
El caso particular más conocido es el problema de la interpolación polinómica, en el
que P es el conjunto de los polinomios de grado menor o igual que n.
La interpolación polinomial consiste en determinar el polinomio único de n
esimo
grado que se ajuste a los n + 1 puntos. Este polinomio, entonces, proporciona una fórmula
para calcular valores intermedios. Aunque hay uno y sólo un polinomio de n
esimo
grado que se ajusta a los n + 1 puntos, existe una gran variedad de formas matemáticas
en las cuales puede expresarse este polinomio. Algunas alternativas son: los polinomios de
Newton y los polinomios de Lagrange.
Polinomio de interpolación de Newton
El polinomio de interpolación de Newton en diferencias divididas es una de las formas
más populares y útiles. El polinomio de n-ésimo grado es
pn (x) = b0 + b1 (x
x0 ) +
+ bn (x
x0 )(x
x1 )
(x
xn 1 )
(A.2)
Para un polinomio de n-ésimo grado se requieren n + 1 puntos: [x0 ; p(x0 )], [x1 ; p(x1 )],
, [xn ; p(xn )] , se usan estos datos en las siguientes ecuaciones para evaluar los coe…cientes:
107
A. Interpolación polinomial
b0 = p [x0 ]
(A.3)
b1 = p [x1 ; x0 ]
(A.4)
b2 = p [x2 ; x1 ; x0 ]
..
.
(A.5)
bn = p [xn ; xn 1 ;
(A.6)
x 1 ; x0 ]
donde las evaluaciones de la función colocadas entre corchetes son diferencias divididas
…nitas. Por ejemplo, la primera diferencia dividida …nita en forma general se representa
como:
p [xi ; xj ] =
p(xi )
xi
p(xj )
xj
La segunda diferencia dividida …nita, que representa la diferencia de las dos primeras
diferencias divididas, se expresa en forma general como
p [xi ; xj ; xk ] =
p [xi ; xj ]
xi
p [xj ; xk ]
xk
En forma similar, la n-ésima diferencia dividida …nita es
p [xn ; xn 1 ; : : : ; x1 ; x0 ] =
p [xn ; xn 1 ; : : : ; x1 ] p [xn 1 ; xn 2 ; : : : ; x0 ]
xn x0
Estas diferencias sirven para evaluar los coe…cientes en las ecuaciones (A.3) a (A.6),
los cuales se sustituirán en la ecuación (A.2) para obtener el polinomio de interpolación
pn (x) = p(x0 ) + (x
+
+ (x
x0 )p [x1
x0 )(x
x0 ] + (x
x1 )
(x
x0 )(x
x1 )p [x2 ; x1 ; x0 ]
xn 1 )p [xn ; xn 1 ;
(A.7)
; x0 ]
el cual se conoce como polinomio de interpolación de Newton en diferencias divididas.
Polinomio de interpolación de Lagrange
El polinomio de interpolación de Lagrange es simplemente una reformulación del polinomio de Newton que evita el cálculo de las diferencias divididas.
108
A. Interpolación polinomial
Dados n + 1 puntos (xi ; yi ) para (i = 1; 2; ; n + 1) de un problema de interpolación,
existe un único polinomio p de grado menor o igual que n tal que p(xi ) = yi para todo
i = 1; 2; ; n + 1. Dicho polinomio p está dado por
pn (x) =
n
X
(A.8)
Li (x)p(xi )
i=0
donde
n
Y
x
Li (x) =
x
j=0 i
para j 6= i,
xj
xj
designa el "producto de".
Interpolación Spline
Un Spline es una curva de…nida a trozos mediante polinomios. El término "spline"hace
referencia a una amplia clase de funciones que se utilizan en aplicaciones que requieren la
interpolación de datos.
En los problemas de interpolación, se utiliza a menudo la interpolación mediante
splines porque da lugar a resultados similares requiriendo solamente el uso de polinomios
de grado menor, además se evitan las oscilaciones, que en la mayoría de las aplicaciones
son indeseables.
Un spline es una función polinomial a trozos. En su forma más general un spline
polinomial Sp : [a; b] ! R consiste de los trozos polinomiales Pi : [tq ; tq+1 ] ! R, donde
a = t0 < t1 <
< tg
2
Sp (t) = P0 (t); t0
t < t1 ;
Sp (t) = P1 (t); t1
..
.
t < t2 ;
Sp (t) = Pg 2 (t); tg
2
< tg
t < tg
1
=b
1
109
A. Interpolación polinomial
donde los puntos g dados para tq ; se llaman nodos. El vector t = (t0 ; : : : ; tg 1 ) es el
vector de nodos para el spline. El spline es uniforme, si los nudos están equidistantemente
distribuidos sobre el intervalo [a; b], de los contrario, éste no es uniforme.
110
B. Documentación de los programas utilizados.
B. Documentación de los programas utilizados.
A continuación se presenta una breve descripción de los diagramas de simulación y
códigos de programación que se realizaron para los dos casos de estudio. Estas simulaciones se llevaron a cabo mediante el programa SIMULINK de MATLAB. Se muestra las
simulaciones de los sistemas dinámicos para cada caso de estudio, la construcción de las
curvas de Bézier para realizar el seguimiento de trayectoria en cada caso de estudio, y la
implementación de los controladores prealimentado y retroalimentado.
B.1. Arreglo motorizado de alta precisión
El esquema de control desarrollado para este sistema se mostró en la Figura B.1. Se
observa en los bloques en color magenta la construcción de la curva algebraica mediante
una curva de Bézier y las derivadas en el tiempo de la salida plana; en los bloques en color
azul se tiene la parametrización de la entrada u dada por (4.26), del estado parcial (x; xB )
dado por (4.27), obtenidas mediante la metodología matricial polinomial, y el modelo
matemático en representación matricial polinomial se muestra en color amarillo.
Figura B.1: Esquema de simulación arreglo motorizado de alta precisión.
A continuación se dará una descripción más detallada del contenido de los bloques:
111
B. Documentación de los programas utilizados.
Bloques color magenta. Este bloque se compone por la curva tipo Bézier y las
cuatro primeras derivadas de la salida plana. Dentro del bloque denominado Bézier se
encuentra el siguiente código de programación
function cb = fcn(kt)
%condiciones iniciales
n=9; %grado del polinomio
t0=0; %tiempo inicial de la curva
tf=0.2; %tiempo final de la curva
p0=0; %cota inferior curva
pf=0.02; %cota superior curva
modulo=mod(n,2);
%si el modulo=0 entonces n es par
%si el modulo=1 entonces n es impar
p=0:n;
%generacion de puntos pi’s
%si el modulo es igual a un número par
if modulo==0 %par
for i=2:(n/2)
p(i)=p0;
end
for i=((n/2)+2):n+1
p(i)=pf;
end
p((n/2)+1)=p0+((pf-p0)/2);
%
%
.....
.
% .....
% de lo contrario el modulo es igual a un número impar
else %impar
for i=1:((n+1)/2)
112
B. Documentación de los programas utilizados.
p(i)=p0;
end
for i=(((n+1)/2)+1):n+1
p(i)=pf;
end
%
......
%
% .....
end
cb=0;
k=0;
if kt<t0
k=k+1;
cb(k)=p0;
elseif kt<=tf
y=0;
for i=0:n cb1=factorial(n)/(factorial(i)*factorial(n-i));
cb2=((((tf-kt)/(tf-t0))^(n-i))*(((kt-t0)/(tf-t0))^i));
y=y+(cb1*cb2*p(i+1));
end
k=k+1;
cb(k)=y;
else
k=k+1;
cb(k)=pf;
end
Bloques color azul. Dentro del bloque denominado parametrización de la entrada,
programada mediante bloques de SIMULINK la ecuación (4.26) veáse Figura B.2. En este
bloque se está generando el controlador prealimentado basado en platitud diferencial.
113
B. Documentación de los programas utilizados.
Figura B.2: Programación de la parametrización de la entrada.
En la Figura B.3 se muestra el bloque llamado Parametrización de las variables del
estado, en el cual se programó la ecuación (4.27) correspondiente a las variables del estado
parametrizadas en términos de la salida plana y sus derivadas sucesivas en el tiempo.
Figura B.3: Programación de la parametrización del estado.
Bloque color amarillo. En este bloque se programó el modelo matemático del sistema véase Figura B.4. En este bloque se realizó la variación numérica de los parámetros.
Con el …n de realizar el análisis heurístico de robustez del sistema con incertidumbre
paramétrica.
114
B. Documentación de los programas utilizados.
Figura B.4: Programación del modelo matemático del sistema.
B.2. Sistema de vibración mecánico
La simulación del esquema de control desarrollado para este sistema se mostró en la
Figura 4.3.1. Se observa en el bloque en naranja la construcción de la curva algebraica
mediante una curva de Bézier y las derivadas en el tiempo de la salida plana; en los
bloques color verde, se muestra la parametrización de las variables del estado (x1 y x2 ),
en el bloque azul se tiene la parametrización de la entrada u, y en el bloque magenta se
tiene el modelo matemático del sistema.
Figura B.5: Esquema de simulación sistema de vibración mecánico.
A continuación se dará una breve descripción del contenido de cada bloque.
115
B. Documentación de los programas utilizados.
El bloque color naranja muestra la construcción de la salida plana (mediante una curva
de tipo Bézier) y sus derivadas sucesivas en el tiempo. En seguida se presenta el código
de programación empleado para la construcción de la curva de Bézier.
function f = fcn(kt)
%condiciones iniciales
n=5; %grado del polinomio
t0=8; %tiempo inicial de la curva
tf=12; %tiempo final de la curva
p0=0.01; %cota inferior curva
pf=0; %cota superior curva
modulo=mod(n,2);
%si el modulo=0 entonces n es par
%si el modulo=1 entonces n es impar
p=0:n;
%generacion de puntos pi’s
if modulo==0 %par
for i=2:(n/2)
p(i)=p0;
end
for i=((n/2)+2):n+1
p(i)=pf;
end
p((n/2)+1)=p0+((pf-p0)/2);
else %impar
for i=1:((n+1)/2)
p(i)=p0;
end
for i=(((n+1)/2)+1):n+1
p(i)=pf;
end
end
116
B. Documentación de los programas utilizados.
f=0;
k=0;
if kt<t0
k=k+1;
f(k)=p0;
elseif kt<=tf
y=0;
for i=0:n
f1=factorial(n)/(factorial(i)*factorial(n-i));
f2=((((tf-kt)/(tf-t0))^(n-i))*(((kt-t0)/(tf-t0))^i));
y=y+(f1*f2*p(i+1));
end
k=k+1;
f(k)=y;
else
k=k+1;
f(k)=pf;
end
En los bloques color verde se encuentra la parametrización de las variables del estado
x1 y x2 (correspondiente a las ecuaciones (4.46) y (4.47) ) en términos de la salida plana
y sus primeras cuatro derivadas sucesivas en el tiempo, ver Figura B.6.
Figura B.6: Programación de la parametrización de las variables del estado en términos
de la salida plana.
117
B. Documentación de los programas utilizados.
En el bloque color azul se muestra la parametrización de la entrada u (correspondiente
a la ecuación (4.45)) en términos de la salida plana y sus primeras cuatro derivadas sucesivas en el tiempo, ver Figura B.7. En este bloque se genera el controlador prealimentado
basado en platitud diferencial.
Figura B.7: Programación de la parametrización de la entrada en términos de la salida
plana.
En el bloque color magenta se presenta la programación del modelo matemático del
sistema, véase Figura B.8
Figura B.8: Programación del modelo matemático del sistema de vibración mecánico.
Para el caso de incertidumbre paramétrica se tiene que en este bloque es donde se realiza
la variación numérica de los parámetros.
118
Referencias.
Referencias
[Levine-Nguyen, 2002]
R. Desailly, J. Levine and D. V. Nguyen, (2002), U. S.
Patent No. US 6,438,461, B1.
[Daza, 2007]
G.
Daza,
Apuntes
del
curso:Vibraciones
Mecáni-
cas,Universidad Tecnica Federico Santa Maria, 2007.
[Fliess, 1990]
M. Fliess, “Some basic structural properties of generalized
linear systems”, Systems and Control Letters, Vol.15, pp.
391-396, 1990.
[Fliess, 1992]
M. Fliess, “Reversible linear and nonlinear discrete time
dynamics”, IEEE Transactions on Automatic Control, Vol.
AC-37, pp. 1144-1153, 1992.
[Fliess, 1998]
M. Fliess, “Some remarks on the Brunovsky canonical
form”, Kybernetica, Vol. 29, No. 5, pp. 417-122, 1998.
[Fliess, et al., 1995]
M. Fliess, J. Levine, Ph. Martin and P. Rouchon, “Flatness
and defect of non-linear systems: introductory theory and
examples”, International Journal of Control, vol. 61, No.
6, pp 1327-1361, 1995.
[Fliess et al., 1999]
M. Fliess, J. Levine, Ph. Martin and P. Rouchon, “A Lie
Backlund approach to equivalence and ‡atness of nonlinear
systems”, IEEE Transactions on Automatic Control, Vol.
44, pp. 922-937, 1999.
[Fliess-Marquez, 2000]
M. Fliess and R. Marquez, “Continuos-time linear predictive control and ‡atness: a module-theoretic setting with
examples”International Journal of Control, Vol. 73, No.7,
pp.606-623, 2000.
119
Referencias.
[Hagenmeyer-Delaleau, 2003] V. Hagenmeyer and E. Delaleau, “Exact feedforward linearization based on di¤erential ‡atness”, International Journal of Control, Vol. 76, No.6, pp. 537-556, 2003.
[Henrion, 2003]
D. Henrion, J-B. Lasserre, “LMIs for constrained polynomial interpolation with application in trajectory planning”, (de la red) 2003.
[Ilchman, 1985]
A. Ilchman, “Time varying linear systems and invariants
of systems equivalence”, International Journal of Control,
Vol. 42, pp. 759-790, 1985.
[Kaczorek, 2007]
Kaczorek, T. Polynomial and Rational Matrices, Applications in Dynamical systems Theory. Hardcover, 2007, XVI.
[La…ta, 1968]
F. La…ta, H. Mata, Introducción a la teoría de las vibraciones mecánicas. Labor.
[Levine, 2006]
J. Lévine, “On necessary and su¢ cient condition for differential ‡atness”, (de la red) pp.1-28, 2006.
[Levine, 2009]
J. Lévine, Analysis and control of nonlinear systems. A
‡atness-based aproach. Springer-Verlag, Berlín Heidelberg.
[Levine-Nguyen, 2003]
J. Levine, and D. V. Nguyen, “Flat output characterization
for linear systems using polynomial matrices”. Systems &
control Letters, Vol. 48, pp. 69-75, 2003.
[López, 2013]
M. J. López Pérez, Linealización exacta prealimentada:
enfoque de aplanamiento (‡atness) diferencial. Tesis de
Maestría, Cenidet, 2013.
[Morillo, 2001]
A. Morillo, Generación de trayectorias en sistemas diferencialmente planos. Revista técnica de la Facultad de Ingeniería Universidad de Zulia, 2001.
120
Referencias.
[Murray et al., 1995]
R. Murray, M. Rathinam and W. Sluis, “Di¤erential ‡atness of mechanical control systems: A catalog of prototype systems”. Proceedings of the 1995 ASME International Congress and Exposition.
[Mahadevan, 2001]
R. Mahadevan, S. K. Agrawal, and F. J. D. III, “Diferential ‡atness based nonlinear predictive control of fed-batch
bioreactors”, Control Engineering Practice, Vol. 9, pp. 889899, 2001.
[Sederberg, 2007]
Sederberg, Tomas W. Computer AIDED geometric design.
Departament of computer science, 2007. Brigham young
university.
[Silva, 2008]
F. M. Silva Carranza, Detección y estimación de fallas en
el motor de inducción mediante reconstructores de estado: un enfoque algebraico diferencial. Tesis de maestría,
Cenidet, 2008.
[Sira-Ramírez, 2004]
H. J. Sira-Ramírez and S. K. Agrawal, Di¤erentially ‡at
systems. New York, Marcel Dekker, 2004.
[Sira-Ramírez, 2000]
H. J. Sira-Ramírez, Orestes Llanes-Santiago, “Control activo de vibraciones mecánicas mediante platitud diferencial”, Noveno congreso latinoamericano de automática.
Colombia, noviembre 2000.
[Suriano, 2012]
J. A. Suriano Sánchez, Control de rodamientos magnéticos basado en aplanamiento (‡atness) diferencial. Tesis de
Maestría, Cenidet, 2012.
[Suryawan]
F. Suryawan, J. De Doná and M. Seron, “On splines
and polinomial tools for constrained motion planning”,
(Preprint, de la red).
121
Referencias.
[Toledo, 2010]
O. Toledo Ojeda, Desarrollo de un sistema de control tolerante a fallas para una turbina eólica basado en conceptos de platitud (‡atness) diferencial. Tesis de Maestría,
Cenidet, 2010.
[Van Nieuwstadt, et al., 1994] M. Van Nieuwstadt, M. Rathinam and R. M. Murray, “Differential ‡atness and absolute equivalence”, in Decision
and Control, 1994. Proccedings of the 33rd IEEE Conference on, 1994, pp.326-332 vol. 1.
[Vidyasagar, 1987]
M. Vidyasagar, Control Systems Synthesis, Cambridge,
MIT Press, Massachussetts, 1987.
122
Descargar