Beamer tutorial

Anuncio
Minicurso de modelado y control de un vehı́culo
inestable.
Nestor Roqueiro
Departamento de Automación y Sistemas
Universidade Federal de Santa Catarina
Florianópolis - SC
Brasil
CX Postal 476
CEP: 88040-900
Fone: ++55 48 3721 7607
E-mail: [email protected]
Colaboración en figuras, textos y proyecto:
Prof. Rodrigo de Souza Vieira
Ms.C. Marcelo G. de Faria
2012
Sumario
Introdución
2 Modelado de un vehı́culo inherentemente inestable.
Cinematica
Dinámica
Modelado de un Vehı́culo de Tres Ruedas Inclinable
Modelo simplificado de una bicicleta
Semejanzas entre bicicleta y triciclo
3 El Problema de Control.
Fundamendación Teórica
1
Control no-linear por realimentación linearizante entrada-salida
Seguimento de trayectória
Control no-linear via Energy Shaping
Proyecto de controladores
Controlador de velocidad
Generación de referencia
PID con compensación estática de la no-linealidad
Control por realimentación linearizante entrada-salida
Control por Energy Shaping
Introdución
Inicialmente serán abordados dos temas que se complementan
en el análisis de los movimientos de un vehı́culo, la
”Cinemática” y la ”Dinámica”.
Basicamente estos son conceptos que se pueden estudiar
separadamente, sin embargo su aplicación en conjunto es
extremamente productiva, tanto del punto de vista de análisis
del comportamiento del vehı́culo, como del punto de vista de
control.
Introdución
La cinemática permite el estudio del movimiento, velocidades
y aceleraciones, y la dinámica permite evaluar ademas de
estas, también las fuerzas contempladas.
Ası́ se puede, de forma bien simple, delimitar la cinemática
para problemas en los cuales la trayectoria es el principal
punto en cuestión siendo que la dinámica se destina al estudio
de los problemas donde las fuerzas y momentos relacionados
son el objeto de estudio.
Introdución
Hay que considerar que cuando se habla de aspectos de
movimiento del vehı́culo se debe tener conciencia de como
este movimiento se realiza. En este caso, que actuadores se
utilizan para realizar el movimiento.
Los vehı́culos presentan diferentes posibilidades de
movimiento, lo que los divide en dos grandes grupos;
Los que se mueven por elementos de rodamiento,
Los que se mueven por elementos alternativos.
Introdución
En el primer caso están los vehı́culos que utilizan como elementos
de locomoción:
ruedas
esteras
esferas.
En el segundo caso, están los vehı́culos que se mueven por piernas
y pistones.
Introdución
Es importante observar que el modelo empleado como
actuador de movimiento del vehı́culo tendrá impacto directo
en el estudio de su cinemática y de su dinámica.
Otros puntos también importantes a ser considerados son a
capacidade de locomoción deseada para el vehı́culo y la
facilidad de fabricación.
En el caso de los vehı́culos con piernas, su fabricación y el
modelo cinemático/dinámico son mas complejos que los de los
vehı́culos con ruedas, sin embargo su capacidade de movilidad
en terrenos accidentados supera cualquier otro tipo de
actuador.
Conceptos básicos de Cinematica
Conceptos básicos de Cinematica
Conceptos básicos de Cinematica
Antes de un análisis mas profundo sobre los aspectos cinemáticos,
es interesante introducir algunos conceptos básicos, como por
ejemplo el concepto de grados de libertad de un vehı́culo.
Son considerados grados de libertad la diferencia entre el
número de variables que definen el problema (n), y el número
de equaciones que definen las restricciones (m).
Vale resaltar también que el número de grados de libertad es fijo
para cada tipo de problema, siendo función única y exclusivamente
del problema en si.
Conceptos básicos de Cinematica
Imaginando por ejemplo una partı́cula en el plano XY, podemos
decir que se puede definir su posición por la ecuación de restricción:
x2 + y2 = R2
(1)
Para R la distancia de la partı́cula hasta el origem del sistema de
coordenadas siendo x e y las coordenadas instantáneas en el plano.
De esta forma, existe una ecuación (m = 1) y dos variables
(n = 2), lo que define un grado de libertad (n − m).
Conceptos básicos de Cinematica
Si un sistema tiene un conjunto de n variables y un conjunto de m
ecuaciones de restricción en la forma:
ϕj = (q1 , q2 , q3 , ..., qn , t) = 0
(2)
Para: j = 1, 2..., m.
estas restricciones se denominan Restricciones Holonómicas, y se
puede resolver el problema considerando la existencia de (n − m)
grados de libertad.
Conceptos básicos de Cinematica
Por otro lado, existen problemas en que ecuaciones de restricción
se definen en función de las derivadas de las coordenadas y del
tiempo, dadas de forma general como:
n
X
aij dqi + aij dt = 0
(3)
i =1
Para j = 1, 2..., m, y aij función de las coordenadas qi y del tiempo.
En este caso, se dice que el conjunto de ecuaciones forma un
conjunto de Restricciones No Holonómicas.
De forma general, sistemas holonómicos son denominados
integrables, mientras que los no holonómicos no lo son.
Cinematica de los cuerpos rı́gidos
Cinematica de los cuerpos rı́gidos
Cinematica de los cuerpos rı́gidos
El estudio de la cinemática clásica se divide en dos grandes
grupos, el de la cinemática de la partı́cula y el de la cinemática
de los cuerpos rı́gidos, ambos focalizados en el análisis de las
posiciones, velocidades y aceleraciones en relación al tiempo.
Mientras el primero se refiere al estudio de la trayectoria de
puntos en el espacio, el segundo se restringe a cuerpos rı́gidos,
sin considerar los efectos de masa.
Cinematica de los cuerpos rı́gidos
En el movimiento de un cuerpo rı́gido, existen dos tipos distintos
de desplazamiento:
translación
rotación.
En la translación, ocurre el desplazamiento del cuerpo rı́gido de tal
forma que, dados dos puntos cualquiera, uniéndolos por un vector,
este mantiene la misma dirección, sentido y módulo, en relación a
un dado sistema de coordenadas,
Cinematica de los cuerpos rı́gidos
Matematicamente, dado un punto cualquiera del cuerpo
denominado de punto A, unido al punto B, por medio del vector
rAB , se puede dar la posición de este último punto como:
rB = rA + rAB
(4)
Derivando la ecuación (4) en relación al tiempo se obtiene:
drB
drA drAB
=
+
dt
dt
dt
(5)
Cinematica de los cuerpos rı́gidos
Se puede observar que el vector rAB se mantiene constante la lo
largo del tiempo, pues en la cinemática se considera el concepto de
cuerpo rı́gido, asi, la componente drAB /dt es nula, de forma que:
drA
drB
=
dt
dt
vA = vB
Dado que vA es la velocidad de translación del punto A, vB la
velocidad de translación del punto B, se concluye que en un
movimiento de translación todos los puntos de um cuerpo
mantienen la misma velocidad y consequentemente la misma
aceleración.
(6)
Cinematica de los cuerpos rı́gidos
El movimiento de rotación por su vez, hace posible que la posición
angular del cuerpo se altere, de tal forma que dados dos puntos
unidos por un vector este modifica su dirección en relación a un
dado sistema de coordenadas, desde que no sea paralelo ou
coincidente con el eje de rotación.
Cinematica de los cuerpos rı́gidos
Siguiendo el mismo raciocinio dado para la translación de cuerpo
rı́gido, admitiendo dos puntos cualquiera A y B, unidos por un
vector rAB . Sabiendo también que el punto A está a una distancia
dA del eje de rotación tal que el vector rA pueda ser dado en
coordenadas polares como:
θA
rA =
(7)
dA
Para θA el ángulo a partir del origem del sistema de coordenadas
polares. Aplicando ahora una rotación δ al vector ra , su nueva
posición pasa a ser:
θA + δ
rA =
(8)
dA
Cinematica de los cuerpos rı́gidos
Derivando la nueva posición en relación al tiempo, tenemos:


dθA dδ 



+
drA
dt
dt
(9)
=
ddA


dt


dt
Como el ángulo θA no varia la lo largo del tiempo pues se trata de
la posición inicial del punto A, y tampoco el módulo de dA , la
unica variación será del ángulo δ, que pasa la ser llamada de
velocidad angular (dδ/dt) del punto A.
Cinematica de los cuerpos rı́gidos
Dado que el punto B dista del eje de rotación dB y adoptando el
mismo raciocinio, de forma que la variación de la posición para
este punto se da por:


dθ
dδ
B




+
drB
dt
dt
=
(10)
ddB


dt


dt
Se llega la la conclusión de que para un movimiento de
translación la velocidad linear es constante, mientras que para
un movimiento de rotación la velocidad angular es constante
para todos los puntos.
Cinematica de los cuerpos rı́gidos
Observando que la velocidad angular es dada como ω = Vr , donde
r es el radio de giro, se puede admitir que para los puntos dados:
V A = ω · dA
V B = ω · dB
(11)
De esta forma, la velocidad linear de los puntos A y B seran iguais
apenas cuando los puntos esten equidistantes del eje de giro, o sea
si el vector rAB es paralelo u ortogonal al eje de rotación. Para
cualquier otro caso, las velocidades serán diferentes.
Cinematica de los cuerpos rı́gidos
Se puede también hacer la misma representación por coordenadas
cartesianas, de forma que sean relacionadas a las polares por las
ecuaciones:
x = cos θ · d
y = sin θ · d
(12)
Utilizando matrices de transformación
Utilizando matrices de transformación
Utilizando matrices de transformación
Una forma bastante facil de manipular los valores en una análisis
cinemática es hacerlo por medio de la álgebra linear.
Para rotacionar un cuerpo en relación a un eje cualquiera, es
suficiente determinar la matriz de rotación y aplicarla la los
vectores de posicionamento de los puntos, conforme mostrado
anteriormente.
De la misma forma, en el caso de translación, basta determinar la
matriz necesaria para que se ejecute el movimiento .
A este tipo de matriz, se le da el nombre de Matriz de
Transformación.
Utilizando matrices de transformación
La aplicación de tales matrices será demostrada en el plano XY,
comenzando por la de translación, conforme mostrado en la figura.
En este caso, el punto A pasa de una posición rA para uma posición
rA + dA . Analizando los componentes de los vectores, se verifica
que en coordenadas homogéneas son dados por: en el plano como:


 rAX 
r
rA =
 AY 
1


 rAX + dAX 
r + dAY
; rA + dA =
 AY

1
(13)
Utilizando matrices de transformación
De esta forma, se concluye que la matriz que lleva el punto A de la
posición 1 para la posición 2, de la figura anterior, es dada por:
1 0 dAX (14)
Mtrans = 0 1 dAY 0 0
1 Ası́, el punto A en la posición 2 será dado como:
rA2 = Mtrans · rA1
1 0 dAX
rA2 = 0 1 dAY
0 0
1
(15)


 rAX 
·
 rAY 
1
Utilizando matrices de transformación
Ya para el caso de una rotación en torno de un eje que pasa por el
origem, conforme mostrado en la figura, la matriz de rotación será
dada por:
cos(δ) −sen(δ) 0 Mrot = sen(δ) cos(δ) 0 (16)
0
0
1 Utilizando matrices de transformación
Al ocurrir una secuencia de movimientos que puedan ser separados
en translaciones y rotaciones, se puede llegar rapidamente a un
valor final a partir de la aplicación de las matrices de
transformación, sin olvidar que el orden de las operaciones altera el
resultado final. Si por ejemplo se aplica una rotación rot1 , una
translación trans1 y una rotación rot2 , la posición final será dada
por:
r2 = Mrot2 · Mtrans1 · Mrot1 · r1
Cinemática aplicada la vehı́culos de tres
ruedas
Cinemática aplicada la vehı́culos de tres
ruedas
Cinemática aplicada la vehı́culos de tres
ruedas
Dada la sucinta presentación de la teorı́a, se puede ahora aplicar a
un ejemplo práctico de determinación de posición de un vehı́culo
con tres ruedas, conforme mostrado en la figura.
Cinemática aplicada la vehı́culos de tres
ruedas
En este caso, si el vehı́culo se mueve del punto 1 hasta el punto 2,
su desplazamiento pasa la ser descripto como la variación da
posición del punto A de rA1 la rA2 , que de forma matricial puede
ser:
rA2 = M · rA1
(17)
Cinemática aplicada la vehı́culos de tres
ruedas
Analizando el vector rAB , mostrado en la figura siguiente, se nota
que hubo una rotación y una translación de forma que se paso de
un estado 1 para un estado 2.
Cinemática aplicada la vehı́culos de tres
ruedas
Para describir este cambio de posición en primer lugar se debe
observar que las matrices de transformación definidas en la sección
anterior son deducidas a partir del origem, asi, antes de mas nada
el vector rAB necessita ser transladado del estado 1 para el origem,
rotacionado y depues transladado para la posición en el estado 2.
Cinemática aplicada la vehı́culos de tres
ruedas
Ası́, dado que:
rA1
Se obtiene:


 rAx1 
r
=
 Ay 1 
1
y
rA2


 rAx2 
r
=
 Ay 2 
1
rAB2 = Mtrans2 · Mrot1 · Mtrans1 · rAB1
(18)
(19)
Cinemática aplicada la vehı́culos de tres
ruedas
Para Mtrans1 la matriz translación que mueve el punto A para el
origem, Mrot1 la matriz rotación que rotaciona el vector rAB1 en la
dirección de rAB2 y Mtrans2 la matriz translación que coloca el
punto A del vector rAB2 en la posición rA2 , y substituyendo los
valores da:
rAB2
1 0 rAx2
= 0 1 rAy 2
0 0
1
cos(δ) −sen(δ) 0 1 0 −rAx1
· sen(δ) cos(δ) 0 · 0 1 −rAy 1
0
0
1 0 0
1
·rAB1
(20)
Cinemática aplicada la vehı́culos de tres
ruedas
Analizando la ecuación (20) se observa que el orden de las
operaciones se de la de la derecha para la izquierda, de forma que
en primer lugar se coloca el vector rAB1 en el origem del sistema
(por eso el signo negativo en rAx1 e y rAy 1 ).
Cinemática aplicada la vehı́culos de tres
ruedas
Sin embargo, observando el problema anterior, no se describe la
trayectoria recorrida, se tiene apenas la definición de la posición
inicial y final del objeto, pues no fueron adicionadas las
restricciones debidas al movimiento de las ruedas, tópico que será
abordado en la sección siguiente.
Estimación de trayectoria
Estimación de trayectoria
Estimación de trayectoria
Para estimar la trayectoria del vehı́culo es necesario determinar
como será su modelo de giro y como forma de mostrar el concepto
matemático, se presentan dos formas de hacer girar un vehı́culo.
En primer lugar el concepto de un vehı́culo de esteras, donde
la curva se de la por la diferencia entre la velocidad de cada
una de sus esteras.
Después será estudiado el modelo matemático cinemático
para un vehı́culo con una rueda del tipo caster
Estimación de trayectoria
Imaginando se tratar de un vehı́culo conforme mostrado
esquematicamente en la figura siguiente, admitiendo que las
esteras se mueven en dirección contraria para efectuar el giro, el
centro de giro será dado por el punto medio entre el punto central
de contacto de las dos esteras, conforme definido por el punto CG
en la figura.
Estimación de trayectoria
Cabe observar que el centro de giro es función de la geometrı́a de
dirección del vehı́culo, siendo por lo tanto diferente para cada
topologı́a de locomoción existente.
Estimación de trayectoria
Sin embargo el giro en el propio centro de giro es muy especifico,
siendo mas adecuada la formulación para una trayectoria
cualquiera. De esta forma, admitiendo que la velocidad
longitudinal (v ) es constante, asi como el radio de la curva (rC ),
para un cierto centro de curva (CC) cualquiera, conforme mostrado
en la figura, la velocidad de cada estera pasa a ser definida la
partir de la determinación de la distancia al centro de curva.
Estimación de trayectoria
Admitindo el centro de giro en el centro del vehı́culo, una vez que
la simetria en relación al eje longitudinal es, en la mayoria de los
casos, necesaria, podemos describir el movimiento de cada estera
conforme las equaciones siguientes, admitiendo el indice I para la
estera interna de la curva y II para la estera externa.
b
b
vI = w · rc −
; vII = w · rc +
(21)
2
2
Para b la distancia entre las dos esteras.
Estimación de trayectoria
Ahora, recordando que la velocidad longitudinal del vehı́culo v se
mantiene constante y el radio de curva es conocido pues se desea
salir de un punto actual para otro conhecido, se obtiene:
w=
v
rc
(22)
Y substituyendo la ecuación (22) en las equaciones (21) se obtiene:
b
b
vI = v · 1 −
; vII = v · 1 +
(23)
2rc
2rc
De esta forma se puede instantaneamente determinar la velocidad
de cada estera, manteniendose el módulo de la velocidad linear
constante.
Estimación de trayectoria
De forma general, se tiene una trayectoria donde el radio de
curvatura es función del tiempo, y depende de la trayectoria
pretendida, asi, se puede escribir genericamente la ecuación (23)
como:
b
vI = v · 1 −
2r (t)
(24)
b
vII = v · 1 +
2r (t)
Estimación de trayectoria
Esta misma metodologia se aplica a vehı́culos que tienen una rueda
de tipo caster. Una rueda es llamada de caster cuando existe una
distancia entre el su punto de fijación al chasis del vehı́culo y su eje
de rotación, como puede ser visto en la figura. En función del
movimiento aplicado al vehı́culo se genera un momento en relación
la esta excentricidade que permite con que el ella gire, de forma
que siempre se mantenga perpendicular al radio de la curva.
Estimación de trayectoria
En este caso, la rueda del tipo caster estará siempre con velocidad
v mientras la rueda interna la la curva tendrá velocidad vI y la
externa vII dadas por las equaciones (23), como mostrado en la
figura.
De esta forma, una buena forma de medir la velocidad longitudinal
del vehı́culo es colocar un encoder en la propia rueda caster,
considerando efectos de deslizamiento.
Dinámica
Dinámica de sistemas mecánicos con masas
mobiles
Dinámica
A continuación se presentan sin demostración dos formulaciones
diferentes utilizadas para el modelado de sistemas mecánicos, las
Leyes de Newton y, el principio de d’Alembert y las ecuaciones de
Lagrange.
Dinámica
Leis de Newton - Movimento de translación
En primer lugar será considerado el movimiento de una partı́cula.
Cuando la geometrı́a de un cuerpo rı́gido no influencia el
movimiento de este cuerpo la masa puede ser considerada
concentrada en un punto (punto de masa).
Dinámica
Las Leyes de Newton fueron formuladas de la siguiente forma:
Primeira ley de Newton: para una masa puntual m
moviendose la una velocidad v la cantidad de movimieno I es
I = mv , y será constante si el sumatório de fuerzas aplicadas
es nulo. Asi, si a una masa m se le aplica una fuerza esta
continua en movimiento rectilı́neo uniforme.
Segunda ley de Newton: Si una fuerza F actua sobre una
masa m entonces:
dI
dmv
=
=F
dt
dt
Si la masa es constante la expresión queda:
m
dv
= ma = F
dt
Dinámica
Tercera ley de Newton: Si un cuerpo ejerce una fuerza sobre
otro, este ultimo ejerce una fuerza de igual magnitud y sentido
contrario. Conocido como principio de ación y reacción.
Si la masa puntual se puede mover sin restricciones esta tiene tres
grados de libertad que corresponden a las tres coordenadas
espaciales.
Pero si se fuerza la masa puntual a moverse en una superficie o
lı́nea entonces poseerá dos el un grado de libertad,
respectivamente.
Dinámica
Cuando se fuerza un cuerpo a moverse en una superficie o una
lı́nea aparecen fuerzas de restricción que son normales a la
trayectoria. Habrá fuerzas aplicadas en la dirección del movimiento
F(y )
independientes de las restricciones y fuerzas normales a la
trayectoria
F(z)
Reformulando la segunda ley esta queda:
ma = F(y ) + F(z)
Dinámica
Movimento de rotación
Em un sistema de coordenadas cartesianas x, y , z se pueden definir
los versores,
ex , ey , ez
Una fuerza
F = Fx ex + Fy ey + Fz ez
aplicada en un vector de coordenadas
r = rx ex + ry ey + rz ez
define un torque
T=r×F
Dinámica
La magnitud del torque es:
|T| = |r| |F| sen (ϕ)
Dinámica
Los versores están relacionados por:
ex × ex
ey × ex
ez × ex
=
0
= −ez
= ey
ex × ey
ey × ey
ez × ey
= ez
=
0
= −ex
ex × ez
ey × ez
ez × ez
= −ey
= ex
=
0
Por lo tanto se puede representar el torque por:
T = r × F = (ry Fz − rz Fy ) ex + (rz Fx − rx Fz ) ey + (rx Fy − ry Fx ) ez
T = Tx ex + Ty ey + Tz ez
O como un determinante
ex
T = r × F = rx
Fx
ey
ry
Fy
ez
rz
Fz
Dinámica
Si una masa puntual se mueve a lo largo de una trayectoria con
velocidad v y la coordenada en relación al origen se da por el
vector r entonces se puede definir momento angular como:
L = r × I = r×mv
Dinámica
A partir de la segunda ley de Newton el torque es:
r×m
dv
=r×F=T
dt
Derivando el momento angular en relación al tiempo se obtiene:
dL d(r×mv)
dt =
dt
v=
dr
dt
⇒
=
dr
dt ×mv
dr
dt ×mv
+ r×m dv
dt
=0⇒
dL
dt =
r×m dv
dt = T
O sea, la derivada del momento angular en relación la un sistema
de coordenadas fijo en el espacio es igual al torque ejercido sobre la
masa puntual.
Dinámica
Princı́pios de mecánica
Cuando el sistema mecánico esta compuesto por varios cuerpos
rı́gidos se necesita aplicar la ley de Newton a cada cuerpo
considerando las fuerzas que mueven el cuerpo en la trayectoria y
las normales a la trayectoria (restricciones).
Posteriormente, las restricciones deben ser eliminadas operando
con las ecuaciones de los otros cuerpos. Otro abordaje, mas
adecuado para casos complicados se presenta la continuación.
Dinámica
Principio de d’Alembert
La segunda ley de Newton para una masa constante puede ser
escrita:
F − ma = 0
Definiendo una fuerza ficticia (no Newtoniana) asociada la la
aceleración,
FT = −ma
se obtiene que,
FT + F = 0
Asi, la suma de las fuerzas aplicadas y de la fuerza de inercia es
cero (equilibrio dinámico).
Dinámica
Las fuerzas que restringen el movimiento siempre deben ser
definidas, asi, considerando las fuerzas de restricción del
movimiento se obtiene que:
ma = F(y ) + F(z)
Las fuerzas de restricción son, por definición, perpendiculares a la
trayectoria. Para un desplazamiento diferencial el trabajo realizado
por estas fuerzas será cero.
T
δWn = F(z) .δr = 0
Dinámica
Como
ma = F(y ) + F(z)
y
entonces
Definiendo
T
δWn = F(z) δr = 0
T
δWn = F(y ) − ma δr = 0
δW = F(y )
T
δr
δWT = (FT )T δr = −maT δr
Se obtiene que:
δW + δWT = 0
Dinámica
O sea, el trabajo virtual es nulo cuando se suma el trabajo
realizado por las fuerzas aplicadas en la dirección de la trayectoria
y el trabajo realizado por la fuerza de d’Alembert.
Se debe resaltar que en esta formulación no aparecen
explı́citamente las fuerzas de restricción.
Dinámica
En un sistema formado por varias masas puntuales con
restricciones descripto por:
(y )
mi r̈i = Fi
(z)
+ Fi ;
i = 1, . . . , n
P (z) T
δri = 0
Fi
i T
P (y )
δri = 0
Fi − mi r̈i
i X (y ) T
X
δri +
Fi
−mi r̈iT δri = 0
|i
{z
δW
}
|i
{z
δWT
}
se puede aplicar el principio de d’Alembert, mostrando que es
valido para sistemas de masas puntuales con restricciones, o sea,
cuerpos rı́gidos.
Dinámica
Equaciones de Lagrange
Para un sistema de masas puntuales el numero de ecuaciones de
Newton es igual al numero masas puntuales.
Se puede simplificar el trabajo de modelado utilizando coordenadas
generalizadas y el principio del trabajo virtual.
Las restricciones reducen el numero de grados de libertad de un
sistema y a continuación se considera que la interconexión entre
las masas puntuales es rı́gida.
Dinámica
La posición de cada una de las n masas puntuales se define por n
vectores de coordenadas ri , i = 1, ..., n.
Si existen r restricciones, entonces el sistema de n masas puntuales
esta definido por f = n − r coordenadas generalizadas
qj , j = 1, ..., f .
Por lo tanto, una masa puntual tiene una posición dada por:
ri = ri (q1 , . . . , qj , . . . , qf )
Dinámica
Para reformular el principio de d’Alembert se calcula
δri =
X ∂ri
∂ri
∂ri
δqf =
δq1 + · · · +
δqj
∂q1
∂qf
∂qj
j
El trabajo virtual para n masas puntuales será:
T
P (y )
Fi − mi r̈i
δri = 0
i
!
T P
P (y )
∂ri
Fi − mi r̈i
=0
∂qj δqj
j
i
i




X ∂ri
X
X (y ) T X ∂ri

mi r̈iT 
δqj  −
δqj  = 0
Fi
∂qj
∂qj
j
i
j
i
{z
} |
{z
}
|
δW
δWT
Dinámica
Alterando el orden de los sumatorios se obtiene:
XX
X X (y ) T ∂ri
∂ri
δqj −
δqj = 0
mi r̈iT
Fi
∂qj
∂qj
j
i
j
i
|
{z
} |
{z
}
δW
δWT
Y dado que:
∂ri
T ∂ri
T ∂ ṙi
δq
mi ṙiT ∂q
j = mi r̈i ∂qj δqj + mi ṙi ∂qj δqj
j
∂ ṙi
∂ri
∂ri
d
δqj = dt
δqj − mi ṙiT ∂q
δqj
mi ṙiT ∂q
mi r̈iT ∂q
j
j
j
d
dt
Aplicando la regra de la cadena
X ∂ri δqj
dri
=
dt
∂qj dt
j
Y derivando en relación q̇j se obtiene;
∂ṙi
∂ri
=
∂ q̇j
∂qj
Dinámica
Y asi,
∂ri
mi r̈iT ∂q
δqj =
j
∂ri
δqj =
mi r̈iT ∂q
j
d
dt
d
dt
∂ri
T ∂ ṙi
δq
mi ṙiT ∂q
j − mi ṙi ∂qj δqj
j
1
1
∂
∂
T
T ṙ
m
ṙ
− ∂q
i
i
i
∂ q̇j 2 mi ṙi ṙi
2
j
Dinámica
La energia cinética de n masas puntuales es:
P1
T
Ek =
2 mi ṙi ṙi
i
P
∂ri
d ∂Ek
= dt
mi r̈iT ∂q
∂ q̇j −
j
i
∂Ek
∂qj
Dinámica
Definiendo fuerza generalizada en la dirección qj
X (y ) T ∂ri
X
d ∂Ek
∂Ek
Fi
Qj =
⇒
Qj −
+
δqj = 0
∂qj
dt ∂ q̇j
∂qj
i
j
Como las coordenadas generalizadas son independientes cada
sumando debe ser nulo, asi se obtiene:
∂Ek
d ∂Ek
−
= Qj ;
dt ∂ q̇j
∂qj
Que son las ecuaciones de Lagrange
j = 1, . . . , f
Dinámica
Considerando el trabajo virtual de las fuerzas aplicadas
(y )
Fi
se obtiene
δW =
X
T (y )
Fi
δri
i
y
T (y ) P ∂ri
∂qj δqj
j
i
P X T (y ) ∂ri
Fi
δqj
∂qj
j
i
δW =
δW =
P
Fi
|
δW =
{z
Qj
P
j
Qj δqj
}
Dinámica
Se puede calcular el trabajo virtual de las fuerzas aplicadas a partir
de las fuerzas generalizadas y de los desplazamientos virtuales.
Si existe una energı́a potencial asociada a las fuerzas aplicadas
entonces
δW = −δEp
∂E
δEp (qi ) = ∂q1p δq1 + · · · +
∂E
Qj = − ∂qpj
d ∂Ek
dt ∂ q̇j
−
∂Ek
∂qj
+
∂Ep
∂qj
=0
∂Ep
∂qf δqf
=
P ∂Ep
j
∂qj
δqj
Dinámica
Se define la función de Lagrange por
L = Ek − Ep
Como la energia potencial no depende de q̇j
∂Ep
=0
∂ q̇j
E entonces la ecuación de Lagrange para sistemas conservativos es:
d ∂L
∂L
−
= 0;
dt ∂ q̇j
∂qj
j = 1, . . . , f
Para obtener las ecuaciones de movimiento es necesario explicitar
la energia cinética y potencial en función de las coordenadas
generalizadas y calcular las derivadas.
Dinámica
Forma matricial del sistema dinámico
Si la posición de las masas no depende explı́citamente del tiempo,
si las fuerzas son conservativas y si el sistema de coordenadas
generalizadas no esta restringido la obtención de las ecuaciones
dinámicas a partir de la formulación Lagrangeana es mas simple.
A este tipo de sistemas de les denomina sistemas naturales (mas
detalles en ”Methods of Analytical Dynamics”, Meirovitch, pg 77).
Sin embargo podemos considerar fuerzas disipativas proporcionales
a la velocidad (Función disipativa de Rayleygh, pg. 88) y aun asi
obtener un modelado mas simple.
Dinámica
En este caso se pueden escribir las ecuaciones dinámicas como,
Mq̈(t) + Cq̇(t) + Kq(t) = F(t)
(25)
Siendo M la matriz de inercia, C la matriz de amortiguamiento, K
la matriz de rigidez, q el vector de grados de libertad y F el vector
de excitación.
Dinámica
Se pueden calcular los elementos de M como:
mij =
∂2T
∂ q̇i ∂ q̇j
(26)
De forma análoga se puede definir la matriz de amortiguamiento
por:
∂2ℑ
(27)
cij =
∂ q̇i ∂ q̇j
Y lo mismo sucede con la matriz de rigidez dada por:
kij =
∂2U
∂qi ∂qj
(28)
Dinámica
Se pueden incorporar otras caracterı́sticas al modelo a partir de las
particularidades del problema a tratar y se pueden obtener modelos
con diferentes grados de complejidad, cabiendo al modelador
escoger el mas adecuado.
Vehı́culo de Tres Ruedas Inclinable
Modelado de un Vehı́culo de Tres Ruedas
Inclinable
Vehı́culo de Tres Ruedas Inclinable
En este proyecto se utilizo un abordaje multicuerpo y el punto de
partida para análisis pasa a ser la definición de las masas del
modelo,
RW– Rueda
trasera
MC
MC– Chassis
principal
RFW– Rueda
delantera
derecha
RW
LFW
RFW
LFW – Rueda
delantera
izquierda
Vehı́culo de Tres Ruedas Inclinable
Para estos cuerpos, utilizaremos como sistema de coordenadas
inercial uno con origen en el punto de contacto de la rueda trasera
con el suelo. La dirección positiva de cada eje será
respectivamente, para adelante, para la izquierda y para arriba,
para los ejes X, Y y Z.
Z
Y
X
Vehı́culo de Tres Ruedas Inclinable
A partir de estas definiciones determinaremos las velocidades de
cada una de las masas del modelo, que cuenta con 9 grados de
libertad, dado que consideramos que todos los cuerpos tienen
movimientos verticales independientes permitiendo ası́ simular
suspensiones.
Movimiento longitudinal (x)
Movimiento transversal (y )
Rotación eje Z (ψ)
Movimiento vertical (z1 )
Rotación eje X (ϕ)
Movimiento vertical (z2 )
Rotación eje Y (cuerpo
principal) (θ)
Movimiento vertical (z3 )
Movimiento vertical (z4 )
Obs: La rotación del cuerpo central en torno de su eje transversal
provoca un momento interfiriendo en el comportamiento de las
suspensiones delantera y trasera.
Vehı́culo de Tres Ruedas Inclinable
Ahora trabajaremos en la definición de las velocidades para cada
uno de los cuerpos descriptos en la sección anterior y por lo tanto
comenzaremos determinando las velocidades longitudinales en X ,
Y y Z , y angulares en relación la los referidos ejes.
Vehı́culo de Tres Ruedas Inclinable
Para la rueda trasera podemos iniciar a partir de la definición de
las velocidades de la figura.
w1
wz1
Z
v1
h1
Y
u1
X
wy 1
wx1
En este caso observamos dos caracterı́sticas importantes. Primero,
la rotación en el eje Z no produce ningún efecto en las velocidades
de traslación pues el centro de masas está exactamente en el
referido eje, sobre el origen del sistema.
Vehı́culo de Tres Ruedas Inclinable
Otra constatación es que si aplicamos una variación angular de ϕ
en relación al eje X , surgen componentes de traslación,
Z
ϕ
v1ϕ
h1
w1ϕ
De esta forma existe una velocidad en el plano Y − Z debida al
movimiento rotativo en relación al eje X , que sale del papel, y que
puede ser descompuesta en dos componentes.
Vehı́culo de Tres Ruedas Inclinable
Una componente en la dirección negativa de Y dada por:
v1ϕ = h1 ϕ̇ cos(ϕ)
(29)
Y otra en la dirección negativa
de Z dada por:
w1ϕ = h1 ϕ̇sen(ϕ)
(30)
En relación a la rotación en torno
del eje Y tendremos,
u1α = h1 α̇ cos(α)
(31)
Y otra en la dirección negativa
de Z dada por:
w1α = h1 α̇sen(α)
(32)
ϕ
v1ϕ
Z
h1
w1ϕ
Vehı́culo de Tres Ruedas Inclinable
Ası́ las velocidades longitudinales para la rueda trasera son:
u1 = u + h1 α̇ cos(α)
v1 = v − h1 ϕ̇ cos(ϕ)
w1 = w1 − h1 ϕ̇sen(ϕ) − h1 α̇sen(α)
(33)
De la misma manera las velocidades angulares son dadas por:
ωx1 = ϕ̇
ωy 1 = α̇
ωz1 = ψ̇
(34)
Vehı́culo de Tres Ruedas Inclinable
Seguimos el mismo raciocinio para el cuerpo central a partir de su
geometrı́a básica.
Z
Y
a2
h2
X
En este caso, aplicando una rotación positiva en el eje X (ϕ) y en
el eje Z (ψ), tendremos una modifcación de la velocidad
transversal, una vez que el centro de masa no está sobre el eje de
rotación del sistema de coordenadas.
Vehı́culo de Tres Ruedas Inclinable
Las componentes serán
v2ψ = a2 ψ̇
(35)
v2ϕ = −h2 ϕ̇ cos(ϕ)
(36)
y
De la misma forma, la velocidad vertical será modificada por una
rotación positiva en el eje X (ϕ), y estará definida por:
w2ϕ = −h2 ϕ̇sen(ϕ)
(37)
Vehı́culo de Tres Ruedas Inclinable
Ademas, observando la Figura podemos asegurar que la variación
del ángulo (α) (inclinación del terreno) afectara las velocidades
vertical y longitudinal del vehı́culo, de forma que,
z
θ
h2
X
a2
w2α
q
= − h22 + a22 α̇sen(α)
u2α =
q
h22 + a22 α̇ cos(α)
(38)
(39)
Vehı́culo de Tres Ruedas Inclinable
Por lo tanto, las ecuaciones de las velocidades lineares para el
cuerpo principal serán:
q
u2 = u + h22 + a22 α̇ cos(α)
v2 = v + a2 ψ̇ − h2 φ̇ cos(φ)
q
w2 = w2 − h2 φ̇sen(φ) −
h22
+
(40)
a22 α̇sen(α)
con la velocidad w del vehı́culo como siendo la del cuerpo
principal.
Las velocidades angulares serán:
z
ωx2 = ϕ̇
ωy 2 = θ̇ + α̇
ωz2 = ψ̇
θ
(41)
a2
h2
X
Vehı́culo de Tres Ruedas Inclinable
Para la rueda delantera derecha tenemos desplazamientos con
relación a los tres ejes, lo que significa decir que tendremos
componentes debido a las rotaciones en las tres direcciones.
Z
Y
X h4
h3
a4
b4
La velocidad en la dirección X será modificada por rotaciones
sobre el eje Z e Y ,
u3α =
u3ψ = b3 ψ̇
(42)
q
(43)
h32 + a32 α̇ cos(α)
Vehı́culo de Tres Ruedas Inclinable
Para este caso las componentes de la velocidad transversal serán,
v3ψ = a3 ψ̇
(44)
v3ϕ = −h3 ϕ̇ cos(ϕ)
(45)
La velocidad vertical será modificada debido a la rotación en
relación al eje X ,
w3ϕ = −h3 ϕ̇sen(ϕ)
(46)
y en relación al eje Y ,
q
w3α = − h32 + a32 α̇sen(α)
(47)
Vehı́culo de Tres Ruedas Inclinable
Ası́, las velocidades lineares para la rueda delantera derecha serán:
q
u3 = u + b3 ψ̇ + h32 + a32 α̇ cos(α)
(48)
v3 = v + a3 ψ̇ − h3 ϕ̇ cos(ϕ)
q
w3 = w3 − h3 ϕ̇sen(ϕ) −
h32 + a32 α̇sen(α)
De la misma forma las velocidades angulares serán:
ωx3 = ϕ̇
ωy 3 = α̇
ωz3 = ψ̇
(49)
Vehı́culo de Tres Ruedas Inclinable
Para la rueda delantera izquierda el raciocı́nio es el mismo que
para la rueda delantera derecha, apenas con el cambio de signo en
la componente en el eje X y Z . De esta forma las componentes
para esta masa son:
q
u4 = u − b4 ψ̇ + h42 + a42 α̇ cos(α)
(50)
v4 = v + a4 ψ̇ − h4 ϕ̇ cos(ϕ)
q
w4 = w4 − h4 ϕ̇sen(ϕ) −
h42 + a42 α̇sen(α)
De la misma forma, las velocidades angulares serán:
ωx4 = ϕ̇
ωy 4 = α̇
ωz4 = ψ̇
(51)
Definición de las energias
Energia cinética
Definidas las velocidades de las cuatro masas del modelo, ahora se
deben determinar las energı́as cinética y potencial del vehı́culo. De
la Dinámica se define energia cinetica para sistemas multicuerpos
como:
T =
1
2
1
2
4
P
k=1
4 P
k=1
4 P
k=1
mk (uk2 + vk2 + wk2 )+
(Ix ωx2 )k + (Iy ωy2 )k + (Iz ωz2 )k −
(Ixy ωx ωy )k + (Ixz ωx ωz )k + (Iyz ωy ωz )k
(52)
Substituyendo ahora los valores de las velocidades dadas por las
ecuaciones 33, 34, 40, 41, 48, 49, 50 y 51 en la ecuación 52,
obtenemos la ecuación de la enegia cinética.
Definición de las energias
Energia potencial
En primer lugar se necesita determinar el termino debido a la
deformación de los resortes de la suspensión del vehı́culo, que de
forma general se define por:
1
Us = kδ2
2
(53)
Con δ siendo la deformación del resorte y k siendo su constante de
rigidez.
Debemos considerar que el vehı́culo cuenta con tres ruedas y con
un resorte actuando en cada una, de esta forma la energı́a
potencial almacenada en los resortes será:
1
U1 = (k1 δ12 + k3 δ32 + k4 δ42 )
2
(54)
Definición de las energias
Para definir la ecuación de la energı́a potencial, se debe tener en
cuenta que la transferencia de carga de un eje para el otro
promueve una tracción en el resorte de un eje al mismo tiempo que
comprime los del otro.
Definición de las energias
Es interesante que relaciónemos la deformación en el resorte con el
ángulo θ, que es una variable del modelo.
δp
θ
a
l
tg θ =
δ4p
δ1p
δ3p
=
=
(l − a2 )
(l − a2 )
a2
(55)
Para θ pequeño vale,
θ=
δ3p
δ4p
δ1p
=
=
(l − a2 )
(l − a2 )
a2
δ3p = δ4p = −θ (l − a2 )
δ1p = θa2
(56)
(57)
Definición de las energias
Por lo tanto la energı́a potencial debido la variaciones en θ y
movimiento vertical del cuerpo principal será:
Up = 12 (k1 (z2 − z1 + θa2 )2 + k3 (z2 − z3 − θ(l − a2 ))2
+k4 (z2 − z4 − θ(l − a2 ))2 )
(58)
Definición de las energias
La deformación de los neumáticos define los desplazamientos:
δ1v = z1 , δ3v = z3 , δ4v = z4 ,
(59)
Y la energı́a potencial asociada es,
1
(kp (z1 )2 + kp (z3 )2 + kp (z4 )2 )
2
con kp siendo la constante de rigidez del neumático.
Uv =
(60)
De esta forma, la energia almacenada en los sistemas elásticos es:
U1 = Uv + Up
(61)
Definición de las energias
Como no hay resistencia a la rotación en relación al eje X , tenemos
también una caracterı́stica de péndulo invertido, cuja tendencia es
del vehı́culo desplazarse angularmente en dirección al suelo.
De esta forma, tendremos un termino de la energı́a potencial a
partir de este efecto dado por:
U2 = m2 gcos(α)h2 (cos(ϕ))
(62)
Como la masa del cuerpo principal es mucho mayor que la de los
demás cuerpos, admitimos su energı́a potencial como la del
vehı́culo.
Definición de las energias
De esta forma la energı́a potencial total del sistema será la suma
de las ecuaciones 61 y 62.
U = 12 (k1 (z2 − z1 + θa2 )2 + k3 (z2 − z3 − θ(l − a2 ))2 +
k4 (z2 − z4 − θ(l − a2 ))2 )+
1
2
2
2
2 (kp (z1 ) + kp (z3 ) + kp (z4 ) )+
m2 gcos(α)(h2 + z2 )(cos(ϕ))
(63)
Definición de las energias
Finalizando con la definición de las energı́as, tenemos que definir la
Función Disipativa de Rayleygh, que en su forma general es:
n
ℑ=
n
1 XX
cij q̇i q̇j
2
(64)
i =1 j=1
Para cij la constante de amortiguamiento referida a las derivadas
temporales de los grados de libertad qi y qj
Definición de las energias
Sabiendo que el vector de grados de libertad está dado por,
qT = {x, y , z1 , z2 , z3 , z4 , ψ, ϕ, θ, }T
(65)
y que habrá amortiguamiento apenas en los amortiguadores, o sea,
solamente en la dirección Z , podemos determinar los valores de cij
como todos nulos, con excepción de c33 , c44 ,c55 , c66 y c99 , pues
son estas variables que causan movimiento vertical.
Definición de las energias
Las velocidades que producirán disipación en los amortiguadores
son:
Amortiguador rueda trasera
(ż2 − ż1 )
a2 θ̇
(66)
Amortiguador rueda delantera derecha
(ż2 − ż3 )
(l − a2 )θ̇
b3 φ̇
(67)
Amortiguador rueda delantera izquierda
(ż2 − ż4 )
(l − a2 )θ̇
b4 φ̇
(68)
Definición de las energias
De esta forma la función disipativa de Rayleygh es:
ℑ = 21 c1 ((ż2 − ż1 )2 + (a2 θ̇)2 )
+ 12 c3 ((ż2 − ż3 )2 + ((l − a2 )θ̇)2
+ 21 c4 ((ż2 − ż4 )2 + ((l − a2 )θ̇)2
donde ci es la constante del amortiguador de la i-ésima rueda.
(69)
Definición de las fuerzas externas
El próximo paso es la definición de las fuerzas externas actuantes
en el vehı́culo que están representadas por el vector,
F(t)T = {Fx , Fy , Fz1 , Fz2 , Fz3 , Fz4 , Mψ , Mϕ , Mθ }T
(70)
La fuerza Fi produce efectos en la i -ésima dirección, y el momento
Mj en la j-ésima rotación.
Definición de las fuerzas externas - Fx
Fx
Definición de las fuerzas externas - Fx
Para un vehı́culo la fuerza máxima de tracción será dada por el
producto de la carga normal (N) al suelo y por el coeficiente de
rozamiento (f ) en la interface neumático-suelo, o sea:
Ft max = Nf
(71)
El torque aplicado en la rueda no puede superar el torque maximo
definido por Ft max . Por lo tanto podemos admitir que la fuerza de
tracción varia de 0 hasta el valor de Ft max y, de esta forma, la
fuerza en la dirección X será dada por la fuerza de tracción en la
rueda trasera, menos la resistencia aerodinámica, la resistencia al
rodado de los neumáticos y la fuerza de frenado Fbr .
Fx = FT − RL a − RR − mgsen(α) − Fbr
(72)
Definición de las fuerzas externas - Fx
La fuerza de tracción (FT ) puede ser determinada por,
FT =
2nTm
ηT
d
(73)
Para n la relación de transmisión, Tm el torque disponible del
motor, d el diametro dinamico del neumático y ηT el rendimiento
de la transmisión.
El diametro dinamico del neumático difiere de su valor nominal y
puede ser escrito como,
d = 0.9588dn
Para dn siendo el diámetro nominal del neumático.
(74)
Definición de las fuerzas externas - Fx
La resistencia aerodinámica puede ser definida como,
RL a =
1
Cx u 2 Aρ
2
(75)
Para Cx el coeficiente de forma del vehı́culo, u la velocidad
longitudinal, A el area frontal proyectada y ρ la densidad del aire.
Definición de las fuerzas externas - Fx
Las resistencias de rodado pueden ser definidas como la fuerza
producida por la deformación de la interface neumático/suelo. Al
rodar un neumático sobre el suelo existen de los regiones distintas,
la primera donde el neumático se comprime al tocar el suelo y la
segunda cuando deja el suelo y se expande.
Definición de las fuerzas externas - Fx
Esta deformación tiene un efecto similar al de la deformación de un
resorte, absorbiendo energı́a de rodado del vehı́culo y puede ser
descripta por la ecuación:
R R = fR N
(76)
Para N la fuerza normal al suelo y fR el coeficiente de resistencia
al rodado, calculado experimentalmente. Un valor recomendado en
la literatura es 0, 01 como una buena aproximación para este
coeficiente.
Expandiendo la ecuación (76) para las tres ruedas, tendremos:
RR = RR1 + RR3 + RR4
(77)
Definición de las fuerzas externas - Fx
De esta forma, colocando las ecuaciones 73,75,76 y 77 y
adicionando la fuerza de frenado Fbr en la ecuación 72 tendremos:
Fx =
2nTm
d ηT
− 12 Cx u 2 Aρ − fR (N1 + N3 + N4 ) − mgsenα − Fbr
(78)
Definición de las fuerzas externas - Fy
Fy
Definición de las fuerzas externas - Fy
Para el segundo elemento, Fy , debemos analizar lo que sucede con
el neumático en el momento en que comienza a hacer una
trayectoria con una componente transversal. A partir de la vista
superior de la rueda delantera, podemos percibir que se pueden
definir tres ángulos en esta situación, δ, que es el angulo de giro de
las ruedas delanteras, θvf , que es el angulo del vector velocidad, y
αf que es el angulo de deslizamiento.
αf
θvf
v
δ
Y de esta forma,
αf = δ − θvf
(79)
Definición de las fuerzas externas - Fy
Como en el eje trasero el angulo de giro es nulo, partiendo del
mismo princı́pio:
αt = −θvt
(80)
Para θvt el angulo del vector velocidad en el eje trasero.
De acuerdo con los valores de estos ángulos se puede describir la
curva caracterı́stica del neumático conforme el diagrama de la
formula magica de Pacejka.
F
γ
αP
Definición de las fuerzas externas - Fy
Se observa que para pequeños ángulos se puede considerar
comportamiento linear, de forma que se puede describir la relación
entre ángulo de deslizamiento y carga lateral por:
F γ
Fy = BCDαP
(81)
αP
Donde B, C y D son coeficientes de la curva caracterı́stica del
neumático. Este produto es tambien conocido como coeficiente de
rigidez de curva (CαP ) y es el propio coeficiente angular de la recta
que aproxima
αP = 0
(82)
Definición de las fuerzas externas - Fy
De esta forma las fuerzas laterales actuantes pasan a ser definidas
como:
Fy = f (αP ) = CαP αP
(83)
Pacejka también define que:
αPdiant = δ −
v + ad ψ̇ − e δ̇
u
(84)
v − at ψ̇
(85)
u
Para ad distancia longitudinal del eje delantero al centro de giro,
at distancia longitudinal del eje trasero al centro de giro y e caster
de las ruedas delanteras.
αPtras = −
Definición de las fuerzas externas - Fy
Ası́, podemos definir la fuerza lateral de la ecuación 83 como:
h
i
δ̇
Fyd = CαPdiant δ − v +aψ̇−e
iu
h
(86)
v −aψ̇
Fyt = CαPtras − u
La variación del ángulo de giro puede ser considerada lenta y por lo
tanto δ̇ = 0.
De esta forma, se puede escribir la ecuación 86 como:
h
i
ψ̇
Fyd = CαPdiant δ − v +a
h
iu
v −aψ̇
Fyt = CαPtras − u
(87)
Definición de las fuerzas externas - Fy
Considerando que puede haber viento lateral, y que el área
transversal es At , el coeficiente de arrastre transversal es Cxt y la
velocidad del viento es Vvent , la fuerza en el eje y será:
a a
v − 23 ψ̇
v + 23 ψ̇
− CαPtras
+
Fy = 2CαPdiant δ − u
u
(88)
2
+ ρCxt At cos(φ)V2vent sign(Vvent )
Definición de las fuerzas externas Fz1 , Fz2 , Fz3 , Fz4
Fz1, Fz2, Fz3, Fz4
Definición de las fuerzas externas Fz1 , Fz2 , Fz3 , Fz4
El tercer, cuarto, quinto y sexto elemento del vector de fuerzas
será dado por las fuerzas en la dirección vertical del vehı́culo en
cada rueda y en el cuerpo central,
Fz1 = kp zp1
(89)
Fz2 = 0
(90)
Fz3 = kp zp3
(91)
Fz4 = kp zp4
(92)
con zpi siendo la rugosidad del suelo bajo la rueda i .
Definición de las fuerzas externas - Mψ
Mψ
Definición de las fuerzas externas - Mψ
El septimo elemento del vector F(t) puede ser definido a partir del
análisis de la figura siguiente,
replacements
Z
Y
X
a4
Fy 4
Fy 3
Como el vehı́culo gira en relación al eje Z y este pasa por el punto
de contacto del neumático con el suelo, podemos decir que el
momento responsable por el ángulo de giro será función de las
fuerzas laterales actuantes en los neumáticos delanteros, definidas
como Fy3 para el neumático delantero derecho y Fy4 para el
izquierdo.
Definición de las fuerzas externas - Mψ
Como la distancia entre el punto de actuación de estas fuerzas y el
eje Z es a3 = a4 , el momento Mψ es,
a3
Mψ = 2 CalfaP
2
v + a23 ψ̇
δ−
u
!
a3
− CalfaP
2
v − a23 ψ̇
u
!
(93)
En este caso no será considerado el efecto del viento pues depende
del formato del vehı́culo.
Definición de las fuerzas externas - Mϕ
Mϕ
Definición de las fuerzas externas - Mϕ
Ya para el octavo elemento, el par capaz de girarlo en torno del eje
X , no tendremos la actuación de la transferencia de carga entre las
de los ruedas del eje delantero pues el vehı́culo inclina.
Siendo CR el centro de rolling y hr la distancia del centro de
gravedad al eje de rolling . En este caso especı́fico, debido a la
suspension ser por duplo A y los brazos ser paralelos, el CR está en
el suelo y hr = h.
La fuerza de inercia será:
Fc = mψ̇ 2 r
(94)
Para m la masa del vehı́culo, ψ̇ la velocidad de rotación en torno
del eje Z y r el radio de curva.
Definición de las fuerzas externas - Mϕ
Para pequeños ángulos de deslizamiento podemos admitir que:
u
r
(95)
1
δ
=
r
l
(96)
ψ̇ =
y,
con,
l
δ
Substituyendo (97) y (95) en (94) , tendremos:
2 2
2 u 2 l
u δ
u δ
l
=m
=m
Fc = m
2
r
δ
l
δ
l
r=
(97)
(98)
Considerando la proyección de la fuerza (98) en la normal al plano
de la rueda y multiplicando por la altura del centro de gravedad,
tendremos el valor del momento en torno del eje X , debido a Fc .
Definición de las fuerzas externas - Mϕ
El viento lateral ejerce un momento dado por:
2 sign(V
ρCxt At cos(ϕ)h2 Vvent
vent )
(99)
2
Las fuerzas ejercidas por el suelo en las ruedas delanteras producen
un momento:
−
−b3 Fp3 + b4 Fp4
(100)
De esta forma, el momento en torno del eje X será,
Mϕ =
mu 2 δcos(ϕ)h2
l
−
2 sign(V
ρCxt At cos(ϕ)h2 Vvent
vent )
2
− b3 Fp3 + b4 Fp4
(101)
Definición de las fuerzas externas - Mθ
Mθ
Definición de las fuerzas externas - Mθ
Observando la figura siguiente se puede definir el noveno elemento
del vector F como,
z
θ
h2
F
a2
Mθ = Fbr h2 −
F
2nTm
ηT h2
d
X
(102)
Definición de las fuerzas externas
Por fin, asociando las ecuaciones (78), (88), (89), (90), (91), (92),
(93), (101) y (102) el vector de fuerzas (70) pasa a ser:

2nTm
1
2

T − 2 Cx u Aρ

d η
a3 − mgsenα − Fbr2
− fR mgcos(α)

a

v− 2 ψ̇
v+ 23 ψ̇
ρC A cos(φ)Vvent sign(Vvent )


− CαP
+ xt t
2CαP δ − u

u
2




k
z
p
p1




 0
kp zp3


k
 p zp4 a3 
a3


 2 a23 CαP δ − v+u2 ψ̇ − a23 CαP v−u2 ψ̇



2

ρCxt At cos(φ)h2 Vvent
sign(Vvent )
mu 2 δcos(φ)h2


−
− b3 Fp3 + b4 Fp4

l
2


2nTm
Fbr h2 − d ηT h2

































(103)
Modelo simplificado de una bicicleta
Trabajo propuesto
Modelar una bicicleta como una aproximación al modelo del
triciclo presentado anteriormente.
Para el modelo simplificado de la bicicleta, serán considerados
apenas el movimiento longitudinal y de rotación en relación al eje
X (q = {x, φ}), mostrados en la figura con h la altura del centro de
gravedad de la bicicleta y m la sua massa.
Modelo simplificado de una bicicleta
Una solución
Para estos grados de libertad, es facil verificar que la energia
cinética de la bicicleta se da por la ecuación 104:
T =
1
(hmφ̇2 + mẋ 2 )
2
(104)
La primeira parcela del lado izquierdo de la ecuación corresponde a
la energia de rotación en torno del eje X de movimiento, mientras
que la segunda parcela corresponde a la energia del movimiento
longitudinal del vehı́culo.
Modelo simplificado de una bicicleta
La energı́a potencial solamente puede ser acumulada en forma de
energı́a potencial gravitacional, ya que este modelo no cuenta con
ningún otro elemento acumulador. Por lo tanto, se define por la
ecuación,
V = mghcos(φ)
(105)
com g siendo la aceleración de la gravedad.
Modelo simplificado de una bicicleta
A partir de las energias potenciales y cinéticas de la bicicleta se
pueden obtener las ecuaciones diferenciales que definen la dinámica
del modelo através del cálculo del Lagrangeano.
El Lagrangeano L del sistema se define por la ecuación,
1
L = T − V = (hmφ̇2 + mẋ 2 ) − mghcos(φ)
2
(106)
Modelo simplificado de una bicicleta
Las ecuaciones dinámicas del sistema se pueden obtener a partir de
L através de la relación,
∂L
d ∂L
=F
(107)
−
dt ∂ q̇
∂q
com F representando el vector de entradas (fuerzas y momentos)
actuando en el sistema.
Modelo simplificado de una bicicleta
Se puede calcular cada un dos elementos de la ecuación 107,
obteniendo:
∂L
= mẋ
∂ ẋ
∂L
= mh2 φ̇
∂ φ̇
∂L
=0
∂x
∂L
=
mghsin(φ)
∂φ
∂L
d
= mẍ
dt ∂ ẋ d
∂L
= mh2 φ̈
dt
∂ φ̇
(108)
Modelo simplificado de una bicicleta
Como resultado se obtiene el modelo dinámico dado por las
ecuaciones 109 y 110:
mh2 φ̈(t) − mhgsin(φ(t)) = g1 (u, δ)
(109)
mu̇(t) = g2 (Tm , u)
(110)
La función g1 (u, δ) describe el momento externo aplicado al
sistema, y se la puede definir de manera semejante a la utilizada en
el modelado del triciclo, pues este también depende de la
geometrı́a del vehı́culo.
Modelo simplificado de una bicicleta
Ası́, utilizando la ecuación (98) que define el momento de rotación
en φ multiplicada por la altura del centro de gravedad, la ecuación
109 pasa a ser escrita como:
φ̈(t) =
g
cos(φ(t)) 2
sin(φ(t)) +
u (t)δ(t)
h
lh
(111)
Modelo simplificado de una bicicleta
De manera análoga, la función g2 (Tm , u) representa las fuerzas
externas actuando en la dirección del movimiento longitudinal, y se
la puede substituir por la formulación de fuerza utilizada en el
modelado del triciclo, con una parcela responsable por la fuerza de
tracción aplicada y otra indicando la fuerza de arrastre
aerodinámico.
De esta forma, la ecuación (110) pasa a ser:
u̇(t) =
1
2nηT
Tm (t) −
Cx Aρu 2 (t)
dm
2m
(112)
Modelo simplificado de una bicicleta
Modelo mas realista
Para tornar este modelo simplificado mais próximo del modelo del
triciclo, se adiciona amortiguamiento al movimiento rotacional φ
de la bicicleta. Los amortiguadores lineares, existentes en el
triciclo, se pueden aproximar por un amortiguador torsional
equivalente igualando el trabajo realizado por los dos mecanismos.
El trabajo W del amortiguador linear del triciclo quando ocurre
una inclinación φ es dada por:
2
b
W = C φ̇φ
2
(113)
com (C ) el coeficiente de amortiguamiento y b2 la distancia entre
el centro de rolling del vehı́culo en el eje X y el amortiguador.
Modelo simplificado de una bicicleta
En este cálculo, se asumió que la posición del amortiguador
coincide con la posición de la rueda para simplificar el problema. El
trabajo equivalente de un amortiguador torcional es:
Wequiv = Ct φ̇φ
(114)
com (Ct ) del amortiguamiento torcional equivalente. Igualando los
trabajos de los dos amortiguadores, se puede obtener el valor del
amortiguador torcional equivalente. Considerando los dos
amortiguadores existentes en el triciclo, el valor del
amortiguamiento torcional equivalente se puede calcular como:
Ct = 2C
2
b
2
(115)
Modelo simplificado de una bicicleta
Adicionando amortiguamiento al movimiento de rotación en torno
del eje X del modelo de la bicicleta, se obtiene la ecuación (116),
que representa la dinámica de inclinación de la bicicleta,
φ̈(t) =
g
Ct
cos(φ(t)) 2
sin(φ(t)) −
φ̇ +
u (t)δ(t)
h
mh
lh
(116)
Semejanzas entre bicicleta y triciclo
Se puede facilitar bastante el proyecto de controladores y el análisis
de los sistemas en lazo cerrado através del uso de modelos
simplificados. Es claro que esta ventaja proviene del sacrificio de
dinámicas del sistema que no serán modeladas.
Dos variables son de mayor interes: el ángulo de inclinación φ y la
velocidad u. Por lo tanto se propone el modelo de una bicicleta
descripto por las ecuaciones (111) y (112) como una simplificación
del modelo del triciclo.
Semejanzas entre bicicleta y triciclo
La comparación entre los dos modelos da informaciones sobre sus
comportamientos. A seguir se presentan los resultados obtidos.
Para realizar las simulaciones, una vez que los dos sistemas son
inestables en lazo abierto, se utilizo un controlador PID con
compensación estática de la ganancia no lineal para estabilizar el
sistema. Este controlador será detallado posteriormente.
Semejanzas entre bicicleta y triciclo
Para la simulación mostrada en la figura se considera una entrada
de giro aplicado por el conductor de δr = 0, 1rad para la izquierda
y para la derecha a una velocidad constante u = 10m/s.
Se controla la velocidad através de un controlador por modos
deslizantes que será descripto posteriormente.
Semejanzas entre bicicleta y triciclo
El gráfico muestra que el comportamiento dinámico de los sistemas
presenta semejanzas con los mismos valores de φ en régimen.
Se puede explicar la diferencia entre los comportamientos por la
ausencia de interacción entre las ruedas frontales y el cuerpo del
vehı́culo en el modelo de la bicicleta
Comparacao de Inclinacao
5
Triciclo
Bicicleta
4
Inclinacao (graus)
3
2
1
0
−1
−2
−3
−4
0
2
4
6
8
10
12
Tempo (s)
14
16
18
20
Semejanzas entre bicicleta y triciclo
La figura muestra la simulación del sistema en lazo abierto para
velocidad considerando cambios simultáneos de velocidad y ángulo
de giro, para verificar el acoplamento entre las variables.
La velocidad inicial de los dos modelos es 5m/s y se aplica un
torque motor constante de 100Nm. El giro aplicado por el
conductor es de 0, 1rad para cada lado.
Comparacao de Inclinacao
10
Triciclo
Bicicleta
8
Inclinacao (graus)
6
4
2
0
−2
−4
0
2
4
6
8
10
12
Tempo (s)
14
16
18
20
Semejanzas entre bicicleta y triciclo
Estas simulaciones indican que los dos modelos presentan algunas
semejanzas, llegando a los mismos valores de inclinación en
régimen, mismo valor de giro (acción de control) en régimen y
comportamiento dinámico para la velocidad longitudinal
semejantes.
Estas caracterı́sticas indican que las ecuaciones de la bicicleta
pueden ser asumidas como una simplificación del modelo completo
del triciclo y, por lo tanto, pueden dar algunas informaciones para
el proyecto y análisis de controladores.
Semejanzas entre bicicleta y triciclo
La comparación de comportamientos dinámicos anterior
muestra que se puede utilizar un modelo simple para proyecto
y análisis.
Se pueden obtener modelos simplificados a partir de un nuevo
modelado fenomenólogico, como hecho anteriormente, que
requiere conocimiento de los efectos dinámicos de diferentes
componentes de un sistema.
Otro abordaje es simular el modelo completo e identificar un
modelo simple utilizando programas de simulación y control
de sistemas dinámicos.
Y otra forma de obtener modelos simples es utilizar técnicas
de reducción de modelo.
Fundamendación Teórica
Fundamendación Teórica
Fundamendación Teórica
Aqui se exponen los fundamentos de control utilizados para este
trabajo, presentando la teoria para las técnicas de control no-linear
por realimentación linearizante entrada-salida y control por energy
shaping.
Fundamendación Teórica
Control no-linear por realimentación
linearizante entrada-salida.
Para esto se introducen algunos conceptos importantes de la
geometria diferencial que resultaran en un controlador que
garantiza la estabilización y el seguimento de trayectórias.
Fundamendación Teórica
En el contexto de la teoria de control, el uso de técnicas basadas
en el cancelamiento matemático de términos levanta
cuestionamentos.
La técnica de realimentación linearizante debe ser vista como una
propiedad estructural de una clase de sistemas lineares, y no como
una solución para el proyecto de control.
Uma propiedad importante de esta clase de sistemas no es
conseguir el cancelamiento exacto de sus no-linearidades, mas
garantizar que el control mantenga las no-linearidades dentro del
alcance de las entradas.
Fundamendación Teórica
Considerando un sistema no linear en la forma
ẋ
= f (x) + g (x)u
(117)
y
= h(x)
(118)
una ley de control por realimentación de la forma
u = α(x) + β(x)v
puede transformar el sistema no-linear en un equivalente
linearizado.
(119)
Fundamendación Teórica
Para tal, se necesita que el sistema sea escrito de acuerdo con la
estrutura.
ẋ = Ax + Bγ(x)[u − α(x)]
(120)
con A de dimensión n × n, B de dimensión n × p, el par (A, B)
controlable, las funciones α : R n → R p y γ : R n → R p×p definidas
en el dominio D ∈ R n que contiene el origem, y la matriz γ(x) no
singular para todo x.
Si se obedecen tales condiciones, la ley de control dada por la
ecuación (119) consigue linearizar el sistema con β = γ −1 .
Proyectando v de forma apropiada se alcanza la estabilidad.
Fundamendación Teórica
Caso el sistema no este en la forma dada por la ecuación (164), se
puede llevar a la forma deseada si existe una transformación de
estados (ecuación 121) que atienda algunos requisitos.
Cuando se usa el cambio de variables para transformar la ecuación
de estados de coordenadas x para coordenadas z, la función T que
mapea la transformación debe poseer inversa.
Adicionalmente, las funciones T y T −1 deben ser continuamente
diferenciables.
z = T (x)
(121)
Fundamendación Teórica
Cuando apenas algunas variables de salida son de interés, como
generalmente es el caso del problema de seguimiento de referencia,
se describe el modelo por ecuaciones de estado y de salida.
Linearizando las ecuaciones de estado no necesariamente resulta en
ecuaciones de salida linearizadas, lo que puede dificultar la solución
del problema de seguimiento de referencia.
Por esta razón, la linearización entrada-salida presenta ventajas,
aunque sea necesario mantener parte de las ecuaciones de estado
en la forma no linear. En este caso, se dice que el sistema es
linearizable en entrada-salida.
Fundamendación Teórica
Se debe observar que en el caso de un sistema entrada-salida
linerarizable, algunos estados del sistema pueden ser
no-observables a partir de la salida elegida.
Asi, estos estados deben ser estables o al menos limitados.
Fundamendación Teórica
Considerando el sistema dado por la ecuación (117), con f , g y h
suficientemente suaves en el dominio D ⊂ R n . Los mapas
f : D → R n y g : D → R n se denominan campos vectoriales en D.
La derivada y (1) es,
y (1) =
∂h
[f (x) + g (x)u] , Lf h(x) + Lg h(x)u
∂x
(122)
con
∂h
f (x)
∂x
indicando la Derivada de Lie de h en relación a f .
Lf h(x) =
Si Lg h(x) = 0, entonces ẏ = Lf h(x) no dependerá de u.
(123)
Fundamendación Teórica
Calculando la segunda derivada de y , denotada por y (2) , se
obtiene:
y (2) =
∂(Lf h(x))
[f (x) + g (x)u] = L2f h(x) + Lg Lf h(x)u
∂x
(124)
Nuevamente, si Lg Lf h(x) = 0, entonces y (2) = L2f h(x),
independiente de u. Repitiendo el proceso se observa que si h(x)
satisface
Lg Lif−1 h(x) = 0, i = 1, 2, ..., ρ − 1; Lg Lρ−1
h(x) 6= 0
f
(125)
entonces u no aparece en las ecuaciones de y , ẏ , ..., y (ρ−1) y
aparece en la ecuación de y ρ con un coeficiente no nulo
y ρ = Lρf h(x) + Lg Lρ−1
h(x)u
f
(126)
Fundamendación Teórica
Utilizando este resultado, se puede ver que el sistema es
entrada-salida linearizable, pues la ley de control realimentada
u=
1
Lg Lρ−1
h(x)
f
[−Lρf h(x) + v ]
(127)
reduce el mapa de entrada salida a
yρ = v
(128)
que es una cadena de ρ integradores. En este caso, al número
entero ρ se lo denomina grado relativo del sistema.
El grado relativo del sistema es una propiedad importante para la
linearización entrada-salida y el seguimento de trayectórias.
Fundamendación Teórica
Considerando el sistema SISO entrada-salida linearizble
representado por el sistema
η̇ = f0 (η, ξ)
(129)
ξ̇ = Ac ξ + Bc γ(x)[u − α(x)]
(130)
y
(131)
= Cc ξ
con ξ ∈ R ρ ,η ∈ R n−ρ , (Ac ,Bc ,Cc ) la forma canónica representando
la cadena de integradores y f0 (0, 0) = 0.
Se desea proyectar una ley de control de forma que la salida y siga
el sinal de referencia r (t).
Fundamendación Teórica
Caso el sistema tenga grado relativo ρ = n, no tiene dinámicas
cero no-triviales.
En este caso, las variables η y sus ecuaciones pueden ser
desconsideradas para el desarrollo del controlador.
Se supone también que la referencia r (t) y sus derivadas r ρ (t) son
limitadas para todo t ≥ 0 y la ρ-ésima derivada es una función
continua por partes de t.
Fundamendación Teórica
Suponiendo


R=
r
..
.
r (ρ−1)




,y = 
ξ1 − r
..
.
ξρ − r (ρ−1)


=ξ−R
(132)
el cambio de variables e = ξ − R en el sistema lo transforma en
η̇ = f0 (η, y + R)
ẏ = Ac y + Bc {γ(x)[u − α(x)] − r ρ }
(133)
La ley de control
u = α(x) + βx[v + r ρ ]
(134)
reduce a la ecuación (133) para la forma
η̇ = f0 (η, y + R)
ẏ = Ac y + Bc v
(135)
Fundamendación Teórica
Se puede alcanzar el objetivo de control para cualquier proyecto de
v que estabilize la segunda ecuación mientras η sea limitado.
Para sistemas de fase mı́nima con e(0), η(0) y R(t) el estado n(t)
es limitado, resolviendo asi el problema de estabilidad local.
Para ampliar la región de atracción y obtener estabilidad global, es
condición suficiente asegurar que el sistema η̇ = f0 (η, ξ) tenga
estabilidad entrada-estado.
Fundamendación Teórica
Control no-linear via Energy Shaping
Ahora veremos la teoria básica de control no linear via energy
shaping, junto con algunos resultados importantes que
posteriormente serán utilizados para la sı́ntesis de um controlador,
basandose en las ecuaciones de Euler-Lagrange.
Se definen los sistemas en la forma de Euler-Lagrange (sistemas
EL) a partir de una técnica de modelado basada en la definición de
funciones de energia, formando la función Lagrangeana que
permite obtener las ecuaciones de movimento del sistema.
Fundamendación Teórica
Al trabajar con pasividad, existe una ventaja al describir sistemas
en la forma de EL, pues ya se obtienen funciones de
almacenamiento y de disipación, base para la técnica de energy
shaping.
Otra ventaja es que se pueden representar sistemas interconectados
de forma simple. El concepto de interconexión es importante, pues
define como se transmite la energia entre sistemas.
La teoria de energy shaping se basa en la modificación de la
energia de sistemas y de sus puntos de equilibrio.
Fundamendación Teórica
El analisis a partir de las energias potenciais ayuda a explicar el
concepto por tras de la teoria.
La primeira figura ilustra la energia potencial de um péndulo, con
um punto de máximo (equilibrio inestable) localizado en 0 y
puntos de mı́nimo (equilibrios estables) localizados en ±π. Através
de la modificación de la energia potencial de el sistema, se desea
obtener una función de energia potencial deseada Vd . Un ejemplo
de función es el de la segunda figura, que posee apenas un punto
de mı́nimo.
5000
18000
4000
16000
3000
14000
2000
Energia Potencial
Energia Potencial
12000
1000
0
−1000
10000
8000
6000
−2000
4000
−3000
2000
−4000
−5000
−5
−4
−3
−2
−1
0
Phi (rad)
1
2
3
4
5
0
−5
−4
−3
−2
−1
0
Phi (rad)
1
2
3
4
5
Fundamendación Teórica
De forma semejante, se puede modificar la función de disipación de
un sistema, adicionando amortiguamiento y garantizando la
estabilidad asintótica de los puntos de equilibrio deseados.
Fundamendación Teórica
Pasividad
Sistemas Pasivos corresponden a una clase de sistemas dinámicos
donde el intercambio de energia con el ambiente desempeña un
papel fundamental en la formulación del problema de control.
Estos sistemas no pueden almacenar mas energı́a que la
disponibilizada por el ambiente, con el exceso de energı́a siendo
disipado.
Fundamendación Teórica
La definición de pasividad está intrinsecamente relacionada con las
propiedades fı́sicas del sistema y de forma particular con su
estabilidad.
Disipatividad es una propiedad fundamental de sistemas fı́sicos.
Em sistemas eléctricos, parte de la energia se disipa como
calor en resistencias.
Em sistemas mecánicos, la fricción entre elementos causa la
perdida de energia.
A continuación se presentan algunas definiciones necesarias para el
concepto de pasividad.
Fundamendación Teórica
Espacios L2 y L2e : Considerando el conjunto Ξ para toda
función real mensurable n dimensional f (t) : R+ → R n . Definiendo
el conjunto
Z ∞
2
k f (t) k2 dt < ∞}
(136)
L2 , {x ∈ Ξ |k f k2 ,
0
con k · k la norma euclidiana. Este conjunto forma un espacio
vectorial normado sobre el campo de los números reales con norma
k · k2 . El espacio extendido L2e puede ser definido como
L2e , {x ∈ Ξ |k f k22T ,
Z
T
k f (t) k2 dt < ∞, ∀T }
(137)
0
Asi, L2 ⊂ L2e , con el espacio extendido conteniendo señales donde
la norma L2 puede tender para infinito, mas apenas en tiempo
infinito.
Fundamendación Teórica
Se define producto interno (Equación 138) y el producto interno
truncado (Equación 139) de dos funciones y y u como;
Z ∞
u(t)T y (t)dt
(138)
hu | y i ,
0
hu | y iT ,
Z
0
T
u(t)T y (t)dt
(139)
Fundamendación Teórica
Los sistemas explorados en este caso, representados por el
operador Σ, poseen la forma
(
ẋ = f (x, u), x(0) = x0 ∈ R n
Σ:
y = h(x, u)
con estados x ∈ R n , entrada u ∈ R m y salida y ∈ R m , donde
Σ : L2e → L2e : u → y .
(140)
Fundamendación Teórica
Disipatividad: La definición matemática de disipatividad está
relacionada a dos funciones: la tasa de alimentación (supply rate),
que define la tasa con que la energia es introducida al sistema, y la
función de almacenamiento (storage function), que indica la
cantidad de energia que está almacenada en el sistema. Estas
funciones estan relacionadas por una inecuación de disipación.
Fundamendación Teórica
El sistema dinámico causal Σ se dice disipativo con respecto a la
tasa de alimentación w (u, y ) : R m × R m → R si y solamente si
existe una función de almacenamiento H : R n → R>0 , de manera
que:
Z T
w (u(t), y (t))dt
(141)
H(x(T )) 6 H(x(0)) +
0
para todo u, T > 0 y x(0) ∈
R n.
Fundamendación Teórica
Pasividad: Σ es pasivo si es disipativo con una tasa de
alimentación w (u, y ) = u T y .
El sistema se dice de Entrada Estrictamente Pasivo si es disipativo
con tasa de alimentación w (u, y ) = u T y − δi k u k2 , con δi > 0.
El sistema se dice de Saida Estrictamente Pasiva si es disipativo
con tasa de alimentación w (u, y ) = u T y − δo k y k2 , con δo > 0.
Fundamendación Teórica
Estabilidad L2 : Σ se dice L2 -estable si existe una constante
positiva γ de forma que, para cada x0 , existe una constante finita
β(x0 ) que satisface la inecuación 142.
k y k2T ≤ γ k u k2T +β(x0 )
(142)
Fundamendación Teórica
Disipatividad y estabilidad L2 estan relacionadas.
Um sistema Σ es L2 estable si es disipativo con una tasa de
alimentación w (u, y ) = 21 γ 2 k u k2 − k y k2 .
Con una función de almacenamiento H ≥ 0 y x0 = 0, se puede
mostrar que:
Z
0
T
k y k2 dt ≤ γ 2
Z
T
k u k2 dt
o
Si un sistema Σ : u → y es de Salida Estritamente Pasiva,
entonces es L2 -estable
(143)
Fundamendación Teórica
Invariancia de pasividad: Considerando los sistemas entrada
salida mostrados en la figura: si Σ1 y Σ2 son ambos pasivos,
entonces el sistema total Σ es tambien pasivo.
Se puede demostrar esto para el caso de interconexión de
realimentación e interconexiones de sistemas en paralelo.
Fundamendación Teórica
Con sistemas Σ1 y Σ2 pasivos, existen funciones de
almacenamiento H1 y H2 tal que,
Hi (xi (T )) − Hi (xi (0)) ≤
RT
0
uiT yi dt, con i = 1, 2.
Definiendo x : (x1 , x2 ) y H(x) = H1 (x1 ) + H2 (x2 ), con H(x)
positiva semi-definida.
Fundamendación Teórica
Para interconexiones en paralelo la salida será y = y1 + y2 , de
forma que:
H(x(T )) − H(x(0)) ≤
Z
0
T
T
T
(u y1 + u y2 )dt =
Z
T
0
mostrando que la interconexión en paralelo es pasiva.
u T ydt (144)
Fundamendación Teórica
Para el sistema realimentado, substituyendo u2 = y1 y u1 = r − y2
se obtiene :
Z T
(r T y1 )dt
(145)
H(x(T )) − H(x(0)) ≤
0
Es importante mostrar que el teorema no exige que los dos
operadores sean pasivos, pues el exceso de pasividad de un sistema
puede compensar la falta de pasividad en otro sistema.
Fundamendación Teórica
Estabilización por realimentación de salida - Un controlador
representado por los parámetros (Tc (qc , q̇c ), Vc (qc , qp ), Fc (q̇c ))
con Tc la energia cinética de el controlador, Vc la energia potencial
de el controlador, Fc la función de disipación de energia del
controlador, qc los estados del controlador y qp los estados del
sistema resuelve el problema de estabilización global por
realimentación de salida si:
Energy shaping: V(q) es propia y posee un único mı́nimo
global en q = q∗ .
Aumento de amortiguamiento: Fc (q̇c ) debe satisfazer
q̇ T
∂Fc
≥ α k q̇c k2
∂ q̇
(146)
para algun α > 0.
Propagación de la disipación: Para toda trayectoria con qc ≡
∂V (q ,q )
constante y c∂qcc p = 0 resulta en qp ≡ constante.
Fundamendación Teórica
Estabilidad Interna y Pasividad: Un sistema entrada-salida
estable es tambien internamente estable si se satisfacen algunas
propriedades de observabilidad. Suponiendo que el sistema Σ sea
de Salida Estrictamente Pasiva con una función de
almacenamiento H ≥ 0.
Si Σ es zero-estado observable, entonces H(x) > 0 para todo
x 6= 0
Si H(x) > 0 para todo x 6= 0, H(0) = 0 y Σ es zero-estado
detectable, entonces x = 0 es un equilibrio localmente
asintoticamente estable. Si H es radialmente irrestricta,
entonces la estabilidad es global.
Definición del Problema de Control
Definición del Problema de Control
Definición del Problema de Control
Presentación del problema
En vehı́culos de cuatro ruedas (automóviles convencionales)
no se desea la rotación en relación al eje X (ángulo ϕ,
también llamada de ”rolling”), pues estos vehı́culos no
permiten el ajuste del ángulo dinámicamente (con el vehı́culo
en movimiento).
Ya en vehı́culos de dos ruedas (como motos y bicicletas) se
utiliza el ”rolling” para mantener la estabilidad y facilitar la
dirección del vehı́culo durante las curvas.
Definición del Problema de Control
En el proyecto del vehı́culo de tres ruedas, la manipulación del
ángulo de ”rolling” permitirá que efectos causados por la
fuerza centrifuga durante las curvas sean compensados,
proporcionando mejor estabilidad y desempeño.
El ángulo de ”rolling” ϕ puede ser ajustado dinámicamente
por de un mecanismo de inclinación variable la traves de una
acción de control.
Definición del Problema de Control
Objetivo
El objetivo es el de desarrollar un controlador que a través de la
manipulación del giro de las ruedas corrija el ángulo de inclinación
ϕ para que las fuerzas transversales al plano de la rueda se anulen.
Definición del Problema de Control
El ángulo de inclinación deseado ϕd se obtiene a partir de la
ecuación (147) que depende de la velocidad del vehı́culo v , del
ángulo de giro deseado δd , de la aceleración de la gravedad g y de
la distancia entre los ejes del vehı́culo L.
2 v .δd
(147)
ϕd = −atan
g .L
El otro objetivo de control es la velocidad en el eje X
Limites de giro para el vehı́culo
Para analizar mejor el desempeño del controlador se necesita fijar
un limite para el giro de las ruedas y para la velocidad del vehı́culo
y, de esta forma, determinar el limite para la inclinación del
vehı́culo.
Limites de giro para el vehı́culo
Se estableció la relación entre las velocidades y los radios de giro
de acuerdo con la norma del DNER, que define los padrones para
la construcción de rutas en Brasil.
Peralte
4%
6%
8%
10%
30
30
25
25
25
40
60
55
50
45
Velocidad Directriz(m/s)
50
60
70
80
90
100 150 205 280 355
90 135 185 250 320
80 125 170 230 290
75 115 155 210 265
100
465
415
375
245
110
755
655
595
540
La tabla muestra los valores de radio de curva mı́nimos para
diferentes velocidades y diferentes valores de peralte de la pista.
Peralte es el declive transversal de la pista, introducido con la
finalidad de reducir o eliminar efectos de fuerzas laterales sobre
pasajeros y/o cargas de los vehı́culos en movimiento.
Limites de giro para el vehı́culo
En este caso se consideraran como valores limite los indicados para
4%, pues el modelo del vehı́culo no simula la presencia de peralte
en la pista.
De esta manera, si el vehı́culo atiende los valores especificados
para 4%, mismo sin la compensación del peralte, podemos
considerar que el sistema atiende a los requisitos.
Limites de giro para el vehı́culo
Transformando el radio de curva en ángulo de giro de las ruedas
delanteras del vehı́culo la través de la ecuación 148:
L
(148)
R
donde L es la distancia entre ejes, R es el radio de curva y δ es el
ángulo de giro, obtenemos (para L = 2.2 metros) la tabla,
tan(δ) =
(◦ )
δ
δ (rad)
30
4.19
0.073
40
2.10
0.036
Velocidad
60
0.84
0.014
Directriz(km/h)
70
80
100
0.61
0.45
0.27
0.011 0.008 0.005
110
0.16
0.003
La tabla define el ángulo de giro necesario para que el vehı́culo
consiga realizar curvas conforme definido por las normas de
construcción de rutas, y estos serán los valores que definirán los
limites para este proyecto. La velocidad máxima del vehı́culo fue
establecida en 110 km/h.
Proyecto de controladores
Proyecto de controladores
Proyecto de controladores
Preliminares
A continuación veremos las etapas y los cálculos para sı́ntesis de
controladores:
PID con compensación estática de no linealidad,
controlador por realimentación linearizante,
control via energy shaping,
control por modos deslizantes
Los controles de velocidad y de inclinación componen un problema
multivariable para el caso del triciclo, pero serán tratados como
dos problemas monovariables separados.
Proyecto de controladores
A continuación y como primer paso del proyecto de controladores
se presenta:
Un controlador de velocidad basado en modos deslizantes,
Un generador de referencias (encargado de calcular el ángulo
de inclinación deseado para el vehı́culo φd que anula las
fuerzas laterales actuantes).
Proyecto de controladores
El controlador de velocidad por modos deslizantes utiliza
como variable de entrada el torque del motor Tm y como variable
de salida a velocidad longitudinal del vehı́culo u.
A partir del sistema en la forma
M(q)q̈ + C q̇ + K (q, q̇)q = F (q, q̇)
(149)
se puede describir por:
q̈ = −M(q)−1 C q̇ − M(q)−1 K (q, q̇)q + M(q)−1 F (q, q̇)
(150)
através del cambio de variables,
x1 = q, x2 = q̇
(151)
Y asi se puede modelar el triciclo como un sistema de ecuaciones
diferenciales de primer orden:
ẋ1 = x2
ẋ2 = −M(x1 )−1 Cx2 − M(x1 )−1 K (x1 , x2 )x2 + M(x1 )−1 F (x1 , x2 )
(152)
Proyecto de controladores
La salida del sistema a ser regulada es el error de velocidad, que
debe ser cero. Se puede definir la superficie de deslizamento para
control de velocidad como,
S = ud − u
(153)
donde la entrada Tm actua sobre S.
Definiendo la ley de control como
(
−k1 , se S > 0,
Tm =
+k1 , se S < 0
(154)
el sistema tiene error nulo en regimen si k1 es suficientemente
grande. Para aplicar la ley de control en las simulaciones se puede
usar un relay con histéresis de valor 0.001, para reduzir el
chattering, caracterı́stico de este tipo de control.
Proyecto de controladores
Para cálculo del valor de referencia de inclinación φd , se utilizó
un generador de trayectorias.
Este generador calcula los valores de referencia de φ y u, que
servirán de entrada para los controladores de inclinación y
velocidad, fundamentado en la teoria de platitud aplicada al
modelo de la bicicleta. (*)
Proyecto de controladores
Se debe determinar el error de inclinación del vehı́culo calculado a
partir del valor de inclinación medida φ y del valor de inclinación
deseado φd .
El valor de φd es el ángulo de inclinación que cancela las fuerzas
laterales actuantes en el vehı́culo.
Proyecto de controladores
Algunas lineas generales orientan la solución para el problema de
seguimiento de trayectoria:
Durante variaciones de giro deseado δd , se debe intentar
manter la velocidad ud constante.
Si el modulo del ángulo de inclinación φd es mayor que un
valor máximo φmax , se debe alterar ud para que δd sea
alcanzado. Durante transitorios se debe mantener el valor de
δd lo mas próximo posible del valor deseado por el conductor,
evitando violar la restricción de inclinación k φd k< φmax .
Cuando u̇d = 0 y δ̇d = 0, entonces φ̈ = 0 (en este caso, φ, ud
y δd se relacionan algebraicamente). De la ecuación (111), se
puede obtener:
tan(φ)gl = u 2 δ
(155)
Proyecto de controladores
No se pueden realizar cambios instantáneos en las referencias en
aplicaciones prácticas. Por eso se necesitan definir transiciones
suaves para la referencia.
Se definen restricciones de movimento aplicando la segunda
ley de Newton en un punto de masa (en este caso, la masa del
vehı́culo) que se mueve a lo largo de una trayectoria (eje x
para el movimento longitudinal) e inclinación (movimento
angular φ).
El sistema no se puede mover mas rápido de lo que permiten
las leyes de la fı́sica.
La solución de las dos ecuaciones diferenciales (111 y 112)
determinan los set-points factibles.
Outra restricción fı́sica proviene de los limites del ángulo de
inclinación.
El objetivo de control es mover la rueda lo mas próximo posible del
valor definido por el conductor, lo mas rápido posible.
Proyecto de controladores
A partir del modelo simplificado de la bicicleta (111 y 112),
Si se conoce el ángulo de inclinación φ, se pueden calcular φ̇ e
φ̈;
Conociendo δ y usando (111), se puede calcular el termino u 2 .
Calculando su raiz cuadrada y considerando apenas
velocidades positivas se puede definir u̇,
Usando la ecuación (112) se puede calcular el valor del torque
Tm .
Ası́, midiendo φ e δ, se pueden calcular todas las variables del
sistema.
Proyecto de controladores
Se pueden definir las condiciones iniciales de δ, δ̇ e δ̈ en t0 através
de los valores deseados o por limitaciones fı́sicas, mientras que se
puede medir φ, φ̇ e φ̈ en el instante t0 .
Para un instante t1 , apenas δ e φ pueden ser no nulas, las otras
cuatro variables deben ser obligatoriamente cero.
Proyecto de controladores
Definiendo dos polinómios de orden adecuada para φ e δ que
satisfagan las condiciones iniciales y finales definidas anteriormente
y calculando sus coeficientes, se pueden calcular todas las variables
del problema. A continuación se muestran los polinómios
escogidos.
Proyecto de controladores
Trayectoria linear para φ: Se puede definir la trayectoria para φ
como una ecuación lineal:
φ(t) = φ(t0 ) + (φ(t1 ) − φ(t0 ))
t − t0
t1 − t0
(156)
Utilizando u(t0 ) y δ(t0 ) se define el valor para φ(t0 ), y con u(t1 ) y
δ(t1 ) se calcula φ(t1 ) utilizando la ecuación (155).
Si el valor de k φ(t1 ) k> π6 , entonces se debe definir φ(t1 ) como
± π6 .
Esta solución garantiza φ̈ = 0 para todo t.
Proyecto de controladores
Trayectoria para δ: Para conseguir transiciones suaves por partes
para la referencia de giro, se propone una ecuación lineal similar a
la utilizada para el cálculo de φ(t):
δ(t) = δ(t0 ) + (δ(t1 ) − δ(t0 ))
t − t0
t1 − t0
(157)
Proyecto de controladores
Trayectoria para velocidad: La función definida por la ecuación
(156) tiene la segunda derivada nula.
De esta manera, para los cálculos de la velocidad u a partir de la
ecuación (111), se debe considerar cero la segunda derivada de φ.
Considerando a ecuación en regimen permanente, se puede
determinar la referencia de u utilizando las funciones de
trayectorias lineares para φ y δ y aplicando en
r
gltan(φ)
u(t) =
δ
(158)
Ası́ se obtienen los valores de φ(t) e u(t) que servirán de referencia
para los controladores de bajo nivel.
Proyecto de controladores
PID con compensación estática de la
no-linealidad
Se proyectará un controlador PID con compensación estática de la
no-linealidad (referido en este caso simplesmente como PID) para
servir para comparación, debido a la ausencia de trabajos
consolidados en la literatura.
Por un lado, diversos artı́culos existentes utilizan diferentes
modelos y presentan pocos resultados experimentales, por otro
lado se dispone de muy poca información técnica de los vehı́culos
construidos.
De esta forma, se eligió el controlador PID para definir una
solución básica. Debido a sua teoria establecida y las propriedades
de análisis, este tipo de controlador es adecuado para generar un
padrón de comparación.
Proyecto de controladores
Para proyectar el controlador se utilizaran modelos linearizados del
triciclo.
A partir de la linearización del modelo en torno del punto de
equilibrio φ = 0 (vehı́culo moviendose en linha reta, con valores
nominales de los parametros) se obtuvieron funciones de
transferencia para diferentes velocidades, criando un mapa de
relaciones entre la entrada (giro aplicado δ) y la salida (ángulo de
inclinación φ) para pequeños valores de inclinación.
La tabla siguiente muestra las funciones de transferencia obtenidas
para diferentes velocidades entre 5m/s y 29m/s, junto con la
ganancia del modelo linearizado.
Proyecto de controladores
(FT’s) obtenidas por linearización.
Vel. (m/s)
Ganancia de la FT Función de transferencia
5
583,48
7
717,60
9
896,43
13
1388,20
15
1701,15
17
2058,80
21
2908,23
23
3400,00
25
3936,48
29
5143,56
(s+0,79)
(s+123,10)(s−2,28)(s+1,42)
(s+0,90)
(s+89,62)(s−2,49)(s+1,28)
(s+0,93)
(s+71,14)(s−2,71)(s+1,15)
(s+0,87)
(s+51,51)(s−3,14)(s+0,95)
(s+0,82)
(s+45,72)(s−3,35)(s+0,87)
(s+0,76)
(s+41,34)(s−3,56)(s+0,80)
(s+0,67)
(s+35,21)(s−3,95)(s+0,68)
(s+0,63)
(s+32,98)(s−4,13)(s+0,64)
(s+0,59)
(s+31,14)(s−4,31)(s+0,60)
(s+0,52)
(s+28,26)(s−4,63)(s+0,53)
Proyecto de controladores
La figura muestra graficamente los resultados de la tabla anterior,
exibiendo la evolución de los polos y ceros del sistema de acuerdo
con la velocidad del vehı́culo.
Proyecto de controladores
La figura detalla los polos y ceros próximos al origen.
Proyecto de controladores
En esta figura se observa la variación de la ganancia.
Proyecto de controladores
Para el cálculo del controlador se utilizo la función de transferencia
para la velocidad de 15m/s, valor medio de la faja de velocidades
esperada.
Proyecto de controladores
El controlador PID deseado debe estabilizar el sistema obedeciendo
las seguintes especificaciones para la respuesta en lazo cerrado:
Tiempo de estabilización (5%) ≤ 1,5 segundos;
Sobreseñal máximo ≤ 20%;
Error en regimen nulo para entradas del tipo escalon.
Para atender las condiciones el sistema en lazo cerrado debe tener
sus polos localizados próximo al punto −2 ± 4i .
Un controlador adecuado para la aplicación no debe presentar
variaciones rápidas en el control y en el ángulo de inclinación, lo
que causarı́a desconfort para los pasajeros.
Proyecto de controladores
La entrada al controlador es la diferencia entre la inclinación
medida φ y la inclinación deseada φd , y su salida será el ángulo de
giro aplicado en el vehı́culo.
Para este trabajo, el controlador propuesto tiene dos grados de
liberdade: el controlador C (s) y un filtro de referencia F (s). (*)
Proyecto de controladores
Ajustando el controlador C (s) para atender las especificaciones,
junto con el filtro de referencia F (s) para eliminar el efecto del cero
dominante, se modifica el lugar de las raı́ces del sistema resultando
en el grafico mostrado en la figura, donde las linhas negras limitan
una area (em blanco) donde se deben localizar los polos.
Proyecto de controladores
Para detallar el comportamiento dominante del sistema, se puede
observar el diagrama de polos y ceros en la figura. En esta se
puede ver que el camino recorrido por los polos atiende los
requisitos. El cero dominante, localizado en aproximadamente −2,
será eliminado por el filtro de referencia, reduciendo el valor de
sobreseñal de la respuesta.
Proyecto de controladores
El controlador C (s) obtenido es:
C (s) = Kc
(s + 2, 05)(s + 5, 75)
s(s + 20)
(159)
y el filtro de referencia F (s) con ganancia estatica unitaria se
define por la ecuación:
F (s) =
2, 05 (s + 5)
5 (s + 2, 05)
(160)
Propuesta: (proyectar un control para el modelo a baja velocidad y
verificar el comportamiento a alta velocidad y vice versa)
Proyecto de controladores
Debido a la ganancia variable del sistema, la ganancia Kc del
controlador no debe ser constante mas una función de la velocidad
del vehı́culo (Kc (u)), para que los polos permanezcan en los
lugares designados y atiendan los requisitos para toda la faja de
velocidad.
Ası́ la ganancia variable del controlador irá compensar los cambios
de ganancia del sistema debido a variaciones de velocidad del
triciclo.
Esta ganancia será definida por una función continua, evitando ası́
efectos indeseados que puedan aparecer caso sea utilizada una ley
de control con discontinuidades que alternen diferentes ganancias
de acuerdo con la velocidad.
Proyecto de controladores
La tabla siguiente muestra los valores de las ganancias del
controlador Kc (ui ) para las velocidades puntuales vi que
mantienen los polos del sistema dentro de las especificaciones
deseadas para los modelos linearizados en diferentes velocidades.
ui
5
7
9
13
15
17
19
21
23
25
27
29
Kc (ui )
8,5
5,14
3,45
1,61
1,16
0,91
0,71
0,57
0,46
0,36
0,318
0,267
Proyecto de controladores
Aplicando la transformación de la ecuación (161), los puntos de
Kc (ui ) pueden ser linearizados, resultando en una ganancia del
controlador (Klc (ui )).
Klc (ui ) = p
1
Kc (ui )
(161)
Proyecto de controladores
Aproximando la función discretizada Klc (ui ) por una recta,
podemos extender la función de los puntos discretos ui para todas
las velocidades u. La función de la recta que describe mejor el
ganancia para los puntos obtidos es la de la ecuación (162):
Klc (u) = −0, 061352 + 0, 0674u
(162)
Proyecto de controladores
Utilizando las ecuaciones (161) y (162) es fácil calcular el valor
efectivo de la ganancia del controlador Kc (u), resultando en la
ecuación (163).
Kc (u) =
1
(Klc (u))2
(163)
Proyecto de controladores
El diagrama de bloques del controlador PID con compensación
estática de la no-linealidad propuesto es el de la figura.
Proyecto de controladores
Para verificar numericamente la validad de la ley de control
propuesta, se combinaron el controlador y el filtro de referencia
presentados junto con cada uno de los trece modelos linearizados
obtenidos y se analizo el diagrama de polos y ceros de cada uno
dos sistemas resultantes, verificando que el sistema es estable para
todas las situaciones y que los polos del sistema se encuentran en
las posiciones deseadas.
Proyecto de controladores
Control por realimentación linearizante
entrada-salida
Ahora será sintetizado un controlador por realimentación
linearizante entrada-salida parcial, que actúe en el giro del vehı́culo
de forma a estabilizar su ángulo de inclinación.
Proyecto de controladores
En primer lugar se debe transformar el sistema a ser controlado en
una representación de estados a partir de las ecuaciones dinámicas
en la forma M(q)q̈ + C q̇ + K (q, q̇)q = F (q, q̇).
Se puede hacer esto pre-multiplicando el sistema por la matriz
M −1 obteniendo,
M(q)−1 [M(q)q̈ + C q̇ + K (q, q̇)q] = M(q)−1 [F (q, q̇)]
q̈ + Ca q̇ + Ka (q, q̇)q = Fa (q, q̇)
con Ca = M(q)−1 C , Ka = M(q)−1 K (q, q̇) e Fa = M(q)−1 F (q, q̇).
Proyecto de controladores
Para el caso del modelo de la bicicleta, la transformación es
simples y se da de forma directa, con x1 = φ, x2 = φ̇ e x3 = u.
ẋ1 = x2
cos(x1 ) 2
x3 δ(t)
lh
2nTm (t)ηT
1
−
Cxx32 Aρ
dm
2m
ẋ2 = gsin(x1 ) +
ẋ3 =
Proyecto de controladores
Para el modelo del triciclo, el cálculo de la inversa de M(q) se
verifico complejo pues al contrario del modelo de la bicicleta, la
matriz de inercia del triciclo no es diagonal y es una función de los
estados del sistema. Asi, M(q)−1 es una expresion demasiado
grande para ser trabajada sin el auxilio de sistemas
computacionales.
Proyecto de controladores
La representación de estados del sistema del triciclo tiene como
base el vector de estados aumentado,
qa = (x, ẋ, y , ẏ , z1 , ż1 , z2 , ż2 , z3 , ż3 , z4 , ż4 , ψ, ψ̇, φ, φ̇, θ, θ̇).
El objetivo de controlar apenas la variable φ hace con que a
técnica de control por linearización parcial sea adecuada.
Una vez que el sistema representado por variables de estados ya se
encuentra en la forma adecuada dada por la ecuación,
ẋ = Ax + Bγ(x)[u − α(x)]
(164)
se debe probar que a función γ para el estado φ es invertible en
todo su dominio.
Proyecto de controladores
El subsistema que representa la dinámica de la inclinación del
vehı́culo (tanto para a bicicleta quanto para el triciclo) puede ser
representado en una forma compacta como:
ẋ1 = x2
ẋ2 = f (x) + g (x)u
y
= x1
con x1 = φ, x2 = φ̇, siendo x el vector de estados y u la entrada
del sistema.
Proyecto de controladores
La figura muestra el diagrama de bloques que representa el
subsistema de la dinamica de inclinación del vehı́culo junto con el
control linearizante.
Proyecto de controladores
Tomando como salida a variable x1 = φ y calculando ẏ e ÿ se
obtiene el grado relativo del sistema ρ = 2. Tomando por base la
ecuación,
y (2) =
∂(Lf h(x))
[f (x) + g (x)u] = L2f h(x) + Lg Lf h(x)u
∂x
(165)
que lineariza el sistema, se obtiene:
u=
1
Lg Lρ−1
h(x)
f
[−Lρf h(x) + v ]
con
L2f h(x) = f (x)
Lg Lf h(x) = g (x) 6= 0
(166)
Proyecto de controladores
Utilizando el resultado anterior y el controlador por realimentación
propuesto por la ecuación (166), se consigue linearizar el sistema y
se obtiene el mapa entrada-salida.
φ̈ = v
(167)
Garantizando que la referencia r y sus derivadas sean limitadas, y
realizando la transformación de variables para incluir la dinamica
del error, se puede proyectar la ley de control v que satisfaga los
requisitos del sistema.
Proyecto de controladores
Se debe elegir v de forma a tornar la dinamica del sistema linear
estable y que su respuesta sea rapida y sin oscilaciones, que son
caracteristicas deseadas para el triciclo.
Para tal, debido a la presencia de perturbaciones y de errores de
modelado, se propone un controlador por realimentación de
estados con integrador.
Proyecto de controladores
La figura muestra el diagrama de bloques de la estrutura del
sistema linearizado con el controlador por realimentación de
estados e integrador para rastreamiento de referencia.
Proyecto de controladores
A partir de la figura y considerando x los estados del sistema, ∆
los estados del integrador, Ke la ganancia de realimentación de los
estados y Ki la ganancia de realimentación del integrador, se puede
obtener una representación de estados del sistema aumentado que
relaciona la entrada de referencia r y la salida medida y .
x
ẋ
B
0
A 0 x
˙ = −C 0 ∆ + 0 u + I r , u = − |Ke {z Ki } ∆
∆
|{z}
|{z}
| {z }
Ka
Aa
Ba
Ea
(168)
Proyecto de controladores
El problema de control del sistema se resume a definir las
ganancias de la matriz Ka tal que el sistema realimentado
ẋa = (Ax − Ba Ka )xa + Ea r
(169)
sea estable y para tal se pueden usar diversas técnicas.
En este caso se opto por la tecnica conhecida como LQR. Esta
tecnica se basea en la minimización de criterios cuadráticos,
associados a la energia de los estados y de la variable de control
del sistema que esta siendo proyectado.
Proyecto de controladores
Considerando el sistema realimentado dado por la ecuación (168)
se desea minimizar una función costo, que representa la energia del
sistema, definida por la función J:
R∞
J = min 0 z(t)T z(t)dt
u(t)
T xa (t)
Q
T
z(t) z(t) =
u(t)
NT
N
R
xa (t)
u(t)
com Q, R e N matrizes de ponderación para xa (t) e u(t).
(170)
Proyecto de controladores
Los elementos de la matriz Q deben ser mayores caso la prioridad
sea minimizar la energia de los estados, lo que representará
menores oscilaciones del sistema.
El cálculo del controlador LQR resuelve la ecuación (170),
minimizando la función.
Se puede probar que, si existe un minimo de la función, entonces
existe una función de Lyapunov P definida positiva con sua
derivada Ṗ negativa, garantizando la estabilidade del sistema.
Proyecto de controladores
Se puede resolver el problema de minimización de una función
costo através de la ecuación de Riccati, obteniendo los valores de
Ka .
Su resolución analitica puede ser complicada, con la complexidad
aumentando de acuerdo con la dimension del problema.
Sin embargo, existem métodos computaciónais eficientes para sua
resolución.
Proyecto de controladores
En este caso se uso la función lqr() del software Matlab, disponible
en la biblioteca Control System Toolbox.
Dadas las matrizes del sistema Aa , Ba y las matrizes de
ponderación Q e R, la función encuentra la solución para la
ecuación de Ricatti (si esta existe), y retorna los valores de Ka que
minimizan J.
Se puede modificar la respuesta del sistema modificando las
matrizes Q e R.
Proyecto de controladores
En este caso los valores de Q e R fueron definidos de forma
empı́rica, ajustando los valores de las matrices de ponderación y
observando los resultados en un proceso iterativo de forma a
obtener una dinámica mas rápida. Los valores obtenidos fueron:


0, 2 0 0
Q =  0 2 0  , R = 0, 001
(171)
0 0 12
y las ganancias calculados para el controlador fueron
Ke = [102, 4 46, 9] e Ki = [−109, 54].
Proyecto de controladores
Control por Energy Shaping
En esta sección se usa el modelado de las energias cineticas T y
potenciales V del sistema para sintetizar un controlador basado en
Energy Shaping que estabilize el sistema.
Para esto vamos usar las ecuaciones de energia de una bicicleta.
La bicicleta incorpora las caracterı́sticas dinámicas de un pendulo
invertido, problema similar al encontrado en el triciclo.
Proyecto de controladores
Controlador Proporciónal-Derivativo basado
en passividade
El controlador PD basado en pasividad tiene una componente
representando energia potencial Vc (q) y una componente para a
disipación de energia Fc (q̇). Para que el sistema en lazo cerrado
sea globalmente estable es necesario que:
La energia potencial deseada del sistema en lazo cerrado Vd ,
dada por la ecuación:
Vd (q) , V(q) + Vc (q)
(172)
tenga un unico punto de minimo global en q = q∗ (constante)
y sea radialmente ilimitada.
La función de disipación Fc satisfaga:
∂Fc
∂Fc
(0) = 0 y, q̇
> 0, ∀q̇ 6= 0
∂ q̇
∂ q̇
(173)
Proyecto de controladores
Siguiendo esas consideraciones en la elección del controlador se
puede probar que el sistema es globalmente asintoticamente
estable.
Para el caso del triciclo y de la bicicleta, se analizara apenas la
estabilidade del ángulo de inclinación φ.
Proyecto de controladores
Definiendo la acción de control uc en función de la energia
potencial del controlador Vc (q) y de un elemento de disipación del
controlador Fc (q̇) de acuerdo con a ecuación (174):
uc = −
∂Vc
∂Fc
(q) −
(q̇)
∂q
∂ q̇
(174)
tenemos que, con la elección adecuada de las funciones de energia
potencial y de disipación deseadas, se obtiene el control a partir de
las ecuaciones (172), (173) y (174).
Proyecto de controladores
En la etapa siguiente, el modelo de la bicicleta será utilizado para
sı́ntesis de un controlador. Para el sistema en lazo abierto se
encuentran los puntos de equilibrio derivando la energı́a potencial
del sistema,
∂Vc (q)
=0
∂q
(175)
encontrando los puntos de equilibrio en φ = i π, i = ..., −1, 0, 1, ....
Derivando la ecuación (175) nuevamente podemos concluir sobre
la estabilidade de los puntos de equilibrio, siendo el sistema
inestable para φ = 0 y estable para φ = π.
Proyecto de controladores
Se necesita elegir una función candidata para Vd que modifique la
estabilidad del sistema y torne el punto de equilibrio deseado q∗ un
mı́nimo de la función.
Una función candidata es,
1
Vd (q) = kp q̃ 2
2
com kp > 0 e q̃ , q − q∗ .
(176)
Proyecto de controladores
De forma semejante se puede elegir la función de disipación
deseada del sistema que satisfaga las ecuaciones
q̇ T
∂Fc
≥ α k q̇c k2
∂ q̇
(177)
y (173). La función propuesta para este caso es la dada por la
ecuación (178):
1
(178)
Fd (q̇) = kd q̇ 2
2
con
Fd (q̇) , F(q̇) + Fc (q̇)
(179)
y kd > 0.
Proyecto de controladores
Esta elección de funciones permite reescribir la ecuación (172)
como:
∂Fc
∂
(V(q) − Vd (q)) −
(q̇)
(180)
u=
∂q
∂ q̇
siendo que la primeira parte del control es responsable por el energy
shaping del sistema y la segunda parte adiciona amortiguamiento.
El control estabilizante calculado por la ley de control propuesta se
obtiene manipulando 179 y substituyendo (105), (176), (178) en
(180), que resulta en:
u = −kp (q − q∗ ) − mghsin(q) − kd (q̇ − q̇∗ )
(181)
Proyecto de controladores
El control propuesto estabiliza el sistema, tornandolo globalmente
asintoticamente estable. Sin embargo pueden haber errores en la
modelado del sistema.
En este caso se consideraron errores en el modelado de la massa m
y en la altura del centro de gravedad h. Ademas de este efecto, se
consideraron perturbaciones actuantes en el sistema que generan
torques que afectan su comportamiento.
En estas condiciones, aunque las propiedades entrada-salida no se
alteren, no se considera mas el sistema como globalmente
asintoticamente estable en el punto de equilibrio deseado (q 6= q∗ ).
Proyecto de controladores
Adicionando un integrador al control se pueden corrigir los desvios
causados por los errores de modelado y por las perturbaciones,
haciendo con que el sistema vuelva a seguir la referencia deseada.
El integrador es el elemento pasivo mais simples que puede ser
incorporado, y su combinación en paralelo con el controlador PD
propuesto tambien resulta en un sistema pasivo.
Proyecto de controladores
La ley de control que se obtiene para el sistema es,
uT = −kp (q − q∗ ) − mghsin(q) − kd (q̇ − q̇∗ ) − ki ∗ (q − q∗ ) (182)
con kp = 25000, kd = 2500, ki = 15000 y mgh = 4905, ganancias
estas obtenidas de forma empirica, que tornan la respuesta
dinámica del sistema semejante a la obtenida para el controlador
PID.
El control uT genera los torques que estabilizan el sistema.
Proyecto de controladores
Esta variable debe ser convertida en giro, entrada real para el
sistema triciclo, através de la transformación:
δ=
uT l
cos(φ)mhu 2
(183)
com l siendo el largo del vehı́culo, h la altura del centro de
gravedad, m la masa del vehı́culo y u su velocidad longitudinal.
Esta función se obtiene através de la ecuación (101), que relaciona
el momento generado por el giro con el ángulo δ.
Proyecto de controladores
Hasta aqui se mostraron los passos utilizados para sintetizar los
controladores PID con compensación estática de la no-linealidad,
realimentación linearizante y Energy Shaping.
Los controladores fueron proyectados para rechazar perturbaciones
no medibles del tipo escalon.
El controlador PID se ajusto a partir de la linearización del sistema
nominal en torno de un punto deseado, y se propuso un
controlador con dos grados de liberdade para atender requisitos de
performance.
Proyecto de controladores
El controlador por realimentación linearizante se aplico apenas en
una parte del sistema (linearización parcial), obteniendose
linearización entrada-salida. Em seguida se estabilizo el sistema
através de realimentación de estados con integrador, con ganancias
de realimentación calculadas através del processo de minimización
de la energia (LQR).
El controlador por Energy Shaping se baso en la formulación
lagrangeana del modelo del triciclo, modificando las energia
potencial y a función de disipación del sistema y adicionando un
termino integral para corregir perturbaciones y variaciones
parametricas.
Descargar