Minicurso de modelado y control de un vehı́culo inestable. Nestor Roqueiro Departamento de Automación y Sistemas Universidade Federal de Santa Catarina Florianópolis - SC Brasil CX Postal 476 CEP: 88040-900 Fone: ++55 48 3721 7607 E-mail: [email protected] Colaboración en figuras, textos y proyecto: Prof. Rodrigo de Souza Vieira Ms.C. Marcelo G. de Faria 2012 Sumario Introdución 2 Modelado de un vehı́culo inherentemente inestable. Cinematica Dinámica Modelado de un Vehı́culo de Tres Ruedas Inclinable Modelo simplificado de una bicicleta Semejanzas entre bicicleta y triciclo 3 El Problema de Control. Fundamendación Teórica 1 Control no-linear por realimentación linearizante entrada-salida Seguimento de trayectória Control no-linear via Energy Shaping Proyecto de controladores Controlador de velocidad Generación de referencia PID con compensación estática de la no-linealidad Control por realimentación linearizante entrada-salida Control por Energy Shaping Introdución Inicialmente serán abordados dos temas que se complementan en el análisis de los movimientos de un vehı́culo, la ”Cinemática” y la ”Dinámica”. Basicamente estos son conceptos que se pueden estudiar separadamente, sin embargo su aplicación en conjunto es extremamente productiva, tanto del punto de vista de análisis del comportamiento del vehı́culo, como del punto de vista de control. Introdución La cinemática permite el estudio del movimiento, velocidades y aceleraciones, y la dinámica permite evaluar ademas de estas, también las fuerzas contempladas. Ası́ se puede, de forma bien simple, delimitar la cinemática para problemas en los cuales la trayectoria es el principal punto en cuestión siendo que la dinámica se destina al estudio de los problemas donde las fuerzas y momentos relacionados son el objeto de estudio. Introdución Hay que considerar que cuando se habla de aspectos de movimiento del vehı́culo se debe tener conciencia de como este movimiento se realiza. En este caso, que actuadores se utilizan para realizar el movimiento. Los vehı́culos presentan diferentes posibilidades de movimiento, lo que los divide en dos grandes grupos; Los que se mueven por elementos de rodamiento, Los que se mueven por elementos alternativos. Introdución En el primer caso están los vehı́culos que utilizan como elementos de locomoción: ruedas esteras esferas. En el segundo caso, están los vehı́culos que se mueven por piernas y pistones. Introdución Es importante observar que el modelo empleado como actuador de movimiento del vehı́culo tendrá impacto directo en el estudio de su cinemática y de su dinámica. Otros puntos también importantes a ser considerados son a capacidade de locomoción deseada para el vehı́culo y la facilidad de fabricación. En el caso de los vehı́culos con piernas, su fabricación y el modelo cinemático/dinámico son mas complejos que los de los vehı́culos con ruedas, sin embargo su capacidade de movilidad en terrenos accidentados supera cualquier otro tipo de actuador. Conceptos básicos de Cinematica Conceptos básicos de Cinematica Conceptos básicos de Cinematica Antes de un análisis mas profundo sobre los aspectos cinemáticos, es interesante introducir algunos conceptos básicos, como por ejemplo el concepto de grados de libertad de un vehı́culo. Son considerados grados de libertad la diferencia entre el número de variables que definen el problema (n), y el número de equaciones que definen las restricciones (m). Vale resaltar también que el número de grados de libertad es fijo para cada tipo de problema, siendo función única y exclusivamente del problema en si. Conceptos básicos de Cinematica Imaginando por ejemplo una partı́cula en el plano XY, podemos decir que se puede definir su posición por la ecuación de restricción: x2 + y2 = R2 (1) Para R la distancia de la partı́cula hasta el origem del sistema de coordenadas siendo x e y las coordenadas instantáneas en el plano. De esta forma, existe una ecuación (m = 1) y dos variables (n = 2), lo que define un grado de libertad (n − m). Conceptos básicos de Cinematica Si un sistema tiene un conjunto de n variables y un conjunto de m ecuaciones de restricción en la forma: ϕj = (q1 , q2 , q3 , ..., qn , t) = 0 (2) Para: j = 1, 2..., m. estas restricciones se denominan Restricciones Holonómicas, y se puede resolver el problema considerando la existencia de (n − m) grados de libertad. Conceptos básicos de Cinematica Por otro lado, existen problemas en que ecuaciones de restricción se definen en función de las derivadas de las coordenadas y del tiempo, dadas de forma general como: n X aij dqi + aij dt = 0 (3) i =1 Para j = 1, 2..., m, y aij función de las coordenadas qi y del tiempo. En este caso, se dice que el conjunto de ecuaciones forma un conjunto de Restricciones No Holonómicas. De forma general, sistemas holonómicos son denominados integrables, mientras que los no holonómicos no lo son. Cinematica de los cuerpos rı́gidos Cinematica de los cuerpos rı́gidos Cinematica de los cuerpos rı́gidos El estudio de la cinemática clásica se divide en dos grandes grupos, el de la cinemática de la partı́cula y el de la cinemática de los cuerpos rı́gidos, ambos focalizados en el análisis de las posiciones, velocidades y aceleraciones en relación al tiempo. Mientras el primero se refiere al estudio de la trayectoria de puntos en el espacio, el segundo se restringe a cuerpos rı́gidos, sin considerar los efectos de masa. Cinematica de los cuerpos rı́gidos En el movimiento de un cuerpo rı́gido, existen dos tipos distintos de desplazamiento: translación rotación. En la translación, ocurre el desplazamiento del cuerpo rı́gido de tal forma que, dados dos puntos cualquiera, uniéndolos por un vector, este mantiene la misma dirección, sentido y módulo, en relación a un dado sistema de coordenadas, Cinematica de los cuerpos rı́gidos Matematicamente, dado un punto cualquiera del cuerpo denominado de punto A, unido al punto B, por medio del vector rAB , se puede dar la posición de este último punto como: rB = rA + rAB (4) Derivando la ecuación (4) en relación al tiempo se obtiene: drB drA drAB = + dt dt dt (5) Cinematica de los cuerpos rı́gidos Se puede observar que el vector rAB se mantiene constante la lo largo del tiempo, pues en la cinemática se considera el concepto de cuerpo rı́gido, asi, la componente drAB /dt es nula, de forma que: drA drB = dt dt vA = vB Dado que vA es la velocidad de translación del punto A, vB la velocidad de translación del punto B, se concluye que en un movimiento de translación todos los puntos de um cuerpo mantienen la misma velocidad y consequentemente la misma aceleración. (6) Cinematica de los cuerpos rı́gidos El movimiento de rotación por su vez, hace posible que la posición angular del cuerpo se altere, de tal forma que dados dos puntos unidos por un vector este modifica su dirección en relación a un dado sistema de coordenadas, desde que no sea paralelo ou coincidente con el eje de rotación. Cinematica de los cuerpos rı́gidos Siguiendo el mismo raciocinio dado para la translación de cuerpo rı́gido, admitiendo dos puntos cualquiera A y B, unidos por un vector rAB . Sabiendo también que el punto A está a una distancia dA del eje de rotación tal que el vector rA pueda ser dado en coordenadas polares como: θA rA = (7) dA Para θA el ángulo a partir del origem del sistema de coordenadas polares. Aplicando ahora una rotación δ al vector ra , su nueva posición pasa a ser: θA + δ rA = (8) dA Cinematica de los cuerpos rı́gidos Derivando la nueva posición en relación al tiempo, tenemos: dθA dδ + drA dt dt (9) = ddA dt dt Como el ángulo θA no varia la lo largo del tiempo pues se trata de la posición inicial del punto A, y tampoco el módulo de dA , la unica variación será del ángulo δ, que pasa la ser llamada de velocidad angular (dδ/dt) del punto A. Cinematica de los cuerpos rı́gidos Dado que el punto B dista del eje de rotación dB y adoptando el mismo raciocinio, de forma que la variación de la posición para este punto se da por: dθ dδ B + drB dt dt = (10) ddB dt dt Se llega la la conclusión de que para un movimiento de translación la velocidad linear es constante, mientras que para un movimiento de rotación la velocidad angular es constante para todos los puntos. Cinematica de los cuerpos rı́gidos Observando que la velocidad angular es dada como ω = Vr , donde r es el radio de giro, se puede admitir que para los puntos dados: V A = ω · dA V B = ω · dB (11) De esta forma, la velocidad linear de los puntos A y B seran iguais apenas cuando los puntos esten equidistantes del eje de giro, o sea si el vector rAB es paralelo u ortogonal al eje de rotación. Para cualquier otro caso, las velocidades serán diferentes. Cinematica de los cuerpos rı́gidos Se puede también hacer la misma representación por coordenadas cartesianas, de forma que sean relacionadas a las polares por las ecuaciones: x = cos θ · d y = sin θ · d (12) Utilizando matrices de transformación Utilizando matrices de transformación Utilizando matrices de transformación Una forma bastante facil de manipular los valores en una análisis cinemática es hacerlo por medio de la álgebra linear. Para rotacionar un cuerpo en relación a un eje cualquiera, es suficiente determinar la matriz de rotación y aplicarla la los vectores de posicionamento de los puntos, conforme mostrado anteriormente. De la misma forma, en el caso de translación, basta determinar la matriz necesaria para que se ejecute el movimiento . A este tipo de matriz, se le da el nombre de Matriz de Transformación. Utilizando matrices de transformación La aplicación de tales matrices será demostrada en el plano XY, comenzando por la de translación, conforme mostrado en la figura. En este caso, el punto A pasa de una posición rA para uma posición rA + dA . Analizando los componentes de los vectores, se verifica que en coordenadas homogéneas son dados por: en el plano como: rAX r rA = AY 1 rAX + dAX r + dAY ; rA + dA = AY 1 (13) Utilizando matrices de transformación De esta forma, se concluye que la matriz que lleva el punto A de la posición 1 para la posición 2, de la figura anterior, es dada por: 1 0 dAX (14) Mtrans = 0 1 dAY 0 0 1 Ası́, el punto A en la posición 2 será dado como: rA2 = Mtrans · rA1 1 0 dAX rA2 = 0 1 dAY 0 0 1 (15) rAX · rAY 1 Utilizando matrices de transformación Ya para el caso de una rotación en torno de un eje que pasa por el origem, conforme mostrado en la figura, la matriz de rotación será dada por: cos(δ) −sen(δ) 0 Mrot = sen(δ) cos(δ) 0 (16) 0 0 1 Utilizando matrices de transformación Al ocurrir una secuencia de movimientos que puedan ser separados en translaciones y rotaciones, se puede llegar rapidamente a un valor final a partir de la aplicación de las matrices de transformación, sin olvidar que el orden de las operaciones altera el resultado final. Si por ejemplo se aplica una rotación rot1 , una translación trans1 y una rotación rot2 , la posición final será dada por: r2 = Mrot2 · Mtrans1 · Mrot1 · r1 Cinemática aplicada la vehı́culos de tres ruedas Cinemática aplicada la vehı́culos de tres ruedas Cinemática aplicada la vehı́culos de tres ruedas Dada la sucinta presentación de la teorı́a, se puede ahora aplicar a un ejemplo práctico de determinación de posición de un vehı́culo con tres ruedas, conforme mostrado en la figura. Cinemática aplicada la vehı́culos de tres ruedas En este caso, si el vehı́culo se mueve del punto 1 hasta el punto 2, su desplazamiento pasa la ser descripto como la variación da posición del punto A de rA1 la rA2 , que de forma matricial puede ser: rA2 = M · rA1 (17) Cinemática aplicada la vehı́culos de tres ruedas Analizando el vector rAB , mostrado en la figura siguiente, se nota que hubo una rotación y una translación de forma que se paso de un estado 1 para un estado 2. Cinemática aplicada la vehı́culos de tres ruedas Para describir este cambio de posición en primer lugar se debe observar que las matrices de transformación definidas en la sección anterior son deducidas a partir del origem, asi, antes de mas nada el vector rAB necessita ser transladado del estado 1 para el origem, rotacionado y depues transladado para la posición en el estado 2. Cinemática aplicada la vehı́culos de tres ruedas Ası́, dado que: rA1 Se obtiene: rAx1 r = Ay 1 1 y rA2 rAx2 r = Ay 2 1 rAB2 = Mtrans2 · Mrot1 · Mtrans1 · rAB1 (18) (19) Cinemática aplicada la vehı́culos de tres ruedas Para Mtrans1 la matriz translación que mueve el punto A para el origem, Mrot1 la matriz rotación que rotaciona el vector rAB1 en la dirección de rAB2 y Mtrans2 la matriz translación que coloca el punto A del vector rAB2 en la posición rA2 , y substituyendo los valores da: rAB2 1 0 rAx2 = 0 1 rAy 2 0 0 1 cos(δ) −sen(δ) 0 1 0 −rAx1 · sen(δ) cos(δ) 0 · 0 1 −rAy 1 0 0 1 0 0 1 ·rAB1 (20) Cinemática aplicada la vehı́culos de tres ruedas Analizando la ecuación (20) se observa que el orden de las operaciones se de la de la derecha para la izquierda, de forma que en primer lugar se coloca el vector rAB1 en el origem del sistema (por eso el signo negativo en rAx1 e y rAy 1 ). Cinemática aplicada la vehı́culos de tres ruedas Sin embargo, observando el problema anterior, no se describe la trayectoria recorrida, se tiene apenas la definición de la posición inicial y final del objeto, pues no fueron adicionadas las restricciones debidas al movimiento de las ruedas, tópico que será abordado en la sección siguiente. Estimación de trayectoria Estimación de trayectoria Estimación de trayectoria Para estimar la trayectoria del vehı́culo es necesario determinar como será su modelo de giro y como forma de mostrar el concepto matemático, se presentan dos formas de hacer girar un vehı́culo. En primer lugar el concepto de un vehı́culo de esteras, donde la curva se de la por la diferencia entre la velocidad de cada una de sus esteras. Después será estudiado el modelo matemático cinemático para un vehı́culo con una rueda del tipo caster Estimación de trayectoria Imaginando se tratar de un vehı́culo conforme mostrado esquematicamente en la figura siguiente, admitiendo que las esteras se mueven en dirección contraria para efectuar el giro, el centro de giro será dado por el punto medio entre el punto central de contacto de las dos esteras, conforme definido por el punto CG en la figura. Estimación de trayectoria Cabe observar que el centro de giro es función de la geometrı́a de dirección del vehı́culo, siendo por lo tanto diferente para cada topologı́a de locomoción existente. Estimación de trayectoria Sin embargo el giro en el propio centro de giro es muy especifico, siendo mas adecuada la formulación para una trayectoria cualquiera. De esta forma, admitiendo que la velocidad longitudinal (v ) es constante, asi como el radio de la curva (rC ), para un cierto centro de curva (CC) cualquiera, conforme mostrado en la figura, la velocidad de cada estera pasa a ser definida la partir de la determinación de la distancia al centro de curva. Estimación de trayectoria Admitindo el centro de giro en el centro del vehı́culo, una vez que la simetria en relación al eje longitudinal es, en la mayoria de los casos, necesaria, podemos describir el movimiento de cada estera conforme las equaciones siguientes, admitiendo el indice I para la estera interna de la curva y II para la estera externa. b b vI = w · rc − ; vII = w · rc + (21) 2 2 Para b la distancia entre las dos esteras. Estimación de trayectoria Ahora, recordando que la velocidad longitudinal del vehı́culo v se mantiene constante y el radio de curva es conocido pues se desea salir de un punto actual para otro conhecido, se obtiene: w= v rc (22) Y substituyendo la ecuación (22) en las equaciones (21) se obtiene: b b vI = v · 1 − ; vII = v · 1 + (23) 2rc 2rc De esta forma se puede instantaneamente determinar la velocidad de cada estera, manteniendose el módulo de la velocidad linear constante. Estimación de trayectoria De forma general, se tiene una trayectoria donde el radio de curvatura es función del tiempo, y depende de la trayectoria pretendida, asi, se puede escribir genericamente la ecuación (23) como: b vI = v · 1 − 2r (t) (24) b vII = v · 1 + 2r (t) Estimación de trayectoria Esta misma metodologia se aplica a vehı́culos que tienen una rueda de tipo caster. Una rueda es llamada de caster cuando existe una distancia entre el su punto de fijación al chasis del vehı́culo y su eje de rotación, como puede ser visto en la figura. En función del movimiento aplicado al vehı́culo se genera un momento en relación la esta excentricidade que permite con que el ella gire, de forma que siempre se mantenga perpendicular al radio de la curva. Estimación de trayectoria En este caso, la rueda del tipo caster estará siempre con velocidad v mientras la rueda interna la la curva tendrá velocidad vI y la externa vII dadas por las equaciones (23), como mostrado en la figura. De esta forma, una buena forma de medir la velocidad longitudinal del vehı́culo es colocar un encoder en la propia rueda caster, considerando efectos de deslizamiento. Dinámica Dinámica de sistemas mecánicos con masas mobiles Dinámica A continuación se presentan sin demostración dos formulaciones diferentes utilizadas para el modelado de sistemas mecánicos, las Leyes de Newton y, el principio de d’Alembert y las ecuaciones de Lagrange. Dinámica Leis de Newton - Movimento de translación En primer lugar será considerado el movimiento de una partı́cula. Cuando la geometrı́a de un cuerpo rı́gido no influencia el movimiento de este cuerpo la masa puede ser considerada concentrada en un punto (punto de masa). Dinámica Las Leyes de Newton fueron formuladas de la siguiente forma: Primeira ley de Newton: para una masa puntual m moviendose la una velocidad v la cantidad de movimieno I es I = mv , y será constante si el sumatório de fuerzas aplicadas es nulo. Asi, si a una masa m se le aplica una fuerza esta continua en movimiento rectilı́neo uniforme. Segunda ley de Newton: Si una fuerza F actua sobre una masa m entonces: dI dmv = =F dt dt Si la masa es constante la expresión queda: m dv = ma = F dt Dinámica Tercera ley de Newton: Si un cuerpo ejerce una fuerza sobre otro, este ultimo ejerce una fuerza de igual magnitud y sentido contrario. Conocido como principio de ación y reacción. Si la masa puntual se puede mover sin restricciones esta tiene tres grados de libertad que corresponden a las tres coordenadas espaciales. Pero si se fuerza la masa puntual a moverse en una superficie o lı́nea entonces poseerá dos el un grado de libertad, respectivamente. Dinámica Cuando se fuerza un cuerpo a moverse en una superficie o una lı́nea aparecen fuerzas de restricción que son normales a la trayectoria. Habrá fuerzas aplicadas en la dirección del movimiento F(y ) independientes de las restricciones y fuerzas normales a la trayectoria F(z) Reformulando la segunda ley esta queda: ma = F(y ) + F(z) Dinámica Movimento de rotación Em un sistema de coordenadas cartesianas x, y , z se pueden definir los versores, ex , ey , ez Una fuerza F = Fx ex + Fy ey + Fz ez aplicada en un vector de coordenadas r = rx ex + ry ey + rz ez define un torque T=r×F Dinámica La magnitud del torque es: |T| = |r| |F| sen (ϕ) Dinámica Los versores están relacionados por: ex × ex ey × ex ez × ex = 0 = −ez = ey ex × ey ey × ey ez × ey = ez = 0 = −ex ex × ez ey × ez ez × ez = −ey = ex = 0 Por lo tanto se puede representar el torque por: T = r × F = (ry Fz − rz Fy ) ex + (rz Fx − rx Fz ) ey + (rx Fy − ry Fx ) ez T = Tx ex + Ty ey + Tz ez O como un determinante ex T = r × F = rx Fx ey ry Fy ez rz Fz Dinámica Si una masa puntual se mueve a lo largo de una trayectoria con velocidad v y la coordenada en relación al origen se da por el vector r entonces se puede definir momento angular como: L = r × I = r×mv Dinámica A partir de la segunda ley de Newton el torque es: r×m dv =r×F=T dt Derivando el momento angular en relación al tiempo se obtiene: dL d(r×mv) dt = dt v= dr dt ⇒ = dr dt ×mv dr dt ×mv + r×m dv dt =0⇒ dL dt = r×m dv dt = T O sea, la derivada del momento angular en relación la un sistema de coordenadas fijo en el espacio es igual al torque ejercido sobre la masa puntual. Dinámica Princı́pios de mecánica Cuando el sistema mecánico esta compuesto por varios cuerpos rı́gidos se necesita aplicar la ley de Newton a cada cuerpo considerando las fuerzas que mueven el cuerpo en la trayectoria y las normales a la trayectoria (restricciones). Posteriormente, las restricciones deben ser eliminadas operando con las ecuaciones de los otros cuerpos. Otro abordaje, mas adecuado para casos complicados se presenta la continuación. Dinámica Principio de d’Alembert La segunda ley de Newton para una masa constante puede ser escrita: F − ma = 0 Definiendo una fuerza ficticia (no Newtoniana) asociada la la aceleración, FT = −ma se obtiene que, FT + F = 0 Asi, la suma de las fuerzas aplicadas y de la fuerza de inercia es cero (equilibrio dinámico). Dinámica Las fuerzas que restringen el movimiento siempre deben ser definidas, asi, considerando las fuerzas de restricción del movimiento se obtiene que: ma = F(y ) + F(z) Las fuerzas de restricción son, por definición, perpendiculares a la trayectoria. Para un desplazamiento diferencial el trabajo realizado por estas fuerzas será cero. T δWn = F(z) .δr = 0 Dinámica Como ma = F(y ) + F(z) y entonces Definiendo T δWn = F(z) δr = 0 T δWn = F(y ) − ma δr = 0 δW = F(y ) T δr δWT = (FT )T δr = −maT δr Se obtiene que: δW + δWT = 0 Dinámica O sea, el trabajo virtual es nulo cuando se suma el trabajo realizado por las fuerzas aplicadas en la dirección de la trayectoria y el trabajo realizado por la fuerza de d’Alembert. Se debe resaltar que en esta formulación no aparecen explı́citamente las fuerzas de restricción. Dinámica En un sistema formado por varias masas puntuales con restricciones descripto por: (y ) mi r̈i = Fi (z) + Fi ; i = 1, . . . , n P (z) T δri = 0 Fi i T P (y ) δri = 0 Fi − mi r̈i i X (y ) T X δri + Fi −mi r̈iT δri = 0 |i {z δW } |i {z δWT } se puede aplicar el principio de d’Alembert, mostrando que es valido para sistemas de masas puntuales con restricciones, o sea, cuerpos rı́gidos. Dinámica Equaciones de Lagrange Para un sistema de masas puntuales el numero de ecuaciones de Newton es igual al numero masas puntuales. Se puede simplificar el trabajo de modelado utilizando coordenadas generalizadas y el principio del trabajo virtual. Las restricciones reducen el numero de grados de libertad de un sistema y a continuación se considera que la interconexión entre las masas puntuales es rı́gida. Dinámica La posición de cada una de las n masas puntuales se define por n vectores de coordenadas ri , i = 1, ..., n. Si existen r restricciones, entonces el sistema de n masas puntuales esta definido por f = n − r coordenadas generalizadas qj , j = 1, ..., f . Por lo tanto, una masa puntual tiene una posición dada por: ri = ri (q1 , . . . , qj , . . . , qf ) Dinámica Para reformular el principio de d’Alembert se calcula δri = X ∂ri ∂ri ∂ri δqf = δq1 + · · · + δqj ∂q1 ∂qf ∂qj j El trabajo virtual para n masas puntuales será: T P (y ) Fi − mi r̈i δri = 0 i ! T P P (y ) ∂ri Fi − mi r̈i =0 ∂qj δqj j i i X ∂ri X X (y ) T X ∂ri mi r̈iT δqj − δqj = 0 Fi ∂qj ∂qj j i j i {z } | {z } | δW δWT Dinámica Alterando el orden de los sumatorios se obtiene: XX X X (y ) T ∂ri ∂ri δqj − δqj = 0 mi r̈iT Fi ∂qj ∂qj j i j i | {z } | {z } δW δWT Y dado que: ∂ri T ∂ri T ∂ ṙi δq mi ṙiT ∂q j = mi r̈i ∂qj δqj + mi ṙi ∂qj δqj j ∂ ṙi ∂ri ∂ri d δqj = dt δqj − mi ṙiT ∂q δqj mi ṙiT ∂q mi r̈iT ∂q j j j d dt Aplicando la regra de la cadena X ∂ri δqj dri = dt ∂qj dt j Y derivando en relación q̇j se obtiene; ∂ṙi ∂ri = ∂ q̇j ∂qj Dinámica Y asi, ∂ri mi r̈iT ∂q δqj = j ∂ri δqj = mi r̈iT ∂q j d dt d dt ∂ri T ∂ ṙi δq mi ṙiT ∂q j − mi ṙi ∂qj δqj j 1 1 ∂ ∂ T T ṙ m ṙ − ∂q i i i ∂ q̇j 2 mi ṙi ṙi 2 j Dinámica La energia cinética de n masas puntuales es: P1 T Ek = 2 mi ṙi ṙi i P ∂ri d ∂Ek = dt mi r̈iT ∂q ∂ q̇j − j i ∂Ek ∂qj Dinámica Definiendo fuerza generalizada en la dirección qj X (y ) T ∂ri X d ∂Ek ∂Ek Fi Qj = ⇒ Qj − + δqj = 0 ∂qj dt ∂ q̇j ∂qj i j Como las coordenadas generalizadas son independientes cada sumando debe ser nulo, asi se obtiene: ∂Ek d ∂Ek − = Qj ; dt ∂ q̇j ∂qj Que son las ecuaciones de Lagrange j = 1, . . . , f Dinámica Considerando el trabajo virtual de las fuerzas aplicadas (y ) Fi se obtiene δW = X T (y ) Fi δri i y T (y ) P ∂ri ∂qj δqj j i P X T (y ) ∂ri Fi δqj ∂qj j i δW = δW = P Fi | δW = {z Qj P j Qj δqj } Dinámica Se puede calcular el trabajo virtual de las fuerzas aplicadas a partir de las fuerzas generalizadas y de los desplazamientos virtuales. Si existe una energı́a potencial asociada a las fuerzas aplicadas entonces δW = −δEp ∂E δEp (qi ) = ∂q1p δq1 + · · · + ∂E Qj = − ∂qpj d ∂Ek dt ∂ q̇j − ∂Ek ∂qj + ∂Ep ∂qj =0 ∂Ep ∂qf δqf = P ∂Ep j ∂qj δqj Dinámica Se define la función de Lagrange por L = Ek − Ep Como la energia potencial no depende de q̇j ∂Ep =0 ∂ q̇j E entonces la ecuación de Lagrange para sistemas conservativos es: d ∂L ∂L − = 0; dt ∂ q̇j ∂qj j = 1, . . . , f Para obtener las ecuaciones de movimiento es necesario explicitar la energia cinética y potencial en función de las coordenadas generalizadas y calcular las derivadas. Dinámica Forma matricial del sistema dinámico Si la posición de las masas no depende explı́citamente del tiempo, si las fuerzas son conservativas y si el sistema de coordenadas generalizadas no esta restringido la obtención de las ecuaciones dinámicas a partir de la formulación Lagrangeana es mas simple. A este tipo de sistemas de les denomina sistemas naturales (mas detalles en ”Methods of Analytical Dynamics”, Meirovitch, pg 77). Sin embargo podemos considerar fuerzas disipativas proporcionales a la velocidad (Función disipativa de Rayleygh, pg. 88) y aun asi obtener un modelado mas simple. Dinámica En este caso se pueden escribir las ecuaciones dinámicas como, Mq̈(t) + Cq̇(t) + Kq(t) = F(t) (25) Siendo M la matriz de inercia, C la matriz de amortiguamiento, K la matriz de rigidez, q el vector de grados de libertad y F el vector de excitación. Dinámica Se pueden calcular los elementos de M como: mij = ∂2T ∂ q̇i ∂ q̇j (26) De forma análoga se puede definir la matriz de amortiguamiento por: ∂2ℑ (27) cij = ∂ q̇i ∂ q̇j Y lo mismo sucede con la matriz de rigidez dada por: kij = ∂2U ∂qi ∂qj (28) Dinámica Se pueden incorporar otras caracterı́sticas al modelo a partir de las particularidades del problema a tratar y se pueden obtener modelos con diferentes grados de complejidad, cabiendo al modelador escoger el mas adecuado. Vehı́culo de Tres Ruedas Inclinable Modelado de un Vehı́culo de Tres Ruedas Inclinable Vehı́culo de Tres Ruedas Inclinable En este proyecto se utilizo un abordaje multicuerpo y el punto de partida para análisis pasa a ser la definición de las masas del modelo, RW– Rueda trasera MC MC– Chassis principal RFW– Rueda delantera derecha RW LFW RFW LFW – Rueda delantera izquierda Vehı́culo de Tres Ruedas Inclinable Para estos cuerpos, utilizaremos como sistema de coordenadas inercial uno con origen en el punto de contacto de la rueda trasera con el suelo. La dirección positiva de cada eje será respectivamente, para adelante, para la izquierda y para arriba, para los ejes X, Y y Z. Z Y X Vehı́culo de Tres Ruedas Inclinable A partir de estas definiciones determinaremos las velocidades de cada una de las masas del modelo, que cuenta con 9 grados de libertad, dado que consideramos que todos los cuerpos tienen movimientos verticales independientes permitiendo ası́ simular suspensiones. Movimiento longitudinal (x) Movimiento transversal (y ) Rotación eje Z (ψ) Movimiento vertical (z1 ) Rotación eje X (ϕ) Movimiento vertical (z2 ) Rotación eje Y (cuerpo principal) (θ) Movimiento vertical (z3 ) Movimiento vertical (z4 ) Obs: La rotación del cuerpo central en torno de su eje transversal provoca un momento interfiriendo en el comportamiento de las suspensiones delantera y trasera. Vehı́culo de Tres Ruedas Inclinable Ahora trabajaremos en la definición de las velocidades para cada uno de los cuerpos descriptos en la sección anterior y por lo tanto comenzaremos determinando las velocidades longitudinales en X , Y y Z , y angulares en relación la los referidos ejes. Vehı́culo de Tres Ruedas Inclinable Para la rueda trasera podemos iniciar a partir de la definición de las velocidades de la figura. w1 wz1 Z v1 h1 Y u1 X wy 1 wx1 En este caso observamos dos caracterı́sticas importantes. Primero, la rotación en el eje Z no produce ningún efecto en las velocidades de traslación pues el centro de masas está exactamente en el referido eje, sobre el origen del sistema. Vehı́culo de Tres Ruedas Inclinable Otra constatación es que si aplicamos una variación angular de ϕ en relación al eje X , surgen componentes de traslación, Z ϕ v1ϕ h1 w1ϕ De esta forma existe una velocidad en el plano Y − Z debida al movimiento rotativo en relación al eje X , que sale del papel, y que puede ser descompuesta en dos componentes. Vehı́culo de Tres Ruedas Inclinable Una componente en la dirección negativa de Y dada por: v1ϕ = h1 ϕ̇ cos(ϕ) (29) Y otra en la dirección negativa de Z dada por: w1ϕ = h1 ϕ̇sen(ϕ) (30) En relación a la rotación en torno del eje Y tendremos, u1α = h1 α̇ cos(α) (31) Y otra en la dirección negativa de Z dada por: w1α = h1 α̇sen(α) (32) ϕ v1ϕ Z h1 w1ϕ Vehı́culo de Tres Ruedas Inclinable Ası́ las velocidades longitudinales para la rueda trasera son: u1 = u + h1 α̇ cos(α) v1 = v − h1 ϕ̇ cos(ϕ) w1 = w1 − h1 ϕ̇sen(ϕ) − h1 α̇sen(α) (33) De la misma manera las velocidades angulares son dadas por: ωx1 = ϕ̇ ωy 1 = α̇ ωz1 = ψ̇ (34) Vehı́culo de Tres Ruedas Inclinable Seguimos el mismo raciocinio para el cuerpo central a partir de su geometrı́a básica. Z Y a2 h2 X En este caso, aplicando una rotación positiva en el eje X (ϕ) y en el eje Z (ψ), tendremos una modifcación de la velocidad transversal, una vez que el centro de masa no está sobre el eje de rotación del sistema de coordenadas. Vehı́culo de Tres Ruedas Inclinable Las componentes serán v2ψ = a2 ψ̇ (35) v2ϕ = −h2 ϕ̇ cos(ϕ) (36) y De la misma forma, la velocidad vertical será modificada por una rotación positiva en el eje X (ϕ), y estará definida por: w2ϕ = −h2 ϕ̇sen(ϕ) (37) Vehı́culo de Tres Ruedas Inclinable Ademas, observando la Figura podemos asegurar que la variación del ángulo (α) (inclinación del terreno) afectara las velocidades vertical y longitudinal del vehı́culo, de forma que, z θ h2 X a2 w2α q = − h22 + a22 α̇sen(α) u2α = q h22 + a22 α̇ cos(α) (38) (39) Vehı́culo de Tres Ruedas Inclinable Por lo tanto, las ecuaciones de las velocidades lineares para el cuerpo principal serán: q u2 = u + h22 + a22 α̇ cos(α) v2 = v + a2 ψ̇ − h2 φ̇ cos(φ) q w2 = w2 − h2 φ̇sen(φ) − h22 + (40) a22 α̇sen(α) con la velocidad w del vehı́culo como siendo la del cuerpo principal. Las velocidades angulares serán: z ωx2 = ϕ̇ ωy 2 = θ̇ + α̇ ωz2 = ψ̇ θ (41) a2 h2 X Vehı́culo de Tres Ruedas Inclinable Para la rueda delantera derecha tenemos desplazamientos con relación a los tres ejes, lo que significa decir que tendremos componentes debido a las rotaciones en las tres direcciones. Z Y X h4 h3 a4 b4 La velocidad en la dirección X será modificada por rotaciones sobre el eje Z e Y , u3α = u3ψ = b3 ψ̇ (42) q (43) h32 + a32 α̇ cos(α) Vehı́culo de Tres Ruedas Inclinable Para este caso las componentes de la velocidad transversal serán, v3ψ = a3 ψ̇ (44) v3ϕ = −h3 ϕ̇ cos(ϕ) (45) La velocidad vertical será modificada debido a la rotación en relación al eje X , w3ϕ = −h3 ϕ̇sen(ϕ) (46) y en relación al eje Y , q w3α = − h32 + a32 α̇sen(α) (47) Vehı́culo de Tres Ruedas Inclinable Ası́, las velocidades lineares para la rueda delantera derecha serán: q u3 = u + b3 ψ̇ + h32 + a32 α̇ cos(α) (48) v3 = v + a3 ψ̇ − h3 ϕ̇ cos(ϕ) q w3 = w3 − h3 ϕ̇sen(ϕ) − h32 + a32 α̇sen(α) De la misma forma las velocidades angulares serán: ωx3 = ϕ̇ ωy 3 = α̇ ωz3 = ψ̇ (49) Vehı́culo de Tres Ruedas Inclinable Para la rueda delantera izquierda el raciocı́nio es el mismo que para la rueda delantera derecha, apenas con el cambio de signo en la componente en el eje X y Z . De esta forma las componentes para esta masa son: q u4 = u − b4 ψ̇ + h42 + a42 α̇ cos(α) (50) v4 = v + a4 ψ̇ − h4 ϕ̇ cos(ϕ) q w4 = w4 − h4 ϕ̇sen(ϕ) − h42 + a42 α̇sen(α) De la misma forma, las velocidades angulares serán: ωx4 = ϕ̇ ωy 4 = α̇ ωz4 = ψ̇ (51) Definición de las energias Energia cinética Definidas las velocidades de las cuatro masas del modelo, ahora se deben determinar las energı́as cinética y potencial del vehı́culo. De la Dinámica se define energia cinetica para sistemas multicuerpos como: T = 1 2 1 2 4 P k=1 4 P k=1 4 P k=1 mk (uk2 + vk2 + wk2 )+ (Ix ωx2 )k + (Iy ωy2 )k + (Iz ωz2 )k − (Ixy ωx ωy )k + (Ixz ωx ωz )k + (Iyz ωy ωz )k (52) Substituyendo ahora los valores de las velocidades dadas por las ecuaciones 33, 34, 40, 41, 48, 49, 50 y 51 en la ecuación 52, obtenemos la ecuación de la enegia cinética. Definición de las energias Energia potencial En primer lugar se necesita determinar el termino debido a la deformación de los resortes de la suspensión del vehı́culo, que de forma general se define por: 1 Us = kδ2 2 (53) Con δ siendo la deformación del resorte y k siendo su constante de rigidez. Debemos considerar que el vehı́culo cuenta con tres ruedas y con un resorte actuando en cada una, de esta forma la energı́a potencial almacenada en los resortes será: 1 U1 = (k1 δ12 + k3 δ32 + k4 δ42 ) 2 (54) Definición de las energias Para definir la ecuación de la energı́a potencial, se debe tener en cuenta que la transferencia de carga de un eje para el otro promueve una tracción en el resorte de un eje al mismo tiempo que comprime los del otro. Definición de las energias Es interesante que relaciónemos la deformación en el resorte con el ángulo θ, que es una variable del modelo. δp θ a l tg θ = δ4p δ1p δ3p = = (l − a2 ) (l − a2 ) a2 (55) Para θ pequeño vale, θ= δ3p δ4p δ1p = = (l − a2 ) (l − a2 ) a2 δ3p = δ4p = −θ (l − a2 ) δ1p = θa2 (56) (57) Definición de las energias Por lo tanto la energı́a potencial debido la variaciones en θ y movimiento vertical del cuerpo principal será: Up = 12 (k1 (z2 − z1 + θa2 )2 + k3 (z2 − z3 − θ(l − a2 ))2 +k4 (z2 − z4 − θ(l − a2 ))2 ) (58) Definición de las energias La deformación de los neumáticos define los desplazamientos: δ1v = z1 , δ3v = z3 , δ4v = z4 , (59) Y la energı́a potencial asociada es, 1 (kp (z1 )2 + kp (z3 )2 + kp (z4 )2 ) 2 con kp siendo la constante de rigidez del neumático. Uv = (60) De esta forma, la energia almacenada en los sistemas elásticos es: U1 = Uv + Up (61) Definición de las energias Como no hay resistencia a la rotación en relación al eje X , tenemos también una caracterı́stica de péndulo invertido, cuja tendencia es del vehı́culo desplazarse angularmente en dirección al suelo. De esta forma, tendremos un termino de la energı́a potencial a partir de este efecto dado por: U2 = m2 gcos(α)h2 (cos(ϕ)) (62) Como la masa del cuerpo principal es mucho mayor que la de los demás cuerpos, admitimos su energı́a potencial como la del vehı́culo. Definición de las energias De esta forma la energı́a potencial total del sistema será la suma de las ecuaciones 61 y 62. U = 12 (k1 (z2 − z1 + θa2 )2 + k3 (z2 − z3 − θ(l − a2 ))2 + k4 (z2 − z4 − θ(l − a2 ))2 )+ 1 2 2 2 2 (kp (z1 ) + kp (z3 ) + kp (z4 ) )+ m2 gcos(α)(h2 + z2 )(cos(ϕ)) (63) Definición de las energias Finalizando con la definición de las energı́as, tenemos que definir la Función Disipativa de Rayleygh, que en su forma general es: n ℑ= n 1 XX cij q̇i q̇j 2 (64) i =1 j=1 Para cij la constante de amortiguamiento referida a las derivadas temporales de los grados de libertad qi y qj Definición de las energias Sabiendo que el vector de grados de libertad está dado por, qT = {x, y , z1 , z2 , z3 , z4 , ψ, ϕ, θ, }T (65) y que habrá amortiguamiento apenas en los amortiguadores, o sea, solamente en la dirección Z , podemos determinar los valores de cij como todos nulos, con excepción de c33 , c44 ,c55 , c66 y c99 , pues son estas variables que causan movimiento vertical. Definición de las energias Las velocidades que producirán disipación en los amortiguadores son: Amortiguador rueda trasera (ż2 − ż1 ) a2 θ̇ (66) Amortiguador rueda delantera derecha (ż2 − ż3 ) (l − a2 )θ̇ b3 φ̇ (67) Amortiguador rueda delantera izquierda (ż2 − ż4 ) (l − a2 )θ̇ b4 φ̇ (68) Definición de las energias De esta forma la función disipativa de Rayleygh es: ℑ = 21 c1 ((ż2 − ż1 )2 + (a2 θ̇)2 ) + 12 c3 ((ż2 − ż3 )2 + ((l − a2 )θ̇)2 + 21 c4 ((ż2 − ż4 )2 + ((l − a2 )θ̇)2 donde ci es la constante del amortiguador de la i-ésima rueda. (69) Definición de las fuerzas externas El próximo paso es la definición de las fuerzas externas actuantes en el vehı́culo que están representadas por el vector, F(t)T = {Fx , Fy , Fz1 , Fz2 , Fz3 , Fz4 , Mψ , Mϕ , Mθ }T (70) La fuerza Fi produce efectos en la i -ésima dirección, y el momento Mj en la j-ésima rotación. Definición de las fuerzas externas - Fx Fx Definición de las fuerzas externas - Fx Para un vehı́culo la fuerza máxima de tracción será dada por el producto de la carga normal (N) al suelo y por el coeficiente de rozamiento (f ) en la interface neumático-suelo, o sea: Ft max = Nf (71) El torque aplicado en la rueda no puede superar el torque maximo definido por Ft max . Por lo tanto podemos admitir que la fuerza de tracción varia de 0 hasta el valor de Ft max y, de esta forma, la fuerza en la dirección X será dada por la fuerza de tracción en la rueda trasera, menos la resistencia aerodinámica, la resistencia al rodado de los neumáticos y la fuerza de frenado Fbr . Fx = FT − RL a − RR − mgsen(α) − Fbr (72) Definición de las fuerzas externas - Fx La fuerza de tracción (FT ) puede ser determinada por, FT = 2nTm ηT d (73) Para n la relación de transmisión, Tm el torque disponible del motor, d el diametro dinamico del neumático y ηT el rendimiento de la transmisión. El diametro dinamico del neumático difiere de su valor nominal y puede ser escrito como, d = 0.9588dn Para dn siendo el diámetro nominal del neumático. (74) Definición de las fuerzas externas - Fx La resistencia aerodinámica puede ser definida como, RL a = 1 Cx u 2 Aρ 2 (75) Para Cx el coeficiente de forma del vehı́culo, u la velocidad longitudinal, A el area frontal proyectada y ρ la densidad del aire. Definición de las fuerzas externas - Fx Las resistencias de rodado pueden ser definidas como la fuerza producida por la deformación de la interface neumático/suelo. Al rodar un neumático sobre el suelo existen de los regiones distintas, la primera donde el neumático se comprime al tocar el suelo y la segunda cuando deja el suelo y se expande. Definición de las fuerzas externas - Fx Esta deformación tiene un efecto similar al de la deformación de un resorte, absorbiendo energı́a de rodado del vehı́culo y puede ser descripta por la ecuación: R R = fR N (76) Para N la fuerza normal al suelo y fR el coeficiente de resistencia al rodado, calculado experimentalmente. Un valor recomendado en la literatura es 0, 01 como una buena aproximación para este coeficiente. Expandiendo la ecuación (76) para las tres ruedas, tendremos: RR = RR1 + RR3 + RR4 (77) Definición de las fuerzas externas - Fx De esta forma, colocando las ecuaciones 73,75,76 y 77 y adicionando la fuerza de frenado Fbr en la ecuación 72 tendremos: Fx = 2nTm d ηT − 12 Cx u 2 Aρ − fR (N1 + N3 + N4 ) − mgsenα − Fbr (78) Definición de las fuerzas externas - Fy Fy Definición de las fuerzas externas - Fy Para el segundo elemento, Fy , debemos analizar lo que sucede con el neumático en el momento en que comienza a hacer una trayectoria con una componente transversal. A partir de la vista superior de la rueda delantera, podemos percibir que se pueden definir tres ángulos en esta situación, δ, que es el angulo de giro de las ruedas delanteras, θvf , que es el angulo del vector velocidad, y αf que es el angulo de deslizamiento. αf θvf v δ Y de esta forma, αf = δ − θvf (79) Definición de las fuerzas externas - Fy Como en el eje trasero el angulo de giro es nulo, partiendo del mismo princı́pio: αt = −θvt (80) Para θvt el angulo del vector velocidad en el eje trasero. De acuerdo con los valores de estos ángulos se puede describir la curva caracterı́stica del neumático conforme el diagrama de la formula magica de Pacejka. F γ αP Definición de las fuerzas externas - Fy Se observa que para pequeños ángulos se puede considerar comportamiento linear, de forma que se puede describir la relación entre ángulo de deslizamiento y carga lateral por: F γ Fy = BCDαP (81) αP Donde B, C y D son coeficientes de la curva caracterı́stica del neumático. Este produto es tambien conocido como coeficiente de rigidez de curva (CαP ) y es el propio coeficiente angular de la recta que aproxima αP = 0 (82) Definición de las fuerzas externas - Fy De esta forma las fuerzas laterales actuantes pasan a ser definidas como: Fy = f (αP ) = CαP αP (83) Pacejka también define que: αPdiant = δ − v + ad ψ̇ − e δ̇ u (84) v − at ψ̇ (85) u Para ad distancia longitudinal del eje delantero al centro de giro, at distancia longitudinal del eje trasero al centro de giro y e caster de las ruedas delanteras. αPtras = − Definición de las fuerzas externas - Fy Ası́, podemos definir la fuerza lateral de la ecuación 83 como: h i δ̇ Fyd = CαPdiant δ − v +aψ̇−e iu h (86) v −aψ̇ Fyt = CαPtras − u La variación del ángulo de giro puede ser considerada lenta y por lo tanto δ̇ = 0. De esta forma, se puede escribir la ecuación 86 como: h i ψ̇ Fyd = CαPdiant δ − v +a h iu v −aψ̇ Fyt = CαPtras − u (87) Definición de las fuerzas externas - Fy Considerando que puede haber viento lateral, y que el área transversal es At , el coeficiente de arrastre transversal es Cxt y la velocidad del viento es Vvent , la fuerza en el eje y será: a a v − 23 ψ̇ v + 23 ψ̇ − CαPtras + Fy = 2CαPdiant δ − u u (88) 2 + ρCxt At cos(φ)V2vent sign(Vvent ) Definición de las fuerzas externas Fz1 , Fz2 , Fz3 , Fz4 Fz1, Fz2, Fz3, Fz4 Definición de las fuerzas externas Fz1 , Fz2 , Fz3 , Fz4 El tercer, cuarto, quinto y sexto elemento del vector de fuerzas será dado por las fuerzas en la dirección vertical del vehı́culo en cada rueda y en el cuerpo central, Fz1 = kp zp1 (89) Fz2 = 0 (90) Fz3 = kp zp3 (91) Fz4 = kp zp4 (92) con zpi siendo la rugosidad del suelo bajo la rueda i . Definición de las fuerzas externas - Mψ Mψ Definición de las fuerzas externas - Mψ El septimo elemento del vector F(t) puede ser definido a partir del análisis de la figura siguiente, replacements Z Y X a4 Fy 4 Fy 3 Como el vehı́culo gira en relación al eje Z y este pasa por el punto de contacto del neumático con el suelo, podemos decir que el momento responsable por el ángulo de giro será función de las fuerzas laterales actuantes en los neumáticos delanteros, definidas como Fy3 para el neumático delantero derecho y Fy4 para el izquierdo. Definición de las fuerzas externas - Mψ Como la distancia entre el punto de actuación de estas fuerzas y el eje Z es a3 = a4 , el momento Mψ es, a3 Mψ = 2 CalfaP 2 v + a23 ψ̇ δ− u ! a3 − CalfaP 2 v − a23 ψ̇ u ! (93) En este caso no será considerado el efecto del viento pues depende del formato del vehı́culo. Definición de las fuerzas externas - Mϕ Mϕ Definición de las fuerzas externas - Mϕ Ya para el octavo elemento, el par capaz de girarlo en torno del eje X , no tendremos la actuación de la transferencia de carga entre las de los ruedas del eje delantero pues el vehı́culo inclina. Siendo CR el centro de rolling y hr la distancia del centro de gravedad al eje de rolling . En este caso especı́fico, debido a la suspension ser por duplo A y los brazos ser paralelos, el CR está en el suelo y hr = h. La fuerza de inercia será: Fc = mψ̇ 2 r (94) Para m la masa del vehı́culo, ψ̇ la velocidad de rotación en torno del eje Z y r el radio de curva. Definición de las fuerzas externas - Mϕ Para pequeños ángulos de deslizamiento podemos admitir que: u r (95) 1 δ = r l (96) ψ̇ = y, con, l δ Substituyendo (97) y (95) en (94) , tendremos: 2 2 2 u 2 l u δ u δ l =m =m Fc = m 2 r δ l δ l r= (97) (98) Considerando la proyección de la fuerza (98) en la normal al plano de la rueda y multiplicando por la altura del centro de gravedad, tendremos el valor del momento en torno del eje X , debido a Fc . Definición de las fuerzas externas - Mϕ El viento lateral ejerce un momento dado por: 2 sign(V ρCxt At cos(ϕ)h2 Vvent vent ) (99) 2 Las fuerzas ejercidas por el suelo en las ruedas delanteras producen un momento: − −b3 Fp3 + b4 Fp4 (100) De esta forma, el momento en torno del eje X será, Mϕ = mu 2 δcos(ϕ)h2 l − 2 sign(V ρCxt At cos(ϕ)h2 Vvent vent ) 2 − b3 Fp3 + b4 Fp4 (101) Definición de las fuerzas externas - Mθ Mθ Definición de las fuerzas externas - Mθ Observando la figura siguiente se puede definir el noveno elemento del vector F como, z θ h2 F a2 Mθ = Fbr h2 − F 2nTm ηT h2 d X (102) Definición de las fuerzas externas Por fin, asociando las ecuaciones (78), (88), (89), (90), (91), (92), (93), (101) y (102) el vector de fuerzas (70) pasa a ser: 2nTm 1 2 T − 2 Cx u Aρ d η a3 − mgsenα − Fbr2 − fR mgcos(α) a v− 2 ψ̇ v+ 23 ψ̇ ρC A cos(φ)Vvent sign(Vvent ) − CαP + xt t 2CαP δ − u u 2 k z p p1 0 kp zp3 k p zp4 a3 a3 2 a23 CαP δ − v+u2 ψ̇ − a23 CαP v−u2 ψ̇ 2 ρCxt At cos(φ)h2 Vvent sign(Vvent ) mu 2 δcos(φ)h2 − − b3 Fp3 + b4 Fp4 l 2 2nTm Fbr h2 − d ηT h2 (103) Modelo simplificado de una bicicleta Trabajo propuesto Modelar una bicicleta como una aproximación al modelo del triciclo presentado anteriormente. Para el modelo simplificado de la bicicleta, serán considerados apenas el movimiento longitudinal y de rotación en relación al eje X (q = {x, φ}), mostrados en la figura con h la altura del centro de gravedad de la bicicleta y m la sua massa. Modelo simplificado de una bicicleta Una solución Para estos grados de libertad, es facil verificar que la energia cinética de la bicicleta se da por la ecuación 104: T = 1 (hmφ̇2 + mẋ 2 ) 2 (104) La primeira parcela del lado izquierdo de la ecuación corresponde a la energia de rotación en torno del eje X de movimiento, mientras que la segunda parcela corresponde a la energia del movimiento longitudinal del vehı́culo. Modelo simplificado de una bicicleta La energı́a potencial solamente puede ser acumulada en forma de energı́a potencial gravitacional, ya que este modelo no cuenta con ningún otro elemento acumulador. Por lo tanto, se define por la ecuación, V = mghcos(φ) (105) com g siendo la aceleración de la gravedad. Modelo simplificado de una bicicleta A partir de las energias potenciales y cinéticas de la bicicleta se pueden obtener las ecuaciones diferenciales que definen la dinámica del modelo através del cálculo del Lagrangeano. El Lagrangeano L del sistema se define por la ecuación, 1 L = T − V = (hmφ̇2 + mẋ 2 ) − mghcos(φ) 2 (106) Modelo simplificado de una bicicleta Las ecuaciones dinámicas del sistema se pueden obtener a partir de L através de la relación, ∂L d ∂L =F (107) − dt ∂ q̇ ∂q com F representando el vector de entradas (fuerzas y momentos) actuando en el sistema. Modelo simplificado de una bicicleta Se puede calcular cada un dos elementos de la ecuación 107, obteniendo: ∂L = mẋ ∂ ẋ ∂L = mh2 φ̇ ∂ φ̇ ∂L =0 ∂x ∂L = mghsin(φ) ∂φ ∂L d = mẍ dt ∂ ẋ d ∂L = mh2 φ̈ dt ∂ φ̇ (108) Modelo simplificado de una bicicleta Como resultado se obtiene el modelo dinámico dado por las ecuaciones 109 y 110: mh2 φ̈(t) − mhgsin(φ(t)) = g1 (u, δ) (109) mu̇(t) = g2 (Tm , u) (110) La función g1 (u, δ) describe el momento externo aplicado al sistema, y se la puede definir de manera semejante a la utilizada en el modelado del triciclo, pues este también depende de la geometrı́a del vehı́culo. Modelo simplificado de una bicicleta Ası́, utilizando la ecuación (98) que define el momento de rotación en φ multiplicada por la altura del centro de gravedad, la ecuación 109 pasa a ser escrita como: φ̈(t) = g cos(φ(t)) 2 sin(φ(t)) + u (t)δ(t) h lh (111) Modelo simplificado de una bicicleta De manera análoga, la función g2 (Tm , u) representa las fuerzas externas actuando en la dirección del movimiento longitudinal, y se la puede substituir por la formulación de fuerza utilizada en el modelado del triciclo, con una parcela responsable por la fuerza de tracción aplicada y otra indicando la fuerza de arrastre aerodinámico. De esta forma, la ecuación (110) pasa a ser: u̇(t) = 1 2nηT Tm (t) − Cx Aρu 2 (t) dm 2m (112) Modelo simplificado de una bicicleta Modelo mas realista Para tornar este modelo simplificado mais próximo del modelo del triciclo, se adiciona amortiguamiento al movimiento rotacional φ de la bicicleta. Los amortiguadores lineares, existentes en el triciclo, se pueden aproximar por un amortiguador torsional equivalente igualando el trabajo realizado por los dos mecanismos. El trabajo W del amortiguador linear del triciclo quando ocurre una inclinación φ es dada por: 2 b W = C φ̇φ 2 (113) com (C ) el coeficiente de amortiguamiento y b2 la distancia entre el centro de rolling del vehı́culo en el eje X y el amortiguador. Modelo simplificado de una bicicleta En este cálculo, se asumió que la posición del amortiguador coincide con la posición de la rueda para simplificar el problema. El trabajo equivalente de un amortiguador torcional es: Wequiv = Ct φ̇φ (114) com (Ct ) del amortiguamiento torcional equivalente. Igualando los trabajos de los dos amortiguadores, se puede obtener el valor del amortiguador torcional equivalente. Considerando los dos amortiguadores existentes en el triciclo, el valor del amortiguamiento torcional equivalente se puede calcular como: Ct = 2C 2 b 2 (115) Modelo simplificado de una bicicleta Adicionando amortiguamiento al movimiento de rotación en torno del eje X del modelo de la bicicleta, se obtiene la ecuación (116), que representa la dinámica de inclinación de la bicicleta, φ̈(t) = g Ct cos(φ(t)) 2 sin(φ(t)) − φ̇ + u (t)δ(t) h mh lh (116) Semejanzas entre bicicleta y triciclo Se puede facilitar bastante el proyecto de controladores y el análisis de los sistemas en lazo cerrado através del uso de modelos simplificados. Es claro que esta ventaja proviene del sacrificio de dinámicas del sistema que no serán modeladas. Dos variables son de mayor interes: el ángulo de inclinación φ y la velocidad u. Por lo tanto se propone el modelo de una bicicleta descripto por las ecuaciones (111) y (112) como una simplificación del modelo del triciclo. Semejanzas entre bicicleta y triciclo La comparación entre los dos modelos da informaciones sobre sus comportamientos. A seguir se presentan los resultados obtidos. Para realizar las simulaciones, una vez que los dos sistemas son inestables en lazo abierto, se utilizo un controlador PID con compensación estática de la ganancia no lineal para estabilizar el sistema. Este controlador será detallado posteriormente. Semejanzas entre bicicleta y triciclo Para la simulación mostrada en la figura se considera una entrada de giro aplicado por el conductor de δr = 0, 1rad para la izquierda y para la derecha a una velocidad constante u = 10m/s. Se controla la velocidad através de un controlador por modos deslizantes que será descripto posteriormente. Semejanzas entre bicicleta y triciclo El gráfico muestra que el comportamiento dinámico de los sistemas presenta semejanzas con los mismos valores de φ en régimen. Se puede explicar la diferencia entre los comportamientos por la ausencia de interacción entre las ruedas frontales y el cuerpo del vehı́culo en el modelo de la bicicleta Comparacao de Inclinacao 5 Triciclo Bicicleta 4 Inclinacao (graus) 3 2 1 0 −1 −2 −3 −4 0 2 4 6 8 10 12 Tempo (s) 14 16 18 20 Semejanzas entre bicicleta y triciclo La figura muestra la simulación del sistema en lazo abierto para velocidad considerando cambios simultáneos de velocidad y ángulo de giro, para verificar el acoplamento entre las variables. La velocidad inicial de los dos modelos es 5m/s y se aplica un torque motor constante de 100Nm. El giro aplicado por el conductor es de 0, 1rad para cada lado. Comparacao de Inclinacao 10 Triciclo Bicicleta 8 Inclinacao (graus) 6 4 2 0 −2 −4 0 2 4 6 8 10 12 Tempo (s) 14 16 18 20 Semejanzas entre bicicleta y triciclo Estas simulaciones indican que los dos modelos presentan algunas semejanzas, llegando a los mismos valores de inclinación en régimen, mismo valor de giro (acción de control) en régimen y comportamiento dinámico para la velocidad longitudinal semejantes. Estas caracterı́sticas indican que las ecuaciones de la bicicleta pueden ser asumidas como una simplificación del modelo completo del triciclo y, por lo tanto, pueden dar algunas informaciones para el proyecto y análisis de controladores. Semejanzas entre bicicleta y triciclo La comparación de comportamientos dinámicos anterior muestra que se puede utilizar un modelo simple para proyecto y análisis. Se pueden obtener modelos simplificados a partir de un nuevo modelado fenomenólogico, como hecho anteriormente, que requiere conocimiento de los efectos dinámicos de diferentes componentes de un sistema. Otro abordaje es simular el modelo completo e identificar un modelo simple utilizando programas de simulación y control de sistemas dinámicos. Y otra forma de obtener modelos simples es utilizar técnicas de reducción de modelo. Fundamendación Teórica Fundamendación Teórica Fundamendación Teórica Aqui se exponen los fundamentos de control utilizados para este trabajo, presentando la teoria para las técnicas de control no-linear por realimentación linearizante entrada-salida y control por energy shaping. Fundamendación Teórica Control no-linear por realimentación linearizante entrada-salida. Para esto se introducen algunos conceptos importantes de la geometria diferencial que resultaran en un controlador que garantiza la estabilización y el seguimento de trayectórias. Fundamendación Teórica En el contexto de la teoria de control, el uso de técnicas basadas en el cancelamiento matemático de términos levanta cuestionamentos. La técnica de realimentación linearizante debe ser vista como una propiedad estructural de una clase de sistemas lineares, y no como una solución para el proyecto de control. Uma propiedad importante de esta clase de sistemas no es conseguir el cancelamiento exacto de sus no-linearidades, mas garantizar que el control mantenga las no-linearidades dentro del alcance de las entradas. Fundamendación Teórica Considerando un sistema no linear en la forma ẋ = f (x) + g (x)u (117) y = h(x) (118) una ley de control por realimentación de la forma u = α(x) + β(x)v puede transformar el sistema no-linear en un equivalente linearizado. (119) Fundamendación Teórica Para tal, se necesita que el sistema sea escrito de acuerdo con la estrutura. ẋ = Ax + Bγ(x)[u − α(x)] (120) con A de dimensión n × n, B de dimensión n × p, el par (A, B) controlable, las funciones α : R n → R p y γ : R n → R p×p definidas en el dominio D ∈ R n que contiene el origem, y la matriz γ(x) no singular para todo x. Si se obedecen tales condiciones, la ley de control dada por la ecuación (119) consigue linearizar el sistema con β = γ −1 . Proyectando v de forma apropiada se alcanza la estabilidad. Fundamendación Teórica Caso el sistema no este en la forma dada por la ecuación (164), se puede llevar a la forma deseada si existe una transformación de estados (ecuación 121) que atienda algunos requisitos. Cuando se usa el cambio de variables para transformar la ecuación de estados de coordenadas x para coordenadas z, la función T que mapea la transformación debe poseer inversa. Adicionalmente, las funciones T y T −1 deben ser continuamente diferenciables. z = T (x) (121) Fundamendación Teórica Cuando apenas algunas variables de salida son de interés, como generalmente es el caso del problema de seguimiento de referencia, se describe el modelo por ecuaciones de estado y de salida. Linearizando las ecuaciones de estado no necesariamente resulta en ecuaciones de salida linearizadas, lo que puede dificultar la solución del problema de seguimiento de referencia. Por esta razón, la linearización entrada-salida presenta ventajas, aunque sea necesario mantener parte de las ecuaciones de estado en la forma no linear. En este caso, se dice que el sistema es linearizable en entrada-salida. Fundamendación Teórica Se debe observar que en el caso de un sistema entrada-salida linerarizable, algunos estados del sistema pueden ser no-observables a partir de la salida elegida. Asi, estos estados deben ser estables o al menos limitados. Fundamendación Teórica Considerando el sistema dado por la ecuación (117), con f , g y h suficientemente suaves en el dominio D ⊂ R n . Los mapas f : D → R n y g : D → R n se denominan campos vectoriales en D. La derivada y (1) es, y (1) = ∂h [f (x) + g (x)u] , Lf h(x) + Lg h(x)u ∂x (122) con ∂h f (x) ∂x indicando la Derivada de Lie de h en relación a f . Lf h(x) = Si Lg h(x) = 0, entonces ẏ = Lf h(x) no dependerá de u. (123) Fundamendación Teórica Calculando la segunda derivada de y , denotada por y (2) , se obtiene: y (2) = ∂(Lf h(x)) [f (x) + g (x)u] = L2f h(x) + Lg Lf h(x)u ∂x (124) Nuevamente, si Lg Lf h(x) = 0, entonces y (2) = L2f h(x), independiente de u. Repitiendo el proceso se observa que si h(x) satisface Lg Lif−1 h(x) = 0, i = 1, 2, ..., ρ − 1; Lg Lρ−1 h(x) 6= 0 f (125) entonces u no aparece en las ecuaciones de y , ẏ , ..., y (ρ−1) y aparece en la ecuación de y ρ con un coeficiente no nulo y ρ = Lρf h(x) + Lg Lρ−1 h(x)u f (126) Fundamendación Teórica Utilizando este resultado, se puede ver que el sistema es entrada-salida linearizable, pues la ley de control realimentada u= 1 Lg Lρ−1 h(x) f [−Lρf h(x) + v ] (127) reduce el mapa de entrada salida a yρ = v (128) que es una cadena de ρ integradores. En este caso, al número entero ρ se lo denomina grado relativo del sistema. El grado relativo del sistema es una propiedad importante para la linearización entrada-salida y el seguimento de trayectórias. Fundamendación Teórica Considerando el sistema SISO entrada-salida linearizble representado por el sistema η̇ = f0 (η, ξ) (129) ξ̇ = Ac ξ + Bc γ(x)[u − α(x)] (130) y (131) = Cc ξ con ξ ∈ R ρ ,η ∈ R n−ρ , (Ac ,Bc ,Cc ) la forma canónica representando la cadena de integradores y f0 (0, 0) = 0. Se desea proyectar una ley de control de forma que la salida y siga el sinal de referencia r (t). Fundamendación Teórica Caso el sistema tenga grado relativo ρ = n, no tiene dinámicas cero no-triviales. En este caso, las variables η y sus ecuaciones pueden ser desconsideradas para el desarrollo del controlador. Se supone también que la referencia r (t) y sus derivadas r ρ (t) son limitadas para todo t ≥ 0 y la ρ-ésima derivada es una función continua por partes de t. Fundamendación Teórica Suponiendo R= r .. . r (ρ−1) ,y = ξ1 − r .. . ξρ − r (ρ−1) =ξ−R (132) el cambio de variables e = ξ − R en el sistema lo transforma en η̇ = f0 (η, y + R) ẏ = Ac y + Bc {γ(x)[u − α(x)] − r ρ } (133) La ley de control u = α(x) + βx[v + r ρ ] (134) reduce a la ecuación (133) para la forma η̇ = f0 (η, y + R) ẏ = Ac y + Bc v (135) Fundamendación Teórica Se puede alcanzar el objetivo de control para cualquier proyecto de v que estabilize la segunda ecuación mientras η sea limitado. Para sistemas de fase mı́nima con e(0), η(0) y R(t) el estado n(t) es limitado, resolviendo asi el problema de estabilidad local. Para ampliar la región de atracción y obtener estabilidad global, es condición suficiente asegurar que el sistema η̇ = f0 (η, ξ) tenga estabilidad entrada-estado. Fundamendación Teórica Control no-linear via Energy Shaping Ahora veremos la teoria básica de control no linear via energy shaping, junto con algunos resultados importantes que posteriormente serán utilizados para la sı́ntesis de um controlador, basandose en las ecuaciones de Euler-Lagrange. Se definen los sistemas en la forma de Euler-Lagrange (sistemas EL) a partir de una técnica de modelado basada en la definición de funciones de energia, formando la función Lagrangeana que permite obtener las ecuaciones de movimento del sistema. Fundamendación Teórica Al trabajar con pasividad, existe una ventaja al describir sistemas en la forma de EL, pues ya se obtienen funciones de almacenamiento y de disipación, base para la técnica de energy shaping. Otra ventaja es que se pueden representar sistemas interconectados de forma simple. El concepto de interconexión es importante, pues define como se transmite la energia entre sistemas. La teoria de energy shaping se basa en la modificación de la energia de sistemas y de sus puntos de equilibrio. Fundamendación Teórica El analisis a partir de las energias potenciais ayuda a explicar el concepto por tras de la teoria. La primeira figura ilustra la energia potencial de um péndulo, con um punto de máximo (equilibrio inestable) localizado en 0 y puntos de mı́nimo (equilibrios estables) localizados en ±π. Através de la modificación de la energia potencial de el sistema, se desea obtener una función de energia potencial deseada Vd . Un ejemplo de función es el de la segunda figura, que posee apenas un punto de mı́nimo. 5000 18000 4000 16000 3000 14000 2000 Energia Potencial Energia Potencial 12000 1000 0 −1000 10000 8000 6000 −2000 4000 −3000 2000 −4000 −5000 −5 −4 −3 −2 −1 0 Phi (rad) 1 2 3 4 5 0 −5 −4 −3 −2 −1 0 Phi (rad) 1 2 3 4 5 Fundamendación Teórica De forma semejante, se puede modificar la función de disipación de un sistema, adicionando amortiguamiento y garantizando la estabilidad asintótica de los puntos de equilibrio deseados. Fundamendación Teórica Pasividad Sistemas Pasivos corresponden a una clase de sistemas dinámicos donde el intercambio de energia con el ambiente desempeña un papel fundamental en la formulación del problema de control. Estos sistemas no pueden almacenar mas energı́a que la disponibilizada por el ambiente, con el exceso de energı́a siendo disipado. Fundamendación Teórica La definición de pasividad está intrinsecamente relacionada con las propiedades fı́sicas del sistema y de forma particular con su estabilidad. Disipatividad es una propiedad fundamental de sistemas fı́sicos. Em sistemas eléctricos, parte de la energia se disipa como calor en resistencias. Em sistemas mecánicos, la fricción entre elementos causa la perdida de energia. A continuación se presentan algunas definiciones necesarias para el concepto de pasividad. Fundamendación Teórica Espacios L2 y L2e : Considerando el conjunto Ξ para toda función real mensurable n dimensional f (t) : R+ → R n . Definiendo el conjunto Z ∞ 2 k f (t) k2 dt < ∞} (136) L2 , {x ∈ Ξ |k f k2 , 0 con k · k la norma euclidiana. Este conjunto forma un espacio vectorial normado sobre el campo de los números reales con norma k · k2 . El espacio extendido L2e puede ser definido como L2e , {x ∈ Ξ |k f k22T , Z T k f (t) k2 dt < ∞, ∀T } (137) 0 Asi, L2 ⊂ L2e , con el espacio extendido conteniendo señales donde la norma L2 puede tender para infinito, mas apenas en tiempo infinito. Fundamendación Teórica Se define producto interno (Equación 138) y el producto interno truncado (Equación 139) de dos funciones y y u como; Z ∞ u(t)T y (t)dt (138) hu | y i , 0 hu | y iT , Z 0 T u(t)T y (t)dt (139) Fundamendación Teórica Los sistemas explorados en este caso, representados por el operador Σ, poseen la forma ( ẋ = f (x, u), x(0) = x0 ∈ R n Σ: y = h(x, u) con estados x ∈ R n , entrada u ∈ R m y salida y ∈ R m , donde Σ : L2e → L2e : u → y . (140) Fundamendación Teórica Disipatividad: La definición matemática de disipatividad está relacionada a dos funciones: la tasa de alimentación (supply rate), que define la tasa con que la energia es introducida al sistema, y la función de almacenamiento (storage function), que indica la cantidad de energia que está almacenada en el sistema. Estas funciones estan relacionadas por una inecuación de disipación. Fundamendación Teórica El sistema dinámico causal Σ se dice disipativo con respecto a la tasa de alimentación w (u, y ) : R m × R m → R si y solamente si existe una función de almacenamiento H : R n → R>0 , de manera que: Z T w (u(t), y (t))dt (141) H(x(T )) 6 H(x(0)) + 0 para todo u, T > 0 y x(0) ∈ R n. Fundamendación Teórica Pasividad: Σ es pasivo si es disipativo con una tasa de alimentación w (u, y ) = u T y . El sistema se dice de Entrada Estrictamente Pasivo si es disipativo con tasa de alimentación w (u, y ) = u T y − δi k u k2 , con δi > 0. El sistema se dice de Saida Estrictamente Pasiva si es disipativo con tasa de alimentación w (u, y ) = u T y − δo k y k2 , con δo > 0. Fundamendación Teórica Estabilidad L2 : Σ se dice L2 -estable si existe una constante positiva γ de forma que, para cada x0 , existe una constante finita β(x0 ) que satisface la inecuación 142. k y k2T ≤ γ k u k2T +β(x0 ) (142) Fundamendación Teórica Disipatividad y estabilidad L2 estan relacionadas. Um sistema Σ es L2 estable si es disipativo con una tasa de alimentación w (u, y ) = 21 γ 2 k u k2 − k y k2 . Con una función de almacenamiento H ≥ 0 y x0 = 0, se puede mostrar que: Z 0 T k y k2 dt ≤ γ 2 Z T k u k2 dt o Si un sistema Σ : u → y es de Salida Estritamente Pasiva, entonces es L2 -estable (143) Fundamendación Teórica Invariancia de pasividad: Considerando los sistemas entrada salida mostrados en la figura: si Σ1 y Σ2 son ambos pasivos, entonces el sistema total Σ es tambien pasivo. Se puede demostrar esto para el caso de interconexión de realimentación e interconexiones de sistemas en paralelo. Fundamendación Teórica Con sistemas Σ1 y Σ2 pasivos, existen funciones de almacenamiento H1 y H2 tal que, Hi (xi (T )) − Hi (xi (0)) ≤ RT 0 uiT yi dt, con i = 1, 2. Definiendo x : (x1 , x2 ) y H(x) = H1 (x1 ) + H2 (x2 ), con H(x) positiva semi-definida. Fundamendación Teórica Para interconexiones en paralelo la salida será y = y1 + y2 , de forma que: H(x(T )) − H(x(0)) ≤ Z 0 T T T (u y1 + u y2 )dt = Z T 0 mostrando que la interconexión en paralelo es pasiva. u T ydt (144) Fundamendación Teórica Para el sistema realimentado, substituyendo u2 = y1 y u1 = r − y2 se obtiene : Z T (r T y1 )dt (145) H(x(T )) − H(x(0)) ≤ 0 Es importante mostrar que el teorema no exige que los dos operadores sean pasivos, pues el exceso de pasividad de un sistema puede compensar la falta de pasividad en otro sistema. Fundamendación Teórica Estabilización por realimentación de salida - Un controlador representado por los parámetros (Tc (qc , q̇c ), Vc (qc , qp ), Fc (q̇c )) con Tc la energia cinética de el controlador, Vc la energia potencial de el controlador, Fc la función de disipación de energia del controlador, qc los estados del controlador y qp los estados del sistema resuelve el problema de estabilización global por realimentación de salida si: Energy shaping: V(q) es propia y posee un único mı́nimo global en q = q∗ . Aumento de amortiguamiento: Fc (q̇c ) debe satisfazer q̇ T ∂Fc ≥ α k q̇c k2 ∂ q̇ (146) para algun α > 0. Propagación de la disipación: Para toda trayectoria con qc ≡ ∂V (q ,q ) constante y c∂qcc p = 0 resulta en qp ≡ constante. Fundamendación Teórica Estabilidad Interna y Pasividad: Un sistema entrada-salida estable es tambien internamente estable si se satisfacen algunas propriedades de observabilidad. Suponiendo que el sistema Σ sea de Salida Estrictamente Pasiva con una función de almacenamiento H ≥ 0. Si Σ es zero-estado observable, entonces H(x) > 0 para todo x 6= 0 Si H(x) > 0 para todo x 6= 0, H(0) = 0 y Σ es zero-estado detectable, entonces x = 0 es un equilibrio localmente asintoticamente estable. Si H es radialmente irrestricta, entonces la estabilidad es global. Definición del Problema de Control Definición del Problema de Control Definición del Problema de Control Presentación del problema En vehı́culos de cuatro ruedas (automóviles convencionales) no se desea la rotación en relación al eje X (ángulo ϕ, también llamada de ”rolling”), pues estos vehı́culos no permiten el ajuste del ángulo dinámicamente (con el vehı́culo en movimiento). Ya en vehı́culos de dos ruedas (como motos y bicicletas) se utiliza el ”rolling” para mantener la estabilidad y facilitar la dirección del vehı́culo durante las curvas. Definición del Problema de Control En el proyecto del vehı́culo de tres ruedas, la manipulación del ángulo de ”rolling” permitirá que efectos causados por la fuerza centrifuga durante las curvas sean compensados, proporcionando mejor estabilidad y desempeño. El ángulo de ”rolling” ϕ puede ser ajustado dinámicamente por de un mecanismo de inclinación variable la traves de una acción de control. Definición del Problema de Control Objetivo El objetivo es el de desarrollar un controlador que a través de la manipulación del giro de las ruedas corrija el ángulo de inclinación ϕ para que las fuerzas transversales al plano de la rueda se anulen. Definición del Problema de Control El ángulo de inclinación deseado ϕd se obtiene a partir de la ecuación (147) que depende de la velocidad del vehı́culo v , del ángulo de giro deseado δd , de la aceleración de la gravedad g y de la distancia entre los ejes del vehı́culo L. 2 v .δd (147) ϕd = −atan g .L El otro objetivo de control es la velocidad en el eje X Limites de giro para el vehı́culo Para analizar mejor el desempeño del controlador se necesita fijar un limite para el giro de las ruedas y para la velocidad del vehı́culo y, de esta forma, determinar el limite para la inclinación del vehı́culo. Limites de giro para el vehı́culo Se estableció la relación entre las velocidades y los radios de giro de acuerdo con la norma del DNER, que define los padrones para la construcción de rutas en Brasil. Peralte 4% 6% 8% 10% 30 30 25 25 25 40 60 55 50 45 Velocidad Directriz(m/s) 50 60 70 80 90 100 150 205 280 355 90 135 185 250 320 80 125 170 230 290 75 115 155 210 265 100 465 415 375 245 110 755 655 595 540 La tabla muestra los valores de radio de curva mı́nimos para diferentes velocidades y diferentes valores de peralte de la pista. Peralte es el declive transversal de la pista, introducido con la finalidad de reducir o eliminar efectos de fuerzas laterales sobre pasajeros y/o cargas de los vehı́culos en movimiento. Limites de giro para el vehı́culo En este caso se consideraran como valores limite los indicados para 4%, pues el modelo del vehı́culo no simula la presencia de peralte en la pista. De esta manera, si el vehı́culo atiende los valores especificados para 4%, mismo sin la compensación del peralte, podemos considerar que el sistema atiende a los requisitos. Limites de giro para el vehı́culo Transformando el radio de curva en ángulo de giro de las ruedas delanteras del vehı́culo la través de la ecuación 148: L (148) R donde L es la distancia entre ejes, R es el radio de curva y δ es el ángulo de giro, obtenemos (para L = 2.2 metros) la tabla, tan(δ) = (◦ ) δ δ (rad) 30 4.19 0.073 40 2.10 0.036 Velocidad 60 0.84 0.014 Directriz(km/h) 70 80 100 0.61 0.45 0.27 0.011 0.008 0.005 110 0.16 0.003 La tabla define el ángulo de giro necesario para que el vehı́culo consiga realizar curvas conforme definido por las normas de construcción de rutas, y estos serán los valores que definirán los limites para este proyecto. La velocidad máxima del vehı́culo fue establecida en 110 km/h. Proyecto de controladores Proyecto de controladores Proyecto de controladores Preliminares A continuación veremos las etapas y los cálculos para sı́ntesis de controladores: PID con compensación estática de no linealidad, controlador por realimentación linearizante, control via energy shaping, control por modos deslizantes Los controles de velocidad y de inclinación componen un problema multivariable para el caso del triciclo, pero serán tratados como dos problemas monovariables separados. Proyecto de controladores A continuación y como primer paso del proyecto de controladores se presenta: Un controlador de velocidad basado en modos deslizantes, Un generador de referencias (encargado de calcular el ángulo de inclinación deseado para el vehı́culo φd que anula las fuerzas laterales actuantes). Proyecto de controladores El controlador de velocidad por modos deslizantes utiliza como variable de entrada el torque del motor Tm y como variable de salida a velocidad longitudinal del vehı́culo u. A partir del sistema en la forma M(q)q̈ + C q̇ + K (q, q̇)q = F (q, q̇) (149) se puede describir por: q̈ = −M(q)−1 C q̇ − M(q)−1 K (q, q̇)q + M(q)−1 F (q, q̇) (150) através del cambio de variables, x1 = q, x2 = q̇ (151) Y asi se puede modelar el triciclo como un sistema de ecuaciones diferenciales de primer orden: ẋ1 = x2 ẋ2 = −M(x1 )−1 Cx2 − M(x1 )−1 K (x1 , x2 )x2 + M(x1 )−1 F (x1 , x2 ) (152) Proyecto de controladores La salida del sistema a ser regulada es el error de velocidad, que debe ser cero. Se puede definir la superficie de deslizamento para control de velocidad como, S = ud − u (153) donde la entrada Tm actua sobre S. Definiendo la ley de control como ( −k1 , se S > 0, Tm = +k1 , se S < 0 (154) el sistema tiene error nulo en regimen si k1 es suficientemente grande. Para aplicar la ley de control en las simulaciones se puede usar un relay con histéresis de valor 0.001, para reduzir el chattering, caracterı́stico de este tipo de control. Proyecto de controladores Para cálculo del valor de referencia de inclinación φd , se utilizó un generador de trayectorias. Este generador calcula los valores de referencia de φ y u, que servirán de entrada para los controladores de inclinación y velocidad, fundamentado en la teoria de platitud aplicada al modelo de la bicicleta. (*) Proyecto de controladores Se debe determinar el error de inclinación del vehı́culo calculado a partir del valor de inclinación medida φ y del valor de inclinación deseado φd . El valor de φd es el ángulo de inclinación que cancela las fuerzas laterales actuantes en el vehı́culo. Proyecto de controladores Algunas lineas generales orientan la solución para el problema de seguimiento de trayectoria: Durante variaciones de giro deseado δd , se debe intentar manter la velocidad ud constante. Si el modulo del ángulo de inclinación φd es mayor que un valor máximo φmax , se debe alterar ud para que δd sea alcanzado. Durante transitorios se debe mantener el valor de δd lo mas próximo posible del valor deseado por el conductor, evitando violar la restricción de inclinación k φd k< φmax . Cuando u̇d = 0 y δ̇d = 0, entonces φ̈ = 0 (en este caso, φ, ud y δd se relacionan algebraicamente). De la ecuación (111), se puede obtener: tan(φ)gl = u 2 δ (155) Proyecto de controladores No se pueden realizar cambios instantáneos en las referencias en aplicaciones prácticas. Por eso se necesitan definir transiciones suaves para la referencia. Se definen restricciones de movimento aplicando la segunda ley de Newton en un punto de masa (en este caso, la masa del vehı́culo) que se mueve a lo largo de una trayectoria (eje x para el movimento longitudinal) e inclinación (movimento angular φ). El sistema no se puede mover mas rápido de lo que permiten las leyes de la fı́sica. La solución de las dos ecuaciones diferenciales (111 y 112) determinan los set-points factibles. Outra restricción fı́sica proviene de los limites del ángulo de inclinación. El objetivo de control es mover la rueda lo mas próximo posible del valor definido por el conductor, lo mas rápido posible. Proyecto de controladores A partir del modelo simplificado de la bicicleta (111 y 112), Si se conoce el ángulo de inclinación φ, se pueden calcular φ̇ e φ̈; Conociendo δ y usando (111), se puede calcular el termino u 2 . Calculando su raiz cuadrada y considerando apenas velocidades positivas se puede definir u̇, Usando la ecuación (112) se puede calcular el valor del torque Tm . Ası́, midiendo φ e δ, se pueden calcular todas las variables del sistema. Proyecto de controladores Se pueden definir las condiciones iniciales de δ, δ̇ e δ̈ en t0 através de los valores deseados o por limitaciones fı́sicas, mientras que se puede medir φ, φ̇ e φ̈ en el instante t0 . Para un instante t1 , apenas δ e φ pueden ser no nulas, las otras cuatro variables deben ser obligatoriamente cero. Proyecto de controladores Definiendo dos polinómios de orden adecuada para φ e δ que satisfagan las condiciones iniciales y finales definidas anteriormente y calculando sus coeficientes, se pueden calcular todas las variables del problema. A continuación se muestran los polinómios escogidos. Proyecto de controladores Trayectoria linear para φ: Se puede definir la trayectoria para φ como una ecuación lineal: φ(t) = φ(t0 ) + (φ(t1 ) − φ(t0 )) t − t0 t1 − t0 (156) Utilizando u(t0 ) y δ(t0 ) se define el valor para φ(t0 ), y con u(t1 ) y δ(t1 ) se calcula φ(t1 ) utilizando la ecuación (155). Si el valor de k φ(t1 ) k> π6 , entonces se debe definir φ(t1 ) como ± π6 . Esta solución garantiza φ̈ = 0 para todo t. Proyecto de controladores Trayectoria para δ: Para conseguir transiciones suaves por partes para la referencia de giro, se propone una ecuación lineal similar a la utilizada para el cálculo de φ(t): δ(t) = δ(t0 ) + (δ(t1 ) − δ(t0 )) t − t0 t1 − t0 (157) Proyecto de controladores Trayectoria para velocidad: La función definida por la ecuación (156) tiene la segunda derivada nula. De esta manera, para los cálculos de la velocidad u a partir de la ecuación (111), se debe considerar cero la segunda derivada de φ. Considerando a ecuación en regimen permanente, se puede determinar la referencia de u utilizando las funciones de trayectorias lineares para φ y δ y aplicando en r gltan(φ) u(t) = δ (158) Ası́ se obtienen los valores de φ(t) e u(t) que servirán de referencia para los controladores de bajo nivel. Proyecto de controladores PID con compensación estática de la no-linealidad Se proyectará un controlador PID con compensación estática de la no-linealidad (referido en este caso simplesmente como PID) para servir para comparación, debido a la ausencia de trabajos consolidados en la literatura. Por un lado, diversos artı́culos existentes utilizan diferentes modelos y presentan pocos resultados experimentales, por otro lado se dispone de muy poca información técnica de los vehı́culos construidos. De esta forma, se eligió el controlador PID para definir una solución básica. Debido a sua teoria establecida y las propriedades de análisis, este tipo de controlador es adecuado para generar un padrón de comparación. Proyecto de controladores Para proyectar el controlador se utilizaran modelos linearizados del triciclo. A partir de la linearización del modelo en torno del punto de equilibrio φ = 0 (vehı́culo moviendose en linha reta, con valores nominales de los parametros) se obtuvieron funciones de transferencia para diferentes velocidades, criando un mapa de relaciones entre la entrada (giro aplicado δ) y la salida (ángulo de inclinación φ) para pequeños valores de inclinación. La tabla siguiente muestra las funciones de transferencia obtenidas para diferentes velocidades entre 5m/s y 29m/s, junto con la ganancia del modelo linearizado. Proyecto de controladores (FT’s) obtenidas por linearización. Vel. (m/s) Ganancia de la FT Función de transferencia 5 583,48 7 717,60 9 896,43 13 1388,20 15 1701,15 17 2058,80 21 2908,23 23 3400,00 25 3936,48 29 5143,56 (s+0,79) (s+123,10)(s−2,28)(s+1,42) (s+0,90) (s+89,62)(s−2,49)(s+1,28) (s+0,93) (s+71,14)(s−2,71)(s+1,15) (s+0,87) (s+51,51)(s−3,14)(s+0,95) (s+0,82) (s+45,72)(s−3,35)(s+0,87) (s+0,76) (s+41,34)(s−3,56)(s+0,80) (s+0,67) (s+35,21)(s−3,95)(s+0,68) (s+0,63) (s+32,98)(s−4,13)(s+0,64) (s+0,59) (s+31,14)(s−4,31)(s+0,60) (s+0,52) (s+28,26)(s−4,63)(s+0,53) Proyecto de controladores La figura muestra graficamente los resultados de la tabla anterior, exibiendo la evolución de los polos y ceros del sistema de acuerdo con la velocidad del vehı́culo. Proyecto de controladores La figura detalla los polos y ceros próximos al origen. Proyecto de controladores En esta figura se observa la variación de la ganancia. Proyecto de controladores Para el cálculo del controlador se utilizo la función de transferencia para la velocidad de 15m/s, valor medio de la faja de velocidades esperada. Proyecto de controladores El controlador PID deseado debe estabilizar el sistema obedeciendo las seguintes especificaciones para la respuesta en lazo cerrado: Tiempo de estabilización (5%) ≤ 1,5 segundos; Sobreseñal máximo ≤ 20%; Error en regimen nulo para entradas del tipo escalon. Para atender las condiciones el sistema en lazo cerrado debe tener sus polos localizados próximo al punto −2 ± 4i . Un controlador adecuado para la aplicación no debe presentar variaciones rápidas en el control y en el ángulo de inclinación, lo que causarı́a desconfort para los pasajeros. Proyecto de controladores La entrada al controlador es la diferencia entre la inclinación medida φ y la inclinación deseada φd , y su salida será el ángulo de giro aplicado en el vehı́culo. Para este trabajo, el controlador propuesto tiene dos grados de liberdade: el controlador C (s) y un filtro de referencia F (s). (*) Proyecto de controladores Ajustando el controlador C (s) para atender las especificaciones, junto con el filtro de referencia F (s) para eliminar el efecto del cero dominante, se modifica el lugar de las raı́ces del sistema resultando en el grafico mostrado en la figura, donde las linhas negras limitan una area (em blanco) donde se deben localizar los polos. Proyecto de controladores Para detallar el comportamiento dominante del sistema, se puede observar el diagrama de polos y ceros en la figura. En esta se puede ver que el camino recorrido por los polos atiende los requisitos. El cero dominante, localizado en aproximadamente −2, será eliminado por el filtro de referencia, reduciendo el valor de sobreseñal de la respuesta. Proyecto de controladores El controlador C (s) obtenido es: C (s) = Kc (s + 2, 05)(s + 5, 75) s(s + 20) (159) y el filtro de referencia F (s) con ganancia estatica unitaria se define por la ecuación: F (s) = 2, 05 (s + 5) 5 (s + 2, 05) (160) Propuesta: (proyectar un control para el modelo a baja velocidad y verificar el comportamiento a alta velocidad y vice versa) Proyecto de controladores Debido a la ganancia variable del sistema, la ganancia Kc del controlador no debe ser constante mas una función de la velocidad del vehı́culo (Kc (u)), para que los polos permanezcan en los lugares designados y atiendan los requisitos para toda la faja de velocidad. Ası́ la ganancia variable del controlador irá compensar los cambios de ganancia del sistema debido a variaciones de velocidad del triciclo. Esta ganancia será definida por una función continua, evitando ası́ efectos indeseados que puedan aparecer caso sea utilizada una ley de control con discontinuidades que alternen diferentes ganancias de acuerdo con la velocidad. Proyecto de controladores La tabla siguiente muestra los valores de las ganancias del controlador Kc (ui ) para las velocidades puntuales vi que mantienen los polos del sistema dentro de las especificaciones deseadas para los modelos linearizados en diferentes velocidades. ui 5 7 9 13 15 17 19 21 23 25 27 29 Kc (ui ) 8,5 5,14 3,45 1,61 1,16 0,91 0,71 0,57 0,46 0,36 0,318 0,267 Proyecto de controladores Aplicando la transformación de la ecuación (161), los puntos de Kc (ui ) pueden ser linearizados, resultando en una ganancia del controlador (Klc (ui )). Klc (ui ) = p 1 Kc (ui ) (161) Proyecto de controladores Aproximando la función discretizada Klc (ui ) por una recta, podemos extender la función de los puntos discretos ui para todas las velocidades u. La función de la recta que describe mejor el ganancia para los puntos obtidos es la de la ecuación (162): Klc (u) = −0, 061352 + 0, 0674u (162) Proyecto de controladores Utilizando las ecuaciones (161) y (162) es fácil calcular el valor efectivo de la ganancia del controlador Kc (u), resultando en la ecuación (163). Kc (u) = 1 (Klc (u))2 (163) Proyecto de controladores El diagrama de bloques del controlador PID con compensación estática de la no-linealidad propuesto es el de la figura. Proyecto de controladores Para verificar numericamente la validad de la ley de control propuesta, se combinaron el controlador y el filtro de referencia presentados junto con cada uno de los trece modelos linearizados obtenidos y se analizo el diagrama de polos y ceros de cada uno dos sistemas resultantes, verificando que el sistema es estable para todas las situaciones y que los polos del sistema se encuentran en las posiciones deseadas. Proyecto de controladores Control por realimentación linearizante entrada-salida Ahora será sintetizado un controlador por realimentación linearizante entrada-salida parcial, que actúe en el giro del vehı́culo de forma a estabilizar su ángulo de inclinación. Proyecto de controladores En primer lugar se debe transformar el sistema a ser controlado en una representación de estados a partir de las ecuaciones dinámicas en la forma M(q)q̈ + C q̇ + K (q, q̇)q = F (q, q̇). Se puede hacer esto pre-multiplicando el sistema por la matriz M −1 obteniendo, M(q)−1 [M(q)q̈ + C q̇ + K (q, q̇)q] = M(q)−1 [F (q, q̇)] q̈ + Ca q̇ + Ka (q, q̇)q = Fa (q, q̇) con Ca = M(q)−1 C , Ka = M(q)−1 K (q, q̇) e Fa = M(q)−1 F (q, q̇). Proyecto de controladores Para el caso del modelo de la bicicleta, la transformación es simples y se da de forma directa, con x1 = φ, x2 = φ̇ e x3 = u. ẋ1 = x2 cos(x1 ) 2 x3 δ(t) lh 2nTm (t)ηT 1 − Cxx32 Aρ dm 2m ẋ2 = gsin(x1 ) + ẋ3 = Proyecto de controladores Para el modelo del triciclo, el cálculo de la inversa de M(q) se verifico complejo pues al contrario del modelo de la bicicleta, la matriz de inercia del triciclo no es diagonal y es una función de los estados del sistema. Asi, M(q)−1 es una expresion demasiado grande para ser trabajada sin el auxilio de sistemas computacionales. Proyecto de controladores La representación de estados del sistema del triciclo tiene como base el vector de estados aumentado, qa = (x, ẋ, y , ẏ , z1 , ż1 , z2 , ż2 , z3 , ż3 , z4 , ż4 , ψ, ψ̇, φ, φ̇, θ, θ̇). El objetivo de controlar apenas la variable φ hace con que a técnica de control por linearización parcial sea adecuada. Una vez que el sistema representado por variables de estados ya se encuentra en la forma adecuada dada por la ecuación, ẋ = Ax + Bγ(x)[u − α(x)] (164) se debe probar que a función γ para el estado φ es invertible en todo su dominio. Proyecto de controladores El subsistema que representa la dinámica de la inclinación del vehı́culo (tanto para a bicicleta quanto para el triciclo) puede ser representado en una forma compacta como: ẋ1 = x2 ẋ2 = f (x) + g (x)u y = x1 con x1 = φ, x2 = φ̇, siendo x el vector de estados y u la entrada del sistema. Proyecto de controladores La figura muestra el diagrama de bloques que representa el subsistema de la dinamica de inclinación del vehı́culo junto con el control linearizante. Proyecto de controladores Tomando como salida a variable x1 = φ y calculando ẏ e ÿ se obtiene el grado relativo del sistema ρ = 2. Tomando por base la ecuación, y (2) = ∂(Lf h(x)) [f (x) + g (x)u] = L2f h(x) + Lg Lf h(x)u ∂x (165) que lineariza el sistema, se obtiene: u= 1 Lg Lρ−1 h(x) f [−Lρf h(x) + v ] con L2f h(x) = f (x) Lg Lf h(x) = g (x) 6= 0 (166) Proyecto de controladores Utilizando el resultado anterior y el controlador por realimentación propuesto por la ecuación (166), se consigue linearizar el sistema y se obtiene el mapa entrada-salida. φ̈ = v (167) Garantizando que la referencia r y sus derivadas sean limitadas, y realizando la transformación de variables para incluir la dinamica del error, se puede proyectar la ley de control v que satisfaga los requisitos del sistema. Proyecto de controladores Se debe elegir v de forma a tornar la dinamica del sistema linear estable y que su respuesta sea rapida y sin oscilaciones, que son caracteristicas deseadas para el triciclo. Para tal, debido a la presencia de perturbaciones y de errores de modelado, se propone un controlador por realimentación de estados con integrador. Proyecto de controladores La figura muestra el diagrama de bloques de la estrutura del sistema linearizado con el controlador por realimentación de estados e integrador para rastreamiento de referencia. Proyecto de controladores A partir de la figura y considerando x los estados del sistema, ∆ los estados del integrador, Ke la ganancia de realimentación de los estados y Ki la ganancia de realimentación del integrador, se puede obtener una representación de estados del sistema aumentado que relaciona la entrada de referencia r y la salida medida y . x ẋ B 0 A 0 x ˙ = −C 0 ∆ + 0 u + I r , u = − |Ke {z Ki } ∆ ∆ |{z} |{z} | {z } Ka Aa Ba Ea (168) Proyecto de controladores El problema de control del sistema se resume a definir las ganancias de la matriz Ka tal que el sistema realimentado ẋa = (Ax − Ba Ka )xa + Ea r (169) sea estable y para tal se pueden usar diversas técnicas. En este caso se opto por la tecnica conhecida como LQR. Esta tecnica se basea en la minimización de criterios cuadráticos, associados a la energia de los estados y de la variable de control del sistema que esta siendo proyectado. Proyecto de controladores Considerando el sistema realimentado dado por la ecuación (168) se desea minimizar una función costo, que representa la energia del sistema, definida por la función J: R∞ J = min 0 z(t)T z(t)dt u(t) T xa (t) Q T z(t) z(t) = u(t) NT N R xa (t) u(t) com Q, R e N matrizes de ponderación para xa (t) e u(t). (170) Proyecto de controladores Los elementos de la matriz Q deben ser mayores caso la prioridad sea minimizar la energia de los estados, lo que representará menores oscilaciones del sistema. El cálculo del controlador LQR resuelve la ecuación (170), minimizando la función. Se puede probar que, si existe un minimo de la función, entonces existe una función de Lyapunov P definida positiva con sua derivada Ṗ negativa, garantizando la estabilidade del sistema. Proyecto de controladores Se puede resolver el problema de minimización de una función costo através de la ecuación de Riccati, obteniendo los valores de Ka . Su resolución analitica puede ser complicada, con la complexidad aumentando de acuerdo con la dimension del problema. Sin embargo, existem métodos computaciónais eficientes para sua resolución. Proyecto de controladores En este caso se uso la función lqr() del software Matlab, disponible en la biblioteca Control System Toolbox. Dadas las matrizes del sistema Aa , Ba y las matrizes de ponderación Q e R, la función encuentra la solución para la ecuación de Ricatti (si esta existe), y retorna los valores de Ka que minimizan J. Se puede modificar la respuesta del sistema modificando las matrizes Q e R. Proyecto de controladores En este caso los valores de Q e R fueron definidos de forma empı́rica, ajustando los valores de las matrices de ponderación y observando los resultados en un proceso iterativo de forma a obtener una dinámica mas rápida. Los valores obtenidos fueron: 0, 2 0 0 Q = 0 2 0 , R = 0, 001 (171) 0 0 12 y las ganancias calculados para el controlador fueron Ke = [102, 4 46, 9] e Ki = [−109, 54]. Proyecto de controladores Control por Energy Shaping En esta sección se usa el modelado de las energias cineticas T y potenciales V del sistema para sintetizar un controlador basado en Energy Shaping que estabilize el sistema. Para esto vamos usar las ecuaciones de energia de una bicicleta. La bicicleta incorpora las caracterı́sticas dinámicas de un pendulo invertido, problema similar al encontrado en el triciclo. Proyecto de controladores Controlador Proporciónal-Derivativo basado en passividade El controlador PD basado en pasividad tiene una componente representando energia potencial Vc (q) y una componente para a disipación de energia Fc (q̇). Para que el sistema en lazo cerrado sea globalmente estable es necesario que: La energia potencial deseada del sistema en lazo cerrado Vd , dada por la ecuación: Vd (q) , V(q) + Vc (q) (172) tenga un unico punto de minimo global en q = q∗ (constante) y sea radialmente ilimitada. La función de disipación Fc satisfaga: ∂Fc ∂Fc (0) = 0 y, q̇ > 0, ∀q̇ 6= 0 ∂ q̇ ∂ q̇ (173) Proyecto de controladores Siguiendo esas consideraciones en la elección del controlador se puede probar que el sistema es globalmente asintoticamente estable. Para el caso del triciclo y de la bicicleta, se analizara apenas la estabilidade del ángulo de inclinación φ. Proyecto de controladores Definiendo la acción de control uc en función de la energia potencial del controlador Vc (q) y de un elemento de disipación del controlador Fc (q̇) de acuerdo con a ecuación (174): uc = − ∂Vc ∂Fc (q) − (q̇) ∂q ∂ q̇ (174) tenemos que, con la elección adecuada de las funciones de energia potencial y de disipación deseadas, se obtiene el control a partir de las ecuaciones (172), (173) y (174). Proyecto de controladores En la etapa siguiente, el modelo de la bicicleta será utilizado para sı́ntesis de un controlador. Para el sistema en lazo abierto se encuentran los puntos de equilibrio derivando la energı́a potencial del sistema, ∂Vc (q) =0 ∂q (175) encontrando los puntos de equilibrio en φ = i π, i = ..., −1, 0, 1, .... Derivando la ecuación (175) nuevamente podemos concluir sobre la estabilidade de los puntos de equilibrio, siendo el sistema inestable para φ = 0 y estable para φ = π. Proyecto de controladores Se necesita elegir una función candidata para Vd que modifique la estabilidad del sistema y torne el punto de equilibrio deseado q∗ un mı́nimo de la función. Una función candidata es, 1 Vd (q) = kp q̃ 2 2 com kp > 0 e q̃ , q − q∗ . (176) Proyecto de controladores De forma semejante se puede elegir la función de disipación deseada del sistema que satisfaga las ecuaciones q̇ T ∂Fc ≥ α k q̇c k2 ∂ q̇ (177) y (173). La función propuesta para este caso es la dada por la ecuación (178): 1 (178) Fd (q̇) = kd q̇ 2 2 con Fd (q̇) , F(q̇) + Fc (q̇) (179) y kd > 0. Proyecto de controladores Esta elección de funciones permite reescribir la ecuación (172) como: ∂Fc ∂ (V(q) − Vd (q)) − (q̇) (180) u= ∂q ∂ q̇ siendo que la primeira parte del control es responsable por el energy shaping del sistema y la segunda parte adiciona amortiguamiento. El control estabilizante calculado por la ley de control propuesta se obtiene manipulando 179 y substituyendo (105), (176), (178) en (180), que resulta en: u = −kp (q − q∗ ) − mghsin(q) − kd (q̇ − q̇∗ ) (181) Proyecto de controladores El control propuesto estabiliza el sistema, tornandolo globalmente asintoticamente estable. Sin embargo pueden haber errores en la modelado del sistema. En este caso se consideraron errores en el modelado de la massa m y en la altura del centro de gravedad h. Ademas de este efecto, se consideraron perturbaciones actuantes en el sistema que generan torques que afectan su comportamiento. En estas condiciones, aunque las propiedades entrada-salida no se alteren, no se considera mas el sistema como globalmente asintoticamente estable en el punto de equilibrio deseado (q 6= q∗ ). Proyecto de controladores Adicionando un integrador al control se pueden corrigir los desvios causados por los errores de modelado y por las perturbaciones, haciendo con que el sistema vuelva a seguir la referencia deseada. El integrador es el elemento pasivo mais simples que puede ser incorporado, y su combinación en paralelo con el controlador PD propuesto tambien resulta en un sistema pasivo. Proyecto de controladores La ley de control que se obtiene para el sistema es, uT = −kp (q − q∗ ) − mghsin(q) − kd (q̇ − q̇∗ ) − ki ∗ (q − q∗ ) (182) con kp = 25000, kd = 2500, ki = 15000 y mgh = 4905, ganancias estas obtenidas de forma empirica, que tornan la respuesta dinámica del sistema semejante a la obtenida para el controlador PID. El control uT genera los torques que estabilizan el sistema. Proyecto de controladores Esta variable debe ser convertida en giro, entrada real para el sistema triciclo, através de la transformación: δ= uT l cos(φ)mhu 2 (183) com l siendo el largo del vehı́culo, h la altura del centro de gravedad, m la masa del vehı́culo y u su velocidad longitudinal. Esta función se obtiene através de la ecuación (101), que relaciona el momento generado por el giro con el ángulo δ. Proyecto de controladores Hasta aqui se mostraron los passos utilizados para sintetizar los controladores PID con compensación estática de la no-linealidad, realimentación linearizante y Energy Shaping. Los controladores fueron proyectados para rechazar perturbaciones no medibles del tipo escalon. El controlador PID se ajusto a partir de la linearización del sistema nominal en torno de un punto deseado, y se propuso un controlador con dos grados de liberdade para atender requisitos de performance. Proyecto de controladores El controlador por realimentación linearizante se aplico apenas en una parte del sistema (linearización parcial), obteniendose linearización entrada-salida. Em seguida se estabilizo el sistema através de realimentación de estados con integrador, con ganancias de realimentación calculadas através del processo de minimización de la energia (LQR). El controlador por Energy Shaping se baso en la formulación lagrangeana del modelo del triciclo, modificando las energia potencial y a función de disipación del sistema y adicionando un termino integral para corregir perturbaciones y variaciones parametricas.