Beamer tutorial

Minicurso de modelado y control de un vehı́culo inestable. Nestor Roqueiro Departamento de Automación y Sistemas Universidade Federal de Santa Catarina Florianópolis - SC Brasil CX Postal 476 CEP: 88040-900 Fone: ++55 48 3721 7607 E-mail: [email protected] Colaboración en figuras, textos y proyecto: Prof. Rodrigo de Souza Vieira Ms.C. Marcelo G. de Faria 2012 Sumario Introdución 2 Modelado de un vehı́culo inherentemente inestable. Cinematica Dinámica Modelado de un Vehı́culo de Tres Ruedas Inclinable Modelo simplificado de una bicicleta Semejanzas entre bicicleta y triciclo 3 El Problema de Control. Fundamendación Teórica 1 Control no-linear por realimentación linearizante entrada-salida Seguimento de trayectória Control no-linear via Energy Shaping Proyecto de controladores Controlador de velocidad Generación de referencia PID con compensación estática de la no-linealidad Control por realimentación linearizante entrada-salida Control por Energy Shaping Introdución Inicialmente serán abordados dos temas que se complementan en el análisis de los movimientos de un vehı́culo, la ”Cinemática” y la ”Dinámica”. Basicamente estos son conceptos que se pueden estudiar separadamente, sin embargo su aplicación en conjunto es extremamente productiva, tanto del punto de vista de análisis del comportamiento del vehı́culo, como del punto de vista de control. Introdución La cinemática permite el estudio del movimiento, velocidades y aceleraciones, y la dinámica permite evaluar ademas de estas, también las fuerzas contempladas. Ası́ se puede, de forma bien simple, delimitar la cinemática para problemas en los cuales la trayectoria es el principal punto en cuestión siendo que la dinámica se destina al estudio de los problemas donde las fuerzas y momentos relacionados son el objeto de estudio. Introdución Hay que considerar que cuando se habla de aspectos de movimiento del vehı́culo se debe tener conciencia de como este movimiento se realiza. En este caso, que actuadores se utilizan para realizar el movimiento. Los vehı́culos presentan diferentes posibilidades de movimiento, lo que los divide en dos grandes grupos; Los que se mueven por elementos de rodamiento, Los que se mueven por elementos alternativos. Introdución En el primer caso están los vehı́culos que utilizan como elementos de locomoción: ruedas esteras esferas. En el segundo caso, están los vehı́culos que se mueven por piernas y pistones. Introdución Es importante observar que el modelo empleado como actuador de movimiento del vehı́culo tendrá impacto directo en el estudio de su cinemática y de su dinámica. Otros puntos también importantes a ser considerados son a capacidade de locomoción deseada para el vehı́culo y la facilidad de fabricación. En el caso de los vehı́culos con piernas, su fabricación y el modelo cinemático/dinámico son mas complejos que los de los vehı́culos con ruedas, sin embargo su capacidade de movilidad en terrenos accidentados supera cualquier otro tipo de actuador. Conceptos básicos de Cinematica Conceptos básicos de Cinematica Conceptos básicos de Cinematica Antes de un análisis mas profundo sobre los aspectos cinemáticos, es interesante introducir algunos conceptos básicos, como por ejemplo el concepto de grados de libertad de un vehı́culo. Son considerados grados de libertad la diferencia entre el número de variables que definen el problema (n), y el número de equaciones que definen las restricciones (m). Vale resaltar también que el número de grados de libertad es fijo para cada tipo de problema, siendo función única y exclusivamente del problema en si. Conceptos básicos de Cinematica Imaginando por ejemplo una partı́cula en el plano XY, podemos decir que se puede definir su posición por la ecuación de restricción: x2 + y2 = R2 (1) Para R la distancia de la partı́cula hasta el origem del sistema de coordenadas siendo x e y las coordenadas instantáneas en el plano. De esta forma, existe una ecuación (m = 1) y dos variables (n = 2), lo que define un grado de libertad (n − m). Conceptos básicos de Cinematica Si un sistema tiene un conjunto de n variables y un conjunto de m ecuaciones de restricción en la forma: ϕj = (q1 , q2 , q3 , ..., qn , t) = 0 (2) Para: j = 1, 2..., m. estas restricciones se denominan Restricciones Holonómicas, y se puede resolver el problema considerando la existencia de (n − m) grados de libertad. Conceptos básicos de Cinematica Por otro lado, existen problemas en que ecuaciones de restricción se definen en función de las derivadas de las coordenadas y del tiempo, dadas de forma general como: n X aij dqi + aij dt = 0 (3) i =1 Para j = 1, 2..., m, y aij función de las coordenadas qi y del tiempo. En este caso, se dice que el conjunto de ecuaciones forma un conjunto de Restricciones No Holonómicas. De forma general, sistemas holonómicos son denominados integrables, mientras que los no holonómicos no lo son. Cinematica de los cuerpos rı́gidos Cinematica de los cuerpos rı́gidos Cinematica de los cuerpos rı́gidos El estudio de la cinemática clásica se divide en dos grandes grupos, el de la cinemática de la partı́cula y el de la cinemática de los cuerpos rı́gidos, ambos focalizados en el análisis de las posiciones, velocidades y aceleraciones en relación al tiempo. Mientras el primero se refiere al estudio de la trayectoria de puntos en el espacio, el segundo se restringe a cuerpos rı́gidos, sin considerar los efectos de masa. Cinematica de los cuerpos rı́gidos En el movimiento de un cuerpo rı́gido, existen dos tipos distintos de desplazamiento: translación rotación. En la translación, ocurre el desplazamiento del cuerpo rı́gido de tal forma que, dados dos puntos cualquiera, uniéndolos por un vector, este mantiene la misma dirección, sentido y módulo, en relación a un dado sistema de coordenadas, Cinematica de los cuerpos rı́gidos Matematicamente, dado un punto cualquiera del cuerpo denominado de punto A, unido al punto B, por medio del vector rAB , se puede dar la posición de este último punto como: rB = rA + rAB (4) Derivando la ecuación (4) en relación al tiempo se obtiene: drB drA drAB = + dt dt dt (5) Cinematica de los cuerpos rı́gidos Se puede observar que el vector rAB se mantiene constante la lo largo del tiempo, pues en la cinemática se considera el concepto de cuerpo rı́gido, asi, la componente drAB /dt es nula, de forma que: drA drB = dt dt vA = vB Dado que vA es la velocidad de translación del punto A, vB la velocidad de translación del punto B, se concluye que en un movimiento de translación todos los puntos de um cuerpo mantienen la misma velocidad y consequentemente la misma aceleración. (6) Cinematica de los cuerpos rı́gidos El movimiento de rotación por su vez, hace posible que la posición angular del cuerpo se altere, de tal forma que dados dos puntos unidos por un vector este modifica su dirección en relación a un dado sistema de coordenadas, desde que no sea paralelo ou coincidente con el eje de rotación. Cinematica de los cuerpos rı́gidos Siguiendo el mismo raciocinio dado para la translación de cuerpo rı́gido, admitiendo dos puntos cualquiera A y B, unidos por un vector rAB . Sabiendo también que el punto A está a una distancia dA del eje de rotación tal que el vector rA pueda ser dado en coordenadas polares como: θA rA = (7) dA Para θA el ángulo a partir del origem del sistema de coordenadas polares. Aplicando ahora una rotación δ al vector ra , su nueva posición pasa a ser: θA + δ rA = (8) dA Cinematica de los cuerpos rı́gidos Derivando la nueva posición en relación al tiempo, tenemos:   dθA dδ     + drA dt dt (9) = ddA   dt   dt Como el ángulo θA no varia la lo largo del tiempo pues se trata de la posición inicial del punto A, y tampoco el módulo de dA , la unica variación será del ángulo δ, que pasa la ser llamada de velocidad angular (dδ/dt) del punto A. Cinematica de los cuerpos rı́gidos Dado que el punto B dista del eje de rotación dB y adoptando el mismo raciocinio, de forma que la variación de la posición para este punto se da por:   dθ dδ B     + drB dt dt = (10) ddB   dt   dt Se llega la la conclusión de que para un movimiento de translación la velocidad linear es constante, mientras que para un movimiento de rotación la velocidad angular es constante para todos los puntos. Cinematica de los cuerpos rı́gidos Observando que la velocidad angular es dada como ω = Vr , donde r es el radio de giro, se puede admitir que para los puntos dados: V A = ω · dA V B = ω · dB (11) De esta forma, la velocidad linear de los puntos A y B seran iguais apenas cuando los puntos esten equidistantes del eje de giro, o sea si el vector rAB es paralelo u ortogonal al eje de rotación. Para cualquier otro caso, las velocidades serán diferentes. Cinematica de los cuerpos rı́gidos Se puede también hacer la misma representación por coordenadas cartesianas, de forma que sean relacionadas a las polares por las ecuaciones: x = cos θ · d y = sin θ · d (12) Utilizando matrices de transformación Utilizando matrices de transformación Utilizando matrices de transformación Una forma bastante facil de manipular los valores en una análisis cinemática es hacerlo por medio de la álgebra linear. Para rotacionar un cuerpo en relación a un eje cualquiera, es suficiente determinar la matriz de rotación y aplicarla la los vectores de posicionamento de los puntos, conforme mostrado anteriormente. De la misma forma, en el caso de translación, basta determinar la matriz necesaria para que se ejecute el movimiento . A este tipo de matriz, se le da el nombre de Matriz de Transformación. Utilizando matrices de transformación La aplicación de tales matrices será demostrada en el plano XY, comenzando por la de translación, conforme mostrado en la figura. En este caso, el punto A pasa de una posición rA para uma posición rA + dA . Analizando los componentes de los vectores, se verifica que en coordenadas homogéneas son dados por: en el plano como:    rAX  r rA =  AY  1    rAX + dAX  r + dAY ; rA + dA =  AY  1 (13) Utilizando matrices de transformación De esta forma, se concluye que la matriz que lleva el punto A de la posición 1 para la posición 2, de la figura anterior, es dada por: 1 0 dAX (14) Mtrans = 0 1 dAY 0 0 1 Ası́, el punto A en la posición 2 será dado como: rA2 = Mtrans · rA1 1 0 dAX rA2 = 0 1 dAY 0 0 1 (15)    rAX  ·  rAY  1 Utilizando matrices de transformación Ya para el caso de una rotación en torno de un eje que pasa por el origem, conforme mostrado en la figura, la matriz de rotación será dada por: cos(δ) −sen(δ) 0 Mrot = sen(δ) cos(δ) 0 (16) 0 0 1 Utilizando matrices de transformación Al ocurrir una secuencia de movimientos que puedan ser separados en translaciones y rotaciones, se puede llegar rapidamente a un valor final a partir de la aplicación de las matrices de transformación, sin olvidar que el orden de las operaciones altera el resultado final. Si por ejemplo se aplica una rotación rot1 , una translación trans1 y una rotación rot2 , la posición final será dada por: r2 = Mrot2 · Mtrans1 · Mrot1 · r1 Cinemática aplicada la vehı́culos de tres ruedas Cinemática aplicada la vehı́culos de tres ruedas Cinemática aplicada la vehı́culos de tres ruedas Dada la sucinta presentación de la teorı́a, se puede ahora aplicar a un ejemplo práctico de determinación de posición de un vehı́culo con tres ruedas, conforme mostrado en la figura. Cinemática aplicada la vehı́culos de tres ruedas En este caso, si el vehı́culo se mueve del punto 1 hasta el punto 2, su desplazamiento pasa la ser descripto como la variación da posición del punto A de rA1 la rA2 , que de forma matricial puede ser: rA2 = M · rA1 (17) Cinemática aplicada la vehı́culos de tres ruedas Analizando el vector rAB , mostrado en la figura siguiente, se nota que hubo una rotación y una translación de forma que se paso de un estado 1 para un estado 2. Cinemática aplicada la vehı́culos de tres ruedas Para describir este cambio de posición en primer lugar se debe observar que las matrices de transformación definidas en la sección anterior son deducidas a partir del origem, asi, antes de mas nada el vector rAB necessita ser transladado del estado 1 para el origem, rotacionado y depues transladado para la posición en el estado 2. Cinemática aplicada la vehı́culos de tres ruedas Ası́, dado que: rA1 Se obtiene:    rAx1  r =  Ay 1  1 y rA2    rAx2  r =  Ay 2  1 rAB2 = Mtrans2 · Mrot1 · Mtrans1 · rAB1 (18) (19) Cinemática aplicada la vehı́culos de tres ruedas Para Mtrans1 la matriz translación que mueve el punto A para el origem, Mrot1 la matriz rotación que rotaciona el vector rAB1 en la dirección de rAB2 y Mtrans2 la matriz translación que coloca el punto A del vector rAB2 en la posición rA2 , y substituyendo los valores da: rAB2 1 0 rAx2 = 0 1 rAy 2 0 0 1 cos(δ) −sen(δ) 0 1 0 −rAx1 · sen(δ) cos(δ) 0 · 0 1 −rAy 1 0 0 1 0 0 1 ·rAB1 (20) Cinemática aplicada la vehı́culos de tres ruedas Analizando la ecuación (20) se observa que el orden de las operaciones se de la de la derecha para la izquierda, de forma que en primer lugar se coloca el vector rAB1 en el origem del sistema (por eso el signo negativo en rAx1 e y rAy 1 ). Cinemática aplicada la vehı́culos de tres ruedas Sin embargo, observando el problema anterior, no se describe la trayectoria recorrida, se tiene apenas la definición de la posición inicial y final del objeto, pues no fueron adicionadas las restricciones debidas al movimiento de las ruedas, tópico que será abordado en la sección siguiente. Estimación de trayectoria Estimación de trayectoria Estimación de trayectoria Para estimar la trayectoria del vehı́culo es necesario determinar como será su modelo de giro y como forma de mostrar el concepto matemático, se presentan dos formas de hacer girar un vehı́culo. En primer lugar el concepto de un vehı́culo de esteras, donde la curva se de la por la diferencia entre la velocidad de cada una de sus esteras. Después será estudiado el modelo matemático cinemático para un vehı́culo con una rueda del tipo caster Estimación de trayectoria Imaginando se tratar de un vehı́culo conforme mostrado esquematicamente en la figura siguiente, admitiendo que las esteras se mueven en dirección contraria para efectuar el giro, el centro de giro será dado por el punto medio entre el punto central de contacto de las dos esteras, conforme definido por el punto CG en la figura. Estimación de trayectoria Cabe observar que el centro de giro es función de la geometrı́a de dirección del vehı́culo, siendo por lo tanto diferente para cada topologı́a de locomoción existente. Estimación de trayectoria Sin embargo el giro en el propio centro de giro es muy especifico, siendo mas adecuada la formulación para una trayectoria cualquiera. De esta forma, admitiendo que la velocidad longitudinal (v ) es constante, asi como el radio de la curva (rC ), para un cierto centro de curva (CC) cualquiera, conforme mostrado en la figura, la velocidad de cada estera pasa a ser definida la partir de la determinación de la distancia al centro de curva. Estimación de trayectoria Admitindo el centro de giro en el centro del vehı́culo, una vez que la simetria en relación al eje longitudinal es, en la mayoria de los casos, necesaria, podemos describir el movimiento de cada estera conforme las equaciones siguientes, admitiendo el indice I para la estera interna de la curva y II para la estera externa. b b vI = w · rc − ; vII = w · rc + (21) 2 2 Para b la distancia entre las dos esteras. Estimación de trayectoria Ahora, recordando que la velocidad longitudinal del vehı́culo v se mantiene constante y el radio de curva es conocido pues se desea salir de un punto actual para otro conhecido, se obtiene: w= v rc (22) Y substituyendo la ecuación (22) en las equaciones (21) se obtiene: b b vI = v · 1 − ; vII = v · 1 + (23) 2rc 2rc De esta forma se puede instantaneamente determinar la velocidad de cada estera, manteniendose el módulo de la velocidad linear constante. Estimación de trayectoria De forma general, se tiene una trayectoria donde el radio de curvatura es función del tiempo, y depende de la trayectoria pretendida, asi, se puede escribir genericamente la ecuación (23) como: b vI = v · 1 − 2r (t) (24) b vII = v · 1 + 2r (t) Estimación de trayectoria Esta misma metodologia se aplica a vehı́culos que tienen una rueda de tipo caster. Una rueda es llamada de caster cuando existe una distancia entre el su punto de fijación al chasis del vehı́culo y su eje de rotación, como puede ser visto en la figura. En función del movimiento aplicado al vehı́culo se genera un momento en relación la esta excentricidade que permite con que el ella gire, de forma que siempre se mantenga perpendicular al radio de la curva. Estimación de trayectoria En este caso, la rueda del tipo caster estará siempre con velocidad v mientras la rueda interna la la curva tendrá velocidad vI y la externa vII dadas por las equaciones (23), como mostrado en la figura. De esta forma, una buena forma de medir la velocidad longitudinal del vehı́culo es colocar un encoder en la propia rueda caster, considerando efectos de deslizamiento. Dinámica Dinámica de sistemas mecánicos con masas mobiles Dinámica A continuación se presentan sin demostración dos formulaciones diferentes utilizadas para el modelado de sistemas mecánicos, las Leyes de Newton y, el principio de d’Alembert y las ecuaciones de Lagrange. Dinámica Leis de Newton - Movimento de translación En primer lugar será considerado el movimiento de una partı́cula. Cuando la geometrı́a de un cuerpo rı́gido no influencia el movimiento de este cuerpo la masa puede ser considerada concentrada en un punto (punto de masa). Dinámica Las Leyes de Newton fueron formuladas de la siguiente forma: Primeira ley de Newton: para una masa puntual m moviendose la una velocidad v la cantidad de movimieno I es I = mv , y será constante si el sumatório de fuerzas aplicadas es nulo. Asi, si a una masa m se le aplica una fuerza esta continua en movimiento rectilı́neo uniforme. Segunda ley de Newton: Si una fuerza F actua sobre una masa m entonces: dI dmv = =F dt dt Si la masa es constante la expresión queda: m dv = ma = F dt Dinámica Tercera ley de Newton: Si un cuerpo ejerce una fuerza sobre otro, este ultimo ejerce una fuerza de igual magnitud y sentido contrario. Conocido como principio de ación y reacción. Si la masa puntual se puede mover sin restricciones esta tiene tres grados de libertad que corresponden a las tres coordenadas espaciales. Pero si se fuerza la masa puntual a moverse en una superficie o lı́nea entonces poseerá dos el un grado de libertad, respectivamente. Dinámica Cuando se fuerza un cuerpo a moverse en una superficie o una lı́nea aparecen fuerzas de restricción que son normales a la trayectoria. Habrá fuerzas aplicadas en la dirección del movimiento F(y ) independientes de las restricciones y fuerzas normales a la trayectoria F(z) Reformulando la segunda ley esta queda: ma = F(y ) + F(z) Dinámica Movimento de rotación Em un sistema de coordenadas cartesianas x, y , z se pueden definir los versores, ex , ey , ez Una fuerza F = Fx ex + Fy ey + Fz ez aplicada en un vector de coordenadas r = rx ex + ry ey + rz ez define un torque T=r×F Dinámica La magnitud del torque es: |T| = |r| |F| sen (ϕ) Dinámica Los versores están relacionados por: ex × ex ey × ex ez × ex = 0 = −ez = ey ex × ey ey × ey ez × ey = ez = 0 = −ex ex × ez ey × ez ez × ez = −ey = ex = 0 Por lo tanto se puede representar el torque por: T = r × F = (ry Fz − rz Fy ) ex + (rz Fx − rx Fz ) ey + (rx Fy − ry Fx ) ez T = Tx ex + Ty ey + Tz ez O como un determinante ex T = r × F = rx Fx ey ry Fy ez rz Fz Dinámica Si una masa puntual se mueve a lo largo de una trayectoria con velocidad v y la coordenada en relación al origen se da por el vector r entonces se puede definir momento angular como: L = r × I = r×mv Dinámica A partir de la segunda ley de Newton el torque es: r×m dv =r×F=T dt Derivando el momento angular en relación al tiempo se obtiene: dL d(r×mv) dt = dt v= dr dt ⇒ = dr dt ×mv dr dt ×mv + r×m dv dt =0⇒ dL dt = r×m dv dt = T O sea, la derivada del momento angular en relación la un sistema de coordenadas fijo en el espacio es igual al torque ejercido sobre la masa puntual. Dinámica Princı́pios de mecánica Cuando el sistema mecánico esta compuesto por varios cuerpos rı́gidos se necesita aplicar la ley de Newton a cada cuerpo considerando las fuerzas que mueven el cuerpo en la trayectoria y las normales a la trayectoria (restricciones). Posteriormente, las restricciones deben ser eliminadas operando con las ecuaciones de los otros cuerpos. Otro abordaje, mas adecuado para casos complicados se presenta la continuación. Dinámica Principio de d’Alembert La segunda ley de Newton para una masa constante puede ser escrita: F − ma = 0 Definiendo una fuerza ficticia (no Newtoniana) asociada la la aceleración, FT = −ma se obtiene que, FT + F = 0 Asi, la suma de las fuerzas aplicadas y de la fuerza de inercia es cero (equilibrio dinámico). Dinámica Las fuerzas que restringen el movimiento siempre deben ser definidas, asi, considerando las fuerzas de restricción del movimiento se obtiene que: ma = F(y ) + F(z) Las fuerzas de restricción son, por definición, perpendiculares a la trayectoria. Para un desplazamiento diferencial el trabajo realizado por estas fuerzas será cero. T δWn = F(z) .δr = 0 Dinámica Como ma = F(y ) + F(z) y entonces Definiendo T δWn = F(z) δr = 0 T δWn = F(y ) − ma δr = 0 δW = F(y ) T δr δWT = (FT )T δr = −maT δr Se obtiene que: δW + δWT = 0 Dinámica O sea, el trabajo virtual es nulo cuando se suma el trabajo realizado por las fuerzas aplicadas en la dirección de la trayectoria y el trabajo realizado por la fuerza de d’Alembert. Se debe resaltar que en esta formulación no aparecen explı́citamente las fuerzas de restricción. Dinámica En un sistema formado por varias masas puntuales con restricciones descripto por: (y ) mi r̈i = Fi (z) + Fi ; i = 1, . . . , n P (z) T δri = 0 Fi i T P (y ) δri = 0 Fi − mi r̈i i X (y ) T X δri + Fi −mi r̈iT δri = 0 |i {z δW } |i {z δWT } se puede aplicar el principio de d’Alembert, mostrando que es valido para sistemas de masas puntuales con restricciones, o sea, cuerpos rı́gidos. Dinámica Equaciones de Lagrange Para un sistema de masas puntuales el numero de ecuaciones de Newton es igual al numero masas puntuales. Se puede simplificar el trabajo de modelado utilizando coordenadas generalizadas y el principio del trabajo virtual. Las restricciones reducen el numero de grados de libertad de un sistema y a continuación se considera que la interconexión entre las masas puntuales es rı́gida. Dinámica La posición de cada una de las n masas puntuales se define por n vectores de coordenadas ri , i = 1, ..., n. Si existen r restricciones, entonces el sistema de n masas puntuales esta definido por f = n − r coordenadas generalizadas qj , j = 1, ..., f . Por lo tanto, una masa puntual tiene una posición dada por: ri = ri (q1 , . . . , qj , . . . , qf ) Dinámica Para reformular el principio de d’Alembert se calcula δri = X ∂ri ∂ri ∂ri δqf = δq1 + · · · + δqj ∂q1 ∂qf ∂qj j El trabajo virtual para n masas puntuales será: T P (y ) Fi − mi r̈i δri = 0 i ! T P P (y ) ∂ri Fi − mi r̈i =0 ∂qj δqj j i i     X ∂ri X X (y ) T X ∂ri  mi r̈iT  δqj  − δqj  = 0 Fi ∂qj ∂qj j i j i {z } | {z } | δW δWT Dinámica Alterando el orden de los sumatorios se obtiene: XX X X (y ) T ∂ri ∂ri δqj − δqj = 0 mi r̈iT Fi ∂qj ∂qj j i j i | {z } | {z } δW δWT Y dado que: ∂ri T ∂ri T ∂ ṙi δq mi ṙiT ∂q j = mi r̈i ∂qj δqj + mi ṙi ∂qj δqj j ∂ ṙi ∂ri ∂ri d δqj = dt δqj − mi ṙiT ∂q δqj mi ṙiT ∂q mi r̈iT ∂q j j j d dt Aplicando la regra de la cadena X ∂ri δqj dri = dt ∂qj dt j Y derivando en relación q̇j se obtiene; ∂ṙi ∂ri = ∂ q̇j ∂qj Dinámica Y asi, ∂ri mi r̈iT ∂q δqj = j ∂ri δqj = mi r̈iT ∂q j d dt d dt ∂ri T ∂ ṙi δq mi ṙiT ∂q j − mi ṙi ∂qj δqj j 1 1 ∂ ∂ T T ṙ m ṙ − ∂q i i i ∂ q̇j 2 mi ṙi ṙi 2 j Dinámica La energia cinética de n masas puntuales es: P1 T Ek = 2 mi ṙi ṙi i P ∂ri d ∂Ek = dt mi r̈iT ∂q ∂ q̇j − j i ∂Ek ∂qj Dinámica Definiendo fuerza generalizada en la dirección qj X (y ) T ∂ri X d ∂Ek ∂Ek Fi Qj = ⇒ Qj − + δqj = 0 ∂qj dt ∂ q̇j ∂qj i j Como las coordenadas generalizadas son independientes cada sumando debe ser nulo, asi se obtiene: ∂Ek d ∂Ek − = Qj ; dt ∂ q̇j ∂qj Que son las ecuaciones de Lagrange j = 1, . . . , f Dinámica Considerando el trabajo virtual de las fuerzas aplicadas (y ) Fi se obtiene δW = X T (y ) Fi δri i y T (y ) P ∂ri ∂qj δqj j i P X T (y ) ∂ri Fi δqj ∂qj j i δW = δW = P Fi | δW = {z Qj P j Qj δqj } Dinámica Se puede calcular el trabajo virtual de las fuerzas aplicadas a partir de las fuerzas generalizadas y de los desplazamientos virtuales. Si existe una energı́a potencial asociada a las fuerzas aplicadas entonces δW = −δEp ∂E δEp (qi ) = ∂q1p δq1 + · · · + ∂E Qj = − ∂qpj d ∂Ek dt ∂ q̇j − ∂Ek ∂qj + ∂Ep ∂qj =0 ∂Ep ∂qf δqf = P ∂Ep j ∂qj δqj Dinámica Se define la función de Lagrange por L = Ek − Ep Como la energia potencial no depende de q̇j ∂Ep =0 ∂ q̇j E entonces la ecuación de Lagrange para sistemas conservativos es: d ∂L ∂L − = 0; dt ∂ q̇j ∂qj j = 1, . . . , f Para obtener las ecuaciones de movimiento es necesario explicitar la energia cinética y potencial en función de las coordenadas generalizadas y calcular las derivadas. Dinámica Forma matricial del sistema dinámico Si la posición de las masas no depende explı́citamente del tiempo, si las fuerzas son conservativas y si el sistema de coordenadas generalizadas no esta restringido la obtención de las ecuaciones dinámicas a partir de la formulación Lagrangeana es mas simple. A este tipo de sistemas de les denomina sistemas naturales (mas detalles en ”Methods of Analytical Dynamics”, Meirovitch, pg 77). Sin embargo podemos considerar fuerzas disipativas proporcionales a la velocidad (Función disipativa de Rayleygh, pg. 88) y aun asi obtener un modelado mas simple. Dinámica En este caso se pueden escribir las ecuaciones dinámicas como, Mq̈(t) + Cq̇(t) + Kq(t) = F(t) (25) Siendo M la matriz de inercia, C la matriz de amortiguamiento, K la matriz de rigidez, q el vector de grados de libertad y F el vector de excitación. Dinámica Se pueden calcular los elementos de M como: mij = ∂2T ∂ q̇i ∂ q̇j (26) De forma análoga se puede definir la matriz de amortiguamiento por: ∂2ℑ (27) cij = ∂ q̇i ∂ q̇j Y lo mismo sucede con la matriz de rigidez dada por: kij = ∂2U ∂qi ∂qj (28) Dinámica Se pueden incorporar otras caracterı́sticas al modelo a partir de las particularidades del problema a tratar y se pueden obtener modelos con diferentes grados de complejidad, cabiendo al modelador escoger el mas adecuado. Vehı́culo de Tres Ruedas Inclinable Modelado de un Vehı́culo de Tres Ruedas Inclinable Vehı́culo de Tres Ruedas Inclinable En este proyecto se utilizo un abordaje multicuerpo y el punto de partida para análisis pasa a ser la definición de las masas del modelo, RW– Rueda trasera MC MC– Chassis principal RFW– Rueda delantera derecha RW LFW RFW LFW – Rueda delantera izquierda Vehı́culo de Tres Ruedas Inclinable Para estos cuerpos, utilizaremos como sistema de coordenadas inercial uno con origen en el punto de contacto de la rueda trasera con el suelo. La dirección positiva de cada eje será respectivamente, para adelante, para la izquierda y para arriba, para los ejes X, Y y Z. Z Y X Vehı́culo de Tres Ruedas Inclinable A partir de estas definiciones determinaremos las velocidades de cada una de las masas del modelo, que cuenta con 9 grados de libertad, dado que consideramos que todos los cuerpos tienen movimientos verticales independientes permitiendo ası́ simular suspensiones. Movimiento longitudinal (x) Movimiento transversal (y ) Rotación eje Z (ψ) Movimiento vertical (z1 ) Rotación eje X (ϕ) Movimiento vertical (z2 ) Rotación eje Y (cuerpo principal) (θ) Movimiento vertical (z3 ) Movimiento vertical (z4 ) Obs: La rotación del cuerpo central en torno de su eje transversal provoca un momento interfiriendo en el comportamiento de las suspensiones delantera y trasera. Vehı́culo de Tres Ruedas Inclinable Ahora trabajaremos en la definición de las velocidades para cada uno de los cuerpos descriptos en la sección anterior y por lo tanto comenzaremos determinando las velocidades longitudinales en X , Y y Z , y angulares en relación la los referidos ejes. Vehı́culo de Tres Ruedas Inclinable Para la rueda trasera podemos iniciar a partir de la definición de las velocidades de la figura. w1 wz1 Z v1 h1 Y u1 X wy 1 wx1 En este caso observamos dos caracterı́sticas importantes. Primero, la rotación en el eje Z no produce ningún efecto en las velocidades de traslación pues el centro de masas está exactamente en el referido eje, sobre el origen del sistema. Vehı́culo de Tres Ruedas Inclinable Otra constatación es que si aplicamos una variación angular de ϕ en relación al eje X , surgen componentes de traslación, Z ϕ v1ϕ h1 w1ϕ De esta forma existe una velocidad en el plano Y − Z debida al movimiento rotativo en relación al eje X , que sale del papel, y que puede ser descompuesta en dos componentes. Vehı́culo de Tres Ruedas Inclinable Una componente en la dirección negativa de Y dada por: v1ϕ = h1 ϕ̇ cos(ϕ) (29) Y otra en la dirección negativa de Z dada por: w1ϕ = h1 ϕ̇sen(ϕ) (30) En relación a la rotación en torno del eje Y tendremos, u1α = h1 α̇ cos(α) (31) Y otra en la dirección negativa de Z dada por: w1α = h1 α̇sen(α) (32) ϕ v1ϕ Z h1 w1ϕ Vehı́culo de Tres Ruedas Inclinable Ası́ las velocidades longitudinales para la rueda trasera son: u1 = u + h1 α̇ cos(α) v1 = v − h1 ϕ̇ cos(ϕ) w1 = w1 − h1 ϕ̇sen(ϕ) − h1 α̇sen(α) (33) De la misma manera las velocidades angulares son dadas por: ωx1 = ϕ̇ ωy 1 = α̇ ωz1 = ψ̇ (34) Vehı́culo de Tres Ruedas Inclinable Seguimos el mismo raciocinio para el cuerpo central a partir de su geometrı́a básica. Z Y a2 h2 X En este caso, aplicando una rotación positiva en el eje X (ϕ) y en el eje Z (ψ), tendremos una modifcación de la velocidad transversal, una vez que el centro de masa no está sobre el eje de rotación del sistema de coordenadas. Vehı́culo de Tres Ruedas Inclinable Las componentes serán v2ψ = a2 ψ̇ (35) v2ϕ = −h2 ϕ̇ cos(ϕ) (36) y De la misma forma, la velocidad vertical será modificada por una rotación positiva en el eje X (ϕ), y estará definida por: w2ϕ = −h2 ϕ̇sen(ϕ) (37) Vehı́culo de Tres Ruedas Inclinable Ademas, observando la Figura podemos asegurar que la variación del ángulo (α) (inclinación del terreno) afectara las velocidades vertical y longitudinal del vehı́culo, de forma que, z θ h2 X a2 w2α q = − h22 + a22 α̇sen(α) u2α = q h22 + a22 α̇ cos(α) (38) (39) Vehı́culo de Tres Ruedas Inclinable Por lo tanto, las ecuaciones de las velocidades lineares para el cuerpo principal serán: q u2 = u + h22 + a22 α̇ cos(α) v2 = v + a2 ψ̇ − h2 φ̇ cos(φ) q w2 = w2 − h2 φ̇sen(φ) − h22 + (40) a22 α̇sen(α) con la velocidad w del vehı́culo como siendo la del cuerpo principal. Las velocidades angulares serán: z ωx2 = ϕ̇ ωy 2 = θ̇ + α̇ ωz2 = ψ̇ θ (41) a2 h2 X Vehı́culo de Tres Ruedas Inclinable Para la rueda delantera derecha tenemos desplazamientos con relación a los tres ejes, lo que significa decir que tendremos componentes debido a las rotaciones en las tres direcciones. Z Y X h4 h3 a4 b4 La velocidad en la dirección X será modificada por rotaciones sobre el eje Z e Y , u3α = u3ψ = b3 ψ̇ (42) q (43) h32 + a32 α̇ cos(α) Vehı́culo de Tres Ruedas Inclinable Para este caso las componentes de la velocidad transversal serán, v3ψ = a3 ψ̇ (44) v3ϕ = −h3 ϕ̇ cos(ϕ) (45) La velocidad vertical será modificada debido a la rotación en relación al eje X , w3ϕ = −h3 ϕ̇sen(ϕ) (46) y en relación al eje Y , q w3α = − h32 + a32 α̇sen(α) (47) Vehı́culo de Tres Ruedas Inclinable Ası́, las velocidades lineares para la rueda delantera derecha serán: q u3 = u + b3 ψ̇ + h32 + a32 α̇ cos(α) (48) v3 = v + a3 ψ̇ − h3 ϕ̇ cos(ϕ) q w3 = w3 − h3 ϕ̇sen(ϕ) − h32 + a32 α̇sen(α) De la misma forma las velocidades angulares serán: ωx3 = ϕ̇ ωy 3 = α̇ ωz3 = ψ̇ (49) Vehı́culo de Tres Ruedas Inclinable Para la rueda delantera izquierda el raciocı́nio es el mismo que para la rueda delantera derecha, apenas con el cambio de signo en la componente en el eje X y Z . De esta forma las componentes para esta masa son: q u4 = u − b4 ψ̇ + h42 + a42 α̇ cos(α) (50) v4 = v + a4 ψ̇ − h4 ϕ̇ cos(ϕ) q w4 = w4 − h4 ϕ̇sen(ϕ) − h42 + a42 α̇sen(α) De la misma forma, las velocidades angulares serán: ωx4 = ϕ̇ ωy 4 = α̇ ωz4 = ψ̇ (51) Definición de las energias Energia cinética Definidas las velocidades de las cuatro masas del modelo, ahora se deben determinar las energı́as cinética y potencial del vehı́culo. De la Dinámica se define energia cinetica para sistemas multicuerpos como: T = 1 2 1 2 4 P k=1 4 P k=1 4 P k=1 mk (uk2 + vk2 + wk2 )+ (Ix ωx2 )k + (Iy ωy2 )k + (Iz ωz2 )k − (Ixy ωx ωy )k + (Ixz ωx ωz )k + (Iyz ωy ωz )k (52) Substituyendo ahora los valores de las velocidades dadas por las ecuaciones 33, 34, 40, 41, 48, 49, 50 y 51 en la ecuación 52, obtenemos la ecuación de la enegia cinética. Definición de las energias Energia potencial En primer lugar se necesita determinar el termino debido a la deformación de los resortes de la suspensión del vehı́culo, que de forma general se define por: 1 Us = kδ2 2 (53) Con δ siendo la deformación del resorte y k siendo su constante de rigidez. Debemos considerar que el vehı́culo cuenta con tres ruedas y con un resorte actuando en cada una, de esta forma la energı́a potencial almacenada en los resortes será: 1 U1 = (k1 δ12 + k3 δ32 + k4 δ42 ) 2 (54) Definición de las energias Para definir la ecuación de la energı́a potencial, se debe tener en cuenta que la transferencia de carga de un eje para el otro promueve una tracción en el resorte de un eje al mismo tiempo que comprime los del otro. Definición de las energias Es interesante que relaciónemos la deformación en el resorte con el ángulo θ, que es una variable del modelo. δp θ a l tg θ = δ4p δ1p δ3p = = (l − a2 ) (l − a2 ) a2 (55) Para θ pequeño vale, θ= δ3p δ4p δ1p = = (l − a2 ) (l − a2 ) a2 δ3p = δ4p = −θ (l − a2 ) δ1p = θa2 (56) (57) Definición de las energias Por lo tanto la energı́a potencial debido la variaciones en θ y movimiento vertical del cuerpo principal será: Up = 12 (k1 (z2 − z1 + θa2 )2 + k3 (z2 − z3 − θ(l − a2 ))2 +k4 (z2 − z4 − θ(l − a2 ))2 ) (58) Definición de las energias La deformación de los neumáticos define los desplazamientos: δ1v = z1 , δ3v = z3 , δ4v = z4 , (59) Y la energı́a potencial asociada es, 1 (kp (z1 )2 + kp (z3 )2 + kp (z4 )2 ) 2 con kp siendo la constante de rigidez del neumático. Uv = (60) De esta forma, la energia almacenada en los sistemas elásticos es: U1 = Uv + Up (61) Definición de las energias Como no hay resistencia a la rotación en relación al eje X , tenemos también una caracterı́stica de péndulo invertido, cuja tendencia es del vehı́culo desplazarse angularmente en dirección al suelo. De esta forma, tendremos un termino de la energı́a potencial a partir de este efecto dado por: U2 = m2 gcos(α)h2 (cos(ϕ)) (62) Como la masa del cuerpo principal es mucho mayor que la de los demás cuerpos, admitimos su energı́a potencial como la del vehı́culo. Definición de las energias De esta forma la energı́a potencial total del sistema será la suma de las ecuaciones 61 y 62. U = 12 (k1 (z2 − z1 + θa2 )2 + k3 (z2 − z3 − θ(l − a2 ))2 + k4 (z2 − z4 − θ(l − a2 ))2 )+ 1 2 2 2 2 (kp (z1 ) + kp (z3 ) + kp (z4 ) )+ m2 gcos(α)(h2 + z2 )(cos(ϕ)) (63) Definición de las energias Finalizando con la definición de las energı́as, tenemos que definir la Función Disipativa de Rayleygh, que en su forma general es: n ℑ= n 1 XX cij q̇i q̇j 2 (64) i =1 j=1 Para cij la constante de amortiguamiento referida a las derivadas temporales de los grados de libertad qi y qj Definición de las energias Sabiendo que el vector de grados de libertad está dado por, qT = {x, y , z1 , z2 , z3 , z4 , ψ, ϕ, θ, }T (65) y que habrá amortiguamiento apenas en los amortiguadores, o sea, solamente en la dirección Z , podemos determinar los valores de cij como todos nulos, con excepción de c33 , c44 ,c55 , c66 y c99 , pues son estas variables que causan movimiento vertical. Definición de las energias Las velocidades que producirán disipación en los amortiguadores son: Amortiguador rueda trasera (ż2 − ż1 ) a2 θ̇ (66) Amortiguador rueda delantera derecha (ż2 − ż3 ) (l − a2 )θ̇ b3 φ̇ (67) Amortiguador rueda delantera izquierda (ż2 − ż4 ) (l − a2 )θ̇ b4 φ̇ (68) Definición de las energias De esta forma la función disipativa de Rayleygh es: ℑ = 21 c1 ((ż2 − ż1 )2 + (a2 θ̇)2 ) + 12 c3 ((ż2 − ż3 )2 + ((l − a2 )θ̇)2 + 21 c4 ((ż2 − ż4 )2 + ((l − a2 )θ̇)2 donde ci es la constante del amortiguador de la i-ésima rueda. (69) Definición de las fuerzas externas El próximo paso es la definición de las fuerzas externas actuantes en el vehı́culo que están representadas por el vector, F(t)T = {Fx , Fy , Fz1 , Fz2 , Fz3 , Fz4 , Mψ , Mϕ , Mθ }T (70) La fuerza Fi produce efectos en la i -ésima dirección, y el momento Mj en la j-ésima rotación. Definición de las fuerzas externas - Fx Fx Definición de las fuerzas externas - Fx Para un vehı́culo la fuerza máxima de tracción será dada por el producto de la carga normal (N) al suelo y por el coeficiente de rozamiento (f ) en la interface neumático-suelo, o sea: Ft max = Nf (71) El torque aplicado en la rueda no puede superar el torque maximo definido por Ft max . Por lo tanto podemos admitir que la fuerza de tracción varia de 0 hasta el valor de Ft max y, de esta forma, la fuerza en la dirección X será dada por la fuerza de tracción en la rueda trasera, menos la resistencia aerodinámica, la resistencia al rodado de los neumáticos y la fuerza de frenado Fbr . Fx = FT − RL a − RR − mgsen(α) − Fbr (72) Definición de las fuerzas externas - Fx La fuerza de tracción (FT ) puede ser determinada por, FT = 2nTm ηT d (73) Para n la relación de transmisión, Tm el torque disponible del motor, d el diametro dinamico del neumático y ηT el rendimiento de la transmisión. El diametro dinamico del neumático difiere de su valor nominal y puede ser escrito como, d = 0.9588dn Para dn siendo el diámetro nominal del neumático. (74) Definición de las fuerzas externas - Fx La resistencia aerodinámica puede ser definida como, RL a = 1 Cx u 2 Aρ 2 (75) Para Cx el coeficiente de forma del vehı́culo, u la velocidad longitudinal, A el area frontal proyectada y ρ la densidad del aire. Definición de las fuerzas externas - Fx Las resistencias de rodado pueden ser definidas como la fuerza producida por la deformación de la interface neumático/suelo. Al rodar un neumático sobre el suelo existen de los regiones distintas, la primera donde el neumático se comprime al tocar el suelo y la segunda cuando deja el suelo y se expande. Definición de las fuerzas externas - Fx Esta deformación tiene un efecto similar al de la deformación de un resorte, absorbiendo energı́a de rodado del vehı́culo y puede ser descripta por la ecuación: R R = fR N (76) Para N la fuerza normal al suelo y fR el coeficiente de resistencia al rodado, calculado experimentalmente. Un valor recomendado en la literatura es 0, 01 como una buena aproximación para este coeficiente. Expandiendo la ecuación (76) para las tres ruedas, tendremos: RR = RR1 + RR3 + RR4 (77) Definición de las fuerzas externas - Fx De esta forma, colocando las ecuaciones 73,75,76 y 77 y adicionando la fuerza de frenado Fbr en la ecuación 72 tendremos: Fx = 2nTm d ηT − 12 Cx u 2 Aρ − fR (N1 + N3 + N4 ) − mgsenα − Fbr (78) Definición de las fuerzas externas - Fy Fy Definición de las fuerzas externas - Fy Para el segundo elemento, Fy , debemos analizar lo que sucede con el neumático en el momento en que comienza a hacer una trayectoria con una componente transversal. A partir de la vista superior de la rueda delantera, podemos percibir que se pueden definir tres ángulos en esta situación, δ, que es el angulo de giro de las ruedas delanteras, θvf , que es el angulo del vector velocidad, y αf que es el angulo de deslizamiento. αf θvf v δ Y de esta forma, αf = δ − θvf (79) Definición de las fuerzas externas - Fy Como en el eje trasero el angulo de giro es nulo, partiendo del mismo princı́pio: αt = −θvt (80) Para θvt el angulo del vector velocidad en el eje trasero. De acuerdo con los valores de estos ángulos se puede describir la curva caracterı́stica del neumático conforme el diagrama de la formula magica de Pacejka. F γ αP Definición de las fuerzas externas - Fy Se observa que para pequeños ángulos se puede considerar comportamiento linear, de forma que se puede describir la relación entre ángulo de deslizamiento y carga lateral por: F γ Fy = BCDαP (81) αP Donde B, C y D son coeficientes de la curva caracterı́stica del neumático. Este produto es tambien conocido como coeficiente de rigidez de curva (CαP ) y es el propio coeficiente angular de la recta que aproxima αP = 0 (82) Definición de las fuerzas externas - Fy De esta forma las fuerzas laterales actuantes pasan a ser definidas como: Fy = f (αP ) = CαP αP (83) Pacejka también define que: αPdiant = δ − v + ad ψ̇ − e δ̇ u (84) v − at ψ̇ (85) u Para ad distancia longitudinal del eje delantero al centro de giro, at distancia longitudinal del eje trasero al centro de giro y e caster de las ruedas delanteras. αPtras = − Definición de las fuerzas externas - Fy Ası́, podemos definir la fuerza lateral de la ecuación 83 como: h i δ̇ Fyd = CαPdiant δ − v +aψ̇−e iu h (86) v −aψ̇ Fyt = CαPtras − u La variación del ángulo de giro puede ser considerada lenta y por lo tanto δ̇ = 0. De esta forma, se puede escribir la ecuación 86 como: h i ψ̇ Fyd = CαPdiant δ − v +a h iu v −aψ̇ Fyt = CαPtras − u (87) Definición de las fuerzas externas - Fy Considerando que puede haber viento lateral, y que el área transversal es At , el coeficiente de arrastre transversal es Cxt y la velocidad del viento es Vvent , la fuerza en el eje y será: a a v − 23 ψ̇ v + 23 ψ̇ − CαPtras + Fy = 2CαPdiant δ − u u (88) 2 + ρCxt At cos(φ)V2vent sign(Vvent ) Definición de las fuerzas externas Fz1 , Fz2 , Fz3 , Fz4 Fz1, Fz2, Fz3, Fz4 Definición de las fuerzas externas Fz1 , Fz2 , Fz3 , Fz4 El tercer, cuarto, quinto y sexto elemento del vector de fuerzas será dado por las fuerzas en la dirección vertical del vehı́culo en cada rueda y en el cuerpo central, Fz1 = kp zp1 (89) Fz2 = 0 (90) Fz3 = kp zp3 (91) Fz4 = kp zp4 (92) con zpi siendo la rugosidad del suelo bajo la rueda i . Definición de las fuerzas externas - Mψ Mψ Definición de las fuerzas externas - Mψ El septimo elemento del vector F(t) puede ser definido a partir del análisis de la figura siguiente, replacements Z Y X a4 Fy 4 Fy 3 Como el vehı́culo gira en relación al eje Z y este pasa por el punto de contacto del neumático con el suelo, podemos decir que el momento responsable por el ángulo de giro será función de las fuerzas laterales actuantes en los neumáticos delanteros, definidas como Fy3 para el neumático delantero derecho y Fy4 para el izquierdo. Definición de las fuerzas externas - Mψ Como la distancia entre el punto de actuación de estas fuerzas y el eje Z es a3 = a4 , el momento Mψ es, a3 Mψ = 2 CalfaP 2 v + a23 ψ̇ δ− u ! a3 − CalfaP 2 v − a23 ψ̇ u ! (93) En este caso no será considerado el efecto del viento pues depende del formato del vehı́culo. Definición de las fuerzas externas - Mϕ Mϕ Definición de las fuerzas externas - Mϕ Ya para el octavo elemento, el par capaz de girarlo en torno del eje X , no tendremos la actuación de la transferencia de carga entre las de los ruedas del eje delantero pues el vehı́culo inclina. Siendo CR el centro de rolling y hr la distancia del centro de gravedad al eje de rolling . En este caso especı́fico, debido a la suspension ser por duplo A y los brazos ser paralelos, el CR está en el suelo y hr = h. La fuerza de inercia será: Fc = mψ̇ 2 r (94) Para m la masa del vehı́culo, ψ̇ la velocidad de rotación en torno del eje Z y r el radio de curva. Definición de las fuerzas externas - Mϕ Para pequeños ángulos de deslizamiento podemos admitir que: u r (95) 1 δ = r l (96) ψ̇ = y, con, l δ Substituyendo (97) y (95) en (94) , tendremos: 2 2 2 u 2 l u δ u δ l =m =m Fc = m 2 r δ l δ l r= (97) (98) Considerando la proyección de la fuerza (98) en la normal al plano de la rueda y multiplicando por la altura del centro de gravedad, tendremos el valor del momento en torno del eje X , debido a Fc . Definición de las fuerzas externas - Mϕ El viento lateral ejerce un momento dado por: 2 sign(V ρCxt At cos(ϕ)h2 Vvent vent ) (99) 2 Las fuerzas ejercidas por el suelo en las ruedas delanteras producen un momento: − −b3 Fp3 + b4 Fp4 (100) De esta forma, el momento en torno del eje X será, Mϕ = mu 2 δcos(ϕ)h2 l − 2 sign(V ρCxt At cos(ϕ)h2 Vvent vent ) 2 − b3 Fp3 + b4 Fp4 (101) Definición de las fuerzas externas - Mθ Mθ Definición de las fuerzas externas - Mθ Observando la figura siguiente se puede definir el noveno elemento del vector F como, z θ h2 F a2 Mθ = Fbr h2 − F 2nTm ηT h2 d X (102) Definición de las fuerzas externas Por fin, asociando las ecuaciones (78), (88), (89), (90), (91), (92), (93), (101) y (102) el vector de fuerzas (70) pasa a ser:  2nTm 1 2  T − 2 Cx u Aρ  d η a3 − mgsenα − Fbr2 − fR mgcos(α)  a  v− 2 ψ̇ v+ 23 ψ̇ ρC A cos(φ)Vvent sign(Vvent )   − CαP + xt t 2CαP δ − u  u 2     k z p p1      0 kp zp3   k  p zp4 a3  a3    2 a23 CαP δ − v+u2 ψ̇ − a23 CαP v−u2 ψ̇    2  ρCxt At cos(φ)h2 Vvent sign(Vvent ) mu 2 δcos(φ)h2   − − b3 Fp3 + b4 Fp4  l 2   2nTm Fbr h2 − d ηT h2                                  (103) Modelo simplificado de una bicicleta Trabajo propuesto Modelar una bicicleta como una aproximación al modelo del triciclo presentado anteriormente. Para el modelo simplificado de la bicicleta, serán considerados apenas el movimiento longitudinal y de rotación en relación al eje X (q = {x, φ}), mostrados en la figura con h la altura del centro de gravedad de la bicicleta y m la sua massa. Modelo simplificado de una bicicleta Una solución Para estos grados de libertad, es facil verificar que la energia cinética de la bicicleta se da por la ecuación 104: T = 1 (hmφ̇2 + mẋ 2 ) 2 (104) La primeira parcela del lado izquierdo de la ecuación corresponde a la energia de rotación en torno del eje X de movimiento, mientras que la segunda parcela corresponde a la energia del movimiento longitudinal del vehı́culo. Modelo simplificado de una bicicleta La energı́a potencial solamente puede ser acumulada en forma de energı́a potencial gravitacional, ya que este modelo no cuenta con ningún otro elemento acumulador. Por lo tanto, se define por la ecuación, V = mghcos(φ) (105) com g siendo la aceleración de la gravedad. Modelo simplificado de una bicicleta A partir de las energias potenciales y cinéticas de la bicicleta se pueden obtener las ecuaciones diferenciales que definen la dinámica del modelo através del cálculo del Lagrangeano. El Lagrangeano L del sistema se define por la ecuación, 1 L = T − V = (hmφ̇2 + mẋ 2 ) − mghcos(φ) 2 (106) Modelo simplificado de una bicicleta Las ecuaciones dinámicas del sistema se pueden obtener a partir de L através de la relación, ∂L d ∂L =F (107) − dt ∂ q̇ ∂q com F representando el vector de entradas (fuerzas y momentos) actuando en el sistema. Modelo simplificado de una bicicleta Se puede calcular cada un dos elementos de la ecuación 107, obteniendo: ∂L = mẋ ∂ ẋ ∂L = mh2 φ̇ ∂ φ̇ ∂L =0 ∂x ∂L = mghsin(φ) ∂φ ∂L d = mẍ dt ∂ ẋ d ∂L = mh2 φ̈ dt ∂ φ̇ (108) Modelo simplificado de una bicicleta Como resultado se obtiene el modelo dinámico dado por las ecuaciones 109 y 110: mh2 φ̈(t) − mhgsin(φ(t)) = g1 (u, δ) (109) mu̇(t) = g2 (Tm , u) (110) La función g1 (u, δ) describe el momento externo aplicado al sistema, y se la puede definir de manera semejante a la utilizada en el modelado del triciclo, pues este también depende de la geometrı́a del vehı́culo. Modelo simplificado de una bicicleta Ası́, utilizando la ecuación (98) que define el momento de rotación en φ multiplicada por la altura del centro de gravedad, la ecuación 109 pasa a ser escrita como: φ̈(t) = g cos(φ(t)) 2 sin(φ(t)) + u (t)δ(t) h lh (111) Modelo simplificado de una bicicleta De manera análoga, la función g2 (Tm , u) representa las fuerzas externas actuando en la dirección del movimiento longitudinal, y se la puede substituir por la formulación de fuerza utilizada en el modelado del triciclo, con una parcela responsable por la fuerza de tracción aplicada y otra indicando la fuerza de arrastre aerodinámico. De esta forma, la ecuación (110) pasa a ser: u̇(t) = 1 2nηT Tm (t) − Cx Aρu 2 (t) dm 2m (112) Modelo simplificado de una bicicleta Modelo mas realista Para tornar este modelo simplificado mais próximo del modelo del triciclo, se adiciona amortiguamiento al movimiento rotacional φ de la bicicleta. Los amortiguadores lineares, existentes en el triciclo, se pueden aproximar por un amortiguador torsional equivalente igualando el trabajo realizado por los dos mecanismos. El trabajo W del amortiguador linear del triciclo quando ocurre una inclinación φ es dada por: 2 b W = C φ̇φ 2 (113) com (C ) el coeficiente de amortiguamiento y b2 la distancia entre el centro de rolling del vehı́culo en el eje X y el amortiguador. Modelo simplificado de una bicicleta En este cálculo, se asumió que la posición del amortiguador coincide con la posición de la rueda para simplificar el problema. El trabajo equivalente de un amortiguador torcional es: Wequiv = Ct φ̇φ (114) com (Ct ) del amortiguamiento torcional equivalente. Igualando los trabajos de los dos amortiguadores, se puede obtener el valor del amortiguador torcional equivalente. Considerando los dos amortiguadores existentes en el triciclo, el valor del amortiguamiento torcional equivalente se puede calcular como: Ct = 2C 2 b 2 (115) Modelo simplificado de una bicicleta Adicionando amortiguamiento al movimiento de rotación en torno del eje X del modelo de la bicicleta, se obtiene la ecuación (116), que representa la dinámica de inclinación de la bicicleta, φ̈(t) = g Ct cos(φ(t)) 2 sin(φ(t)) − φ̇ + u (t)δ(t) h mh lh (116) Semejanzas entre bicicleta y triciclo Se puede facilitar bastante el proyecto de controladores y el análisis de los sistemas en lazo cerrado através del uso de modelos simplificados. Es claro que esta ventaja proviene del sacrificio de dinámicas del sistema que no serán modeladas. Dos variables son de mayor interes: el ángulo de inclinación φ y la velocidad u. Por lo tanto se propone el modelo de una bicicleta descripto por las ecuaciones (111) y (112) como una simplificación del modelo del triciclo. Semejanzas entre bicicleta y triciclo La comparación entre los dos modelos da informaciones sobre sus comportamientos. A seguir se presentan los resultados obtidos. Para realizar las simulaciones, una vez que los dos sistemas son inestables en lazo abierto, se utilizo un controlador PID con compensación estática de la ganancia no lineal para estabilizar el sistema. Este controlador será detallado posteriormente. Semejanzas entre bicicleta y triciclo Para la simulación mostrada en la figura se considera una entrada de giro aplicado por el conductor de δr = 0, 1rad para la izquierda y para la derecha a una velocidad constante u = 10m/s. Se controla la velocidad através de un controlador por modos deslizantes que será descripto posteriormente. Semejanzas entre bicicleta y triciclo El gráfico muestra que el comportamiento dinámico de los sistemas presenta semejanzas con los mismos valores de φ en régimen. Se puede explicar la diferencia entre los comportamientos por la ausencia de interacción entre las ruedas frontales y el cuerpo del vehı́culo en el modelo de la bicicleta Comparacao de Inclinacao 5 Triciclo Bicicleta 4 Inclinacao (graus) 3 2 1 0 −1 −2 −3 −4 0 2 4 6 8 10 12 Tempo (s) 14 16 18 20 Semejanzas entre bicicleta y triciclo La figura muestra la simulación del sistema en lazo abierto para velocidad considerando cambios simultáneos de velocidad y ángulo de giro, para verificar el acoplamento entre las variables. La velocidad inicial de los dos modelos es 5m/s y se aplica un torque motor constante de 100Nm. El giro aplicado por el conductor es de 0, 1rad para cada lado. Comparacao de Inclinacao 10 Triciclo Bicicleta 8 Inclinacao (graus) 6 4 2 0 −2 −4 0 2 4 6 8 10 12 Tempo (s) 14 16 18 20 Semejanzas entre bicicleta y triciclo Estas simulaciones indican que los dos modelos presentan algunas semejanzas, llegando a los mismos valores de inclinación en régimen, mismo valor de giro (acción de control) en régimen y comportamiento dinámico para la velocidad longitudinal semejantes. Estas caracterı́sticas indican que las ecuaciones de la bicicleta pueden ser asumidas como una simplificación del modelo completo del triciclo y, por lo tanto, pueden dar algunas informaciones para el proyecto y análisis de controladores. Semejanzas entre bicicleta y triciclo La comparación de comportamientos dinámicos anterior muestra que se puede utilizar un modelo simple para proyecto y análisis. Se pueden obtener modelos simplificados a partir de un nuevo modelado fenomenólogico, como hecho anteriormente, que requiere conocimiento de los efectos dinámicos de diferentes componentes de un sistema. Otro abordaje es simular el modelo completo e identificar un modelo simple utilizando programas de simulación y control de sistemas dinámicos. Y otra forma de obtener modelos simples es utilizar técnicas de reducción de modelo. Fundamendación Teórica Fundamendación Teórica Fundamendación Teórica Aqui se exponen los fundamentos de control utilizados para este trabajo, presentando la teoria para las técnicas de control no-linear por realimentación linearizante entrada-salida y control por energy shaping. Fundamendación Teórica Control no-linear por realimentación linearizante entrada-salida. Para esto se introducen algunos conceptos importantes de la geometria diferencial que resultaran en un controlador que garantiza la estabilización y el seguimento de trayectórias. Fundamendación Teórica En el contexto de la teoria de control, el uso de técnicas basadas en el cancelamiento matemático de términos levanta cuestionamentos. La técnica de realimentación linearizante debe ser vista como una propiedad estructural de una clase de sistemas lineares, y no como una solución para el proyecto de control. Uma propiedad importante de esta clase de sistemas no es conseguir el cancelamiento exacto de sus no-linearidades, mas garantizar que el control mantenga las no-linearidades dentro del alcance de las entradas. Fundamendación Teórica Considerando un sistema no linear en la forma ẋ = f (x) + g (x)u (117) y = h(x) (118) una ley de control por realimentación de la forma u = α(x) + β(x)v puede transformar el sistema no-linear en un equivalente linearizado. (119) Fundamendación Teórica Para tal, se necesita que el sistema sea escrito de acuerdo con la estrutura. ẋ = Ax + Bγ(x)[u − α(x)] (120) con A de dimensión n × n, B de dimensión n × p, el par (A, B) controlable, las funciones α : R n → R p y γ : R n → R p×p definidas en el dominio D ∈ R n que contiene el origem, y la matriz γ(x) no singular para todo x. Si se obedecen tales condiciones, la ley de control dada por la ecuación (119) consigue linearizar el sistema con β = γ −1 . Proyectando v de forma apropiada se alcanza la estabilidad. Fundamendación Teórica Caso el sistema no este en la forma dada por la ecuación (164), se puede llevar a la forma deseada si existe una transformación de estados (ecuación 121) que atienda algunos requisitos. Cuando se usa el cambio de variables para transformar la ecuación de estados de coordenadas x para coordenadas z, la función T que mapea la transformación debe poseer inversa. Adicionalmente, las funciones T y T −1 deben ser continuamente diferenciables. z = T (x) (121) Fundamendación Teórica Cuando apenas algunas variables de salida son de interés, como generalmente es el caso del problema de seguimiento de referencia, se describe el modelo por ecuaciones de estado y de salida. Linearizando las ecuaciones de estado no necesariamente resulta en ecuaciones de salida linearizadas, lo que puede dificultar la solución del problema de seguimiento de referencia. Por esta razón, la linearización entrada-salida presenta ventajas, aunque sea necesario mantener parte de las ecuaciones de estado en la forma no linear. En este caso, se dice que el sistema es linearizable en entrada-salida. Fundamendación Teórica Se debe observar que en el caso de un sistema entrada-salida linerarizable, algunos estados del sistema pueden ser no-observables a partir de la salida elegida. Asi, estos estados deben ser estables o al menos limitados. Fundamendación Teórica Considerando el sistema dado por la ecuación (117), con f , g y h suficientemente suaves en el dominio D ⊂ R n . Los mapas f : D → R n y g : D → R n se denominan campos vectoriales en D. La derivada y (1) es, y (1) = ∂h [f (x) + g (x)u] , Lf h(x) + Lg h(x)u ∂x (122) con ∂h f (x) ∂x indicando la Derivada de Lie de h en relación a f . Lf h(x) = Si Lg h(x) = 0, entonces ẏ = Lf h(x) no dependerá de u. (123) Fundamendación Teórica Calculando la segunda derivada de y , denotada por y (2) , se obtiene: y (2) = ∂(Lf h(x)) [f (x) + g (x)u] = L2f h(x) + Lg Lf h(x)u ∂x (124) Nuevamente, si Lg Lf h(x) = 0, entonces y (2) = L2f h(x), independiente de u. Repitiendo el proceso se observa que si h(x) satisface Lg Lif−1 h(x) = 0, i = 1, 2, ..., ρ − 1; Lg Lρ−1 h(x) 6= 0 f (125) entonces u no aparece en las ecuaciones de y , ẏ , ..., y (ρ−1) y aparece en la ecuación de y ρ con un coeficiente no nulo y ρ = Lρf h(x) + Lg Lρ−1 h(x)u f (126) Fundamendación Teórica Utilizando este resultado, se puede ver que el sistema es entrada-salida linearizable, pues la ley de control realimentada u= 1 Lg Lρ−1 h(x) f [−Lρf h(x) + v ] (127) reduce el mapa de entrada salida a yρ = v (128) que es una cadena de ρ integradores. En este caso, al número entero ρ se lo denomina grado relativo del sistema. El grado relativo del sistema es una propiedad importante para la linearización entrada-salida y el seguimento de trayectórias. Fundamendación Teórica Considerando el sistema SISO entrada-salida linearizble representado por el sistema η̇ = f0 (η, ξ) (129) ξ̇ = Ac ξ + Bc γ(x)[u − α(x)] (130) y (131) = Cc ξ con ξ ∈ R ρ ,η ∈ R n−ρ , (Ac ,Bc ,Cc ) la forma canónica representando la cadena de integradores y f0 (0, 0) = 0. Se desea proyectar una ley de control de forma que la salida y siga el sinal de referencia r (t). Fundamendación Teórica Caso el sistema tenga grado relativo ρ = n, no tiene dinámicas cero no-triviales. En este caso, las variables η y sus ecuaciones pueden ser desconsideradas para el desarrollo del controlador. Se supone también que la referencia r (t) y sus derivadas r ρ (t) son limitadas para todo t ≥ 0 y la ρ-ésima derivada es una función continua por partes de t. Fundamendación Teórica Suponiendo   R= r .. . r (ρ−1)     ,y =  ξ1 − r .. . ξρ − r (ρ−1)   =ξ−R (132) el cambio de variables e = ξ − R en el sistema lo transforma en η̇ = f0 (η, y + R) ẏ = Ac y + Bc {γ(x)[u − α(x)] − r ρ } (133) La ley de control u = α(x) + βx[v + r ρ ] (134) reduce a la ecuación (133) para la forma η̇ = f0 (η, y + R) ẏ = Ac y + Bc v (135) Fundamendación Teórica Se puede alcanzar el objetivo de control para cualquier proyecto de v que estabilize la segunda ecuación mientras η sea limitado. Para sistemas de fase mı́nima con e(0), η(0) y R(t) el estado n(t) es limitado, resolviendo asi el problema de estabilidad local. Para ampliar la región de atracción y obtener estabilidad global, es condición suficiente asegurar que el sistema η̇ = f0 (η, ξ) tenga estabilidad entrada-estado. Fundamendación Teórica Control no-linear via Energy Shaping Ahora veremos la teoria básica de control no linear via energy shaping, junto con algunos resultados importantes que posteriormente serán utilizados para la sı́ntesis de um controlador, basandose en las ecuaciones de Euler-Lagrange. Se definen los sistemas en la forma de Euler-Lagrange (sistemas EL) a partir de una técnica de modelado basada en la definición de funciones de energia, formando la función Lagrangeana que permite obtener las ecuaciones de movimento del sistema. Fundamendación Teórica Al trabajar con pasividad, existe una ventaja al describir sistemas en la forma de EL, pues ya se obtienen funciones de almacenamiento y de disipación, base para la técnica de energy shaping. Otra ventaja es que se pueden representar sistemas interconectados de forma simple. El concepto de interconexión es importante, pues define como se transmite la energia entre sistemas. La teoria de energy shaping se basa en la modificación de la energia de sistemas y de sus puntos de equilibrio. Fundamendación Teórica El analisis a partir de las energias potenciais ayuda a explicar el concepto por tras de la teoria. La primeira figura ilustra la energia potencial de um péndulo, con um punto de máximo (equilibrio inestable) localizado en 0 y puntos de mı́nimo (equilibrios estables) localizados en ±π. Através de la modificación de la energia potencial de el sistema, se desea obtener una función de energia potencial deseada Vd . Un ejemplo de función es el de la segunda figura, que posee apenas un punto de mı́nimo. 5000 18000 4000 16000 3000 14000 2000 Energia Potencial Energia Potencial 12000 1000 0 −1000 10000 8000 6000 −2000 4000 −3000 2000 −4000 −5000 −5 −4 −3 −2 −1 0 Phi (rad) 1 2 3 4 5 0 −5 −4 −3 −2 −1 0 Phi (rad) 1 2 3 4 5 Fundamendación Teórica De forma semejante, se puede modificar la función de disipación de un sistema, adicionando amortiguamiento y garantizando la estabilidad asintótica de los puntos de equilibrio deseados. Fundamendación Teórica Pasividad Sistemas Pasivos corresponden a una clase de sistemas dinámicos donde el intercambio de energia con el ambiente desempeña un papel fundamental en la formulación del problema de control. Estos sistemas no pueden almacenar mas energı́a que la disponibilizada por el ambiente, con el exceso de energı́a siendo disipado. Fundamendación Teórica La definición de pasividad está intrinsecamente relacionada con las propiedades fı́sicas del sistema y de forma particular con su estabilidad. Disipatividad es una propiedad fundamental de sistemas fı́sicos. Em sistemas eléctricos, parte de la energia se disipa como calor en resistencias. Em sistemas mecánicos, la fricción entre elementos causa la perdida de energia. A continuación se presentan algunas definiciones necesarias para el concepto de pasividad. Fundamendación Teórica Espacios L2 y L2e : Considerando el conjunto Ξ para toda función real mensurable n dimensional f (t) : R+ → R n . Definiendo el conjunto Z ∞ 2 k f (t) k2 dt < ∞} (136) L2 , {x ∈ Ξ |k f k2 , 0 con k · k la norma euclidiana. Este conjunto forma un espacio vectorial normado sobre el campo de los números reales con norma k · k2 . El espacio extendido L2e puede ser definido como L2e , {x ∈ Ξ |k f k22T , Z T k f (t) k2 dt < ∞, ∀T } (137) 0 Asi, L2 ⊂ L2e , con el espacio extendido conteniendo señales donde la norma L2 puede tender para infinito, mas apenas en tiempo infinito. Fundamendación Teórica Se define producto interno (Equación 138) y el producto interno truncado (Equación 139) de dos funciones y y u como; Z ∞ u(t)T y (t)dt (138) hu | y i , 0 hu | y iT , Z 0 T u(t)T y (t)dt (139) Fundamendación Teórica Los sistemas explorados en este caso, representados por el operador Σ, poseen la forma ( ẋ = f (x, u), x(0) = x0 ∈ R n Σ: y = h(x, u) con estados x ∈ R n , entrada u ∈ R m y salida y ∈ R m , donde Σ : L2e → L2e : u → y . (140) Fundamendación Teórica Disipatividad: La definición matemática de disipatividad está relacionada a dos funciones: la tasa de alimentación (supply rate), que define la tasa con que la energia es introducida al sistema, y la función de almacenamiento (storage function), que indica la cantidad de energia que está almacenada en el sistema. Estas funciones estan relacionadas por una inecuación de disipación. Fundamendación Teórica El sistema dinámico causal Σ se dice disipativo con respecto a la tasa de alimentación w (u, y ) : R m × R m → R si y solamente si existe una función de almacenamiento H : R n → R>0 , de manera que: Z T w (u(t), y (t))dt (141) H(x(T )) 6 H(x(0)) + 0 para todo u, T > 0 y x(0) ∈ R n. Fundamendación Teórica Pasividad: Σ es pasivo si es disipativo con una tasa de alimentación w (u, y ) = u T y . El sistema se dice de Entrada Estrictamente Pasivo si es disipativo con tasa de alimentación w (u, y ) = u T y − δi k u k2 , con δi > 0. El sistema se dice de Saida Estrictamente Pasiva si es disipativo con tasa de alimentación w (u, y ) = u T y − δo k y k2 , con δo > 0. Fundamendación Teórica Estabilidad L2 : Σ se dice L2 -estable si existe una constante positiva γ de forma que, para cada x0 , existe una constante finita β(x0 ) que satisface la inecuación 142. k y k2T ≤ γ k u k2T +β(x0 ) (142) Fundamendación Teórica Disipatividad y estabilidad L2 estan relacionadas. Um sistema Σ es L2 estable si es disipativo con una tasa de alimentación w (u, y ) = 21 γ 2 k u k2 − k y k2 . Con una función de almacenamiento H ≥ 0 y x0 = 0, se puede mostrar que: Z 0 T k y k2 dt ≤ γ 2 Z T k u k2 dt o Si un sistema Σ : u → y es de Salida Estritamente Pasiva, entonces es L2 -estable (143) Fundamendación Teórica Invariancia de pasividad: Considerando los sistemas entrada salida mostrados en la figura: si Σ1 y Σ2 son ambos pasivos, entonces el sistema total Σ es tambien pasivo. Se puede demostrar esto para el caso de interconexión de realimentación e interconexiones de sistemas en paralelo. Fundamendación Teórica Con sistemas Σ1 y Σ2 pasivos, existen funciones de almacenamiento H1 y H2 tal que, Hi (xi (T )) − Hi (xi (0)) ≤ RT 0 uiT yi dt, con i = 1, 2. Definiendo x : (x1 , x2 ) y H(x) = H1 (x1 ) + H2 (x2 ), con H(x) positiva semi-definida. Fundamendación Teórica Para interconexiones en paralelo la salida será y = y1 + y2 , de forma que: H(x(T )) − H(x(0)) ≤ Z 0 T T T (u y1 + u y2 )dt = Z T 0 mostrando que la interconexión en paralelo es pasiva. u T ydt (144) Fundamendación Teórica Para el sistema realimentado, substituyendo u2 = y1 y u1 = r − y2 se obtiene : Z T (r T y1 )dt (145) H(x(T )) − H(x(0)) ≤ 0 Es importante mostrar que el teorema no exige que los dos operadores sean pasivos, pues el exceso de pasividad de un sistema puede compensar la falta de pasividad en otro sistema. Fundamendación Teórica Estabilización por realimentación de salida - Un controlador representado por los parámetros (Tc (qc , q̇c ), Vc (qc , qp ), Fc (q̇c )) con Tc la energia cinética de el controlador, Vc la energia potencial de el controlador, Fc la función de disipación de energia del controlador, qc los estados del controlador y qp los estados del sistema resuelve el problema de estabilización global por realimentación de salida si: Energy shaping: V(q) es propia y posee un único mı́nimo global en q = q∗ . Aumento de amortiguamiento: Fc (q̇c ) debe satisfazer q̇ T ∂Fc ≥ α k q̇c k2 ∂ q̇ (146) para algun α > 0. Propagación de la disipación: Para toda trayectoria con qc ≡ ∂V (q ,q ) constante y c∂qcc p = 0 resulta en qp ≡ constante. Fundamendación Teórica Estabilidad Interna y Pasividad: Un sistema entrada-salida estable es tambien internamente estable si se satisfacen algunas propriedades de observabilidad. Suponiendo que el sistema Σ sea de Salida Estrictamente Pasiva con una función de almacenamiento H ≥ 0. Si Σ es zero-estado observable, entonces H(x) > 0 para todo x 6= 0 Si H(x) > 0 para todo x 6= 0, H(0) = 0 y Σ es zero-estado detectable, entonces x = 0 es un equilibrio localmente asintoticamente estable. Si H es radialmente irrestricta, entonces la estabilidad es global. Definición del Problema de Control Definición del Problema de Control Definición del Problema de Control Presentación del problema En vehı́culos de cuatro ruedas (automóviles convencionales) no se desea la rotación en relación al eje X (ángulo ϕ, también llamada de ”rolling”), pues estos vehı́culos no permiten el ajuste del ángulo dinámicamente (con el vehı́culo en movimiento). Ya en vehı́culos de dos ruedas (como motos y bicicletas) se utiliza el ”rolling” para mantener la estabilidad y facilitar la dirección del vehı́culo durante las curvas. Definición del Problema de Control En el proyecto del vehı́culo de tres ruedas, la manipulación del ángulo de ”rolling” permitirá que efectos causados por la fuerza centrifuga durante las curvas sean compensados, proporcionando mejor estabilidad y desempeño. El ángulo de ”rolling” ϕ puede ser ajustado dinámicamente por de un mecanismo de inclinación variable la traves de una acción de control. Definición del Problema de Control Objetivo El objetivo es el de desarrollar un controlador que a través de la manipulación del giro de las ruedas corrija el ángulo de inclinación ϕ para que las fuerzas transversales al plano de la rueda se anulen. Definición del Problema de Control El ángulo de inclinación deseado ϕd se obtiene a partir de la ecuación (147) que depende de la velocidad del vehı́culo v , del ángulo de giro deseado δd , de la aceleración de la gravedad g y de la distancia entre los ejes del vehı́culo L. 2 v .δd (147) ϕd = −atan g .L El otro objetivo de control es la velocidad en el eje X Limites de giro para el vehı́culo Para analizar mejor el desempeño del controlador se necesita fijar un limite para el giro de las ruedas y para la velocidad del vehı́culo y, de esta forma, determinar el limite para la inclinación del vehı́culo. Limites de giro para el vehı́culo Se estableció la relación entre las velocidades y los radios de giro de acuerdo con la norma del DNER, que define los padrones para la construcción de rutas en Brasil. Peralte 4% 6% 8% 10% 30 30 25 25 25 40 60 55 50 45 Velocidad Directriz(m/s) 50 60 70 80 90 100 150 205 280 355 90 135 185 250 320 80 125 170 230 290 75 115 155 210 265 100 465 415 375 245 110 755 655 595 540 La tabla muestra los valores de radio de curva mı́nimos para diferentes velocidades y diferentes valores de peralte de la pista. Peralte es el declive transversal de la pista, introducido con la finalidad de reducir o eliminar efectos de fuerzas laterales sobre pasajeros y/o cargas de los vehı́culos en movimiento. Limites de giro para el vehı́culo En este caso se consideraran como valores limite los indicados para 4%, pues el modelo del vehı́culo no simula la presencia de peralte en la pista. De esta manera, si el vehı́culo atiende los valores especificados para 4%, mismo sin la compensación del peralte, podemos considerar que el sistema atiende a los requisitos. Limites de giro para el vehı́culo Transformando el radio de curva en ángulo de giro de las ruedas delanteras del vehı́culo la través de la ecuación 148: L (148) R donde L es la distancia entre ejes, R es el radio de curva y δ es el ángulo de giro, obtenemos (para L = 2.2 metros) la tabla, tan(δ) = (◦ ) δ δ (rad) 30 4.19 0.073 40 2.10 0.036 Velocidad 60 0.84 0.014 Directriz(km/h) 70 80 100 0.61 0.45 0.27 0.011 0.008 0.005 110 0.16 0.003 La tabla define el ángulo de giro necesario para que el vehı́culo consiga realizar curvas conforme definido por las normas de construcción de rutas, y estos serán los valores que definirán los limites para este proyecto. La velocidad máxima del vehı́culo fue establecida en 110 km/h. Proyecto de controladores Proyecto de controladores Proyecto de controladores Preliminares A continuación veremos las etapas y los cálculos para sı́ntesis de controladores: PID con compensación estática de no linealidad, controlador por realimentación linearizante, control via energy shaping, control por modos deslizantes Los controles de velocidad y de inclinación componen un problema multivariable para el caso del triciclo, pero serán tratados como dos problemas monovariables separados. Proyecto de controladores A continuación y como primer paso del proyecto de controladores se presenta: Un controlador de velocidad basado en modos deslizantes, Un generador de referencias (encargado de calcular el ángulo de inclinación deseado para el vehı́culo φd que anula las fuerzas laterales actuantes). Proyecto de controladores El controlador de velocidad por modos deslizantes utiliza como variable de entrada el torque del motor Tm y como variable de salida a velocidad longitudinal del vehı́culo u. A partir del sistema en la forma M(q)q̈ + C q̇ + K (q, q̇)q = F (q, q̇) (149) se puede describir por: q̈ = −M(q)−1 C q̇ − M(q)−1 K (q, q̇)q + M(q)−1 F (q, q̇) (150) através del cambio de variables, x1 = q, x2 = q̇ (151) Y asi se puede modelar el triciclo como un sistema de ecuaciones diferenciales de primer orden: ẋ1 = x2 ẋ2 = −M(x1 )−1 Cx2 − M(x1 )−1 K (x1 , x2 )x2 + M(x1 )−1 F (x1 , x2 ) (152) Proyecto de controladores La salida del sistema a ser regulada es el error de velocidad, que debe ser cero. Se puede definir la superficie de deslizamento para control de velocidad como, S = ud − u (153) donde la entrada Tm actua sobre S. Definiendo la ley de control como ( −k1 , se S > 0, Tm = +k1 , se S < 0 (154) el sistema tiene error nulo en regimen si k1 es suficientemente grande. Para aplicar la ley de control en las simulaciones se puede usar un relay con histéresis de valor 0.001, para reduzir el chattering, caracterı́stico de este tipo de control. Proyecto de controladores Para cálculo del valor de referencia de inclinación φd , se utilizó un generador de trayectorias. Este generador calcula los valores de referencia de φ y u, que servirán de entrada para los controladores de inclinación y velocidad, fundamentado en la teoria de platitud aplicada al modelo de la bicicleta. (*) Proyecto de controladores Se debe determinar el error de inclinación del vehı́culo calculado a partir del valor de inclinación medida φ y del valor de inclinación deseado φd . El valor de φd es el ángulo de inclinación que cancela las fuerzas laterales actuantes en el vehı́culo. Proyecto de controladores Algunas lineas generales orientan la solución para el problema de seguimiento de trayectoria: Durante variaciones de giro deseado δd , se debe intentar manter la velocidad ud constante. Si el modulo del ángulo de inclinación φd es mayor que un valor máximo φmax , se debe alterar ud para que δd sea alcanzado. Durante transitorios se debe mantener el valor de δd lo mas próximo posible del valor deseado por el conductor, evitando violar la restricción de inclinación k φd k< φmax . Cuando u̇d = 0 y δ̇d = 0, entonces φ̈ = 0 (en este caso, φ, ud y δd se relacionan algebraicamente). De la ecuación (111), se puede obtener: tan(φ)gl = u 2 δ (155) Proyecto de controladores No se pueden realizar cambios instantáneos en las referencias en aplicaciones prácticas. Por eso se necesitan definir transiciones suaves para la referencia. Se definen restricciones de movimento aplicando la segunda ley de Newton en un punto de masa (en este caso, la masa del vehı́culo) que se mueve a lo largo de una trayectoria (eje x para el movimento longitudinal) e inclinación (movimento angular φ). El sistema no se puede mover mas rápido de lo que permiten las leyes de la fı́sica. La solución de las dos ecuaciones diferenciales (111 y 112) determinan los set-points factibles. Outra restricción fı́sica proviene de los limites del ángulo de inclinación. El objetivo de control es mover la rueda lo mas próximo posible del valor definido por el conductor, lo mas rápido posible. Proyecto de controladores A partir del modelo simplificado de la bicicleta (111 y 112), Si se conoce el ángulo de inclinación φ, se pueden calcular φ̇ e φ̈; Conociendo δ y usando (111), se puede calcular el termino u 2 . Calculando su raiz cuadrada y considerando apenas velocidades positivas se puede definir u̇, Usando la ecuación (112) se puede calcular el valor del torque Tm . Ası́, midiendo φ e δ, se pueden calcular todas las variables del sistema. Proyecto de controladores Se pueden definir las condiciones iniciales de δ, δ̇ e δ̈ en t0 através de los valores deseados o por limitaciones fı́sicas, mientras que se puede medir φ, φ̇ e φ̈ en el instante t0 . Para un instante t1 , apenas δ e φ pueden ser no nulas, las otras cuatro variables deben ser obligatoriamente cero. Proyecto de controladores Definiendo dos polinómios de orden adecuada para φ e δ que satisfagan las condiciones iniciales y finales definidas anteriormente y calculando sus coeficientes, se pueden calcular todas las variables del problema. A continuación se muestran los polinómios escogidos. Proyecto de controladores Trayectoria linear para φ: Se puede definir la trayectoria para φ como una ecuación lineal: φ(t) = φ(t0 ) + (φ(t1 ) − φ(t0 )) t − t0 t1 − t0 (156) Utilizando u(t0 ) y δ(t0 ) se define el valor para φ(t0 ), y con u(t1 ) y δ(t1 ) se calcula φ(t1 ) utilizando la ecuación (155). Si el valor de k φ(t1 ) k> π6 , entonces se debe definir φ(t1 ) como ± π6 . Esta solución garantiza φ̈ = 0 para todo t. Proyecto de controladores Trayectoria para δ: Para conseguir transiciones suaves por partes para la referencia de giro, se propone una ecuación lineal similar a la utilizada para el cálculo de φ(t): δ(t) = δ(t0 ) + (δ(t1 ) − δ(t0 )) t − t0 t1 − t0 (157) Proyecto de controladores Trayectoria para velocidad: La función definida por la ecuación (156) tiene la segunda derivada nula. De esta manera, para los cálculos de la velocidad u a partir de la ecuación (111), se debe considerar cero la segunda derivada de φ. Considerando a ecuación en regimen permanente, se puede determinar la referencia de u utilizando las funciones de trayectorias lineares para φ y δ y aplicando en r gltan(φ) u(t) = δ (158) Ası́ se obtienen los valores de φ(t) e u(t) que servirán de referencia para los controladores de bajo nivel. Proyecto de controladores PID con compensación estática de la no-linealidad Se proyectará un controlador PID con compensación estática de la no-linealidad (referido en este caso simplesmente como PID) para servir para comparación, debido a la ausencia de trabajos consolidados en la literatura. Por un lado, diversos artı́culos existentes utilizan diferentes modelos y presentan pocos resultados experimentales, por otro lado se dispone de muy poca información técnica de los vehı́culos construidos. De esta forma, se eligió el controlador PID para definir una solución básica. Debido a sua teoria establecida y las propriedades de análisis, este tipo de controlador es adecuado para generar un padrón de comparación. Proyecto de controladores Para proyectar el controlador se utilizaran modelos linearizados del triciclo. A partir de la linearización del modelo en torno del punto de equilibrio φ = 0 (vehı́culo moviendose en linha reta, con valores nominales de los parametros) se obtuvieron funciones de transferencia para diferentes velocidades, criando un mapa de relaciones entre la entrada (giro aplicado δ) y la salida (ángulo de inclinación φ) para pequeños valores de inclinación. La tabla siguiente muestra las funciones de transferencia obtenidas para diferentes velocidades entre 5m/s y 29m/s, junto con la ganancia del modelo linearizado. Proyecto de controladores (FT’s) obtenidas por linearización. Vel. (m/s) Ganancia de la FT Función de transferencia 5 583,48 7 717,60 9 896,43 13 1388,20 15 1701,15 17 2058,80 21 2908,23 23 3400,00 25 3936,48 29 5143,56 (s+0,79) (s+123,10)(s−2,28)(s+1,42) (s+0,90) (s+89,62)(s−2,49)(s+1,28) (s+0,93) (s+71,14)(s−2,71)(s+1,15) (s+0,87) (s+51,51)(s−3,14)(s+0,95) (s+0,82) (s+45,72)(s−3,35)(s+0,87) (s+0,76) (s+41,34)(s−3,56)(s+0,80) (s+0,67) (s+35,21)(s−3,95)(s+0,68) (s+0,63) (s+32,98)(s−4,13)(s+0,64) (s+0,59) (s+31,14)(s−4,31)(s+0,60) (s+0,52) (s+28,26)(s−4,63)(s+0,53) Proyecto de controladores La figura muestra graficamente los resultados de la tabla anterior, exibiendo la evolución de los polos y ceros del sistema de acuerdo con la velocidad del vehı́culo. Proyecto de controladores La figura detalla los polos y ceros próximos al origen. Proyecto de controladores En esta figura se observa la variación de la ganancia. Proyecto de controladores Para el cálculo del controlador se utilizo la función de transferencia para la velocidad de 15m/s, valor medio de la faja de velocidades esperada. Proyecto de controladores El controlador PID deseado debe estabilizar el sistema obedeciendo las seguintes especificaciones para la respuesta en lazo cerrado: Tiempo de estabilización (5%) ≤ 1,5 segundos; Sobreseñal máximo ≤ 20%; Error en regimen nulo para entradas del tipo escalon. Para atender las condiciones el sistema en lazo cerrado debe tener sus polos localizados próximo al punto −2 ± 4i . Un controlador adecuado para la aplicación no debe presentar variaciones rápidas en el control y en el ángulo de inclinación, lo que causarı́a desconfort para los pasajeros. Proyecto de controladores La entrada al controlador es la diferencia entre la inclinación medida φ y la inclinación deseada φd , y su salida será el ángulo de giro aplicado en el vehı́culo. Para este trabajo, el controlador propuesto tiene dos grados de liberdade: el controlador C (s) y un filtro de referencia F (s). (*) Proyecto de controladores Ajustando el controlador C (s) para atender las especificaciones, junto con el filtro de referencia F (s) para eliminar el efecto del cero dominante, se modifica el lugar de las raı́ces del sistema resultando en el grafico mostrado en la figura, donde las linhas negras limitan una area (em blanco) donde se deben localizar los polos. Proyecto de controladores Para detallar el comportamiento dominante del sistema, se puede observar el diagrama de polos y ceros en la figura. En esta se puede ver que el camino recorrido por los polos atiende los requisitos. El cero dominante, localizado en aproximadamente −2, será eliminado por el filtro de referencia, reduciendo el valor de sobreseñal de la respuesta. Proyecto de controladores El controlador C (s) obtenido es: C (s) = Kc (s + 2, 05)(s + 5, 75) s(s + 20) (159) y el filtro de referencia F (s) con ganancia estatica unitaria se define por la ecuación: F (s) = 2, 05 (s + 5) 5 (s + 2, 05) (160) Propuesta: (proyectar un control para el modelo a baja velocidad y verificar el comportamiento a alta velocidad y vice versa) Proyecto de controladores Debido a la ganancia variable del sistema, la ganancia Kc del controlador no debe ser constante mas una función de la velocidad del vehı́culo (Kc (u)), para que los polos permanezcan en los lugares designados y atiendan los requisitos para toda la faja de velocidad. Ası́ la ganancia variable del controlador irá compensar los cambios de ganancia del sistema debido a variaciones de velocidad del triciclo. Esta ganancia será definida por una función continua, evitando ası́ efectos indeseados que puedan aparecer caso sea utilizada una ley de control con discontinuidades que alternen diferentes ganancias de acuerdo con la velocidad. Proyecto de controladores La tabla siguiente muestra los valores de las ganancias del controlador Kc (ui ) para las velocidades puntuales vi que mantienen los polos del sistema dentro de las especificaciones deseadas para los modelos linearizados en diferentes velocidades. ui 5 7 9 13 15 17 19 21 23 25 27 29 Kc (ui ) 8,5 5,14 3,45 1,61 1,16 0,91 0,71 0,57 0,46 0,36 0,318 0,267 Proyecto de controladores Aplicando la transformación de la ecuación (161), los puntos de Kc (ui ) pueden ser linearizados, resultando en una ganancia del controlador (Klc (ui )). Klc (ui ) = p 1 Kc (ui ) (161) Proyecto de controladores Aproximando la función discretizada Klc (ui ) por una recta, podemos extender la función de los puntos discretos ui para todas las velocidades u. La función de la recta que describe mejor el ganancia para los puntos obtidos es la de la ecuación (162): Klc (u) = −0, 061352 + 0, 0674u (162) Proyecto de controladores Utilizando las ecuaciones (161) y (162) es fácil calcular el valor efectivo de la ganancia del controlador Kc (u), resultando en la ecuación (163). Kc (u) = 1 (Klc (u))2 (163) Proyecto de controladores El diagrama de bloques del controlador PID con compensación estática de la no-linealidad propuesto es el de la figura. Proyecto de controladores Para verificar numericamente la validad de la ley de control propuesta, se combinaron el controlador y el filtro de referencia presentados junto con cada uno de los trece modelos linearizados obtenidos y se analizo el diagrama de polos y ceros de cada uno dos sistemas resultantes, verificando que el sistema es estable para todas las situaciones y que los polos del sistema se encuentran en las posiciones deseadas. Proyecto de controladores Control por realimentación linearizante entrada-salida Ahora será sintetizado un controlador por realimentación linearizante entrada-salida parcial, que actúe en el giro del vehı́culo de forma a estabilizar su ángulo de inclinación. Proyecto de controladores En primer lugar se debe transformar el sistema a ser controlado en una representación de estados a partir de las ecuaciones dinámicas en la forma M(q)q̈ + C q̇ + K (q, q̇)q = F (q, q̇). Se puede hacer esto pre-multiplicando el sistema por la matriz M −1 obteniendo, M(q)−1 [M(q)q̈ + C q̇ + K (q, q̇)q] = M(q)−1 [F (q, q̇)] q̈ + Ca q̇ + Ka (q, q̇)q = Fa (q, q̇) con Ca = M(q)−1 C , Ka = M(q)−1 K (q, q̇) e Fa = M(q)−1 F (q, q̇). Proyecto de controladores Para el caso del modelo de la bicicleta, la transformación es simples y se da de forma directa, con x1 = φ, x2 = φ̇ e x3 = u. ẋ1 = x2 cos(x1 ) 2 x3 δ(t) lh 2nTm (t)ηT 1 − Cxx32 Aρ dm 2m ẋ2 = gsin(x1 ) + ẋ3 = Proyecto de controladores Para el modelo del triciclo, el cálculo de la inversa de M(q) se verifico complejo pues al contrario del modelo de la bicicleta, la matriz de inercia del triciclo no es diagonal y es una función de los estados del sistema. Asi, M(q)−1 es una expresion demasiado grande para ser trabajada sin el auxilio de sistemas computacionales. Proyecto de controladores La representación de estados del sistema del triciclo tiene como base el vector de estados aumentado, qa = (x, ẋ, y , ẏ , z1 , ż1 , z2 , ż2 , z3 , ż3 , z4 , ż4 , ψ, ψ̇, φ, φ̇, θ, θ̇). El objetivo de controlar apenas la variable φ hace con que a técnica de control por linearización parcial sea adecuada. Una vez que el sistema representado por variables de estados ya se encuentra en la forma adecuada dada por la ecuación, ẋ = Ax + Bγ(x)[u − α(x)] (164) se debe probar que a función γ para el estado φ es invertible en todo su dominio. Proyecto de controladores El subsistema que representa la dinámica de la inclinación del vehı́culo (tanto para a bicicleta quanto para el triciclo) puede ser representado en una forma compacta como: ẋ1 = x2 ẋ2 = f (x) + g (x)u y = x1 con x1 = φ, x2 = φ̇, siendo x el vector de estados y u la entrada del sistema. Proyecto de controladores La figura muestra el diagrama de bloques que representa el subsistema de la dinamica de inclinación del vehı́culo junto con el control linearizante. Proyecto de controladores Tomando como salida a variable x1 = φ y calculando ẏ e ÿ se obtiene el grado relativo del sistema ρ = 2. Tomando por base la ecuación, y (2) = ∂(Lf h(x)) [f (x) + g (x)u] = L2f h(x) + Lg Lf h(x)u ∂x (165) que lineariza el sistema, se obtiene: u= 1 Lg Lρ−1 h(x) f [−Lρf h(x) + v ] con L2f h(x) = f (x) Lg Lf h(x) = g (x) 6= 0 (166) Proyecto de controladores Utilizando el resultado anterior y el controlador por realimentación propuesto por la ecuación (166), se consigue linearizar el sistema y se obtiene el mapa entrada-salida. φ̈ = v (167) Garantizando que la referencia r y sus derivadas sean limitadas, y realizando la transformación de variables para incluir la dinamica del error, se puede proyectar la ley de control v que satisfaga los requisitos del sistema. Proyecto de controladores Se debe elegir v de forma a tornar la dinamica del sistema linear estable y que su respuesta sea rapida y sin oscilaciones, que son caracteristicas deseadas para el triciclo. Para tal, debido a la presencia de perturbaciones y de errores de modelado, se propone un controlador por realimentación de estados con integrador. Proyecto de controladores La figura muestra el diagrama de bloques de la estrutura del sistema linearizado con el controlador por realimentación de estados e integrador para rastreamiento de referencia. Proyecto de controladores A partir de la figura y considerando x los estados del sistema, ∆ los estados del integrador, Ke la ganancia de realimentación de los estados y Ki la ganancia de realimentación del integrador, se puede obtener una representación de estados del sistema aumentado que relaciona la entrada de referencia r y la salida medida y . x ẋ B 0 A 0 x ˙ = −C 0 ∆ + 0 u + I r , u = − |Ke {z Ki } ∆ ∆ |{z} |{z} | {z } Ka Aa Ba Ea (168) Proyecto de controladores El problema de control del sistema se resume a definir las ganancias de la matriz Ka tal que el sistema realimentado ẋa = (Ax − Ba Ka )xa + Ea r (169) sea estable y para tal se pueden usar diversas técnicas. En este caso se opto por la tecnica conhecida como LQR. Esta tecnica se basea en la minimización de criterios cuadráticos, associados a la energia de los estados y de la variable de control del sistema que esta siendo proyectado. Proyecto de controladores Considerando el sistema realimentado dado por la ecuación (168) se desea minimizar una función costo, que representa la energia del sistema, definida por la función J: R∞ J = min 0 z(t)T z(t)dt u(t) T xa (t) Q T z(t) z(t) = u(t) NT N R xa (t) u(t) com Q, R e N matrizes de ponderación para xa (t) e u(t). (170) Proyecto de controladores Los elementos de la matriz Q deben ser mayores caso la prioridad sea minimizar la energia de los estados, lo que representará menores oscilaciones del sistema. El cálculo del controlador LQR resuelve la ecuación (170), minimizando la función. Se puede probar que, si existe un minimo de la función, entonces existe una función de Lyapunov P definida positiva con sua derivada Ṗ negativa, garantizando la estabilidade del sistema. Proyecto de controladores Se puede resolver el problema de minimización de una función costo através de la ecuación de Riccati, obteniendo los valores de Ka . Su resolución analitica puede ser complicada, con la complexidad aumentando de acuerdo con la dimension del problema. Sin embargo, existem métodos computaciónais eficientes para sua resolución. Proyecto de controladores En este caso se uso la función lqr() del software Matlab, disponible en la biblioteca Control System Toolbox. Dadas las matrizes del sistema Aa , Ba y las matrizes de ponderación Q e R, la función encuentra la solución para la ecuación de Ricatti (si esta existe), y retorna los valores de Ka que minimizan J. Se puede modificar la respuesta del sistema modificando las matrizes Q e R. Proyecto de controladores En este caso los valores de Q e R fueron definidos de forma empı́rica, ajustando los valores de las matrices de ponderación y observando los resultados en un proceso iterativo de forma a obtener una dinámica mas rápida. Los valores obtenidos fueron:   0, 2 0 0 Q =  0 2 0  , R = 0, 001 (171) 0 0 12 y las ganancias calculados para el controlador fueron Ke = [102, 4 46, 9] e Ki = [−109, 54]. Proyecto de controladores Control por Energy Shaping En esta sección se usa el modelado de las energias cineticas T y potenciales V del sistema para sintetizar un controlador basado en Energy Shaping que estabilize el sistema. Para esto vamos usar las ecuaciones de energia de una bicicleta. La bicicleta incorpora las caracterı́sticas dinámicas de un pendulo invertido, problema similar al encontrado en el triciclo. Proyecto de controladores Controlador Proporciónal-Derivativo basado en passividade El controlador PD basado en pasividad tiene una componente representando energia potencial Vc (q) y una componente para a disipación de energia Fc (q̇). Para que el sistema en lazo cerrado sea globalmente estable es necesario que: La energia potencial deseada del sistema en lazo cerrado Vd , dada por la ecuación: Vd (q) , V(q) + Vc (q) (172) tenga un unico punto de minimo global en q = q∗ (constante) y sea radialmente ilimitada. La función de disipación Fc satisfaga: ∂Fc ∂Fc (0) = 0 y, q̇ > 0, ∀q̇ 6= 0 ∂ q̇ ∂ q̇ (173) Proyecto de controladores Siguiendo esas consideraciones en la elección del controlador se puede probar que el sistema es globalmente asintoticamente estable. Para el caso del triciclo y de la bicicleta, se analizara apenas la estabilidade del ángulo de inclinación φ. Proyecto de controladores Definiendo la acción de control uc en función de la energia potencial del controlador Vc (q) y de un elemento de disipación del controlador Fc (q̇) de acuerdo con a ecuación (174): uc = − ∂Vc ∂Fc (q) − (q̇) ∂q ∂ q̇ (174) tenemos que, con la elección adecuada de las funciones de energia potencial y de disipación deseadas, se obtiene el control a partir de las ecuaciones (172), (173) y (174). Proyecto de controladores En la etapa siguiente, el modelo de la bicicleta será utilizado para sı́ntesis de un controlador. Para el sistema en lazo abierto se encuentran los puntos de equilibrio derivando la energı́a potencial del sistema, ∂Vc (q) =0 ∂q (175) encontrando los puntos de equilibrio en φ = i π, i = ..., −1, 0, 1, .... Derivando la ecuación (175) nuevamente podemos concluir sobre la estabilidade de los puntos de equilibrio, siendo el sistema inestable para φ = 0 y estable para φ = π. Proyecto de controladores Se necesita elegir una función candidata para Vd que modifique la estabilidad del sistema y torne el punto de equilibrio deseado q∗ un mı́nimo de la función. Una función candidata es, 1 Vd (q) = kp q̃ 2 2 com kp > 0 e q̃ , q − q∗ . (176) Proyecto de controladores De forma semejante se puede elegir la función de disipación deseada del sistema que satisfaga las ecuaciones q̇ T ∂Fc ≥ α k q̇c k2 ∂ q̇ (177) y (173). La función propuesta para este caso es la dada por la ecuación (178): 1 (178) Fd (q̇) = kd q̇ 2 2 con Fd (q̇) , F(q̇) + Fc (q̇) (179) y kd > 0. Proyecto de controladores Esta elección de funciones permite reescribir la ecuación (172) como: ∂Fc ∂ (V(q) − Vd (q)) − (q̇) (180) u= ∂q ∂ q̇ siendo que la primeira parte del control es responsable por el energy shaping del sistema y la segunda parte adiciona amortiguamiento. El control estabilizante calculado por la ley de control propuesta se obtiene manipulando 179 y substituyendo (105), (176), (178) en (180), que resulta en: u = −kp (q − q∗ ) − mghsin(q) − kd (q̇ − q̇∗ ) (181) Proyecto de controladores El control propuesto estabiliza el sistema, tornandolo globalmente asintoticamente estable. Sin embargo pueden haber errores en la modelado del sistema. En este caso se consideraron errores en el modelado de la massa m y en la altura del centro de gravedad h. Ademas de este efecto, se consideraron perturbaciones actuantes en el sistema que generan torques que afectan su comportamiento. En estas condiciones, aunque las propiedades entrada-salida no se alteren, no se considera mas el sistema como globalmente asintoticamente estable en el punto de equilibrio deseado (q 6= q∗ ). Proyecto de controladores Adicionando un integrador al control se pueden corrigir los desvios causados por los errores de modelado y por las perturbaciones, haciendo con que el sistema vuelva a seguir la referencia deseada. El integrador es el elemento pasivo mais simples que puede ser incorporado, y su combinación en paralelo con el controlador PD propuesto tambien resulta en un sistema pasivo. Proyecto de controladores La ley de control que se obtiene para el sistema es, uT = −kp (q − q∗ ) − mghsin(q) − kd (q̇ − q̇∗ ) − ki ∗ (q − q∗ ) (182) con kp = 25000, kd = 2500, ki = 15000 y mgh = 4905, ganancias estas obtenidas de forma empirica, que tornan la respuesta dinámica del sistema semejante a la obtenida para el controlador PID. El control uT genera los torques que estabilizan el sistema. Proyecto de controladores Esta variable debe ser convertida en giro, entrada real para el sistema triciclo, através de la transformación: δ= uT l cos(φ)mhu 2 (183) com l siendo el largo del vehı́culo, h la altura del centro de gravedad, m la masa del vehı́culo y u su velocidad longitudinal. Esta función se obtiene através de la ecuación (101), que relaciona el momento generado por el giro con el ángulo δ. Proyecto de controladores Hasta aqui se mostraron los passos utilizados para sintetizar los controladores PID con compensación estática de la no-linealidad, realimentación linearizante y Energy Shaping. Los controladores fueron proyectados para rechazar perturbaciones no medibles del tipo escalon. El controlador PID se ajusto a partir de la linearización del sistema nominal en torno de un punto deseado, y se propuso un controlador con dos grados de liberdade para atender requisitos de performance. Proyecto de controladores El controlador por realimentación linearizante se aplico apenas en una parte del sistema (linearización parcial), obteniendose linearización entrada-salida. Em seguida se estabilizo el sistema através de realimentación de estados con integrador, con ganancias de realimentación calculadas através del processo de minimización de la energia (LQR). El controlador por Energy Shaping se baso en la formulación lagrangeana del modelo del triciclo, modificando las energia potencial y a función de disipación del sistema y adicionando un termino integral para corregir perturbaciones y variaciones parametricas.

Beamer tutorial

Documentos relacionados

Productos

Apoyo

Beamer tutorial

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib