KOSA ANDRAS Y SZIGETI FERENC NOTAS SOBRE TEORIA DE CONTROL OPTIMO TEORIA DE CONTROL OPTIMO POR KOSA A N D W Y S Z I G E T I FERENC DEPARTAMEMTO DE MTEMATICA FACULTAD DE CIEWCIAS UNIVERSIDAD DE IDS ANDES MERIDA-VENEZUELA 1980 ESTAS NOTAS RESUMEN UN CURSO B E V E SOBRE TEORlA DE CONTROL O P T I M O DlCTADAS EN EL DEPARTAMENTO DE MAT& M a f I C A DE LA UMIVESIDAD DE LOS ANDES POR EL DOCTOR FERENC SZIGETI, FROFESOR DE LA UNIVERSf DAD E ~ T V O S LORAND DE BUDAPESTp DURANTE E L P R I M E R SEMESTRE BEL ~ F j o1980, AGRADECEMOS A LOS PROFESQRES KOSA ANDRAS Y SZIGETl FERENC POR SU COLABORACION AGRADECEMOS T A W I E N A L A SENORITA E L I D E RAMIHEZ Y6R SU DEDlCAClON Y EXCELENTE TRABAJO DE D A C T I L O G R A F I A D O , -AGRADECIMIENTO NOTACIONES I . EL PRINClPIO DE MAXIM0 DE PONTRIAGUIN. 11, CONTROLABILIDAD, OBSERVABILIDAD..., 1 t s 1 e a I .., ... ..38 TEORIA DE CONTROL OPTIMO INTMDUCCIOM -- En e l c o n t r o l autombtico, l a Economfa y 10s problemas de e s t a d f s t i c a matemstica, en g e n e r a l , en los problemas de f i p o i n v e r s o s u r g i e r o n rnuchos problemas de optimizacibn 10s cuales no han podido ser resueltos por medio de rngtodos c l d s i c o s d e l C S l c u l o Variational. problemas d e e s t a Sndole L. 10s Para r e s o l v e r Pontriaguin y s u escuela - cred una nueva t e o r z a , llamada "Teorfa de C o n t r o l Optirnd'. E l esquema de 10s procesos considerados es el s i g u i e n t e : hay una l e y de l a " n a t u r a l e z a " , con l a p o s i b i l i d a d de l a "intervencibn kumana", es d e c i r , se pueden c o n t r o l a r 10s procesos consfderados. E v i d e n t m e n t e , una lntervencidn humana en l a n a t u r a l e z a tiene c i e r l o s o b j e t i v o s , Estos - o b j e t i v o s pueden ser de c a r a e t e r cualitativo, par ejemplq el o b j e t i v o de l a a c t i v i d a d h m a n a es t r a s f e r i r el s i s t e - m a de una posicidn a o t r a posicibn deseada. En general el o b j e t i v o prirnario de l a a c t i v i d a d hunana tfene caracter cualitatfvs. - Pero, ademds tenemas tambign o t r o t i p 0 de i n t e r & , por ejmplo: p r o d u c i r b i e n e s e n una cantidad maximal, o con un precio mfnimo. tivo secundario t i e n e un cardcter c u a l i t a t i v o , I - Lucgo, el obje El teorema f u n d a m e n t a l e s el p r i n c i p i . 0 ds MSximo de P ~ n t r ia - g u 4 ~con e l cual. se pucden resalver, rnuchos d e i o a yr23ble mas p l a n t e a d o s , por cjemplo: a) La estabilidad d e Pos reactores, cj Ida determinacidn del f u n c i o n a m i e n t o mds econ6rnico de Los reactores, 10s processs controlados, d) La identificaeibn de l o s procesos m c d i a n t e f i l t r s c i b n , e) L a d e t e m i n a c i d n d e l a forma de 10s e s t r a t o s , utilizan- do 10s m&todss sfsmicos (es decir, e l problema i n v e r s o de l a s x s r n l c a ) . f) L a determinaciCn de l a e s t r a t e g f a optimal e n un rnercado, g) La a u t o m a t i z a c i b n . optimal de s i s ternas i n d u s t r i a l e s . - L a t c o r f a de c o n t r o l bptimo u t i l i z a de l a m a t e m 6 t i c a p r o f u n d m c n t e : el a n b l i s i s , e l a n d i i s i s f u n c i o n a l , l a s ecuaciones d i f ererxciales, la geometrfa convexa, l a t e o r f a de probabi li -d a d , etc. ASS, l a teor%ade c o n t r o l 6 p t i m o ha Llegado a ser tma rama muy i m p o r t a n t e de las matemdticas desde e l purrto de vista prSctico y tebsico. NOTACLONES - - := Utilizado p a r a d e f i n i r c o n j u n t s s , funclones,etc, ~ o dos s puntos "apuntan" h a c i a el objeto que s e d e f i n e . f: A + - B de f es Denota una funcidn o a p l i c a c i 6 n ;el dominio el rango de f es Rf:= Df:= A,y B. W - El con junto de 10s nGmeros reales, IR" - E l e s p a c i o de los vectores reales de dirnensidn x = f o g & ( - x i 2 - Norma de IR" . Funcidn cornpuesta de la = f o (t, x, u) - ecuaci6n n. funcidn g i f e r e n c i a l , donde con f t es - la f u n c i 6 n i d d n t i c a sobre e l dominio comGn de la t r a y e c t o r i a x y el control u. - Transpuesta d e l a m a t r i z A. EL PRINCIPIO DE MAXIM0 DE PONTRIAGUIM I. Considerernos un punto m a t e r i a l d e masa 1 q u e s e mueve en una r e c t a ; supongarnos que se conoee que en 10s instanles to y t r , e l p u n t o ocupa l a s posiciones xo y x l , y t i e n e velocidades % y fl respectivamente: S u p o n g m o s que l a ecuacidn d e l movimiento de este pun- .. t o e s t d dada por . x = u, donde u e s una f u n c i d n que "controls" o "regula" dicho movimiento. que u B TI Supongarnos y e s t d s u j e t a a l a condicidn lul 5 1, en - t o n c e s debe ser una funci6n: Resolviendo l a ecuacidn d i f e r e n c i a l % = u s e ve que hay una i n f i n i d a d de f u n c i o n e s que l a satisfaccn; es decir, existen s o l u c i o n e s u definidas sobre un cierto interval* [,:t t\f] con val-ores en [-1.11, se o b t i e n e n f u n c i o n e s x , s a t j s f a c i t 5 n d o s e que d e l a s que 2 = u . D e c o n s i d e r a c i o n e s de t i p 0 f z s i c o , se s a b e tambi&n que e x i s t e n funcidnes u de d i c h o tdpo, t a l e s que l a s so- l u c i o n e s de l a ecuacidn P = u s a t i s f acen tarnbiGn l a s condiciones: E l problema mds s e n c i l l o e n l a t e o r l a d e l c o n t r o l o p t i - mal c o n s i s t e , p o r ejemplo, e n e n c o n t r a r l a funcidn u para l a c u a l e l funcional toma su valor m l n i m o ; a e s t e p,roblema, l o llamaremos: Problema de l a rninimizaci6n d e l tiempo del tiempo mfnimo. a problema 2.- NOTACIONES Y DEFINICIONES. 2.1. Demos dos ndmeros n a t u r a l e s arbitrarios n y r, m Sea U t R un c o n j u n t o a r b i t r a r i o no vacfo, con mas d e un e l e m e n t o (generalrnente es un conjunto compacto, un p o l i e d r o convexo, e t c ) . d o s p u n t o s f i j o s y sea una fun- Sean xo,xl E R" cidn f : R con n > R" XU- f (x,u) = Ax + Bu, donde A E IR nxn ,B nxk C IEt son m a t r i c e s . En e l e jemplo dado e n (1), tenemos que: DEFINICION: de f u n c l o n e s de siguiente: CU Sea R e l subconjunto de l a c l a s e -> U , d e f i n i d o d e l a manera U es un interval0 compacto. y (ii) u , to: = m i n IjU es continua a t r a z o s (en l o s p u n t o s de d i s c o n t i n u i d a d s e d e f i n e carno a l g u n o de Tos l f m-i tes laterales) A . una funcidn u que satisface las c o n d i c i o n e s (i) y ( i i ) la llarnaremos CONTROL. 2.2. Tomemos u E CU y consideremos el p r o b l m a con valor i n i c i a l : x = Ax + u x(t*) By = x 0 . Consideremos l a f u n c i 6 n : F ( t , y ) : = Ay + Bu(t) entonces e l problema ( * ) DEFINICIONES: entonces xU Si xu ( t t ,:t[ ty 1) es e q u i v a l e n t e a: es l a soluci6n del problema (*I es la T R A Y E C M R I A 4 correspondjente a1 , u; y a l a pareja ordenada (xU,u) se le llama control PROCESO Sea . (xU,u) un proceso: entonces sabemos que: Adembs, generalmente no oeurrc que: DEFINICIONES: U Si' (x ,u) es un proceso ta.L yue: e n t o n c e s diremos que y al control NOTACION: u u ( x ,u) es un PROCESO ADMISIBLE, -- l o llamaremos un CONTROL ADMISEBLE. --" Denotaremos por nu a la clase d e contsoLes admisibles; o sea: u 6C,/u es admLsible Sea J (luando existe e l f u n c i o n a l d e f i n i d o como s i g u e : J a l c a n z a e l mfnimo a b s o l u t o ; es d e c i r cuando - u E RU J t a l que: (u) = min u E diremos q u e u J (u) , nu es un CONTROL OPTIMAL ,y a1 p r o c e s o c o r r e s p o n d i e n t e PROCESO OPTIMAL. DEFINICION. Sea el s u b c o n j u n t o 1 C ]Itn d a d o por T - NOTACION. E l slmbolo xo ?-.'xl g u i e r e decir q u e es un c o n t r o l a d m i s s i b l e para 10s p u n t o s o t r a s palabras, inicial xo u xo y xl; u en " l l e v a " un p u n t o desde l a p o s i c i d n hasta l a posicidn f i n a l x l . Hemos d e f i n i d o ET corno e l c o n j u n t o d e puntos e n d e s d e 10s c u a l e s se puede l l e g a r a1 o r i g e n d u r a n t e R" un tiempo no mayor que T; se puede d e m o s t r a r que cuando se l l e g a a 1 origen en un tiempo - T * < T, gar tambign e n e l tiempo se puet5e lle -.- T: LEMA I: , y sea v el con T t r o l q u e l l e v a dicho p u n t s a1 origen d e manera que: PFUXBA: Sea dado un punto en Definamos el contra1 este control trozos y u -b U, como s i g u c : es a d m i s i b l e , ya que u es continua a 0 6 U. se t i e n e que l a tsayectoria despugs Para e s t e d e l instante rencial: u: [0,~] - T* e s t d gobernada p o r l a ecuaciBn d i - f e - o sea, tenemos el s i g u i e n t e problema con valor i n i c i a l : cuya s o l u c f d n es: Este r e s u l t a d o significa que s i t E [T*.T] PRUEBA. es e l c o n t r o l u y el punto quedarL e n e l origen. 2 x 1 y xo Sean 10s puntos t n i c i a l e s 0 en 1 , T tenemos que demostrar que e l segment0 ,que une a e s t o s dos puntos esta c o n t e n i d o e n 1 ; o sea, si elegido T A € [0,11 y p: debe p e r t e n e c e r a I-A, el punto: 1 . T Como x: C. 1 (i = 1,2), e n t o n c e s e n v i r t u d del LEMA f T existen c o n t r o l e s ui: tal que la trayectoria xi i va el p u n t o xo al o r i g e n . POT atra parte, xi = correspondiente a uj lie- xi satisface 1-a ecuacidn diferencial: Axi + Bui 1uego : lo que e s correcto p l a n t e a r ya que n i d a s sobre el misma intervalo. x l y x2 - estAn defi Por otra parte: es un control admisible, ya que es una funciCn continua a. trozos ya que Llamando U y es convexo. x3: = Axl + yx2, se tiene que: # si t: = 0 , entonces: 3 xo ; ademds: l u e g o l a trayectoria parte del p u n t o o sea, l a trayectoria llega al origen. Hemos demostrado que p a r a cualquier p u n t o mento que une a 2 con x 8 x: , existe un c o n t r o l l l e v a e l punto a1 origen e n un tiempo y de aquf se concluye q u e 1 x i del seg- T; u j que luegat e s eanvexo. T El siguiente lema dice que cuando s e trata de un punto i n t e r i o r de 1 , desde este punto s e puede P I - e g a r a 1 T o r i g e n e n un tiempo manor que desde un punto de 1 Ti y en c o n s e c u e n c i a , s i no se puede llegar a1 orkgen duran - T te un tiempo menor que f r o n t e r a de 1, T T dicho punto debe e s t a r en la L m A 3: que Sea xo E 1 , entonces T T* < T , y un c o n t r o l que l l e v a el punto Y a que PRUEBA: d e f i n i d o en T* C 'R 1 . hay una v e c i n d a d de T e s t S totalmente contenida en 1 tal [o,T*] t a , l a1 o r i g e n e n e l tiempa x, xo E u existe un . T*, x, que y hay un ~ o l i e d i ocon T v e x o q u e esta t o t a l m e n t e c o n t e n i d o e n e s t a v e e i n d a d y t a l que c o n t i e n e a x, como p u n t o i n t e r i o r . En l a f i g u r a se e x p l . i c a l o que o c u r r e cuando 1 C R2. P a r a c a d a vsrtice d e l p o l i e d r o e x i s t e un c o n t r o l q u e 10 l l e v a a 1 o r i g e n d u r a n t e un tiempo Sea E > o quiente: T ( p o r LEMA 1 ) . " s u f i c i e n t e m e n t e pequefio" e n e l s e n t i d o si- dado un p u n t o x, . R" q u e l o l l e v a a1 o r i g e n , e l n k e r o y ( x , u ) un p r o c e s o Ix(E)- xOI es t a n pe - quefio como queramos; g r d f i c a m e n t e e s t o se ve corno: T- t: ------'T-E Esto se puede hacer con todas las t r a y e c t o r i a s que l l e v a n 10s vertices del p o l i e d r o a 1 o r i g e n , como se i n d i c a e n l a f -i T- --- --- --Mu-- E ---- gura: Esto s i g n i f i c a que hemos d i v i d i d o cada t r a y e c t o r i a en dos partes: la "parte pequefia" que exige un tietnpo i g u a l a E para ser r e c o r r i d a y l a "parte grandee' fomadapor 1 puntos de T- E . Hay un teorema geometric0 que dice: "Dado un p o l i e d r o convexo en P R ~ ,existe un E > 0 t a l que consideradas las bolas de centro e n cada v e r t i c e y radio E? y e l i g i e n d o un punto e n cada una de e a t a s bolas, Bstas. determinan un ' p o l i e d r o 0 si a € P se puede escoger Entonces sea E > 0 Q convexo; y ademds 0 de manera que E de manera que x 0 a E Q . s e a un punto in- , t e r i o r del nuevo poliedro de v e r t i c e s contenidos en F c # u E s t o quiere d e c i r que exlste ura cont.ral el p u n t o x0 a1 o%i.qen en tlrr tiempa T*: - ylze I.%eva "-F 1 . )i tal que Sea u un c o n t r o l aclrnisible que lleva un punk0 desde Is posicidn x, E Iksr" it1 origen, sea x es necesasio que existc2 una f u n s i . 6 ~ 1 9 t i s f a g a l a e c u a c i 6 n diferencial l i n e a l : t a l que para cada i - C U C j.t.o , a ? t '-l -I la t r a p a c t o r i a no n u l a ciue s a - Sea T: = t y - t, ,y consideremas e l c o n j u n t o 1 . Asf, rn e l punto i n i c i a l xo es un punto f r o n t e r a de 1: , ya rn q u e s i f u e s e p u n t o i n t e r i o r se p o d r f a l l e g a r a1 o r i g e n e n un tiempo menor que que u We x, T y e s t o c o n t r a d i c e e l hecho de es un c o n t r o l o p t i m a l . Por o t r a p a r t e , es c l a r o no puede e s t a r f u e r a de T - Se sabe de l a geometrfa, o d e l a n s l i s i s f u n c i o n a l q u e s i s e tiene un c o n j u n t o convexo y se f i j a un punto en la f rontera, existe un h i p e r p l a n 0 ' ( h i p e r p l a n o de apoyo) que lo "separaN, en el s e n t i d o de que todo e l c o r l j u n t o queda a un l a d o d e l hiperplano. - En e l caso g e n e r a l este h i p e r p l a n o no estS determinado unfvocamente; par ojemplo, si e n e l p l a n o e l c o n j u n t o convexo es un cuadrado y el punt o d e f a f r o n t e r a e s un v e r t i c e hay una i n f i . n i d a d de pPa nos de apoyo. En n u e s t r o c a s o ocurre l o siguiente: Hiperplano de apoyo En l a figura antericr plano por n es el vector normal al hiper- xo, e l cual esfa dirigido hacia l a parte del , e s p a c i o que c o n t i e n e a por l o t a n t o para cada T y € 1 Sea 5 se t i e n e que: T l a s o l u c i d n d e l s i g u i e n t e problema ccn valor hi - cial: vamos a demostrar que para esta $ se cumple ( 4 ) . Razonando por reducci6n a1 absurdo, supongamos que exis v* € te u y un punto tE it:, tyl para 10s c u a l e s no v a l e l a igualdad; en e s t e caso existe tambign qn i n t e r - < $ ( t ),BV* Para u y > v* > ($(t) , ~ u ( t ) > tenemos grbficamente: t E PI' '21 Construyamos un nuevo c o n t r o l u*: t -> U? como s i g u e : este control u* es una f u n c i d n c o n t i n u a a t r o z o s . Consideremos el siguiente problema: fc = Ax sea x* + Bv* , x(ty) = 0 ; l a s o l u c i 6 n de este problema, entonces: Definamos ::x cer a = x*(to); e s t e punto x? 0 dehe pertene- 1 , porque se puede llegar desde este p u n t o a1 T o r i g e n durante un tiempo T , l u e g o e n v i r t u d de ( 5 ) : Sea x una s o l u c i 6 n de (I), y I) una s o l u c i 6 n c u a l q u ie ra de ( 2 ) , e n t o n c e s : pero: luego: Entonces para el control Newton-Leibniz, se t i e n e : u, de acuerdo a La regla de ~ para el tcontra1 eu*: y ~ Siendo $ l a s o l u c i b n del. problema ( 6 ) y restando las igualdades a n t e r i o r e s , se tiene: En esta igualdad l a funcidn subintegral. es negativa por la manera en que hemos definido v * , Luego: y esto es una contradf ccidn con ( 7 ) 1 Por Lo tanto deber ser . Con este r a z o n a m i e n t o hmos d e m o s t r a d o q u e p a r a cada asume s u mdximo, cuando v: = u (t) . A 1 d e m o s t r a r e l p r i n c i p i o de Mdximo p a r a e l cass l i n e a l , consideramos que U - es un p o l i e d x o convexo; f r e c u e n t e mente s u c e d e q u e cuando e n un problema g e n e r a l . se t r a t a d e l caso convexo, las c o n d i c i o n e s n e c e s a r i a s s o n t a m b i e n c o n d i c i o n e s s u f i c i e n t e s ; por e j e m p l o , cuando se t f e n c u n a f u n c i d n convexa de una v a r i a b l e y Ea d e r i v a d a de @sea e n un p u n t o i n t e r i o r h e su d o m i n i o es i . g u a l a cero, e s t a con - - d i c i d n es s u f i c i e n t e h a s t a p a r a un mfnimo a b s o l u t o , L u e go es n a t u r a l e x a m i n a r este a s p e c t 0 e n l a c o n d i c i b n d e P o--r t r i a g u i n : si un p r o c e s o s a t i s f a c e e l p r i n c i p i o de mbximo, e s t e p r o c e s o es o p t i m a l a n o . S e puede d e m o s t r a r que en e l problema d e l a mi.nimizaci6n d e l t i e m p o y en e l caso - n e a l l a c o n d i c i d n de Pontriaguin es casi s u f i c i e n t e , l i e Eo que h a c e f a l t a es a i i a d i r una c o n d i c i d n mds a 1 p o l i e d r o col vex0 U. Para p r e p a r a r e s t a c o n d i c f 6 n a d i c i o n a l haremos - consideraciones previas. Sea A una a p l i c a c i d n l i n e a l de R" e n R" (no haremos d i - ferencia e n t r e l a aplicaci6n l i n e a l y la representacibn # matrical de l a aplicacibn) , entonces: DEFINICION: pie d e R": aplicacidn Sea A una m a t r i z se d i c e que A S nxn y S un subesgaciopro - es i n v a r i a n t e respecto x si para cada Dada una a p l i c a c i 6 n l i n e a l E S, A:R" se t i e n e que -zR n y un a la Ax C S . n no nubo, a t R hay una c o n d i c i 6 n n e c e s a r i a y suficiente para que exista un subespacio i n v a r i a n t e S respecto de A t a l yue a E S; es- t a c o n d i c i d n es: son linealmente dependientes. V a m o s a consider& el caso l i n e a l donde: f ( y , v ) = A y . + Bv, y i) es un poliedro convexo que s a t i s f a c e dos condiciones: U U c o n t i e n e a 1 oriyen, p e r o e l origen no es un v d r t i - c'=, Y ii) Cualquier a r i s t a w de U es t a l que 10s v e c t o r e s : son l i n e a l m e n t e i n d e p e n d i e n t e s ; es decir, dada cualquier arista w de U - y para cualquier s u b e s p a c i o invariante S respecto de A, se t i e n e que Bw $ S. Guando s e cumple (ii) s e dice que TEOMMA: --. Sea .U t i e n e la t?OSICION *-. GE-- ( x , u ) u n proceso que s a t i s f a c e el p r i n c i p i c ? de mdximo, siendo: dada por: dondc es un poliedro convexo en U R ~ ,que t i m e la posi- c i d n general y que c o n t i e n e al origen pero Qste no es un - vgrtice; entonces (x,u) es urn proceso optima.1 p a r a el p r a b l ~ ma de la minimizacibh d e l tiempo. A n t e s de dar una prueba de este tearema, veamos el s i g u i e n t e lema: LEm: P Sea $1 una s o l u c i 6 n no t r i v i a l de 4 = -A T+ , sea Consideremos el c o n j u n t o : entonces S es un subespacio i n v a r i a n t e respect-9 d e f A* i) S es un subespacio: Dados xlr x2 f S y a , B E R, se t i e n e : luego : axl ii) + Rx2 C S e s un subespacio_propio: S Razonarniento por reduccidn al absurdo: si fuese S = R < $ (t)I Y > = 0 entonces ocurrirfa que donde $ ( t ) = 0 para algGn no puede s e r , ya que 9 t E [ T 'd T per0 &to es s o l u c i d n de una e c u a c i 6 n d i f e r e n c i a l lineal y s i en algtin punto de cero, e n t o n c e s es cero e n t o d s e l i n t e r v a l 0 iii) S , de y E R", ; n L T ~, T ~ ]es 8 t3 es invariante: Sea x E S , e n t o n c e s para cada n e que < $(t), x> = 0 , l u e g o : <$ (t),x> = 0 -> t C [ T ~ , T ~ ] se tie - PRUEBA DEL TEOICEMA: Razonarldo por reduecidn a1 nbuurdo, su - pongamos que no es un proceso o p t i m a l , y e h t c r n c e s (x,u) existe un control u [to,qtal que -tl ci6n i n i c i a l yue es€a d e f i n i d o e n un inter-halo < tl tomarla como el o r i g e n . I) St Sea xl, que podmos l a t r a y e c t a r i a correspon- 4 diente a Sea y l l e v a e l punto desde l a posi- hasta l a posici6n final xo - u. l a f u n c i 6 n que aparece e n e l enunciado del princi- pio d e mSximo, e l c u a l se cumple para el proceso ( x , u ) . Calculemos <+(fi) ,x (TI)> : - -- en l o anterior se toma e n c u e n t a que X I ~ = 0, ~ y }gue - x(t0) = x(t0) = X 0 - En l a p d g i n a 17 dernostramos que: entonces a n d l o g a m e n t e se we que: De acuerdo a Pa r e g l a de Newton-Lelbnitz; tencmos: la funcidn subintegral es mayor que ,cero, ya que face el p r i n c i p i o de rndxirna y la f.unci6n u s a t is <+,Bu > e s el mdximo para v E U ) ; por lo tantcr: <JI,Bv > ( Por otra parte t e n e m a s gue: per0 c$,Bu > debe ser mayor o i g u a l a cera, pya. quc' <.$ft),By$ s para cada t [TI,tl.] f i j o en <q(t),Bu(t)b -2 <@(t) , ~ u ( t )> > O y cada para cada v G U, y t C coaro O t U: ltl,tt:i; -. D e ( * ) y I**)se c a n c l u y e qu2: -" < l k J p x ( t t ) * >- 0. demustrmos que 6 s t a es la f u n c i 6 n nuXa sobre e i S i ~ t e r ~ a l o hemas v i s t o que: ( Ahara hien, sea dl c j r i g e n , sea u ' y u": U1 w tJt E IT', ,t.-J ) *-. la c a x a def p o i i e d r o una a s i s t a de U1 f 1 U q u e con+-iene euyos v 8 r t i c e ~ ; ,5012 Para cada t f i j o en r-- jt. , t l J c o n s i d e r e n ~ o sla f u n c i i i n : i s e t i e n e que: p s r a cada t fi jc e n (TI,tl], I* v a r i a n d n v en Ijl; por Otra parte: Es conocido q u e si. una f u n c i d n lineal asume en a.13 p u n t o in.- tcrior dc un poliedro su m6ximo, entonccs e s t a f u n c i d n constante. POI: lo t a n t . ~ ,a s m e lo,.;m i s r n a s v a l c ~ c sr.n u" ; o s e a , para cada t.r El.tlI] es u' y Por e l lema a n t e r i o r , Bw pestenece a algfin s u b e s g ~ a c i oi n va r i a n t e r e s p e c t o de A , y e s t o c o n t r a d i c e que U p o s i e i 6 n general. Considerenos de nuevo el e3ernplo i n t r s d u c t o r l o : resolviendo: La funcidn +: = (91,$:7) - dcbe . rnax c [-1r11 ( $ i t ) BV>, ' satisfacer: -l o sea: max v c [-lrl] $2(t)Y = 4(t) it) < $ ( t ) ,rju(ti' tlene In y f%acier& 10s cSirlculos correspondientes tenemos: f (-ct+d) max v; = (-ct+d)u ( t ) . v E [-1 ,I] Hay c u a t r o posibilidades para la f u n c i O n [t:, q 3 t - y u r a s son: Sea.: > -ct+d, que de acuerdo a las siguientes E i - = ioj R no puede ser, porquc en e s t e ::.:as(> $2 serfs la f u n c i 6 n identicamente i g u a l a $ = cero. E n t o n c e s el max v [-I f1-J es en cada caso: t I (-ct+d)v) , Los p u n t o s de discontinuidad d e l c o n t r o l u s e llarrian PUNTOS DE CONMUTACION. El estudio de este probiema a trav6s deP p r i n c i p i o dcL m8- ximo nos da, como s e ve, rnss i n f o m a c i 6 n q u e el e s t u d i ~rea -- l i z a d o mediante Pa p r o g r m a c i 8 n dinSmica. E n t o n c e s , ya sabemos que el c o n t r o l v a l e 1; o vale -I; asme arnhs v a P o r e s pera co:: un solo punto de c o m n u t a c i 6 n por l o t a n t o p a r a d e t e r m i n a r las trayectosias tenemos: R e s o l v i e n d o ambos sistemas, obtenemos yuc: 1 2 x1 = 7 x 2 X1 - + - 1-2 x 22 8 , para + 8 o el s i s t e m a (I); y para el sistema (TI). ; En eada caso hay s o l o una curva qlle llega a1 o r i g e n del sistma de c o o r d e n a d a s ; uniendo e s t a s dos curvas tenemos: L a uni6n d e e s t a s dos curvas d i v i d e en dos partes el p l a - no; tomemos, por e j e m p l o , u n p u n t o P del plano que e s t 6 "por encima" de l a curva, y determinernos cud1 es l a t r a y e c t o r i a 6ptima para llevar e s t e punto desde su p s s i e i 6 n # - inicial hasta el. o r i g e n . Por el. p u n t o P pasan: uaa s o l u c i 6 n del s i s t e m a CX! corres - porldiente al c o n t r o l u = c o r r e s p o n d i e n t e al controL P y una soluci6rr d e l siszerna (13;; u = -1, como se i n d i c a en la fi- yura: Lo q u e i n d i c a que la t r a y e c t u s i a 6ptihna correspoz:XJtinte a3 pt~:~l"Li? ees: De rnanera anbloga, sc v r q u e sf tomasos el p u n t o "por deba jo" de l a curva, la t r a y e c t o r i a bptima c o r r e s p o n d i e n t e e s : En resumen, hernos d e m o s t r a d ~qile el-igiendo un p u n t c a r b i t ra ria e n el plan0 hay solo una trayectoria yue satisface el p r i ncipio de mbximo. Torr~ando er. c u e n t a l a s c o n d i c i o n e s suf i c i entes, s e oh biene 2x1 -- rnediatamente, que esta t r a y e c t o r i a m i s m a es 6 p t i m a ~ EL CASO GENERAL Demos dos ntimeros n a t u r a l e s a r b i t r a r i o s n y r. Sea U C IRm un c o n j u n t o o r b i t r a r i o no v a c z o , con m6s de elemento. o s wiq ' Sean D C IR un c o n j u n t o a b i e r t o , un y f u n c i b n , c o n t i n u a , con sus d e r i v a d a s p a r c i a l e s con - tinuas respecto a las n + l variables Como c o n t r o l e s , c o n s i d e r e m o s l a s f u n c i o n e s u: [tz, t';l -1 continuas a trozos. un c o n t r o l si u Tomando dos p u n t o s ( t o . x , ) r - U, ( t l , x l ) E Dr se dice a d m i s i b l e r e s p e c t o a1 prohlerna t," = to, t: = tl y e l d i c h o problema de c o n t o r n o t i e n e solucibn. Ahora c o n s i d e r e m o s t a m b i e n una f u n c f o n a l de t i p 0 0 para minimizar. donde g, atg, s 3, son c o n t i n u a s sobre D x U. Denotando e l conjunto de 10s c o n t r o l e s a d m i s i b l e s con ii (xo ,xl), n u e s t r o problema esquematicamente es J(X,U) g o ( t , x , u ) .--> = f C t , x , u ) = A x + Bu, y ( t , x , u ) = 1 , En e l caso considerado U o b i e n , J ( x , u ) = tl es e g u i v a l e n t e a - min! tU 0 ; la desi-gualdad P o r a n a l o g k a con l a f f s i c a , denotemos con H - l a siguien t e funci6n: E s t a f u n c i d n s e denomina f u n c i 6 n de Hamilton. B e ve i n - m e d i a t a m e n t e , q u e l a e c u a c i 6 n o r i g i n a l y l a e c u a c i 6 n aux i l i a r s e e x p r e s a n e n tgrminos d e la f u n c i d n d e H a m i l t o n respectivamente: Y e l p r i n c i p i o de mdximo d e m o s t r a d o para e l c a s o l i n e a l toma l a s i g u i e n t e foma: max V € u ~ ( x ( t ) v, , $(ti) = ~ ( x ( t,.) u ( t ) , $ ( t ) ) . - Con e s t a r e f o m u l a c i d n tenemos P a p o s i b l i d a d d e l a genera l i z a c i d n d e l t e o r e m a d e principio de mdximo. En e l c a s o - d e l problema ( A ) d e f i n a m o s l a f u n c i d n de Hamilton d e mane ra s i m i l a r : E l principio de Mdximo de P o n t r i a q u i n . d Sean u € un x control optimal, control l a t r a y e c t o r i a correspondiente x u , es decir, a1 es l a s o l ~ c i b nd e l prob1m.a d e con torno En este c a s o e x i s t e una s o l u c i d n no n u l a de l a e c u a c i 6 n dif e r e n c i a l t a l que, para todo t max V € OBSERVACION. c rt: . I, t'; se t i e n e . H ( t , x ( t ) . v,$(t) ) = H(t,xEt) ,u(t),$ftl). u L a e c u a c i d n (1) no depende de l a v a r i a b l e I). 11. CONTROLABILIDADl OBSERVABILIDAD Todavfa no hemos examinado e l c o n j u n t o IT de Los p u n t o s en 10s c u a l e s e l sistema es c o n t r o l a b l e a l c e r o . Sj. un I ,TI , e n t o n c e s sobre [ O no T e x i s t e un c o n t r o l a d m i s i b l e q u e l l e v a e l x, a1 cero. Ade - punto x0 no p e r t e n e c e a l 1 ,T > 0, e n t o n c e s el con T j u n t o de 10s c o n t r o l e s a d m i s i b l e s r e s p e c t o a l a s c o n d i m a s s i xo no p e r t e n e c e a 1 - ciones d e c o n t o r n o e s vacfo. Por eso e l p r a b l e m a de l a c o n t r a b i l i d a d es un problema muy i m p o r t a n t e del p u n t o de v i s t a de l a o p t i m i zacibn . C~nsideremose l s i s t e m a l i n e a l lRnxn Sea e l c o n j u n t o B = JRn- el es - donde A € pario lRm. Luego, los c o n t r o l e s c o n s i d e r a d o s son t o d a s U l a s f u n c i o n e s c o n t i n u a s a t x o z v s d e f i n i d a s sobre un i n t er vale compacto, con sus v a l o r e s e n d i c e c o n t r o l a b l e a 1 cero scbre e x i s t e un c o n t r o l a d m i s i b l e lRm . E l s i s t e m a (1) se [to,tQ d e l p u n t o u: [t,,tl], ci6n diferencial # xo, s i t a l que l a ecua - - t i m e solucibn. El sisterna (1) s e dice totalmente c o n t r o n ].able al cero sobre [to. tl'). si p a r a todo p u n t o xo E IR , el sistema (1) es controlable a1 cero sobre [to,tJ d e l punto x Sea 0 . La matriz fundamental del sistema ( l ) donde , O: [tort1] es decir, l a a p l i c a c i d n X t [tort,] 3 @ -+ JR nxn ( t ,T), es una solucidn ma - t r i c i a l del sistema hprnogeneo Se sabe que l a s o l u c i 6 n d e l sistema (1) con la condicidn j n i c i a l x(to) = x 0' s e expresa m e d i a n t e la fdrmula de Cau - es c o n s t a n t e , s c t i e n e Cuando A Cuando A y B $ ( t .t 1 = exp A ( t - t o ) . 0 son f u n c i o n e s m a t r i c i a l e s , tienen l u g a r I fdrmulas similares, luego todos 10s resultadados se pueden generalizar fgcilmente para este caso. Definamos una matriz W(to,tl) de la siguiente forma: La controlabilidad total del sistema. (1) se caracteriza mediante la ma.triz W(to,tl). TEOREMA. El sistema (1) es totalmente controlable al ce- ro sobre [to,tl] si y solo si la matriz W(to,tl) es po- sitiva definida. DEMOSTIUCION. Supongamos que W (to,tl) es una rnatriz po- sitiva definida. Entonces es invertible. Sea x punto cualquiera. Tomemos el siguiente control E IRn un definido como sigue: Utilizando la fdrmula de Cauchy para el punto inicial y para el control (51, se tiene : Por lo tanto,el sistema (1) es totalmente mntrolable a1 cero sobre el intervalo [tortl] . - Ahora supongamos que el sistema (1) es totalmente contro lable al cero sebre el intervalo [to,tJ, W(t 0rt I ) no es positiva definida. un vector x no nu'lo, tal que Par otra parte, tenemos pero la matriz Entonces debe existir En virtud de la continuidad del integrando, se tiene - Tomando en cuenta el hecho que el sistema (1) es total mente controlable sobre punto [to,tl] x l = - $(tl,t,) -1x obtenemos que para el existe un control tal que P(tl,to)~l + jtl$(tltt) Buitldt t 0 es decir, Calculemos la noma de x, utilizando (7) = 0 , E s t o muestxa que l a m a t r i z W ( t o , t l ) es p o s i t i v a d e f i ni da. OBSERVACIONe - S i e l sistema (1) es t o t a l m e n t e controla ble al c e r o , e n t o n c e s l a r n a t r i z W ( t 0 ,tl) e s p o s i t i v a es i n v e r t i b l e . definida, por lo tanto W(to.tl) Si es i n v e r t i b l e , e n t o n c e s , tomando e n c u e n t a l a W(t0rtl) p r i m e r a p a r t e d e l a p r u e b a d e l teorema s e o b t i e n e contralabilidad d e l sistema. la A p a r t i r d e e s t o obtenemos l a ' s i g u i e n t e ' afirmacibn: " E l sistema (1) e s t o t a l m e n t e c o n t r o l a b l e a l c e r o s o b r e [t ,tl] s i y s o l o s i l a m a t r i z W ( t o , t l )e s i n v e r t i b l e " . 0 Ahora, vamos a p r o b a r o t r a c o n d i c i d n n e c e s a r i a y s u f i - c i e n t e p a r a l a c o n t r o l a b i l i d a d t o t a l a 1 c e r o de8 siste- TEOREMA., E l s i s t e m a ( 3 ) e s t o t a l r n e n t e c o n t r o l a b l e a1 ce - ro s o b r e [to,tl] s i y s o l o s i r l a c o n d i c i d n d e ~ a l m a n, es d e c i r , l a s i g u i e n t e c ~ n d i c i b nde rango t i e n e l u g a r : rango (B, AB DEMOSTRACION. a) ,..... ,A n-l. B) mos que W(toftl) . (8) Supongarnos q u e (11 no es t o t a l m e n t e c o n t r o l a b l e a1 c e r o s o b r e rnatriz W ( t o , t l ) = n bo,tl] . En e s t e c a s o no es p o s i t i v m e n t e d e f i n i d a . es s e m i d e f i n i d a p o s i t i v a . 4 la P r o b a re En efecto, W (to,tl) es simetrica y se tiene se anula, entonces e n virtud de l a continuidad y l a novegatividad de l a norma cuadrada tambien se anula e n cada p u n t o d e l i n t e r v a l 0 [t,,tl] Luego, . L a k-6sima d e r i v a d a de ( 9 ) respecto a t es S u s t i t u y e n d a e n ( 1 0 ) t: = t l r s e t i e n e n P o r l o t a n t o e l rango de la matriz (B, AB, ....,A n- 1B ) f o m a d a de las matrices k A B (k = 0,. ., n-1) , menor que n , es d e c i r l a c o n d i c i b n de Kalman no t i e n e Zugar. Ahora, supongarnos q u e e l rango ( B , A B , . . . Luego, existe un vector , An-1 x # 0 , tal R) < n. que U t i l i z a n d o e l teorema d e Cayley-Hamilton, existe un po- linomio de g r a d o n, t a l que 2iT es una r a l z d e l plinmio, es d e c i r , d e b e n e x i s t i r c o n s t a n t e s cob c ~ . . lC . n-l ' tales que P o r l o t a n t o , obtenemos U t i l i z a n d o (121, (13) y (14) por i n d u c c i e n se demuestra que T T k B (A) x = O (para t o d o k) . Luego, se t i e n e k=O Ahora, se demuestra facilmente' que la Eorma c u a d r s t i c a se anula en x # 0. En e f e c t o , Por lo tanto el sistem,a no es totalmente controlable a1 cero sobre el intervalo [to,t j . OBSERVACION. 1) La condicidn de K a l m a n no depende del i n t e r v a l o [to, tl] , entonces la c o n d i c i b n de Kalman tiene lu- gar si y solo si, el sistema ( 1 ) es totalmente con - trolable al cero sobre un intervalo [to,tl] cual - quiera. 2) La sufici-enciadel principio de mbximo, se prueba de manera similar en el caso, cuando el conjunto U que contiene el cero es un poliedro convexo en 1 su interior y la condicidn de Kalman esta satisfecha pox el sistema. E n t o n c e s tiene lugar e l s i g u i e n te teorema. -TEOREMA. Supongamos que el sSstema (1) es t o t a l m e n t e controlable a1 cero, y el conjunto U convex0 - es un poliedro que contiene el cera en su interior. Luego un proceso (x,u) e s 6ptim0, si verifica el principio , de maxim0 de Pontriaguin. La condicidn de la controlabilidad es una condicidn # - c u a l i t a t i v a , p e r t e n e c i e n t e a l a t e o r f a d e sistemas. En - - t u n c e s , e l p r i n c i p i o d e mdximo c o n , s u c a r a ' c t e r c u a n t i t a t i v o t i e n e t a n h i e n un c a r a ' c t e r c u a l i t a t i v o en la teorlta de s i s t e m a s . mora c o n s i d e r a n o s e l sistema (1) d e nuevo c o n donde C es una m a t r i z de una ob- n x k. - E l sistema (1) con l a o b s e r v a c i d n (15) se dice totalmen te o b s e r v a b l e s o b r e un i n t e r v a l 0 [to,tl] s i t o d o p a r (u,y) de c o n t r o l y o b s e r v a c i d n d e t e r m i n a unfvocamente e l estado i n i c i a l xo . D e otra manera e s t o es, si entonces x 0 OBSERVACION. = xl . L a d e f i n g c i d n se puede r e d u c i r considerando solamente un sistema c o n t r o l a d o con e l c o n t r o l n u l o , p e s t s que la d e f i n i c i d n no depende esencialrnente del control. E u e f e c t o , s i un estado i n l o i a i x 0' corresponde unf-mca- m m t e a una observac56n r e s y e c t i v a del sistema cont-.rola d o con u = 0, e n t ~ n c e se s t ~estado i n i c i a l x 0 tainl>.i&n - corresponde u n f v o c a e n t e n una obscrvacien rcspectiva deX sistema c o n t r s l d d a con un c o n t r o l u cualquiz~a.Su- pongamos 10 contraria, e s dlecir, se tienen (16) y (1'7). E n t o n c e s la d i f e r e n c i a de ( 1 6 ) y (17) e s 0 - Luego, la sbservacidn cia1 xo - x. . C! $(t,to) (xO-xI) Q corresponde a la corsdicidn i n-.i Pero cl sistema c o n t r o l a d o con es observable unfvocamente. Por lo tanto, u = 0 xo = x l . La afirmaci6n recfproca as i s m e d i a t a , es d e c i r , si para t o do c o n t r o l u , l a condiciSn inicial e s t a d e t e n n i n a d a - unfvocamente por l a observacibn entonces para el control u = 0 t m b i 6 n l a c o n d i c i e n infcial queda d e t e r m i n a d a unfv o c m e n t e pos l a observacibn. Jhora,definamos una m a k r i . ~ M( to,t , 1 d e la siguiente for 4 . V m o s a ver coma se puede c a r a c t c r i z a r del sistema (1) en t6rml.nos dq (18) . la observabi-lidad - TEOREMA- El sistema (1) con l a observacibn (15) e s t o t a l mente observable sobre M(to,tl) Lto,tJ si y solo si la m a t r i z es i n v e r t i b l e . DEMOSTRACLON. -observable. Supongamos que e l sistema e s totalmerite - En virtud de la f6rmula de Cauehy la sbser- vecidn de l a t r a y e c t o r i a correspondiente a1 estado i n i .cia1 xo, con c o n t r o l u definida como s i g u e - 0 . e s la funcidn - c i d xo , queda u n f v s c m e n t e d e t e m i n a d a por la &EZP-C~.&~ debe ser xo = 0. 61 M(to,tl) Luego no es singular. M(t,,tl) es una matriz i f i v e r t i b l e , e n t o n c e s l a ecua - 'c.i.6n 619) se mresuelve un%vocamentc respecto de la observa -. c i 6 n y, finalmente xo v i e n e dado p a r la fdrrnula Ahora, cansideremas un s i s t m a aut6nomo con una obsesva - ci6n aut6nomaC es decir, -PI3OPOSICTON. sobre 10,tl] , entonces el interval0 --DEMOSTi?A.CION. bre S i el sisterna ( 2 ) es totalmente obssrvab1.e [O,tl], [to,toftl] es t u t a l m e n t e observable sobre para cada - Si el sistema e s totalmente observable so- e n t o n c e s s e g h e l teorema a n t e r i o r la natriz e s invertible. Sea t0 C D3 un n€irriero cualquiera. mans -. funnando la integral mediante I,ucgo, la rnatriz &¶(to,to c ts] tambien es i n v e r t i b l e . Consideremos nuevamente la matriz M ( 0 , tl) Tansfomando la integral (21) med$ante Tomando e n cuenta e s t a elti-ma integral se ve queda d e f i n i d a por l a r n a t r i z quc ella W (0,tEl correspondiente a1 Euego se tiene e l s i g u i e n t e : --TEOREMA. LO, tl] E l sistema ( 2 0 ) es totalmente observable sobre s i y solo s i e l sistema ( 2 2 ) es t o t a l m e n t e c o n trolable a cero sobre LO,tJ , por lo tanto, si y solo si, la siguiente c o n d i c i B n de Kalman tiene lugar OBSERVACIONES : 1 . - La c o n d i c i 6 n 2 3 n o depende del nfamero tlr l u e g o , si l a condici6n ( 2 3 ) d e Kalman estd. s a t i s f e c h a , e l sis- tema (20) es totalmente observable para todo sobre el interval0 [O, . En tJ tl > O este cnso diremos que e l sistema es t o t a l m e n t e observable. Ahora definamos el sistema conjugado d e l s i s t e r n a ( 2 0 ) de l a siguiente manera SegGn las condiciones de ~alrnanel sistema (203 es totalmente controlable a1 c e r o , si y solo si, el sis tema conjugado ( 2 4 9 es totalmente o b s e r b a b l e . Ademas e l sistema ( 20) e s totalmente observable si y- solo si el sistema conjugado ( 2 4 ) es totalmente controlable a l cero. #