LA RED NEURONAL BACKPROPAGATION COMO INTERPOLADOR

LA RED NEURONAL BACKPROPAGATION COMO INTERPOLADOR al r/ Carlos Eduardo Castrill6n Velasquez ([email protected]), Jose Fernando Perlaza' Orduz, Aart Van Schoonhoven, Eduardo Owen ([email protected]), Roberto Segovia. ' . ;) I j ~ "1 Resumen: En el presente articulo se expone como aprovechar la caracteristica de generalizacion de la red neuronal BackPropagation para la interpolacion instantanea de datos en una y dos dimensiones, y como se puede realizar el entrenamiento de la misma durante el proceso (on line) para manejar datos que cambian dinamicamente. Ademas se muestra como rue esta h~cnica implementada sobre un instrumento de medicion climatologica para invernaderos, diseftado por los au to res. 1. INTRODUCCION Todo sistema interacrua permanentemente con olros, como resultado, el sistema en cuesti6n varia continuamente y en muchos casos sus variaciones se presentan de manera rapida y compleja. Este es el caso de los ecosistemas, y sistemas biol6gicos; ellos son complejos y su variaciones son practicamente impredecibles (9). En muchos procesos, (especialmente cuando se trata de investigacion) se requiere hacer un seguirniento preciso de muchas de las variables de estos sistemas, y se haee necesario el am1lisis y Iii interpretacion de estas variables de una manera casi continua 'e inmediata, donde la sola observaei6n humana no puede seguir la nipida evoluci6n y cambio de estos sistemas. l,C6mo podria realizarse este seguimiento, amilisis e interpretacion al mismo ritrno que la variac ion de las variables de mi sistema? Una opcion es interpolar una serie de puntos para encontrar la funcion de una curva que pasa por todos y cada uno de estos puntos (15). Las propiedades deseables en una interpolacion son entonces, tener una representaci6n parametrica, es decir que pueda representarse en funcion de ciertos parametros, obtener una curva suave, sin sobre oscilaciones entre los puntos y que el eambio en uno de los puntos no afecte a toda la eurva sino solo a un entomo reducido y faci! de calcular (15). Existen diversos metodos de interpolaci6n, entre los que se encuentran; mmlmos cuadrados, polinomios de interpolaci6n de Lagrange, polinomios de interpolacion de Newton, Splines, Interpolacion de Hermitte (16)(17). Segun los datos, su desviaci6n y distribuci6n, se escoge el metoda que puede lograr una mejor interpolaci6n. Estos metodos, son apropiados cuando el sistema es de dos dimensiones, pero para el caso de tres dimensiones la complejidad aumenta, sin mencionar el proceso de seleeci6n del metodo de interpolaci6n. Otra tecnica, es la propuesta en este articulo, usando la red neuronal backpropagation, la eual puede ajustar los parametros de interpolaci6n (que en este caso serian sus pesos) mediante un mecanismo de aprendizaje de los puntos conocidos, cuando se eonoce un nivel de error permitido en dicha interpolacion y ciertas condiciones de distribucion de los datos. La ventaja de esta tecnica esta en la facilidad para representar datos en tres dimensiones (0 mas), y en que el mecanismo de ajuste de pesos es automatico y oculto al programador, mediante el entrenarniento de la red neuronal. Este articulo pretende mostrar una estrategiade interpolaci6n de datos de una y dos dimensiones, para una variable, de manera nipida y precisa asi como su implementacion en sistemas de adquisicion de datos biologicos reales, basado en el principio· de funcionamiento y en la capacidad de generalizacion de la red neuronal Backpropagation (7). .. -', j] La red neuronal Backpropagation es capaz de generalizar un comportamiento a partir de un conjunto de muestras escogidas como patrones de entrenarniento. Asi como el cerebro humano, esta red necesita de una etapa de aprendizaje en la que se Ie presentan algunos ejcmplos, la red actualiza sus pesos mediante la presentacion repetida de estos ejemplos por medio de un mecanismo de· correcci6n de error hasta lIegar a obtener aciertos con estos patrones. En esc momenta se podra usar la red para encontrar cualquier otro valor difcrente. a los patrones de entrenamiento esperando una respuesta apropiada. En otras palabras esta red busca una funcion de comportamiento que se acople a los valores muestreados y al comportamiento del sistema con un valor minimo de error. La red backpropagation tiene cntonces una ctapa de entrenamiento y otra elapa de trabajo. . i::l i" ..:; .. J ,'~ "1 J ) '-' ,,'f'\: . ",," \.~ '\ ...... '" ' ....~-.:.) ... SIll" ~) ~-' &:" LUi ~"'. V\.'~,",l \'IJ.f:.. Fig. 1. Estructura de una red neuronal Backpropagation Si se tiene un conjunto de puntos en un espacio tridimensional, cuya distribucion es conocida y se sabe quc la variacion entre un punto y otro, ocurre de manera suave,l,que mecanismo podria generar una interpolacion rapida de estos puntos y responder a la variacion ocurrida en alguna dimension de alguno(s) de los puntos? Supongamos que se tienen un conjunto de n puntos en un espacio tridimensional como 10 indica la figura 2. Cuando se trata de dos dimensiones, una red backpropagation hallana una curva, en el caso de tres dimensiones la red, aprende la superficie que pasa por dichos puntos, esto se aprecia en la figura 3. y % y P3t P1· • PS• . . , Fig. 3. Tnterpolaci6n en dos y tres dimensiones. ·P7 PS. P4. Aprovechando la capacidad de la RNA Backpropagation, de generalizar para todo el conjunto a partir de unos cuantos puntos, podemos disefiar una estrategia de interpolacion en tiempo real utilizando un objeto, la Red Neuronal Backpropagation. x ·Pn y Fig. 2. Puntos en 3 dimensiones. Ademas se conoce que la vanaClOn entre estos puntos se realiza de manera suave, sin oscilaciones entre elIos, y que puede variar su ubicaci6n con respecto a alguna de sus dimensiones, por tanto requerimos de una estructura que dinamicamente cambie los parametros de la curva que interpola estos puntos. La capacidad de generalizaci6n de la red neuronal Backpropagation mediante su mecanismo de aprendizaje iterativo de ciertos puntos logra una curva que pasa por cada uno de los puntos de entrenamiento con un error minimo especificado por el error de aprendizaje. En otras palabras, aprende dicha curva (7). Esta red esta compuesta por una capa de enjrada, capas ocultas y una capa de salida, cada neurona con sus salidas conectadas a todos los elementos dc la capa de adelante. Una red de m capas se puede vcr griificamente como en la figurn 1. 142 4 -" ..1 v\"l P2 2. MARCO TEORICO - W! /~., ~\ ... 3. PROBLEMA Y SOLUCION Una de las principales caracteristicas de las redes neuron ales Backpropagation, es su capacidad de generali:zacion(7), es decir que a partir del aprendizaje de una muestra de elementos de un conjunto presentados como patrones de entrenamiento, esta red, es capaz de generar una representacion de todo el conjunto durante'su operacion. ..... -' '............. Universidad del Valle, Centro Internacional de Agricultura Tropical (CIAT), SATEK Ltda.. 143 3. 1 Diagrama de j1ujo de estrategia de intelpolacioll Los puntos a interpolar son entonces los patrones de entrenamiento de la red neuronal, se definen tambien el error minimo con que se desea esta interpolacion y se establecen la estructura dc la red (numero de neuronas) de manera que esta pueda generar la curva que cubra todos los puntos sin sobre entrenamiento, que genere oscilaciones no deseadas, y el intervalo que se representara con la curva 0 superficie. Con estos val ores como entradas el diagrama de la estrategia de interpolacion seria el siguiente: Control de datos z M6dulo de entrenamiento de la ~ RNA Backpropagation Red ""enid. @ M6dulo de barrido instalacion con una diferencia entre punto y punto de I a 10 centimetros. Este barrido genera una matriz, cuadrada con los valores de la variable en cada cuadro de 10 x 10 CMS. Esta matriz es representada con gnificos de colorimetria como 10 muestra las figura 7. Errer C8US1Ido par ~fide --------- "-.,x~------""'" Superficie Patrones de Salida untos x,y de barrido dande e: es el error de entrenamiento. El segundo m6dulo se encarga de recibir una red neuronal con una estructUra que evite las oscilaciones entre puntos por algful sobre entrenamiento y el error minimo. con el que se desea obtener la interpolacion. Este bloque realiza un 'procedimiento de aprendizaje iterativo como el explicado anteriormente, hasta llegar al error minimo. Una vez terminado el aprendizaje de los puntos, este bloque entrega una RNA entrenada en cuyos pesos estan los panimetros que cara'cterizanla superficie que pasa por dichos puntos. Este valor puede dejarse fuo, 0 ser calibrado por el usuario entre ciertos limites impuestos por la capacidad de la red neuronal. Fig. 7. Datos interpol ados del microclima. Instrumento Microclimatics 2D. 4. APLICACI6N 5. PRUEBAS Y RESULTADOS Este mecanismo de interpolaci6n ha sido implementado en un instrumento de medici6n del microcIima de invernaderos y cuartos de crecimiento del Centro Internacional de . Agricultura· Tropical CIAT, el cual recibe el nombre de MicrocIimatics 2D. Este instrumento midelas variables, temperatura, humedad· Relativa, luminosidad y ventilaci6n para todo el area del invernadero. a partir de una red de sensores distribuida dentrl;> del mismo. Una· vez implementado calibrados los sensores y ajustado el mecanismo de interpolaci6n de manera que la red entrenada no presente oscilaciones no deseadas, observando que la variaci6n entre punto y punto se realice de manera suave. Se procedi6 a evaluar con un sensor de r~ferencia para cada variable, la precisi6n de la red comprobando que la medida obtenida en un punto cualquiera dentro de la instalaci6n corresponde a un valor con un error por debajo del deseado, en caso contrario, se variaba la estructura de la red neuronal, o se aumentaban las iteraciones de su entrenamiento hasta lograr un aprendizaje mas fino. Una solucion fue almacenar una red que estuviera cerca de los datos promedio, con 10 que su entrenamiento era mas rapido y preciso. El instrumento de medici6n esta compuesto por una red de sensores de humedad relativa, temperatura y luminosidad, distribuidos estratf!gicamente en el invernadero 0 instalaci6n en una matriz de 3 x 4 puntos, como 10 muestra la figura 6. En el,tercer mOdulo se realiza un barrido de un intervalo de la superflcie, simplemente entrando las posiciones x, y de varios puntos con una distancia Ax y /!"y pequeiia entre ellos que .depende de las necesidades del usuario 0 de la plataforma de visualizaci6n de los datos de salida. -.. . . . Este mecanismo es sensible daiios en la entrada, algUn dato que presente un valor extremo, producido por algful dano en la entrada, hace que la superficie aprendida se afecte notablemente, especialmente si es un valor cercano al limite del intervalo, como 10 muestra Ia figura 8. P.".l Hum>!lf",ado. ---' '--Vtntil.ldo:rtl 3.2 Error de interpolacion SuperflCle correct. • El error de entrenarniento de Ia red neuronal indica que los val ores real de cualquier punto puede ser el valor entregado mas 0 menos el valor de error, como 10 muestra la figura 5. -E;- ~:r: Fig. 5. Error de interpolacion Grupo de 4 sensotu Red de sen.mes Fig. 6. Red de sensores En esta aplicaci6n se conoce exactamente la posici6n de cada uno de los sensores, y estos son los patrones de entrada para la red neuronal. El valor medido por cada sensor corresponde a los patrones de salida. Los algoritmos de adquisici6n e interpolaci6n fueron realizados en lenguaje G, LabVIEW y siguen la estructura del diagrama de flujo explicado anteriormente, en un cicIo repetitivo. El error minimo establecido para estas redes es de 0.005 y el barrido de la red entrenada se realiza para toda la 144 con et bIoque de caito! de delo. Para esta aplicaci6n especifica de medici6n del microcIima, se pudo comprobar que los sensores percibian el minimo cambio para una distancia de separaci6n entre ellos maxima de 2,5 mts (I). a ,. Esta secuencia puede ser usada en un cicIo repetitivo, de esta manera la red neuronal estara permanentemente actualizando Ia superficie dado un cambio en sus patrones de entrenamiento. ~ La red presenta inmunidad a los daiiosen la entrada hasta para 3 puntos adyacentes entre si cuya separaci6n es inferior a 2,5 mts (I). Cuando los puntos defectuosos ascienden aun total de 4 se comienza a notar oscilaciones en esa zona y por tanto la superficie generada no representa la superficie real. Fig. 4. Diagrama de flujo de estrategia de interpolacion Este diagrama esta compuesto por tres bloques. El primero simplemente realiza una seleccion de los datos validos y trabaja a criterio del usuario de la estrategia ademas con este bloque se eliminan datos que en un sistema de adquisici6n previo hayan tenido errores. Los valores de las dimensiones X y Y corresponden a los patrones de entrada de la red, y la dimension Z equivale a la variable que se va a interpolar y corresponde a los patrones de salida. defecto en aIg\rlo de los pol,...... de _ode Fig. 9. Efecto entrada fuera de range eliminada. {(x I,y 1) ... (xn,yn)} RNA Error Mlnimo correct. Aunque los puntos de sensado estan distribuidos uniformemente sobre el espacio, es posible que para algunas otras aplicaciones sea necesario tener ciertas regiones mas densas, es decir, con mayor cantidad de puntos de sensado y con una separaci6n entre ellos mas pequeiia, si las variaciones en esa pequefia region son mas marcadas, pero este noes el caso para el microclima de. invemaderos y cuartos de crecimiento. . 6. CONCLUSIONES La red neuronal backpropagation, dada su capacidad de generalizaci6n, puede ser usada para realizar la interpolaci6n de datos, cuando se puede soportar cierto grado de error y se conoce ciertas caracteristicas con respecto a la variaci6n de la variable entre lospuntos para el intervalo de interpolaci6n. Se puede usar una secuencia de toma de patrones, entrenamiento de la red y barrido de la red entrenada, la cual al ser repetida ciclicamente logra que la interpolaci6n responda a alguna de entrada alcanzando una variaci6n en los datos interpolaci6n dinamica de datos. Por medio de esta estrategia de interpolaci6n se esta usando la red Backpropagation, que es una red neuronal con entrenamiento fuera de linea, en una operaci6n que requiere dicho aprendizaje EN LINEA. Error caus8do per defecto en eigIm de los -------- ~ Fig. 8. Efecto de entrada fuera de rango. En otras palabras, un error grande en un patron de entrada se traduce en un error grande en gran parte de la red. Para evitar esto el primer bloque de la rutina de interpolaci6n elimina estos val ores que se salen de rango, afectando entonces solo de manera local al resultado de la interpolaci6n y no de manera general. Figura 9. Para realizaruna correcta interpolacion de los datos, se debe escoger el nfunero apropiado de neuronas de la capa intermedia, la cual se puede definir mediante una etapa de calibraci6n del interpolador. El exceso de. neuronas, puede provocar oscilaciones no deseadas y su deficiencia, puede dejar a la red con un error muy alto. El tiempo de procesamiento puede reducirse si se dispone de una red entrenada con valores. promedio 0 frecuentes, de los datos de interpolaci6n. Esto provoca que la red inicial quede mas cerca del error minimo. Tambien se puede recurrir a 145 almacenar la ultima' red entrenada y reutilizarla en el siguiente cicio. EI m6dulo de control de datos, que elimina los datos fuera de rango, hace que tared siempre se entrene con datos villidos, 10 que hace la tecnica de interpolacion inmune a danos en la entrada, afectando solamente una porcion local de la superficie interpolada. . EI interpolador con red Backpropagation se presenta entonces como una herramienta para trabajar con sistemas que requieran analisis e interpolacion de datos en tiempo de real de adquisici6n y para datos de mas de dos dimensiones que presentan complejidad para las tecnicas de interpolacion . convencionales. Este metodo tiene las siguientes caracteristicas: AnaIisis en tiempo real, representaci6n parametrica, generaci6n de una superflcie suave, inmune a dallos en las entradas, calibracion del error y de las oscilaciones no deseadas, adaptabilidad a las entradas, caIculo de parametros automatico y oculto al usuario. 14. Marrero Negron Pablo V.; Pagina web. Notas de an~1isis numerico, . . http://uprhmateOI.upr.clu.edul-pnmlnotas4061/index.htm IS. Pedro J. Pascual Broncano y Antonio Gutierrez, Pagina Web Escuela Tecnica Superior de Informaticadela Universidad Aut6noma de Madrid, 1998-2000 http://www.ii.uam.es/-pedro/graficos/teorialCurvaslntro/Curv asIntro.htm 16. Contenido de la materia Analisis Numerico y Programaci6n FORTRAN; Pagina Web, Universidad . Tecnol6gica de Panama; Facultad de Ingenieria Mecanica, http://ns.fim.utp.ac.palalfalanfortranlindex.html 17. DIAZ WLADIMIRO; Pagina Web; http://www.uv.es/-diazl 18. REDES NEURONALES ARTIFICIALES;pagina web http://www.gc.ssr.upm.es/inves/neurallann21anntUtorial.html 19. Eduardo Morales, Pagina Web, redes neuronales; http://w3.modtesm.mxl-emoraleslCursoslOptimizalnode68.h tml 20. Redes Neuronales Artificiales, Pagina web http://electronica:com.mxlneural 21. Redes Neuronales; Pagina web, CLASIFICACION DE FRASES DEL LENGUAJE NATURAL Sergio Roa Ovalle Luis Fernando Nino Departamento de Ingenieria de Sistemas Universidad Nacional de Colombia Bogotii, D.C. Resumen: En este articulo se considera la tarea de la c1asificacion de frases del lenguaje natural, utilizando una red neuronal recurrente. En este caso el resultado es la c1asificacion de las frases por su estado gramatical (gramaticalmente correctas 0 incorrectas). En este trabajo se logra en un . porcentaje aceptable esta c1asilicacion, utilizando como ejemplos para entrenar a la red neuronal recurrente, frases codificadas del lenguaje natural, b!lsandose .esta codification en la teoria lingiiistica de Reccion y Ligamiento. entrenamiento (algoritmo de retropropagaeion a traves del tiempo) utilizado ampliamente en redes neuronales recurrentes [5][6][10] y los resultados obtenidos a partir de la implementacion de la aplicaci6n que se realiz6. 2. EJEMPLOS DE ENTRENAMIENTO Los ejemplos de entrenamiento empleados se obtuvieron tomando frases codifieadas en este caso del lenguaje Ingles [6], basandose esta codificaei6n en la Teoria de RecCien y Ligamiento 0 de Principios y Parametros, la eual afirma que solo los parametros y el texico son adquiridos por un ser humano, los principios no son aprendidos [2]. Con el entrenamiento de la red neuronal, 10 que se busca es producir los mismos juieios que un hablante de lengua nativa sobre datos gramatical y no gramatiealmente correctos y en un futuro inferir del comportamiento de la red neuronal la gramatiea del lenguaje correspondiente sin tener mueho conocimiento de su estructura, en un intento por exhibir el mismo tipo de poder diseriminatorio que se ha obtenido por los lingiiistas con la Teoria de Recci6n y Ligamiento [6]. En [6] se describe el sistema empleado para clasificar las palabras en distintas categorias, como sustantivos, verbos, articulos, y tambien se obtiene una subeategorizacion de ellas, por ejemplo verbo transitivo. De esta codificaci6n se tomaron los respectivos ejemplos de entrenamiento. Algunos ejemplos usados en el entrenamierito, se muestran en la Tabla 1. Palahras clave: Redes neuronales recurrentes, procesamiento dellenguaje natural, teo ria de reccion y ligamiento, algoritmo de retropropagaclon a traves del tlempo. http://www.gc.ssr.upm.es/inves/neurallindex~html REFERENCIAS I. INTRODUCCION I. CASTRILLON C.E. y PERLAZA J.F., Caracterizacion del microclima en un invernadero y un cuarto de crecimiento (area de biotecnologia) en el CIAT, mediante teenicas de instrumentaci6n virtual. Tesis de grado, Universidad del Valle, Facultad de Ingenieria, Cali. 2000. 2. CARVAJAL, L.· Metodologia de la investigaci6n, Cali. 1990. 3. BUNGE, MARIO. La ciencia su metodo y su filosofia. p. 110. 4. BACHELARD, G. La formaci6n del espiritu cientifico. 5. COBO, H. Norinas Tecnicas. Octava edici6n. Impretec . Ltda. Guadalajara de Buga. 1998. p. 49.. 6. Natiorial Instruments,. LAB VIEW 5.1 Manual de programaci6n. 1999. 7. Hilera J. y Martinez V., Redes neuronales artificiales. Addison-Werley Iberoamericana. U.S.A. 1995. p. 390. 8. Kohonen T., An introduction to Neural Computing. 1988. 9. Jones, J.G.W. & Street, P.R.; System Theory Applied to Agriculture and The food chain. Elsevier Science Publishers Ltda. N.Y. U.S.A.; 1990. p. 365. 10. Robert, G.D. Steel & James H. Torria; Principles and procedures of statistics. McGraw Hill. N.Y. 1960. pA8I. 11. Adela Abad de Servin & Luis A. Servin Andrade; Introducci6n al muestreo. Editorial Limosa.. Mexico 1978. p.200. 12. Cardona, Jaiber; Desarrollo de mOdulos para redes neuronales backpropagation en ambientes de instrumentaci6n y. control implementados con LabVIEW. Universidad del Valle, Cali. Colombia 1998. 13. Duque Miriam Cristina; Estadista .biotecnologia y asesora del CIAT, Comuriicaci6n verbal, Palmira, 2000. Las redes neuronales han sido utilizadas ampliamente en tareas de clasificaei6n y, enpafticular, sonde mayor uso y difusi6h las redes multieapa con realimentacion. Sin embargo, en el caso de la clasificaci6n de frases dellenguaje natural se puede verificar' que las redes neuronales reeurrentes poseen una habilidad inherente para simular aut6matas de estado finito [5], por medio de los cuales se puede llegar a inferir la gramatica de un lenguaje regular [6]. En este caso, a partir del comportamiento de una red neuronal reeurrente como un sistema ctimimico [5] se puede lIegar a construir un automata finito deterministico [6] [4] [7] [8]. Sin embargo, se debe tener en cuenta que las gramaticas de los lenguajes naturales no pueden ser representadas en forma absoluta por modelos de estado finito, debido a la estructura jernrquica que poseen . estas gramaticas,. sin embargo, se ha demostrado que estas redes reeurrentes tienen el poder de representaci6n requerido para las soluciones jerarquicas [3J. TABLA 1 EJEMPLQS DE ENTRENAMfENTO CODIFICADOS Y SU CLASIFICACI6N Frase En el desarrollo de esta investigacion se utilizo entonees una red neuronal recurrente para la clasificaei6n de frases como gramaticalmente correctas 0 incorrectas. En este trabajo se eomprob6 la capacidad de una red neuronal denominada red neuronal de Elman, utilizada en trabajos previos con problemas de lenguaje natural [6], [3] [9]. Algunas otras redes neuronales recurrentes han sido propuestas pero la red neuronal de Elman ha. presentado resultados muy satisfactorios en cuanto al entrenamiento [6] .. En las siguientes secciones se hara una breve presentaei6n de los ejemplos codificados utilizados para el entrenamiento de la red, los cuales fueron tomados de [6] y cuya codifieaci6n se base. la teoria de Reccion y realiz6 teniendo como Ligamiento [2]. Posterionnerite se expondra la topologia de la red neuronal de Elman empleada, eI algoritmo de 146 Codificacion Estado gramatic al n4 v2 a2 c n4 v2 adv I I am eager for John to be here n4 v2 a2 c n4 pi v2 1 adv f----- n4 v2 a2 n4 .v2 adv 0 I am eager John n4 v2 a2 n4 pi v2 to be here 0 adv 1 I am eager to be n4.v2 a2 v2 adv here n4 v2 a2 21 v2 adv 1_ Como entradas a la red neuronal se presentanentonces las frases codificadas a traves de un analizador sintlictico y lexico. Esta clasificaci6n se codific6 de tal forma que la informaci6n se pueda presentar a la red neuronal. Por 147 ejemplo: ~".II P4Ml' Clase sustantivo No es de la clase = 0.0 Subcategoria 1 = 0.5 Subcategoria 2 = 0.666 Subcategoria 3 = 0.866 Subcategoria 4 = 1.0 WII donde no es la tasa inicial de aprendizaje (0.2), C, = 50,c} = 0.65, N = numero total de epocas de cntrenamiento (4000), 11 W _ _~~) u la epoca actual de entrenamiento. Este plan se usa para evitar que, el algoritmo conveJja a minimos locales no adecuados [6]. (Xlf''' -- ~'y W III • • ~(n;l;{lJ WI! I' '\''\)1 ....~~1.''''''~.,~..-.'It.. '~ En [6] se describe la utilizaci6n de 9 clases de verbos (v), 4 de sustantivos (n), 4 de adjetivos (a) y 2 de preposiciones (P) y adicionalmente las clases marcador (mrkr) ,determinante (det), complemento (c) y adverbio (adv) que no tienen subcategorias, es decir se les da valor de 1.0. EI vidor que se Ie da a las subcategorias de sustantivos, verbos, adjetivos y preposiciones se establece a partir de un orden lineal de acuerdo a la similitud entre subcategorias [1]. Las salidas de la red neuronal son originalmente 0 (gramaticalmente incorrecto) y I (correcto), pero a la red se Ie' dieron como :salidas esperadas 0.1 y 0.9 para evitar que Ia funci6n de activacion para cada neurona se sature [6]. A la red neuronal se Ie presentaron 365 ejemplos de estc tipo repartidos equitativiunente entre ejemplos correctos e incorrectos para entrenarla y obtener como resultado la clasificaci6n de los distintos ejemplos en el estado gramatical correspondiente. '\ <l ·'>"'. .'.u,/·v ll 0 " , ,/'•.'t'fa I \JlIll ,7\l\WI~~_" rm / . "" ,," ..-_.--- 'fICll1P!) Fig. 1. Utilizaci6n de la ventana En la Fig. I se muestra la red Neuronal de Elman. En la implementacion se determino usar 20 neuronas en la capa oculta ya que se presentaron los mejores resultados en la convergencia del algoritmo de entrenamiento. En la Fig. 1 no se muestran todas las conexiones. Para Ia capa de salida; las 2 neuronas se tomaron para la clasificacion de frases corrcctas e incorrectas. Si la frase es correcta la respuesta deseada para la primera neurona es 0.9, y parala segunda 0.1. Si la frase es incorrecta la respuesta deseada para la primera neurona es 0.1 y para la segunda 0.9, es deCir, Ia primera neurona clasificaria los ejemplos correctos y la segunda los incorrectos. ~, / -h \ -lO x.tl) 'W;l l't1{ll ''f:;; lu1\' ~; /'\Vf XlII} W;u' XilItl), I} * ! a lit & Fig. 2. Retropropagaci6n a traves del tiempo Sea U el conjunto de indices de neuronas quetienen salidas hacia otras neuronas, T(t) el conjurito de indices para los cuaies se tiene una respuesta deseada, e el error para cada neurona, E(t) el error en el tiempo t y E to /al (t',1) elerror total, desde un tiempo t' hasta t, se tiene que: e (/):::.(di(IJ-Yl (I) sikE T (I) A o elwlnu:aso E{t)=~ L .2 t~(l , [111 (t)r 1 3.TOPOLOGiA DE LA RED NEURONAL La red utilizada es una red neuronal recurrente, es decir que en general los estados anteriores de algunas 0 todas sus neuronas tambien se reciben como entrada a esas mismas neuronasy al resto [5]. En este caso se us6 Ii llamada Red Neuronal de Elman [3], en Ia cual existe retroalimentacion desde cada neurona en la capa oculta hacia el resto de neuronas en esa misma capa oculta. Para poder ingresar los ejemplos a la red neuronal se utiliza en la capa de entrada una ventana de tamaiio 2, en la que las frases se ingresan de a 2 palabras [6]. Cada ventana corresponde a 8 neuronas, correspondientes a las 8 categorias, es decir, en total, 16 neuronas, y el valor que se les ingresa es el correspondiente a la subcategoria 0 0 si la neurona no corresponde a esa categoria. Por ejemplo el ingreso de la frase codificada "nl v In corresponderia a 0.5 en la primera neurona, 0 en las oiias 7 de la respectiva ventana, 0 para la primera neurona de la 2a. ventana, 0.5 para la segunda neurona correspondiente a verbos y 0 para el resto. El uso de una ventana se debe al objetivo futuro de la investigacion, el cual es encontrar el automata correspondiente extrayendo esa informacion de los cambios en el estado de la red neuronal, esto debido ala caracterizacion de Ia red como un sistema dinamico [5]. Si se usara una vehtana tan grande como la frase con mayor cantidad de palabras el resultado de la red seria mejor pero no se estaria obserV'ando eleomportamiento que se busca [6]. El proceso se puede observar en la Fig. I. 0 4. ALGORITMO DE ENTRENAMIENTO ,. Se utilizo la actualizacion cstocastica, es decir, los ejemplos : son tomados en forma aleatoria paraevitar que dos ejemplos seguidos se tomen como de la misma clase y cada ejemplo es presentado e inmediatamente se hace la retropropagaci6n. Los pesos se inicializan aleatoriamente con valores desde -2 hasta 2, valores que presentaron un mejor rendimiento. C,..t.ff(t ',/)=.2: E(T) 5. RESULTADOS OBTENIDOS ' En el entrenamiento realizado el error total promedio dado por la surna de los errores cuadraticos de todos los ejemplos fue de 0.09 aprox. para un promedio de error por neuron a de 0.3. Debido a la complejidad computacional del problema, que para 11 neuronas es del orden O(nh) en espacio y O(1I 2h/h' para cada tiempo de entrenamiento, no se pudo realizar una gran cantidad de simulaciones. Para los 365 ejemplos cada simulacion duro 2h. 30m. en una maquina con procesador Pentium III.· En un principio los ejemplos iniciales que se Ie dieron fueron algo contmdictorios, porque algunas frases con codificaciones identicas tenian estados gramaticales diferentes. Estos ejemplos fueron eliminados y se logro mejorar el rendimiento de la red. , Se utilizo una version [10] del algoritmo de retropropagacion a traves del tiempo (BPTT) [5]. Este algoritmo seusa para el entrenamiento de redes neuronales recurrentes,' es una extension del algoritmo estandar. Se deriva de desplegar la operacion temporal de la red en una red con alimentacion hacia adelante, y su topologia crece en una capa' a cada paso de tiempo, manteniendose los pesos simlpticos. En la Fig. 2 se muestra una red recurrente sencilla con dog neuronas, mostrandose las conexiones entre elIas como primera instancia y en segundo lugar la red desplegada en el tiempo. EI algoritmo utilizado es una combinacion del BPTT por epocas (para cada epoca los ejemplos son mostrados en su totalidad y posteriormente se hace la retropropagacion) y el BPTT tnmcado 0 en tiempo real (los ejemplos se muestran e inmediatamente se realiza la retropropagaci6n para los It tiempos mas recientes) [5]. En este algoritmo solo hasta h' tiempos adicionales se hace la retropropagacion; en este caso h' se toma como el tiempo desde que ingresa laprimera palabra de una frase a la red neuronal hasta el tiempo de la ultima palabra. Para la implementaci6n, h se tomo con un valor de 20, que es aproximadamente el doble en promedio de h'. ' TABLA 2 Si ahora se define k 0 U, v como la respuesta neta y 0 como la funci6n de activaci6n (se utiliz6 la funcion Iogistica sigmoide) se tiene que el eaJculo de los gradientes locales pam la neurona k es el siguiente: "'·h·~{T)}e,ft) ' tp '(I'jh)} Respuesta Frase codificada Correcta~corr. deseada nl v2a2nl pi v21 adv nl v2 a4 nl v2 adv nl det nl v3 vO nl v2 nl vi nl v2 v6 nl v2 nl det nl v3 nl v2 v3 nl v2 a3 nl v2 a4 nl nl vO nl v3 nl n4 det nl v2 !rl T""'t n."'f }~ll/i' '(v1iTHl".(T)+ 'I ~______~RE=S~LT~DOSOB~NIDOS ,'··uililt + IU 2:. I .. ~' # r-/i'<T~t r O!M!'i,ll+Il~( J:A 1.' Se observa que solo se tienen en cuenta las respuestas deseadas para los ultimos h' tiempos. Una vez se ha hecho la retropropagacion hasta t-h+ 1 se realiza cl siguiente ajuste de pesos pam la neurona i: ' I L\ w~.=rl' L 6;lT)x,(T-l) t-J·oA~1 donde 0 es la tasa de aprendizaje, que se obtuvo de la siguiente manem: 1'11'1', Incorrecta 0.1352 Illcorrecta 0.8473 Correcta 0.0988 0.9012 Correcta Correeta Correcta Incorrecta Incorrecta . Incorre~ v2 a2 det nl v2 adv~631 0.9368 Incorre~1 .'~ (-Io,-:!" fif.f-/r' 0.031010.9~89 0.8765 0.7729 0.9459 0.0684 0.0083 __ 0.1234 -_"-C-0 ~} 0.0540 0.9315 0.9916 0 nl v3 v2 a 2 det nl 0.0:3'70 0.9629 Incorrecta I v 2 adv I det nl v2 v2 0.9369 0.0631' Correcta Se utilizaron otros 135 ejemplos para probar la red y, se estimo su clasificaci6n en un 70% aproximadamente. Algunos resultados obtenidos se muestran en la Tabla 2. 0 tJ, ...!!.. \' I .~ ' ; ' } ~ J 6. CONCLUSIONES " , IIJIJ.l En este tmbajo se ha discutido aeerca de Ia clasificaci6n de frases del lenguaje natural y se ha encontrado que la 148 149 , INTERPOLADOR PARA CONTROLDIFUSO ADAPTATIVO clasificaci6n es relativamente satisfactoria, dada la capacidad inherente de las redes neuronales recurrentes para simular automatas de estadofinito deterministic os, y dado que las redes neuronales' recurrentes tambien son' una buena representacion para estructuras jenirquicas, en este caso la gramatica del lenguaje en estudio, se considera que estas redes pueden ser objeto de investigaciones posteriores ,en tareas de procesamiento dellenguajenatural y la obtencion de automatas y gramaticas que se puedan inferir de ellas. ·'7.AUTORES 12, no. I, pp. 126-140,2000. [7] C.W. Omlin y c.L. Giles, "Constructing Deterministic Finite-State Automata in Recurrent Neural Networks", J. ACM, voL 45, no. 6, p.937, 1996. [8] C.W. Omlin y C.L. Giles, "Extraction of Rules from Discrete-Time Recurrent Neural Networks," Neural Networks, vol. 9, no. 1, pp.41-52, 1996. [9] A. Stolcke, "Learning Feature-Based Semantics with Simple Recurrent Networks", Technical Report TR-90-015, Int'l Computer Science Inst., Berkeley, Calif., Abr. 1990 [lOJ R.I. Williams y 1. Peng, "An Efficient Gradient-Based Algorithm for On-Line Training of Recurrent Network Trajectories," Neural Computation, vol. 2, no. 4, pp. 490-501, 1990. Sergio Roa Ovalle es estudiante de ultimo semestre de pregrado en Ingenieria de Sistemas de la Universidad Nacional de Colombia sede Bogota. Sus areas de interes son procesamiento de Imagenes, ' VISIon computacional, procesamiento del lenguaje natural y de la voz" sistemas inteligentes, reconocimiento de patrones y computacion grafica. Betancur Betancur, Manuel; Pedraza Diaz, Marta Elena y Marin Arango, Diego Ignacio , GRIAL ':'Grupode Investigacion cn AutomaticaUniversidad Pontificia Bolivariana, Medellin, Colombia '[email protected] ReSumen:, Se presenta una idea para la optlmizacion de un proceso automatico de ada pta cion de uncontrolador FMRLC* slmulado. Dicha idea consiste e'n interpolar el valor de cada una de las reglas activadas conslderando el valor de las reglas vecinas segun su validez 0 certeza. La interpolation se realiza despues del mecanismo de inferencia y antes de la interfaz de concrecion (defuzzyfication). Esto se realiza para cada una de , las reglas activadas de forma tal que el valor final despues de la interfaz de concrecion es mejor que el obtenido con el FMRLC original. ' Abstract: An idea for the optimization of an automatic adaptation process in a simulated FMRLC* is presented. The Idea consists of interpolatillg the value or each one or the active rules using its neigbbors according to their certainty value. Interpolation follows the inference mechanism just before the defuzzyfication process. This is done for each one orthe active rules so that the final value after the defuzzyfication process is ' better than the one obtained with the original FMRLC. Luis Fernando Niiio es profesor de la Universidad Nacional de Colombia, Ingeniero de Sistemas Universidad Nacional de Colombia, Msc. en Matematicas, Universidad Nacional de Colombia, Mscen Matematicas con enfasis enCiencias dela Computacion, Universidad de Memphis, B.U., Ph.D., en Matematicas con enfasis en Ciencias de .la Computacion, Universidad de Memphis, ,E.U. Sus areas de interes son. Redes Neuronales y Sistemas' Bio-inspirados, Computacion Evolutiva, Sistemas lnmunologicos Artificiales, Procesamiento de lmagenes: y Computacion Griifica, Aplicacion de las Mateni~ticas' a las Ciencias de la Computac1on. ' Keywords: Interpolation, FMRLC*, IFMRLC+, Intelligent Fuzzy Control.' ' 1. INTRODUCCION Este trabajo es la segunda fase en la exploracion de una serie de ideas por parte del GRIAL tendientes, a mejorar el metodo FMRLC* para adaptacion y aprendizaje' autonomo en controladores difusos, usando ideas bio~nspiradas [5]. La importancia del trabajo radica en desarrollar un controlador difuso inteligente capaz de interpolar 10 que ha aprendido para algunas situaciones de modo que pueda aplicar ese conocimiento en situaciones similares pero menos conocidas. Esto es, que su comportamiento usani un ciertb grado de "sentido comtin" al enfrentar situaciones anormales 0 desconocidas. REFERENCIAS [I] E.B. Baum y F. Wilczek, "Supervised Learning of Probability Distributions by Neural Networks", Neural Information Processing Systems, pp. 52-61, New York: Am. Inst. Of Physics, 1988. [2] C.A. Black, "A step-by-step introduction to the Government and Binding theory of syntax," Summer Institute of Linguistics, 1999. [3] 1.L. Elman, "Distributed Representations, ,Simple Recurrent Networks, and Grammatical Structure," Machine Learning, vol. 7, nos. 2/3, pp. 195-226, 1991. New York: Springer Verlag, 1996. [4] C.L. Giles, C.B. Millcr, D. Chen, G.Z. Sun, H.H. Chen y Y.C. Lee, "Extracting and Learning an Unknown Grammar with Recurrent Neural Networks", Advances in Neural Information Processing Systems 4, pp. 317-324, San Mateo, Calif.: Morgan Kaufmann, 1990. [5] S. Haykin, Neural Networks, A Comprehensive Foundation. Second Edition. New Jersey: Prentice Hall, 1999. [6] S. Lawrence, G. Lee Giles, S. Fong, "Natural Language Grammatical Inference with Recurrent Neural Networks", IEEE Transactions on Knowledge and Data Engineering, vol. Esta investigacion muestra como usar cl conocimiento adquirido en las reglas ya aprendidas -teniendo como medida de su certeza 0 validez la cantidad de veces que estas hayan sido utilizadas- con el fill de mejorar el valor de reglas mcnos ciertas, y obtener asi un resultado que mejore la efectividad de la salida del controlador. 150 2. INSPlRACI6N DEL INTERPOLADOR Para ilustrar la idea basica suponga que un operario se enfrenta al problema dc guiar un bote usando el timon, pero recibe muy poca (0 ninguna) instruccion en cuanto a su funcionamiento. , Para unas, condiciones dadas de viento, oleaje y carga del bote; el timon tendra un cierto efecto en el rumbo del barco. Durante . este experimento mental dichas condiciones permaneceran constantes. Se realizarnn tres pruebas sobre este sistema hipotetico para asi llegar a la intuicion de la necesidad de un "interpolador" para lograr un resultado con , "sentido com un": En el primer escenario, al pedirle al novato "timonel" ,que gire el bote levemente, este aplicara una cierta fuerza al timon. Dependiendo de los resultados -que de seguro no seran'satisfactorios en un primer momento- el ajustara su conocimiento para ese caso particular. En 10 sucesivo ante solicitudes similares sera cada vez mas certera la accion a tomar, 'pues con la experiencia se adapta la accion de control, y con la memoria' se aprende. Esto implica que aplicara laaccion que fueexitosaen el pasado si se llegan a presentar las mismas condiciones' en el' futuro. Igual fundona el sistema para este caso cuando el "timonel" no es un humane sino el algoritrno FMRLC. En un segundo escenario, si en'vez de solicitar un giro leve, se solicita algototalmente diferente, por ejemplo un giro muy fuerte en sentido contrario, entonces las condiciones son otras. EI timonel (}(~ase controlador) debera realizar un proceso de aprendizaje similar al que se acaba de describir para el primer escenario. Este ensayo-error sucede tanto en el caso con el timonel humano como con el que usa el FMRLC. Lo interesante se aprecia en un tercer escenario posterior en el que se solicita realizar un giro con intensidad intermedia. Un timonel humane "intuitivamente" aplicani una "interpolaci6n" entre los dos escenarios que ya conoce y para los cuales confiaen las reglas aprendidas. Asi pues, aplicara una fuerza intermedia al ,timon (sin haberlo aprendido ni de terceros ni de su experiencia previa), y seguramente lograra resultados aceptables sin tener que seguir todo el proceso de aprendizaje para esc ca.so particular. Tomara un "atajo". Por supuesto, si las decisiones tomadas no resultasen adecuadas, sigue disponible su capacidad de adaptacion y aprendizaje para ajustar dicllo conocimiento a partir'de la experiencia. 151 a) Si en vez de un timonel humane dicho bote hubiese estado controlado por un FMRLC, para todos los escenarios' hubiese seguido el mismo algoritmo de aprendizaje. Por tal razon en el momento de hacer el primer giro de intensidad intermedia se hubiese desperdiciado el conocimiento previo adquirido para los giros leves y los giros fuertes. Es precisamente en este Ultimo tipo de escenarios donde resulta interesante y necesaria la capacidad de interpolacion para el FMRLC, emulando en alguna medida el comportamiento del timonel humano. b) 3. EL ALGORITMO FMRLC El metoda original FMRLC (Passino y Yurkovich [I]) que sirve de base para aplicar la idea del interpolador tiene un conjunto de llx II reglas en el control ad or, usando el error e(t) y.la derivada-del-error de(t) como entradas (Ver figura I). Dispone de un modelo de referencia de la planta para orientar la sintonia del controlador, de modo tal que la salida de dicho modelo de referencia Ym(t) se convierte en la salida deseada Y(t) de la planta real. Usando la desviacion Ye(t) & Yc(t) entre el modelo y la planta, se alimenta un modele inverso intuitivo de la planta para decidir las adaptaciones que deben hacerse a las reglas del controlador. Una matriz de certezas de 11 xll: Esta matriz cambiara dinamicamente durante la aplicacion del algoritmo asignandole un grade de certeza a cada una de las reglas' aprendidas, y su crecimiento dependera de una funei6n que converge ai, siendo este el valor maximo po sible de certeza, es decir,es equivalente a tener una seguridad del 100% de que esa'regla se ha adaptado muchas veces y que por 10 tanto debe ser correcta. Una matriz de mascara de 3x3: Esta matriz se utiliza para limitar el valor de ,Ia interpolacion a las reglas que mdean cada una de las reglas activadas, ya que el algoritmo toma solamente una regIa en cada iteracion y esto se repetini cuatro veces, una para cada regIa activada, teniendo en cuenta que el grade de importancia de las reglas vecinas esmenor que la de la regIa en juego. Esta matriz tiene unos' valores predeterminados los cuales' cambian dinamicamente dependiendo del b'fado de certeza dela regIa: en cuesti6ri, i.e. si la certeza de una'regIa determinada a la cual se Ie va a realizar el procesoes mayor a 0.8, la interpolaci6n solo ten<4U en cuenta la regia del. centro, es decir el valor del centro de la matriz de certt;!zas sera uno y todos los demas seran cero. ' ." El objetivo del. mecanismo de adaptacion es sintonizar el controlador difuso adaptando sus reglas de modo que el buque persiga la orientacion del modele de referencia. Por 10 general, el controlador difuso tiene 4 reglas activas, debido al traslape de las funcio!les de rnembresia de las (dos) entradas, el error e(t) y Ia derivada-del-error de(t). . Esas reglas son siempre vecinas, formando un "cuadrado'; que viaja por la matriz de reglas segun los valores de e(t) y de(t). Estas cuatro ieglas son las utilizadas para el calculo del valor de la accion de control en el momento de Ia concreci6n en cada cicIo de muestreo y control. . La planta 0 proceso simulado [3] es un. buque-tanque. La elltrada u(t) a la planta es el angul0 de "tim6n", y la salida Y(t) es la orientaci6n 0 rumbo de la nave. 152 Todas las simulaciones se realizaron para un buque-tanque. EI intervalo de tiempo fue lO.OOO segundos, con un paso de integraci6n de 1 segundo, y un periodo de muestreo de 10 segundos para eI controlador. [3]. EI codigo se encuentra disponible en [5]. c) Una valiable temporal: Esta variable es una matriz, de 11x11 ell donde se almacella el valor obtellido de la regIa despues del proceso de interpolaei6n, con el fin de no alterar el valor de las reglas adaptadas en la matriz de reglas original. Max.Error se define entonces como el maximo del valor absoluto de Ye(t) durante cada simulaci6n. 5.2. CECI "Criterio de error cuadratico integral" Este criterio res alta los errores grandes, y perdona los pequeiios segun una ley cuadratica. 5.3. CECIT "CECI temporal" Como el CECI, pero ademas perdona los errores iniciales, y castig~ los de estado estable. 5.4. CEAI "Criterio de error absoluto integral" Este criterio castiga con proporcionalidad' los errores grandes y pequeiios. 6. RESULTADOS Las Uicnicas empleadas por el interpolador conllevan a una notable mej~ria en el desempeno del sistema, las cuales pueden ser vistas cualitativamente cn las tablas I y 4 Y cuantitativamente en las tablas 2 y 3. En la tabla 1 se observa el resultado de la matriz de certezas para tres escenarios diferentes. Dicha matriz indica el grade de confiabilidad delaprendizaje para cada regIa difusa: Mejor Caso: Este es el primer caso que se presenta en la tabla 1. En este ejemplo, las presintonia inicial es la correcta, entonces solo son exploradas las reglas del centro, 10 cua( significa que hay una buena sintonia y que el control se realiza principalmente alrededor de esta zona. Caso Neutro: Es el segundo caso que se presenta en la tabla I. En este ejemplo la presintonia inicial la matriz de reglas se encuentra en cero, entonces se observa que algunas reglas alejadas del centro alcanzan a ser exploradas al cometer errores en las decisiones. Sin embargo, al final se logra que se exploren las reglas del centro que son las que deben predominar sobre el control. Peor Caso: Es el tercer caso que se presenta en la tabla I. En este ejemplo la presintonia inicial de la matriz de reglas tiene val ores totalmente opuestos a los correctos. Por 10 tanto en la grafica se observa como las reglas exploradas son las de los bordes (saturaciones) con una tendencia a explorar las del centro. Es decir, el sistema tiende a estabilizarse para futuras iteraciones. La segunda, "Neutral", supuso una condicion nula, sin sintonia, i.e. al controlador se Ie ensefio que no respondiera ante los errores, sino que dejara el timon centrado y quieto. Fig. 2 Proceso de Interpolaci6n calculado Ym(t) menos Rumbo real Y(t).Ye(t) es un indicador de la efectividad del proceso de adaptaeion: A medida que decrece, significa que la planta se esta comportando del modo propuesto en el, modele de referencia, 10 cual es el objetivo del mecanismo de adaptacion. 5.5. CEAIT "CEAI temporal" Como el CEAI, pero ademas perdona los errores iniciales, y castiga los de estado estable. . 5. SIMULACION En la primera familia se supuso un razonable "Mejor Caso" para el modelo del controlador, i.e. las reglas iniciales se presintonizaron usando conocimiento intuitivo de Ia planta, instruyendo aI controlador, para virar la nave y corregir adecuadamente la orientaci6n. 1--.-,--- El metodode interpolacion IFMRLC propuesto aqui emplea los siguientes 3 elemen~os (Ver figura 2): Es posible establecer una analogia entre el metodo de interpolacion para eI control difuso adaptativo y el comportamiento de las personas aI enfrentar situaciones desconocidas. Estas suelen emplear herramientas similares a las usadas en situaciones parecidas vividas .anteriormente, pero de forma modificada puesto que no son iguales. Sin embargo, cuando se vive una situacion 0 experiencia completamente igual a una vivid a anteriormente, no es necesario modificar la forma en la cual se reacciona, sino que se confia en la experiencia previa. Una serle de 3 familias de pruebas se ejecutaron para los dos metodos (EI FMRLC "original" y el IFMRLC tlinterpolador"): 4. INTERPOLACION PARA EL FMRLC Fig. I. IFMRLC Una vez establecidos estos elementos, la interpolacion se realiza de la siguiente forma: se hace una multiplicaci6n entre la matriz de certezas y la de mascara obteniendo asi una nueva matriz la cual se normaliza. Luego se hace un producto punto entre esta matriz normalizada y la matriz de reglas. Finalmente este resuitado se lleva al lugar en donde iba a ser aplicada .' antes la regia enjuego. Vease Figura 2. La ultima, "Peor Caso ", supuso Ia peor condici6n posible, donde el diseiiador "erradamente" propone unas reglas iniciales que Ie ordenan al controlador aumentar el error girando la nave justo en el sentido equivocado. Esto equivale a enseiiar "mentiras" al timonel. Los criterios de desempeiio (benchmarks) us ados para todas las pruebas son los mismos y los resultados se muestran en la Tabla 2. Todos tienen valor ideal cero. Cada fila es un caso diferente. Las filas se agrupan por familias (condicion inicial). 5.1. Criterio Max.Error Sea el error-colltra-modelo-de-referencia Ye(t) el error que se presenta ante el mecanismo de aprendizaje, i.e. Rumbo 153 · TABLA 1: • COMPARACION DE LA MATRIZ DE CERTEZAS AL FINAL DE LAS SIMULACIONES "'.1t,,,,,!,_/111 __ ] .",?~,,1I' El interpolador tuvo solo una desmejora que se puede observar en la tabla 3, en el Mejor Caso, donde se tuvo una degradacion del 4% del maximo error obtenido para una referencia senoidal indicando un pequeno decremento en el maximo error absoluto, sin c.onsecuencias para los demas criterios de error los cuales tuvieron un buen comportamiento. § () ~ 1;:! 0 c.:!J "'u ~ .... ~ 0 t:.~ 3::E ~ N .t: 'ia 7. CONCLUSIONES ::E ....; I<f .... t.« <44'~--~n,.u , •• t_ .~~"'<>-"~1 "'" ~ ,,-,It..l 4. , _ ... ':;:11> l""".'. ".JII'"'' "~~ "'. r~~.,!, ~:::s () ~. g c.::; ~ 1'3z0 '" Como se puede observar, se logra una mejoria de hasta el 88% en el·peor caso que es justamente el mas critico e interesante. Los resultados esbozados en la tabla 2 muestran una mejora del 9% para el mejor caso, un 13% en el caso neutro y una mejoria del 88% para los casos peores y extremos -justo cuando mas se necesita la adaptaci6n inteligente con el nuevo metodo IFMRLC (interpolador). Por tanto, es justo decir que el interpolador aumenta la inteligencia del algoritmo FMRLC. (1) Tambienmejorola estabilidad en general y se suavizo el uso del actuador. REFERENCIAS ~ ()U (1) "0 .~ 'ia ::E ~.!r>~t,""'111f,*,,~,·j._\#',f ..H4~"-li N 1 ,q; ''1\ A.qu;i;li;;f_if... ,;:~\ "~1M"'" ''"'*''''',." w,U_'ttII: if_ ~ .._ " . , g ~ 0 c.~ ~u N .... ([) a t: (1) 3Q., ~ N .t: ~ ,...., Max-Error Seno Cuadrada ~iH",". ~-~"'-\t;;:. F//fol""t!' La tabla 2 presenta la medida de los criterios de desempeno para cada experimento, y la tabla 3. muestra la mejora comparativa en el desempeno del nuevo metodo interpolador contrastado con el original. [1.] PASSINO, K.M. y YURKOVICH, S., Fuzzy Control. Addison Wesley. USA. 1997. 475p [2.] OSORIO, M. y GONZALEZ, C.E., Ambiente interactivo para trabajo experimental en tiempo real usando Matlab, (9°:Cali:2000). En Memorias del IX Congreso Latinoamericano de Control Automatico, Cali, 2000, 1 CDROM [3.] Kevin M. Passino. Kevin M. Passino Home Page. Department of Electrical Engineering Ohio State. May 4,1999. Columbus Ohio. June 2 of 1999. <http://eewww.eng.ohio state.eduJ-passino/ic_code.htm> [Consulta: 14 Abril 2000]. [en linea]. [4.]BETANCUR, M. y ORTIZ, A., Fuzzy controller extrapolating adaptation methodology, (9°:Cali:2000). En Memorias del IX Congreso Latinoamericano· de Control Automatico, Cali, 2000, 1 CDROM [5.] Proyecto Fuzzy [en linea]. GRIAL, Mayo 2001. <http://www.upb.edu.co/griaVproyectos/fuzzy> [Consulta: 28 Mayo 200 I]. Cecit ,. CECI Seno Seno ' Cuadrada 2.Neutral 3.PeorCaso Original (x 103) lnterpolador Cuadrada Ceait Cuadrada 80067C 70829G 177680C I73380C 2 862500 138300 IS,S 1,85 TABLA 3 MEJORA EN EL DESEMPEflo DEL METODO DE INTERPOLACION Max-Error I.Mejor Caso Seno Cuadrada OO/! OO/! -4O/! 50/! Ceci Ceai Ceait Cecit Mejora Seno Cuadrada Seno Cuadrada Seno Cuadrada Scno Cuadrada Promedio 00/< Oo/! Oo/! Oo/! OO/! 00/< 00/< 0% Oo/! 50/! 160/< llo/< 17O/! 8o/! 12O/! 9% 3o/! 140/< 0% 13% 2.Neutral 0% 88% - 3.PeorCaso ..... 155 154 Ceai Seno I.Mejor Caso (1) t: (1) '" ....~ TABLA 2 RESULTADOS COMPARADOS PARA LOS METODOS ORIGINAL E INTERPOLADOR -~ ,t q ii II d TABLA 4 COMPARACI6N DE RESULTADOS DE SIMULACI6N PARA REGLAS INICIALIZADAS EN PEOR CASO REFERENCIA CUADRADA Il Peor casu para reglas iniciales Consigna Cuadrada [\ !! I, ,I11 t: .~ IiII ~ II ~ 'I III » .s::: .~ ~ t" II » » » tl t: ~t: a I if II I La senal cuadrada de referencia es la misma en todos los casos. Se muestra gnificamente despues de filtrada por el modelo de referencia. La base de reglas se, presintonizo con el "Peor Caso". ( EI negado de "Mejor Caso". ) La ganancia del Modelo de Referenda es igual en todos los casos. , . Se grafican los 10000 segundos de simulacion. Rurtx>rea(S(jicl:Jlynnb>_(~)tEI""-l'VlotEl",",co,gr"""', II !I Erick Maldonado ([email protected]), Miguel Strefezza ([email protected]) .~ II I' MODELAJE Y CONTROL DE UNA ~LANTA PILOTO DE NEUTRALIZACION DE pH MEDIANTE UN CONTROLADOR HIBIUDO DIFUSO-PID .t;.J ~ -0'2' ~ - e."" ~ 'u c::r ·5 O\~ 0t<') ~O\ NN II lh o .g .~ u .5 :a ~.S ~~ ::Su ~ u.lu.l ~~ C> ._ ..... .~ § g g.... ... AA I .rnrrnJ[] - 1000 2000 3000 <4(lOO 5000 fiOOO 7000 8000 0000 , .t: ~'<t Vlu.l 1,.. .,_ .~ .~ .~ . . ___J .s 1i1o .:; S 'd .- -i:l .~ "" .~ ~ e.. ~ 00 ~l· '-I~ .' (l 1000 J 2000 J ' N 3QCO~. .;!;;-----'-;;"""~",",,,,,,~,-+';,ooo.'-l,;;: .. .... ;;!-l-;;;!;;;-.;:!. o.~ ::So gg Tlempo(s.c) 156 modelo se presentan en las secciones 2 y 3. El esquema de control propuesto y los resultados en la seccion 4, las conclusiones son dadas en la seccion 5. 2. EL PROCESO La planta piloto es la representacion a escala de un reactor continuo e isotermico tipotanque agitado CSTR (Colltinuos Stirred Tank Reactor). En el se lleva a cabo una neutralizacion entre un acido debil (Fa), acido acetico, y una base fuerte (Fb), el hidr6xido de sodio, ambos dentro de un medio acuoso obtenido por la introduccion de un flujo de agua destilada (Fw ), para facilitar las condiciones de operacion. Para mantener el volumen (V), 1,65 Its., dentro del reactor constante, se utiliza una tuberia de desagiie. Esto permite que el proceso pueda trabajar con un minimo de instrumentos:· una bomba dosificadora que sirve para manipular el flujo de base, un electrodo para medir el pH, dentro del tanque y una tuberia de desagfie. Otra bomba dosificadora, para variar la entrada del flujo de acido, que serviria para simular perturbaciones en el proceso. Los caudales son del orden de 5OmVmill. El esquema se muestra en la figura 1. Palabras Claves: Control de pH, Control Hibrido, Control Difuso. l. INTRODUCCI6N El control de pH es extremadamente necesario en las industrias de procesos quimicos e involucra plantas de alta complejidad. Estos sistemas no son lineales, son variantes con el tiempo, y no es £licit reproducirios. Los controladores chlsicos no pueden ajustarse a perturbaciones 0 a cambios de puntos de operacion. Como posible solucion de esto, controladores no lineales han sido propuestos [2][3J[IIJ. Bajo conocimiento preciso del proceso y de sus no linealidades, estos presentan un buen desempeno en ciertos rangos. 3. MODELO Los controladores difusos son disefiados con base a conocimientos de un experto 0 por extraccion de datos del proceso [10] y representados por reg las lingiiistioas del tipo Si-Entonces. Estos tambien han sido utilizados en procesos no lineales [l J[ 6]. Los controladores hibridos parten con el proposito de combinar diferentes h~cnicas de control, y asi aprovechar las ventajas de cada una de ellas[4] [8]. Donde no solo la' combinacion de tecnicas de inteligencia artificial son utilizados, sino tambien la de controladores clasicos con alguna de estas tecnicas[5J[7][9]. EI control clasico acrua en los rilomentos en el cual el proceso se encuentra trabajando en condiciones normales. El controlador difuso actua cuando se pr.esentan perturbaciones 0 no linealidades, mejorando la resimesta del sistema. Son simples de implementar, presentando buenos resultados. En este trabajo se presenta la aplicacion de un controlador hibrido difuso-PID para el control de pH en una reacci6n de neutralizacion. Adicionalmente a la salida de este controlador es afiadida una etapa integradora, esta produce que los tiempos de respuesta se reduzcan en forma significativa. EI sistema presenta buenos resultados y responde a diferentes puntos de operacion. La descripcion del proceso, asi como el u.lu.l AA Resumen: En este articulo se presenta el modelo de una planta piloto de neutralizacion de pH, entre un acido debH y una base fuerte, con el objetivo de diseiiar un controlador para esta reaccion. Una aproximaciiin del modelo y de la dlnamica del sistema es presentada. La valida cion es realizada con datos obtenidos experimentalmente de la planta. Para eL control de este proceso no lineal, se propone el uso de un controlador hibrido difuso-PID. Adicionalmente se introduce a la estrategia de control una etapa integradora, la cual reduce en forma slgnificativa tanto en el tlempo de respuesta como el de establecimiento. 10000 lInguo tEl til'lOO. SllIidatEI oa1raodtr dfuso (edrada tEl "'"'co), 9rad:lr!, '1WJJT~)'~·f"f"···)f~"."-"'"~'i" :! Dpto. Procesos y Sistemas, Universidad Simon Bolivar. Venezuela Para obtener el modelo de la planta, primero es necesario desan-ollar un modelo fenomenologico que describa la reaccion de neutralizacion en el reactor. Luego se procede a validar el modelo con datos reales. Fig. L Esquema general de la planta. 3.1 Modelo del Comportamiento Hidraulico y de la Instnllllelltacioll. Bajo condiciones de laboratorio, debido a la utilizacion de un mezclador magnetico y a las pequenas proporciones del 157 dimlmica del elemento· final de control debe ser. modelado como un sistema de primer orden, con' restricciones en la entrada y tiempo de retardo, con ganancia de la base =45, as! la funci6n de correcci6n de la base es: reactor, los efectos del mezcIado pueden ser despreciados. Por otro lado, estando eI medidor de pH localizado en las cercanfas del tubo de salida del recipiente, eI retardo por trans porte en la medida de la variable control ada tambien se puede despreciar. La dinamica del sensor de pH es tambien despredable, debido a que se posee una medida instantanea del pH. Tampoco el elemento final de control, la bomba de la base, posee una respuesta dimimica que afecte la validaci6n experimental. La HJ1. . 1.8 Bef "'I = (s + 0.001) a F~ ~~ ~II",""~I"'''' I,:;:., r ~f 1 a fb fb1 fb2 Flujo acido Fea Factor de correccion para el acido 1 bU3J1 rn n=I rn + +' phd3 e> ... feb _. ~ . .," operaci6n pH vs time .. ~. Zero-Pole planta Ph +CNA ...~ Flujo base Fig. 2 Diagrama del sistema. La dinamica de la bomba de flujo de acido es representada con factor de ganancia del addo= 17 con un tiempo muerto, debido a retard os observados, de e 680" asf la correccion del acido resulta: Aef = 7.5· 7 6.5 . .4 * 0~9 (s + 0.025)(s + 0.028) 6508 + 1 6 pH 5.5 R j: Si e es Ai y de es!lj entonces dUj'''' eel +'deCz + C3 (I) Donde Cn sonconstantes y la salida del modelo es calcuhida por el promedio de los pesos de la contrlbuci6n decada regia. Las funciones' de perte.nencia del error (e) y de Ia variaci6n del error (de) se muestran en la figura 5. Una vez disejiado este controlador es necesario ver su desempeiio con la planta, de manera que se puedan obtener nuevos eonocimientos que permitan sintonizar el controlador PID. EI controlador PID esta descrito por: u=Kpe+Kde+Kdedt Cuando el error se hace pequeno el controlador difuso, para evitar sobrepicos, realiza una aeClOn de contrapeso evitando de esta forma que esto suceda 0 que sea 10 nuis pequeno posible. EI PID clasico por tener parte integral posee "memoria", por 10 que al acercarse al punto de operacion aun recuerda su estado anterior, esto se refleja en su salida de forma que esta por 10 general es mayor de 10 que se necesita, favoreciendo al sobrepaso, mientras que el controlador difuso por estar basado en reglas y comparaciones puede modificar mas rapidamente su salida, por 10 querealiza una flip ida acci6n compensatoria. Ademas presenta un· buen desempeiio cuando las no linealidades se presentan en el sistema. . FinaImente, al esquema de control hibrido, es agregada una etapa integradora, la cual hace novedosa la estrategia control del sistema. La funci6n de esta etapa es integrar el valor de la salida del controlador hibrido. Esto trae como consecuencia, que la respuesta del sistema se haga mas flIPida, produciendo una disminuci6n notoria en el tiempo de establecimiento, como se observa en la figura 7. Este tiempo se reduce en un 90% aproximadamente. Ademas esta etapa no produce alteraciones en la estabilidad del sistema, factor que 10 hace relevante dentro del esquema disefiado. (2) Se podria utilizar algUn metoda conocido de sintonizaci6n, como es el de Ziegler-Nichols, aunque con un mayor conocimiento' de la planta y de su interacci6n con el controlador difuso, resulta mucho truis 6ptimo haeer la seleccion de los parametros de una forma mas intuitiva, de manera que se complementen las acciones de ambos controladores. En la figura 6 se muestra la respuesta del sistema con un controlador PID, se puede notar que es muy lento. . ~~~ De esta forma en la salida del controlador se observan la contribuci6n de. fuertes efectos proporcionales, integrales, doblemente integrales. En forma mas abstracta y global se puede ver el controlador como el trabajo en paraIelo de un controlador "inteligente", que ejerce compensaci6n al controlador clasico, en paralelo a un controlador de la forma (PU 2). La presencia de efectos tipo integral, Iogra~" un error en estado estacionario nulo, al tiempo que permite que se alcance este estado muy nipidamente. 3.2 Validacioll y Resultados de la Simulaci6n. 3.5 LI 3 0 ---l~OOO--~rooo~~3000----~~~--5000~ 0000 Se desarrollo el modelo en SIMULINK®, figura 2. Se tierrpo (s) . realizaron varias simulaciones con este modelo, a Fig. 3. Cambios en el pH. continuaci6n se describe una de elias. Donde Fa,Fal ,fb,fb I Por medio de las simulaciones se observa la necesidad de Y fb2 son los val ores de acido y base utilizados para obtener introducir acciones de control del tipo integrativa, al la respuesta de la planta. . tiempo que el conocimiento adquirido de la planta se Al principio solamente ~I agua y el acido son mezcIados. . puede expresar con mayor facilidad a partir del error y la Inidalmente, un flujo de base en forma constante es variacion del error. Tomando estas como variables de afiadido. A los 2000 segundos, el flujo de la base es entrada para el control difuso. aumentado, produciendo un aumento del pH. Luego, a los i I 3000 segundos, el flujo de base es reducido, produciendo una caida del pH. Finalmente a los 4000 segundos, el flujo H de addo es reducido, produciendo un incremento en eI pH. p Los cambios en el pH son mostrados en la figura 3. ... -+ 4. CONTROL HIBRIDO DIFUSO-PID. Fig. 4. Esquema de Control Propuesto. EI sistema es muy lento, por 10 que una de las metas mas importantes que se tuvo en consideracion durante el proceso de disefio fue mejorar Ia velocidad del sistema, tanto en tiempo de alza, como en eI de establecimiento. Esto implica que el controlador difuso debe ser extremadamente rapido, por 10 que el tiempo de cruculo del mismo, debe ser pequeno, esto sugiere que se utilice el metodo de Takagi y Sugeno, al tiempo que el numero de reglas utilizadas sea pequeno. As! para este disefio se utilizan solamente cinco reglas que describan cl comportamiento del proceso, las cuales son de la forma: Aquf se describe el esquema de control hibrido propuesto, el cual combina las bondades del controlador PID y del difuso. Es simple de implementar, figura 4, donde las acciones de ambos controladores son sumadas. El controlador esta defillido por las regia." difusas del tipo Si-Entonces, obtenidas a partir de las simulaciones realizadas con eI modelo de la figura 2. 158 pH n..J,_"""" Fig. 5. Funciones ile Pettenencia ilel error (e) y de la variaci6n ilel error (ile). Si en el control hibrido se observan las acciones del control PID y del difuso en forma. independiente, se notara que en los instantes de error grande, los dos controladores actUan en forma aunada para alcanzar el punto de operacion en el menor tiempo de alza posible. II pH Tiempo (seg) Fig. 7. Respuesta de la PJanta con el esquema propuesto. 5. CONCLUSIONES 1 r-== pH CO.lfotador PD pH Rlfmncla En este articulo, se ha presentado un esquema de control hibrido,entre un control PID· y del control difuso y es simple de implantar. El control difuso esta descrito mediante cinco reglas y cada universo de discurso esta formado por tres particiones. Tiempo (seg) 1500 2000 2500 '000 3m 4000 Fig. 6. Respuesta con un Control PID, 159 Se introduce una etapa integradora, la cual es novedosa, que produce un efecto muy importante en la respuesta del sistema, reduce en forma significativa el tiempo de establecimiento y no influye en forma negativa en" la estabilidad del sistema. Los resultados presentados por la estrategia de control son positivos, ya que la planta puede ser controlada para difere,ntes puntos de operacion a pesar de los cambios sensibles que puede presentar el control de pH, abarcando toda la gama de pH posible. Al tiempo que se ha logrado obtener a partir de un sistema muy lento,' uno bastante nipido, cuyo tiempo de establecimiento es del orden de 50 seg. en todos los casos, presentando sobrepico nulo en muchos casos y pequeno en otros. Se presenta el modelo de una planta piloto de laboratorio y su validacion basada en datos experimentales, demostrando que esta depende de las condiciones de operacion, de la dimimica de los instrumentos, los cuales no son simples de ajustar. No. I, pp. II. Y.H. Wong, P. R. Krinhnaswamy, W.K. Teo, B.D. Kulkarni, and P.B., Deshpande. [1994]. "Experimental' application of robust nonlinear control law to pH contro!'.'.: Chern. Eng. Sci., N. 49, pp.199-20 ' CONTROL DE UNA SISTEMA DE TANQUE PILOTO MEDIANTE LA UN CONTROLADOR DIFUSO OPTIMIZADO Carlos Jimenez ([email protected] ), Miguel Strefezza ([email protected]) Dpto. de Procesos y Sistemas, Universidad Simon Bolivar, Venezuela Resumen: En este articulo se plantea el modelaje, diseiio y la implementacion de un control de un sistema de tanque mediante un control diruso. En este sistema de tanque, se propone el control del nivel del liquido, variable principal a controlar, ademas del control del caudal que entra a dicho tan que. Para el control de nivel de este sistema no, lineal, se propone realizar la implementacion de un control difuso con optimizacion de los panimetros de las conclusiones de las reglas difusas mediante el metodo del gradiente estocastico. Para el control de caudal se implanta un controlador PI. Se realizan tanto simulaciones como la implementacion en tiempo real del esquema de control propuesto en el sistema de tanque, obtenit\ndose buenos e interesantes resultados en la aplicacion de est a tecnica. 6.AtITORES Erick Maldonado actualmente' cursa el decimosegundo trimestre de Ingenieria Electronica. Miguel Strefezza es profesor del Departamento de Procesos y Sistemas. Doctorado y Maestria en aplicaciones de control difuso y neuronal. Fax: +58-212-9063303. Tel: +58-212 9063327. Palabras Claves: Identificacion. 1. Control Difuso, conclusiones de .las reglas difusas mediante el metodo del gradiente estocastico. El esquema de control es implantado y presenta buenos resultados. La seccion 2 se presenta la descripcion del modelo de la planta, luego en la seccion 3 se presenta el esquema de control planteado y sus resultados, finalmente en la seccion 4, lasconc1usiones. 2. El proceso que se presenta en la planta es sencillo, pero no lineal, la figura 1 muestra su esquema general. Consiste en un tanque con un caudal de entrada, Qenb controlado por una valvula. En el tanque se presenta un caudal de salida, Qsah controlado por otra valvula. Optimizacion, INTRODUCCION , ....1>. '.~~•..;:r. ~,-. (1.", I~.· ~.~ En la industria la presencia de diferentes sistemas no lineales hace que los sistemas se hagan complejos al momento de ser reproducidos y controlados. Controladores chisicos y tccnicas no lineales para el control de este tipo de sistemas han sido presentadas [3][7], el problema es que para su aplicacion se debe tener un conocimiento preCiso de las no linealidades del sistema para su implantacion y asi lograr su control. BIBLIOGRAFiA l. F. Alfaro y V. Salas [1997]. "Modelado y Control de un Reactor Quimico utilizando Logica Difusa". Tesis de pregrado.· 2. T .K. Gustfsson and K. V. Waller [1992]."Nonlinear and Adaptive Control of pH". Ind. Eng. Chern. Res., Vol 31, N. 12, pp. 2681-2693 3. M.A. Henson and D.E. Seborg. [1994]. " Adaptive Nonlinear Control of pH Neutralization Process", IEEE Trans. Control Systems Technology. Vol. 2, N. 3, pp 169 182. 4. J-S. Jang, C-T. Sun [an Mizutani, E.[1997]. "Neuro Fuzzy and Soft Computing, Prentice Hall. 5. C. Lin and Y. Sheu [1991]. "A Hybrid Control approach for Pendulum-Car Control", Proceedings of the IECON'91, Japan, pp. 461-465. 6. E. H. Mamdani and B. Sembi [1980]. "Process Control using Fuzzy Logic", in Fuzzy Sets, Wang, P.P. and Chang, S.K.(edts.), Plenum Press: New York, pp. 249-266. 7. N. Matsunaga, K. Syoji and S. Kawaji [1989]. "A Proposal of Fuzzy Hybrids Control Method", IEEE System Control, SC-89-17, pp. 1-10. 8. L. Pavel and M. Chelarau [1992]. "Neural Fuzzy Architecture for Adaptive Control", Proceedings of the IEEE International Conference on Fuzzy Systems, pp. 1115 1122. 9. Y. Saito and T. Ishida [1990]. "Fuzzy PIO Hybrid Control- An application to Burner Control", Proceedings of the International Conference on Fuzzy Logic and Neural Networks, IIZUKA, Japan, pp. 65-69. 10. Takagi and M. Sugeno [1985]. "Fuzzy Identification of Systems and its applications to Modeling Control". IEEE Transaction on System, man and Cybernetics, Vol. SMC-15, MODELO DE LA PLANTA PILOTO. "".·,,1 "'''"I Samba Los controladores difusos son diseiiados en base a la experiencia de un operador 0 a datos obtenidos en el sistema, implementados mediante reglas lingiiisticas[8]. Estos han sido aplicados a diferentes procesos no lineales[I][4]. Para mejorar el diseno de los sistemas de inferencia difusa, se plantea la utilizacion de diferentes metodos de optimizacion[2][5][6].La optimizacion se puede descomponer en dos problemas, optimizacion estructural y parametrica. La estructural, en la cual se optimizan el numero de reglas, el numero de subconjuntos difusos a utilizar. La optimizacion parametrica, en la cual se realiza un optimizacion las funciones de pertenencia de entrada y de salida, donde estas funciones se suponen conocidas[5]. En forma general estos se pueden dividir en metodos de optimizacion analitica, basado en el gradiente descendente, utilizados para optimizacion parametrica, metodos evolucionarios, basados en Ia utilizacion de algoritrnos geneticos utilizados tanto para optimizacion estructural como parametrica y los metodos de clasificacion, utilizados para la optimizacion estructural. En el presente. trabajo se presenta la aplicacion y la implantacion, en un sistema de tanque, de un control difuso optimizado para el control de nivel y del control del caudal con un control PI clasico. En este caso se plantea realizar una optimizacion paramctrica, en la cual solo se optimizan las 160 161 Fig. I Esquema de fa Pfanta. En la planta real se realizaron varias pruebas para obtener las respuestas del sistema y as! poder modelar matematicamente el comportamiento de la misma. Se caracterizo la dimlmica del nivel del tanque, manteniendo el caudal de entrada y el nivel constantes. La figura 2 muestra el modelo de la dimimica del nivel, en este diagrama se considera la dinamica de la valvula de salida como parte de la del tanque. Ademas seinc1uye un sumador, que anade caudal al nivel del tanque. Esto es 10 adecuado para completar el modelo, asi se reflejan los cambios de nivel por efecto del cambio del caudal de entrada, 10 cual puede considerarse como perturbaciones en este. Gil;.,,, o D:l33",.t-gflIto' '1j..,.. , Fig. 2 Dimimica del Nivel En la caracterizacion del caudal al igual que para el caso anterior se mantiene constante el caudal y luego se Ie hace un cambio. De esta manera se obtiene la respuesta de Ia valvula, y se tiene model ado el sistema completo. En la figura 3 se muestran el modelo modelo que simula la dinamica de la vaJvula del caudal de entrada. EI bloque llamado "Transport Delay", representa un pequeno retardo que es observado en la valvula realluego que se Ie acciona con una senal referencia. I Si e es P y si de es P entonces qaj es N Si e es N y si de es N entonces qaj es P Donde los bi son constantes y la salida viene calculada por el promedio de los. pesos de la contribucion de cada regia, ecuaci6n I. Donde: qaj es la variacion en la valvula del caudal, para ajustar mas 0 menor cantidad de Uquido en el tanque. En la figura 6, se muestra el esquema de control a implementar~ I N Lajb Fig. 3. ValVula de caudal. 3.2 Control PI Difuso con optimizacion de parametros.de la salida (conclllsiones de las reglas) (1) Laj ... .. j=1 ~~~l~ ~. W~::: 3. ESQUEMA DE CONfROL PROPUESTO. En este sistema se desea controlar tanto el nivel del tanque, que es considerada como nuestra variable principal, asi como el caudal que a este entra, evidentemente cada variable tendra un controlador asociado. En el caso del control de nivel, es donde se implantarn el controlador PI difuso optimizado, para el control del caudal, se utilizan\ un controlador c1asico. Ademas como parte de la estrafegia de control, la salida del controlador difuso tambien servin\ como una referenda adicional a la referenda del control de caudal. Como se observa en la figurn 4. ... ~ ~ ~ ~ &i = -11·, (y(x)-d(x))' (CXj/ .I;lXj) (2) j y = i=~ Finalmente, se incluye en ambos casos el bloque controlador que permite estabilizar adecuadamente las repuestas. conclusiones de las misnias. En este ca~o, se aplicarn la optimizacion de las conclusiones en el sistema. La ecuacion que derme la optimizacion de los parnmetros en" las conclusiones de las reglas es la siguiente: • ~ u ~ M M 1 1 Dentro de la teoria de control de'sistemas, se ofrecen muchos metodos para mejorar y optimizar las caracteristicas de un sistema de control dado. Ya sea desde el punto de vista estructural .0 parametrico, la optimizacion requiere de metodos matematicos que no lIeven a una sobrecarga del modelo a optimizar, por 10 que la comprension y seleccion del metodo mas adecuado es una tarea profunda y laboriosa. La aplicacion de esta variable de optimizacion, se realiza sumando justo despues del calculo de cada conclusion la variable que corresponde a esa salida. Es de acotar que la constante: 11 E [1,0] define en cierta forma la calidad de la optimizacion. La diferencia: (y(x)-d(x)), denota realmente el calculo del error entre el valor de inferencia difusa y la referencia, que en ese momento entia a la etapa de optimizacion. e ~;1~ ;~ 0,8 . . 0.8 . . 0.' 0.2 .• J.~5--:: .•'*.~.-"~~3~-:: ..-:! .•';"2~..~.•~,"";;:~.:-"''-::-•.'!",,:---:.:-:.•i':2-'::' •.'!".3:--:.:-:.•~'-~0.•5 de EI metodo que se presenta para optimizar los parnmetros de nuestro control PI Difusoes el .metodo del gradiente estocastico. ·Los parnmetros a los que se puede aplicar este metodo en nuestro sistema difuso pueden ser: 0 los pesos generados en los antecedentes de las reg las difusas oen las EI control de caudal se realiza con un controlador PI, el cual se obtiene sintonizando de forma heuristica, basado en la respuesta del sistema ante una entrada escalon. La figura 7 muestra las simulaciones con la senal Fig. 5. Funciones de Membrecia del error (e) y su Variaci6n (de) - ToWakspace v.!IwIacaulal Ptlse . =FB ----G Mont", mr SalIda ,4Just&C ~ r:;J ,"I. • I",""" ' .' r Well' 1n1: II - """ nivet riI\I lema Fig. 4. Esquema de Control Propuesto 3.1 Control PI DifilSO Fig. 6 Esquema de Control Implantado en la Planta Piloto TABLA I TABLA DE BUSQUEDA DEL CONTROLADOR. Como se senal6 anteriormente se utilizarn un controlador PI Difuso para el control del nivel, el diseno de este esta basado en la emulacion del control que realiza un PI chlsico sobre la respuesta de un sistema de primer orden ante una entrada escalon. EL control consiste en monitorear el error (e) y su variac ion (de) del sistema para generar cambios en la senal de control. N z NG Np z Np z p z Pp p utiIizada para optimizar el control difuso en el esquema de control, se puede observar la respuesta del sistema, sin y con optimizacion. Variado el nivel del tanque entre 30 y 50 cm. 5.5 Niv<l(anxIO) ~--- 5 M I I I, I ,I 4.5 PG 4 3.5 Luego de realizar las pruebas, las funciones de membrecia definidas para el error (e) y su variacion (de), se muestran en la figura 5. Para obtener la salida del control difuso, eI metodo de inferencia de Takagi-Sugeno es utilizado, las variables de salida son mostradas en la Tabla I. Donde, Positivo: P, Negativo: N; Cero: Z; grande: G, pequeno: p. Las reglas vienen dada de la forma: R i : Si e es Ai y de es Ci entonces dUi es bi EI indice: i, se refiere a I:i conclusion i-esima que se esta calculando. EI indice: j, refiere el calculo de la sumatoria de los pesos 0 antecedentes de cada regia. Asi queda definido el control PI Difuso a emplear para eI control del nivel, pero ya que se desea controlar del caudal de entrada para que el sistema pueda responder' mas rnpidamente ante las perturbaciones en el nivel, a continuacion se define otro control difuso que monitorea eI errory su variation para aumentar 0 disminuir el caudal de entrada cuando sea conveniente. Las reglas de este control son solo dos: 162 ~.~., 2.5 . /r I I I . ... 500 Finalmente, este esquema de control se implanta en el sistema de control de la planta real. Las respuestas del sistema ante la optimizacion tambien se hacen 1-1\ I \ I yT Ticrnpo(scg) 100 variaciones en los puntos de opera cion luego de haber finalizado la optimizacion del control difuso. u,.-.fl!!lr...."".. , ~...A--1 r- .. _• I J;:::':::, f · I 1000 !) Fig. 7. Resultado de las Simulaciones. Sin optimizar (linea cortada), optimizada (linea continua). -............... ojl) ~JJ '. .. '. . . ,,-'-.....,......,.. nr: J.I ~~ ,$I) Fig: 8. Respuesta del sistema a diferentes puntos de operaci6n. Como puede observarse en esta figura 7, la optimizacion produce en este caso una senal para el nivel mas estable y con menos ruido que sin la optimizacion. Esto asegura que la respuesta del sistema ha sido mejorada. En la figura 8, se muestra la una simulacion de respuesta del sistema con patentes. En la figum 9 se observa la respuesta del sistema ante la senal utilizada para la implantation del control difuso optimizado en la planta piloto. Variado el nivel del tanque entre 20 y 30 cm . En la figura lOse muestra la respuesta de 163 la plarita' ante diferentes puntos de operacion y ante perturbaciones en el caudal (350-400 seg). 4. CONCLUSIONES ! i ,I I I :: ~ ; ,; ,I \ il ,i ~ :1 En este articulo, se ha presentado la implantacion de un control difuso optimizado para el control de nivel en una planta real, no presenta problemas de retardo 0 sobrecarga del proceso de calculo y ejecucion. Se pudo comprobar los resultados de la optimizacion en el modelo real con las simulaciones realizadas. Este control es combinado con un control chisico PI, para controlar el caudal. Los resultados muestran que este esquema de control son positivos~ mostrando su efectividad y posibilidad de implantar en un sistema no lineal. 3.51 Nivel (cmxlO) 3 2.5 'i 2 :t " :l ," ,J 1.5 :~ 1 I't " : ~ :1 .i;~ , ~ o.s,; 50 100 150 200 250 300 350 400 '50 500 REFERENCIAS [1]Alfaro, F. y Salas, V. [1997]. "Model ado y Control de un Reactor Quimico utilizando Logica Difusa". Tesis de pregrado. ' [2]Berenji, H.R.[1993]. "Q-Learning for Fuzzy Rules", Proc. of IJCAI' 93 ,Chambery. [3]Camacho, E. F.; Bordons, c.; [1992]. "Model Predictive Control in the Process Industry". Springer editions. Sevilla, Espafia. [4]Dote, Y. and Honma, M. [1987]. "Improved Fuzzy-Set Temperature Distribution Control for Electric Furnance". Proc. of the second IFSA, Tokyo, Japan, 1987. Y.[l999]. "Algorithmes [5]Glorennec, Pierre d'apprentissage pour systemes d'inference flou". Hermes Science Publications, Paris, 1999. [6]Jang, J-S, Sun, C-T and Mizutani, E.[1997]. ''Neuro Fuzzy and Soft Computing". Prentice Hall, Inc. 1997. [7]Palizban, H. O'Kelly, P. And Rees, N.[l995]. "Practical Optimal Predictive Control of Power Plant Coal Mills". Proc. IFAC Symp; Control of Power Plants and Power Systems, pp. 177-182. [8]Takagi, T. and Sugeno, M. [1985]. "Fuzzy Identification of Systems and its Applications to Modeling and· Control". IEEE Transaction on System, Man and Cybernetics, Vol. SMC-15, No. I, pp. 116-132. Fig. 9. Respuesta de la Planta Piloto. Nivel (arriba) y Caudal (abajo) I Ademas se presenta el modelo de la planta, obtenida a partir de datos experimentales y demostrando que este depende de los puntos de operacion y de la dimlmica de los instrumentos. <I .' un Ii :If I~ " ) 11 if II ~tt :~CM.rtl.l : n (~ J II ill, : t\ ~ ..ty '~"'n -::ref f-:.#\ ("I, ! . 1,,----1 ·'t'fl~ '--, • ;.)j -Jj .. >.' r~, !\Ir\_< [1 --"....",..1 jj,' .... " ~,~ ~'-j itti r~"t):t~1 I: Fig. 10. Respuesta de la planta II AUTORES Carlos Jimenez actualmente cursa el decimoquinto trimestre de Ingenieria Electronica, esta realizando su tesis de grado en control difuso. Ha aplicado para realizar su postgrado en Japon. . Miguel Strefezza es profesor del Departamento de Procesos y Sistemas' con Doctorado y Maestria, en aplicaciones de control difuso y neuronal. Fax: +58-212-9063303. Tel: +58 212-9063327. ,I, ]1 '11 H. Alvarez ([email protected]) Facultad de Minas. Universidad Nacional de Colombia. Grupo de Automatica M. Pefia ([email protected]) . Instituto de Automatica, Universidad Nacional de San Juan, Argentina. Abstract: This work presents a possible structure for the fuzzy partition of input space during the identification of a Takagi-Sugeno Fuzzy Inference System (TS FIS). The proposal states the use of a Multi-Dimensional Fuzzy Set (MDFS) for each rule instead of various single fuzzy sets on individual discourse universes. It is demonstrated by examples how the MDFS reduces the identification complexity in spite of lack of linguistic interpretation. Additionally, the information contained in a MDFS, which is directly adjusted from data, results major than using fuzzy partitions on each individual discourse universes. Therefore, the precision of the FIS model is enhanced. Keywords: Fuzzy Inference Systems, Takagi-Sugeno, fuzzy sets, clustering. I. INTRODUCTION . The use of artificial intelligence tools for modeling emerged during the early nineties as a promising addition for controlling and optimizmg industrial, processes. A lot of works have used Artificial Neural Networks (ANN) and Fuzzy Inference Systems (FIS) for function approximation [Johansen, 1996; Bossley, 1997]. Several structural modification have been proposed over the initial ANN and FIS types in order to improve their capabilities for modeling dynamical processes. However, a lot of work must be done before taking at hand a modeling tool which be easier identified and gives high precision with small parameters and ~ow structural complexity. The aim of this paper is to propose a modified treating of fuzzy sets in. the rule antecedent, during a fuzzy model identification. The Takagi-Sugeno Fuzzy Inference System (TS FIS) is used here to identified a process model [Takagi and Sugeno, 1985].The novelty in the proposed identification procedure is the implicit definition ofa Multi-Dimensional Fuzzy Set (MDFS) over each rule antecedent. In this way, it is not necessary to perform an explicit fuzzy sets definition in the rule antecedent, i.e. triangular, trapezoidal, bell-shaped, etc. On the contrary, a simple MDFS characteristic point is determined and a distance measurement is stated from each spatial point to such a MDFS characteristic point. In this way, a few lines in the FIS operation algorithm allow calculate the membership values of any spatial point to each MDFS associated with the rule base. In spite of the lack of linguistic meaning, theMDFS uses all the information contained in the data set avoiding the information reduction that occurs when an explicit fuzzy set is obtained for each rule [Pefia et. aI., 1998; Espinosa, 200 I]. The paper is 'organized as follow. Firstly, the FIS are presented in general, but given especial attention to Takagi- i"~~~ : ~~ .~ IMPLICIT MULTIDIMENSIONAL FUZZY SETS IN TAKAGI-SUGENO FUZZZY MODELING 164 Sugeno type. Next, a detailed description of rule antecedent part and MDFS concept is given. In the fourth part, the steps for identified a TS FIS model using MDFS is stated. Finally, two applications are presented when a TS FIS model was found and tested as a process model. The conclusions part ends this paper with a brief mention of future works. II. TAKAGI-SUGENO FUZZY INFERENCE SYSTEM AS A MODELING TOOL A Fuzzy Inference System (FIS) is a linguistic tool that performs a mapping S:X c R n ~ Y c Rm. When this mapping is used as a )Ilodel, the FIS is called a Fuzzy Model (FM). In this tool, the. knowledge about the relationship between input domain X and output domain Y is encoded as a set of IF-THEN rules. Rule antecedent and consequent may contain linguistic terms linked by logical operators: And, Or, Not, etc. In order to conform the antecedent, any FIS defines a set of linguistic temis Ai at the domain of each input variable. This set of terms Ai={ AJ. A 2, ... ,As} is known as a fuzzy partition on the variable X. The number of linguistic terms in Ai (granularity) is strongly related to FIS precision when it is used as a model. The other rule component is the consequent, which is directly related to the output variable Y. The rule output may be a fuzzy set (Linguistic FIS, Relational FIS) ora numerical function (Takagi-Sugeno FIS). If the output is a fuzzy set it is necessary to perform a defuzzification procedure in order to get a numerical value (Linguistic and Relational FIS) .. The final element in FIS is the inference machine. This operates over the rules in order to map a set of input values to output values. This static mapping S:X c R n ~ Y c R m is augmented with the dynamic behavior of the system being modeled using external filters applied to the model input vector. These filters allow FIS to operate with a vector of model inputs (regressor) constituted by current and delayed values of the system inputs. The Takagi-Sugeno FIS Model uses as consequent a linear function ofthe·jnput variables. This model is able to represent a general class of static or dynamic nonlinear systems. In this model the rules are of the form: Ri: Then: If: x is B i (x) yi=J i (x) (I) where x=[xI, X2,oo.,XN] are the N inputs of the Fuzzy Model (regressor), Bi(X) is a N-dimensional fuzzy set and '/ is the output for the rule i defined by the function f(x). Generally, this function is expressed as an affine linear function of the input variables: 165 f ie x )- ao + a\x\... + I j + a IMXM -- where aj are tunable scalars. Nonnalization procedures are commonly applied to the input and output variables in order to avoid scale differences. The consequent parameters are those being used by the function fi (x) The exponent m is currently taken equal 2.0 but other values can be used. This procedure generally produces convex input sets in the M-dimensional input space. Under some circumstances non-convex input sets may appear. To prevent this, a multi-center cluster defmition can be used. In this case the MDFS definition is based in two or more chamcteristic points fPena et. Vj.. (2) I + aTx ao and the antecedent pammeters are those that define the fuzzy partition of the problem space. The nonnalized model output, Yn' is B. The selection ofmodel inputs calculated as a weighted avemge of the contribution of each rule: Y /I = ~l W ; (~ )y ! / /I t w i (x n) To avoid using an excessive number of inputs in a FIS based model, it is necessary to apply an input selection method which can find those. inputs that greatly affect the system output. If x ={XI. X2•...•XN} is the set of model inputs, then the number of possible input sets is (2N-l), the number of subsets of x (excepting the void set). To select the inputs among all the possible input sets there are seveml methods: Regularity Criterion (RC), Lipzchitz Coefficients (LC), False Nearest Neighborhood (FNN) [Rhodes and Momri, 1996; Menold et. a1. 1996; Pefia et. al. 1998]. (3) f where wi (Xn) is the membership value of the nonnalized input vectorx n to the input fuzzy set of the rule i. 1 I ·1 j :~; Ii !l rJ I f III. MULTIDIMENSIONAL FUZZY SETS IN A TS FIS MODEL Usually, most of FIS operate with an explicit. antecedent partition, but it is possible to use an implicit partition. A Multi-Dimensional Fuzzy Set (MDFS) Aij is an implicit partition proposed in this paper. In this case, all the individual fuzzysetsin the antecedent of each rule are tmnsfonned into a single MDFS. This procedure implies to solve the logical opemtions indicated in the rule antecedent, if a set of individual fuzzy partitions were given. In spite of the lost of linguistic meaning that occurs during this procedure by using MDFS a more compact FIS model is attained. Additionally, it is not necessary to explicit the fonn of each fuzzy set' in the rule antecedent. Therefore" the tasks related to FlS model design and tuning (model identification) result easier. Additionally, a fuzzy clustering is perfonned over the data to obtain a first guess of the final number or rules. In this case the model design (or structure selection) is a direct step in model identification procedure. Input fuzzy sets can be obtained by various ways. Typically the procedure for obtaining fuzzy sets reduces the original membership values to standard fuzzy fonns function as bell shaped, trapezium, triangle, etc. The effects of such a reduction are showed in Figure l. In this case two clusters present similar center coordinates when they are projected on Xt, X2 axis (dashed lines). Therefore, only one explicit fuzzy set results for the two clusters. In order to avoid this infonnation lack, the following fonnulation for the M dimensional input fuzzy sets is stated. The fuzzy clustering procedure mentioned above establishes a center value for each identified fuzzy cluster. To calculate the membership grade of a particular input datum, the first M coordinates of the center are selected, corresponding to' the M input variables. Each membership is computed using: Il;k = 1I±(di~ Jm d j=1 for identification. If input-output identification data are genemted experimentally by injecting input sequences u(k) into an unknown system, then the question arises as to the proper choice of input sequences u(k) which will produce an unifonn identification set [Johansen, 1996]. If an' input x is constructed which systematically produces experimental data, and sufficiently covers the domain X, then it is possible to obtain a more accnmte process model. (4) Jk where Jllk is the membership value of datum x(k) to center Vi. di/c = IIx(k)-vII! is the distance from datum x(k) to center VI and for mathematical consistence, if ~k = 0, then Jlik=O because x(k) = C. Modelstructure identification IV. A TS FIS MODEL IDENTIFICATION PROCEDURE System identification is defined as the process of construing a model of a dynamic system with its experimental data. The Takagi-Sugeno FIS is governed by the pammeter set a. which takes all the required FIS pammeters from equation (2). The size of e is fixed by the number of inputs in the regressor x and the number offuzzy cluster (or rules)c. Upon detennining 9 and x, the model is identified. The TS FIS identification procedure can be' divided into four steps: acquisition of data for the identification; selection of model inputs; identification of model structure (model design) and identification ofmodel parameters. It should be noted here tImt, since the used fonnulation to calculate membership functions is detennined by a given distance function, the input fuzzy sets are stated over the concatenated antecedent with their center as the only defining parameter for each group (i.e. a MDFS defmition). Using MDFS the FIS model identification begins with a fuzzy C-mean clustering in order to detennine the appropriate partition of the combined input-output space. These clusters allow the calculation of the membership values for the training data set. This is done by measuring the Euclidian distance from each point x to the center of the Cluster using equation (4) with m=2. Next, a direct projection of the membership functions from this input-output space to the input space allows the identification of the MDFS through their characteristic points. Finally, a least square procedure is applied to find the consequent parameters in rules. A. The acquisition ofdata for the identification The previous step in the FIS based model building is '. the acquisition of an adequate set of identification data. The way these data are acquired should allow to, explore the process opemting zone, because the quality of the model will be determined by the characteristic of the exciting input selected 166 The last step, needed for completing the definition of FIS structure is to' find· the optimal number of rules. The fuzzy clustering technique is an appropriate tool for this task. The criterion used here is: n c S(c)=L L(Uik)m(I!Xk k:l -Vi If -llv; -xW) (5) i:l where n is the number of data to be clustered; c is the number of clusters (c::::: 2) ; Xl is kth data vector, x is the avemge of data x,•...•xn;; :Vi is the vector representing the center of the ith cluster; II . I is the nonn opemtor; Jlik is the gmde of kth data belonging to ith cluster, and m is an adjustable weight (usually m=1.5 3). The number of clusters, c, is determined so that S(c) reaches a minimum as c increases; it is supposed to be a typical local minimum. D. Model parameter identification Up to this point we have already found the FIS structure by inputs identification and rules elicitation using a fuzzy clustering over the input-output identification data. Both procedures gave two results: an (M+l)-dimensional input output space partition through c clusters and one center for each cluster, taken as its MDFS characteristic. However, since the output is unknown at the prediction moment, we should detennine an antecedent partition just over a reduced M dimensional space which contains only the M input variables (usually known). Then each rule antecedent is assigned a membership value obtained from the fuzzy clustering on the input-output space: Jl x di)...., x M (i) = Jl x di),..., X}.f (i), y(i) (6) Once the MDFS of input clusters are obtained, the FIS parameter identification is completed by tile known Takagi Sugeno method considering the output vector Y, the pammeter vector 0 and the weighted inputs X. Therefore, the problem is reduced to solving the following typical least square equation for obtaining 0: o =(XT Xrl X T y (7) In this way the pammeter vector 0 is found and the.FIS model is completed. V. TWO ILUSTRATIVE APPLICATIONS In this section two TS FIS model identified by means of the previously discussed procedure are presented. The use of MDFS is emphaSized in order to illustrate its utility. Firstly, a model for penneability reduction is presented. Finally, a model for the pH neutralization process is showed. Both examples use TS FIS model with MDFS in the rule antecedent. A. A model for permeability reduction by fines flow through porous media The transport of fine particles in fonnations followed by plugging is recognized as the major cause of fonnation damage in hydrocarbon wells. The TS FIS model presented here was identified for predicting the principal behavior of fonnation damage under known solution injection flow rate, medium porosity, salt concentration and initial medium penneability. For the laboratory experiments, suspensions of Calcium Carbonate (CaCOJ ) were injected into the porous media. The particle size distribution for. the CaCO J suspensions were measured with the Counter Coulter equipment and the mean particle size derived from the distributions was about 8 !lm. The porous media were constructed with clean sand which grain sizes were carefully selected for each experiment. The characteristics of the sandpacks and suspensions used in this study guarantee that no size exclusion mechanisms will be present during the displacements. In case of consolidated samples, particle size and pore size should be considered as input parameters. The data base experimentally obtained contains 42 penneability curves [Zuluaga et ai., 200 I]. Due to limited laboratory data, during the TS FIS model identification, the clustering method was bounded in the maximum number of clusters. It must be pointed out that the input variables; initial penneability (Ko), porosity (Por), concentration (C) and flow rate (Q) were normalized in the interval [-1,+1]. Pore volume (PV) and the relationship KlKo were nonnalized in the interval [0,+1]. During the sensitivity analysis, the exclusion of the input PV produced a static model response. Therefore, it was essential to include PV as a model input in order to provide dynamic behavior to the model. With these five input variables the number of consequent parameters would be Na=(5+l)*c, with c being the number of clusters. Additionally, for each pore volume injected there are 42 penneability reduction points and each fuzzy rule has six tunable parameters that must be adjusted with experimental data for each PV. Therefore, with 42 laboratory curves the maximum number of clusters (No) would be about Nol(5+1)=42/6=7. Then, the FIS model was attained maintaining the cotnpromisebetween the maximum number of clusters and the best perfonnance. After a sensitivity analysis it was found that 6 clusters yielded the 167 I Ii best results. Table I shows the centers of MDFS obtained for this model. The performance of a FIS model using MDFS and a FIS model using triangular fuzzy sets, both compared to real laboratory data is showed in Figure 2. 11 Table I. Center coordinates of the Multidimensional Fuzzy Sets obtained 'for.EermeabilitJ:: m<?del. Ii Variable-+ Rule .J. KO Por C Q PV II·II 1 -0.4173 0.4097 0.2867 cO.6723 -0.5794 0.4317 0.0165 -0.5446 -0.2291 0.0075 -0.0763 0.0296 0.8322 0.0087 0.2193 0.0374 -0.7934 -0.7829 0.4182 0.5436 -0.6011 -0.6776 0.3508 -0.3681 0.3673 0.3753 0.3901 0.3904 0.3717 0.3866 11 Ii' 2 3 4 11 Ii 11 5 6 11 A model in space state was established avoiding observability problem of input-output process model. The structure of the final pH model is presented in Figure 3. As can be seen; two fuzzy models are necessary because of two process states are used (xl and Xl)' A description of such states was given in a benchmark stated in [Alvarez et a!., 2001]. In the present work only the model for state XI is showed, but the results were similar for the other state (Xl)' Xl i: 0.6 0.4 !~'A~-~ ~'g-;:-o -1r-~-""1!!I'--m~B:'_ "0. 0 "0_ -0- -<>0- -0- 0 _ 0.0 +-------,------~----___l 0.0 100.0 200.0 300.0 Pore Volume. Fig.. 2. Penneability reduction showing actual response (- -). Fuzzy model with MDFS response (-'"-) and Fuzzy model with triangular fuzzy sets response (-0-) for a validation curve (Ko=26200). • Ii I M j j The maximum mean squared error of the Fuzzy Model using MDFS was 0.04460. On the other hand, the maximum mean squared error of the Fuzzy Model using triangular fuzzy sets in input variables was 0.10 160. Additionally, the model using MDFS was easier identified that the model with triangular fuzzy sets. It is evident taken into account that in the first case it is not necessary to perform an input fuzzy sets identification. j B. A model for pH neutralization benchmark ~ In this model, the intention was to capture the relevant dynamic performance of a wastewater neutralization process, previously stated as a benchmark [Alvarez et aI., 2001]. A set of experimental data where taken from a process installed at Instituto de Automatica, Universidad Nacional de San Juan, Argentina. In brief, the assembly consists of three tanks and one Continuous Stirred Tank Reactor (CSTR). The tanks contain solutions of strong acid (HN0 3), strong base (NaOH) and an acid salt (NaHC03) which gives the buffer effect of the neutralization system. Such an assembly resembles the current conditions of industrial wastewater neutralization. Three dosage pumps with 4 to 20 m.a. command signal are used to reproduce operational conditions and control actions. One pH sensor with 4 to 20 m.a. transmitter is used on the CSTR output stream. The data set· used to identify and validate. the TS FIS model was attained applying several perturbation to the process. In this way, the normal operative region of the neutralization process was. covered with 3000 identification data ario 3000 validation date. A sampling time of 15 seconds was used. ~ ,~! II I I I I I lij I I II ~ I ~ I -3 ~ -5 equatio~ pH Fuzzy Model . -6 1 0 (l.p \~~~ r~~~~~y I,.!'#tJ~i' 61 V"\ \[/1,. 1JtQ, III' ~~ J ~~,-' \j • 15000 Fig. 4. Real data (continuous MDFS ( .....) and Fuzzy Pena, M., diSciascio, F. and Carelli, R. (\ 998). Structure identification of a Takagi-Sugeno fuzzy model (in Spanish). Proc. VIII CLCA, 2. Rhodes and Morarl (1996). Determining the model order of nonlinear input/output systems. AIChe-Journal, vol. 44, pp 151-163. Takagi, T. and Sugeno, M. (1985). Fuzzy Identification of systems and its application to modeling an control, IEEE Trans. on Systems Man and Cybemetics, 15: 1. 116 -132. Zuluaga, E.; Alvarez, H. and Velasquez, J. (2001) Prediction of permeability reduction by external particle invasion using artificial neural networks and fuzzy models. Accepted to Canadian JOllmal ofPetrolewn Technology. • 30000 45000 . Time in seconds and Estimated XI using Fuzzy model withs with triangular fuzzy sets (~----). Fig. 3. Scheme of the proposed model 0.2 ,• -2 Output Xl 0 l.: o~ ....~ lil~ -1 Fuzzy 1.2 1.0 . x, -4 i, 0.8 3 X 10. CI~~-'---""'---'--- Table 2 shows the center coordinates of the multidimensional fuzzy sets obtained for the model of state XI. The model inputs (regressor) were five delayed state XI and two delayed control action u. Five clusters (rules) were found as the optimum number. All variables were normalized in the interval [0, I]. The performance of FIS model with MDFS and FIS model with triangular fuzzy sets regard real validation laboratory data is presented in Figure 4. The maximum mean squared error of the Fuzzy Model using MDFS was 0.002705. On the other hand, the maximum mean squared error of the Fuzzy Model using triangular fuzzy sets in input variables was 0.006163. As can be seen, in this case the performance of fuzzy model with MDFS is better than the performance of fuzzy model with triangUlar fuzzy sets, TABLE 2 CENfER COORDINATES OF THE MULTIDIMENSIONAL FUZZY SETS OBTAINED FOR TIlE MODEL OF STATE AI Rule ..... ~ Variable .J. 168 X,.(k-I) 0.49480 0.69272 0.90480 0.26938 . xl.(k-2) 0.49529 0.69163 0.90554 0.26800 X •.(k-3) 0.55162 0.26733 0.42466 0.20443 X,.(k-4) 0.55248 0.26190 0.42617 0.20072 XI.(k-5) 0.55178 0.26047 0.42658 0.19973 u.(k-l) 0.55206 0.26192 0.42623. 0.19790 u.(k-2) 0.55110 0.26757 0.42469 0.19913 0.2437 7 0.2451 I 0.6953 8 0.7043 4 0.7081 4 0.7051 5 0.6976 8 VI. CONCLUSIONS' In this work the use of Multi-Dimensional Fuzzy Sets (MDFS) in the. antecedent of Takagi-Sugeno Fuzzy Systems (TS FIS) was explored. Such a proposal reduce the lack of information occurred during typical fuzzy set. Additionally, the MDFS in the antecedent produces an easier method to identifying fuzzy models. Unfortunately, the MDFS reduces the linguistic interpretability of the obtained fuzzy systems. Looking for illustrate this facts, two applications of fuzzy identification using MDFS in the TS FIS antecedent were presented and compared with fuzzy model using triangular fuzzy sets in the antecedents. The performance of fuzzy . models with MDFS was better than that of fuzzy models with triangular fuzzy sets. A lot ofwork must be done in order to find the best distance measurement in a MDFS. In the present work only an Euclidian measurement was used. This measurement can result very simple when a high nonlinear process is being modeled. It is clear that a more complex distance measurement will allow a reduced number of clusters (rules) and a more compact cluster representation without lost of information. REFERENCES Alvarez, H.; Londono, C.; diSciascio, F. and Carelli, R. (200 I) pH Neutralization Process as a Benchmark for Testing Nonlinear Controllers. Indust. and Eng. Chemistry Research, May 2001. Bossley, K.M.(1997) Neurofuzzy modelling approaches in system identification. PhD thesis, University of Southampton, U.K. Espinosa, J. (2001). Fuzzy modeling and control PhD thesis. Katholieke Universiteit Leuven, Belgium. Johansen, T. (1996) Identification of nonlinear systems using . empirical data and prior knowledge. Alltomatica, 32, 99 589-606. Menold, P.; Allgower, F. and Pearson, R, (1996) Nonlinear structure identification or chemical processes. Technical Report AUT96-32. Insitut fur Automatik-Zurich. 169 APLICACION DE OPTIMIZACION MULTIOBJETIVO CON ALGORITMOS GENETICOS A UN PROBLEMA DE ELECTRIFICACIONRURAL Adriana Pulgarin ([email protected]), Ricardo Smith ([email protected]), Posgrado en Aprovechamiento de Recursos Hidniulicos. Facultad de Minas Universidad Nacional de Colombia Resumen: En este articulo se presenta una aplicacion de los Algoritmos Geneticos como herramienta de solution a un problema de optimization de las inversiones en electrification rural en el cual se considero apropiado optimizar simuItaneamente varios objetivos. Palabras Clave: Electrification Rural, Algoritmos Geneticos, Optimizacion Multiobjetivo l. INTRODUCCION La aplicad6n de los Algoritmos Geneticos para solucionar un problema de optimizaci6n con Multiples Objetivos acomete un problema trabajado en afios anteriores por el Posgrado en Aprovechamiento de los Recursos Hidnlulicos para la Corporaci6n Autonoma Regional del Rio Nare 'CORNARE' (Manjares, 1989), en la cual se adelant6 el estudio de los proyectos que se requerian para la electrificaci6n de toda el area bajo su jurisdiccion, dadas ciertas condiciones de disponibilidad de recursos y de condiciones politicas y nonnativas que rigen para la regi6n. El estudio considera 956 proyectos posibles, para realizar en un horizonte de tiempo de cinco afios y con unos recursos presupuestales provenientes de las transferencias de ley obligatoria que las entidades propietarias de plantas hidroelectricas de generaci6n hacen a la Corporaci6n. Para dar soluci6n a este problema, en este articulo se propone aprovechar el manejo paralelo de las soluciones que hacen los Algoritmos Geneticos y hacer uso de un metoda de optimizaci6n multiobjetivo con Algoritmos Geneticos, Suma de Radios Globales Ponderados (SWRG), propuesto por Bentley y Wakefield (1997), que pennite manejar simultaneamente todos los objetivos. Los resultados obtenidos se comparan con los obtenidos mediante un metodo tradicional de optimizaci6n con mUltiples objetivos: El Metodo de las Restricciones, que iterativamente optirniza el problema eligiendo un solo objetivo y trata los demas como restricciones. A traves de tin gran numero de ejecuciones del algoritmo, en cada una de las cuales los objetivos restringidos toman diferentes valores, se puede obtener una curva de intercambio entre pares de objetivos, pero este proceso es demasiado dispendioso en cuanto a su codificaci6n y tiempo de ejecuci6n. 2. OPTlM!ZACION MULTIOBJETIVO La optimizaci6n Multiobjetivo bl1sca optimizar un vector cuyos componeutes son cada uno de los objetivos. La soluci6n a un problema de este tipo no es un punto unico, sino una familia de puntos que definen una frontera (curva trade off), conocida tambien como soluci6n paretiana (Bentley y Wakefield, 1997) 0 conjunto de soluciones no dorninadas. Una soluci6n no dominada es una solucion tal que dentro de la regi6n factible no existe otra soluci6n para la cual los , valores de los objetivos sean mejores 0 iguales a los de ella. De otra fonna, Una soluci6n X es dominada si existen una soluci6n factible y no peor que X para todos los objetivos F; , i = 1,... , k (Smith y otros, 2000): f(x) frY) maximizacion. V 1 :S i :S k para problemas de Por su naturaleza los problemas de optimizaci6n multiobjetivo requieren para su soluci6n tecnicas diferentes a las tecnicas estandar utilizad,as en optimizaci6n con un solo objetivo. En las iIltimas dos decadas se han desarrollado Algoritmos Geneticos para trabajar problemas de optimizaci6n multiobjetivo; algunos de enos, estan basados en metodos clasicos, como el metoda de las restricciones y el metoda de las ponderaciones, mientras que otros plantean nuevas estrategias de soluci6n. Los Algoritmos Geneticos trabajan con una poblaci6n de individuos que represent an soluciones potenciales del problema y que son modificados a traves de las diferentes generaciones (0 iteraciones). Debido a su estructura, los Algoritmos Geneticos pueden buscar aqueHas soluciones no dominadas en fonna paralela; convirtiendose en herramientas muy atractivas para resolver problemas multiobjetivo. 3. ALGORlTMOS GENETICOS Y OPTIMIZACION MULTlOBJETIVO Para haHar una soluci6n mediante Algoritmos Geneticos en un problema de optimizaci6n multiobjetivo existen, en forma general, dos fonnas de aproximaci6n: La primera de elias se basa en los metod os tradicionales de soluci6n a problemas multiobjetivo. como los son el Metodo de las Restricciones, en el cual el Algoritmo Genetico se codifica de tal manera que todos los objetivos, excepto uno, sean constantes (restringidos a un solo valor); el objetivo restante se toma como la funci6n de aptitud para el algoritmo genetico y el Metodo de la suma ponderada de los objetivos, en la cual se 170 requiere de al elecci6n inicial de el conjunto de pesos para los objetivos. La segunda fonna de aproximaci6n, la confonnan los metodos que tratan de considerar conjuntamente todos los objetivos y hallar de fonna simultanea el conjunto de soluciones no dominadas al problema. Algunas de estas aproximaciones penniten ademas, la posibilidad de guiar la evolucion del algoritmo para que conveIja a un pequeno sUbconjunto de soluciones no dominadas defmido por el usuario, esto para evitar el caso bastante comtin en problemas grandes, en el que se hallan muchas soluciones no dominadas, cuando en realidad, el conjunto de soluciones deseadas por el decisor es un subconjunto pequeno del conjunto de soluciones Paretianas., Esta segunda forma de aproximacion es la que se emplea en este trabajo para dar solucion al problema planteado. Los metodos "que consideran simultaneamente todos los objdivos se enfrentan dificultades adicionales a las que se presentan cuando se intenta optimizar un problema de un solo objetivo. Bentley y Wakefield (1997), sugieren que la mayor obstaculo denominado Problema de Clasijicacion, radica en que para los problemas multiobjetivo, cada solucion tiene varios val ores de aptitUd, uno por cada objetivo a considerar; 10 que representa un problema a la hora de juzgar la aptitud global de los individuos, por ejemplo en un problema puede existir un individuo en la poblaci6n con valores de aptitud muy altos con respecto a algunos objetivos y valores de aptitud baja para los objetivos restantes, a la vez que puede existir un individuo con valores de aptitud medios para todos los objetivos. Bentley y Wakefield, (1997) analizan y clasifican diversos metodos de optirnizacion multiobjetivo con Algoritmos Geneticos de' acuerdo a la forma en que estos resuelven el interrogante de como evaluar acertadamente los individuos en presencia de varias funciones objetivo (clasificacion jerarquica) de manera que el algoritmo lIegue a un conjunto de soluciones no dominadas que solucione el problema de una fonna eficiente. Para realizar esta clasificacion utilizan los conceptos de Independencia del Rango e Importancia. Luego de evaluar con problemas particulares,' algunos de los metodos discutidos, los autores obtienen buenos resultados con el metodo Suma de Radios Globales Ponderados (ver anexo 1). . 3.1 Manejo de Restricciolles Un aspecto importante de especial consideracion en la aplicaci6n de este tipo de algoritmoses el manejo de restricciones, ya que los Algoritmos Geneticos no las trabajan explicitamente, haciendo que los procesos de evaluacion de un individuo en una poblaci6n lleguen a ser bastante complejos, especialmente en la presencia de soluciones factibles y no factibles y que cada apJicacion requiera de un manejo de las restricciones que se adapte al problema que se esta implementando Michalewicz (1994b). . ' En' esta aplicacion se utiliz~ una fonna de penalizaci6n para problemas enteros (Bean y Hadj-Alouane, 1992) en la cual se 171 relajan las restricciones por una funci6n de penalizacion no lineal comunmente usada en programacion no lineal continua. Esta funcion de penalizaci6n consiste de la suma ponderada de las violaciones de las restricciones elevadas al cuadrado 4. PLANTEAMIENTO DEL PROBLEMA DE ELECTRIFICACION RURAL La Corporacion Autonoma Regional Rionegro-Nare 'CORNARE' es una entidad de caracter publico descentralizado, cIeado por ley y con jurisdiccion en 26 municipios que confonnan hi. region del Oriente del Departamento de, Antioquia, region de Colombia en Sudamerica, encargada de administrar, controlar y encauzar el uso y aprovechamiento de los recursos naturales renovables dentro del concepto del desarrollo humano sostenible. La region del Oriente Antioqueiio, esta compuesta por 26 municipios que ocupan un territorio de 809400 hectareas, el 13% del departamento. Con el objetivo de adelantar su programa de' electrificaci6n rural CORNARE identific6 956' proyectos posibles; cada proyecto se caracteriza por el niImero de viviendas rurales que favorece, por su costo economico, por su aporte a la cobertura del servicio electrico municipal, por la demanda de electricidad a las subestaciones asociadas a el, entre otros. Se considero importante 'el planteamiento de objetivos que ayuden a dirigir el plan de eIectrificaci6n de manera adecuada a las necesidades de la regi6n. Estos objetivos incluyen: La Eficiencia econ6mica en la asignaci6n de recursos, la Equidad en las coberturas municipales, el tratamiento preferencial a los municipios prioritarios y el asegurar presencia politica en todos los municipios de la zona. ' Adicionalmente, el problema esta sujeto a una serie de restricciones. La fonnulacion matematica del problema es la siguiente: ' 4.1 Funciones Objetivo EOdenda economica en la asignacion de recurs os Con este objetivo se busca maximizar los beneficios asociados a la construccion de los proyectos, representados por la cantidad de viviendas que se atienden con cada proyecto' particular. Este objetivo se representa matematicamente de la siguiente manera. T Max Z1 = N L L Ik,t*Nuviv K (=0 k=1 donde N es el numero de proyectos considerados, Nuvivk es el niImero de viviendas que se benefician con la implementacion del proyecto k, I k. I es una variable binaria (0,1) que indica la decisi6n de implementar 0 no eI proyecto k, en el periodo de tiempo t. Equidad en las coberturas municipales Con este objetivo se desea conseguir un nivel mmlD10 de cobertura en todos los municipios de laregi6n, ya que en 1989 existian grandes desequilibrios en coberturas municipales varian do entre un 8.1% y 93.2%' Este objetivo pueden escribirse de la sig~iente manem:' , . Restr;cciones de contilrgencia .' Utilizadas pam indicar que la 'construccion 'de un proyecto esta condicionada a la construccion previa de otro proyecto:' Se plantean as!: ' ", =Cobertura i,t-1 + n L I k,t * (Colltribuciollk,t) ~ Cobdes i,t k=1 kei i e municipios no prioritari OS donde Coberturai.l.l es el porcentaje cob.ertum del servicio en el municipio i al inicio del periodo .t, Contribuci6nk,/ es la contribucion del proyecto k al incremento en el porcentaje de cobertum del servicio en el municipio i en eI periodo t, Cobdest.1 es eI porcentaje de cobertum deseada pam el municipio i al fmal del periodo considemdo y n es el niunero de proyectos que pertenecen al municipio i. Tratamiento preferencial a los municipios prioritarios La leyestipl.!-Ia que las,inversiones se deben dirigir de forma prioritaria h:icia los municipios que se yen directamente afectados por la construccion de embalses. Entonces, para cada municipio prioritario al 'final del 'horizonte de planificaeion se ~esea satisfacer: Max Z3 , =Cober/ura l•I ./ n + LJ k.1 * ( Contribuciom,,j >i::obdesiP,1 k=/ kei i E' municipios prio'ritarios donde Cobdes ;p,1 es la eobertum deseada pam el municipio prioritario i, al final del periodo considerndo. AI tratarse de munieipios prioritarios la cobertura minima deseadaenestos municipios debe ser mayor que la cobertura minima deseada en los municipios no prioritarios. II Max Z4 =LJk,t ~1: donde j es un proyecto que requiere ser construido antes de construir ken el tiempo t' . Restr;ccioltes de 110 dtlplicidad Utilizadas pam indicar que cada proyecto se puede eonstruir maximo una vez. Se plantean asi: ' T L/k., ~1, 4.2 Restricciolles Este problema de electrificacion rural esta sujeto a las siguientes restricciones, para todo k = 1,..., Nproy Se utiliza el metodo de Algoritrnos Genetieos para problemas con multiples objetivos propuesto por Bentley y Wakefield (1997), Suma de Radios Globales Pondemdos (SWRG, por sus iniciales en Ingles). Los valores de parnmetros del Algoritrno Genetico fueron fijados a traves de experimentos con diferentes eonfigumciones. En la Tabla 1 se presentan los valores de estos parametros. TABLA 1 PARAMETROSDELALGORnnMOGENETICO 1",0 donde Nproy es el niunero total de proyectos. Restricciolles presupllestales Utilizadas pam indicar ellimite del presupuesto pam inversiones que puede ser ejecutado en cada ano. ,Estas restricciones se ' presentan de la forma: , de 2000 Numero Individuos Iteraciones Probabilidad Cruce Mutacion I 1000 10% 25% 10% En la Fig. I se presentan los niveles de cobertura a1canzada en cada uno de los 26 municipios. De igual forma en la Fig. 2 se muestm los niveles tot ales de cobertum e'n cada municipio al final del periodo como resultado del programa de electrificacion rural que se obtiene con la aplicacion del metodo multiobjetivo de Algoritmos Geneticos, Suma de Radios Globales Ponderados. En la Fig. 3 se presenta una compamcion entre los resultados obtenidos por Manjarres (1989) utilizando el metodo de las restricciones y los resultados obtenidos en este trabajo con Algoritrnos Geneticos. Tambien, en la Tabla 2 y en la Tabla 3 se muestm la distribueion anual de los recursos economicos con cada uno de estos metodos en relacion con el presupuesto disponible, y el numero de viviendas beneficiadas. Como puede observase en dichas tablas, se obtuvo un mayor numero de viviendas beneficiadas cuando se utilizo el metodo de las restricciones pero se presenta mayor equilibrio en las coberturas municipales con la utilizaci6n del metodo de Algoritmos Geneticos (ver Fig. 3), asi mismo se hace mejor uso del presupuesto cuando se utilizan el metodo de Algoritmos Genetieos ya que por este metodo se dejan de utilizar aproximadamente 31' millones de. pesos del presupuesto disponible mientras que por el metodo de las restricciones este valor es de 1000 millones aprox. Nproy / '2)",tCostq.t ~PresuH, ! '"'[" k-eO . para todo t 1,...;r Restr;ccion de capacidad dispolf;ble ell las subestaciones Cada proyecto de electrificacion rural esta asoeiado a una subestacion desde la cual se Ie abastecera de energia, por 10 tanto esta restricci6nindica' quela demanda exigida por los proyectos asociados':i una subestaeion no debe exceder la capacidad de la ~stacon en cada' periodo considerado. La demanda de cada proyecto se calcula como PCE* Nuvivk ,donde PCE es el promedio de consumo' de energia por vivienda en kilovatios por ano (kWa). .L/k'l * dem k ~ DisPI.t para todo t kell - - - - -- -- - - -- - - - - - - - - - - - - - - -- - - - '" +-------. -. -. . i donde COStOk,1 representa el costo de cada proyecto en el ano t,y Presup, es el presupuesto disponible pam inversion en el ano t. 40.0 :g 30.0 .. i!., _ ... ... ... ... _ _ _ - - ..... - - • - - 26.5 - - - - • - - • - ............ 20.0 14.0 11 .6 5,9 5.0 ..... - • _ .. _ ... ... ... ... ... 11.6 10.7 Wj~_ I-lJLUJtjlJL:::~~-P~::!ilUl}lLFL~"" Muridp'o :AI plantear el problema resultan 956 variables de decision binarias, para cada' periodo de tiempo t, el horizonte de planificacion es de 5 aiios y en total se tienen 4780 variables distrib~idas de la siguiente manera: 172 _ _ • - ---. 24.1 Fig. L Adicion de cobertura en cada municipio I k •t , y 2791 restricciones _ ~ ... 5. SOLUCI6N CON ALGORITMOS GENETICOS de decisi6~ binarias _ _ . - - . - -- - 5.1 0.0 _ _ _ _ ... 35.1 20.3 ~ 8 ... _ _ _ _ .. donde DISP/.tes· la disponibilidad de capacidad en las subestaci6n i-esima para satisfaper las demandas en el periodo t. La sumatoria se hace sobre todos los proyectos asociados a la subestacion I. k=1 kei Gamntizando que en cada municipio se construya por 10 menos un proyeeto. ~ '2:'/1,' t=O Asegurar presencia politic a en todos los municipios de la zona. Con este objetivo se pretende haeer presencia en todos los municipios realizando inversiones en cada uno de ellos, se plantea de la siguiente mariera: 140 I' l(k,l) Max Z 2 Restricciones de no duplicidad: 956 Restricciones de contingencia: 1690 Restricciones de presupuesto: 5 Restricciones de Capacidad en las subestaciones: 173 -~P-;I ( " ". ! 100 0 80.0 g., 90.4 -~ .. .~ (5 CD ~ "'C -> c: -l'! .~ c: ~ CD '~~E .!! .... CO ._ « « U '(3 -a. •.;;. .... ~ co CD .'~' - ~ - co Ii - Q -,li "cp "c: - U (!). (!) (!) °og'uu. 0 c:. 1:! ..J ..J ::E .~ te: t z a.CD & r:x: '" "- .: CD a:; c: 0 0: I m ','.' Ol III Dadas co -.~. "10' c: c: :; "ECD ·E0 g - .U - 0 .W' - ~ ..Jr:x:r:x:>.9.a~ c: c: c: c: '" III'" III'" III'" III'" III'" III Muridpo c: 0 III ..,// Fig. 2. Cobertura final en los municipios funciones objetivo de un problema: Ii (x~, i = 1,2,... , n y un conjunto de vectores de soluci6n al problema: {S.. S2 ,""sm}' Un metodo de (definida por el metodo) cambia cuando el rango efectivo i 1,2,..n . cambia. Un metodo de de Anexo 1 - .... las n clasificaci6n jernrquica es rango dependiente si la cIasificaci6n jerarquica de la aptitud de {sl' S2,..., S m} c: CD c c coca III Teniendo en cuenta la definici6n de rango efectivo, se puede introducir el concepto de independencia del rango, como 10 fonnula Bentley (1996): La aplicaci6n de metodo multiobjetivo con Algoritmos Geneticos, Suma de Radios GIobales Ponderados, penniti6 atacar un problema muy grande (electrificaci6n rural) considerando simuItaneamente todos los objetivos, y presentando ventajas muy significativas, tanto en tiempos de ejecuci6n como en la calidad de las soluciones haIIadas, con respecto al metodo de las restricciones utilizado tradicionalmente para atacar este problema. -6:.0-r -66.4 _ _ •• _ _ .g .Q CONCLUSIONES 78.6 ·1' 61.4 __ _ _ -e-n;-~ j!:. 80 0g;.... ::::J:::J n;CO u:J-E rocoCO U 41 .6 .;::;: :e 28.7 6. 86.6 66.6 _ r· .. . . -l • - - 20.0 ~ • - 64.5 60.0 -l • - - 0.0 ;9.0 -6 - 7.1. :; 40.0 --:r8~ 93:5 - -rI \ 100.0100 D 1 ."~. . .. -. r :·:'f."J··':T. ~ - - - - - - - 5 3• ~ -- 9.Jl.l~"~ 6 hex), En este anexo se presentan los conceptos fonnulados por Bentley y Wakefield (1997): la independencia del rango y . la importancia que emplean para describir. el metodo de optimizaci6n multiobjetivo con Algoritmos Geneticos, SWRG, propuesto por eIIos y que se describe mas adelante. = cIasificaci6n jerarquica de rango independiente si la cIasificaci6n jerarquica de la aptitud de {sl,s2""sm} , definida por el metodo no cambia cuando el rango efectivo de Ij(x), i 50 = 1,2,... , n cambia. Independencia del Rango 40 g 30 '" !I j 8 20 ~ 1\ i\ ------I-{ J \ - :~. 10 o ~~~~(, N M ~ ~ ~ ~ ~ ts~iY,~-:; _ _~~ ft{. ~ 2 ~ ~ ~ ~ ~ ~ ~ ~ ~ N ~ ~ ~ ~ I -+-AG-SWRG ~ Fig. 3. Comparaci6n de las adiciones de cobertura municipal obtenidas por 2 metodos diferentes. TABLA 2 DISTRIBUCION DE ANUAL DE COSTOS Y NUMERO DE VIVIENDAS BENEFICIADASHALLADOS CON EL METODO DE LAS RESTRICCIONES. Nuvjv Ano Costo Presupuesto Presupuesto restante 2 2.768 2.371 3 2.252 4 2.116 5 2.006 11.513 Total $ 1.170.417.126 $ 1.173.159.598 $ 1.172.077.488 $ 1.114.820.247 $ 1.066.590.514 $ 5.697.064.973 $ 1.168.338.432 $ 1.047.317.943 $ 925.433.878 $ 788.691.042 $ 701.700.057 $ 4.631.481.351 $ 2.078.694 $ 125.841.655 $ 246.643.610 $ 326.129.205 $ 364.890.457 $ 1.065.583.622 TABLA 3. DISTRIBUCION DE ANUAL DE COSTOS Y NUMERO DE VIVlENDAS BENEFICIADAS HALLADOS CON EL MULTlOBJETlVO CON ALGORITMOS GENETlCOS. Nuviv Ano Costo Presupuesto Presupuesto restante 1.153 Total 2 1.768 3 2.303 4 2.868 5 3.264 11.356 $ 1.168.604.200 $ 1.165.549.107 $ 1.158.399.004 $ 1.107.903.821 $ 1.065.296.652 $ 5.665.752.784 $ 1.170.417.126 $ 1.173.159.598 $ 1.172.077.488 $ 1.114.820.247 $ 1.066.590.514 $ 5.697.064.973 174 Los. metodos de clasificaci6n independientes del rango no requieren infonnaci6n de pesos ex6gena para c1asificar las soluciolles apropiadamente y caIcular su aptitud global. Esta es una ventaja significativa con respecto a los metodos dependientes del rango (Bentley, 1996),ya que penniten que un Algoritmo Genetico pueda ser usado para diferentes problemas. . ~ No. MLJicipo '·Uil' "-'el Restricciales Segun Bentley y Wakefield (1997), la unica fonna para garantizar que todos los objetivos en un problema muItiobjetivo sean tratados igualmente por el Algoritmo Genetico, es convertir los rangos efectivos para que sean comparables, luego usar un metodo dependiente del rango, o usar directamente un metodo de cIasificaci6n ·independiente del rango, 10 que asegura que los objetivos no se comparan directamente unos con otros. En la utilizaci6n de un Algoritmo Genetico para un problema multiobjetivo, cada funci6n objetivo 0 funci6n de aptitud toma valores dentro de un intervalo numerico finito conocido como rango efectivo. El rango efectivo de una funci6n depende de la funci6n en si misma y de los valores que toman las variables del problema dentro del Algoritmo Genetico. El rango efectivo de una funci6n de aptitudf(x), es el intervalo comprendido entre el valor minimo y el valor maximo que toma la funci6n en el Algoritmo Genetico. $ 1.812.926 $ 7.610.491 $ 13.678.484 $ 6.916.426 $ 1.293.862 $ 31.312.189 Es de esperar que las funciones objetivo dentro de un problema multiobjetivo tengan diferentes rangos efectivos entre si, es decir, los rangos efectivos de las funciones no sernn conmensurables (Schaffer, 1985). Esto implica que si se agregaran simplemente los val ores de aptitud de los individuos dentro de una poblaci6n para obtener un solo valor de aptitud para cada uno de eIIos, la funci6n de aptitud con el rango efectivo mas grande dominaria la selecci6n. Como se ve en la Fig. 4, un valor de aptitud pobre para la funci6n objetivo que tiene el rango efectivo mas grande tiene un efecto mas negativo sobre la aptitud global que un valor pobre para la funci6n objetivo con el rango mas pequeno. Importancia Segun Bentley y Wakefield (1997), la importancia es otra propiedad deseable en la cIasificaci6n jerarquica y consiste en la habilidad de incrementar la importancia de algunos objetivos con respecto a otros en la cIasificaci6n de las soluciones para pennitir que la bUsqueda sea dirigida a converger en soluciones aceptables, aceptables dentro de un subconjunto mas pequeno del conjunto 6ptimo Paretiano, favoreciendo aqueIIas soluciones mas cercanas al 6ptimo de las funciones con mayor importancia, y en proporci6n a esta. . rango efectivo 1 o c o :::> '"E Q) m o ~ o o c Q) :::> m Se deduce que los metodos con Algoritmos Geneticos mas atractivos para resolver problemas multiobjetivo, seran aqueIIos que cuenten con un metodo de clasificaci6n jerarquica independiente del rango y que ademas pennitan especificar la importancia de los objetivos de una manera practica (Bentley y Wakefield, 1997), los metodos de evaluaci6n de los illdividuos: Suma de Radios Ponderados 00 rango efectivo 2 '"E Fig. 4. Rangos efectivos para dos funciones objetivo 175 (SWR) Y Suma de Radios Globales Ponderados (SWRG), proPtlestos p,or dichos autores cumplen con esos requisitos. Computer Science. University of North Carolina Charlotte. Smith, R., Y otros (2000), Decisiones con multiples objetivos e incertidumbre. Universidad Nacional de Colombia. Medellin, Colombia. Suma de Radios Ponderados (SWR) Los valores de aptitud para cada objetivo son convertidos en radios, usando la mejor y la peor solucion de cada generacion con respecto al objetivo considerado, esto remueve la dependencia del rango de las soluciones y estas pueden ser ponderadas y sumadas para proveer un tmico valor de aptitud para cada individuo. CONTROL NEURONAL DINAMICO PARA SINCRONIZACION DE CAOS' Edgar N. Sanchez ([email protected]), Luis J. Ricalde CINVESTAV, Unidad Guadalajara, MEXICO Jose P. Perez CINVESTAV. Unidad Guadalajara y U~iversidad Autonoma De Nuevo Leon, Monterrey, Nuevo Leon, Mexico Guanrong Chen University of Houston, Houston, Texas, USA and City University of Honk Kong Suma de Radios Globales Ponderados (SWRG) Resumen: Este articulo presenta una nueva estructura de control adaptable, basada en redes neuronales dinamicas para seguimiento de trayectorias de plantas no lineales desconocidas. Los principales componentes de esta estructura incluyen un identificador neuronal y una ley de control, los cuales conjuntamente garantizan el seguimiento deseado., La estabilidad del 'error de seguimiento es analizada por mediode los metodos basad os en funciones de Lyapunov. La aplicabilidad de la estructura propuesta es probada mediante un ejemplo con sistemas dinamicos complejos: sincronizacion de caos. Este metodo es una variacion del anterior. En lugar de convertir en radios las aptitudes separadas de cada solucion para cada objetivo usando los mejores y peores valores de la poblacion actual, se usan los valores globalmente mejores y peores. En ambos metodos, la importancia de los objetivos individuales puede asignarse mediante pesos. Cada cierto mlmero de generaciones, los pesos de los objetivos pueden ser variados, asi el "ordenamiento de acuerdo a la , importancia de cada objetivo en la aptitud global varia, es decir, un objetivo que inicialmente tenia el mayor grado de importancia pasa' a tener un grado de importancia secundario. Usando el metodo del control optimo inverso, una ley de control, capaz de producir caos en una red neuronal dimimica, fue presentada en [12J. EI presente articulo extiende estos resultados al seguimiento de trayectorias caoticas en sistemas dinamicos desconocidos. EI. nuevo esquema de control adaptable esta compuesto de un' identificador neuronal dinamico, el cual construye en linea un modelo para la planta desconocida y una ley de control, la cual asegura que la planta desconocida siga la trayectoria de referencia satisfactoriainente. EI nuevo metodo es ilustradopor un ejemplo de sistemas dinamicos complicados: sincronizacion de caos. Palabras Clave: 'Redes neuronales, sincronizacion' de caos, control adaptable, funci6nde Lyapunov, estabilldad. 1. INTROnUCCION , 2. PRELIMINARES MAmMATIcos A partir de la publicacion [1], ha habido un continuo incremento en el interes por aplicar redes neuronales en identificacion y control de sistemas no lineales. La mayoria de estas 'apliCaciones' usan estriicturas estaticas [2, 3]. Se ha desarrollado mucho ultimamente el uso de redes neuronales dinamicas, 10 cual permite unmodelado mas eficaz de los sistemas dinamicos mencionados [4]. Dos Iibros recientes [5J, [6] revisan la aplicacion de redes neuronales dinamicas para identificacion y control. En [5]., en particular. se utiliza un aprendizaje fuera qe linea, mientras. que [6J ,analiza identificacion' adaptable y control poi-medio de'aprendizaje en linea; la estabilidad en lazo cerrado se establece basandose en metodos de funcion de Lyapunov. En [6] el problema de seguimiento de trayectorias ,es reducido a un problema de seguimiento lineal, con aplicacion a motoresDC. Por otro lado, los metodos de control aplicados a sistemas no' lineales en general han sido extensamente desarrollados desde principios de los 80's, por ejemplo, basandose enla teoria de geometria diferencial [7]. Recientemente, el enfoque de pasividad ha generado gran interes para el desarrollo de nuevas leyes de control de sistemas no lineales [8]. Un problema importante es como lograr control no lineal robusto en la presencia de dinamicas no modeladas y perturbaciones externas. En esta linea de investigacion,existe el llamado control no lint!al H [9, I OJ. Una de las mayores dificultades de este metodo, ademas de la posible inestabilidad estructural def sistema,· es el resolver el sistema de ecuaciones diferenciales parciales asociado. Con el proposito de reducir este problema computacional, el lIamado metodo del control optimo inverse,. fue recientemeIlte desarrollado con base en el concepto de estabilidadentrada~ estado [11]. REFERENCIAS Bean, lC., y Hadj-Alouane, A.B. (1992), A dual genetic algorithm for bounded integers programs. Departamento de ingenieria industrial y operaciones, Universidad de Michigan, Repo~eTecnico 92-53. Bentley, P. J. 1• YWakefield, P. (1997). Finding acceptable solutions in the Pareto-Optimal range using Multiobjective Genetic Algorithms. (1) Department of Computer Science, University College London, (2) Division of Computing and Control Systems, School of Enginee'ring, University of Huddersfield, London, UK. Holland, 1 (1975), Adaptation en Natural and Artificial Systems, MIT Press. Manjarres, J.F. (1989), Aproximacion al planeamiento regional usando la programacion entera mixta, Tesis de Maestria. Posgrado en Aprovechamiento, de Recursos Hidniulicos, Facultad de Minas, Universidad Nacional de Colombia, Medellin. Michalewicz Z (1994a), Genetic algorithms + data structures = evolution programs. Springer-Verlag, New York, 2 ed. Michalewicz Z. (1994b), Genetic algorithms, numerical optimization, and constraints, Department of 176 a ser P~ero present~mos' el identificador n~uronal utilizado. , A) Redes Neurollales Recurrentes de Alto Orden. En [13], las redes I1euronales recurrentes de alto orden son definidas' como .- L x, - -a/x, + ~ LJ W" ,bol nY j~l. J,(l) l ' • - I 1- ,... ,n donde Xi es el estado de la i-esima neurona, L es el numero de conexiones de alto orden, {hh .. .ln} es unacoleccion de subconjuntosno ordenados de {l,2, ... ,m+n}, ai>O, Wik s01110s pesos ajustables en .la red neUronal, .~(k) sonenteros no negativos. y Y es un vector definido por T' T Y=[YJ,"',YmYn+]'''',Yn+"J =[S(XI),...,S(X,J,S(UI),'" S(u"J} , con U=[UJ,U2,. ..,UnJT la entrada a 1a red neuronal, y S(-) una funcion suave dada por Sex) = I +e' Para 1a funcion l+exp(-flx) sigmoidal, p es una constante positiva y E es un ntlmero real positivo. Por 10 tanto, S(x)E[E,e+1j. Como puede observarse, permite la introduccion de terminos de alto orden. Definiendoun vector z(x,u)=[zI(x,u),...,zdx,u)t = [IT Y jaJ(I) JE I, , ..., IT Y al(L)] j JE I L ( I ) puede reescribirse como I, X, =-a,x, + X, L,-, W"Zl(x,u),i = 1,..., -a,x, + w, (x,u), i = 1•..., donde Wi =[W~b"·Wi./)' En este articulo, se consideran ternullos II II (2) del tipo y=b'J, ... ,YmYn+]'...,Yn+"JT=[S(x]),...,S(x,J,S(UI),.....S(unJJ (esto 177 significa que se utiliza el' mismo numero de entradas que de estados). Tambien se supone que la entrada a la red neuronal la afecta directamente, asi que (1) puede reescribirse como, x,=-a,x,+w;z,(x)+u" i=I,... ,n (3) Reescribiendo (2) en forma matricia], se obtiene x==Ax+WZ(X)+II, se obtiene e=Ae+(W' -U0rz(x)+uHfr(z(x)-Z(xJ-a,(t,W) (13) w=W' -W,ii=ll-a,(t,l¥) (14) r, >0 i =1,..•, L y sustituyendo (14) en (13), se obtiene e=Ae+Wrz(x) + ffT'(z(x)-z(x.»+ii • .1 V=-liell 2 donde xp,J;,eK', gpeRlUn, ueRn. Tomando en consideracion que tanto f como g son desconocidos, se trata de modelar (5) por medio de una red neuronal dinllinica en la forma de (4). Por 10 tanto el modelo de la planta se convierte en, .:i:p =x+w =Ax+Wrz(x)+w +11• (6) =Ax+ WTz(x) + w,... +11- [(x" II) (9) la cual se puede escribir elemento a elemento como tv¥ = e,!!(x,) , i =1,2,... n, j =I,...,L Sustituyendo (18) en (17) se llega a V=-.k'e+e'nf(z(x)..;.z(x.»+e'ii -a,(t,JV) =Ae+wrz(x) +u + (-[(X"II) + A~ + IITz(xJ W. + x-tx" ( 17) ii=-Jif'(z(x)-z(xJ)-ke con la que se obtiene 8 d="'j r=28 x,{O) = (1 1 con y A - [tanh(1a;)) (T(x)::: tanh(kx,) k = 0.5 Los resultados de la simulacion se muestran en las figuras I a3. (19) .. Fig. 1. Evolucion en el tiempo del estado Xz (22) ~t'r1!'''! ~M: n;·M 'W1!H,rnl' ,...- Luego, se obtiene, una accion de control, tanto para la red neuronal como para la planta, dada por: 1/ = ii +a,(t,JV) - IITz(x,) (A + I)(x x,) II,) Ax, ..- (23) Teorema 1. Para el sistema no lineal desconocido modelado por (6), la ley de aprendizaje en linea (19) y Ia accion de control (23), en conjunto, aseguran el seguimiento de la referencia no lineal (12). (10) 4. EJEMPLO DE APLICACI6N Con el proposito de mostrar la aplicabilidad del esquema de control propuesto,se prob6 el siguiente ejemplo. . 178 ~I <11 .,'i ,f'! Fig. 3. Plano de fase de la planta 5 CONCLUSIONES Se ha presentado una nueva estructura adaptable basada en redes neuronales dinllinicas para seguimiento de trayectorias de para sistemas no lineales, desconocidos. Esta estructura esta compuesta de un identificador neuronal y. una ley de control para seguimiento detrayectorias. La estabilidad de Ia dinamica del error ha side establecida por medio del metoda de la funcion de Lyapunov. La aplicabilidad de la estructura propuesta fue probada en simulacion, por medio de un ejemplo de un sistema complejo: sincronizacion de caos. Los resultados son motivantes. El trabajo futuro en esta linea busca simplificar la condicion de tener el mismo numero de entradas que de estados en el sistema de control Los autores agradecen eI apoyo del proyecto CONACYT, Mexico, 32059 A. El segundo autor agradece el apoyo de la Facultad de Ciencias Fisico Matematicas de la Universidad Autonoma de Nuevo Leon. . u::: -Wr(z(x)-z(x,» - ke+ [(X" '" Agradecimientos. (21) V=-(A+k~~' <0 V'e,JV;tO Por 10 tanto, tim e(t) ::: 0 . (26) tanh(kx,) (2() keir I) =-51 ,r =1501 Los resultados obtenidos se pueden resumir en el siguiente +x-x, + Ax-Ae+a,(t,W»-IITz(xJ es una estimacion de 5 0.5 En la simulacion, se utilizo Ia siguiente red neuronal dinamica X::: Ax + rW'(T(x) + U x(O)=(O 0 of Considerando (20), se propone la siguiente ley de control, e == Ax+ WTz(x) + u + (-[(x"II.) + Wrz(x.) TV [-10) '(18) trfVTW}= -eTIVrz(x) Ahora, sumando y restando al lade derecho de (9) los terminos Ifrrz(x),a,(t,Ip) y Ae y recordando que wper.'=x-xp, se obtiene donde /8::10 (16) 2 +trVVw} . Como en [6], usamos la siguiente ley de aprendizaje (8) e=i, -x' ,., I L -} +-tryVTW V=eTAe+eTiiirz(x) +eT»nz(x) - z(xJ) +eTii donde el termino wper representa el eITor de modelado, y W son los valores desconocidos de los pesos, los cuales minimizan el error de modelado. Luego, podemos definir wper:=x-xp. Su derivada con respecto al tiempo es: X,I(O») (x., (0) x,, (0) = y x,, ::: -fix" Su derivada con respecto al tiempo, a 10 largo de las trayectorias de (15) esta dada por ~ e:=x,-x, ': con (5) 3. ANALISIS DE SEGUIMIENTO DE TRAYECTORIA. El error de seguimiento de trayectoria se define como la diferencia entre la salida de la planta desconocida modelada por (6) y la trayectoria de referencia definida por: X, ,: I,(X"II.); x, e R' (7) Definamos el error de seguimiento como, El objetivo, es hacer que el atractor caotico de Chen siga la referencia dada por el atractor de Lorenz definido como X'I = (T(x" - X,I) (25) x,,:z = rx" X,.2 - X,.lX"J (15) A) Estabilizacion del seguimiento de trayectorias Una vez que se obtuvo (15), se puede proceder a estudiar su estabilizacion. Notar que e = 0, .IV = 0 es un' punto de equilibrio. Con el objeto de realizar un amHisis de estabilidad, se considera la siguiente funcion de Lyapunov: '-mlU flUtHlitj;nu con a = 35 b = 3 c = 28 Definiendo xp = F;,(xp,u)= I,(x,) + gp(X,)1I -a,(t,W) • (12) e == Ae+Wrz(x)+II-Wrz(xJ-a,(t,W) (24) +CXP , Sumando y restando a (12) el terminoWrz(x) se tiene B) Modelado de la planta La planta no linea] desconocida se mode]a como +(A + 1)(x-xp)+a,(t,IV)-IITz(xJ pi Por 10 tanto, (l0) se reduce a, (4) ,0 0 0 rL Estos parametros,,( juegan e] mismo papel que el tamafio del paso en el algoritmo de gradiente descendie~te. ~ x,, =(c-a)x -X,IX" xp1 =X,IXp' -bX,l J:(x"u.) = Ax; +JWz(xJ+(A+I)(x-x,)+~(t,Jh (II) donde xeR",JVeRnxL,z(x)eRL,ueR n yA=-A! A>O Ahora, se considera ]a siguiente modificacion a la red de alto orden: X =: Ax + wrz(x) + II donde r es una matriz diagonal definida como rl 0 0 0 o r, 0 0 r=lo 0 0 0 o 0 r L-I 0 En este ejemplo, la planta desconocida considerada en el atractor caotico de Chen generado por X,I = a(x" - X,I) Ahora, suponiendo que - [(X"II,) +Ax; + JWz(xJ +(A +I)(x-xp) +a,(t,W) =0 ,~~ Fig. 2. Diagrama de fase de la referencia REFERENCIAS 1. K. S. Narendra y K. Parthasarathy, "Identification and control of dynamical systems using neural networks", IEEE Trans, 011 Neural Networks, vol. 1, no. I, pp 4·27, 1990. 2. M. M. Gupta and D. H. Rao (Eds.), Neuro-Control Systems, Theory and Applications, IEEE Press, Piscataway, N.J., USA, 1994. 3. K. Hunt, G. Irwin and K. Warwick (Eds.), Neural Networks Engineering in Dynamic COlltrol Systems, Springer Verlag, New York, USA, 1995. 4. A. S. Poznyak, W. Yu, E. N. Sanchez, and 1. P. Perez, tlNonlinear adaptive trajectory tracking using dynamic neural networks tl , IEEE TrailS. 011 Neural Networks, vol. 10, no 6, pp 1402-1411, Nov. 1999. 5. K. Suykens, L. Vandewalle and R. de Moor, Artificial Neural Networks Jor Modelling and Co1ltrol oJ Nonlinear Systems, Kluwer Academic Publishers, Boston, USA,1996. 6. G. A. Rovitahkis and M. A. Christodoulou, Adaptive Control with Recurrent High-Order Neural Networks, Springer Verlag, New York, USA, 2000. 7. A. Isidori, Nonlinear COlltrol Systems, 3rd Ed., Springer Verlag, New York, USA, 1995. 179 8. D. J. Hill and P. Moylan ,"The Stability of nonlinear dissipative systems", IEEE Trans. on Auto. Control, vol. 21, 708-711,1996. 9. H. W. Knobloch, A. Isidori and D. FlockelZi, Topics in Control Theory, Birkhauser, Boston, USA, 1993. 10. T. Basar and \ P. Bernhard, H-Infinity Optimal Control and Related Minimax Design. Problems, Birkhauser, Boston, USA,1995. II. M. Krstic and H. Deng, Stablization of Nonlinear Uncertain Systems, Springer Verlang, New York, USA, 1998. 12. E. N. Sanchez, J. P. Perez and G. Chen, "Using dynamic neural control to generate chaos: an inverse optimal control approach", Int. J. ofBifurcation and Chaos, to appear 200 I. 13. E. B. Kosmatopoulos et ai., "Dynamical neural networks that ensure exponential identification error convergence", Neural Networks, vol. 1, no. 2, pp 299-314, 1997. 14. H. Khalil, Nonlinear Systems, 2nd Ed., Prentice Hall, Upper Saddle River, NJ, USA, 1996. 15. E. N. Sanchez and 1 P. Perez, "Input-to-state stability analysis for dynamic neural networks", IEEE Trans. Circuits Syst. , vol. 46, pp 1395-1398, 1999. LA LOGISTICA DEL CONGRESO INTERNACIONAL EN INTELIGENCIA 'COMPUTACIONAL'(CIIC-2001) Giovanni Perez Ortega (gperez@perseus:unalmerl.edu.co) John Sebastian Montoya,Gomez, Natalia Pineda Betancur Escuela Ingenieria de la Organizacion Universidad Nacional de Colombia - Sede Medellin Por esto quisimos desde aqui, el ultimo articulo de las merilOrias del CnC-2001, rendir un sincero homenaje a todas las personas que dieron vida a este proyecto, q~e demuestra que la Universidad Nacional de Colombia, continua cumpliendo con su mision y compromiso con la Academia, la Investigaci6n y la Extension a 10 largo y ancho del territorio colombiano. Resumen. Este articulo hace un recorrido por las actividades que constituyeron la base para la realizadon del CUC-200t y sirve de referenda para el montaje de eventos similares. Ademas, se destacan las dilicultadesque al final lograron vencerse de tal forma que se garantizara el hito; Asi mismo se resaltan las personas que nos apoyaron incondicionalmente, por 10 que este se constituye en un sincero homenaje. Objetivos del evento. EI CnC-2001 es un foro intemacional para investigadores y profesionales en los diferentes campos de la Inteligencia Computacional y. los Sistemas Bioinspirados. Ademas,es un espacio para promover el intercambio y la discusi6n de. ideas y experiencias en diferentes disciplinas, entre participantes provenientes de ia academia, 'la industria y las empresas estatales. EI proposito principal del CnC-200t es difundir e impulsar el desarrollo de la Inteligencia Computacional con la presentacion de trabajos realizados ensus areas. EI CnC-2001 se origin6 en la Red Colombiana en Inteligencia Computacional y Sistemas Bioinspirados. Palabras Clave: Logistica, Evento, CnC-200l, Integracion, Personas, Organization. Realizar el Congreso Internacional en Inteligencia ComputacionalCIIC-2001, no fue una labor de dias ni tampoco de una sola persona, mas bien se podria decir que durante los dos afios anteriores a la fecha de su iniciaci6n ya se estaba pensando en 10 que hoy se. presenta. Gracias a esos esfuelZos de mas 35 personas entre los que se destacan: el Vicerrector de la Sede UN Medellin, el Decano y el Vicedecano de Investigaci6n de la Facultad de Minas, el Director General del evento, los comites cientificos . Internacional y Local y los cinco auxiliares del CnC-200l, se logr6 alcanzar los objetivos, utilizando la planeaci6n,' la organizaci6n, la direcci6n yel control, en un recorrido que dur6 600 dias. En la Inteligencia Computacional.y la Informatica Bio Inspirada se desarrollan sistemas con base en los comportamientos y mecanismos exitosos observados en la naturaleza, logrando soluciones con representaci6n numerica del conocimiento, adaptabilidad, tolerancia. a fallas, velocidad de procesamiento comparable a los procesadores cognitivos humanos, y optirnizaci6n de la rata de error. No olvidamos las Dependencias de la UN, incluyendo la Sede Bogota, quienes en todo . momento se pusieron a disposici6n de la Organizaci6n del CnC-2001, y que no decir de la Oficina deComunicaciones, el Centro de Procesamiento de Informacion y su servicio de servidoresInternet, y el Centro de Publicaciones, que expusieron todos sus atributos y utilizaron todas las herramientas para que el cnC-2001 fuera 10 que es hoy, una verdadera reaUdad. Definicion de los temas del evento: Se definieron como temas principaJes del CIIC-200J: Algoritmos Evolutivos, Redes . Neuronales, Sistemas Difusos, Inteligencia Colectiva, Computacion Molecular, Aprendizaje de Maquina, Sistemas Hfbridos, Embrionica, Automatas Celulares, Evoluci6n Simulada, Vida Artificial, Hardware Evolutivo. Logistica del Evento. Definir logistica es una tarea algo dificil, pues mucltas veces el termino Ita 181 180 sido relacionado con las organizaciones militares l y otras, se ha definido como una gesti6n de distribuci6n fisica que integra las funciones de planificaci6n, implementaci6n y control del flujo eficiente de materias primas, recursos de producci6n y productos finales desde el punto de origen hasta el consum0 2 • Sin embargo, para el CIIC-200 I se definini como todas aquellas actividades que tengan relaci6n con el exito del evento, desde su inicio hasta su fin, aplicando la eficiencia y la eficacia. • Lanz!lmiento oficial del evento utilizando la pagina web. Con base en estas macro actividades, se construyeron los cronogramas de las acciones a adelantar cada una con el responsable y las Dependencias tanto en el interior de la Universidad, como al exterior; que podian colaborar con el exito del evento. De estas acciones se destacan: • Definici6n de bases de datos en los que aparecen publico objetivo, empresas con probabilidad de vinculaci6n y conferencistas o ponentes de propuestas academicas. • Actualizaci6n y mtraci6n de las bases de datos. Permiten aproximar los datos a la eficiencia. • Divulgaci6n y publicidad del evento. Incluye las actividades de: desarrollo de la imagen, afiche, peglablesy pendones entre otras. • Procesos de inscripciones: Es' una de las actividades mas importantes del evento. Requiere una clara coordinaci6n con la asistencia administrativa de la Facultad 0 la entidad que maneje la reglamentaci6n financiera del Estado, ademas debe permitir que para el usuario sea 10 mas sencillo y natural posible. • Contabilidad del evento. Debe estar acorde con el flujo de efectivo presentado al inicio de la propuesta. • Recursos fisicos: Actividad que impIica la consecuci6n de' elementos que tiene la Universidad y muchas yes se desconocen por los organizadores de los eventos. Por· ella se requiere destreza, habilidad y muchos contactos. • Memorias: Es una actividad obligatoria para los organizadores de un evento, pues de estas, muchas veces depende que los conferencistas internacionales asistan al evento. Deben cumplir ciertas normas en cuanto a su publicaci6n y registro. Las actividades empresariales que forman parte de la logistica, varian de empresa a erilpresa dependiendo de las caracteristicas como la estructura organizativa de cada una, las diferentes opiniones de los directivos 0 directores acerca de cada actividad deniro del ambito de las operaciones de la fmna. Para nuestro caso, se definieron las siguientes macro actividades con base en el proceso administrativo definido por H. Fayol [Fayol, 1961] desde los primeros anos de 1900, las cuales se convirtieron en la base fundamental de la construcci6n del CIIC-2001, recordando que si se desea realizar un evento similar, pueden tomarlas como base pero son susceptibles de cambiar, de acuerdo con 10 arriba expresado Actividades de Planeacion • Definici6n de misi6n, VISIOn y Objetivos (incluye el desdoble de la planeaci6n en politicas, directrices, metas, programas y reglas). Actividades de Organizacion • Definici6n . de las unidades de apoyo, las cuales incluyen la' conformaci6n . de los comites organizadores y los cientificos tanto nacional como internacional. Actividades de Direccion y Control • Establecimiento de los canales de comunicaci6n y los tipos de integraci6n de las unidades, en las que se incluyeron las reuniones y periocidades para las reuniones. Las Acciones Adicionalmente se incluyeron algunas actividades que se enrnarcan tambien dentro de este mismo proceso, tales como: • Integrar las actividades para lograr el objetivo del evento, fue quizas una de las tare as mas dificiles del CIIC-2001, debido al sin niImero de compromisos de cada responsable (con la academia, investigaci6n y extension), a la dificultad que representan muchas de las reglas en las universidades Estatales y a muchas personas que no son capaces de flexibilizar las reglas, de acuerdo al contexto en que hoy se vive. Presentacion ante las directivas Universitarias del proyecto (incluye flujo de fondos). I The Random House College Dictionary. New York. Random House. 1972 2 Aetas de la reuni6n anual en 1979 del National Council of Physical Distribution Management. 182 • De todas formas, se realizaron todos los esfuerzos para permitir que las acciones se materializaran e hicieran parte del exito de este evento. AIcance de la logistica. Segun la definici6n de logistica para el caso, esta reune todas las actividades que se repiten muchas veces a 10 largo del canal a traves del cual las materias primas se convierten en productos finales. Por 10 anterior, las materias primas del evento estan constituidas por las ponencias, los ponentes, las memorias, refrigerios, almuerzos, escarapelas, diplomas, silIas, entre otras y el canal, senin los dos grupos que se constituyeron alrededor del evento, la Direccion Academica, relacionada con todo 10 que tiene que ver con los expositores, conferencistas, conferencias, poster, y articulos; y la Direccion Administrativa, responsable de todas las actividades que tienen que ver con la infraestructura, financiaci6n y el personal auxiliar entre otros. Lo que se muestra entonces, es que debe haber una integracion entre estos dos tipos de actividades, las academicas y las administrativas, puesto que a pesar de ser diferentes, apuntan hacia el mismo objetivo. Las Fortalezas Para la Direcci6n Admirtistrativa del CIIC-2001, las principales fortalezas que tuvo el evento esta representado en las personas, su dinamismo, ahinco y esfuerzo, por ella es de destacarse: La respuesta de la Vicerrectoria de Sede a la Organizacion del evento, que demuestra que esta Dependencia siempre esta abierta a los proyectos que planteen una ventaja competitiva (segun el modelo Porteriano) con relacion a los demas. • La Ofieina de Comunicaciones de la Sede, la respuesta de algunos estudiantes de Ingenieria Industrial y Administrativa, los esfuerzos del Director General del CIIC 200 I, profesor Jesus Antonio Hernandez R. y su asistente Rosalicia Arnngo G., quienes sin lugar a dudas, son las personas a quienes debemos hoy su realizacion, puesto que fueron ellos quienes se convencieron de que su reto era alcanzar el exito del CIIC-2001 y a fe que 10 lograron. • La idoneidad, la capacidad de trabajo y la paciencia de los miembros del Comite Cientifico, para realizar la evaluaci6n del sinnumero de artlculos que se les entregaron para su valoracion. • La Disposicion de los conferencistas nacionales e internacionales para enriquecer este evento y que no dudaron en enviarnos sus articulos de quizas, muchos anos de labor investigativa. Asi mismo a aquellos investigadores, que nos enviaron sus articulos para evaluacion y que por alguna razon no calificaron para hacer parte de los • Las dificuItades. En la realizacion de todo evento se presentan dificultades, las cuales dependen de ciertas variables, que como se expreso anteriormente estan en funci6n de la naturaleza misma de la empresa que se desee emprender. Obviamente, este grado de dificultad, es directamente proporcional a la satisfaccion que se logra una vez se venzan todo tipo de obstaculos, alimentando la jerarquia de las necesidades a partir del tercer nivel segun Maslow [Chiavenato, 1996]. Entre las dificultades mas import antes que se presentaron durante los dias previos al inicio del CIIC-2001, fueron: • La Inversion en el CIIC-2001: Fue muy dificil convencer a la empresa privada para que se hiciera presente en el evento en cualquiera de las modalidades que se facilitaron para ello, tales como asistencia de empleados, publicidad en pendones, memorias, refrigerios, almuerzos, escarapelas, entre otros. Se sigue notando una aplicaci6n de los recursos empresariales hacia aquellas actividades que Ie garanticen un retorno inmediato de la inversion, dejando a un lado las actividades que Ie pudieran generar ingresos en el largo plazo utilizando la investigacion y la capacitaci6n. Es reflejo de la problematic a econ6mica que vive nuestro pais, por ella el CIIC-2001, no es la excepci6n. Conseguir el capital semilla: Es una da gran des dificultades que afrontan los grupos organizadores de este tipo de eventos, pues en su gran mayoria, las Facultades, Departamentos 0 Escuelas de las Universidades no cuentan con suficiente dinero para iniciar el desarrollo de las actividades. Para nuestro caso solo despues de un ano se logr6 conseguir los primeros recursos que permitieran elaborar el afiche y construir la pagina web con los temas relacionados con el CIlC-2001. ,183 pocos que tuvieron la opci6n de hacer parte de las conferencias y p6sters del evento. • La Universidad Nacional de Colombia, que hoy mas que nunca demuestra su importancia como eje central de 1a investigaci6n en la regi6n. Conclusiones ./ Las actividades especificas que hacen parte de la logistica de un evento son en su gran mayoria variables, por ello se deben presentar a modo de ejemplo, puesto que todo depende del ambiente y de las fuerzas externas que influyen en este . ./ Es muy importante para alcanzar el exito de un evento, realizar una buena integraci6n de las actividades que hacen parte de la logistica de este. Por 10 tanto deben considerarse los canales de comunicaci6n, las reuniones y controles peri6dicos como mecanismos para lograrlo . ./ El exito de la logistic a, est a en contar con personas dispuestas y comprometidas con e1 objetivo. La Universidad Naciona1 de Colombia, Sede Medellin ha demostrado poseer este recurso . ./ La consecuci6n de los recursos econ6micos, sigue siendo la principal dificultad que debe enfrentar el grupo organizador de un even to, por 10 tanto se requiere ofrecer servicios 0 productos altamente diferenciados. I I 1 r Bibliografia BALLOU, H. Ronald. Logistica Empresarial control y planificaci6n. Ediciones Diaz de Santos S.A. Madrid. 1991 CHIAVENATO, Idalberto. Introducci6n a la Teoria General de la Administraci6n. Mc Graw HilL Bogota. 2000 FAYOLo Henri. Administraci6n industrial y Gene.ral. Editorial Herrero Hermanos. Buenos Aires. 1961. HILL y JONES. Administraci6n Estrategica, un enfoque integrado. Mc Graw Hill. 1996. Mexico. 184

LA RED NEURONAL BACKPROPAGATION COMO INTERPOLADOR

Documentos relacionados

Productos

Apoyo

LA RED NEURONAL BACKPROPAGATION COMO INTERPOLADOR

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib