S.E.P. S.E.I.T. D.G.I.T. CENTRO NACIONAL DE INVESTIGACION Y DESARROLLO TECNOLOGICO cenidet IMPLEMENTACIÓN DE CONTROLADORES PARA SISTEMAS NO LINEALES USANDO REDES NEURONALES ARTIFICIALES E T I S PARA OBTENER S EL GRADO DE: MAESTRO E N CIENCIAS E N INGENIERÍA ELECTRONICA P E R S E N T A: ING. JUAN CARLOS ALARCÓN ROCHA DIRECTORES DE TESIS M.C. RAFAEL PARRAHERNÁNDEZ DR JAIME ÁLVAREZ GALLEGOS CUERNAVACA, MORELOS NOVIEMBRE 1999 CENTRO NACIONAL DE INVESfIGACIÓN Y DESARROLLO TECNOLÓGICO cerridet ACADEMIA DE LA MAESTRiA EN ELECTRÓNICA FORMA R11 ACEPTACION DEL TRABAJO DE TESIS Cuemavaca, Mor. Dr. Juan Manuel Ricaño Castillo Director del cerridet Presente Jefe del Depto. de Electrónica At’n. Dr. Jaime E. Arau Roffiel Después de haber revisado el trabajo de tesis titulado: “IMPLEMENTACIÓN DE CONTROLADORES PARA SISTEMAS NO LINEALES USANDO REDES NEURONALES ARTIFICIALES”, elaborado por el alumno Juan Carlos Alarcón Rocha, bajo la dirección del M.C. Rafael Parra Hernández y co-director Dr. Jaime Álvarez Gallegos, el trabajo presentado se ACEPTA para proceder a su impresión. ATENTAMENTE M.C. Carlos Daniel García Beltrán Dr. Luis Gerard0 Vela Valdés Expediente INTERIOR INTERNADO PALMIRA SIN. CUERNAVACA. MOR. MÉXICO AP 5-164 CP 62050, CUERNAVACA, TELS. (73112 2314.12 7613.18 7741. FAX 1731 12 2434 Dr. Jaime Arau Rolfielliefe del Depto de Eiectrónico EMAlL [email protected] cenidet Centro Nacional de Investigación y Desarrollo Tecnológico Cuernavaca, Morelos Ing. Juan Carlos Alarcón Rocha Candidato al grado de Maestro en Ciencias en Ingeniería Electrónica Presente Después de haber sometido a revisión su trabajo final de tesis titulado: “IMPLEMENTACIÓN DE CONTROLADORES PARA SISTEMAS NO LINEALES USANDO REDES NEURONALES ARTIFICIALES’, y habiendo cumplido con todas las indicaciones que el jurado revisor de tesis le hizo, le comunico que se le concede autorización para que proceda a la impresión de la misma. como requisito para la obtención del grado. Reciba un cordial saludo. I .-\ I C.C.P. expediente. INTERIOR INTERNADO PALMiRA S/N. CUERNAVACA. MOR. MCXICO AP 5-164 CP62050, CUERNAVACA, TELS. 1731122314, 127613. 187741. FAX 173) 122434 Or. Ja’ime Arau RoffielIJefe del Depto d e Electrónica EMAlL [email protected] cenidet A quienes debo la vida, quienes me formaron y me inculcaron los principios de superación sin importar condiciones Iimitantes... Quienes me enseñaron que las restricciones materiales son solo una ilusión cuando en verdad se desea alcanzar una meta... Por despertar en mi la inquietud de buscar nuevas metas... Que Dios los guarde I I Muy lejos donde brilla el sol, se encuentran mis más altas aspiraciones probablemente nunca las alcance; pero puedo alzar la vista, contemplar su belleza creer en ellas y tratar de seguir su rumbo... Dedicatoria A Dios por darme la vida Con todo mi amor a tres grandes mujeres Mi madre Maria de los Angeles, Mi abuelita Macaria, Mi tia Maria del Carmen. quienes me han dado toda su ternura, cariño, amor y han inculcado en mi el sentido de la responsabilidad. A mi abuelito Aurelio por todos sus consejos, que Dios lo tenga en su reino (t). A mi tío Manuel por su apoyo incondicional. Con todo respeto, a mi amigo Ricardo Valladolid (t). A mi hermano G. Iván por darme su apoyo, confianza, cariño y por todos los momentos que desde niños hemos compartido. Y a una persona muy especial, mi hermanito José Manuel, te amo pequeñito. A quien con su cariño me apoyo en todo momento. Nadira, te quiero. Agradecimientos A mi familia. gracias por su incondicional apoyo y cariño A mis asesores M.C. Rafael Parra Hernández y Dr. Jaime Álvarez Gallegos, por haber Compartido sus conocimientos y darme paciencia en momentos dificiles, además de su amistad. AI comité de revisión por sus comentarios y sugerencias para mejorar y enriquecer este tema de investigación: M.C Carlos Daniel Garcia Beltrán, M.C. Guadalupe Madrigal Espinosa y Dr. Luis Gerard0 Vela Valdés. A rnis maestros por su amistad y apoyo durante mi formación académica ' AI Dr. Rafael Castro Linares por sus comentarios para mejorar este trabajo de tesis. A la Lic. Margarita Martinez Leal, por su ayuda en la revisión de este trabajo. A rnis compañeros de la generación de los patos: Amin, Pedro, Beristain, Lalo, Ricardo, Javier, Freddy, Rubén y Jorge por todos los momentos que compartimos juntos. A rnis amigos Iván, Elias, Toño, Nacho, Victor, Jhonson, Mario, Ciro, Marco, Miguel y Morcillo por su apoyo incondicional. A la Sra. María Elena y al Dr. J.Arau por su apoyo en todo momento A mis amigas Esmeralda, Ari, Lucero, Liliana, Ale, Sofia, Gaby y Carla gracias por su amistad. A todo el personal administrativo y del área de electrónica de esta institución AI pueblo de México, que a través de CONACYT y SEP me permitió realizar rnis estudios. neuroidentificador ................................................................................ I 9 I <". 2.4 Identificación para el control de sistemas .................................................. f 't< 4 ~ I i . ,.. ..> ;.._! . . Capítulo'3 Análisis de ,sensibilidad y optimización sin ) I $*'. : 3- 2-23 '' ' * restricciones % ... ,. . 3.1 Analisis de sensibilldad ................................................................................ 5': 3-1 11 .... * . . . . 3.1.2 Análisis de sensibilidad para el modelo de regulación de'flujo...........3-7 I . 't .,. 3.2 Optimizacion ............................................... P................................................ 3-9 .. It .3.2.1 Funciones de una variable ....1.......................................................... 3-10 11 i ' ,I. . , b 3.2.2 Funciones de n variables .................................................................. 3-12 ? ii . ..... ...... d -/ Agradecimientos A mi familia, gracias por su incondicional apoyo y cariño. A mis asesores M.C. Rafael Parra Hernández y Dr. Jaime Áivarez Gallegos, por haber compartido sus conocimientos y darme paciencia en momentos difíciles, además de su amistad. AI comité de revisión por sus comentarios y sugerencias para mejorar y enriquecer este tema de investigación: M.C Carlos Daniel Garcia Beltrán, M.C. Guadalupe Madrigal Espinosa y Dr. Luis Gerard0 Vela Valdés. A mis maestros por su amistad y apoyo durante mi formación académica. ' AI Dr. Rafael Castro Linares por sus comentarios para mejorar este trabajo de tesis. A la Lic. Margarita Martinez Leal, por su ayuda en la revisión de este trabajo A mis compaiieros de la generación de los patos: Amin, Pedro, Beristain, Lalo, Ricardo, Javier, Freddy, Rubén y Jorge por todos los momentos que compartimos juntos. A mis amigos Iván, Elias, Toño, Nacho, Victor, Jhonson, Mario, Ciro, Marco, Miguel y Morcillo por su apoyo incondicional. A la Sra. Maria Elena y al Dr. J.Arau por su apoyo en todo momento A mis amigas Esmeralda, Ari, Lucero, Liliana, Ale, Sofía, Gaby y Carla gracias por su amistad. A todo el personal administrativo y del area de electrónica de esta institución ~ l ' ~de ~México, ~ bque l a~través de CONACYT y SEP me Permitió realizar mis estudios. TABLA DE CONTENIDO Tabla de contenido . . . . . . . .............. Lista de figuras ...................................... Lista de tablas ........................................ Introduccion.. ......................................... . I ............................ ...................................................... " ..................................................... ix .............................. ....................... x Capítulo 1 ,Redes neuronales artificiales .. 1.1 Introduccm ................................................................................................. 1.2 Descripción de una neurona biológica ......................................................... 1.3 Redes neuronales artificiales ................................................................. 1.3.1 Arquitectura .............. 1-1 1-4 ..................................................... 1-5 1.3.2 Conexiones......................................................................................... 1-7 1.3.3 Aprendizaje ..<.. .......................................... .................. 1-8 1.4 Clasificación............................. ...............:...... ..................1-8 1.5 Las redes neuronales artificiales como elementos de control ...................... 1-9 1.5.1 Esquema de control indirecto usando redes neuronales artificiales. 1-10 ......................... 1.6 Algoritmos de entrenamiento. ..................... Capítulo 2 Identificación de sistemas dinámicos usando redes neuronales artificiales ., 2.1 Conceptos básicos y notacion ..................................................................... 2.2 Identificación de sistemas estáticos y dinámicos ......................................... 2.2.1 Representación de sistemas .............................................................. 2-1 2-2 2-2 2.2.2Identificaci6n~. ....................................................................................... . r , s ,. . ' 2 " i ,>*~, , ':2:2.3Esquemas ge identific i6n .....;..............:........................................... 2-4 2.3.1 lntercambiador de calor RCT 100............................................................. 2-7 ~ : 2-6 ~ 2.3 Casos de aplicacibn..................................................................................... 2-7 2.3.1.I Identificación del sistema con un neuroidentificador empleando el algoritmo OLL ................................................................ 2.3.1.2Pruebas de. .generalizaci6n del modelo obtenido con el neuroidentificador .............................................................................. 2.3.2CEllO Servo Trainer ..... ...................................................................... 2.3.2.1Identificación del sistema con un neuroidentificador empleando el algoritmo OLL ............................................................... 2.3.2.2Pruebas de generalización del modelo obtenido con el * 2-15 >. 2.3.3 de flujo ................................................................. . . ' ~Módulo.de regulación ," . . empleando el algoritmo OLL ................................................................ < 2-20 neuroidentificador ................................................................................ 2-21 ,. - i ' 2-1O 2-13 2-17 2-19 neuroidentificador .............................................................................. . 2-8 I. I .. %, 8, 2.3':3.1Identificación del sistema con un neuroidentificador ~ 2.3.2.2Pruebas de . .generalización del modelo obtenido con el 2.4 Identificación Para el control de sistemas .................................................. ' Capítulo 2-23 3 Análisis de sensibilidad y optimización sin restricciones .. - , . de sensibilidad ................................................................................ 3-1 3.1 Analisis 3.1.1Análisis de sensibilidad para el modelo del CEI 10.Servo Trainer......3-4 3.1.2Análisis de sensibilidad para el modelo de regulación de flujo ...........3-7 3.2 Optimización ................................................................................................ 3-9 . . ~1 : . ' . , , . 3.2.1'Funciones de una variable ................................................................. 3-10 , < - . I 3.2.2Funciones de n variables.................................................................. , . ii 3-12 Capítulo 4 Programación cuadrática secuencial y. su aplicación en las redes neuronales artificiale s 4.1 Optimización no lineal con restricciones ...................................................... 4-1 4.2 Condiciones necesarias y suficientes para un mínimo local ........................ 4-2 4.3 Programación cuadratica secuencial (SQP) ................................................ 4-3 4.4 Identificación del CE110 Servo Trainer empleando el algoritmo SQP .........4-3 4.4.1 Pruebas de generalización del modelo obtenido con el neuroidentificador ................................................................................... 4-6 4.5 Identificación del módulo de regulación de flujo empleando el algoritmo SQP .............................................................................................................. . I 4.5.1 Pruebas de generalización del modelo obtenido con el neuroidentificador .................................................................................. Ca&ulo 5 Resultados I 4-7 4-10 5.1 Implementación del esquema de control indirecto ....................................... 5.2 Control del CE110 Servo Trainer ................................................................. 5-1 5-5 5.2.1 Regulación y seguimiento sin perturbación ........................................ 5-5 5.2.2 Estrategia de control para rechazo a perturbaciones ......................... 5-6 5.2.3 Regulación con perturbación.............................................................. 5-7 5.2.4 Regulación y seguimiento de una trayectoria con una no linealidad en la seiíal de control y sin perturbación ............................................ 5-8 5.2.5 Regulación con una no linealidad en la señal de control sin perturbación y en presencia de perturbación...................................................................... 5-9 5.3 Control del módulo de regulación de flujo .................................................. 5-10 5.3.1 Seguimiento sin perturbación................................................................. 5-10 5.3.2 Regulación con perturbación ............................................................ 5-11 iii Capítulo .. '6 Gkclusiones 1 , . . .y, .......... .................... 6.1 Resultados'obte 6.2 Trabajos futuros .:................... ..................................................... ? héndice A I ,A.I Ejemplo de optimización de los parametros de una red neuronal artificial empleando SQP ......................................................................... A-? héndice B I B . l Programa de comunicación ........................................................................ B-I B.l .IConexión cliente-servidor .................................................................. B-2 B.l .2 Conexión servidor-cliente .................................................................. 8-2 B.2 Programa general de RNA ......................................................................... B-3 héndice C I C.1 Metodología propuesta para identificar una planta SISO usando redes neuronales artificiales ............................ :.................................................. C-I Referencias ......................... :I.............................................................................. Bibliografía ........................................................................................................... iv R-I S-1 LISTADE FIGURAS Figura 1.1 Esquema de control directo adaptable con modelo de referencia ......1-3 Figura 1.2 Esquema de control indirecto adaptable con .modelo de referencia ... 1-3 Figura 1.3 Diagrama esquemático de una neurona biológica .............................. 1-4 Figura 1.4 Modelo básico de una neurona........................................................... 1-6 Figura 1.5 Configuraciones de las redes neuronales artificiales .......................... 1-9 Figura 1.6 Esquema de control indirecto usando RNA ...................................... 1-10 Figura 1.7 Red neuronal recurrente simple ...........;............................................ 1-12 Figura 2.1 Sistema visto como una caja negra .................................................... 2-4 Figura 2.2 Esquema de una red neuronal........................................................... 2-5 Figura 2.3 Esquema de identificación serie-paralelo ........................................... 2-6 Figura 2.4 Esquema de identificación en paralelo ............................................... 2-6 Figura 2.5 Esquema del intercambiador de calor RCT 100 de DIDATEC TECHNOLOGIE .................................................................................. 2-8 Figura 2.6 Patrones de entrenamiento tomados del intercambiador de calor RCT 100, las muestran fueron tomadas cada 10 segundos ...............2-8 Figura 2.7 Esquema serie paralelo para la identificación de la planta RCT 100 ................................................................................................... 2-9 Figura 2.8 Respuesta del intercambiador de calor RCT 100 y del modelo, las muestran fueron tomadas cada 10 segundos................................... 2-10 Figura 2.9 Doscientos sesenta y siete datos extraidos de la respuesta de intercambiador de calor RCT 100 ante rampas para pruebas de generalización de la RNA, cada muestra fue tomada por intervalos de 10 segundos ................................................................................ 2-11 Figura 2.10 Salida de la planta y salida del modelo (entrenado con el algoritmo OLL) para los datos de entrada de la figura 2.9. ...............2-12 V Figura 2.1 1 Trescientos datos extraídos del intercambiador de calor RCT 100 para pruebas de generalizacit~n del modelo obtenido con el neuroidentificador, cada muestra fue tomada por intervalos de I O segundos. ......................................................................................... 2-12 Figura 2.12 Respuesta del modelo obtenido con el neuroidentificador para los datos de la figura 2.1 I. .............................................................. 2-13 Figura 2.13 CEI 10 Servo Trainer ...................................................................... 2-14 Figura 2.14 Esquema paralelo para la identificación de la planta CEI 10 Servo Trainer.................................................................................. 2-15 Figura 2.15 Patrones de entrenamiento tomados del CEI 10 Servo Trainer, el tiempo de muestreo fue de 0.4 segundos. ................................... 2-16 Figura 2.16 Respuesta del CEllO Servo Trainer y del modelo obtenido con la RNA, el tiempo de rnuestreo fue de 0.4 segundos. ........................ 2-16 Figura 2.17 Señal senoidal para evaluar el modelo del C E l l O Servo Trainer y respuesta del mismo, el tiempo de muestreo fue de 0.4 segundos. .2-17 Figura 2.18 Respuesta del CEI 10 Servo Trainer y del modelo obtenido con la RNA, el tiempo de muestreo fue de 0.4 segundos. ....................... 2-17 Figura 2.19 Ciento cinco datos obtenidos del CEllO Servo Trainer para pruebas de generalización de la RNA, cada muestra fue tomada por intervalos de 0.4 seg................................................................... 2-18 Figura 2.20 Respuesta del CEI 10 Servo Trainer y del modelo obtenido con la RNA, el tiempo de muestreo fue de 0.4 segundos....................... 2-18 Figura 2.21 Módulo de regulación de flujo ......................................................... 2-19 Figura 2.22 Esquema paralelo para la identificación del módulo de regulación de flujo.............................................................................................. 2-20 Figura 2.23 Patrones de entrenamiento tomados del módulo de regulación de flujo, el tiempo de muestreo fue de 0.4 segundos....................... 2-20 Figura 2.24 Respuesta del módulo de regulación de flujo y del modelo obtenido con la RNA, el tiempo de muestreo fue de 0.4 segundos.......................................................................................... 2-21 Figura 2.25 Ciento cinco datos obtenidos del módulo de regulación de flujo para pruebas de generalización de la RNA, cada muestra fue 2-22 tomada por intervalos de 0.4 seg Figura 2.26 Respuesta del módulo de regulación de flujo y del modelo obtenido con la RNA, el tiempo de rnuestreo fue de 0.4 segundos. 2-22 Figura 2.27 Esquema de control indirecto ....................................................... Figura 3.1 Gráfica del error cuadrático medio ...................................................... vi 2-23 3-2 Figura 3.2 Estructura del neuroidentificador empleado para la identificación 3-5 de CE110 Servo Trainer usando OLL ................................................. Figura 3.3 Respuesta del modelo obtenido con RNA para el C E l l O Servo Trainer para una señal que contiene datos con los que no se entrenó la RNA................................................................................................. 3-6 Figura 3.4 Respuesta del modelo obtenido con RNA para el módulo de regulación de flujo para una señal que contiene datos con los que no se entrenó la RNA ............................................................................... 3-8 Figura 3.5 Aproximación de dos puntos con una RNA ........................................ 3-9 Figura 3.6 Representación de una función de una variable ............................... 3-10 Figura 4.1 Esquema paralelo para la identificación de la planta CEI 10 Servo Trainer .............................................................. :.................................. 4-4 Figura 4.2 Estructura del neuroidentificador empleado para la identificación de CEI 10 Servo Trainer usando SQP ................................................ 4-4 Figura 4.3 Patrones de entrenamiento tomados del CEIIO Servo Trainer, el tiempo de muestreo fue de 0.4 segundos. .......................................... 4-5 Figura 4.4 Respuesta del CEllO Servo Trainer y del modelo obtenido con la RNA, el tiempo de rnuestreo fue de 0.4 segundos .............................. 4-6 Figura 4.5 Señal senoidal para evaluar el modelo del CEI 10 Servo Trainer, el tiempo de muestreo fue de 0.4 segundos. ...................................... 4-6 Figura 4.6 Respuesta del CEI 10 Servo Trainer y del modelo obtenido con la RNA, el tiempo de muestreo fue de 0.4 segundos .............................. 4-7 Figura 4.7 Esquema paralelo para la identificación de la planta módulo de regulacion de flujo ............................................................................... 4-8 . I Figura 4.8 Patrones de entrenamiento tomados del módulo de regulación de flujo, el tiempo de muestreo fue de 0.4 segundos............................... 4-9 Figura 4.9 Respuesta del módulo de regulación de flujo y del modelo obtenido con la RNA, el tiempo de rnuestreo fue de 0.4 segundos. ...4-9 Figura 4.10 Señal senoidal para evaluar el modelo del módulo de regulacióri de flujo, el tiempo de rnuestreo fue de 0.4 segundos........................ 4-10 Figura 4.11 Respuesta del módulo de regulación de flujo y del modelo obtenido con la RNA, el tiempo de muestreo fue de 0.4 segundos. .4-11 Figura 5.1 Esquema de control indirecto basado en redes neuronales ... artificiales ............................................................................................. 5-1 Figura 5.2 lnterfaz gráfica .................................................................................... 5-3 vii Figura 5.3 Implementación del esquema de control indirecto con la ayuda de computadoras personales .......:................................ ;.......................... 5-4 Figura 5.4 Gráfica de la respuesta del Servo Trainer en .-seguimiento y regulación sin perturbación ..................................... : .......................... 5-6 Figura 5.5 Estrategia de control en regulación con perturbación ......................... 5-7 Figura 5.6 Regulación sinkon carga para el CEI 10 Servo Trainer ...................:.5-7 Figura 5.7 Señal de control con histéresis y offset aplicada al CEI 1O Servo Trainer y su respuesta ........................................................................ 5-8 Figura 5.8 Respuesta del sistema en regulación y seguimiento de una trayectoria, sin'carga y en presencia de una no linealidad en la' señal de control................................................................................... 5-9 Figura 5.9 Respuesta del sistema a) en presencia de una no linealidad en la señal de control para parámetros del neuroidentificador desconocidos; b) perturbación en el sistema ............................. ......5-10 ,. ~ Figura 5.1 O Respuesta del seguimiento de un flujo deseado sin perturbación ..5-1 1 Figura 5.1 1 Regulación sinlcon perturbación en la válvula ................................ 5-1 1 Figura A.l Estructura de una red neuronal artificial ............................................ A-I viii LISTADE TABLAS Tabla 3.1 Parámetros del neuroidentificador usado para copiar la dinámica del CEI 10 Servo Trainer usando OLL ........................................................ 3-5 Tabla 3.2 Parámetros del neuroidentificador usado para copiar la dinámica del módulo de regulación de flujo usando OLL.......................................... 3-7 Tabla 4.1 Parámetros de la RNA entrenada con SQP para identificar el CEI 10 Servo Trainer ......................................................................................... 4-4 Tabla 4.2 Parámetros de la RNA entrenada con SQP para identificar el módulo ., de regulacion de Rujo.......................................................................... 4-8 Tabla A.l Patrones de entrenamiento para una RNA ........................................... Tabla A.2 Valor de los parámetros de la RNA optimizada .................................. A-2 A-6 ix ' Antecedentes El control clásico ha solucionado de manera eficiente la mayoría de los problemas de control que se han presentado. Sin embargo, debido a que se basa en la teoría de los sistemas lineales, se requiere que el sistema.a controlar sea lineal o que tenga un comportamiento lineal en la región de operación. El problema de control de sistemas no lineales es muy complejo y en algunas aplicaciones presenta una gran cantidad de procedimientos heuristicos. El método clásico de linealización de sistemas no lineales se realiza de manera local, es decir en diversos puntos de operación del sistema para el cual se obtienen modelos lineales. Este procedimiento tiene la desventaja de que habrá de diseñar un controlador lineal para cada modelo obtenido en cada punto de trabajo. Además, al pasar de un modelo lineal al siguiente, no existen garantías de que el control funcione correctamente, ya que aparecen fenómenos no lineales de mayor complejidad [I]. Más recientemente se ha utilizado una metodología que produce una linealización global y exacta del sistema no lineal original a través de una transformación de variables y una retroalimentación de estados [2]. Este último método se restringe a determinados sistemas, pero cubre casos muy prácticos como los robots manipuladores. Entre otras técnicas para el análisis y diseño de controladores para sistemas no lineales se pueden mencionar: 1) técnicas de control geométrico basado en la geometría diferencial. 2) control predictivo. 3) control adaptable con conocimiento parcial del modelo matemático de la planta y 4) control basado en el teorema de Lyapunov. desafortunadamente en todos estos análisis se requiere conocer el modelo matemático de la planta o al menos tener un conocimiento parcial del mismo. Se han propuesto numerosas técnicas de control adaptable [3] para reemplazar los métodos de control clásico; la habilidad de adaptarse a las variaciones de las dinámicas de la planta ha hecho que la importancia de los controladores adaptables se incremente en muchas aplicaciones. Sin embargo, antes de ser implementados tiene que establecerse el modelo matemático de la planta que muchas veces es difícil y laborioso. Si agregamos a esto el error de modelado de la planta ello nos lleva a una degradación en el desempeño de los controladores. . Por otro lado, el reciente surgimiento del paradigma de las redes neuronales artificiales como una poderosa herramienta de aprendizaje, ha atraído el interés de los investigadores en diferentes áreas. Se ha mostrado que las RNA presentan un buen desempeño en la identificación y el control de sistemas, independientemente de las no linealidades que presente. Usando estructuras de control basadas en la obtención de modelos numéricos es Dosible, en teoría, realizar el control de cualquier sistema no lineal sin requerir de un modelo matemático a priori [4]. Una búsqueda computacional [5] mostró que durante 1990-1995 fueron publicados, en el área de ingeniería, 9955 artículos con títulos conteniendo las palabras "redes neuronales artificiales". De estos artículos, 8000 trataban sobre aproximación de funciones y reconocimiento de patrones, es decir sistemas estáticos; 1955 artículos estaban relacionados con el control de sistemas usando redes neuronales, de estos últimos sólo 355 artículos fueron ubicados en el área de aplicaciones. De estos, 45% estaban relacionados con aspectos teóricos, aproximadamente el 28% eran estudios de simulación, 23% estaban relacionados con experimentos de laboratorio y un 4% (14 artículos) estaban relacionados con aplicaciones reales. Las estadísticas también revelan que el área de interés de aplicación de las redes neuronales artificiales son los sistemas estáticos, particularmente el reconocimiento de patrones y además, que las aplicaciones prácticas no han tenido un papel importante. Lo anterior se debe sin duda a la complejidad en el diseño, síntesis e implernentaciones suficientemente rápidas de controladores basados en redes neuronales artificiales aplicados a sistemas no lineales reales. Objetivo El objetivo de este trabajo de tesis es el sigue/nte: Desarrollar, implemenfar y evaluar controladores de alto desempetio, basados en redes neurona/es artificiales, aplicados a sistemas no lineales. xi Propuesta Una propuesta interesante para el desarrollo e implementación de controladores para sistemas no lineales es el uso de redes neuronales para la obtención de modelos numéricos adaptabies. Se pretende implementar el esquema de control , . indirecto basado en redes neuronales artificiales. I Los aspectos relevantes a evaluar del controlador basado en redes neuronales serán: Desempeño del esquema de control en la regulación aplicado a dos prototipos de laboratorio. Desempeño del esquema de control en el seguimiento de trayectorias predefinidas. Robustez práctica del sistema ante perturbaciones tales como: error en el conocimiento de los valores de los parámetros del modelo y variación de los valores de los parámetros. Alcances A través del presente proyecto de investigación se pretende: + + t Desarrollar controladores, de alto desempeño basados en redes neuronales artificiales, aplicados a sistemas no lineales. lmplementar prácticamente el esquema de control indirecto basado en redes neuronales artificiales. Evaluar el desempeño del controlador en regulación, seguimiento y robustez. Organización de la tesis En el CAPiTULO 1 se expone la problemática del modelado de sistemas dinámicos usando técnicas de control convencional y técnicas de control moderno; también se proponen las redes neuronales artificiales corno una alternativa para la identificación y el control de sistemas no lineales. En el CAPITULO 2 se presenta la identificación de sistemas dinámicos y se aplican las redes neuronales artificiales a la identificación de dos prototipos de laboratorio. En el CAPITULO 3 se realiza un análisis de sensibilidad del identificador basado en redes neuronales artificiales (neuroidentificador) y se expone la optimización sin restricciones. En el CAPiTULO 4 se expone el método de estimación paramétrica con restricciones, en particular el método de programación cuadrática secuencia1 (SQP). El CAPITULO 5 corresponde a las pruebas y análisis de resultados de la evaluación del esquema de control indirecto implementado en dos prototipos de laboratorio. En el APÉNDICE A se presenta un ejemplo de la implementación del algoritmo SQP en la estimación paramétrica de una red neuronal artificial. En el APÉNDICE B se explica como trabaja el programa de comunicación entre dos computadoras personales, empleando la plataforma de Labwindows. xiii Capítulo 1 Redes neuronales artificiales 1.Iintroducción El primer paso en el estudio de un sistema físico es derivar las ecuaciones matemáticas que lo describen. Esta descripción que deberá ser conveniente computacionalmente y, al mismo tiempo deberá ser una representación adecuada del sistema, es conocida como el modelo matemático. Si sólo interesa el comportamiento final del sistema, una descripción entradasalida o una función de transferencia será adecuada para representarlo. Si, por el contrario, interesa el comportamiento interno del sistema, entonces será útil una descripción en el espacio de estados. Un modelo es una representación aproximada de un sistema físico; se usa para organizar y/o reducir esfuerzos computacionales requeridos en el análisis y diseño de sistemas. Desarrollar un modelo adecuado para un sistema físico complejo es una tarea importante y difícil que requiere la habilidad para determinar cuáles variables físicas o relaciones son importantes para la precisión del modelo y cuáles pueden ser despreciadas. Esto implica que el sistema físico pueda tener varios modelos dependiendo de la cuestión de interés. Capitulo 1. Redes neuronales artificiales Una representación matemática de un sistema fisico se obtiene describiendo matemáticamente la cantidad de diferentes interacciones en los componentes del sistema. Esto se logra aplicando las leyes flsicas que gobiernan tales interacciones de los modelos del sistema. Pero ¿por qué se necesita un modelo matemático para describir un proceso? El objetivo es desarrollar un sistema de control, el cual garantice que los objetivos de operación del sistema sean satisfechos en presencia de ciertas perturbación. El modelo matemático del sistema ayuda en la simulación ya que existen casos en los cuales resulta demasiado costosa o peligrosa la experimentación directa con el sistema; también ayuda para el entrenamiento de personal, y con base en él es posible encontrar una ley de control de tal forma que la salida de la planta siga a una referencia deseada (e.g. en los esquemas de control adaptable). I La teoria de control trata sobre el análisis y sintesis de sistemas dinámicos, en los cuales una o más variables son preestablecidas dentro de ciertos límites. Si las funciones que representan al sistema (modelo matemático), tanto en los estados como en la salida, son conocidas, el problema de control es diseñar un controlador, el cual genere la entrada de control. uconc(k),deseada, basada en toda la información disponible en un instante k. Mientras una amplia variedad de técnicas en el dominio del tiempo y de la frecuencia existen para la síntesis y diseño de controladores para los sistemas lineales, no existen métodos similares para los sistemas no lineales. En las Últimas tres décadas ha existido un gran interés en el control de sistemas en los cuales están presentes las incertidumbres de sus dinámicas. Para asegurar un tratamiento matemático adecuado, la mayoría de los esfuerzos han sido encaminados al control adaptable de plantas lineales invariantes en el tiempo con parámetros desconocidos. Sin embargo, el interés de este trabajo de tesis va enfocado al control de sistemas dinámicos no lineales cuyo modelo matemático no es conocido. I” LOS esquemas de control basados en los sistemas adaptables hacen explícito el uso de modelos para el control, es por ello que han sido estudiados ampliamente. Uno de los sistemas de control adaptable es el sistema de control adaptable con modelo de referencia (MRAC). En la teorla convencional del control adaptable se distinguen dos etapas en el proceso de adaptación al emplear un MRAC para el control de una planta. La primera se denomina parte algebraica, que busca demostrar que el controlador tiene la capacidad suficiente para lograr el objetivo deseado. Es decir, si se conoce alguna información a priori de la planta, se demuestra que el vector de parámetros del controlador, O*, existe para cualquier valor del vector de parámetros, p , de la planta, tal que la salida de la planta controlada junto con el controlador se aproxime asintóticamente a la salida del modelo de referencia. La 1-2 Capítulo 1. Redes neuronales artificiales = segunda etapa es la parte analítica del problema, que consiste en determinar leyes adaptables estables, para ajustar e(k) tal que Iim B(k) = 8* y asegurar que el 3: k-r- error de salida tienda a cero. Y,&) Modelo de referencia : error I Con olador Planta .-fYpla"(t) J Modelo de referencia I / I Y-U) V t+ Co rolador ir I I Figura 1.2 Esquema de control indirecto adaptable con modelo de referencia El problema de control de sistemas no lineales es muy complejo y en algunas aplicaciones presenta una gran cantidad de procedimientos heurícticos. El método 1-3 Capíiiilo 1. Redes iteiiri~i~alc.s ariijicialcs clásico de linealización de sistemas no lineales se realiza de manera local, es decir, en diversos puntos de operacibn del sistema para el cual se obtienen modelos lineales. Este procedimiento tiene la desventaja de que habrá que diseñar un controlador lineal para cada modelo obtenido en cada punto de trabajo. Además, al pasar de un modelo lineal al siguiente, no existen garantías de que el control funcione correctamente, ya que aparecen fenómenos no lineales de mayor complejidad [6,7]. "Para superar estas dificultades, el uso de las redes neuronales artificiales (RNA), en control, se ha incrementado de forma significativa en los últimos años. Su gran habilidad de aprendizaje, ayuda a que el diseño del controlador sea más flexible, especialmente cuando la planta presenta dinámicas complejas y altamente no lineales, según afirma Nguyen y Widrow. Esta es una ventaja distintiva sobre las técnicas de diseño de controladores usando la teoría de control clásico" [8]. 1.2 Descripción de una neurona biológica "Una neurona es una célula viva y, como tal, contiene los mismos elementos que forman parte de todas las células biológicas. Además, contienen elementos característicos que las diferencian. En general, una neurona consta de un cuerpo esférico, de 5 a 10 micras de diámetro, del que salen una rama principal, el axón, y varias ramas más cortas, llamadas dendritas (ver figura 1.3). A su vez, el axón puede producir ramas en torno a su punto de arranque, y con frecuencia se ramifica extensamente cerca de su extremo" [9,10]. Una de las características que diferencian a las neuronas del resto de las células vivas, es su capacidad de comunicarse. En términos generales, las dendritas y el cuerpo celular reciben señales de entrada; el cuerpo celular las combina e integra 1-4 - Capitulo I . Redes neuronales artificiales y emite señales de salida. El axón transporta esas señales a las terminales axónicos, que se encargan de distribuir información a un nuevo conjunto de neuronas. Por lo general, una neurona recibe información de miles de otras neuronas y. a su vez, envia información a miles de neuronas más. Se calcula que en el cerebro humano existen del orden de I O l 5 conexiones [I1,121. La señal generada por la neurona y transportada a lo largo del axón es un impulso .eléctrico, mientras que la señal que se transmite entre los terminales axónicos de una neurona y las dendritas de las neuronas siguientes es de origen quimico; concretamente, se realiza mediante moléculas de sustancias transmisoras (neurotransmisores) que fluyen a través de unos contactos especiales, llamados sinapsis, que tienen la función de receptor y están localizados entre los terminales axónicos y las dendritas de la neurona siguiente [13]. ' Para establecer una similitud directa entre la actividad sináptica y la analogía con las redes neuronales artificiales, vamos a fijar los siguientes aspectos: las señales que llegan a la sinapsis son las entradas a la neurona; éstas son ponderadas (atenuadas o amplificadas) a través de un parámetro denominado peso, asociado a la sinapsis correspondiente. Estas señales de entrada pueden excitar a la neurona (sinapsis con peso positivo) o inhibirla (peso negativo). El efecto es la suma de las entradas ponderadas. Si la suma es igual o mayor que el umbral de la neurona, entonces la neurona se activa (proporciona salida). Esta es una situación todo o nada; cada neurona se activa o se desactiva [14]. 1.3 Redes neuronales artificiales I.3.1 Arquitectura La arquitectura de las RNA está definida por elementos básicos de procesamiento y por la forma en que están interconectados. El elemento básico de procesamiento es la neurona, llamada asi por su analogía con las neuronas biológicas, aunque también es llamada perceptrón (Rosenblati( 1958)) o adaline (Widrow y Hoff (1960)). La mayoría de los elementos básicos de procesamiento está formada por dos componentes (ver figura 1.4) [15,16]: 1) un sumador ponderado, 2) una función de activación. Capitulo I . Redes neuronales artificiales a Función no lineal r' Yi Figura 1.4 Modelo bdsico de una neurona Sumador ponderado El sumador ponderado está descrito por: N ... II xi(t) = za,yj(t) i=1 + z b j k u k ( f +) w j k=l esto da una suma ponderada xi en términos de las salidas de todos los elementos fi ={yi,...,y,& entradas externas uk={u&..unz) y los pesos correspondientes au y bik junto con una constante wi llamada umbral. N de estos sumadores ponderados pueden ser convenientemente expresados en una forma matricial, dada por: x(t) = A y ( t ) + Bü(f) + w donde: (14 A es una matriz de N x N elementos a, B es una matriz de N x M elementos bik w es un vector de N elementos wi y es un vector de N elementos yi Función de activación La función de activación puede ser una simple función lineal o de cualquier otro tipo, por ejemplo una función no lineal tal que g ( . ) proporciona el elemento de salida yi en términos de la salida del sumador ponderado x i [ 1 7 ] , es decir: Y, = dx;) (1.3) La RNA que se utilizará en el desarrollo de este trabajo de tesis se empleará en la neurona de la capa de salida una función de activación lineal y en las neuronas de la capa intermedia una función de activación sigmoidal. La función sigmoidal ha sido empleada en el campo de las redes neuronales artificiales debido a que Cybenko demostró que las RNA con este tipo de función son capaces de 1-6 - Capitulo 1. Redes neuronales artijíciales representar funciones continuas [I 81. Esta función está descrita matemáticamente por: I.3.2Conexiones 1 Las neuronas por si solas no son poderosas en términos de computación o representación, pero el paralelismo de sus interconexiones permiten establecer relaciones entre variables obteniendo grandes capacidades de procesamiento. Se tiene una hipótesis sobre la noción de memoria en las redes biológicas para hacer conexiones sinápticas. Basados en esta hipótesis, los valores o pesos de las conexiones (sinapsis), determinan la “memoria” o “conocimiento” de la red neuronal [19,20]. Algunas de las neuronas en una RNA son llamadas neuronas de entrada y otras de salida, estos dos conjuntos proveen un medio a la red para comunicarse con el mundo exterior. El resto de las neuronas de la red que no entran en estos conjuntos son llamadas neuronas ocultas. En general, las neuronas de entrada pueden conectarse a las neuronas de salida o a las neuronas ocultas, las neuronas pueden conectarse mutuamente a otras neuronas y también pueden conectarse a sí mismas. AI conjunto de neuronas ya sean de entrada, salida u ocultas se le llama capa. Partiendo de este tipo de organización, a través de capas, se distinguen dos sistemas de interconexión de las neuronas: I.Conexiones dentro de capa. Son conexiones entre las neuronas de una misma capa. 2. Conexiones entre capas. Son conexiones entre neuronas de diferentes capas. Las conexiones entre capas permiten que la señal de entrada a la red neuronal pueda fluir a través de ésta en dos formas diferentes dependiendo del tipo de red: i) Flujo en una sola dirección. La señal de entrada a la red sólo fluye en una sola dirección desde las neuronas de entrada hasta las neuronas de salida. ii) Flujo con retroalimentación. En este caso la red tiene una estructura de retroalimentación debido a que las salidas de las neuronas de una capa están conectadas a las entradas de las neuronas de una capa anterior (por ejemplo capa de salida - capa de entrada) [21]. 1-7 1.3.3 Aprendizaje La mayoria de las redes neuronales son sometidas a un procedimiento de "aprendizaje" durante el cual se determinan los valores adecuados de los pesos y umbrales, con el fin de que la RNA logre aprender un comportamiento deseado; para este procedimiento de aprendizaje se requiere el empleo de métodos de estimación de parámetros.. El aprendizaje puede ser supervisado o no supervisado. En el aprendizaje supervisado se le muestra a la RNA la respuesta demandada de ella ante una entrada particular. A través de métodos para minimizar el error entre la salida de la RNA y la salida deseada, se supervisa el aprendizaje. En el aprendizaje no supervisado no se le proporciona a la red la respuesta deseada. La RNA con base en la información o características de los patrones de entrada los acomoda por grupos o secciones [22,23]. 1.4 Clasificación Las RNA pueden clasificarse en dos grupos: el de las RNA no recurrentes (RNANR), mejor conocidas como RNA feedforward, y el de las RNA recurrentes (RNAR). "Las RNANR no tienen capacidad de memoria, su salida está determinada, únicamente, por las entradas actuales y los valores de los pesos, por lo que su entrenamiento se realiza a través de un mapeo estático"[24,25]. "Lac RNAR se denominan así,. por poseer conexiones de retroalimentación, ya sea: entre las neuronas de la capa de salida y las de la capa de entrada, entre las neuronas de la misma capa o entre neuronas de diferentes capas. La existencia de retroalimentación origina que la salida de la RNA se encuentre determinada por las entradas actuales y las entradas previas, teniendo importantes capacidades, tales como la de almacenar información o la de memoria"[26,27] (ver figura 1.5). b) Red neuronal recurrente Figura 1.5 Configuraciones de /as redes neuronales artificiales 1.5 Las redes neuronales artificiales como elementos de control La gran diversidad de sistemas no lineales es la primera razón del por qué no se sistematiza y generaliza la teoría para el diseño de controladores no lineales. Existe un rango de métodos tradicionales en el análisis y síntesis de controladores no lineales, para clases específicas de sistemas no lineales, como por ejemplo: métodos de plano fase, técnicas de linealización y funciones descriptivas [28]. "En aplicaciones prácticas, resulta difícil expresar las dinámicas reales de la planta en ecuaciones matemáticas. Si se agrega a esto las aproximaciones que se realizan en el modelado, el desempeño del controlador, que se diseña con base en el modelo, es deficiente. Los esquemas de control adaptable pueden ajustar al controlador de acuerdo a las características del proceso, previendo un alto nivel de desempeño" [29]. "El control adaptable presenta algunas desventajas. Por ejemplo. existen algoritmos adaptables que trabajan para problemas específicos y no trabajan para un amplio rango de problemas, de tal forma que cada aplicación tiene que ser analizada individualmente. Tales algoritmos utilizan algún conocimiento acerca del proceso para una correcta selección de la identificación del modelo" [30]. En los Últimos años, las RNA han atraído el interés de los investigadores en diferentes áreas, por su capacidad de modelar sistemas no lineales y porque presentan como características principales la capacidad de aprendizaje, procesamiento en paralelo, toma de decisiones, capacidad de generalización y tolerancia a fallas [31,32,33]. 1-9 Capíiulo I . Redes neuronales ani‘ciales 1S.1 Esquema de control indirecto usando redes neuronales artificiales Existen muchas situaciones donde una persona provee en un control la acción de retroalimentación para una tarea particular, donde resulta difícil el diseñar un controlador automático empleando las técnicas convencionales de la teoría de control. Sin embargo, actualmente es deseable diseñar un controlador automático que minimice la acción del ser humano, esto ha sido llamado control supervisado WI. El esquema de control indirecto es un esquema de control supervisado. En este esquema de control, el controlador es usualmente conectado en serie con la planta que será controlada. Sin embargo, para el diseño de tal controlador es necesario conocer el modelo de la planta, que puede obtenerse a través de algún método de identificación. ‘ Es posible emplear una RNA para el control e identificación de una planta en el esquema de control indirecto, en el cual los parámetros de ajuste de la red neuronal artificial del controlador (neurocontrolador) necesitan actualizarse usando el error que está determinado por la diferencia entre la salida de la planta y la referencia deseada. Debido a que el neurocontrolador está conectado en serie con la planta y sus parámetros iniciales son aleatorios, se tiene una señal de control desconocida, lo cual produce un error inicial. Esto lleva a emplear un algoritmo de entrenamiento eficiente, con el finLde obtener una señal de control adecuada. El esquema del control indirecto basado en redes neuronales artificiales se muestra en la figura 1.6 [35]. error refer(k) ucon,(k) J YPb”W *. + . ”...._......sensibilidad ........................’....,. Figura 1.6 Esquema de control indirecto usando RNA Capliulo 1. Redes neuronales ariifciales El objetivo de control está definido de la manera siguiente: donde yp/an(k)=f(üconi(k))y uconi(k)=neurocontrolador(refer(k),wc,vc) w, y v, representan los parámetros del neurocontrolador. Como se mencionó anteriormente, la salida de la red neuronal se compara con la salida de la planta, de tal forma que se emplea como indice de desempeño para minimizar un error cuadrático medio: Un mínimo de la función descrita en (1.6) puede estar dado por: Partiendo del hecho que el modelo de la planta no está disponible o no es conocido, entonces no es posible conocer la sensibilidad, es decir: Sin embargo, esta expresión puede ser estimada a través del uso de una RNA como identificador de la planta, como se muestra en la figura 1.6. Después del entrenamiento del neuroidentificador, e.g. cuando ymo,,(k)=yp/an(k) (basado en un índice de desempeño) se puede suponer que la sensibilidad del neuroidentificador es semejante a la de la planta. Usando ymod(k)en lugar de yPfan(k),el objetivo de control (1 5 )se puede lograr ya que es posible encontrar el mínimo de (1.7). El tipo de RNA originalmente empleado como neuroidentificator es la red neuronal recurrente simple (RNRS) [36],la cual es mostrada en la figura 1.7. 1-11 99- 0555 Capitiilo I . Redes neuronales ariijiciales (b) Capa de salida de la RNRS (a)Estructura de RNRS Figura 1.7 Red Neuronal Recurrente Simple La salida de la RNRS se define como br = vo + CV,f j=r !"C w,x: + o;-' i=0 1 (1 .sa) (1.9b) donde: v y w representan los parámetros de la RNA f(s) representa la función de activación sigmoidal Como se mencionó anteriormente, es necesario emplear un algoritmo de entrenamiento para las redes neuronales artificiales, de tal forma que en el esquema de control indirecto basado en RNA, el neurocontrolador pueda proporcionar una señal de control adecuada con el fin de asegurar que el error entre la salida de la planta y la referencia deseada sea igual a cero. También es necesario emplear un algoritmo de entrenamiento que estime los parámetros del neuroidentificador, de tal forma que se copie la dinámica de la planta y que el error entre la salida de la planta y la salida del modelo (neuroidentificador) también sea igual a cero. 1.6 Algoritmos de entrenamiento' "El desarrollo y popularización de la regla de aprendizaje de retropropagación (backpropagation) ha estimulado fuertemente la investigación en esta área. Sin embargo, el algoritmo de aprendizaje retropropagación (backpropagation) presenta algunas desventajas como son: muy lenta velocidad de convergencia y la necesidad de tener parámetros predeterminados, lo cual limitan el uso práctico de este algoritmo". "Se han reportado muchos algoritmos de entrenamiento para las RNA en la literatura. Algunos son reglas heuristicas para encontrar los parámetros óptimos para el aprendizaje. Otros refinan el método de gradiente descendente para acelerar la convergencia. Otros más, emplean diferentes métodos de optimización no lineal como gradientes conjugados, el método de Newton o las técnicas quasiNewton". "Todos estas mejoras logran mejores velocidades de convergencia y para muchas aplicaciones son suficientes. Sin embargo, para aquellas aplicaciones en las que se requiere una alta precisión en la salida, tal como la predicción de series caóticas de tiempo, los algoritmos conocidos son muy lentos e ineficientes". Para reducir las dificultades descritas se ha propuesto en la literatura un nuevo algoritmo de aprendizaje el cual no realiza una evaluación de gradientes locales. Este algoritmo está basado en la optimización capa por capa de la red neuronal artificial y es llamado algoritmo de aprendizaje mediante optimización capa por capa (aprendizaje OLL por sus siglas en inglés). Las capas son optimizadas alternativamente en un proceso iterativo. El algoritmo de optimización capa por capa se aplica a una red neuronal artificial como la mostrada en la figura 1.5, y se procede como sigue: Se inicia con pesos aleatorios. Con ayuda de estos pesos se calculan los pesos de las conexiones de la capa intermedia con la capa de salida, dejando constantes los pesos de las conexiones entre la capa de entrada y la capa intermedia. Cabe aclarar aquí que no se calculan incrementos en esta capa, se calculan directamente los pesos que hacen que disminuya el error, esto ya es una diferencia con la regla backpropagation que para todas las capas calcula incrementos. Con este primer grupo de pesos optimizados se prueban los patrones de entrenamiento y si el error entre la salida de la planta y la salida del neuroidentificador todavía no llega a la cota establecida entonces se pasa a optimizar el grupo de pesos de las conexiones entre la capa de entrada con la capa intermedia. Aquí sí se calculan incrementos que corresponden solamente a esta capa entrada-intermedia. Nuevamente, una vez optimizado este grupo de pesos se prueban los patrones de entrenamiento y si no se ha alcanzado la cota 1 Este apartado se basa en la referencia [37] y [38] 1-13 ~~~ ~ ~ ~ Capíiulo I . Redes neuronales artificiales establecida se regresa a optimizar nuevamente los pesos del primer grupo. Y así se entra en un ciclo hasta que se encuentren los mejores pesos o, en su defecto, hasta que lleguen a un número de iteraciones establecido por el usuario. Otro punto importante que usa el algoritmo OLL es que en la optirnización de los pesos de la capa entrada-intermedia, a pesar de que se presenta un problema no lineal por causa de la función sigmoidal, el algoritmo OLL lo traduce a un problema lineal. 1-14 Capítulo 2 Identificación de sistemas dinámicos usando redes neuronales artificiales 2.1 Conceptos básicos y notación La caracterización de sistemas es uno de los problemas de gran interés dentro de la teoría de control; este problema consiste en encontrar una representación matemática del sistema a la que se denomina modelo. El modelo de un sistema puede ser representado por medio de un operador P, con base en el espacio de entrada U y el espacio de salida Y. El objetivo es caracterizar la clase P, a la cual pertenece P. Dada una clase P donde el operador P E P , el problema de identificación es determinar una clase P c P y un operador P E P tal que, P se aproxime a P. En sistemas estáticos los espacios U y Y son subconjuntos de R" y Rm, respectivamente, mientras que en un sistema dinámico se asume que son funciones integrables definidas en un intervalo de [O,T] Ó [O, a).En ambos casos, el operador P está definido intrínsecamente por pares de entrada-salida. A Capítulo 2. Idrnii/icacion de sisicmas dinámicos La elección de la clase de modelos de identificación P , así como la especificación del método usado para determinar P , depende de una gran variedad de factores relacionados con la precisión deseada, la manipulación analítica, la manera en la A cual el modelo P puede representar a P, su simplicidad, la facilidad con la que puede ser extendido el modelo y finalmente, si P será usado fuera de línea o en linea. En aplicaciones prácticas muchas de estas decisiones dependen naturalmente de la información a priori que se conozca de la planta que será identificada [39]. . 2.2 Identificación de sistemas estáticos y dinámicos El problema del reconocimiento de patrones es un ejemplo típico de identificación de sistemas estáticos. Los conjuntos compactos de U i c % ” , son mapeados dentro de elementos y,eXrn;(i=l,2,...,m) en el espacio de salida a través de una función P. Los elementos de U, denotan el vector de patrones correspondientes a la clase y,. En los sistemas dinámicos, el operador P se define por funciones de tiempo de pares de entrada-salida u(t), y(f), t E [O,T].En ambos casos el objetivo es determinar P , tal que para todo E > O y una norma definida convenientemente (denotada porllll) sobre el espacio de salida. En (2.1), P ( u ) denota la salida del modelo identificado mientras que y- y = E , es el error entre la salida generada por el modelo y la salida de la planta [40]. 2.2.1 Representación de sistemas Existen diferentes métodos para representar sistemas dinámicos, unos de ellos es representarlos a través de ecuaciones diferenciales o de diferencias, el cual se encuentra actualmente bien establecido en la teoría de control y se aplica a una amplia variedad de sistemas. Por ejemplo, las ecuaciones diferenciales: Capitulo 2. Idenfificacidn de sistemas dinamicos Y ( t ) = y/[x(t)l dónde x u ) = [Xl(t)>XZ(f)'.-, x , ( t ) Y . u ( t )= [u,(t),u*(f),...,up(f)]T Y y ( t ) = Iv,(t>,y,(t),...,y,( t)l'representan un vector de entrada p y un vector de salida rn de un sistema de orden n, u,(t)denota las entradas, x , ( t ) las variables de estado y y , ( t ) las salidas del sistema. @ y Y son mapeos estáticos no lineales definidos como: @:gin x 9lp + F?", y Y :%" -+ 93"'. El vector x(f)denota el estado del sistema en un tiempo f y es determinado por el estado anterior, en un tiempo f, < t , y por la entrada u definida sobre el intervalo [to,t), así la salida y(f), está determinada por el estado del sistema en un tiempo t. Como se puede observar, la ecuación (2.2) es una representación estado. El sistema representado en la ecuación (2.2) puede ser expresado en tiempo discreto de la siguiente forma: donde u ( . ) , x(.)y y(.) son secuencias de tiempo discretas. Si se considera al sistema lineal e invariante en el tiempo, las ecuaciones que gobiernan su comportamiento son: donde A , B y C son matrices de ( n x n ), ( n x p ) y ( rn x n) respectivamente. Entonces, el sistema es representado por la triada (C,B,A), y empleando la teoría de los sistemas lineales invariantes en el tiempo, que involucra los conceptos de controlabilidad, observabilidad y estabilidad que han sido estudiados extensivamente en las últimas tres décadas, es posible encontrar una solución para u(.). La señal de control u ( . ) ,también puede ser determinada con base en la optimización de un criterio de desempeño. El estudio de estos diferentes problemas puede ser fundamentalmente encaminado al hecho de que pueden ser reducidos a una solución de n ecuaciones lineales. En contraste con ésto, los problemas que involucran ecuaciones no lineales de la forma de (2.2), donde las funciones @ y Y son conocidas, conducen a un sistema de ecuaciones algebraicas no lineales cuya solución es difícil de obtener y muchas de las veces es válida solamente para casos particulares [41]. 2-3 Caniiuln 2. Idenfificacih de sisfemas dinámicos 2.2.2 Identificación Cuando las funciones @ y Y en (2.3). o las matrices A, B y C en (2.4) no se conocen, surge entonces un problema de identificación de un sistema desconocido. Esto puede establecerse formalmente como sigue: La entrada y salida de una planta dinámica, invariante en el tiempo, causal y discreta, está dada por u(.) y ypfan(.), respectivamente, donde u(.) es una función del tiempo uniforme y acotada; la planta se asume estable con una representación conocida, pero con los valores de los parámetros desconocidos. El objetivo del proceso de identificación es construir un modelo que pueda sustituir a la planta, de tal forma que cuando se le aplique una señal de entrada, u ( k ) , como a la planta, produzca una señal de salida y,,,,(k), la cual se aproxime a yp,an(k)en el sentido descrito en la ecuación (2.1). ' Los modelos pueden ser construidos y desarrollados de diversas maneras: en forma totalmente teórica, basados en las relaciones físicas que rigen el comportamiento de la planta, o bien en forma empírica con experimentos sobre la planta ya existente, o inclusive mediante una combinación de ambas técnicas. Una forma empirica de realizar una identificación es ver a la planta como una caja negra (ver figura 2.1), a la cual se le aplican señales de entrada y se observan la señal o señales de salida [42]. Figura 2. I Sistema visto como una caja negra El problema de identificación consiste, entonces, en encontrar la relación existente, en términos de ecuaciones matemáticas, entre las señales aplicadas al sistema, u ( k ) y u ( k - I ) , y la respuesta del mismo, ~ ~ , ~ ~ ( k ) , y ~y ~ ~ ~ ypfa,,(k-2). Dependiendo de la dinámica del sistema, es conveniente retroalimentar señales atrasadas tanto del control como de la salida y así emplear diferentes estructuras para la identificación de la planta. En general, se desea que el modelo represente fielmente al sistema bajo las más variadas condiciones de operación, pero es conveniente también que el modelo 2-4 Capitulo 2. Idenrijicación de sisremas dhamicos sea sencillo, lo que conlleva un compromiso entre sencillez y representación fiel del comportamiento de la planta. En la práctica, muchas veces es difícil y complicado determinar el modelo matemático de un sistema físico, por lo que generalmente se realiza una serie de aproximaciones, y algunas veces no es posible incluir en el modelo todas las no linealidades que pudiera presentar la dinámica de la planta. Resulta interesante el emplear una técnica de control inteligente para la identificación de sistemas físicos, de tal forma que la herramienta que se emplee obtenga el modelo de la planta. El reciente surgimiento del paradigma de las redes neuronales artificiales como una poderosa herramienta de aprendizaje, ha mostrado su buen desempeño en la identificación, control y predicción de cualquier sistema, independientemente de las no linealidades que presente, por ello se decidió emplearlo como una estrategia alterna para la identificación y el control de un sistema físico. ' Como se mencionó en el capítulo anterior, una red neuronal artificial se define como "una colección de unidades llamadas neuronas, que se comunican unas con otras por medio de conexiones llamados pesos". El aprendizaje de la red neuronal se lleva a cabo a través de un entrenamiento, que consiste en encontrar los valores adecuados de los..pesos (wi,vj)y de los umbrales (bi) que satisfacen un conjunto de datos entrada-salida de la planta (ver figura 2.2). AI proceso de encontrar los valores adecuados de los pesos (wi,v,) y de los umbrales (bJ,se le denomina estimación paraméfrica. En el presente trabajo, la identificación de la planta se llevó a cabo a través del esquemas de identificación paralelo y del esquema de identificación serieparalelo. 2-5 Capiirrio 2. Idrnlificacidn de sisirmas dimimicos 2.2.3 Esquemas de identificación c- .'7 En el esquema de identificación serie-paralelo, tanto la señal de entrada como la señal de salida de la planta son conectadas directamente a la entrada del identificador, y la diferencia entre la respuesta del identificador y la respuesta de la planta, e@). se usa como un índice de desempeño para satisfacer un conjunto de datos entrada-salida en el proceso de estimación paramétrica. De esta forma el identificador no sólo se encuentra en serie, sino que también en paralelo con la planta (ver figura 2.3). Planta G I,)k(t"oc" Y p l A ....... r' ldentificador F e(k) Y k(), Figura 2.3 Esquema de idenlificacibn serie-paralelo En tanto que en el esquema de identificación paralelo, la entrada de la planta se conecta a la entrada del identificador y la diferencia entre la respuesta del identificador y la respuesta de la planta, e@), se usa como un índice de desempeño para satisfacer un conjunto de datos entrada-salida en el proceso de estimación paramétrica. De esta forma el identificador solamente se encuentra en paralelo con la planta (ver figura 2.4) [43,44,451. ldentificador F Figura 2.4 Esquema de identificación en paralelo Durante el proceso de identificación se encuentran los parámetros de un modelo propuesto y se ajustan (sintonizan), con el fin de optimizar una función de desempeño basada en el error, e@), entre la salida del modelo y la salida de la planta. El proceso de identificación con una red neuronal artificial consiste en ajustar los parámetros de la RNA (umbrales y pesos) empleando algún algoritmo de estimación paramétrica (etapa de entrenamiento de la RNA), basado en el error entre la salida del neuroidentificador y la salida de la planta. En las identificaciones realizadas a los procesos que se describen a continuación se empleó el algoritmo de entrenamiento de optimización capa por capa (OLL), para 2-6 Capitulo 2. Identificación de risIemas dinamicos redes neuronales artificiales recurrentes simples [46]. En el apéndice C se propone una metodología para el entrenamiento de una RNA. Se consideran tres casos de estudio para la etapa de identificación a través de una RNA usando el algoritmo de entrenamiento OLL. I.lntercambiador de calor RCT 100 2. CEI 10 Servo Trainer. 3. Módulo de regulación de flujo. ' 2.3 Casos de aplicación 2.3.1 lntercambiador de calor RCT I100 ' Un caso de estudio es un módulo de temperatura RCT 100 de DIDATEC TECHNOLOGIE, que se muestra en la figura 2.5 [47]. El intercambiador de calor consiste de dos tubos, uno dentro del otro, en el tubo de menor diámetro (línea dentro del tubo de mayor diámetro) circula agua caliente que proporciona el termorregulador, la circulación de esta agua caliente provoca que el agua que fluye en el tubo de mayor diámetro incremente su temperatura debido al intercambio de energía calorífica. Aquí lo que interesa es mantener a una cierta temperatura el agua que fluye en el tubo de mayor diámetro, agua fría. Si se requiere una mayor temperatura en el agua fría se abrirá la válvula de regulación, en caso contrario se cerrará. El problema consiste en mantener la temperatura de un fluido, en este caso agua, a una temperatura deseada, mediante la transmisión de calor que proporciona un fluido caliente (agua caliente), a mayor flujo de agua caliente más rápido es el calentamiento del agua fría. El flujo de agua caliente es controlado por una válvula de regulación, mientras que el flujo de agua fría es controlado por la válvula de perturbación. El agua caliente es suministrada por el termorregulador, el agua fría es suministrada por la red. La entrada del actuador es para controlar el porcentaje de apertura de la válvula de regulación. La salida del sensor caliente es para monitorear la temperatura del agua caliente que proporciona el termoregulador, lo mismo se aplica para el caso de la salida del sensor frío para la temperatura deseada del agua fria. I. 2-7 Capiftilo 2. IdenfiJicaridn de sisfemas dinámicos + IConvefiidorF- . Salida del sensor Caliente -----pGziz++ . Salida del sB”so, lri0 Grupa lemorregulador Figura 2.5 Esquema del intercambiador de calor RCT 100 de DlDATEC TECHNOLOGE. 2.3.1 .IIdentificación del sistema con un neuroidentificador empleando el algoritmo OLL Para la etapa de identificación se requirió de la adquisición de datos de la temperatura de la planta, y,,=”, (con un tiempo de muestre0 de 10 seg ,[48]) al aplicar una trayectoria predefinida u,,, , en la válvula de control, con ésto se ,y,,,,) (ver figura 2.6). obtuvo un conjunto de datos de entrada-salida(u,,,, Muestras (Tiempo de muestre0 10 seg) Figura 2.6 Patrones de entrenamiento tomados del intercambiador de calor RCT 100, las muestran fueron tomadas cada 10 segundos. 2-8 Capitulo 2. Identificación de sistemas dinamicos El proceso de identificación con redes neuronales artificiales, se realiza a través del entrenamiento de la misma, es decir, se estiman los parámetros de la RNA para satisfacer el conjunto de datos entrada-salida mostrados en la figura 2.6. Lo anterior es hecho de tal forma que logre copiar la dinámica de la planta y las no linealidades que pudiera presentar ante la señal de entrada aplicada. La forma de identificar la planta usando una RNA se debería hacer, en principio, dando como entrada a la red el porcentaje de apertura de la válvula del RCT 100 y como salida la temperatura correspondiente, usando los datos que se muestran en la figura 2.6. Esto correspondería a un esquema de identificación en paralelo, es decir, la RNA tendría una neurona en la capa de entrada y una neurona en la capa de salida. Sin embargo, la RNA no puede aprender dos comportamientos distintos para una misma señal de entrada y los datos de la figura 2.6 presentan esta caracteristica. Esto se debe a que la dinámica de la planta es muy lenta. Para solucionar el problema se agrega a la RNA una entrada extra, la cual es simplemente la salida retardada en una unidad de tiempo (ver figura 2.7) y después se vuelve a entrenar. Figura 2.7 Esquema serie paralelo para la identificación de la planta RCT 100 Con esto lo que se logra es cambiar los datos de entrada y hacer que obedezcan al comportamiento de una función, es decir, se cambió de dominio. Por lo tanto, para hacer la identificación la red se entrena con dos vectores de entrada y un Único vector de salida. Los vectores de entrada están conformados, uno por el porcentaje de apertura de la válvula y el otro por la salida de la planta retrasada una unidad de tiempo, en este caso la unidad de tiempo corresponde al tiempo de muestre0 de 1O segundos. La salida deseada es la salida actual de la planta. Asi, para llevar a cabo la identificación del RCT 100 por medio de una RNA se usaron 1699 datos. La estructura de la RNA propuesta consiste de 2 neuronas en la capa de entrada, 10 neuronas en la capa intermedia y 1 neurona en la capa de salida, así que se tienen que estimar 51 parametros; fue necesario realizar 100 iteraciones para cumplir con el criterio de error propuesto. La figura 2.6 muestra los patrones de entrenamiento de la RNA mientras que en la figura 2.8 se muestra la respuesta del intercambiador de caioi RCT 100 y la respuesta del modelo obtenido a través del neuroidentificador. 2-9 Capifiilo 2. Identificacidn de sisfemas dinamicos I;2 : O 200 400 600 800 1000 1200 1400 1600 Muestras (Tiempo de muesireo 10 seg) Figura 2.8 Respuesta del Nitercambiador de calor RCT 100 y de/ modelo, las muestran fueron tomadas cada 10 segundos. 2.3.1.2 Pruebas de generalización del modelo obtenido con el neuroidentificador El proceso de generalización en una RNA consiste en evaluar el comportamiento del modelo obtenido con el neuroidentificador, ante datos no empleados en el entrenamiento; se desea que la salida del modelo sea igual a la salida de la planta. Existen tres condiciones necesarias, pero no suficientes para lograr una buena generalización: a) La primera condición establece que los datos de entrada a la red neuronal artificial deben de contener suficiente información del comportamiento de la planta, de tal forma que exista una función matemática que pueda representar dicho comportamiento en forma precisa, esto puede lograrse al aplicar una señal tipo rampa o senoidal. b) La segunda Eondición necesaria implica que la función que se desea aprender sea suave. En otra palabras, que ante un pequeño cambio en las entradas debe producirse un pequeño cambio en las salidas. Muchas funciones no suaves, como las producidas por secuencias pseudoaleatorias no pueden ser generalizadas por las redes neuronales artificiales, por ello no puede aprender el comportamiento que presenta una planta al ser excitada por este tipo de señales 1491. 2-10 Capítulo 2. Identijieacidn de sistemas dimimicos c) La tercera condición necesaria para una buena generalización, establece que el conjunto de casos de entrenamiento es representativo del subconjunto de casos que se desean generalizar. A continuación se presenta la primera prueba de generalización, para ésto se usan 267 datos. Para obtener estos datos el intercarnbiador de calor RCT 100 se excitó con un conjunto de rampas cuya pendiente creciente llega hasta 70% de apertura en la válvula de control, después decrece hasta cerrar completamente la válvula de control, el incremento y decremento en la válvula fue del 2.5% en cada tiempo de muestreo, y se obtuvieron las salidas que se muestran en la figura 2.9. , I Muesiras (Tiempo de muestre0 10 seg) Figura 2.9 Doscientos sesenta y siete datos extraídos de la respuesta de , intercambiador de calor RCT 100 ante rampas para pruebas de generalización de la RNA, cada muestra fue tomada por intervalos de 10 segundos. Después se aplicó el mismo conjunto de rampas al modelo obtenido con el neuroidentificador y entrenado con el algoritmo OLL. Cabe hacer la aclaración que una de las entradas a la RNA es la señal de salida de la planta retrasada en una unidad de tiempo. Como la RNA ha sido entrenada con anterioridad y ha copiado la dinámica del intercambiador de calor RCT 100, su respuesta debe ser la misma que la de la planta, la figura 2.10 muestra que ésto se cumple. Como se puede observar en la misma figura, la RNA tiene la capacidad de generalización, ya que la diferencia entre la temperatura de la planta y la del modelo es mínima. I) wr B 'lb 1 .¡I ' I¡ , 1 . 50 ~ 100 150 200 Mue~iras(Tiempa de rnuesireo 10 589) 11 i .I 250 Figura 2.10 Salida de la pianfa y salida del modelo (entrenado con el algoritmo OLL) para los datos de entrada de la figura 2.9. 11 ' Para la segunda prueba de generalización se tomaron 300 patos, los cuales se muestran en la figura 2.1 I . Los datos de entrada correspoqde al porcentaje de apertura de la válvula y los datos de salida corresponden allla temperatura de la planta. La señal de apertura de la válvula está descrita por I1 u,,,,(k)= 15.0*(sin(0.0062* k)+sin(0.031*/0)+3.0. '1 II M~eslras(Tiempa de r n u e s V ~10 leg) 'I Figura 2.1 ITrescienios datos extraídos del intercarnbiador de calor RCT 100 para pruebas de generalización d d modelo obtenido con el neuroidentificador, cada muestra fue tomada por intervalos de 10 segundos. I1 En esta segunda prueba de generalización se realizó el mismo procedimiento que para la primera. En la figura 2.12 se puede observar la temperatura de salida del intercambiador de calor y la salida de temperatura del modelo. AI igual que en la prueba anterior, se puede observar que la RNA !tiene la capacidad de generalización, ya que la diferencia entre la temperatura de la planta y la del modelo es mínima. 'I 11 I1 I - 't 2-12 --.------ .lb ~ ~~ . .. . ~ . ~. ~~ . . -~ II . . -. 3. '. . *. ' , .I^ ~ .r .- ,1 : . .Capitulo 2. Ideniifícacidn de sisiemas dinanlicos - I* ., .. L r:I :,.. ' I " 'I Figura 2.'12 Respuesta del modelo obtenido con el neuroidentificador para los datos de la figura 2.11. .. f. . . 1. - . 2.3.2 CEI 10 Servo Trainer . , ' . , . 1 ,7, - El CEI 10 Servo Trainer esta enfocado 'específicamente a los problemas de velocidad y posición que son comunes en la industria. Esta planta puede ser usada para el diseño práctico de controladores clásicos y es posible evaluar su desempeño [50]. I t , Es posible examinar el control de velocidad de la flecha rotatoria con diferentes cargas e inercias. Incluye la facilidad de adicionar un engrane como carga, operado por un embrague eléctrico, unacarga en la flecha con una caja de cambios y un sensor de posición. Una característica especial del CEI 10 Servo Trainer es que incluye un conjunto de elementos no lineales típicos los cuales son asociados con el control en el seguimiento de una trayectoria. El CEI 10 Servo Trainer se muestra en la figura 2.13. Éste incluye un motor de CD con flecha rotatoria en la cual pueden ser montados los siguientes componentes: Una carga inercial. Un tacómetro para la medición de velocidad de la flecha. Un generador que es usado como carga eléctrica al motor. Un amplificador para el motor, el cual provee la potencia para que la flecha gire. " . . . 2-13 Capifuío2. Idenfificacidn de sisfemas dinamicos .. . 5 , , n Muesiras(Tiempo de muestreo 0.4 seg) . i ! . Figura 2.15 Patrones de entrenamiento tomados del CEllO Servo Trainer, el tiempo de muestreo fue de 0.4 segundos. .? ' ., .. , . . ., , i . - Una vez que se entrenó la RNA, se le aplicó el mismo conjunto de datos de entrada que fueron aplicados al motor (planta), con el fin de comparar su comportamiento contra el comportamientó real de la planta ante la misma señal de excitación (ver figura 2.1 6). ! i Y ! I I i i I I O 2 4 6 8 10 12 14 16 18 20 Muestras(Tiemp0 de muestre0 0.4 seg) Figura 2.16 Respuesta del CEI 10 Servo Trainer y del modelo obtenido con la RNA, el tiempo de muestreo fue de 0.4 segundos. Como lo muestra la figura 2.1 6, el comportamiento del modelo es el esperado y la diferencia entre las señales es mínima. 2-16 Capitulo .2. Idenfificacidn de sisfemas dinámicos 50 . . 100 150 200 250 Muestras (Tiempo de muesireo 10 seg) IO Figura 2.12 Respuesta del modelo obtenido con el neuroidentificador para los datos de la figura 2.11. 2.3.2 CEI 1O Servo Trainer El CEllO Servo Trainer está enfocado específicamente a los problemas de velocidad y posición que son comunes en la industria. Esta planta puede ser usada para el diseño práctico de controladores clásicos y es posible evaluar su desempeño [50]. Es posible examinar el control de velocidad de la flecha rotatoria con diferentes cargas e inercias. Incluye la facilidad de adicionar un engrane como carga, operado por un embrague eléctrico, una carga en la flecha con una caja de cambios y un sensor de posición. Una característica especial del CEI 10 Servo Trainer es que incluye un conjunto de elementos no lineales típicos los cuales son asociados con el control en el seguimiento de una trayectoria. El CEI 10 Servo Trainer se muestra en la figura 2.13. Éste incluye un motor de CD con flecha rotatoria en la cual pueden ser montados los siguientes componentes: Una carga inercial. Un tacómetro para la medición de velocidad de la flecha. Un generador que es usado como carga eléctrica al motor. Un amplificador para el motor, el cual provee la potencia para que la flecha gire. 2-13 Capitulo 2. Identificacidn de sistemas dinámicos Un embrague operado eléctricamente para habilitar el amplificador del motor, el cual se conecta a una flecha secundaria llamada la posición de la flecha de salida. Esta se conecta a: 6 Una caja de engranes reductora en un radio 30:1, que sirve como carga mecánica, 6 Un sensor de posición para la flecha con un indicador visual de calibración. La velocidad del motor se determina por el voltaje CD aplicado al amplificador de entrada. De igual manera, la carga del generador se determina por una entrada externa. Ambas son arregladas para operar en el rango de +1OV (O a 1OV en el caso del generador). El sensor de velocidad y de posición de la flecha dan una salida en el rango de O a IOV. Una puerta en la parte trasera del lado izquierdo permite el acceso para cambiar el tamaño de la carga inercia1 adicionando o quitando los discos de inercia. Además de estos componentes, el CEI10 Servo Trainer contiene una serie de elementos no lineales . Estos se encuentran localizados en la parte superior del panel principal. Un bloque de anti-zona muerta para eliminar cualquier zona muerta introducida deliberadamente o inherente al motor CEI 10. Un bloque de zona muerta para introducir una zona muerta que puede ser estudiada. Un bloque de saturación que permite saturar el amplificador del servo-drive. Un bloque de histéresis que puede ser aplicado al sistema. Unidad de no linealidades - Salida de la unidad no lineal salida del tac(imetro o-riov generador - l o a +1OV Conmutador entrada al motor electnw Figura 2.13 CE11O Servo Trainer 2-14 Capítulo 2. Ideniificacidrr de sisiemas dinámicos 2.3.2.1 Identificación del sistema con un neuroidentificador empleando el algoritmo OLL Para poder realizar el proceso de entrenamiento de la red neuronal artificial recurrente, fue necesario aplicar la señal de entrada u,,, en el amplificador que proporciona la señal adecuada al motor, y obtener los datos de la velocidad de la planta, ypran. Con ésto se obtuvo un conjunto de datos de entrada-salida. Como se mencionó el proceso de identificación con redes neuronales artificiales, se realiza a través del entrenamiento de las mismas, de tal forma que logre copiar la dinámica de la planta. La constante de tiempo de este sistema es aproximadamente de 1.5 seg [51]. Se recomienda un tiempo de muestreo entre 0.1 a 0.3 veces la constante de tiempo del sistema [52,53]. Para el caso específico se propuso un tiempo de muestre0 de 0.4 seg. Debido a que la dinámica del sistema es rápida, es posible emplear un modelo de identificación paralelo, como se muestra-en la figura 2.14 umnt(k) , 14- SeNo Trainer , +p(k) Figura 2.14 Esquema paralelo para la identificación de la planta CE1 I O Servo Trainer Para llevar acabo el entrenamiento de la RNA se usó la rampa de 21 datos, que se muestran en la figura 2.15. La señal de entrada es u,,, ( k )= u,,, ( k - I)+ 0.5 volts, el tiempo de muestreo es de 0.4 segundos. La configuración usada para la red neuronal artificial recurrente fue de 1 neurona en la capa de entrada, 4 neuronas en la capa intermedia y 1 neurona en la capa de salida. Se requirió de 50 iteraciones para lograr satisfacer el criterio de error propuesto. 2-15 Caphilo 2. iúeniiflcacidn de sisiemas dinámicos I 1 Muestras(Tiemp0de muestre0 0.4 seg) Figura 2.15 Patron& de entrenamiento tomados del CE110 Servo Trainer, el tiempo de muestreo fue de 0.4 segundos. . Una vez que se entrenó la RNA, se le aplicó el mismo conjunto de datos de entrada que fueron aplicados al motor (planta), con el fin de comparar su comportamiento contra el comportamiento real de la planta ante la misma señal de excitación (ver figura 2.16). 9 , , , , , , , , , , , 8. 765. 4. 3- t. 1. 0 % " " ' , I Muestras(Tiernp0de muestre0 0.4 seg) Figura 2.16 Respuesta del CE110 Servo Trainery del modelo obtenido con la RNA, el tiempo de muestreo fue de 0.4 segundos. Como lo muestra la figura 2.16, el comportamiento del modelo es el esperado y la diferencia entre las señales es mínima. 2-16 - Capitulo 2. Idenrifiración de sistemas dinamicos 2.3.2.2 Pruebas de generalización del modelo obtenido con el neuroidentificador En la primera prueba de generalización, se usó un conjunto de 163 datos. Para obtener estos datos, el Servo Trainer se excitó con una señal senoidal descrita por uco,,,(k)= 2.8 + 1.2 sin(0.2454 k) volts. La señal de excitación y la respuesta de la planta se muestran en la figura 2.1 7. I Mueslras(Tiempode muestre0 0.4 sea) Figura 2.17 Señal senoidal para evaluar el modelo del C E l l O Servo Trainer y respuesta del mismo, el tiempo de muestreo fue de 0.4 segundos. Después se aplicó el mismo conjunto de datos de entrada al modelo obtenido con el neuroidentificador y entrenado con el algoritmo OLL. En la figura 2.18 se puede observar la velocidad del motor y la velocidad del modelo. Mueslas(Tiemp3de muestre0 0.4 seg) Figura 2.18 Respuesta de/ C E l l O Servo Trainery de/ modelo obtenido con la RNA, el tiempo de muestreo fue de 0.4 segundos. Capitiilo 2. Ideniijicación de sisfemas dinámicos Como muestra la figura 2.18, el comportamiento del modelo es el esperado, la salida de la planta en la parte inferior de la señal de cotitrol del motor es ypian(45)= 1.0686 volts y la salida del modelo es aproximadamente y"od(45) = 0.9647volts. io cual corresponde a un error del 10.76%. Muerbas(Tiemp de rnUesVen ü.1 seg) Figura 2.19 Ciento cinco datos obtenidos del CEllO Servo-Trainer para pruebas de generalización de la RNA, cada muestra fue tomada por intervalos de 0.4 seg. ; Para la segunda prueba de generalización, se tomaron 105 datos, los cuales se muestran en la figura 2.19. La señal de excitación está descrita por u,,,, (k)= 5.0+ 2.0 * sin(0.2454 k). Después se aplicó el mismo conjunto de datos de entrada al modelo obtenido con el neuroidentificador y entrenado con el algoritmo OLL. En la figura 2.20 se puede observar la velocidad del motor y la velocidad del modelo, y se muestra que existe una diferencia de 0.1747 volts en la región inferior de la senoidal, lo cual equivale a un error de 7.869%. MUeSbas(TiernpO de rnueslren 0.4 reg) Figura 2. 20 Respuesta de/ CEI 1 O Servo Trainer y de/ modelo obtenido con /a RNA, e/ tiempo de muestre0 fue de 0.4 segundos. Capitirlu 2. Idenlifcación de sistemas dinamicus Por lo tanto, se puede concluir que el modelo obtenido para el CEllO Servo Trainer a través del neuroidentificador representa el comportamiento esperado de la planta. 2.3.3 Módulo de regulación de flujo ES un módulo de regulación de flujo de FESTO DIDACTIC (ver figura 2.21) [54]. La idea principal es controlar, a través de una bomba de CD, el flujo de un liquido que se encuentra en un contenedor. Este sistema presenta los siguientes componentes: Una bomba de CD que permite la circulación continua del líquido y a través de la cual se controla el flujo; tiene un rango de operación de O a 10 litros/min; su señal de excitación corresponde a un rango de O a 24 VCD. Un sensor de flujo que va montado sobre la tubería; presenta un rango de medición de 0.5 a 15 litroslmin; su señal de salida es una onda cuadrada con amplitu'd de 5 a 12 V, y con base en la frecuencia se determina el flujo del líquido. Un contenedor para almacenar el líquido; en este caso agua. Una válvula manual que se emplea para aplicar una perturbación sistema. I 1 periurbación Bomba Figura 2.21 M6dulo de regulacidn de flujo al Capirido 2. Ideniijicacidn de sisiemos dinámicos 2.3.3.1 Identificación del sistema con un neuroidentificador empleando el algoritmo OLL La etapa de identificación se requirió de la adquisición de datos del flujo de la planta, Y ~ , ~ "al , aplicar una trayectoria predefinida u,,, , en la bomba de CD, Con ésto se obtuvo un conjunto de datos de entrada-salida. Figura 2.22 Esquema paralelo para la identificación del módulo de regulación de flujo Para llevar acabo el entrenamiento de la RNA se usó la rampa de 16 datos, que se muestran en la figura 2.23. La señal de entrada es u,,,(k)=u,,(k-1)+0.5 volts, el tiempo de muestre0 es de 0.4 segundos. La configuración usada para la red neuronal artificial recurrente fue de 1 neurona en la capa de entrada, 4 neuronas en la capa intermedia y 1 neurona en la capa de salida. Se requirió de 50 iteraciones para lograr satisfacer el criterio de error propuesto. Muestras(Tiempnde muestren 0.4 seg) Figura 2.23 Patrones de entrenamiento tomados del módulo de regulación de flujo, el tiempo de muestreo fue de 0.4 segundos. 2-20 Cap¡iulo 2. Identificación de sisiemas dinamicos Una vez que se entrenó la RNA, se le aplicó el mismo conjunto de datos de entrada que fueron aplicados al motor (planta), con el fin de comparar su comportamiento contra el comportamiento real de la planta ante la misma señal de excitación (ver figura 2.24). 12 I . Muesiras(Tiempo de rnuesireo 0.4 seg) Figura 2.24 Respuesta del mddulo de regulacidn de flujo y del modelo obtenido con la RNA. el tiempo de muestreo fue de 0.4 segundos. Como lo muestra la figura 2.24, el comportamiento del modelo es el esperado y la diferencia entre las señales es mínima. 2.3.3.2 Pruebas. de generalización neuroidentificador del modelo obtenido el En la primera prueba de generalización, se usó un conjunto de 163 datos. Para obtener estos datos, el módulo de regulación de flujo se excitó con una señal senoidal descrita por u,,,, (k)= 5.0 +2.0 sin(0.2454* k ) volts. La señal de excitación y la respuesta de la planta se muestran en la figura 2.25. 2-2 1 Copitulo 2. Identificacidn de sistemas dindmicos O 20 40 KO 80 1w Muestras(Tiernp0 de muestre0 0.4 seg) Figura 2.25 Ciento cinco datos obtenidos de/ módulo de regulación de flujo para pruebas de generalización de la RNA, cada muestra fue tomada por intervalos de 0.4 seg. Después se aplicó el mismo conjunto de datos de entrada al modelo obtenido con el neuroidentificador y entrenado con el algoritmo OLL.En la figura 2.26 se puede observar el flujo del módulo y el flujo del modelo. O 20 40 KO 80 103 I Muestras(Tiemp0 de muestre0 0.4 seg) Figura 2.26 Respuesta del módulo de regulación de flujo y del modelo obtenido con la RNA, el tiempo de muestre0 fue de 0.4 segundos. ' Se puede observar que la RNA tiene la capacidad de generalización, ya que la diferencia entre el flujo de la planta y el flujo del modelo es mínima. 2-22 Capítulo 2. Ideniifiración de sistemas dinamicos 2.4 Identificación para el control de sistemas Uno de los esquemas de control en los cuales se puede implementar la RNA, es el esquema de control indirecto, que se muestra en la figura 2.27. error UC0"ik) Planta Ypi,"(k) + . . .. '.., Neuroidentificador / '.. "...._______.......______. sensibilidad '... .............. Figura 2.27 Esquema de control indirecto Este esquema de control consta de dos etapas: 1. La primera etapa consiste en realizar una identificación del sistema; en este caso a través de un neuroidentificador(RNA), el cual copia la dinámica del sistema. El neuroidentificador ajusta sus parámetros con base en un índice de desempeño o criterio de error que está dado por la diferencia de la ., salida del sistema y la salida del modelo. 2. La segunda etapa consiste en encontrar una ley de control adecuada, a través del neurocontrolador, de tal forma que la salida de la planta siga a una referencia deseada. AI implementar la segunda etapa del esquema de control indirecto para los casos de estudio anteriormente planteados, no fue posible lograr el comportamiento deseado, es decir, que la salida de la planta, yplan(kJ.siga a la referencia deseada, refer(k). El neurocontroiador necesita dos elementos para el ajuste de sus parámetros; uno es el índice de desempeño que está dado por la diferencia entre la salida de la planta y la referencia deseada y es una función que se propone. El otro elemento es un elemento llamado sensibilidad del modelo. La sensibilidad del modelo se define como "la razón de cambio que existe en la salida respecto a la razón de cambio de la entrada en un instante de tiempo". 2-23 Capitulo 2. Ideniificacidn de sistemas dinámicos Sensibilidad = ay pia0 ( kU,,", 1 a"C0"l (2.5) En las gráficas de respuesta del intercambiador de calor RCT 100 y del CEl10 Servo Trainer, se puede observar que ambas plantas tienen un comportamiento monótono, es decir, si la señal de entrada u,, crece, la señal de salida yPian también crece, y viceversa, si la señal de entrada u,,,, decrece, por lo tanto la sensibilidad es positiva. I decrece, la salida y,,=, Con los métodos generalmente usados para la estimación parametrica, de los parámetros W , y V, que son los pesos de la capa intermedia y de la capa de salida del neuroidentificador respectivamente, existe la posibilidad que la sensibilidad del modelo no siempre sea positiva. Esto se debe a que dichos métodos se basan en la generación y solución de un sistema de ecuaciones lineales, en las cuales, si la solución existe es única y el vector solución puede estar formado por valores positivos y negativos. Así que siempre es posible la existencia de un conjunto de datos entrada-salida para los cuales el comportamiento del modelo no sea el adecuado. Como se mencionó con anterioridad, en el esquema de control indirecto basado en redes neuronales artificiales se calcula una ley de control con base en el modelo numérico obtenido con el neuroidentificador. Sin embargo, si éste modelo numérico no representa adecuadamente a la planta, aún cuando se tenga un método eficaz para calcular la ley de control, ésta no será la adecuada para controlar a la planta, será adecuada para controlar al modelo. Por esto se requiere tener un buen modelo numérico para encontrar una ley de control adecuada y así satisfacer el objetivo de control. En el siguiente capítulo se hará un análisis de sensibilidad para demostrar que los modelos numéricos obtenidos no siempre pueden presentar un buen comportamiento cualitativo, por lo que el esquema de control indirecto no tuvo el desempeño adecuado en el control de los casos de estudio. 2-24 Capítulo 3 Análisis de sensibilidad .y optimización . . restricciones SUI 3.1 Análisis de sensibilidad Para llevar a cabo el análisis de sensibilidad, se comenzará por mencionar el objetivo de control, el cual está definido de la siguiente manera [55,56]: /imllrefer(k)-y,,,,(k.u,,, k+m ]I E (3.1) donde E es un criterio de error, que puede ser definido como un error cuadrático medio [57,58]: 1 E =-(refer(k)-y,,(k.u,,,, 2 >)’ (3.2) Como puede observarse, el error está en función de k, que es el tiempo discreto, y de que es la señal de entrada a la planta. El error varía sólo si la señal de Capitulo 3. ~liialisisde seiisihilidadg optimizacihi sin resrrircioni*s entrada, uconl,varía, de tal forma que para un valor deseado de salida, refer(k), el valor de salida de la planta, yPi,,, puede ser mayor o menor (ver figura 3.1). error t Figura 3.1 Gráfica del error cuadrático medio Es evidente que el mínimo de (3.2) se puede encontrar derivando la ecuación respecto a u,,,~. Así. (3.3) El término dY pla"(kJ UCO"1 I es llamado sensibilidad de la planta [59,60,61]. La ' duc,*t sensibilidad se define como la variación que existe en la salida respecto a la variación existente en la entrada para un tiempo k. Sin embargo, no se conoce la expresión matemática que describe el comportamiento de la planta y por ello dY pian fkUcont I no es conocida. Si se propone un modelo, tal que: dUCO", Ym,(k~,,,,,P)= Ypian(kUcon,) (3.4) donde p es el vector de parámetros del neuroidentificador, se puede establecer que [62]: dYmo~(k,ucon~ P P I = dYpm dU,"l con^ dumt (3.5) La obtención del modelo (neuroidentificador) se realiza en la etapa de identificación, el objetivo del neuroidentificador es copiar la dinámica de la planta. El criterio de error de este modelo puede establecerse también como un error cuadrático medio, el cual está dado por la siguiente ecuación: 3 -2 Capitulo 3. Analisis de sensibilidad y oprimizacidn sin restricciones el minimo se encuentra expresado por: (3.7) ") es la sensibilidad del modelo respecto a los parámetros, dP p=[w;,vJ, del neuroidentificador. donde dYmod(k'Uconf Recordando que para satisfacer el objetivo de control se debe conocer el término Suponiendo un sistema monótono, es decir, si la entrada crece la salida crece y viceversa, si la entrada decrece la salida decrece, entonces la sensibilidad de la planta es positiva. La salida para una red neuronal recurrente simple [63].está dada por: (3.8.a) (3.8.b) (3.8. c) La función de activación de cada neurona es una función sigmoidal definida como 4 I f ( s )= __ 1+ e-' y su derivada es: f'(S)= f(s)[l-f(s)]- (3.9) ds W 0 " l (3.10) Capiiulo 3. Analisis de sensibilidad y oprimiración sin resiricciones Por lo tanto, la sensibilidad de una red neuronal recurrente simple está dada de la siguiente manera: (3.11 ) De la ecuación (3.11) se puede observar que como f(sh) varía entre O y 1 y su complemento entre 1 y O, para obtener una sensibilidad positiva los pesos whj y Vh de la red neuronal deberán ser ambos positivos o ambos negativos. Con los métodos de estimación paramétrica generalmente usados para las RNA, aun y cuando se asegura que y,,(k,u,,)=Y,,~~(k,u,,,,) Y que dymo,j(k,UcOn, % dYpian(k,ucanr ) , la sensibilidad no se cumple de manera general, du,,, es decir, siempre es posible la existencia del conjunto de datos entrada-salida para los cuales el comportamiento del modelo no sea el adecuado. Esto se debe a que tales métodos consisten en la generación y solución de un sistema lineal, por lo que la solución, si existe, es Única y los parámetros de solución pueden ser positivos o negativos. duce,, ' Con el propósito de mostrar la falla de estos métodos a continuación se hará un análisis de sensibilidad para una planta. 3.1.1 Análisis de sensibilidad para el modelo del CE110 Servo Trainer. El CEllO Servo .Trainer es un sistema monótono debido a que cuando se incrementa la señal de voltaje de entrada, uconf.existe un incremento en la velocidad, y,, y viceversa, es decir, cuando existe una disminución en la señal de entrada, también la velocidad disminuye. Por lo tanto la sensibilidad de la planta es positiva. Como se mencionó en el capítulo anterior, se obtuvo un modelo válido a través de un proceso de identificación con una red neuronal artificial recurrente simple. El algoritmo empleado para la estimación de los parámetros de la RNA es el algoritmo de optimización capa por capa (OLL); la estructura de la RNA es la que se muestra en la figura 3.2. 3 -4 Capitulo 3. Análisis de sensibilidad y optimización sin restricciones Entra Pesos de la capaf u Figura 3.2 Estructura del neuroidentificador empleado para la identificación de/ CEllO Servo Trainer usando OLL Los parámetros de la red neuronal artificial son los umbrales, bi, Ips pesos de la capa intermedia, wi, y los pesos de la capa de salida, vi,. Así, la entrada de la RNA es ponderada a través de los pesos de la capa intermedia, wi,se le suma el umbral y se aplica la función de activación de la neurona, en este caso una función sigmoidal, la respuesta de cada neurona es ponderada con los pesos de la capa de salida, vi. Se debe aclarar que los umbrales son multiplicados por la unidad. 1 2 3 4 5 Pesos w -0.4715922 0,1768026 -0.4534636 -0.3835130 Pesos v 358.0178299 9.2206202 -0.4452780 -262.0147885 Umbrales -0.4716069 0.1767707 -0.4534508 -0.3844735 1.7373304 Capitulo 3. Análisis de sensibilidod y optimizoción sin restricciones (3.12) Una prueba experimental de la sensibilidad de la planta fue realizada al CEllO Servo Trainer una vez que se obtuvo un modelo de la planta, cuyo desempeño era el adecuado, con los parámetros que se muestran en la tabla 3.1. La señal de excitación para obtener el conjunto de datos entrada-salida con los que se entrenó la RNA fue una rampa que parte de 5.5 volts hasta llegar a los 8 volts. Sin embargo, al aplicar una señal de excitación u,,,(k) =u,,,,(k)+0.01 volts al modelo, que contiene datos con los que no se entrenó la RNA, es decir, señales de entrada menores a 5.5 volts, se tiene un comportamiento no esperado, esto es debido a que la sensibilidad del modelo no es semejante a la sensibilidad de la planta para dicha señal. Analizando la figura 3.3 en la región A, mientras que la salida de la planta es creciente, la salida del 'modelo es decreciente, y su sensibilidad es negativa. En la región B la salida del modelo es creciente al igual que la de la planta, y la sensibilidad es positiva, en esta región la sensibilidad del modelo es semejante a la sensibilidad de la planta. Así se muestra que la sensibilidad se cumple de manera local y no de manera global como se desea. Tiempo Figura 3.3 Respuesta de/ modelo obtenido con RNA para el CE110 Servo Trainerpara una señal que contiene datos con los que no se entren6 la RNA 3-6 Capitulo 3. Análisis de sensibilidad y optimi:acidn sin restricciones 1 2 3 4 5 Pesos w -0.4715953 0,1768094 -0.4534600 -0.3832502 Pesos v 91.7683751 11.9406781 -0.4452780 -90.1691994 Umbrales -0.4715909 0.1767518 -0.4534679 -0.3851798 -1.1317161 Capifulo 3. Andlisis de sensibilidad y opfimizacidn sin resfricciones sensibilidad es positiva, en esta región la sensibilidad del modelo es semejante a la sensibilidad de la planta, sin embargo cuando la salida del modelo es mayor a 5.5 volts (datos con los que no se entrenó la RNA, región C) la sensibilidad cambia de pendiente y empieza a existir mayor error entre la salida de la planta y la salida del modelo. Así se muestra que la sensibilidad se cumple de manera local Y no'de manera global como se desea. ' Y o > c ia o . . 100 , , 200 3w 400 . . . . . 5M) wo 700 800 900 100 Tiempo Figura 3.4 Respuesta del modelo obtenido con RNA para el módulo de regulacidn de flujo para una señal que contiene datos con los que no se entrenó la RNA Esto es claramente atribuible al método de estimación paramétrica, en esencia el método trata de satisfacer un conjunto de puntos, haciendo que el comportamiento de la RNA se asemeje al de una función que aproxima dichos puntos; en la figura 3.5a se muestra el comportamiento de una RNA al aproximar dos puntos, A y B. con sensibilidad positiva. Por ejemplo, se sabe que la RNA aprendió el comportamiento entre estos dos puntos, sin embargo, no se sabe cuál es el comportamiento de la RNA para puntos intermedios, por ejemplo para el punto C. En la figura 3.5b se muestra que para un punto intermedio C, la respuesta del modelo (neuroidentificador) es diferente a la respuesta de la planta, por lo que la sensibilidad es negativa entre el punto A y el punto C debido a que L& !!!! AUcon, < O , mientras que entre el punto C y el punto B la sensibilidad es positiva AY pian debido a que __ > O . AUcon, 3-8 Capiiulo 3. Análisis de sensibilidady opiimización sin resiricciones B aj Aproximación de dos puntos con una RNA B b) Gráfica de sensibilidad positiva y sensibilidad negativa Figura 3.5 Aproximación de dos puntos con una RNA Es evidente que la sensibilidad puede ser positiva o negativa para puntos con los cuales la RNA no fue entrenada. Es por ello que se propone el empleo de un método de estimación paramétrica con restricciones (optimización con restricciones), de tal forma que se asegure que los pesos de la capa intermedia y los pesos de la capa de salida de la RNA sean siempre positivos o siempre negativos y así cumplir con la condición de que la sensibilidad sea positiva y se cumpla de manera global. 3.2 Optimización' El problema de optimización consiste en encontrar el máximo o el mínimo de una función objetivo. Esta puede representar el costo, energía o beneficio en términos de las variables de interés del proceso que será analizado. El modelo del proceso y las restricciones describen las relaciones ent're las variables de interés. Una gran variedad de problemas en el diseño, construcción, operación y análisis de plantas pueden resolverse empleando un procedimiento de optimización. Un problema tipico de ingeniería se puede describir de la siguiente manera: se tiene un proceso que puede ser representado a través de ecuaciones matemáticas o por datos experimentales. Se establece un criterio de desempeño tal que se minimice un costo. El objetivo de optimizar es encontrar los valores de las variables del proceso con los cuales se obtenga el mejor valor para el criterio ' Este apartado se basa en la referencia [64] 3-9 Capitulo 3. Análisis de sensibilidad y optimizacidn sin restricciones de desempeño. Esto involucra un compromiso entre el capital y el costo de operación. Los elementos descritos (proceso o modelo y el criterio de desempeño) constituyen el problema de "optimización". Los problemas típicos en el diseño de ingeniería química u operación de plantas, tienen muchas o un número infinito de soluciones. La optimización está enfocada a seleccionar la mejor solución del conjunto total de soluciones, a través de métodos cuantitativos eficientes. En la operación de plantas, los beneficios surgen del desempeño de la planta, esto lleva a la reducción de contaminantes, reducción en el consumo de energía, lograr velocidades altas de procesamiento, etc.; la optimización puede también reducir los costos de mantenimiento, menor uso de la maquinaria y su mejor empleo. Existen algunos aspectos que deben considerarse para establecer un problema de optimización. A continuación se establecerán las condiciones para optimizar, es decir encontrar una máximo o un mínimo en funciones de una o varias variables. 3.2.1 Funciones de una variable2 hi f(X) Figura 3.6 Representación de una función de una variable , * Este apartado se basa en la referencia [65] ~~ 3-10 ~~~ .. iún siir restricciones La aproximación clásica al problema de encontrar los valores xo y x* es encontrar ecuaciones que se satisfagan para xo y x*. La función representada en la figura 3.6, así como sus derivadas son funciones continuas, y se puede observar que en ambos puntos xo y x* la derivada f ' ( x ) (gradiente de la función), es cero. fyx) = o (3.13) Los valores en el punto x,,, , en el cual se encuentra un máximo local, y x,, que es un punto de inflexión, también satisfacen esta ecuación. Entonces, la ecuación (3.13) es sólamente una condición necesaria para la existencia de un mínimo en la función f(x), pero no es una condición suficiente. Sin embargo, se aprecia que en los valores xo y x', f ' ( x ) cambia de signo negativo a signo positivo. En x, el cambio de signo es de positivo a negativo, mientras que en x, la derivada no cambia de signo mientras x pasa a través del valor x,. Entonces, en un mínimo la derivada es un incremento de la función y como la razón de cambio en el incremento de f ' ( x ) es medida por la segunda derivada, se espera que: f"(xo) > O, f"(x*)>O mientras que f"(xm) < O (3.14) Los resultados intuitivos pueden demostrarse considerando la serie de expansión de Taylor de f(x) en xo (o x* o x,,,). Es necesario que la función y sus derivadas sean continuas. f (X, hZ + h ) - f ( X , ) = hf'( X , ) + f"(X , ) + ... 2! (3.15) Si xo es un punto en el cual se tiene un mínimo, entonces el término de la parte izquierda de la ecuación (3.15) es positivo para todo huh1 < 6). Entonces f ' ( x , ) tiene que ser cero, y ésta es la condición necesaria para la existencia de un mínimo de f(x) (ver ecuación 3.13). Si f ' ( x , ) > O un valor negativo Suficientemente pequeño para h, haria que el término del lado derecho de (3.15) sea negativo; si por el contrario, f ' ( x , ) < O un valor positivo suficientemente pequeño para h, haría que el término del lado derecho de (3.15) también sea negativo. Como el siguiente término involucra h2, se observa que si: f " (x, ) > o se tendrá un mínimo de la función f(x). Si f ' ( x , ) = O argumentos similares, x, es' un máximo. - (3.16) y f"(x,,,) < O, entonces por 3-1 I Capitrrln 3. AiiRlisis de sensibilidad y npiiniiznciÚn sin resiriccioiics El caso ambiguo dónde f " ( x ) = O puede resolverse si se continua con la serie de expansión de Taylor: h2 h3 h4 (3.17) f ( X , + h ) - f ( x , ) = h f ' ( x , ) + -f " ( X , ) + -f " ' ( x, ) + -f""( X , ) + ... 2! 3! 4! Se puede establecer entonces una regla: Si f(x) y sus derivadas son continuas, entonces xg es un punto extremo (máximo o mínimo) si y sólo si n es par, donde n es el orden de la primera derivada en xg. Si f " ( x , ) < O , entonces xg es un máximo; si f " ( x , ) > O , entonces xo es un rninirno. 3.2.2 Funciones de n variables3 Consideremos la función de n variables reales: f ( x i , x ~ ~ x 3 , . . . =~ nf(x) ) (3.18) El punto con coordenadas (xr,xz,...,xn) en el espacio Euclidiano n es denotado por un vector columna x. El gradiente de la función ( a f / a x , , a f / a x , ,...,af/ax,,) es denotado por V f ( x ) . La matriz Hessiana de f(x) es denotada por H(x) y es una matriz simétrica de n x n con elementos: (3.19) f(x) tiene un mínimo en xo si existe una vecindad alrededor de xg tal que f(x) es al menos un poco mayor que f(xo) para todos los puntos de la vecindad; es decir, existe un 6positivo, tal que para Ix - x,I < 6 , f(x) .: f(xo). Para un mínimo global en x*, f(x) 2 f(x*) para todo x. Con estas definiciones y suposiciones ciertas, se puede generalizar la ecuación (3.15). de la manera siguiente: = hTV f (x, ' Este apartado se basa en 3-12 1 ) + -- h r H ( x , )h + .._ 2 la referencia [65] (3.20) Capitulo 3. .halisi.s de scnsihilidad y opiinii:acid~i si11 resfriccio~ies Entonces, si xo es un minimo para f(xJ. cada primera derivada parcial d f j a x , ( i = l .....n) desaparecerá en XO. En el caso en que xo sea un máximo escogiendo apropiadamente hj se puede hacer que f(xo+h) - f(xoxo)sea negativo. Así, la condición necesaria para la existencia de un mínimo en xo es: V f (x , ) =o (3.21) De esta forma, si los términos de orden superior en la ecuación (3.20) se desprecian, el signo de f(xo+h) - f(xo) esta determinado por: 1 2 - h r H ( x , )h (3.22) Si H(xo) es positiva definida, entonces la ecuación (3.22) es positiva para toda h. Entonces, las condiciones suficientes para la existencia de un mínimo son: Of( x, ) = O , H( xo ) sea positiva definida (3.23) H ( x , ) sea negativa definida (3.24) Para un máximo se requiere que Vf(x,)=O, Hasta el momento, se han establecidos los conceptos para la optimización sin restricciones; sin embargo, como se mencionó anteriormente el problema que concierne es la optimización con restricciones. En el siguiente capítulo se hablara de este problema. : 3-14 .. Capítulo 4 Programación cuadratica secuencia1 1 - ysu aplicación en las redes neuronales artificiales 4.1 Optimización no lineal con restricciones El problema general de optimización con restricciones consiste en minimizar una función no lineal sujeta a restricciones. Existen dos formulaciones equivalentes de este problema [66,67], ellas son: rnin {f(x): gj(x) SU, jsI, h,(x) = O, j c E } (4.1) donde cada gj y hj es un mapeo de 91" a 91, e I y E son los indices para los conjuntos de restricciones de desigualdad y de igualdad, respectivamente. y la otra formulación es: ' 8, h(x) = O , rnin{f(x): I S X ~ U ] I donde h se mapea de 91" a 91m, y I y u son los límites inferiores y superiores del vector x . La función no lineal f(x), así como las funciones g(x) y h(x) que describen a las restricciones, deben de ser suaves [68]. Como se mencionó en el capítulo anterior, se han propuesto diferentes técnicas de solución al problema de optimización con restricciones. Sin embargo, el que reporta la literatura como el más poderoso para la solución de este tipo de problemas es el método de programación cuadrática secuencia1 (Sequential Quadratic Programming SQP) [69,70]. La base de estos métodos de solución es la función de Lagrange o Lagrangiano. Éste se forma incluyendo la función objetivo, las restricciones de igualdad con su respectivo multiplicador de Lagrange y las restricciones de desigualdad con un multiplicador de Lagrange adicional. La expresión que representa al Lagragiano es la siguiente: (4.3) 4.2 Condiciones necesarias y suficientes para un mínimo local Las condiciones necesarias.para que x* sea un mínimo local de f(x). son: [71] 1. Que el gradiente del Lagrangiano sea igual a cero, es decir m VL(x,w,u)= V f ( X ) + - p , V h , ( X ) ,=1 P ~u,Vg,(x)= o ,=,,,+l (4.4) 2. Que 1a.s funciones f(x), hj(x), g,(x) sean doblemente diferenciables en x*. 3. Que los multiplicadores de Lagrange existan. Las condiciones suficientes para que x* sea un mínimo de f(x), requieren que la matriz Hessiana del Lagrangiano sea positiva definida para todos los valores del 4-2 '. ..- vector v, para los cuales v T V g j ( x * ) = O ,y v'Vh,(x*)=O, esto es, que para todas las restricciones se cumple la condición siguiente: VTV2[L(X*,W*,U*)b >o (4.5) Las condiciones mencionadas con anterioridad son conocidas como las condiciones para optimización de Kuhn-Tucker [72,73]. Estas condiciones son la base para el diseño de algunos algoritmos y como criterio de terminación para otros. 4.3 Programación cuadrática secuencial (SQP) El algoritmo de programación cuadrática secuencial es una generalización del método de Newton [74] para problemas de optimización sin restricciones, en el que se encuentra una longitud de paso a partir del punto actual, minimizando el modelo cuadrático del problema. En el presente trabajo de tesis se empleó una función de MATLAB (ver apéndice A) que soluciona el problema de programación cuadrática secuencial [75]. 4.4 Identificación del CEllO Servo Trainer empleando el algoritmo SQP AI igual que en las identificaciones realizadas con el algoritmo OLL. fue necesario aplicar una señal de entrada, u,,,,(, en el amplificador que proporciona la señal adecuada al motor, para obtener los datos de la velocidad de la planta, yplan,con ésto se obtuvo un conjunto de datos de entrada-salida. Con este conjunto se realizó el entrenamiento del neuroidentificador y se estimaron sus parámetros, con el fin de copiar la dinámica de la planta. Para realizar la identificación de la planta CEllO Servo Trainer se empleó el algoritmo de estimación paramétrica de programación cuadrática secuencial (SQP). La función que se minimiza es semejante a la que se muestra en el apéndice A. El esquema empleado para la identificación se muestra en la figura 4.1. 4-3 Figura 4.I Esquema paralelo para la identificación de la planta CE1 I O Servo Trainer La estructura del neuroidentificador sigue siendo de una neurona en la capa de entrada, cuatro neuronas en la capa intermedia y una neurona en la capa de salida, pero ahora la RNA es estática (ver figura 4.2). Enlrad Pesos de la capa Intermedia Pesos de la capa de salida Figura 4.2 Estructura del neuro identilicador empleado para /a idenfificacion del CE110 Servo Trainer usando SOP * Los parámetros de la red neuronal artificial empleada para la identificacion del Servo Trainer, son los umbrales ( b ) ,los pesos de la capa intermedia ( w ) y los de la capa de salida (v). Asi, la entrada de la RNA se pondera a traves de los pesos de la capa intermedia, w, se le suma el umbral y se aplica la funcion de activacion de la neurona, en este caso una funcion sigmoidal; la respuesta de cada neurona, es ponderada pero'con los pesos (v) de la capa de salida. Se debe aclarar que los umbrales son multiplicados por la unidad. I ___ 2 3 4 5 4-4 Pesos w 0.066746 7.397896 -0.068960 -0.017636 . Pesos v .~ 15.621801 0.0000000 -36.981 109 -42.928650 Umbrales ___-0.0230381 0.1447089 -0.4825632 -0.0969537 164.5463893 - .- Se sabe que la sensibilidad de una RNA como la mostrada en la figura 4.2 está dada por la siguiente ecuación Si se analiza la sensibilidad a través del camino de conexión de la tercera neurona de la capa intermedia, desde la entrada hasta la salida, se puede observar que al multiplicar los pesos, la sensibilidad es positiva. Para el resto de las neuronas es positiva la sensibilidad, por lo que se cumple con que la sensibilidad del modelo es semejante a la sensibilidad de la planta. Fue necesario realizar 1303 iteraciones para lograr satisfacer el criterio de error cuadrático medio propuesto, cuyo valor fue de 0.082645 unidades. Los patrones con los que se entrenó la RNA son los que se muestran en la figura 4.3. iq O , , , , , , , , , 2 4 6 8 10 12 14 16 18 20 Muestras(Tiempo de muestre0 0.4 seg) Figura 4.3 Patrones de entrenamiento tomados del CE110 Servo Trainer, el tiempo de muestre0 fue de 0.4 segundos. Para llevar a cabo el entrenamiento de la RNA se usó una rampa de 21 datos, que se muestra en la figura 4.3. La señal de excitación está descrita por: ucOni(k) = ucon, ( k ) + 0 . 5 volts, el tiempo de muestre0 es de 0.4 segundos. Una vez que se entrenó la RNA, se le aplicó el mismo conjunto de datos de entrada que fue aplicado al motor (planta), con el fin de comparar su comportamiento contra el comportamiento real de la planta ante la misma señal de excitación (ver figura 4.4). Capífrrlo 4. Progrnnracióii crrodrrilica scmerrcial (SQP) 9, , , , J' s u a p l i c a c i h cn RNA I I ;. Muestras(Tlemp0 de muestre0 O 4 seg) Figura 4.4 Respuesta del CE11O Servo Trainer y del modelo obtenido con la RNA, el tiempo de muestre0 fue de 0.4 segundos. Como lo muestra la figura 4.4, el comportamiento del modelo es el esperado y se cumple con la condición de sensibilidad positiva. 4.4.1 Pruebas de generalización del modelo obtenido con el neuroidentificador En la primera prueba de generalización, se uso un conjunto de 163 datos. Para obtener estos datos, se excitó con una señal senoidal al Servo Trainer; su respuesta y la señal de excitación se muestran en la figura 4.5. La señal de excitación esta descrita por u,,, ( k )= 2.8 + 1.2 * sin(0.2454* k ) . Muesimas(Tiernpo de muerlreo 0.4 seg) Figura 4.5 Señal senoidal para evaluar el modelo del CEllO Servo Trainer, el tiempo de muestre0 fue de 0.4 segundos. . *- . .. ., Después se aplicó el mismo conjunto de datos de entrada al modelo obtenido con el neuroidentificador y entrenado con el algoritmo SQP. En la figura 4.6 se puede observar la velocidad del motor y la velocidad del modelo. Mueslras(Tiernpo de muesireo 0.4 seg) Figura 4. 6 Respuesta del CE110 Sew0 Trainery del modelo obtenido con la RNA, el tiempo de muestre0 fue de 0.4 segundos. En la misma figura se observa que el modelo obtenido para el C E l l O Servo Trainer a través del neuroidentificador entrenado con el algoritmo SQP, representa el comportamiento esperado de la planta y la sensibilidad del modelo es semejante a la sensibilidad de la planta. Como las gráficas anteriores muestran el buen desempeño cualitativo del modelo y se asegura que la sensibilidad del modelo es semejante a la sensibilidad de la planta al usar el método de estimación paramétrica con restricciones, se procedió a la identificación de una planta, cuya variable de interés es el flujo de un liquido. 4.5 Identificación del módulo de regulación de flujo empleando el algoritmo SQP Para la identificación del módulo de regulación de flujo fue necesario aplicar una señal de entrada, u,,,, , en la bomba de CD, para obtener los datos del flujo la planta, yPi,,, con ésto se obtuvo un conjunto de datos de entrada-salida. Con este conjunto se realizó el entrenamiento del neuroidentificador y se estimaron sus parámetros, con el fin de copiar la dinámica de la planta. . . 4-7 Capiriilu 4. Pro~graniacihcuadrática scriwricial (SQP)y sii apliracih cii RN:I Para realizar la identificación de la planta se empleó el algoritmo de estimación paramétrica de programación cuadrática secuencia1 (SQP). La función que se minimiza es semejante a la que se muestra en el apéndice A. El esquema empleado para la identificación se muestra en la figura 4.7 de flujo Figura 4.7 Esquema paralelo para la identificación de la planta módulo de regulación de flujo La estructura del neuroidentificador es de una neurona en la capa de entrada, cuatro neuronas en la capa intermedia y una neurona en la capa de salida, y la RNA es estática (ver figura 4.2). Los parámetros de la red neuronal artificial empleada para la identificación del módulo de regulación de flujo, son los umbrales ( b ) , los pesos de la capa intermedia (w) y los de la capa de salida (v). Así, la entrada de la RNA se pondera a través de los pesos de la capa intermedia, w, se le suma el umbral y se aplica la función de activación de la neurona, en este caso una función sigmoidal; la respuesta de cada neurona, es ponderada pero con los pesos (v) de la capa de salida. Se debe aclarar que ¡os umbrales son multiplicados por la unidad. El vector de pesos y umbrales para el neuroidentificador obtenido es: 1 2 3 4 5 Pesos w 0.074348 3.507698 -0.023078 -0.010662 Pesos v 0.097957 76.01 5352 -298.497568 -292.714007 Umbrales 399.930104 1.970191 -1.025592 La sensibilidad de una RNA como la mostrada en la figura 4.2 está dada por la siguiente ecuación 4.29. Si se analiza la sensibilidad a través del camino de conexión de la tercera neurona de la capa intermedia, desde la entrada hasta la salida, se puede observar que al multiplicar los pesos, la sensibilidad es positiva. Para el resto de las neuronas es positiva la sensibilidad, por lo que se cumple con que la sensibilidad del modelo es semejante a la sensibilidad de la planta. 4-8 - : , . .d- , ,' . Cnpiiirlu 4. Propamociún ciraúrriiicn .smiorciul .(SUI') y s u aplicucioti eti RNA Fue necesario realizar 1309 iteraciones para lograr satisface[- el criterio de error cuadráiico medio propuesto, cuyo valor fue de 0.481443 unidacles. Para llevar a cabo el entrenamiento de la RNA se usó una rariipa de 8 datos, que se muestra en la figura 4.8. La señal de excitación esta descrita por: uConI ( k ) = u,,,, ( k )+ 1 .O volts, el tiempo de rnuestreo es de 0.4 s(::gundos. Muestras(Tiempo de rnuestreo 0.4 seg) Figura 4.8 Patrones de entrenamiento tomados del riióilulo de regulación de flujo, el tiempo de mueslreo fue de 0.4 segundos. Una vez que se entrenó la RNA, se le aplicó el mismo conjunto de datos de entrada que fue aplicado al módulo de regulación de flujo (planta), con el fin de comparar su comportamiento contra el comportamiento real de la planta ante la misma señal de excitación (ver figura 4.9). 11 r 11, 10- ,_--- a- 7- Muestras(Tiemp0 de muestreo 0.4 seg) Figura 4.9 Respuesta del módulo de regulación de f k j o y del modelo obtenido con la RNA, el liempo de muestreo fue de 0.4 segundos. Cupífrrlo 4. Progruiiruci6ii cirurlraricu secrreirciui (SQP) J! s u uplicucioir cii RNA - Como lo muestra la figura 4.9, el comportamiento del modelo es el esperado y se cumple con la condición de sensibilidad positiva. 4.5.1.1 Pruebas de generalización del modelo obtenido con el neuroidentificador En la prueba de generalización, se usó un conjunto de 320 datos. Para obtener estos datos, se excitó con una señal senoidal al módulo de regulación de flujo; su respuesta y la señal de excitación se muestran en la figura 4.10. La señal de excitación está descrita por u,,~ ( k ) = 4.88 + 2.12 * sin(0.2454 * k ) . O 50 100 150 200 250 300 I Muesiras(Tiemp0de muestre0 0.4 seg) Figura 4.10 Sei,al senoidal para evaluar el modelo del modelo de regulación de flujo, el tiempo de muestre0 fue de0.4 segundos. Después se aplicó el mismo conjunto de datos de entrada al modelo obtenido con el neuroidentificador y entrenado con el algoritmo SQP. En la figura 4.1 1 se puede observar el flujo de la planta y el flujo del modelo. En la misma figura se observa que el modelo obtenido para el modulo de regulación de flujo a través del neuroidentificador entrenado con el algoritmo SQP, representa el comportamiento esperado de la planta y la sensibilidad del modelo es semejante a la sensibilidad de la planta. 4-10 - I O 50 100 150 200 250 300 I Mueslras(Tiempa d e muestreo 0 . 4 seg) Figura 4.11 Respuesta del módulo de regulación de flujo y del modelo obtenido con la RNA, el tiempo de muestreo fue de 0.4 segundos. Como las gráficas anteriores muestran el buen desempeño cualitativo L-. modelo y se asegura que la sensibilidad del modelo es semejante a la sensibilidad de la planta al usar el método de estimación paramétrica con restricciones, se procedió a la implernentación del esquema de control indirecto, el cual será descrito en el capítulo siguiente. Cabe señalar que para los prototipos de laboratorio CE110 Servo Trainer y para el módulo de regulación de flujo la sensibilidad siempre es positiva en toda su región de operación, ya que para un incremento en la señal de control, corresponde un incremento en la señal de salida de la planta. Para un sistema altamente no lineal el cuál tenga una sensibilidad positiva en algunos puntos dentro de su región de operación, y una sensibilidad negativa en otros puntos de su región de operación, es posible emplear el método de estimación paramétrica con restricciones (SQP) para calcular los parámetros de un neuroidentificador. Esto se puede lograr estableciendo nuevas restricciones, que van a depender de los valores para los cuales la sensibilidad es positiva y de los valores para los cuáles la sensibilidad es negativa. Mientras que los métodos de estimación paramétrica generalmente empleados para el entrenamiento de un neuroidentificador, van a seguir adoleciendo de que sus parametros (pesos y umbrales) pueden ser positivos o pueden ser negativos. 4-1 I Capirirlo J. Pro~ramariónciradráfica sccrrcncial (SQP) 4-12 .v SII apliraci<iii CII RiV.4 Capítulo 5 Resultados 5.1 Implementación del esquema de control indirecto El esquema de control implementado con redes neuronales artificiales es el esquema de control indirecto [76], que se muestra en la figura 5.1 refei - L/ / Neurocontrolador /, UC0"Sk) YP."(' Planta + - Neuroideniificador I I '.............sensibilidad '..., ...................... .._< Figura 5.1 E s y u m a de control indirecto basado en redes neuronales artificiales Capítulo S. Resrrltatlns Como ya se mencionó, este esquema de control consta de dos etapas: La primera etapa consiste en realizar una identificación de la planta, en este caso a través de un neuroidentificador (RNA), el cual copia la dinámica de la planta: Ym(k,uc,,,1 P ) = Y d a n (k,u,,m ) ' 9 (5.1) donde p=[wi,vJ es el vector de parámetros del neuroidentificador. Mediante el uso de un algoritmo de estimación paramétrica con restricciones (SQP) se asegura que la sensibilidad del modelo es semejante a la sensibilidad de la planta de forma global, como lo indica (5.2): (5.2) El neuroidentificador ajusta sus parámetros con base en un indice de desempeño o criterio de error que está dado por la diferencia de la salida de la planta y la salida del modelo: La segunda etapa consiste en encontrar una ley de control adecuada, a traves del neurocontroiador, de tal forma que la salida de la planta siga a una referencia deseada, es decir: Ypia"(k>UcOnr ) = refew) (5.4) y el objetivo de control está definido de la siguiente manera: donde E es un criterio de error, éste puede ser definido como un error cuadrático medio: Es evidente que el minim0 de (5.6) se puede encontrar derivando la ecuación As¡, respecio a uconf. (5.7) -~ 5-2 ,, .II > - - Capifulo5. Kmrifados donde: m=O h 4 La derivada parcial de (5.7) respecto a cada uno de los parámetros genera un sistema de nxn ecuaciones lineales cuya solución se encuentra empleando el método de Levenberg-Marquardt [77] ( n es el número de parámetros del neurocontrolador). En lo referente a la adquisición y envío de señales de los prototipos de laboratorio, se empleó una tarjeta ATMIO-16X de National Instruments No. parte 776578-01 [78]. Para señales analógicas se tienen 16 canales de entrada y 2 canales de salida. Como los procesos son SISO, se emplearon dos canales analógicos, uno de entrada y otro de salida. La interfaz gráfica empleada es la que se muestra en la figura 5.2. En la pantalla superior se grafica la señal de control, mientras que en la pantalla inferior se grafica la señal de salida de la planta y la señal de referencia. ' 1 ....... j lo1x I ..... - ...... a 20 ,.'.i'40 ' 59;. ' 7 9 , 9 9 1 . ~ ... Acuakacví? del bdle, DiA . . . . . . . . . . . . . . .... F-" ,~. O ~ .I i , .. ............. . . . . . Figura 5.2 Intedaaz gráfica . . Fue necesario el empleo de dos computadoras personales para la implernentación del esquema de control, debido a que el algoritmo de estimación de los parámetros del neuroidentificador es complejo y toma tiempo considerable la 5-3 obtención de modelos. Así que, mientras en una PC se realiza la adquisición de los datos de la salida de la planta y la generación (estimación paramétrica del neurocontrolador) y envío de la señal de control, en la otra PC se realiza el proceso de estimación paramétrica del neuroidentificador, con el fin de entrenar a la RNA y de esta manera se logra el aprendizaje de la dinámica de la planta y tener un control en tiempo real (ver figura 5.3). Las computadoras se encuentran conectadas a través de un protocolo TCPllP haciendo uso de la red. La programación fue desarrollada en lenguaje C y se empleó la plataforma de Labwindows v.5.2 [79] debido a la facilidad que presenta para realizar la interfaz gráfica y las herramientas de programación para establecer comunicación entre dos computadoras. Planta Adquisicion de la seiial de la planta y envio de la seiial de control @ E n v i o del conjunto de datos entrada-salida para la estimación de parámetros @ Estimacion parametrica @ Enviodelosparámetros estimados del neuroidentificador Figura 5.3 lmplemenfación del esquema de control indirecto con la ayuda de computadoras personales Para realizar el control a través de las redes neuronales artificiales empleando el esquema de control indirecto mostrado en la figura 5.1, se consideran dos prototipos de laboratorio: I.CEI 10 Servo Trainer. 2. Módulo de regulación de flujo El prototipo del intercambiador de calor RCT 100 ya no fue empleado para la implementación del esquema de control, debido a que la dinámica de este sistema es muy lenta y en las pruebas de identificación (ver figura 2.8 del capítulo 2) fue necesario invertir hasta 4.72 hrs con el fin .de obtener un conjunto de datos entrada-salida que serían útiles para lograr una identificación. Se propone usar el prototipo de laboratorio de regulación de flujo, debido a que presenta una dinámica mucho más rápida que la del intercambiador de calor RCT 100. 5 -4 r.tx* -a,..- i ,,r (“it‘ .~ Capitulo 5. Resultados 5.2 Control del CE11O Servo Trainer La constante de tiempo de este sistema es aproximadamente de 1.5 seg [80]. Se recomienda un tiempo de muestreo entre 0.1 y 0.3 veces la constante de tiempo del sistema [81,82]. Para el caso específico se propuso un tiempo de muestreo de 0.4 seg. Las pruebas que se realizaron en este prototipo son las siguientes: I.Regulación y seguimiento sin perturbación. 2. Regulación con perturbación. 3. Regulación y seguimiento de una trayectoria con una no linealidad en la señal de control y sin perturbación. 4. Regulación con una no linealidad en la señal de control sin perturbación y en presencia de la misma. A continuación se explica cada una de ellas y se muestran las gráficas de respuesta. 5.2.1 Regulación y seguimiento sin perturbación Para el CEllO Servo Trainer se realizó una prueba de seguimiento y regulación sin perturbación empleando el esquema de control indirecto. En la región A de la figura 5.4, se aplica una referencia de velocidad descrita por la ecuación refer(k) = 2.8 + 1.2 * sin(0.2454 * k ) volts, en la misma figura es posible apreciar el buen desempeño de la estructura de control. En este caso, el neuroidentificador tenía un buen modelo numérico de la planta, debido a que se encontraba previamente entrenado, es por ésto que es posible seguir inmediatamente a la referencia. Posteriormente se hace un cambio de referencia para lograr el control del motor en regulación a refer(k) = 2.5 volts en la región B. En la región C se muestra otro cambio de referencia, en esta región se realiza el seguimiento de una trayectoria de velocidad cuyo comportamiento está descrito por la ecuación refer&) = 5.0 + 2.0 *sin(0.2454 k ) volts. Finalmente se aplica otro cambio de referencia de refer(k)=5.0 volts, como se muestra en la región D. 5- 5 La figura 5.4 muestra que la señal de la planta sigue satisfactoriamente a la señal de referencia predefinida, tanto en seguimiento, como en regulación. r I Muestras(Tiemp0 de rnuesireo 0.4 Seg) Figura 5. 4 Gráfica de /a respuesfa de/ Servo Trainer en seguimiento y regulación sin perturbación 5.2.2 Estrategia de control para rechazo a perturbaciones La regulación en presencia de perturbación se realiza empleando la siguiente estrategia de control. Partiendo del hecho que se tiene controlada a la planta, se aplica una perturbación en el región A como puede observarse en la figura 5.5, y se hace la conside;ación que. la salida de la planta decrece. El control detecta que existe un error mayor al permitido, en este caso 2.5%, deshabilita la señal de control del neurocontrolador e inyecta como señal de control una rampa, de tal forma que la salida de la planta tienda a incrementarse hasta alcanzar a la referencia. La respuesta de la planta y la señal de control son almacenados en una tabla y con ellos se obtiene un modelo a través del proceso de estimación paramétrica, el ) modelo se usa en la etapa de control para lograr que ~ ~ , ~ , , (=krefer(k). Se supone ahora que la señal de la planta se incrementa debido a otra perturbación, como se muestra en la región B de la figura 5.5. La señal del neurocontrolador se deshabilita y se introduce una rampa pero con pendiente negativa, con el fin de que la señal de la planta tienda a disminuir y así se logre alcanzar a la referencia. Nuevamente, la salida de la planta y la señal de control aplicada son almacenados en una tabla y con ellos se obtiene un nuevo modelo a 5-6 través del procedimiento de estimación paramétrica, y así encontrar una ley de control adecuada para lograr el objetivo de control. 5.2.3 Regulación con perturbación En la figura 5.6 se muestra la respuesta del sistema en una prueba de regulación sin carga, la referencia de velocidad es refer(k)= 2.5 volts. En la región A se logra controlar a la planta y se tiene un error del 1.7%; en el punto A se aplica una perturbación y se puede observar en la gráfica que la sintonización de los parametros se lleva a cabo hasta que se obtiene otro modelo con el cual nuevamente se logra controlar a la planta y tener un error del 3.6% en la región B. . Muesbas(Tiemp0 de mwslreo 0.4 segl Figura 5.6 Regulación sin/con carga para el CEllO Servo Traine: Capitulo 5. Resullados 5.2.4 Regulación y seguimiento de una trayectoria con una no linealidad en la señal de control y sin perturbación La siguiente prueba que se realizó fue aplicar una no linealidad al sistema CEllO Servo Trainer, la cual consistió en sumar un nivel de 1.8 volts a la señal de control, y además de un bloque de histéresis. En la figura 5.7 se muestra la señal de control y la respuesta del motor ante tal señal de control y la respuesta del sistema. Muestras Figura 5.7 Sena1 de control con histéresis y offset ap :ai ai CE110 Sew0 Trainer y su respuesta S 3 Una de las pruebas consistió en la regulación de una señal descrita por un escalón refer(k) = 4.0 vo/ls, una vez que se logró que la salida del motor fuera de aproximadamente 4.068 volts, que corresponde a un error de 1.72%, como se observa en la región A de la figura 5.8. En la muestra k=764 se aplicó una señal de referencia senoidal descrita por refer(k) = 5.0 + 2.0 sin(0.2454 * h ) VOMS como se muestra en la región B de la figura 5.8. En la misma figura se puede observar el buen desempeño del esquema de control indirecto. 5-8 1.5 2.5 I O 50 1W 150 200 250 300 I Muesiras(Tiempo de muestre0 0.4 seg) Figura 5.8 Respuesta del sistema en regulación y seguimiento de una trayectoria, sin carga y en presencia de una no linealidad en la sena1 de control 5.2.5 Regulación con una no linealidad en la señal de control sin perturbación y en presencia de perturbación Otra prueba fue la regulación de la salida a una señal de referencia de 5 volts. El modelo inicial que tiene el neuroidentificador (pesos y bias) no corresponde al modelo de la planta con la no linealidad, así que al principio el error es de 35.2%, como se muestra en la figura 5.9. AI detectar un error mayor al 2.5%, el esquema global de control inicia el proceso de sintonización de parámetros del neuroidentificador, con el fin de lograr copiar la dinámica de la planta. El nuevo modelo obtenido se emplea en el esquema de control para sintonizar los parámetros del neurocontrolador (basados en la sensibilidad del modelo y el error entre la salida de la planta y la referencia deseada) con el objeto de logar que la salida de la planta siga a la referencia. En la región A de la figura 5.9, se puede observar que se ha logrado controlar al sistema para la referencia deseada con un error menor al 1%. Una vez que se logra realizar el control, se aplica una carga al motor en el punto A, de tal forma que su salida disminuye y el error se incrementa a 30.6%. Nuevamente inicia el proceso de sintonización descrito, hasta que se logra controlar al sistema en la región B con un error de 0.6%. 5-9 - Capitulo 5. Rtwltados _--___m____ 2W 250 Muestras(Tiernp0 de muestre0 0.4 Seg) 50 100 150 I Figura 5.9 Respuesta del sistema a)en presencia de una no linealidad en la señal de control para parámetros de/ neuroidentificador desconocidos; b) perturba. cion en el sistema 5.3 Control del módulo de regulación de flujo El otro caso de estudio para implementar el esquema de control indirecto, es un módulo de regulación de flujo de FESTO DIDACTIC. Las pruebas que se realizaron en este prototipo son las siguientes: 1. Seguimiento sin perturbación. 2. Regulación con perturbación. 5.3.1. Seguimiento sin perturbación En la gráfica que se muestra en la figura 5.10, se observa una prueba donde la señal a seguir es refer(k) = 2.8 + 1.2 * sin(0.2454 * k ) . En la parte inferior del primer periodo de la señal senoidal, se tiene un error de 18% entre la salida de la planta y la señal de referencia y conforme transcurre el tiempo se obtienen nuevos modelo en linea, de tal forma que se logra llegar a un 13% de error en la zona inferior de la senoidal, en tanto para el resto de la señal se logra realizar un buen seguimiento. 5-10 O 50 100 150 200 250 3W I Muesiras(Tiempo de rnuestreo 0.4seg) Figura 5.10 Respuesta del seguimiento de un flujo deseado sin perturbación 5.3.2. Regulación con perturbación En la figura 5.1 1, se muestra una prueba de regulación a la que se le aplica una períurbación, por medio de la válvula manual. Punto Muestras(Tiernpo de rnuectreo 0.4 seg) Figura 5.11 Regulación sin/con perturbación en la válvula 5-1 1 - Capifrrlo 5. Resirifados - El sistema se arranca con un modelo que no corresponde a la dinámica del proceso, aún así se logra tener un error en regulación del 6.6%. Sin embargo debido a que se desea que el error sea menor que el 2.5%0,inicia el proceso de sintonización de los parámetros del neuroidentificador a través de la estimación paramétrica hasta obtener un modelo, este modelo (como se mencionó anteriormente) es usado para ajustar los parámetros del neurocontrolador, de tal forma que se logre que la salida de la planta siga a la referencia. Como se muestra en la región A de la figura 5.1 1, se 1,ogra que el error sea menor al 1%. En el punto A de la figura 5.1 1, se aplica una perturbación al cerrar la válvula manual, no completamente, pero sí de manera considerable, de tal forma que el flujo del líquido disminuye por lo que genera que el error se incremente hasta 47.3%, as¡ que se inicia nuevamente el proceso de sintonización descrito y se logra regular el flujo del liquido con un error del 1.3% en la región B. 5-12 Capítulo 6 Conclusiones de los resultados . .. obtemdos 6.1 Resultados obtenidos Con base en los resultados obtenidos en el desarrollo de este tema de investigación, se concluye lo siguiente: 1. Para la identificación de sistemas no lineales se ha mostrado que los algoritmos de entrenamiento generalmente empleados en las redes neuronales artificiales, cumplen que la sensibilidad del modelo numérico obtenido sea semejante a la sensibilidad de la planta de manera local. De tal forma que siempre existe la posibilidad de la existencia de un conjunto de datos entradasalida para el cual el comportamiento del modelo no sea el esperado. Por lo tanto debe de tenerse cuidado en la selección del algoritmo de entrenamiento para las redes neuronales artificiales. 2 . Se logró mostrar el buen desempeño de las redes neuronales artificiales en la identificación de sistemas no lineales, empleando un algoritmo de estimación parametrica. con restricciones, de tal forma que la sensibilidad del modelo numérico obtenido es igual a la sensibilidad de la planta para cualquier conjunto de datos de entrada-salida. .. 3. Los métodos de estimación paramétrica generalmente empleados en las redes neuronales artificiales son capaces de encontrar un mínimo global de la función objetivo, el método de estimación ' paramétrica con restricciones encuentra un mínimo local de la función objetivo. Sin embargo, cuando se obtienen modelos numéricos usando RNA y empleando el método de estimación paramétrica con restricciones se cumple que la sensibilidad del modelo sea semejante a la sensibilidad de la planta. 4. Si la sensibilidad de una planta cambia dependiendo del punto de operación de ésta, es posible emplear el método de estimación paramétrica para calcular los parámetros del neuroidentificador teniendo cuidado de establecer correctamente las restricciones que serán función de la sensibilidad. 5. AI lograr tener un buen modelo numérico del sistema no lineal, se asegura que el neurocontrolador encontrará una ley adecuada, al menos en sentido, de tal forma que es altamente probable que se satisfaga el objetivo de control. 6. Con el presente trabajo se muestra que con la implementación del esquema de control indirecto basado en redes neuronales artificiales y empleando el método' de estimación parametrica de programación cuadrática secuencia1 (SQP) se obtienen,resultados satisfactorios aplicándolo en linea en los dos problemas del control: regulación' y seguimiento de trayectorias predefinidas, logrando errores hasta de 0.6% entre la señal de referencia y la salida de la planta. 7. El tiempo que se lleva el sistema en controlar a la planta no se debe a que el neurocontrolador realice un número considerable de iteraciones para lograr encontrar una ley de control adecuada, sino que se debe al número de iteraciones que realiza el neuroidentificador para lograr copiar la dinámica de la planta. En este sentido, el tiempo para la obtención de modelos numéricos a través de las redes neuronales artificiales es hasta de 80 seg., los mejores casos fueron de 40 seg. Sin embargo no es posible mejorar de manera considerable este tiempo, ya que es debido al tiempo de procesamiento de la máquina. 8. Cabe señalar que, por la forma de adquirir los datos, es decir, estableciendo que la derivada de la señal de la planta respecto al tiempo de muestre0 fuera menor al 2%. dy,,(k)/dk <0.02, de tal forma que se aseguraba que el sistema estaba en estado estacionario cuando se realizaba la lectura, fue posible emplear redes neuronales artificiales estáticas para la identificación de las plantas dinámicas empleando el algoritmo de estimación paramétrica SQP. 9. Se tiene la necesidad de contar con dos computadoras personales para la implementación del esquema de control indirecto basado en redes neuronales artificiales, debido a que el método de estimación paramétrica es complejo y 6-2 .vsCfif?.!.v;*"'+--* Capítulo 6. Conclusiones requiere de una cantidad considerable de iteraciones(l300 aproximadamente) para encontrar modelos numéricos adecuados. 10.Un problema de las redes neuronales artificiales es que no existe una metodología para la selección del tipo de RNA a utilizar, el número de patrones para el entrenamiento, número de capas, número de neuronas en cada una de las capas, etc. La selección de la estructura de la RNA se hizo a través de un proceso de prueba y'error, es decir, se proponía una estructura sencilla, se entrenaba a la RNA y si no se lograba el comportamiento deseado, se agregaban patrones de entrenamiento y nuevamente se entrenaba a la RNA. Si aún así no se lograba tener el comportamiento deseado, se procedía entonces a agregar neuronas en la capa intermedia de la RNA, con ello se aumenta el número de parámetros que es necesario estimar, es por ésto que mientras más sencilla sea la estructura de la RNA, se tiene un menor número de parámetros a estimar.^ es menor el tiempo de cómputo para realizar el aprendizaje de la RNA. 11. Para sistemas SISO, se recomienda proponer inicialmente una RNA cuya estructura sea sencilla, por ejemplo una RNA con una neurona en la capa de entrada, tres neuronas en la capa de salida y una neurona en la capa de salida. Los patrones de entrenamiento representan un elemento primordial en la etapa de aprendizaje o entrenamiento de la RNA, y durante la etapa de experimentación se observó que el aprendizaje se altera cuando se presentan repeticiones o ausencias de datos en ciertas regiones o zonas. Una forma de solucionar ésto es intentar distribuir los patrones de entrenamiento en toda la región de trabajo, lo cual se puede lograr muestreando adecuadamente y aplicando una señal de excitación que distribuya los patrones de entrenamiento lo mejor posible, en la etapa de obtención de datos para entrenamiento. A diferencia de la identificación para sistemas lineales, a partir de un análisis de frecuencia en donde la señal impulso, escalón o una señal pseudoaleatoria tienen preferencia por excitar más modos del sistema, los patrones de entrenamiento para una RNA deben estar distribuidos en la región de trabajo de tal forma que se logre copiar la dinámica del sistema en todo el rango de operación de la planta y se prefiere que no estén repetidos o que no se encuentren tan juntos, de esta forma la RNA puede llegar a copiar de forma adecuada el comportamiento de la planta o sistema. 12.La estructura del neuroidentificador, ya sea MISO o SISO, depende de la dinámica del sistema, ya que para dinámicas muy lentas, por ejemplo el intercambiador de calor RCT 100, fue necesario incluir una entrada extra a la RNA con el fin de lograr copiar su dinámica. En cambio, para sistemas cuya respuesta dinámica es mas 'rápida' (CE110 Servo Trainer o módulo de regulación de flujo) bastó con tener una entrada en la RNA para lograr copiar la dinámica del sistema. 6-3 Capitulo 6. Conclusiones 13.Se logró trabajar en el control indirecto en línea, lo cual muestra la capacidad de las redes neuronales artificiales estáticas para la identificación y control de cualquier sistema no lineal. 14.Usando el algoritmo de estimación paramétrica SQP para el entrenamiento del neuroidentificador, se han obtenido resultados que indican robustez del esquema de control ante perturbaciones aún cuando el aquel este en lazo abierto. 15. El entrenamiento del neuroidentificador permite obtener modelos numéricos eficientes de tal forma que se copia la dinámica de la planta. Se trabajó con plantas SISO, para las cuales las estructuras del neuroidentificador fueron SISO (CE110 Servo Trainer o módulo de regulación de flujo) y MISO ( intercambiador de calor RCT 100). Sin embargo, es posible realizar la identificación de planta MIMO o SIMO, para lo cual basta con agregar en la función de error que se propone el término que representaría a la salida extra de la planta en función de la entrada. Se empleó una ' RNA en el neuroidentificador, aunque es posible también trabajar con RNA dinámicas, la Única modificación que se realizaría es agregar la recurrencia en la función de error que se propone. 6.2 Trabajos futuros Trabajar con redes neuronales artificiales dinámicas empleando el algoritmo de estimación paramétrica SQP, con el fin de comparar el desempeño del neuroidentificador empleando ambas estructuras de redes neuronales artificiales. Investigar, además de la estructura de control indirecto basada en redes neuronales artificiales, nuevos esquemas de control basados en redes neuronales artificiales, tales como el esquema de control inverso, esquema de control con modelo de referencia, por nombrar algunos. Resulta interesante investigar acerca de la implementación en hardware de la RNA, así como también del método de estimación paramétrica. Otro punto de interés es investigar la posibilidad de desarrollar algoritmos con técnicas de búsquedas múltiples para la solución del problema de optimización. Esto es, si tenemos una superficie que representa la respuesta del sistema, nos colocamos en un punto deseado, y allí proponemos una función de error cuadrático medio, el punto deseado puede tocar en algún lado al paraboloide generando dicha función de error, pero no sabemos si este punto representa al mínimo. La idea es encontrar este mínimo de tal forma que el comportamiento del modelo sea semejante al comportamiento de la planta real en ese punto. Cuando se tiene un conjunto de patrones de entrenamiento, el procedimiento anterior se realiza para cada uno de los patrones de entrenamiento. 6-4 Apéndice A A.l Ejemplo de optimización de los parámetros de una red neuronal artificial empleando SQP Como se mencionó con anterioridad, se empleó el método de programación cuadrática secuencial (SQP)para encontrar los parámetros del neuroidentificador, de tal forma que satisfaga un criterio de desempeño dado por la diferencia entre la salida del neuroidentificador (modelo) y la salida de la planta. En este apéndice se muestra como se aplica el método de programación cuadrática secuencial descrito en la sección 4.2, para encontrar los parametros que hagan que la RNA de la figura A . l , aprenda el conjunto de datos presentados en la Tabla A.1. W Figura A 1 Esfrucfura de una red neuronal artificial - Apdiidice A. Ejemplo de In nptimizacióir de los pnrinieiros dc roin RNA Con base en los experimentos realizados al minimizar una función f, se observó que al usar una RNA como la que se muestra en la figura A.1 se obtenía un menor error cuadrático medio de dicha función f, cuando los pesos ( w f , w2) y umbrales (blib2)de las conexiones entre la neurona de la capa de entrada y las neuronas superiores de la capa intermedia y de éstas con la neurona de la capa de salida (v1,v2)eran positivos; los pesos (w3, w4) y umbrales (b3,b4) de las conexiones entre la neurona de la capa de entrada y las neuronas inferiores de la capa intermedia y de éstas con la neurona de la capa de salida (v3,v4)eran negativos. Tabla A. 1 Pafrones de entrenamiento ara una RNA Patrón k 4 5 Entrada u 6.58424 7.242672 7.966939 8.763633 9.574268 Salida 3.613434 4.177094 4.719238 6.2448 12 6.393890 Para llevar a cabo este procedimiento, se emplea la función de MATLAB v.4.2 o superior, constr que soluciona una ecuación no lineal sujeta a restricciones a través del método de programación cuadrática secuencia1 (SQP), de tal forma que los parametros de la RNA se optirnizan todos a la vez. La estructura de la función constr se muestra a continuación: x = consfr('fun :XO) x = constr('fun:xo,options) x = constr('fun',xo,options,vlb,vub) x = constr('fun',xo,options,vlb,vub, 'grad') [x,opfions] = constr('fun',xo, ...) donde xo es el punto inicial y puede ser cualquier valor. x = consfr('fun',xo) inicia en xo y encuentra el mínimo de una función fun, definida en un archivo con extensión rn llamado funm La función fun regresa dos argumentos: un valor escalar f, de la función que ha sido minimizada y una matriz de restricciones g. fW= fun(x) Alternativamente, puede usarse una expresión con x representando a las variables independientes y con f y g representando a la función y a las restricciones. x = constr('fun',xo,options) define un vector de parámetros opcionales, en donde: opfions(2) controla la precisión de x en la solución. opfions(3) controla la precisión de f e n la solución. A-2 Para mayor información en el vector options, ir a la sección del tutorial de [84] x = constr('fun:xo,options,vlb,vub) define un conjunto de limites superiores e inferiores en x a través de las matrices vlb y vub. Esto restringe la solución en el rango vlb < x < vub. Las variables vlb y vub, son de la misma dimensión de x. x = constr('fun',xo,options,vlb,vub,'gradj) llama a la función grad que regresa las derivadas parciales de la función y de las restricciones, a/¿%, en el punto x. a/¿%, [dcdg] = grad(x) La columna de dg contiene las derivadas parciales de cada una de las restricciones, es decir, la i-ésima columna de dg corresponde a la derivada parcial de la i-ésima restricción respecto a cada unos de los elementos de x. El vector options y la función grad pueden contener matrices vacías, en tal caso el vector options toma valores definidos por default y las derivadas parciales no se calculan con la función grad, sino que se calculan a través del método de diferencias finitas. Un segundo argumento en el lado izquierdo regresa los parámetros de optimización. Por ejemplo: [x, options] = constr('fun ',xo) regresa los parámetros usados en la optimización. Por ejemplo, options(l0) que contiene el número de iteraciones empleadas para encontrar el mínimo de la función. Una de las limitaciones del método es que la función que será minimizada y las restricciones deben de ser continuas. A continuación se usará esta función en la optimización de los parámetros de una red neuronal artificial. Como se ha mencionado con anterioridad, la salida de la RNA está dada por: y,", k = E v , f ( w h ü k+ b k ) 4 @.I) h=l se propone un índice de error cuadrático medio descrito por la ecuación: E,, = 2(Ym,(k.U..P)-Ypi,,(k.U))2 1 =0 (A4 A-3 Apindice A. Ejemplo de l a o p l i ~ ~ i i z a c de i ó ~losp~rametror ~ de I I I I R RNA donde p representa los parámetros de la red neuronal artificial. Interesa que la sensitividad sea positiva, como se describe en el capítulo 3, ~=~vnf(s)[l-f(s)fVih esto , se logra sólo si ambos pesos son positivos o du h=i ambos negativos. Esta condición será manejada como la restricción en el problema de optimización. Así, la función f que será minimizada empleando la función constr de MATLAB, estaría dada por la siguiente expresión: Se realiza un cambio de variables, de tal forma que los parámetros de la RNA están contenidos en el vector x , esto se debe a que MATLAB requiere que la función este en términos del vector x. La forma de la función de error f, para el ejemplo descrito esta dada por (funm): % Función de error que se minimiza f = 0.5 * (... (x( 1O)/( 1+exp(-6.584247*~(2)-~(1 )))+x(l 1)I(1+exp(-6.584247*~(4)-~(3)))+... x( 12)/(1+exp(-6.584247*~(6)-~(5)))+~( 13)/(1+exp(-6.584247*~(8)-~(7)))+... ~ ( 9-)3.613434)"2+ ... (x(lO)/(I +exp(-7,242672*~(2)-x(l )))+x( 11)I(1+exp(-7.242672*~(4)-~(3)))+... x(l2)/( 1+exp(-7.242672*~(6)-~(5)))+~( 13)/(1+exp(-7.242672*~(8)-~(7)))+... x(9)-4.177094)"2+ ... (x(lO)/(I +exp(-7.966939'x(2)-x(l)))+x(l1)/(1+exp(-7.966939*~(4)-~(3)))+... x( 12)/(1+exp(-7.966939'~(6)-~(5)))+~(13)/( 1+exp(-7.966939*~(8)-~(7)))+... ~ ( 9-)4.719238)"2+ ... Apéndice A. Ejemplo de la opiimiración de los parómetros de una RNA (x(lO)/(I +exp(-8.763633*x(Z)-x(l)))+x(l l)/(l+exp(-8.763633'~(4)-~(3)))+ ... x( 12)/(1 +exp(-8.763633'~(6)-~(5)))+~( 13)/(1 +exp(-8.763633'~(8)-~(7)))+... ~ ( 9-) 6.244812)A2+... (x(lO)/(I +exp(-9.574268*x(2)-x(l)))+x(l1)/(1 +exp(-9.574268*~(4)-~(3)))+... x( 12)/(1 +exp(-9.574268*~(6)-~(5)))+~( 13)/(1 +exp(-9.574268*~(8)-~(7)))+.. . ~ ( 9-) 6.393890)A2); % Restricciones no lineales ... g = 0.0; Las restricciones se incluyen como vectores de los límites inferiores y superiores El vector de los parámetros iniciales que se optimizan es: xo = [ 0.71588294817297 0.89284160814575 0.27310247022514 0.25476929556228 0.86560347774475 0.23235037062753 0.80487174411571 0.90839754344852 0.23189431811233 0.23931256446899 0.04975448407125 0.07838407477005 0.64081540987002]'; Empleando la función constr la solución al probiema esta dado por: El vector solución esta dado por: x = [ 0.06347019474110 0.00000000000000 0.00006418969283 O.12779590262248 -0.00133039001240 -0.14618531471238 0.00000000000000 -0.14464367523348 0.00607423357905 5.18972821136005 12.09350354975058 -13.68771654303776 -1 3.76957413744724 ] Apéndice A. Ejemplo de la optimizacidn de los parbmelros de una RNA El valor del error cuadrático medio es: 0.16042841611389 y se logra obtener en 930 iteraciones empleando el algoritmo de estimación paramétrica SQP. En la tabla A.2 se muestran los valores de los pesos y umbrales de la red neuronal artificial optimizados. 1 2 3 4 5 Pesos w 0.000000 0.127796 -0.146185 -0.144644 Pesos v 5.189728 12.093504 -13.687717 -13.769574 Umbrales 0.063470 0.000064 -0.00133 0.000000 0.006074 Se prueban los nuevos pesos en la RNA ésta proporciona las siguientes salidas yrna(l) = yrna(2)= yrna(3) = yma(4) = Yrna(5) = 3.517504 4.248850 5.013891 5.806860 6.561194 El programa en MATLAB empleado es so1.m clear all CIC % Vector de parámetros inicial XO = [ 0.71588294817297 0.89284160814575 0.27310247022514 0.25476929556228 0.86560347774475 0.23235037062753 0.80487174411571 0.90839754344852 0.23189431811233 0.23931256446899 0.04975448407125 0.07838407477005 0.64081540987002]'; x=xo; options = O; % Restricciones vlb = [O O O O -1000 -1000 -1000 4 0 0 0 O O O -1000 -1000]; v u b = [IO00 1000 1000 1000 O O O O 1000 1000 1000 O O]; A-6 . _. %Límite inferior %Límite superior NNE = 1; %no. de neuronas en la capa de entrada NNI = 4; %no. de neuronas en la capa intermedia NNS = 1; %no. de neuronas de la capa de salida . .o .I YOOptimiza la función f(x) descrita en el archivo fun.m [x,options] = constr('fun'.x,options,vlb,vub); % Una solución a este problema a sido encontrada en: .fprintf('x = %nn',x) % El valor de la función en el punto solución es: fprintf('f = %nn',options(8)) YO El número total de iteraciones fue: fprintf('1teraciones = %Rn'.options( 1O)) % Asigna pesos y umbrales de la capa intermedia en el vector de umbrales (b) y en el de pesos (P) cont=l ;k=l ; for(j=l :"I) %no. de umbrales b(j) = x(cont); cont=cont+l; for(i=l:NNE) %no de entradas p(k) = x(cont); cont=cont+l ;k=k+l; end end % Asigna pesos y umbrales de la capa de salida en el vector de umbrales (b) y en el de pesos (PI j= NNI+NNS; b(j) = x(cont); cont=cont+l; for(i=l:NNI) %no de entradas p(k) = x(cont); cont=cont+l ;k=k+l; end Escribe en el archivo pesos.ide el vector solución de pesos pesos = fopen('pesos.ide','w'); fprintf(pesos,'%nn',p); fclose(pesos); o/o Yo Escribe en el archivo bias.ide el vector solución de umbrales bias = fopen('bias.ide','w'); fprintf(bias.'%nn', b); fclose(bias); A-I Ap<’ndice A. Ejcmplo de la oprimiración de los parameiros dc una RNA .. A-8 Apéndice B $ 6.1 Programa de comunicación En este apéndice, se explica los archivos que se generan y los' que se requieren para lograr la comunicación entre la dos computadoras personales con las que es necesario implementar la adquisición y control de los sistemas expuestos en este trabajo de tesis. Una de las computadoras es denominada servidor y la otra cliente. Se cuenta con un programa de comunicación bajo la plataforma de Labwindows. El proyecto que la ruta se maneja en PC-Cliente se encuentra ubicado en c:\atarjeta\cliente\tcpclntf.prj. mkntras que el que en la PC-Servidor se encuentra ubicado en: c:\atarjeta\servidoAtcpserv.prj . Cuando se ejecuta el programa del cliente en la PC-Cliente, se tiene que dar la dirección TCP/IP de la PC-Servidor y también una dirección de memoria, en nuestro caso se le otorgaba la dirección 3000, que corresponde a la misma de la de PC-Servidor. Cuando se ejecuta el programa del servidor en la PC-Servidor, se teclea la misma dirección de memoria que se le dió a la PC-Cliente y entonces se establece la comunicación entre ambas máquinas. Apéndice A. Ejemplo de la oprimizacidn de los parametros de una RNA 8.1.1 Conexión cliente-servidor Una vez que se establece la comunicación, la PC-Cliente envía un vector con el conjunto de datos entrada-salida de la planta. Este vector tiene una dimensión fija de 500 posiciones, en donde se almacenan los parámetros que se estiman del neuroidentificador, por lo que sblo se emplean algunas de estas posiciones para almacenar dato y en la posición 450 del vector que envía PC-Cliente. se tiene la información acerca del número de datos del conjunto entrada-salida a usar en el entrenamiento (patrones de entrenamiento), de tal forma que la PC-Servidor sabe cuántos datos ha recibido. Este conjunto de datos se encuentra almacenados en el archivo c:\atarjeta\matlab\data.dat de PC-Cliente; el primer número del archivo indica el número total de renglones y el segundo número indica el total de columnas de datos que contiene el archivo, de tal forma que la PC-Cliente sabe la longitud del vector de datos que envía a la PC-Servidor. Con este vector de datos, la PC-Servidor genera un archivo c:\atarjeta\rnatlab\fun.m, el cual contiene la ecuación de la función que será minimizada. Este proceso se lleva a cabo cada 3 segundos. , Mientras se realiza lo anterior, el programa c:\atarjeta\matlab\sol.m de la PC- Servidor, puede estar ejecutándose bajo MATLAB v.5.01. El programa se inicializa con valores aleatorios en el vector solución. Como la función que minimizará debe estar contenida en el archivo c:\ atarjeta\matlab\fun.m checa si éste se encuentra vacío. Si esto sucede, entra en un ciclo de espera hasta que detecta que el archivo c:\ ...\fun.m contiene la función que se va a minimizar y la solución es almacenada en c:\.atarjeta\matlab\ini.m. Cada vez que la función cambia, se guarda en un archivo c:\atarjeta\matlab\a-#.m, donde # = 0,1,2, ...n, con el fin de ir almacenando los modelos que se fueron resolviendo, así como el vector solución para cada uno de ellos. Esto con el objetivo de analizar los datos con los que se entrena cuando surge algún problema como el que no sea posible encontrar un modelo adecuado. I - _ 6.1.2 Conexión servidor-cliente Cuando se ha encontrado la solución del problema, es decir se han estimado los parámetros del neuroidentificador, la PC-Servidor lee del archivo c:\.atarjeta\matlabkini.m el vector solución y lo escribe al cliente. El cliente lo lee y lo almacena en un vector. Sin embargo, es necesario que el vector solución sea separado en pesos y umbrales del neuroidentificador, así que la PC-Cliente realiza este proceso y almacena los pesos en el archivo c:\atarjeta\rnatlab\pesos.ide y los umbrales en el archivo c:\atarjeta\matlab\bias.ide del cliente. Los archivos c:\ ...\pesos.ide y c:\ ...\bias.ide contienen en su primer línea el número 31, el cual indica que el archivo contiene ya todos los pesos y umbrales del neuroidentificador. Esto es debido a que el programa general de RNA en algún B -2 momento necesita leer tales archivos y si éstos se encuentran vacios (ésto sucede sólo mientras el cliente guarda a disco los datos que ha recibido) espera hasta que el archivo que contienen los datos esta grabado, esto lo hace checando que la primer línea del archivo se igual a 31. B.2 Programa general de RNA El programa general de RNA, se encuentra en la ruta c:\atarjeta\easyio\aowave.prj de la PC-Cliente. Los parámetros del neuroidentificador se encuentran en la ruta c:\atarjeta\matlab\pesos.ide y c:\atarjeta\matlab\bias.ide. Los parámetros del neurocontrolador se encuentran en c.\atarjeta\easyio\pesos.con y c:\atarjeta\easyio\bias.con. La adquisición de los datos de la planta se realiza en el programa c:\atarjeta\easyio\ai-async.c y el envio de los datos se lleva a cabo en c:\atarjeta\easyio\ao_async.c . Estos archivos, son una modificación de los programas originales de LabWindows. B-3 I B-4 . '. Apéndice C C.l Metodología propuesta para identificar una planta SISO usando redes neuronales artificiales Con base en la experiencia adquirida en el desarrollo de este trabajo de tesis, se propone la siguiente metodología para realizar la identificación de una planta usando redes neuronales artificiales (neuroidentificador). 1. Determinar la dinámica de la planta con base en la variable de interés, es decir, cuando la variable es temperatura la dinámica de la planta es lenta, mientras que en el caso de variables de fluido, presión, velocidad, etc., la dinámica es rápida. Si la dinámica de la planta es lenta y además presenta un retardo de tiempo tal como el intercambiador de calor, es muy probable que presente dos comportamientos distintos para una misma señal de entrada. Este conjunto de datos la RNA no los puede aprender, por lo que se recomienda emplear un esquema de identificación serie-paralelo, usando como entradas a la RNA la señal de control, u,,,, ( k ) , y la señal de salida de la planta retardada en una unidad de tiempo, yD,="(k-1). Si la dinámica de la planta es rápida, es recomendable usar un esquema de identificación paralelo, de tal forma que la entrada a la RNA es la señal de control, u,, ( k ) . 2. Usar una RNA estática con una configuración simple en la capa intermedia, se recomienda usar de tres a cuatro neuronas con el fin reducir la cantidad y el tiempo de cómputo para estimar los parámetros en la RNA. Proponer utilizar una neurona en la capa de salida mientras que el número de neuronas en la capa de entrada depende de la dinámica del sistema como se mencionó anteriormente. 3. Aplicar a la planta una señal de excitación tipo rampa con el fin de distribuir sus datos de salida, los cuales (conjunto de datos entrada-salida) serán empleados como patrones de entrenamiento representando un elemento primordial en la etapa de aprendizaje de la RNA. Una buena distribución de los datos a lo largo de toda la región de trabajo radicará en una mejor identificación de la dinámica de la planta. 4. Se recomienda emplear una cantidad de datos de entrenamiento mayor a diez, los cuales representen la región de operación de la planta, de esta forma se asegura que el neuroidentificador logre copiar la dinámica de la planta además de las no linealidades que pudieran existir en el comportamiento de la misma. 5. Si los datos de entrenamiento de la RNA varían, por ejemplo, en el rango de O a 100 unidades, se recomienda normalizarlos a un rango de O a 1 y la separación entre ellos (Idato(k - 1) -dato(k - 2)1< 5% ) se recomienda que sea de un 5% al 10%. Si el rango de los datos varía de O a ' l 0 , es posible trabajar directamente con ellos teniendo una separación de 0.5 unidades. ... 6. El siguiente paso es entrenar la RNA con el conjunto de datos entrada-salida (patrones de entrenamiento) obtenidos. Si no se logra el comportamiento deseado, agregar más datos al conjunto de entrada-salida y entrenar nuevamente a la RNA. 7. Si aún así no se logra obtener el comportamiento deseado, entonces será necesario agregar neuronas en la capa intermedia de la RNA, pero con ello se aumenta el número de parámetros de la RNA que se estiman, es por ésto que mientras más sencilla sea la estructura de la RNA, se tiene un menor número de parámetros-a estimar y es menor el tiempo de cómputo para realizar el aprendizaje de la RNA. Continuar agregando neuronas en la capa intermedia hasta lograr copiar la dinámica de la planta. e-2 Referencias [ l ] Narendra, K. "Neural network for control theory and practice", Proceedings of the /€€E, vol. 84, no. 10, pp. 1385-1406, 1996. [2] lsidori Alberto, Nonlinear Control Systems, introduction, Springer-Verlag third edition, 1995. [3] Khalid Marzuki, Omatu S. and Yusof R.. "Temperature regulation with neural networks and alternative control schemes", /€€E Transactions on Neural Networks, vol. 6, no. 3, pp.572-582, 1995. 2 [4] Alves da Silva A.P., et al.. "A nonparametric neural networks for adaptive real time control '", /€€E lnternational Conference on Systems, Man and Cybernetics. vol. 3, pp. 2488-93, 1995. [5] Narendra op.cit. p.1385 [6] Idem p.1401 [7] Rao D.H., "Neural networks in robotics and control: some perspectives", /€E€ lnternational . Conference on lndustrial Automation and control, p.451, 1995 [8] lsidori Alberto, op.cit. p.5 [9] Khalid Manuki, op.cit. pp.572-582. [IO] Young-Moon, Myeon-Song Choi, Kwang Y. Lee, "An optimal tracking neurocontroller for nonlinear dynamic systems", /€E€ Transactions on neural networks, vol. 7, no. 5, p.1099, 1996. [ll]Hilera José y Martínez Victor J., Redes neuronales artificiales. Fundamentos, modelos y aplicaciones, fundamentos de las redes neuronales, Addison-Wesley Iberoamericana, Madrid, España 1995. p.45 [12] Rao D.H. op.cit., p.451 [I31 Idem [I41 Hilera José op.cit. p.45 [I51 Idem p.46 [I61 Ibidem, p.49 [I71 Hunt K.J. et al.. "Neural networks for control systems-A survey", Autmáfica(/FAC), vo1.28, no.6, p.1086, 1992 [I81 Jin Liang and Madan M. Gupta, "Dynamic feedback control of unknown nonlinear systems using dynamic neural networks", /€E€ lnternafional conference on systems, man and cybernetics. lnteligent systems for the 21" century, vol 2, p. 1261, 1995 [I91 Hunt K.J., op.cit. p.1087 [20] Hernandéz Reyes A,, "Neuro-observador de flujo magnético para el control de flujohelocidad de un motor de inducción" (Tesis de maestría en ciencias en ingeniería electrónica), Centro Nacional de Investigación y Desarrollo Tecnológico, Cuernavaca, Morelos, 1997, p. 2-2 [21] Hunt K.J., op.cit. p. 1087 [22] Rao D.H., op.cit., p.451 [23] Parra Hernández R. "Sistema de control supervisorio y control de velocidad para una turbina de gas basado redes neuronales artificiales'' (Tesis de maestría en ciencias en ingeniería electrónica), , Centro Nacional de Investigación y Desarrollo Tecnológico, Cuernavaca, Morelos, 1996, p.2-4. [24] Rao D.H., op.cit., p.451 [25] Parra Hernández R. op.cit. p.2-4. [26] Chao-Che Ku and Kwang Y. Lee "Diagonal recurrent neural networks for dynamic systems control", /€€E Transactions O R neural networks. vo1.6, no.1, p.144,1995 [27] Jin Liang, op.ct. p. 1261 [28] Idem [29] Chao Che Ku, op cit. p.144 [30] Hunt K.J., op.cit, p.1084 [31] Alves da Silva, op.cit. p.2488 [32] Idem [33] Ibidem [34] Hunt K.J. and Sbarbaro D.. "Neural networks for nonlinear internal model control", /€E€ Proccedings-D, ~01.138,no.5. p.431, 1991 [35] Narendra, K.op.cit. p.1400 I . [36] Hunt K.J.. op.cit., p.1101, 1996 [37] Xianzhong Cui y Kang G. Shin, "Direct control and coordination using neural networks". /E€€ Transactions on systems, man and cybernetics, vo1.23, no.3, p.686, 1993 1381 Hernandez Reyes A,, op.cit. pp. 3.3-3.5 [39] Idem pp.3.6-3.15 [40] Ergezinger S. and Thomsen E., "An accelerated learning algorithm for multilayer perceptrons: Optimization layer by layer" /€E€ Transactions on neural network, vol 6, no.1, pp.31,33, 1995. [41] Narendra K. and Parthasarathy., "Identification and control of dynamic systems using neural networks", /E€€ Transactions on neural networks, vol. 1. no. 1, p. 5, 1990. [42] Idem [43] Ibidem p.6 - [44] Sjoberg J. and De Raedt P., "Nonlinear systems identification: a software concept and examples", In 'Proceedings lFAC Symposium on Identification, Japan, p.3, 1997. [45] Narendra K., pp. 13.14 1990 [46] Hunt K.J., et a/. ."Neural Networks for control systems-. A survey", Automatica(lFAC), vol 28, no.6, pp.1097,1098, 1992 [47] Henson Michael A. and Seborg Dale E., "Nonlinear Process Control", Chapter 7, Prentice-Hall 1997,. pp. 378-380 [48] Hernández Reyes A,, op.cit., pp. 3.3-3.5 [49] Manual del intercambiador de calor RCT 100, GRUPO DIDATEC Ingeniería Pedagógica y Didáctica, S.A. de C.V. [50] Stephanopoulos G.. Chemical Process Control-An introduction tolheory and Practice, Chapter 30, Prentice-Hall 1984, p.639 [51] ft~://ft~.sas.mm/~ub/neural/FAQ3.html/questions [52]TecQuipment Limited, "CEI 10 Servo Trainer Guide Reference", PWIPElajpIOl97, Distribuido en Mexico por: Harry Mazal, S.A. de C.V. con dirección en Laguna de Tamiahua No. 204, Col. Anáhuac, 11320, México, D.F. e-mail: [email protected] 1 [53] Idem [54] Astrom Karl J., "Computer Controlled Systems-Theory and Design", Chapter 6, Prentice-Hall, 1984, p.187. [55] Stephanopoulos G., op.cit. p.640 [56] Narendra K., op.cit., p.6. 1990 [57] Hunt K.J., op.cit., p.1101. 1992 [58] Xianzhong Cui, op.cit. p.688. [59] Drucker Harris and Yann Le Cun, "Improving Generalization Performance Using Double Backpropagation", /€E€ Transactions on Neural Networks, vo1.3, no.6, p.991, 1992. [60] Young-Moon op.cit., p.1103. [61] Hunt K.J., op.cit., p.688, 1991 [62] Chao-Che Ku,op.cit., p.147 [63] Lennari Ljung, System Identification: Theory for the User, Chapter 10 Computing the estimate, Prentice-Hall, 1987, p.295 [64] Hernandez Reyes A,. op.cit. p. 3.7 [65] Himmelblau D.M. and Edgar T.F., Optimization of chemical process, Chapter 1 , p. 4-14, McGraw-Hill 1989 [66] Brian D. Bunday, Basic Optimisation Methods, Part I Unconstrained Optimization-Chapter 1, Edward Arnold Ltd, pp.4-7 1985 R-4 . . .- . , [67] Hirnrnelblau D.M., op.cit. p.300 [68] http://www-fp.rncs.anI.qov/otc/GuidelO~tWeblcontinuous/constrained/,.. nonlinearcon/ [69] Panier Eliane R and Tits André L.. "On Combining Feasibility, Descent and Superlinear.Convergence in Inequality Constrained Optimization", pp.2,3 " [70] Idern pp.1-15 [71] flp://plato.la.asu.edu/pub/donlp2/README.donlp2 [72] Hirnrnelblau D.M., op.cit. pp.221,222 [73] Idern [74] Brian D. Bunday, op.cit. p.83 ~ [75] Hirnrneiblau D.M., opcit. pp. 208-213 [76] Grace Andrew, Optimization Toolbox for use with MATLAB, User's Guide, _._ Section 2, pp.2.26-2.32, The Math Works Inc, 1994. [77] Chao-Che Ku, op.cit. pp145-147 [78] Hernandez Reyes A,, op.cit. pp. 3.3-3.5 [79] AT-M10-16X User Manual, National Instruments, 1994 Edition Part number 320640-01 [80] LabWindowslCVl User Interface Reference Manual, National Instruments, 1998 [81] TecQuipment Limited, CEllO Servo Trainer Guide Reference, Section 5, pp. 5.9-5.10. [82] Astrorn Karl J., op.cit. p.187 [83] Stephanopouios G., op.cit. p. 639 [84] Grace Andrew, op.cit. pp 1.13-1.15,2.22-2.32.3.9-3.12 SEI' CENEDET DGIT CEI\I$RO DE BNFBRMACIBN 99- 0555 R-5 ~ Referencias Bibliografía Alves da Silva A.P. et al., "A nonparametric neural networks for adaptive real time control ", /E€€ lnternational Conference on Systems, Man and Cybernetics. vol. 3, pp.2488-2493. 1995. Astrom Karl J., Computer Controlled Systems-Theory and Design, Chapter 6. Prentice-Hall, 1984, p.187. AT-MIO-16X User Manual, National Instruments. 1994 Edition 320640-01 Part number Bunday Brian D., Basic Optimisation Methods, Part I Unconstrained Optimization Edward Arnold Ltd, pp.4-7, 1985 2 Chao-Che Ku y Kwang Y. Lee "Diagonal recurrent neural networks for dynamic systems control", /€€E Transactions on neural networks, vo1.6, no.1, pp.144155,1995 Drucker Harris and Yann Le Cun, "Improving Generalization Performance Using Double Backpropagation", /€E€ Transactions on Neural Networks, vo1.3. no.6, pp.991, 1992. Ergezinger S. and Thomsen E., "An accelerated learning algorithm for multilayer perceptrons: Optimization layer by layer" /€E€ Transactions on neural network, vol 6, no.l, pp.31-42, 1995. ftp://ftp.sas.com/pu b/neural/FAQ3.html/questions Grace Andrew, Optimization Toolbox for use with MATLAB, User's Guide, The Math Works Inc, 1994 Henson Michael A. and Seborg Dale E., Nonlinear Process Control, Chapter 7, Prentice-Hall, 1997 .~ Hernández Reyes A., "Neuro-observador de flujo magnético para el control de flujo/velocidad de un motor de inducción" (Tesis de maestría en ciencias en BibliograJia ingenierla electrónica), Centro Nacional de Investigación y Desarrollo Tecnol6gico. Cuernavaca, Morelos, 1997, pp.2.1-2.18 Hilera José y Martinez Víctor J., Redes neuronales artificiales. Fundamentos, modelos y aplicaciones, Fundamentos de las redes neuronales. AddisonWesley Iberoamericana, Madrid, EspaAa 1995 Himmelblau D.M. and Edgar T.F. Optimization of chemical process, McGrawHill 1989 Hunt K.J., et al. "Neural networks for control systems-A survey", Autmática(lfAC), vo1.28, no.6, pp.1083-1111, 1992. Hunt K.J. and Sbarbaro,D., "Neural networks for nonlinear internal model control", /€E€ Proccedings-D, vol.138, no.5, pp.431-438, 1991 httD://www-fo.mcs.anI.qov/otc/Guide/OptWeb/continuous/constrained/... nonlinearconl lsidori Alberto, Nonlinear Control Systems, Introduction. Springer-Verlag third edition, 1995. _I_ Jin Liang and, Madan M. Gupta, "Dynamic feedback control of unknown nonlinear systems using dynamic neural networks", /E€€ international conference on systems, man and cybernetics. lnteligent systems for the 21'' century, vol 2, pp. 1261-1266,2995 Khalid Marzuki, Omatu S. and Yusof R., "Temperature regulation with neural networks and alternative control schemes", /E€€ Transactions on Neural Networks, vol. 6, no. 3, pp.572-582, 1995. LabWindowslCVl User Interface Reference Manual, National Instruments, 1998 Lennart Ljung, System Identification: Theory for the User, Chapter 10, PrenticeHall, 1987 Narendra K. and Parthasarathy. "Identification and control of dynamic systems using neural networks", /€E€ Transactions on neural nehuorks, vol. 1. no. 1. p. 5, 1990. Narendra. K. "Neural network for control: theory and practice", Proceedings of the /€€E,vo1.84. no. 1O, pp.1385-1406, 1996. . *,, Panier Eliane R. and Tits André L., "On combining feasibility, descent and superlinear convergence in inequality constrained optimization", pp.1-15. s-2 BibliograJia Parra Hernández R. “Sistema de control supervisorio y control de velocidad para una turbina de gas basado redes neuronales artificiales” (Tesis de maestría en ciencias en ingeniería electrónica), Centro Nacional de Investigación y Desarrollo Tecnológico, Cuernavaca, Morelos, 1996. Rao D.H. “Neural networks in robotics and control: some perspectives”, /€€E International Conference on lndustrial Automation and control, pp.451-456,1995 Sjoberg J. and De Raedt P., “Nonlinear systems identification: a software concept and examples”, In Proceedings lFAC Symposium on identification, Fukukoka, Japan 1997. Stephanopoulos G., Chemical Process Control-An introduction toTheory and Practice, Prentice-Hall 1984 TecQuipment Limited, C E l l O Servo Trainer Guide Reference, PW/PE/ajp/O197 Xianzhong Cui y Kang G. Shin, “Direct control and coordination using neural networks”, /€E€ Transactions on systems, man and cybernetics, vo1.23, no.3, pp.686-697, 1993 Young-Moon, Myeon-Song Choi, Kwang Y. Lee, “An optimal tracking neurocontroller for nonlineal dynamic systems”, /€E€ Transactions on neural networks, vol. 7, no. 5, pp.1099-1110, 1996. Bibliografía . s-4 .