REDES NEURONALES EN CONTROL ALEJANDRO SUÁREZ S. UTFSM CONTENIDO 1. 2. 3. 4. 5. INTRODUCCIÓN CONCEPTOS FUNDAMENTALES APRENDIZAJE APLICACIONES EN CONTROL EJEMPLOS 1. INTRODUCCIÓN PORQUE USAR REDES NEURONALES EN CONTROL. Procesos reales Control manual Control automático Lineal, no lineal Variante, invariante Optimo, robusto, adaptivo Difuso, neuronal 2. CONCEPTOS FUNDAMENTALES 2.1 2.2 2.3 2.4 2.5 NEURONA FUNCIÓN DE ACTIVACIÓN RED NEURONAL TIPOS DE REDES MODELOS DE REDES 2.1 NEURONA NEURONA BIOLÓGICA NÚCLEO AXÓN DENDRITAS NEURONA ARTIFICIAL ENTRADAS X1 CONEXIONES FUNCIÓN DE RED FUNCIÓN DE ACTIVACIÓN W1 X2 W2 X3 W3 Σ ENTRADAS PONDERADAS y(.) v(.) Θ SALIDA 2.2 FUNCIONES DE ACTIVACIÓN y(v) y(v) Funciones Umbral 1 1 0 v v -1 y(v) Funciones Sigmoidal y(v) 1 1 0 v v -1 2.3 RED NEURONAL RED NEURONAL BIOLÓGICA RED NEURONAL ARTIFICIAL neurona neurona neurona neurona neurona neurona CAPA DE ENTRADA CAPA OCULTA CAPA DE SALIDA 2.4 TIPOS DE REDES NEURONALES FEEDFORWARD RECURRENTES NEURONA ESTÁTICA NEURONA DINÁMICA 3. APRENDIZAJE 3.1 Mecanismos de aprendizajes 3.1.1 Aprendizaje Supervisado: Utiliza patrones de salida deseados para entrenar. ek = d k − y k x1(n) xi(n) Wj1(n) Wji(n) wk ( n + 1) = wk ( n ) + ∆ wk ( n ) ∆ wk ( n ) = α ek ( n )G 'k ( n ) xi ( n ) sj1(n) sj i(n) sjp(n) xp(n) Wjp(n) Σ νj(n) G(°) 3.1.2 Aprendizaje No Supervisado: Utiliza regla de auto-organización para el entrenamiento. ∆wij = α ai a j w a ij i a j 3.2 EJEMPLOS DE REDES SEGÚN MECANISMO DE APRENDIZAJE APRENDIZAJE SUPERVISADO APRENDIZAJE NO SUPERVISADO •Aprendizaje por corrección de error • Aprendizaje Hebbiano • Perceptrón •Hopfield •Adaline y Madaline •Linear Associative Memory •Backpropagation •Fuzzy Associative Memory •Counterpropagation •Grossberg •Aprendizaje por refuerzo •Linear Reward Penalty •Bidirectional Associative Memory •Aprendizaje competitivo/cooperativo •Associative Reward Penalty •Learning Vector Quantizer •Adaptive Heuristic Critic •Cognitròn / Neocognitrón •Aprendizaje estocástico •Máquina de Boltzman •Máquina de Cauchy •Teoría de Resonancia Adaptiva 3.3 Algoritmos de convergencia Gradiente descendente a) Razón de aprendizaje b) Momento c) Razón y momento variables wil(n+1) =wil(n) +∆wil(n) ∆ wil (n) = −η Gradiente conjugado Gradiente conjugado escalado ∂ ξ total ∂ wil (n) Respuesta Impulso de duración Finita (FIR) Wji(n) x1(n) wji(o) xi(n) z-1 xi(n) wji(1) xi(n-1) Wj1(n) Wji(n) sj1(n) sj i(n) Σ νj(n) G(°) sjp(n) z-1 xi(n-2) xp(n) wji(2) wji(m-1) xi(n-m+1) z-1 xi(n-m) Wjp(n) sji(n) wji(m) s ji (n) = W jiT X i ( n) p X i (n ) = [xi (n ), xi (n − 1), h , xi (n − m )] T [ ] W ji = w ji (o ), w ji (1), h , w ji (m ) T v j (n) = ∑ s ji (n) i =1 y j (n) = G (v j ( n) ) Retropropagación temporal del error para capa de salida ek = d k − yk δ k (n) = ek (n)G 'k (n) Wkj (n + 1) = Wkj (n) + αδ k (n) X j (n) Retropropagación del error Red Identificación x1 y1 k xv Wji j yk wkj yq q xc Wrp q δ j = G j ' (v j )∑ δ k wkj k =1 r wqr Econt = dk - yk δ k = Econt Gk ' (vk ) Retropropagación del error de control Red Control Red Identificación x1 y1 m xv wsv i s wis kk Wji xc j wkj p e wpe q Wrp yk yq wqr r δ k = Econt Gk ' (vk ) r δ i (n − m) = G 'i (vi (n − m ))∑ ∆ (n − m )W ji j =1 T j q δ j = G j ' (v j )∑ δ k wkj k =1 4. APLICACIONES EN CONTROL 4.1 SENSOR NEURONAL 4.2 MODELO NEURONAL 4.3 CONTROL NEURONAL 4.1 SENSOR NEURONAL 1. 2. RECOPILAR DATOS TRANSFORMACIÓN *fft *wavelets *filtros 3. 4. NORMALIZACIÓN ENTRENAR LA RED *entrenamiento *memorización *validación 4.2 MODELO NEURONAL 1. MODELO SERIE 2. MODELO PARALELO 4.3 1. 2. 3. 4. 5. 6. CONTROL NEURONAL CONTROL INVERSO LAZO ABIERTO CONTROL INVERSO LAZO CERRADO CONTROL SIN MODELO CONTROL CON MODELO CONTROL CON MODELO DE REFERENCIA CONTROL PREDICTIVO 1. MODELO INVERSO LAZO ABIERTO 2. MODELO INVERSO LAZO CERRADO 3. CONTROL SIN MODELO ∂ξ(n) ∂ξ(n) ∂ ej (n) ∂ ypj(n) = • • • ∂ wji (n) ∂ ej (n) ∂ y (n) ∂ upj(n) pj ∂ upj(n) ∂ vj (n) • ∂ν j (n) ∂ wji (n) 4. CONTROL CON MODELO 5. CONTROL CON MODELO DE REFERENCIA 6. CONTROL PREDICTIVO 7. CONTROL PREDICTIVO CON MODELO DE REFERENCIA Modelo Procesos discretos sistema . 00995 z − . 99 discreto lineal primer sistema discreto lineal . 00487 z + . 00474 2 z − 1 . 91 z + . 923 sistema y p discreto ( k + 1) = orden segundo no lineal y (k ) 1 + y (k ) p 2 orden primer orden + u 3 (k ) p sistema y p discreto ( k + 1) = y no lineal p (k ) 1+ y y p 2 p segundo ( k − 1) (k ) + [y y 2 p p orden ( k ) + 2 .5 ( k − 1) ]+ u (k ) FIN