Analíti ak C

Anuncio
k
Analíti a
Revista de Análisis Estadístico
Journal of Statistical Analysis
Rodrigo Cajamarca y Hermann Mena
2.3 Mínimos cuadrados recursivo (MCR)
El método de mínimos cuadrados recursivo es, como
su nombre lo indica, una versión recursiva del método de
mínimos cuadrados por lotes. Este método utiliza en cada
iteración una parte del conjunto de entrenamiento y no requiere el cálculo de la inversa de Φ⊤ Φ; de esta manera su
desempeño es más eficiente que el MCL. El algoritmo calcula θ̂ (k) mediante θ̂ (k − 1), x k , y yk ; donde k representa un
ciclo sobre el conjunto de entrenamiento G, la iteración se
repite K veces; para más detalles ver [11].
Al igual que para el MCL, se utiliza la función de pertenencia Gaussiana para las entradas y una función Delta
para las salidas. Los parámetros bl , clj y σjl > 0 se definen
como en el método anterior.
Sea P(k) la matriz n × n definida como
! −1
−1
k
⊤
i i ⊤
P(k) = Φ Φ
= ∑ x (x )
,
(8)
3
Al igual que en la sección anterior, se generalizó este
método para el caso de entrada-salida múltiple; ver Algoritmo 2.
2.4 Aprendizaje desde el ejemplo modificado
(AEM)
Este método tiene un enfoque muy intuitivo para la
construcción de un sistema difuso el cual se basa en técnicas de optimización para determinar los parámetros del
sistema. En el AEM se generan automáticamente reglas y
funciones de pertenencia; por esta razón, este método es
una alternativa viable a problemas en los cuales se carece
de información a priori del sistema. De manera análoga a
la sección anterior, se consideran funciones de pertenencia
Gaussiana y Delta; el método se describe de la siguiente
manera:
i =1
se obtiene
P ( k ) = P ( k − 1) − P ( k − 1) x k
y
( I + ( x k ) ⊤ P ( k − 1 ) x k ) −1 ( x k ) ⊤ P ( k − 1 ) ,
k
k
k ⊤
θ̂ (k) = θ̂ (k − 1) + P(k) x (y − ( x ) θ̂ (k − 1)).
1. Construcción de un sistema difuso inicial: dados el par
de datos de entrada y salida ( x i , y j ) ∈ G, i = 1, . . . , M,
se forma un sistema difuso inicial con ( x1 , y1 ) y se inicializa el número de reglas R = 1
(9)
(10)
f ( x i | θ ) = b1
(12)
Si se aplica el lema de la matriz inversa, se evita la inpara c1j = x1j , σj1 = σ0 (parámetros de las funciones de
versión de una matriz; y, en su lugar, únicamente se calcula
pertenencia de las variables de entrada) y b1 = y1 (pael inverso del escalar ( I + ( x k )⊤ P(k − 1) x k )−1 . Las ecuaciorámetro de la función de pertenencia de la variable de
nes (9) y (10) caracterizan P(k) y θ̂ (k) y permiten describir
salida), para todo j = 1, . . . , n.
el método de mínimos cuadrados recursivo.
Para inicializar el algoritmo, se emplean generalmente
2. Evaluación de los datos de entrenamiento: se utiliza un
θ̂ (0) = 0 y P(0) = P0 = αI para algún α > 0. Otra opción
factor de tolerancia ε f que determina el error. Para cada
es utilizar una aproximación heurística.
( x i , y j ) ∈ G se evalúa:
Además se puede usar el método de mínimos cuadrados recursivo ponderado. En este caso se utiliza un factor
• si | f ( x i | θ ) − yi | ≤ ε f , entonces el sistema difuso f
0 < λ ≤ 1 que se conoce como un “factor de pérdida de
representa correctamente ( x i , yi ), y por lo tanto, no
memoria” y sirve para dar mayor peso a la información
es necesario añadir ninguna regla. Se repite este pamas reciente. Si λ = 1 se obtiene el método MCR original.
so, con el siguiente par de datos de entrenamiento.
En el método de mínimos cuadrados recursivo P(k) se define como:
• si | f ( x i | θ ) − yi | > ε f , entonces se añade una regla
1
k
k
⊤
P(k) = λ ( I − P(k − 1) x (λI + ( x )
para representar ( x i , yi ) modificando los parámetros
(11)
P ( k − 1 ) x k ) −1 ( x k ) ⊤ ) P ( k − 1 )
de las funciones de pertenencia; continuar al Paso 3
θ̂ (k) = θ̂ (k − 1) + P(k) x k (yk − ( x k )⊤ θ̂ (k − 1))
Si en el sistema difuso (3), se reemplaza x k con ξ ( x k ) en 3. Codificación de parámetros del sistema difuso: si no se
cumple la condición del Paso 2, se añade una nueva re(11) se obtiene
gla R = R + 1, bR = yi y cij = x ij , para todo j = 1, . . . , n.
n
1
k
P ( k ) = λ I − P ( k − 1) ξ ( x )
La modificación de los σji para i = R se realiza utilih
i −1
zando los centros de las funciones de pertenencia de la
λI + (ξ ( x k ))⊤ P(k − 1)ξ ( x k )
o
forma;
(ξ ( x k ))⊤ P(k − 1)
h
i
′
n∗j = arg mı́n{|cij − cij | : i ′ = 1, 2, . . . , R, i ′ 6= i },
θ̂ (k) = θ̂ (k − 1) + P(k)ξ ( x k ) yk − (ξ ( x k ))⊤ θ̂ (k − 1)
26
Analítika, Revista de análisis estadístico, 2 (2012), Vol. 3(1): 23-42
Descargar