Apéndice C. TEORÍA DE CONJUNTOS DIFUSOS

Anuncio
Apéndice C. TEORÍA DE CONJUNTOS DIFUSOS
C.1.
Algunas definiciones básicas
Conjunto difuso. Es un conjunto sin un límite definido. La transición entre
“pertenecer a un conjunto” y “no pertenecer a un conjunto” es gradual y esta
transición suave es caracterizada por una función de pertenencia. Los conjuntos
definidos de forma imprecisa desempeñan un papel importante en el pensamiento
humano, particularmente en los dominios del reconocimiento de patrones, de la
comunicación de la información y de la abstracción (Zadeh, 1965).
Inteligencia computacional (Soft computing). Es un enfoque emergente de la computación
que tiene un paralelo notable con la capacidad de la mente humana de razonar y de
aprender en un ambiente de incertidumbre e imprecisión (Zadeh, 1992). Los
componentes principales de la soft computing son la lógica difusa, la computación
neuronal y los algoritmos genéticos. Según Jang, Sun y Mizutani (1997), las
principales características del procesamiento neuro-fuzzy y del soft computing son:
que utilizan la experticia humana, son modelos computacionales inspirados en la
biología, aplican nuevas técnicas de optimización, implican cálculo numérico,
tienen nuevos campos de aplicación, tienen un modelo de aprendizaje libre,
significan procesos de cálculo intenso, son tolerantes a fallos, sus características
pueden ser enfocadas hacia un objetivo y tienen aplicaciones en el mundo real.
Razonamiento aproximado. El razonamiento con lógica difusa no es exacto sino en
cierta forma impreciso. De acuerdo con las premisas y las implicaciones difusas las
conclusiones que se obtienen o se deducen igualmente difusas (Rutkowska, 2002).
Variable lingüística. Este concepto fue introducido por Zadeh (1975) para
proporcionar una base para el razonamiento aproximado, así: “por una variable
lingüística se quiere decir que se trata de una variable cuyos valores son palabras u
oraciones en un lenguaje natural o artificial. La motivación para el uso de palabras
o de oraciones en lugar de números es que las caracterizaciones lingüísticas son, en
general, menos precisas que los valores numéricos” (Rutkowska, 2002).
Apéndice C
222
La matemática de los conjuntos difusos trabaja con conjuntos que no tienen
límites perfectamente definidos, es decir, la transición entre la pertenencia y nopertenencia de una variable a un conjunto es gradual. Estos conjuntos se
caracterizan por las funciones de pertenencia, que dan flexibilidad a la modelación
utilizando expresiones lingüísticas, tales como mucho, poco, leve, severo, escaso,
suficiente, caliente, frío, joven, viejo, etc. Surgió de la necesidad de solucionar
problemas complejos con información imprecisa, para los cuales la matemática y
lógica tradicionales no son suficientes. La lógica difusa es un lenguaje que permite
trasladar sentencias sofisticadas del lenguaje natural a un formalismo matemático.
La lógica difusa fue inventada en 1960 por Lofti Zadeh, guiado por el
principio de que las matemáticas pueden ser usadas para encadenar el lenguaje con
la inteligencia humana. Algunos conceptos pueden ser mejor definidos con
palabras, los conjuntos difusos ayudan a construir mejores modelos de la realidad.
C.2.
Características generales de los conjuntos difusos
Estas son algunas de las características matemáticas de los conjuntos difusos según
Rutkowska (2002), Jang et al. (1997), Nauk et al. (1997), Kosko (1992) y Martín del
Brio y Sanz (2001). En la Figura C.1 se presentan algunas de las características de
un conjunto difuso.
Conjunto difuso: Expresa el grado de pertenencia al conjunto que tiene cada uno de
los elementos. El conjunto difuso A en X puede definirse como el conjunto de los
pares ordenados
A = {( x , µ A ( x ) ) x ∈ X }
(C.1)
donde µA(x) es la función de pertenencia al conjunto difuso.
Funciones de pertenencia: dan para cada elemento de X un grado de membresía al
conjunto A. El valor de esta función está en el intervalo entre 0 y 1, siendo 1 el
valor para máxima pertenencia. Si el valor de esta función se restringiera solamente
a 0 y 1, se tendría un conjunto clásico, o no-difuso. Esta función no es única. Las
funciones utilizadas más frecuentemente son las de tipo trapezoidal, singleton,
triangular (T), tipo S, exponencial, tipo Π (forma de campana).
Apoyo: En un conjunto difuso A es el conjunto de todos los puntos x para los
cuales la función de pertenencia (µA(x)) es mayor que cero.
Centro: En un conjunto difuso A es el conjunto de todos los puntos para los cuales
la función de pertenencia (µA(x)) es igual a 1.
Normalidad: Un conjunto difuso es normal si siempre existe un punto para el cual la
función de pertenencia es 1, es decir el centro no está vacío.
Puntos de cruce (Crossover): Son los puntos del conjunto difuso para los cuales
µA(x)=0.5
Apéndice C
223
Conjunto difuso simple (Singleton): Es el conjunto difuso para el cual el apoyo es
solamente un punto, en el cual el valor de la función de pertenencia es 1.
Conjunto α-corte: Aα de un conjunto difuso A al todos los puntos x para los que se
cumple Aα = {x µ A (x) ≥ α }
Conjunto α-corte marcado: Aα’ de un conjunto difuso A al todos los puntos x para los
que se cumple Aα′ = {x µ A (x) > α }
Convexidad: Un conjunto es convexo si y solo si para cualesquiera x1, x2 ∈ X y
cualquier λ∈ [0,1] se cumple que µ A ( λ x1 + (1 − λ ) x 2 ) ≥ min {µ A ( x1 ), µ A ( x 2 )} . Se dice
que un conjunto es convexo si todos sus conjuntos de nivel α son convexos.
Grado de pertenencia
1
0.5
Centro
Puntos de cruce
Apoyo
Figura C.1. Algunas características de un conjunto difuso
Números difusos: Es un conjunto difuso en la recta real (R) que satisface las
condiciones de normalidad y convexidad, la función de pertenencia es continua a
trozos y el centro del centro del conjunto difuso consiste de un único valor.
Intervalo difuso: Un conjunto difuso es un intervalo difuso si en la recta real (R) que
satisface las condiciones de normalidad y convexidad y la función de pertenencia es
continua a trozos.
Simetría: Un conjunto difuso es simétrico si alrededor de un punto x=c se cumple
µ A (c + x) = µ A (c − x) , para todo x ∈ X
Conjunto difuso abierto a la derecha: Un conjunto difuso A es abierto a la derecha si
cumple que lim x→ −∞ µ A ( x) = 1 y lim x → +∞ µ A ( x ) = 0
Conjunto difuso abierto a la izquierda: Un conjunto difuso A es abierto a la izquierda si
cumple que lim x →−∞ µ A ( x) = 0 y lim x → +∞ µ A ( x ) = 1
Conjunto difuso cerrado: Un conjunto difuso A es cerrado si cumple que
lim x →−∞ µ A ( x ) = lim x →+∞ µ A ( x ) = 0
Apéndice C
224
Ancho de conjuntos difusos normales y convexos: Esta definido como la distancia entre los
dos únicos puntos de cruce Ancho ( A) = x 2 − x1 , donde µA(x1)= µA(x2)=0.5
C.3.
Operaciones entre conjuntos difusos
En los conjuntos difusos son aplicables las tres operaciones básicas de los
conjuntos clásicos (unión, intersección y complemento), además de realizar
operaciones entre ellos también es posible aplicar operadores sobre un conjunto
difuso, este es el caso de la concentración y la dilatación. En la Tabla C.1 se
encuentran algunas de las operaciones básicas de los conjuntos difusos.
Tabla C.1. Operaciones entre conjuntos difusos
Operación
Definición
Contención o Subconjunto
A es subconjunto de B si y solo si µA(x)≤ µB(x), para todo
x.
A ⊆ B ⇔ µ A ( x) ≤ µ B ( x)
Unión
La unión de los conjuntos difusos A y B es el conjunto
difuso C, y se escribe como C = A ∪ B o C=A OR B, su
función de pertenencia está dada por
µ C ( x) = max (µ A ( x), µ B ( x) ) = µ A ( x) ∨ µ B ( x)
Intersección
La intersección de los conjuntos difusos A y B es el
conjunto difuso C, y se escribe como C = A ∩ B o
C=A AND B, su función de pertenencia está dada por
µ C ( x) = min (µ A ( x), µ B ( B ) ) = µ A ( x) ∧ µ B ( x)
Complemento (negación)
El complemento del conjunto difuso A, denotado por Ā
(¬ A, NOT A), se define como
µ A ( x) = 1 − µ A ( x)
Producto Cartesiano
Si A y B son conjuntos difusos en X y Y, el producto
cartesiano de los conjuntos A y B A x B en el espacio X x
Y tiene la función de pertenencia
µ A× B ( x, y ) = min (µ A ( x ), µ B ( y ) )
Co-producto Cartesiano
A + B en el espacio X x Y tiene la función de pertenencia
µ A× B ( x , y ) = max (µ A ( x ), µ B ( y ) )
Para un conjunto difuso A
Norma
Concentración
Dilatación
µ Norma ( A ) (x ) =
µ A (x ) , para x ∈ U
max[µ A ( x )]
Modificador del conjunto difuso A, hace más estrecha la
función de pertenencia
µ Conc ( A ) ( x ) = (µ A ( x ))2 , para x ∈ U
Modificador del conjunto difuso A, hace más ensancha la
función de pertenencia
µ Dilat ( A ) ( x ) = (µ A ( x ))0.5 , para x ∈ U
Apéndice C
C.4.
225
Desfusificación
Los problemas basados en conjuntos difusos se originan de la utilización de
calificaciones lingüísticas. Luego de formar los conjuntos difusos correspondientes
a un determinado problema es necesario obtener una respuesta de estos. En
muchos casos es importante que esta respuesta no sea difusa y se debe pasar de
una respuesta difusa a una que no lo es. Para lograr esto se ha desarrollado el
concepto de Desfusificación. Se han propuesto varios métodos para lograr esta
transformación, algunos de ellos se explican a continuación. El método de
desfusificación debe ser escogido de acuerdo con la aplicación que se desea hacer
(Jang et al. 1997).
C.4.1
Centroide de área (COA)
Este método consiste en hallar para cada conjunto difuso su área y la ubicación del
centroide de área. El valor desfusificado es el resultado del cociente entre el
producto entre las sumatoria de los productos del las áreas y sus centroides, y la
sumatoria de las áreas
Valor desfusificado = X =
∑Ax
∑A
i i
(C.2)
i
ó
COA =
∫µ
A
( x) xdx
X
∫µ
A
( x) dx
X
C.4.2
Procedimiento máximo
Aquí se supone que la función de pertenencia tiene solamente un punto máximo
simple, se toma el valor de desfusificación en este punto máximo
y0 ( B ) = arg max {µ B ( y ) y ∈ Y }
(C.3)
En caso que la función de pertenencia de la salida tenga varios puntos
máximos, se crea un grupo (Bmax) con estos puntos (soluciones óptimas)
{
}
Bmax = y ∈ Y µ ( y ) = max µ B ( z )
z∈Y
(C.4)
De este grupo de máximos se debe obtener un único punto. Esto se puede
hacer de varias formas. Un método es escoger aleatoriamente un punto óptimo
(supone que todas las soluciones son igualmente buenas), pero preferiblemente que
sea un punto en la mitad del conjunto de soluciones. La solución puede escogerse
también hallando el valor medio del conjunto, si este es un conjunto finito
Apéndice C
226
y0 ( B ) =
1
N
∑y
(C.5)
y∈Bmax
donde N es el número de elementos en el conjunto.
C.4.3
Centro de Gravedad
Con este método se tiene en cuenta información relacionada con la función de
pertenencia µB. Se toma la media de todos los pesos
y0 ( B ) =
C.5.
1
∑µ
B
∑ yµ B ( y )
( y ) y∈Bmax
(C.6)
Reglas difusas Si-Entonces
Como en la lógica clásica, la lógica difusa se ocupa del razonamiento formal con
proposiciones, pero a diferencia de esta, los valores de las proposiciones pueden
tener valores intermedios entre verdadero y falso. El concepto de variable
lingüística fue un escalón al concepto de reglas difusas SI-ENTONCES, estas son
una base para la lógica difusa que a menudo es utilizada en aplicaciones prácticas
(Zadeh, 1975; Rutkowska, 2002; y Zadeh, 1996). El concepto de reglas difusas es
importante cuando las dependencias descritas por estas reglas son imprecisas o
cuando no se requiere un alto grado de precisión (Rutkowska 2002).
En una regla difusa se asume como
Si x es A entonces y es B
Donde A y B son valores lingüísticos definidos por conjuntos difusos dentro de
los universos X y Y. Como en la lógica clásica a menudo “x es A” es llamada
premisa y “y es B” es llamada la conclusión o consecuencia. Este tipo de reglas puede ser
utilizado para modelar y analizar un sistema.
Varios métodos para calcular la relación R = A → B han sido propuestos. R
puede ser visto como un conjunto difuso con una función de pertenencia en dos
dimensiones
µ R ( x, y ) = f ( µ A ( x ), µ B ( y )) = f ( a , b )
(C.7)
Apéndice C
C.6.
227
Razonamiento Difuso
También llamado razonamiento aproximado es un procedimiento de inferencia que
saca conclusiones con reglas si-entonces utilizando conjuntos difusos (Jang et al.
1997).
Siendo A, A’, y B conjuntos difusos que pertenecen a X, X, y Y
respectivamente. Asume que la implicación difusa A → B es expresada como una
relación R en X × Y . El conjunto difuso B inducido por “x es A” y la regla difusa
“si x es A entonces y es B” están definidos como
µ B ' ( y ) = max x min [µ A' ( x ), µ R ( x, y )]
= ∨ x [µ A′ (x ) ∧ µ R (x )]
(C.8)
De acuerdo al problema que se desea resolver se han desarrollado
diferentes reglas para el razonamiento difuso, en estas puede variar el número de
antecedentes y de consecuencias. Se emplea también diferentes operadores para
relacionar los conjuntos difusos como Y, O, Implicación, Desfusificación, entre otros.
C.7.
Aplicaciones
La teoría de conjuntos difusos ha sido ampliamente aplicada en campos como: la
Medicina, Economía, Ecología y Biología. Se ha empleado en empresas de
producción de artículos eléctricos y electrónicos como una herramienta de control,
se ha utilizado para el desarrollo de procesadores y computadoras.
Los conjuntos difusos son usados para toma de decisiones y estimaciones
en Sistemas de Control como son: aire acondicionado, control de automóviles y
controladores en sistemas industriales.
En el campo de la Ingeniería Civil, la lógica difusa esta siendo aplicada
también en control de cierre de compuertas en presas (Chile), control de tráfico
(Puerto Rico), control de secaderos de hoja de tabaco (Cuba), control de balanceo
en puentes grúa control de nivel de líquidos en contenedores y se espera que su
aplicación se generalizará de manera muy notable en los próximos años.
La evolución del daño sísmico fue estudiada por Song, Hao, Murakami y
Sadohara (1996) utilizando lógica difusa. Zhao y Chen (2002) propusieron un
sistema difuso para el diagnóstico del daño en puentes de hormigón armado. Ellos
construyen unas funciones de pertenencia de las variables de entrada con un
algoritmo de fuzzy partitioning e induciendo reglas difusas de los datos numéricos.
El diagnóstico se basa en tres tipos de factores: factores de diseño, como tipo
estructural, longitud de las luces, ancho del tablero y cantidad de luces; factores
ambientales como humedad y precipitación, clima de la región, volumen de tráfico
y variaciones de temperatura; y otros factores como edad de la estructura, clase y
localización de los daños. Finalmente, Ahlawat y Ramaswamy (2001) propusieron
Apéndice C
228
un sistema de control de vibraciones estructurales utilizando la teoría de conjuntos
difusos; y Anoop, Rao K.B. y Rao T.V.S.R.A. (2002) propusieron usarlos en la
estimación de la vida útil de miembros estructurales en concreto reforzado.
C.8.
Referencias
Ahlawat A.S., y Ramaswamy A. (2001). Multiobjective optimal structural vibration control
using a fuzzy logic control system. Journal of Structural Engineering 127(11), pp. 1330–
1337.
Anoop M.B., Rao K.B., y Rao T.V.S.R.A. (2002). Application of fuzzy sets for estimating
service life of reinforced concrete structural members in corrosive environments.
Engineering structures, 24 (2002) pp. 1229-1242.
Jang J.-S.R., Sun C. –T., y Mizutani E. (1997). Neuro-Fuzzy and soft computing. A
computational approach to learning and machine intelligence. London, UK: Prentice-Hall.
Kosko B. (1992). Neural Networks and Fuzzy Systems: A dynamical systems approach to machine
intelligence. Englewood Cliffs, NJ: Prentice Hall.
Martín del Brío B. y Sanz A. (2001). Redes neuronales y sistemas borrosos. Ra-Ma Editorial,
Madrid, España.
Nauck D., Klawonn F., & Kruse R. (1997). Foundations of neuro-fuzzy systems. Chichester,
England: John Wiley & Sons.
Rutkowska D. (2002). Neuro-fuzzy architectures and hybrid learning, Physica Verlag,
Heidelberg, Germany.
Song Bo, Hao S., Murakami S. & Sadohara S. (1996). Comprehensive evaluation method
on earthquake damage using fuzzy theory, Journal of Urban Planning and Development,
122, 1, pp. 1-31.
Zadeh L.A. (1965). Fuzzy sets. Information and control, 8, 338-353.
Zadeh L.A. (1975). The concept of a linguistic variable and its application to approximate
reasoning, Information science, Part I, Vol. 8, pp.199-249, Part II, Vol.8, pp.301-357,
Part III, Vol. 9, pp. 43-80.
Zadeh L.A. (1992). Fuzzy logic, neural networks and soft computing. One-page course
announcement of CS 294-4, Spring 1993, the University of California at Berkeley.
Zadeh L.A. (1996). Fuzzy logic and the calculi of fuzzy rules and fuzzy graphs: a precis, Multiple
Valued Logic. Vol 1, pp. 1-38.
Zhao Z., & Chen C. (2002). A fuzzy system for concrete bridge damage diagnosis.
Computers & Structures, 80, pp. 629-641.
Descargar