Fundamentos de Matemática Difusa

Anuncio
Fundamentos de Matemática Difusa
Daniel Reina
Director:
Leonardo Jiménez Moscovitz
Matemático
Especialista en Informática y Ciencias de la Computación
Fundación Universitaria Konrad Lorenz
Facultad de Matemáticas
10 de junio de 2008
Resumen
Este trabajo presenta la base fundamental de la matemática difusa,
dentro del desarrollo de un proyecto de investigación en la Universidad.
Se tratan los conjuntos difusos, la lógica difusa y la aritmética difusa y
las operaciones lógicas, conjuntistas o aritméticas que se pueden realizar
1
con estos objetos, así como sus propiedades. El tema se ha desarrollado
buscando en lo posible una presentación preferiblemente axiomática
2
Índice
Introducción
4
1. Preliminares
1.1. Desarrollo Intuitivo de la Matemática Difusa . . . . . . . . . . .
6
6
2. Fundamentación de la Matemática Difusa
2.1. Conjuntos Difusos y Lógica Difusa . . . . . .
2.2. La Función de Pertenencia . . . . . . . . . . .
2.3. Números Difusos . . . . . . . . . . . . . . . .
2.4. Variables Lingüísticas . . . . . . . . . . . . .
2.5. Proposiciones y Conectivos . . . . . . . . . .
2.6. Cuantificadores Difusos . . . . . . . . . . . .
2.6.1. Cuantificadores Difusos Absolutos . .
2.6.2. Cuantificadores Difusos Relativos . . .
2.7. Modificadores Lingüísticos (Linguistic Hedge)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
10
13
21
25
26
29
30
31
33
3. Operaciones Difusas
3.1. Operaciones entre Conjuntos Difusos . . . . .
3.1.1. Complementos Difusos . . . . . . . . .
3.1.2. Intersecciones Difusas (T-normas) . .
3.1.3. Uniones Difusas (T-conormas) . . . .
3.2. Operaciones Aritméticas en Intervalos Difusos
3.3. Operaciones Aritmeticas en Números Difusos
3.4. Reticula de Números Difusos . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
34
34
35
37
39
40
43
48
4. Inferencia Difusa
4.1. Inferencia para Proposiciones Difusas Condicionales . . . . . .
4.1.1. Modus Ponens Generalizado . . . . . . . . . . . . . . . .
4.1.2. Modus Tollens Generalizado . . . . . . . . . . . . . . . .
4.1.3. Silogismo Hipotético Generalizado . . . . . . . . . . . .
4.2. Inferencia para Proposiciones Difusas Condicionales Calificadas
4.3. Inferencia de Proposiciones Cuantificadas . . . . . . . . . . . .
.
.
.
.
.
.
55
55
57
58
59
60
63
5. Conclusiones
67
Referencias
69
Introducción
Este trabajo forma parte del desarrollo del proyecto de investigación del
Grupo Promente de la Fundación Universitaria Konrad Lorenz, en el proyecto
denominado Desarrollo de un Producto de Software para aplicación de la Lógica Difusa a los problemas de Regresión y Clasificación, dentro de la línea de
Sistemas Computacionales Bioinspirados
Dentro de los intereses del Grupo de Investigación Promente, se encuentra
por supuesto el de la investigación sobre la fundamentación matemática. Este
trabajo pretende introducir justamente los formalismos matemáticos, desde un
punto de vista puramente teórico, aunque se introducen algunos ejemplos con el
fin de aclarar los conceptos. Sin embargo, el alcance de este trabajo no pretende
conecta la teoría con los sistemas prácticos, tema que se desarrolla por otros
integrantes del grupo de investigación.
Dentro de la literatura que se consigue en el área de los sistemas difusos,
es proporcionalmente escasa la que se puede conseguir en idioma español, y
más escasa aún la que trata de los temas matemáticos que se encuentran en los
propios fundamentos de los sistemas difusos. Dentro del exámen bibliográfico
que se realizó, aún en idioma inglés, pocos son los libros que tratan esta fundamentación teórica con la suficiente profundidad. Se examinó particularmente el
libro de Ross [Ros04], que contiene abundante información tanto a nivel teórico como aplicado, así como el libro de George Klir y Bo Yuan, Fuzzy Sets and
Fuzzy Logic [Gky95] que tiene también una excelente profundidad y tratamiento
matemático.
El presente trabajo se basa fuertemente en el libro de Klir & Yuan, del cual
se toman varios ejemplos y desarrollos. Se hizo de esta manera para ir proporcionando, tanto al grupo de investigación como a quien consulte el libro de Klir
& Yuan, de un punto de entrada al mismo y al excelente tratamiento y temática
que el cobija. El tratamiento que aquí se hace de los temas abordados no es
exhaustivo, dado que por limitaciones de tiempo y por los propios intereses del
grupo, se ha centrado en solo algunos de los temas más relevantes alli tratados.
Se espera con esto contribuir en algo a la literatura en idioma español sobre esta
temática, así como familiarizar al lector con los temas que trata el libro de Klir
& Yuan.
En el capítulo 1 se hace una presentación intuitiva del concepto de matemática difusa, presentando un ejemplo simple. Alli se hace una presentación inicial
de los conceptos de conjunto difuso y función de pertenencia, entre otros. En el
capítulo 2, se presenta la fundamentación axiomática básica de la matemática
difusa y una definición más formal de la función de pertenencia y sus propiedades. Con base en esto, se introduce el concepto de número difuso, llevando así el
concepto de conjunto difuso al campo de los números reales o un subconjunto
de ellos. Por otra parte, se presentan las variables lingüísticas y los llamados
modificadores lingüísticos, que facilitan la conexión de la teoría estudiada con
las expresiones más usuales del lenguaje natural que utiliza el ser humano en
su comunicación habitual. Se expone también la teoría más general sobre los
cuantificadores difusos, mencionando solo dos de los más importantes.
4
En el capítulo3 se presentan las operaciones difusas. Por una parte, se exponen las operaciones con conjuntos difusos, tales como complemento, unión e
intersección, para pasar luego a las operaciones aritméticas tanto con números
como con intervalos difusos. Se exponen las retículas de números difusos, que
permiten introducir el concepto de orden en ellos. En el capítulo 4 se exponen
los principales conceptos relacionados con la inferencia difusa, así como algunos
de sus principales esquemas.
Dentro de los temas que no se tocan en este trabajo, está el de los mecanismos de inferencia prácticos (que corresponden a otros integrantes del grupo
de investigación). Por supuesto que tampoco se toca la mecánica práctica que
utilizan. No se aborda por ejemplo el tema de las relaciones difusas, por cuanto
no era relevante en esta etapa del proyecto de investigación.
El trabajo se ha desarrollado en LaTex siguiendo muy de cerca las normas
AMS (American Mathematical Association) para la presentación de trabajos en
matemáticas.
5
1.
Preliminares
El concepto intuitivo de conjunto clásico corresponde al de una colección de
objetos, reunidos usualmente mediante la referencia a alguna propiedad que los
caracteriza. En teoría de conjuntos clásica, un conjunto esta bien definido si se
puede determinar de manera absoluta si determinado elemento pertenece o no
al conjunto sin ninguna ambigüedad.
Las operaciones que se pueden realizar con los conjuntos clásicos, tales como
la unión, intersección, complemento, diferencia se definen mediante axiomas
sencillos que, como se verá en el desarrollo del trabajo, corresponden a casos
particulares de la matemática difusa, en particular de los conjuntos difusos.
La lógica clásica igualmente se puede considerar como un caso particular de
la lógica difusa. Por tanto, es conveniente tener presente tanto los fundamentos
de la misma, las operaciones que se pueden realizar con los objetos de la lógica,
y las principales propiedades.que poseen dichas operaciones.
La idea de la matemática difusa nació en un artículo de Lotfi A. Zadeh publicado en 1965, que tenía por título "Fuzzy Sets.en la cual se permite representar
de forma matemática conceptos difusos, borrosos o imprecisos. La matemática
difusa tiene en cuenta que solo en pocas ocasiones el concepto de blanco/negro
o verdadero/falso es absoluto. Por el contrario, existen infinitos tonos de gris
o valores de verdad en muchos de los aspectos de la realidad. Tras la publicación de la obra de Lotfi A. Zadeh, la lógica difusa comenzó a tener auge y se
desarrollaron rápidamenta aplicaciones con base en ella.
1.1.
Desarrollo Intuitivo de la Matemática Difusa
Un conjunto clásico es definido de tal manera que divide los individuos en
grupos: miembros y no miembros. Esta división es bien definida, no ambigüa,
y se da de manera abrupta, y puede ser suficientemente válida para algunos
conceptos y conjuntos, como por ejemplo la pertenencia de un número a N, o
de una letra determinada al conjunto de las vocales en el idioma español.
Siendo así, una función de pertenencia para un conjunto clásico A se puede
definir como:
0 si el elemento no pertenece a A
vA =
(1)
1 si el elemento pertenece a A
Sin embargo, muchos conceptos de clasificación presentan otra característica.
Por ejemplo el conjunto de las personas altas o de los autos veloces, no tienen
una frontera clara de clasificación, la cual se caracteriza más bien por ser poco
precisa, de manera que se puede considerar la transición gradual desde la no
pertenencia hasta la pertenencia total al conjunto.
Para definir un conjunto difuso, se debe establecer una función de pertenencia (o también llamada función de membresía en algunos textos) que permita
asignar a cada elemento, un valor real que indica que tanto pertenece al conjunto, generalmente en el intervalo unitario [0, 1] .Los valores más grandes denotan
superior grado de pertenencia al conjunto, mientras que los valores pequeños denotan poca pertenencia. En los extremos, se tiene que el valor 0 denota ninguna
6
pertenencia mientras que el valor 1 denota pertenencia total..Usualmente se utiliza cualquiera de las siguientes notaciones para hacer referencia a esta función:
κA : X → [0, 1]
A : X → [0, 1]
(2)
(3)
donde el símbolo A denota tanto al conjunto como a la función de pertenencia
asociada. Se utilizará esta última notación, de la cual se puede verificar que no
genera ninguna ambigüedad.
En el campo aplicativo, la lógica difusa ha llegado a ser importante por
cuanto permite al científico e ingeniero explotar la tolerancia a la imprecisión
que se da en situaciones y problemas reales. La lógica difusa es de gran valor
principalmente en los siguentes casos:
Situaciones complejas donde es prácticamente imposible tener un modelo
matemático que la represente adecuadamente. Esto puede deberse en parte
a la complejidad del problema, y en parte a que no se tiene suficiente
información sobre el mismo.
Situaciones complejas donde intentar obtener una alta precisión puede
llegar a ser muy costoso.
Situaciones donde obtener una alta precisión puede requerir demasiado
tiempo.
Situaciones donde la solución encontrada por los métodos clásicos requiere
simplificar excesivamente el problema real. En otras palabras, mediante los
métodos clásicos se obtendría un modelo que no representa con adecuada
fidelidad la situación de interés.
Así, la lógica difusa tiene un gran potencial para entender sistemas que son
esquivos a desarrollos analíticos por su complejidad [Ros04]. Este tipo de problemas no está circunscrito a ser de un determinado tipo; por ejemplo, pueden
ser de tipo lineal o no lineal. En casos donde se presenta esta incertidumbre,
es conveniente utilizar aproximadores universales, esto es, sistemas que describen en cierta manera el comportamiento de sistemas complejos, usualmente
no lineales.
Los sistemas difusos pueden verse como aproximadores universales, esto es, sistemas que describen en cierta manera el comportamiento de sistemas
complejos, usualmente no lineales. Esta condición de aproximador universal ha
sido demostrado en varios trabajos [Kos94]. En ellos se llegó a establecer un isomorfismo entre el álgebra abstracta y lineal y la estructura de un sistema difuso.
Dicho isomorfismo se basa en esencia, en que el desarrollo de los sistemas difusos
se basan en el teorema de aproximación de Stone-Weierstrass, que establece que toda función real contínua cuyo dominio es un intervalo compacto,
esto es cerrado y acotado, puede ser aproximado uniformemente por polinomios.
7
Por otra parte, es común que al abordar inicialmente el tema de la lógica
difusa asocie erradamente este término con la probabilidad como tal. Sin embargo [Ros04] hace una clara distinción entre estos dos términos: "difuso"hace
referencia a una falta de distinción de un evento, mientras que la probabilidad
describe la incertidumbre en la ocurrencia de dicho evento.
Los conjuntos difusos representan conceptos lingüísticos como bajo, medio
y alto, que se emplea a menudo para definir los estados de una variable. Tal
variable normalmente se llama variable difusa. En Fig.1(a), por ejemplo, la
temperatura dentro de un rango [T1 , T2 ] se caracteriza como una variable difusa,
y se contrasta en la fig.1(b). Los estados de la variable difusa allí indicados son
conjuntos difusos que representan cinco conceptos lingüísticos: muy bajo, bajo,
medio, alto, muy alto. Todos ellos estan definidos por las funciones de pertenencia
que se pueden expresar de la siguente forma:
[T1 , T2 ] − > [0, 1].
Figura 1: Comparación entre conjuntos difusos y clásicos.
La importancia de las variables difusas es que ellas facilitan las transiciones
graduales entre los estados y por consiguiente, poseen una capacidad natural
para expresar y tratar con observación e incertidumbre en la medida. Una medida suminstrada al sistema representado en la fig.1(a) es clasificada en algún
estado según la frontera que la cobije mayormente.La incertidumbre en cuanto
8
al estado alcanza el valor máximo en cada frontera donde trapecios adyacentes
se intersectan. En ese punto, una medida debe considerarse como evidencia para
cualquiera de los dos estados en la frontera. Al tratar con las variables clásicas,
fig. 1(b), el caso es muy diferente, ya que la incertidumbre incluso se ignora
en este caso extremo; la medida se considera como evidencia exclusiva para
uno de los estados en la frontera, dependiendo de cual estado contiene al punto
fronterizo en la definición matemática.
Dado que las variables borrosas capturan las incertidumbres de la medida
como la parte de datos experimentales, ellos se armonizan más a la realidad
que las variables clasicas. Es una paradoja interesante que las bases de datos
alimentadas con variables borrosas nos proporcionan, de hecho, evidencia más
exacta y más real de los fenómenos que la base de datos alimentadas con las
variables clásicas.
Aunque la matemática basada en los conjuntos difusos tiene mejor capacidad expresiva que la matemática basada en los conjuntos clásicos, su utilidad
depende críticamente de la capacidad que se tenga para construir las funciones
de pertenencia apropiadas para diferentes conceptos den diferentes contextos.
Ejemplo 1.1 (Conjunto Difuso) Se considerarán [Gky95] ahora tres conjuntos difusos que representan los conceptos de persona joven, de mediana edad y
vieja.Se puede obtener una expresión razonable de estos conceptos si se utilizan
Mediana Edad A
Edadx
Figura 2: Función de pertenencia trapezoidal.(ejemplo tomado de [Gky95]).
funciones de pertenencia trapezoidales A1 , A2 , A3 tal se muestra en Fig.2. Estas
funciones se pueden definir en el intervalo [0, 80] como sigue:
9
A1 (x) =
A2 (x) =
A3 (x) =









1
cuando x ≤ 20
(35−x)
15
cuando 20 < x < 35
0
cuando x ≥ 35

0 cuando x < 20 o x > 60





(x−20)

cuando 20 < x < 35

15
















(60−x)
15
cuando 45 < x < 60
1
0
(x−45)
15
(4)
(5)
cuando x ≥ 60
cuando x ≤ 4520
cuando 45 < x < 60
1
(6)
cuando x ≥ 60
Es necesario en algún momento realizar una de las posibles aproximaciones discretas de los valores difusos. Las aproximaciones son importantes
porque, como se verá posteriormente, son necesarias en las representaciones y
en el cálculo de conjuntos difusos. Por ejemplo, se puede tomar la función A2 ,
que se muestra en la ec. 5 y la fig.2 y definir la aproximación discreta como
sigue:
Es importante notar la simetría implícita en la definición de la aproximación
discreta.
2.
2.1.
Fundamentación de la Matemática Difusa
Conjuntos Difusos y Lógica Difusa
El alfabeto utilizado en la lógica difusa es en gran parte similar a la lógica
clásica. Por una parte, se requieren proposiciones, conectivos, y en general, de
un lenguaje mediante el cual se pueda expresar de manera clara. Por una parte,
se verá más adelante que la lógica difusa se puede ver como una extensión de la
lógica tradicional en muchos aspectos. Como tal. toma parte de sus elementos
de ella.
La matemática difusa se basa en una fundamentación axiomática similar a la
teoría de probabilidades, con la cual comparte la mayoría de los axiomas. Este
constructo requiere la definición de una retícula que consiste de los siguientes
nodos:
1. X que es el universo del discurso.
2. T que es un elemento maximal.
3. F que es un elemento minimal.
10
D 2x
x
x ∉ 22, 24, . . . , 58 0. 00
x ∈ 22, 58
x ∈ 24, 56
0. 13
x ∈ 26, 54
x ∈ 28, 52
0. 40
x ∈ 30, 50
0. 67
x ∈ 32, 48
0. 80
x ∈ 34, 46
0. 93
0. 27
0. 53
x ∈ 36, 38, . . . , 44 1. 00
Figura 3: Aproximación Discreta de la función de pertenencia A2 mediante la
función D2 de la forma: D2 : {0, 2, 4, ..., 80} → [0, 1] . [Gky95].
4. ∧ la conjunción.
5. ∨ la disyunción.
La retícula se puede denotar por L (X, T, F, ∧, ∨) .Las letras x, y, z denotan
elementos de X dentro de la retícula.
Los axiomas presentan inicialmente, la definición de la retícula:
Axioma 2.1 (Idempotencia) Para todo x ∈ L, se tiene que:
x∧x=x∨x=x
(7)
Axioma 2.2 (Conmutatividad) Para todo x, y ∈ L, se tiene que:
x∨y
x∧y
= y∨x
= y∧x
(8)
(9)
Axioma 2.3 (Asociatividad) Para todo x, y, z ∈ L, se tiene que:
x ∨ (y ∨ z) = (x ∨ y) ∨ z
(10)
Axioma 2.4 (Absorción) Para todo x, y ∈ L, se tiene que:
x ∨ (x ∧ y) = x
x ∧ (x ∨ y) = x
11
(11)
(12)
Axioma 2.5 (Elemento Maximal y Minimal) Para todo x ∈ L se tiene
que:
x∨T = T y x∧T =x
(13)
Axioma 2.6 (Relación de Órden) Para todo x, y ∈ L se tiene que:
x ≤ y si existe z ∈ L tal que y = x ∨ z
(14)
A cada elemento de la retícula se le puede aplicar una función de valuación, que indicará su valor de verdad en el intervalo [0, 1] . La función de
valuación de denotará por
p : L → [0, 1]
(15)
y está sujeta a las siguientes condiciones:
Axioma 2.7 p(F ) = 0 y p(T ) = 1
Axioma 2.8 Para todo x, y ∈ L,
si x ≤ y entonces p(x) ≤ p(y)
(16)
Axioma 2.9 (Aditividad) Para todo x, y ∈ L,
p(x ∧ y) + p(x ∨ y) = p(x) + p(y)
(17)
donde p(x ∧ y) ≤ mı́n(p(x), p(y)) ≤ máx(p(X), p(y)) ≤ p(x ∨ y)
Axioma 2.10 (Equivalencia o Congruencia) Para todo x, y ∈ L,
x ↔ y si p(x ∧ y) = p(x ∨ y)
(18)
Los10 axiomas anteriores son comunes a prácticamente la totalidad de las
lógicas.
Axioma 2.11 (Distancia) Para todo x, y ∈ L,
d(x, y) = p(x ∨ y) − p(x ∧ y)
(19)
donde d(x, y) cumple que 0 = d(x, x) ≤ d(x, y) ≤ 1
Axioma 2.12 (Medida de Equivalencia) Para todo x, y ∈ L, se tiene:
p(x ↔ y) = 1 − d(x, y) = 1 − p(x ∨ y) + p(x ∧ y)
(20)
Axioma 2.13 (Medida de la Fuerza de la Implicación.) Para todo x, y ∈
L, se tiene:
p(x → y) = p(x ↔ x ∧ y)
= 1 − d(x, x ∧ y)
= 1 − p(x) − p(x ∧ y)
= 1 + p(y) − p(x ∨ y)
= 1 − d(x, x ∨ y)
12
(21)
Axioma 2.14 (Negación) Para todo x ∈ L, se cumple
p(x̄) = p(x ↔ F ) = 1 − p(x) = 1 − d(x, F )
(22)
Axioma 2.15 (Distributividad) Para todo x, y, z ∈ L, se tiene que
x ∧ (y ∨ z) = (x ∧ y) ∨ (x ∧ z)
(23)
Axioma 2.16 (Implicación Estricta) Para todo x, y ∈ L, se tiene que
{p(x → y) = 1 ∨ p(y → x) = 1}
(24)
La versión debilitada del axioma es tomada usualmente por la lógica difusa:
p((x → y) ∨ p(y → x)) = 1
(25)
La función de valuación (ec. 15) es equivalente a la ec. 3, cuyas propiedades
y características se explican en la sección 2.2.
2.2.
La Función de Pertenencia
La función de pertenencia describe toda la información contenida en un
conjunto difuso. Tal como se mencionó en la sección 1.1, se espera que esta
función sea contínua, cerrada y acotada, y que posea algunas propiedades que
la hagan interesante.
Definición 2.1 (Propiedades de Función de Pertenencia) Dado un conjunto difuso A, se espera que su función de pertenencia cumpla con las siguientes
propiedades:
1. Propiedad de Normalidad: debe existir x ∈ A tal que A(x) = 1. Si
se tiene que A(x) < 1 para todo x ∈ A, al conjunto difuso se le llama
subnormal.
2. Propiedad de Monotonicidad: si x1 es más próximo a x que el valor
x2 , entonces A(x1 ) > A(x2 )
3. Propiedad de Simetría: Si x1 y x2 son equidistantes de x, entonces
A(x1 ) = A(x2 )
Algunas funciones de pertenencia de uso común, que cumplen con las propiedades mencionadas, se muestran en la fig. 4.
Uno de los conceptos más importantes de conjuntos difusos es el concepto
de corte α y su variante el corte estricto, que se exponen en la siguiente
definición.
13
1
1
A1 (x)
.5
A1 (x)
.5
0
0
1
3
2
4
x
0
0
1
1
A 1 (x)
.5
A 1 (x)
.5
0
0
1
3
2
4
x
0
0
1
2
3
4
x
1
2
3
4
x
Figura 4: Algunas funciones de transferencia comunes.
Definición 2.2 (Corte Alfa) Dado un conjunto difuso A definido en X y
cualquier número α ∈ [0, 1], el corte α, denotado por α A, y el corte estricto,α+ A,
son los conjuntos tradicionales o clásicos de la forma:
α
α+
A = {x/A(x) ≥ α}
A = {x/A(x) > α}.
(26)
(27)
Esto es, son los conjuntos clásicos α A y α+ A donde están contenidos todos
los elementos x del conjunto referencial X cuyo grado de pertenencia es mayor
que o igual al valor específico de α.
Una propiedad importante de corte α y corte α estricto que siguen inmediatamente de sus definiciones, es que la clasificación total de valores de α en
el intervalo [0, 1] es inversa en la forma que conserva la inclusión de los cortes
α correspondientes, y de manera análoga para los cortes α estrictos. Es decir,
para cualquier conjunto difuso A y para α1 , α2 ∈ [0, 1] de distinto valor tal que
α1 < α2 , se tiene:
α1
A ⊇α2 Ayα1 + A ⊇α2 + A.
(28)
Esta propiedad también puede expresarse por las ecuaciones
α1
A ∩α2 A =α2 A,α1 A ∪α2 A =α1 A,
14
(29)
y
α1 +
A ∩α2 + A =α2 + A,α1 + A ∪α2 + A =α1 + A
(30)
Una consecuencia obvia de esta propiedad es que todos los cortes α y todos
los cortes α estrictos de cualquier conjunto difuso forman dos familias distintas
de conjuntos clásicos anidados. Por ejemplo, los intervalos que representan los
cortes α y los cortes α estrictos de los conjuntos difusos A1 , A2 , y A3 en la fig.
2 cortan con el α creciente. Desde que los conjuntos de nivel A1 , A2 , y A3 son
todos [0, 1], claramente, las familias de todos los cortes α y todos los cortes α
estrictos son en este caso infinitos para cada uno de los conjuntos.
En este punto conviene conocer la forma general de una función de pertenencia, y conocer los nombres asignados a algunas de sus partes.
Definición 2.3 (Núcleo - core) El centro (core) de una función de pertenencia para un conjunto difuso A se define como la región del universo que se caracteriza por la completa y total pertenencia de sus elementos al conjunto A. Esto
es, es el conjunto clásico definido como:
centro de A = {x | A(x) = 1}
(31)
Luego el centro de A se puede definir como el corte 1 A.
Definición 2.4 (Soporte - support) El soporte (support) de una función de
pertenencia para un conjunto difuso A se define como la región del universo que
se caracteriza por tener un grado de pertenencia al conjunto A, que sea mayor
que 0 Esto es, es el conjunto clásico definido como:
soporte de A = {x | A(x) > 0}
Luego el soporte de A se puede definir como el corte estricto
(32)
0+
A
Definición 2.5 (Frontera - boundary) La frontera (boundary) de una función de pertenencia para un conjunto difuso A se define como la región del
universo que se caracteriza por tener un grado de pertenencia al conjunto A,
que sea mayor que 0, pero menor que 1 Esto es, es el conjunto clásico definido
como:
frontera de A = {x | 0 < A(x) < 1}
(33)
Luego la frontera de A se puede definir como
0+
A −1 A.
Definición 2.6 (Altura) La altura h(A) de un conjunto difuso A es el mayor
grado de pertenencia obtenido por cualquier elemento en ese conjunto. Formalmente:
h(A) = sup A(x).
(34)
x∈X
donde si el conjunto difuso cumple la propiedad de normalidad,se tiene que
h(A) = 1.
15
Ejemplo 2.1 Con base en el ejemplo 1.1, se puede tener una caracterización
completa de todos cortes α y los cortes estrictos α para los Paconjuntos difusos
A1 , A2 , A3 según la fig. 2. Para todo α ∈ (0, 1]
0
A1
A1
α
A2
α
A3
α+
A1
α+
A2
α+
A3
1+
A1
α
=
=
=
=
=
=
=
=
0
A2 =0 A3 = [0, 80] = X
[0, (35 − 15α)]
[(15α + 20) , (60 − 15α)]
[(15α + 45) , 80]
(0, (35 − 15α))
((15α + 20) , (60 − 15α))
((15α + 45) , 80)
1+
A2 =1+ A3 = ∅
Definición 2.7 (Conjunto Nivel) El conjunto de todos los valores α ∈ [0, 1]
para un conjunto difuso dado A es llamado un conjunto nivel de A. Formalmente,
Λ(A) = {α/A(x) = α para algún x ∈ X}
donde Λ denota el nivel del conjunto difuso A definido en X.
Ejemplo 2.2 Para el ejemplo 1.1 se tienen los siguientes conjuntos nivel:
Λ(A1 ) = Λ(A2 ) = Λ(A3 ) = [0, 1]
Λ(D2 ) = {0, 0,13, 0,27, 0,4, 0,53, 0,61, 0,8, 0,93, 1}
Teorema 2.1 (Conjunto difuso convexo) Un conjunto difuso A en es
convexo si y solo si
A(λx1 + (1 − λ)x2 ) ≥ mı́n[A(x1 ), A(x2 )]
para todo x1 , x2 ∈ y todo λ ∈ [0, 1], donde mı́n denota al operador mínimo.
Demostración. Es similiar a la demostración para conjuntos clásicos.
1. Se asume que A es convexo y sea α = A(x1 ) < A(x2 ).Entonces, x1 , x2 ∈α
A y λx1 + (1 − λ)x2 ∈α A para algun λ ∈ [0, 1] por la convexidad de A.
Luego
A(λx1 + (1 − λ)x2 ) ≥ α = A(x1 ) = min [A(x1 ), A(x2 )] .
2. Se supone que A satisface A(λx1 + (1 − λ)x2 ) ≥ min[A(x1 ), A(x2 )], se
necesita demostrar que para cualquier α ∈ (0, 1],α A es convexo.
16
Se tiene que cualquier x1 , x2 ∈α A. (esto es, A(x1 ) ≥ α, A(x2 ) ≥ α), para
cada λ ∈ [0, 1],
Por A(λx1 + (1 − λ)x2 ) ≥ min[A(x1 ), A(x2 )]
A(λx1 + (1 − λ)x2 ) ≥ min [A(x1 ), A(x2 )] ≥ mı́n(α, α) = α;
es decir λx1 + (1 − λ)x2 ∈α A, α A es convexo para cualquier α ∈ (0, 1].
Luego A es convexo.
Las tres operaciones básicas en conjuntos clásicos que son complemento,
intersección y unión, pueden generalizarse a los conjuntos difusos en más de
una manera. Sin embargo, una generalización particular que es de interés es
la que produce las llamadas operaciones difusas estándar, que sonlas que se
tendrán en cuenta de ahora en adelante, y se definen a continuación.
Definición 2.8 (Complemento) El complemento normal Ā, de un conjunto
difuso A con respecto al conjunto universo X es definido para todo x ∈ X por
la ecuación
Ā(x) = 1 − A(x)
(35)
Los elementos de X para los que Ā(x) = A(x) se llaman puntos de equilibrio de A.
Para el complemento normal, es claro que el grado de función de pertenencia
de los puntos de equilibrio es de 0,5. por ejemplo, el punto de equilibrio de A2
en Fig.2 es de 27,5 y 52,5.
Definición 2.9 (Unión) Dado dos conjuntos difusos, A y B, la unión normal,
A ∪ B, se define para todo x ∈ X por las ecuaciones
(A ∪ B)(x) = max[A(x), B(x)]
(36)
Definición 2.10 (Intersección) Dado dos conjuntos difusos, A y B su intersección normal, A ∩ B, se define para todox ∈ X por las ecuaciones
(A ∩ B)(x) = min[A(x), B(x)]
(37)
Donde el min y max denotan al operador mínimo y al operador máximo, respectivamente. Debido al asociatividad de min y max, estas definiciones pueden
extenderse a cualquier numero finito de conjuntos difusos. Con base en el ejemplo
1.1, se tiene que la operaciones de unión (A1 ∪ A3 ) se puede definir gráficamente
como se observa en la fig 5.
Mientras que un ejemplo de las operaciones de intersección y el complemento
se observan en la fig. 6
Cualquier conjunto potencia difuso, denotado por F (X) puede verse como
una retícula, en la cual la intersección difusa normal y la unión difusa normal
17
A2
1
x
A 3(x)
x
A 3 ) (x)
x
Figura 5: Unión difusa: A1 ∩ A3 según el ejemplo 1.1.
18
B(x)
1
x
C (x)
1
x
(B C)(x)
x
(B C)(x)
1
x
19
Figura 6: Operaciones difusas.para
el ejemplo [Gky95]
juegan los papeles de ínfimo y supremo respectivamente. Esto satisface todas
las propiedades de la retícula Booleana definidas en la sec. ??, exceptuando la
ley de contradicción y la ley de medio excluido. Tal retícula es a menudo llamada
un Retícula de De Morgan o un Álgebra de De Morgan.
La retícula de De Morgan también puede definirse como el par (F (X), ⊆),
donde el ⊆ denota la inclusión difusa, gracias a la cual los elementos de F (X) están parcialmente ordenados. Entonces, si se tienen dos conjuntos difusos A, B ∈
F (X), A es un subconjunto de B, y se denota (A ⊆ B) si,
A(x) B(x)
para todo x ∈ X. Se puede verificar que con las operaciones difusas estándar,
A ⊆ B si A ∩ B = A y A ∪ B = B para cualquierA, B ∈ F (X).
Si bien muchas propiedades de la lógica clásica y la lógica difusa se comparten
entre ellas, es necesario tener precaución porque no sucede con todas las leyes.
Este es el caso de la Ley de Contradicción. Si esta ley se cumpliera en lógica
difusa, se debería tener siempre que min[A(x), 1 − A(x)] = 0. Esto se puede
traducir afirmando que o bien un valor de verdad o bien su contrario debe ser
totalmente falso (valor 0). Sin embargo, es fácil verificar que esta igualdad no se
cumple para cualquier valor A(x) ∈ (0, 1) y sólo se cumple para A(x) ∈ {0, 1},
que corresponde al caso particular de los conjuntos clásicos.
Definición 2.11 (Cardinalidad Escalar) Para cualquier conjunto difuso A
definido en un conjunto universal finito X, se define la cardinalidad escalar, |A|
mediante la expresión
|A| =
A(x)
(38)
x∈X
Es usual encontrar que a |A| se le llama cuenta sigma de A.
Ejemplo 2.3 Según esta definción, la cardinalidad escalar del conjunto difuso
D2 definido en el ejemplo 1.1 es
|D2 | = 2(0,13 + 0,27 + 0,4 + 0,53 + 0,67 + 0,8 + 0,93) + 5 = 12,46
Al igual que un elemento tiene un grado de pertenencia a un conjunto difuso, se puede realizar una consideración análoga respecto de la inclusión de un
conjunto en otro conjunto difuso. Para este último caso, se habla del grado de
inclusión como una medida análoga al grado de pertenencia.
Definición 2.12 (Grado de Inclusión) Sean A, B un par cualquiera de subconjuntos difusos definidos en un conjunto universal finito X. El grado de inclusión de A en B, denotado por S(A, B), se define mediante la expresión
1
S (A, B) =
|A|
|A| −
x∈X
20
max[0, A(x) − B(x)]
(39)
la cual se puede expresar de manera más resumid, mediante algunas transformaciones, de la forma
S(A, B) =
|A ∩ B|
|A|
(40)
En esta definición, la
describe la suma de los grados a que la desigualdad del subconjunto A(x) B(x) se viola. La diferencia describe la falta de
estas violaciones, y la cardinalidad |A| en el denominador permite normalizar la
expresión en el rango 0 ≤ S(A, B) ≤ 1 como es de esperarse.
2.3.
Números Difusos
Entre los diversos tipos de conjuntos difusos, de importancia especial son
los conjuntos difusos que se definen en el conjunto R de números reales. Como
dicho conjunto es infinito, el conjunto difuso tendrá infinitos miembros. Además,
como en todo conjunto difuso, a cada número real se corresponde un valor de
pertenencia que es asignado por una función de pertenencia. Las funciones de
pertenencia de estos conjuntos tienen la forma
A : R− > [0,1]
(41)
Esta función tiene claramente un significado cuantitativo y bajo ciertas
condiciones, se puede ver a A como un número difuso o intervalo difuso. En general, un número difuso se puede definir de manera breve tal como se
expone a continuación.
Definición 2.13 (Número Difuso) Se define un número difuso como un
conjunto normalizado y convexo A ⊆ R, cuya función de pertenencia es al
menos, contínua a trazos y tiene el valor funcional A(x) = 1 justo para un
elemento.
Analizando la anterior definición, se tiene que el conjunto difuso se puede
ver intuitivamente como el conjunto de números cercanos a un valor r en A, tal
como muestra la fig. 7. El conjunto A debe ser normal, y bajo esta concepción
el grado de pertenencia de r en cualquier conjunto difuso debe ser 1, o en otras
palabras, A(r) = 1. El soporte de un número difuso y todos sus cortes α, para
α = 0, debe ser un intervalo cerrado, para permitir la definicion del significado de operaciones aritméticas en números difusos en cuanto a las operaciones
aritméticas ordinarias en los intervalos cerrados, que son bien establecidas en
términos del análisis clásico de intervalos [Gky95].
Definición 2.14 (Intervalo Difuso) Se define un intervalo difuso como un
conjunto indeterminado normalizado y convexo A ⊆ R que posee un intervalo
intermedio cuya función de pertenencia es como mínimo, contínua a trazos y
tiene el valor funcional A(x) = 1 justo para todo x del intervalo intermedio.
21
Intuitivamente, los números o intervalos difusos se pueden ver como números
o intervalos aproximados, como "los números cercanos a un número real " o "los
números reales que estan alrededor de un intervalo de números reales"[Gky95]
Ya que un corte α de cualquier número difuso requiere estar dentro de un
intervalo cerrado para todo α ∈ (0,1], cada número difuso es un conjunto difuso
convexo. Lo inverso, sin embargo, no necesariamente es verdad, ya que cortes α
de algunos conjuntos difusos convexos, quizá sean abiertos o intervalos abiertos
por la mitad.
Ejemplo 2.4 (Números e Intervalos Difusos) La fig. 7 muestra los siguientes casos:
1. El número real ordinario 1,3
2. El intervalo ordinario [1,25, 1,35].
3. Un número difuso que expresa la proposición "cerca de 1.3".
4. Un intrervalo difuso que expresa la proposición "cerca del intervalo [1.28,1.32]".
1
0
0
Figura 7: Número e Intervalo Difuso.
22
Las formas de la función de pertenencia más usuales para los números difusos
son precisamente las mostradas en la fig. 7, aunque el tipo de aplicación y la
necesidad pueden determinar el uso de otras formas, incluso asimétricas, tal
como se observa en la fig. 8.
La función de pertenencia asimétrica de la fig.8(c) aumenta hasta llegar a
cierto valor, mientras que la función de pertenencia de la fig. 8(d) disminuye
después de cierto valor, lo que también satisface los requisitos de los números
difusos en el sentido que captan nuestra concepción de un número grande y
número pequeño respectivamente, en el contexto de una aplicación particular.
Aún cuando estas funciones tampoco cumplen la condición de simetría, su importancia y utilidad es clara.
1
1
A
B
0
0
a
(b)
1
1
D
C
0
0
(d)
(c)
Figura 8: Funciones de Pertenencia Asimétricas.
Teorema 2.2 (Representación de número difuso) Sea A ∈ F (R). Entonces, A es un número difuso.si en A existe un intervalo cerrado [a, b] = ∅ de tal
manera que

1 para x ∈ [a, b]

l(x) para x ∈ (−∞, a)
A(x) =
(42)

r(x) para x ∈ (b, ∞),
23
Donde la función l es una función monótona creciente, contínua a la derecha
definida como:
l : (−∞, a) → [0,1]
(43)
de tal manera que l(x) = 0 para x ∈ (−∞, w1 ). La función r es una función
monótona decreciente, contínua a la izquierda definida como:
r : (b, ∞) → [0, 1]
(44)
de tal manera que r(x) = 0 para x ∈ (w2 , ∞).
La implicación del teorema 2.2 es que cada número difuso puede ser representado de forma fragmentada, tal como se expone en la gráfica 9.
A
1
D
0
a
b
Figura 9: Representación fragmentada de un número difuso.
Ejemplo 2.5 Se definen los cuatro números difusos en el fig.7 asi:
1. w1 = a = b = w2 = 1,3, ,l(x) = 0 para todo x ∈ (−∞, 1, 3), r(x) = 0 para
todo x ∈ (1,3, ∞).
2. w1 = a = 1,25, b = w2 = 1,35, ,l(x) = 0 para todo x ∈ (−∞, 1,25),
r(x) = 0 para todo x ∈ (1,35, ∞).
24
3. a = b = 1,3, w1 = 1,2, w2 = 1,4,
0
para x ∈ (−∞, 1,2)
l(x) =
10(x − 1,3) + 1 para x ∈ (1,2, 1,3]
0
para x ∈ (1,4, ∞)
r(x) =
10(1,3 − x) + 1 para x ∈ (1,3, 1,4]
4. a = 1,28, b = 1,32, w1 = 1,2, w2 = 1,4,
0
para x ∈ (−∞, 1,2)
l(x) =
12,5(x − 1,28) + 1 para x ∈ [1,2, 1,28)
0
para x ∈ (1,4,∞)
r(x) =
12,5(1,32 − x) + 1 para x ∈ (1,32, 1,4]
Usando los números difusos, se puede definir el concepto de cardinalidad
difusa para conjuntos difusos que están definidos en conjuntos universales finitos.
Definición 2.15 (Cardinalidad Difusa) Sea A un conjunto difuso definido
en un conjunto universo finito X. La cardinalidad difusa de A, denotada por
|A|, es un número difuso definido en N mediante la fórmula
α
Ā
(| A|) = α para todo α ∈ Λ(A).
Ejemplo 2.6 El cardinal difuso para el conjunto D2 definido en la fig. 3 cuyo
corte α esta en la fig. 2, es
0,13 0,27 0,4 0,53 0,67 0,8 0,93 1
D =
+
+
+
+
+
+
+ = 0,572 82
19
17
15
13
11
9
7
5
2.4.
Variables Lingüísticas
Las variables difusas cuantitativas se formulan con ayuda del concepto
de número difuso, que permite representar el estado de dicha variable. Pero los
números difusos se utilizan para representar conceptos lingüísticos (tales como
peqeño, mediano, grande, etc), que pueden ser interpretados en un contexto
particular, se generan estructuras llamadas variables lingüísticas [Gky95].
Cada variable lingüística cuyo estado se expresa mediante terminos lingüísticos interpretados como números difusos específicos es definido en terminos de
una variable base, cuyos valores son números reales dentro de un rango
específico. Una variable base es una variable en el sentido clásico (por ejemplo
la temperatura, la presión, la velocidad, el voltaje, la humedad, etc.) así como cualquier otra variable numérica, (por ejemplo, envejecer, actuación, sueldo,
cantidad de sangre, probabilidad, fiabilidad, etc.). En una variable lingüística se representan valores aproximados de terminos linguisticos de una variable
base, pertinente a una aplicación particular, capturados por los números difusos
apropiados.
25
Definición 2.16 (Variable Lingüística) Una variable lingüística se caracteriza totalmente por un quíntuplo (v, T (x), X, g, m) en donde
v es el nombre de la variable lingüística,
X es el conjunto universo
T es el conjunto de terminos lingüísticos de v que se refiere a una variable
base.de quien el rango de valores es un conjunto X,
g es una regla sintáctica (una gramática) por lo general los términos
lingüísticos en T , y
m es una regla semántica que asigna a cada término lingüístico t ∈ T su
significado m(t) que es un conjunto difuso en X. Es decir m : T → F (X).
Para hacer claridad en estos conceptos conviene introducir aquí un ejemplo,
tomado de [Gky95].
Ejemplo 2.7 Un ejemplo de una variable lingüística se muestra en la fig.10. El
nombre de la variable lingüística es .a ctuación"(performance). Esta variable expresa la actuación (variable base en este ejemplo) de la entidad meta-orientada
(una persona, la máquina, la organización, el método, etc.) en un contexto dado
por cinco terminos lingüísticos básicos, que son: muy pequeño, pequeño, mediano, grande, muy grande, vistos como condiciones lingüísticas generadas por
una regla sintáctica (no explícitamente mostrado en la fig.10), como no muy
pequeño, grande o muy grande, muy muy pequeño, y asi sucesivamente.
A cada uno de los términos lingüísticos básicos es asignado uno de los cinco
números difusos según una regla semántica, como mostrado en la figura [Gky95].
Los números difusos cuyas funciones de pertenencia tienen la forma trapezoidal
usual, se han definido en el intervalo [0, 100].
2.5.
Proposiciones y Conectivos
Las proposiciones difusas se diferencian de las proposiciones clásicas por el
rango de sus valores de verdad, ya que el grado de verdad de una proposicion
difusa se expresa por un numero en el intervalo de la unidad [0, 1] , mientras que
el grado de verdad de una proposición clásica se encuentra únicamente en los
extremos de dicho intervalo, esto es {0, 1}
Las proposiciones difusas que se puedan encontrar en los textos son expresadas generalmente en cuatro tipos:
1. Las proposiciones incondicionales e inhabiles.
2. Las proposiciones incondicionales y calificadas.
3. El condicional y las proposiciones inhabiles.
4. El condicional y las proposiciones calificadas.
26
Variable
Linguistica
Valores
Linguisticos
PEQUEÑO
MEDIANO
MUY ALTO Regla
Semantica
Restricción
Difusa
Variable Base
Figura 10: Ejemplo de variable lingüística (tomado de [Gky95]).
Definición 2.17 (Proposiciones Incondicionales No-Calificadas) Una proposición incondicional no-calificada es una expresión p de la forma
p : V es F
(45)
donde V es una variable que toma valores v de algun conjunto universal de
valuaciones V , y F es un conjunto difuso en V que representa un predicado
difuso.
Si T (p) es el grado de verdad de la proposición p, y v es un valor particular
de V, entonces v ∈ F con grado de pertenencia F (v), y se cumple que
T (p) = F (v)
(46)
La expresión se puede generalizar si V es asignada según un determinado
conjunto índice I, de tal manera que V : I → V, donde si i ∈ I, y V es el
conjunto de valores que puede eventualmente tomar V (i) , la expresión de la ec.
toma la forma más general
p : V (i) es F donde i ∈ I
T (p) = F (V (i))
(47)
(48)
El papel que cumple la ec.46 es de vital importancia, ya que provee un puente
de conexión entre la teoría de conjuntos y las proposiciones difusas, tal como se
verá en el ejemplo 2.8.
27
Ejemplo 2.8 Sea V una variable que representa la temperatura. Sea "altaün
predicado, donde "alta"∈ F. Sea p una proposición difusa que espresa:
p : La temperatura (V) es alta (F )
De acuerdo con la definición, el grado de verdad T (p) depende tanto del
valor real de la temperatura como de la definición de .a lta". Suponga ahora que
se tiene la función de pertenencia definida en la fig. 11
Figura 11: Ejemplo de la Temperatura (tomado de [Gky95]).
Se sabe que V toma valores particulares de acuerdo v con la temperatura. Si
se tiene como caso particular que V = v = 85 grados, tal como se indica en la
gráfica, el grado de pertenencia que le corresponde es de F (v) = F (0,85) = 0,75.
Y de acuerdo con la ec 46, y tal como se observa en la fig. 12, T (p) = F (v) =
0,75.
Ejemplo 2.9 Sea I un conjunto de personas, cada persona se caracteriza por
su edad, y dado un conjunto difuso expresado por el predicado "joven", la forma
general p : V (i) es F sera p : edad(i) es joven.
El grado de verdad de esta proposicion T (p) es determinado para cada persona i, luego T (p) = Joven(edad(i)).
Definición 2.18 (Proposiciones Condicionales No-Calificadas) Una proposición condicional no-calificada es una expresión p de la forma:
p : si V es F, entonces W es G
(49)
donde V, W son variables que toman valores respectivos v ∈ V, w ∈ W,
donde V, W son universos de valuaciones, y F, G son conjuntos difusos en
V, W que representa un predicado difuso.
28
Figura 12: Ejemplo de conexión entre Teoría de Conjuntos Diusos y Proposiciones Difusas.
Estas proposiciones también pueden verse como las proposiciones de la forma
{V, W} es R,
(50)
donde R es un conjunto difuso en el producto cartesiano V × W que es
determinado para cada v ∈ V y cada w ∈ W de la forma
R(v, w) = j [V(v), W(w)]
(51)
donde j denota un operacion binaria en [0, 1], representando la implicación
difusa conveniente de acuerdo con la necesidad.
2.6.
Cuantificadores Difusos
Se puede extender el alcance de los predicados difusos mediante el uso de
cuantificadores difusos. Los cuantificadores difusos son números difusos que
toman parte en las proposiciones difusas, con algunas especificaciones que se
introducen en esta sección.
Los cuantificadores difusos pueden ser de de dos tipos: los absolutos, definidos
en R y los relativos, definidos en [0, 1].
29
2.6.1.
Cuantificadores Difusos Absolutos
Los cuantificadores difusos absolutos están definidos en R y se caracterizan mediante determinados términos lingüísticos que lo evidencian: "casi 10 ",
"mucho más de 1500 ", "aproximadamente 270 ", por ejemplo.
Las expresiones de este tipo se pueden representar formalmente de tres maneras equivalentes:
p : Hay Q i s en I tales que V(i) es F
p : Hay Q E s donde E(i) = F (V(i))
p : X es Q
(52)
(53)
(54)
donde p es la expresión más analítica, p es la expresión resumida, y p es una
expresión equivalente aún más resumida y más habitual en el lenguaje natural,
que pueden representar todas el mismo concepto como se verá en el ejemplo. Se
tiene en estas expresiones que Q es un número difuso en R, V es una variable
que asume el valor V(i) para el individuo i ∈ I, y F es un conjunto difuso
constituido por todos los posibles valores de V.
En la ec. 54 se tiene que X es una variable que toma valores en R que
representa la
cardinalidad
del escalar del conjunto difuso, esto es, W = |E| ,
donde |E| = i∈I E(i) = i∈I F (V(i)).Además, se puede verificar que
T (p) = T (p ) = T (p ) = Q (|E|) .
(55)
Ejemplo 2.10 Se tiene que p ="Hay alrededor de 57 trabajadores que tienen
buen rendimiento en ventas en la empresa". Donde I es el conjunto de trabajadores, Q es el número difuso real .a lrededor de 57", V(i) es el grado de
rendimiento del vendedor i, y F es el conjunto difuso definido con los posibles
valores de V que representan al término lingüístico "buen".
Se puede tener una expresión para p ="Hay alrededor de 57 trabajadores
buenos-vendedores en la empresa".
Ejemplo 2.11 Sea la proposición
p : "Hay aproximadamente tres estudiantes del curso cuya facilidad en inglés es alta".
Sea I conformado por los integrantes del curso, es decir I = {Andres, Blanca,
Carlos, Diego, Viviana}
Sea V es una variable con los valores en el intervalo [0, 100] grados que expresan la facilidad para el inglés, V(i) es la facilidad en inglés del integrante i. F es
el conjunto difuso conformado por todos los posibles valores de V. Comparando
la proposición p con
p : "Hay Q i’s en I tal ese V (i) es F ,se puede ver que Q, en este
caso,es el cuantificador difuso .aproximadamente 3, y F es un conjunto
difuso que toma valores en [0, 100], y captura numéricamente el término lingüístico ”facilidad-alta”. Q y F se definen en la fig. 13 Se asume que:
30
V (Andres) = 35,
V (Blanca) = 20,
V (Carlos) = 80,
V (Diego) = 95,
V (Esteban) = 70.
El valor de verdad de la proposición es:
0
Andres
E=
0
Blanca
+
+
,75
Carlos
+
1
Diego
,5
Esteban .
+
Luego, se calcula el cardinal de E:
|E| = E(i) = 2,25.
i∈I
Finalmente, se usa T (p) = T (p´) = Q (|E|) para obtener el valor de verdad
de nuestra proposición:
T (p) = 2(2,25) = 0,625.
Asumiendo, por otro lado, que las cuentas de los estudiantes no son conocidas, no se construye E. La proposición proporciona, en este caso, con la información sobre los grados de posibilidad de varios valores del cardinal de E.
por ejemplo, Q(3) = 1, la posibilidad de |E| = 3 es 1; esto es imposible porque
|E| = 5, y así sucesivamente.
1
1
0.75
Q(E)
0.625
F(a)
0.5
0
1
3
2
2.25
Q:
4
5
0
6
(E)
cerca de 3
50
Brenda
Andres
F:
100
a
Carlos
David
Fluidez
Figura 13: Gráfica para el ejemplo 2.11 (tomado de [Gky95])
2.6.2.
Cuantificadores Difusos Relativos
Los cuantificadores difusos del segundo tipo se definen en [0, 1] y se caracterizan por terminos lingüísticos que lo evidencian: "casi todos", "la mayoría",
"poco más de la mitad", por ejemplo. Se puede observar la representación gráfica
de un cuantificador de este tipo en la fig 14.
31
Aprox mitad
Medio
1
Casi Todo
0.4
0
1
0.63
Figura 14: Cuantificador difuso definido en [0, 1] .
Las proposiciones difusas con los cuantificadores del segundo tipo tienen la
forma general
p : Entre los i s en I tales que V (i) es F1 hay Qi s en I tales que V2 (i) es(56)
F2
p : Q E1 s son E2 s
(57)
p : X es Q
(58)
donde Q es un número difuso en [0, 1], y el significado de los símbolos
restantes es el mismo como previamente se definieron, y E1 , E2 son los conjuntos difusos:
E1 (i) = F1 (V1 (i))
E2 (i) = F2 (V2 (i)), ∀i ∈ I
(59)
(60)
Ejemplo 2.12 Un ejemplo de una proposición de este formulario es la proposición ”Entre los estudiantes en una clase dada que es joven, casi todos
tienen la facilidad en inglés y nivel alto”
Se puede modificar como sigue: ”Casi todo joven los estudiantes en una clase
dada son estudiantes cuya la facilidad en inglés es alta.”
32
También se llaman cuantificadores del primer tipo los cuantificadores absolutos, mientras los cuantificadores del segundo tipo se llama los cuantificadores
relativos. Esta terminología tiene el sentido cuando se comparan las definiciones
de la variable W para los cuantificadores del primer tipo y segundo tipo, dado
por las ecuaciones correspondientes.
2.7.
Modificadores Lingüísticos (Linguistic Hedge)
Los modificadores lingüísticos son términos lingüísticos especiales que modifican otros términos lingüísticos. Algunos de ellos son, por ejemplo, mismo, más
o menos, justamente, ligeramente, algo o sumamente Los modificadores difusos
se pueden usar para modificar tanto los predicados difusos, como el valor de los
grados de verdad difusa y las probabilidades difusas.
Ejemplo 2.13 una expresión con uso de modificador (en negrilla) es "x es una
persona ligeramente gorda".
Otra proposición, tal como .es joven" que se asume significa ”x es joven es
verdad”, puede afectarse por los modificadores de las siguiente maneras: ”es
verdad que x es muy joven”, ”es muy cierto que x es joven”.
En general, dada una proposición difusa p, se puede modificar ésta mediante
un modificador lingüístico H, quedando formalmente así:
p : x es F
Hp : x es HF,
(61)
(62)
donde HF denota el predicado difuso obtenido aplicando el modificador H a
los datos del predicado F . Las modificaciones adicionales pueden ser obtenidas
aplicando el cerco al valor de verdad difuso o a la probabilidad difusa empleada
en la proposición dada.
Dado un predicado difusoF en X, y un modificador h definido como una
operación unaria asociada un modificador lingüístico H [Gky95], el predicado
difuso modificado HF es determinado para cada x ∈ X en la ecuación
HF (x) = h(F (x))
(63)
Esto significa que las propiedades de los modificadores lingüísticos pueden ser
estudiadas observando las propiedades de los modificadores asociados. Cualquier
modificador h es un biyeccion creciente. Si h(a) < a para todo a ∈ [0, 1], el
modificador se llama fuerte; si h(a) > a para todo a ∈ [0, 1], el modificador
se llama débil. El modificador especial vacio para el que h(a) = a se llama un
modificador identidad.
Definición 2.19 (Modificador Lingüístico Fuerte y Débil) Un modificador fuerte fortalece un predicado difuso al que es aplicado, reduciendo el valor
de verdad de la proposición asociada. Un modificador débil debilita el predicado
y el valor de verdad aumenta en la proposición.
33
Por ejemplo, considere tres proposiciones difusas:
p1 : John es joven,
p2 : John es muy joven,
p3 : John es bastante joven,
Matemáticamente se permite√que los modificadores lingüísticos h se represente por a2 si es fuerte, y por a si es débil. Si se asume que John tiene 26
años y, según el conjunto difuso JOVEN representando el predicado difuso joven,
JOVEN (26) = 0,8. Entonces, MUY JOVEN (26) = 0,82 = 0,64 y BASTANTE
JOVEN (26) = (0,8) = 0,89. De, T (P1 ) = 0,8, T (p2 ) = 0,64, y T (p3 ) = 0,89.
Estos valores están de acuerdo con nuestra intuición: entre más fuerte la aserción
es menor su valor de verdad y viceversa.
Teorema 2.3 (Propiedades del Modificador Lingüístico h) Es fácil demostrar que cada modificador h satisface las siguientes condiciones:
1. h(0) = 0 and h(l) = 1;
2. h es una función continua;
3. si h es fuerte, entonces h−1 es débil y viceversa;
4. dado algun modificador g, las composiciones de g con h y h con g también son modificadores y, si h y g son fuertes (o débiles), entonces son
compuestas.
3.
Operaciones Difusas
En este capítulo se introducen o amplían los operaciones difusas ya vistas,
tanto para los conjuntos como para los números e intervalos difusos.
3.1.
Operaciones entre Conjuntos Difusos
En esta sección se redefinen las funciones como complemento, intersección,
y unión, desde la persepectiva de los conjuntos difusos.
Para el complemento:
Ā(x) = 1 − A(x)
(64)
Para la intersección:
(A ∩ B)(x) = min[A(x), B(x)],
(65)
(A ∪ B)(x) = max[A(x), B(x)],
(66)
Para la intersección:
para todo x ∈ X. Estos son las operaciones difusas normales.
Se puede ver fácilmente, que las operaciones difusas normales se realizan
como las operaciones correspondientes para los conjuntos clásicos o tradicionales
34
cuando el rango de la funcion de pertenencia se restringe al conjunto {0, 1}. Es
decir, las operaciones difusas normales son generalizaciones de las operaciones
de conjuntos clásicos. Se entiende ahora bien, sin embargo, que ellos no son
las únicas posibles generalizaciones. Para las tres operaciones, existe una clase
amplia de funciones cuyos miembros también califican como las generalizaciones
difusas de las operaciones clásicas. Estas tres clases de funciones se examinan en
las secciones siguientes, donde cada una se caracteriza por los axiomas descritos.
Funciones que califican como las intersecciones difusas y las uniones difusas
normalmente se divulgan en la literatura como las t-normas y t-conormas,
respectivamente.
Desde que el complemento, la intersección y la unión difusa no son las únicas
operaciones, contrariamente a sus análogos para la lógica clásica, diferentes funciones pueden ser definidas y funcionar apropiadamente para representar estas
operaciones en diferentes contextos.
Entre la gran variedad de complementos, intersecciones y uniones difusas
la propiedad de las operaciones difusas poseen ciertas propiedades que les dan
una importancia especial. Por ejemplo, la intersección difusa normal (operador
min) produce el conjunto mas grande entre aquéllos producidos por todas las
posibles intersecciones difusas (t-normas). La unión difusa normal (operador
max) produce, al contrario, el conjunto difuso más pequeño entre los conjuntos
difusos producidos por todas las posibles uniones difusas (t-conormas).
Un rasgo deseable de los operaciones difusos normales es su prevención inherente del componente de errores de los operadores. Si cualquier error ε es
asociado con la funcion de grados de pertenencia A(x) y B(x), entonces el error
máximo asociado con la funcion de pertenencia x en Ā, A ∩ B, y A ∪ B sigue
siendo ε. La mayoría de las operaciones de los conjunto difusos alternativos
carecen esta característica.
Las intersecciones difusas (t-normas) y las uniones difusas (t-conorms) no
cubren todos los operaciones porque pueden agregarse los conjuntos difusos,
pero cubren todos agregando operaciones que sean asociativas [Gky95].
3.1.1.
Complementos Difusos
Sea A un conjunto difuso en X. por la definición, A(x) se interpreta como
el grado en el que x pertenece a A. donde cA denota un complemento difuso
de A de tipo c. Entonces, cA(x) puede ser no sólo interpretado como el grado
a que x pertenece a cA, sino también como el grado a que x no pertenece a
A. Similarmente, A(x) también puede interpretarse como el grado a que x no
pertenece a cA.
Como una convención de notacion, el complemento cA se define por la función
c : [0, 1] → [0, 1]
(67)
que asigna un valor c(A(x)) a cada grado de pertenencia A(x) para cualquier
conjunto difuso A. El valor c(A(x)) se interpreta como el valor de cA(x). Es
decir,
35
c(A(x)) = cA(x)
(68)
para todo x ∈ X por definición. Dado un conjunto difuso A, se obtiene cA
aplicando la función c a los valores A(x) para todo x ∈ X.
Se debe tener en cuenta que esta función c es totalmente independiente de los
elementos x que valoran al A(x) asignado; sólo depende de los propios valores.
En la investigación siguiente de su las propiedades formales, se puede ignorar x y
se asume que el argumento de c es un número arbitrario a ∈ [0, 1]. Sin embargo,
para usar la función pora determinar un complemento de un conjunto difuso A,
se tiene que guardar huella de elementos x para hacer la conexión entre A(x) y
cA(x) expresado por la ec. 68.
La función c debe ser también válida intuitivamente, como los complementos
significativos de conjuntos difusos. Para caracterizar la funcion c que produce
los complementos difusos significativos, se pueden declarar intuitivamente las
propiedades justificables por lo que se refiere a los requisitos axiomáticos. Luego
se puede determinar la clase de funciones que satisfacen estos requisitos.
Para producir los complementos difusos significantes, la función c debe satisfacer por lo menos los axiomas definidos a continuación.
Axioma 3.1 (Límite Condicional para Complementos) Si c representa al
complemento difuso, entonces
c(0) = 1
c(1) = 0
(69)
Axioma 3.2 (Monotonía para Complementos) Sea c el complemento difuso. Para todo a, b ∈ [0, 1], se cumple que
a ≤ b → c(a) ≥ (b).
(70)
Axioma 3.3 (Continuidad del Complemento) Si c el complemento difuso,
c es una función contínua.
Axioma 3.4 (Propiedad Involutiva del Complemento) Si c el complemento difuso, c es involutivo esto es, que para cada a ∈ [0, 1]
c(c(a)) = a
Según el Axioma 3.1, la función c debe producir los complementos correctos
para los conjuntos clásicos. Según el Axioma 3.2, se exige ser monotonamente
decreciente: cuando su grado de pertenencia en A aumenta (cambiando x), la
36
calidad del número de miembros correspondiente en cA no debe aumentar: puede
disminuir o, por lo menos, permanecer igual.
Hay muchas funciones que satisfacen los Axiomas 1 y 2. Para cualquier
conjunto difuso A, conjuntos difusos diferentes cA constituyen su complemento,
cada uno se produce por una función distinta c. toda funcion que satisface
los axiomas forman la clase más general de complementos difusos. Es bastante
obvio que la exclusión o debilidad de estos axiomas agregarían algunas funciones
totalmente inaceptable como los complementos.
Una violación del Axioma 3.1 incluiría funciones que no conforman al complemento normal para los conjuntos clasicos. El axioma 3.2 es esencial, se espera
intuitivamente que un aumento en el grado de pertenencia en un conjunto difuso deba producir una disminución o en el caso extremo, ningún cambio en el
grado de pertenencia de su complemento. Los Axiomas 3.2 y 3.2 son llamados
el esqueleto axiomático para los complementos difusos.
En la mayoría de los casos de importancia práctica, es deseable considerar
adicionar varios requisitos para los complementos difusos. Cada uno de ellos
reduce la clase general de los complementos difusos a un subclase especial. Dos
de los requisitos más deseables que normalmente se listan en la literatura entre
los axiomas de complementos difusos están especificados en los axiomas 3.3 y
3.4.
3.1.2.
Intersecciones Difusas (T-normas)
La intersección de dos conjuntos difusos A y B se especifica en general por
una operacion binaria en el intervalo unitario; es decir, una función de la forma
i : [0, 1] × [0, 1] → [0, 1].
(71)
Para cada elemento x del conjunto universal, esta función toma como su
argumento el par que consiste en grado de pertenencia en los conjuntos A y B, y
retorna el grado de pertenencia de sus elementos que constituyen la intersección
de A y B, asi,
(A ∩ B)(x) = i[A(x), B(x)]
(72)
para todo x ∈ X.
Un orden para cualquier función i de esta forma para calificar una intersección difusa, debe tener propiedades apropiadas que aseguren que conjuntos difusos producidos por i son intuitivamente aceptables como las intersecciones
difusas de cualquier par de conjuntos difusos. Esta funcion es conocida como
t-norma. De hecho, las t-normas son generalmente aceptadas como el equivalente a la clase de intersecciones difusas. Se puede usar el termino t-normas o
intersecciones difusas.
37
Dada una t-norma y los conjuntos difusos A y B, se tiene que aplicar la ec.
72 para cada x ∈ X para determinar la intersección de A y B basada en i. Sin
embargo, la función i es totalmente independiente de x; sólo depende de los
valores A(x) y B(x). Se puede ignorar x y asumir que los argumentos de i son
los números arbitrarios a, b ∈ [0, 1] en las propiedades formales de t-normas que
se examinan a continuación.
Una interseccion difusa o t-norma i es una operacion binaria en el intervalo
unitario que satisface al menos los siguientes axiomas para todo a, b, d ∈ [0, 1]:
Axioma 3.5 (Límite Condicional) i(a, 1) = a
Axioma 3.6 (Monotonía para Intersección) b ≤ d implica i(a, b) ≤ i(a, d)
Axioma 3.7 (Conmutatividad para Intersección) i(a, b) = i(b, a)
Axioma 3.8 (Asociatividad para Intersección) i(a, i(b, d)) = i(i(a, b), d)
Estos axiomas conforman el esqueleto axiomático para las intersecciones o
t-normas difusas. Es fácil ver que los primeros tres axiomas aseguran que la
intersección difusa definida por la ec 72 se vuelve la intersección clásica cuando A
y B son clasicos: el i(0, 1) = 0 y i(1, 1) = 1 se sigue directamente del axioma del
límite condicional; i(1, 0) = 0 se deriva entonces del axioma de commutatividad,
mientras que i(0, 0) = 0 del axioma monotonia. Cuando un argumento de i
es 1 la condición del límite y commutatividad también aseguran,como nuestra
concepción intuitiva de los requerimientos intersección difusa, que la calidad
del número de miembros en la intersección es igual al otro argumento en la
expresión.
Monotonicidad y commutatividad expresan el requisito natural que una disminución en el el grado de número de miembros en conjuntos A o B no puede
producir un aumento en el grado de pertenencia en la intersección. Commutatividad asegura que la intersección difusa simétrica, que es indiferente al orden
en que se consideran los conjuntos a ser combinados. El último axioma, la asociatividad, asegura que se puede tomar la intersección de cualquier número de
conjuntos en cualquier orden con parejas arbitrarias; este axioma permite extender el funcionamiento de intersección difusa a más de dos conjuntos.
En muchas ocasiones es deseable restringir la clase de intersecciones difusas
(t-normas) considerando varios requisitos adicionales. Tres de las restricciones
más importantes se expresan por los axiomas siguientes, dadas las especificaciones para i, a, b dadas anteriormente:
Axioma 3.9 (Continuidad para Intersección) i es una función continua
Axioma 3.10 (Subidempotencia para Intersección) i(a, a) < a
Axioma 3.11 (Monotonía Estricta para Intersección) a1 < a2 y b1 < b2
implica i(a1 , b1 ) < i(a2 , b2 )
38
El axioma de continuidad previene una situación en que un pequeño cambio
en el grado de pertenencia de cualquier conjunto difuso A o B produzca una
discontinuidad en el grado de pertenencia A ∩ B.
El axioma de subidempotencia trata un caso especial, en que el grado de
pertenencia en A y B (para algún x) tiene el mismo de valor de a. El axioma
expresa el requisito que el grado de la funcion de pertenencia A ∩ B en este caso
especial no debe exceder a. Este requisito es más débil que el de idempotencia,
el requisito i(a, a) = a, es llamado el subidempotencia. Finalmente, el axioma
de monotonía estricta expresa una forma más fuerte que el de monotonicidad.
3.1.3.
Uniones Difusas (T-conormas)
La discusión de uniones difusas es estrechamente paralela de intersecciones
difusas. Como la intersección difusaa, la unión difusa general de dos conjuntos
difusos A y B se especifica por una función
u : [0, 1] × [0, 1] − [0, 1].
(73)
El argumento a esta función es el par que consiste en el grado de pertenencia
de algunos elementos x en el conjunto difuso A y el grado de pertenencia de
ese mismo elemento en el conjunto difuso B. La función devuelve el grado de
pertenencia para los elemento en el conjunto difuso A ∪ B. De aqui,
(A ∪ B)(x) = u[A(x), B(x)]
(74)
para todo el x ∈ X.
Las propiedades que una función u debe satisfacer para ser intuitivamente
aceptable como una unión difusa está exactamente igual que las propiedades de
funciones como que son conocido en la literatura como t-conormas. Se puede
usar los términos t-conormas o uniones difusas indistintamente.
Un union difusa o t-conorma u es una operacion binaria en el intervalo
unitario que satisface por lo menos los axiomas que se enuncian a continuación.
Para todo a, b, d ∈ [0, 1]:
Axioma 3.12 (Límite Condicional para Unión) u(a, 0) = a
Axioma 3.13 (Monotonicidad para Unión) b ≤ d implica u(a, b) ≤ u(a, d)
Axioma 3.14 (Conmutativida para Unión) u(a, b) = u(b, a)
Axioma 3.15 (Asociatividad para Unión) u(a, u(b, d)) = u(u(a, b), d)
39
Estos axiomas son el esqueleto axiomátioco esencial para las uniones difusas
o t-conormas. Se puede hacer un análisis análogo al caso del complemento e
intersección y verificar que las propiedades se cumplen para los conjuntos clásicos
y que son suficientemente válidas de manera intuitiva.
Análogamente al caso de la intersección, se pueden establecer restricciones
axiomáticas para lograr algunos resultados esperados.
Axioma 3.16 (Continuidad para Unión) u es una función contínua
Axioma 3.17 (Superidempotencia para Unicón) u(a, a) > a
Axioma 3.18 (Monotonía Estricta para Unión) a1 < a2 y b1 < b2 implica u(a1 , b1 ) < u(a2 , b2 )
3.2.
Operaciones Aritméticas en Intervalos Difusos
La aritmética difusa esta basado en dos propiedades de números difusos
[Gky95]:
1. Cada conjunto difuso, y cada número difuso, puede representarse totalmente y singularmente por cortes α
2. Los cortes α de cada número difuso son intervalos cerrados de números
reales para todo α ∈ (0, 1].
Estas propiedades permiten definir las operaciones aritméticas en los números
difusos en terminos de operaciones aritméticas en sus cortes α, es decir, operaciones aritméticas en intervalos cerrados. Estas operaciones son un asunto de
análisis de intervalos, una área bien fundamentada de la matemática clásica.
Notese que un número real r ∈ R también puede considerarse como un intervalo
especial degenerado [r, r].
Si denota cualquiera de las cuatro operaciones aritméticas más comunes en
los intervalos cerrados: +.−, ·, (suma, resta, multiplicación, división). Entonces,
[a, b][d, e] = {f g | a ≤ f ≤ b, d ≤ g ≤ e)
(75)
es una propiedad general de todos las operaciones aritméticas en los inter[a,b]
, que no se define
valos cerrados, teniendo en cuenta la excepción del caso [d,e]
cuando 0 ∈ [d, e]. Es decir, el resultado de una operacion aritmética en un
intervalo cerrado es de nuevo un intervalo cerrado.
Definición 3.1 (Operaciones Aritméticas Básicas) Las cuatro operaciones
aritméticas básicas definidas en intervalos cerrados se definen como sigue:
[a, b] + [d, e]
[a, b] − [d, e]
[a, b] · [d, e]
[a, b]
[d, e]
= [a + d, b + e]
(76)
= [a − d, b − d]
(77)
= [mı́n(ad, ae, bd, be), máx(ad, ae, bd, be)]
(78)
a a b b
a a b b
= [mı́n( , , , ), máx( , , , )] siempre que 0 ∈
/ [d, e]
(79)
d e d e
d e d e
40
Cuando uno de los intervalos descritos en las ecuaciones de la definición 3.1
es el intervalo degenerado, se obtienen las operaciones especiales; cuando dos de
los intervalos se degeneran, se obtiene la aritmética normal de números reales,
como sería de esperarse.
Ejemplo 3.1 Se deben verificar cuidadosamente las siguientes expresiones, constatando con la definición 3.1:
[2, 5] + [1, 3] = [3, 8]
[0, 1] + [−6, 5] = [−6, 6]
[2, 5] − [1, 3] = [−1, 4]
[0, 1] − [−6, 5] = [−5, 7]
[−1, 1] · [−2, −0,5] = [−2, 2]
[3, 4] · [2, 2] = [6, 8]
[−1,1]
[−2,−0,5]
[4,10]
[1,2]
= [−2, 2]
= [2, 10].
Las operaciones aritméticas en los intervalos cerrados satisfacen algunas propiedades útiles, que se describen a continuación.
Teorema 3.1 (Propiedades de las Operaciones Aritméticas) Sean A =
[a1 , a2 ], B = [b1 , b2 ], C = [c1 , c2 ], 0 = [0, 0], 1 = [1, 1]. Las propiedades de las
operaciones aritméticas difusas se definen como sigue:
1. Conmutatividad:
A + B = B + A,
A·B =B·A
2. Asociatividad:
(A + B) + C = A + (B + C)
(A · B) · C = A · (B · C)
3. Identidad:
A =0+A =A+0
A =1·A= A·1
41
4. Subdistributiva:
A · (B + C) ⊆ A · B + A · C
5. Distributiva:
si b · c ≥ 0 para cadab ∈ B y c ∈ .C, entonces A · (B + C) = A · B + A · C .
Si A = [a, a], entonces a · (B + C) = a · B + a · C
6. 0 ∈ A − A y 1 ∈
A
A.
7. si A ⊆ E y B ⊆ F , entonces:
A+B
A−B
A·B
A
B
⊆ E +F
⊆ E −F
⊆ E ·F
E
⊆
F
(80)
(81)
(82)
(83)
Demostración. La mayoría de estas propiedades sigue directamente de
ecuaciones descritas en la def. 3.1 Se demuestran las propiedades menos obvias de subdistributividadty y distributividad
1. Primero, se tiene que:
A · (B + C) =
=
⊆
=
{a · (b + c) | a ∈ A, b ∈ B, c ∈ C]
{a · b + a · c | a ∈ A, b ∈ B, c ∈ C)
{a · b + a · c | a ∈ A, b ∈ B, c ∈ C)
A · B + A · C.
(84)
(85)
(86)
(87)
Luego A · (B + C) ⊆ A · B + A · C.
2. Se asume ahora, sin pérdida de generalidad, que b1 ≥ 0 y c1 ≥ 0. Entonces,
se tienen que considerar los siguientes tres casos:
si a1 ≥ 0, entonces,
si a1 < 0ya2 ≤ 0, entonces −a2 ≥ 0, (−A) = [−a2 , −a1 ], y
si a1 < 0 y a2 > 0, entonces
A · (B + C) = [a1 · (b2 + c2 ), a2 (b2 + c2 )]
= [a1 · b2 , a2 · b2 ] + [a1 · c2 , a2 · c2 ]
= A · B + A · C.
(88)
(89)
(90)
Esta distributividad no es general. Para verificarlo, sea A = [0, 1], B =
[1, 2], C = [−2, −1], entonces, A·B = [0, 2], A·C = [−2, 0], B+C = [−1, 1],
y A · (B + C) = [−1, 1] ⊂ [−2, 2] = A · B + A · C.
42
3.3.
Operaciones Aritmeticas en Números Difusos
A continuación se presentan dos métodos para desarrollar la aritmética difusa. Un método es basado en la aritmética de intervalos. El otro método es
el principio de extensión por medio del cual se extienden operaciones en los
números reales a las operaciones en los números difusos. Para ello se asumirá
que los números difusos son representados por funciones de pertenencia continuas.
Definición 3.2 Sean A y B números difusos y sea que denota cualquiera
de las cuatro operaciones aritméticas básicas. Entonces, se define un conjunto
difuso en R, A ∗ B, por definicion en corte α, α (AB), como
α
(AB) =α Aα B
(91)
para algun α ∈ (0, 1]. (Cuando = /, claramente, se requiere que 0 ∈
/α B
para todos α ∈ (0, 1].)
Se puede demostrar [Gky95] que AB puede expresarse como
AB =
∪
α
α∈[0,1]
(AB)
(92)
donde α (AB) es un intervalo cerrado para cada α ∈ (0, 1] y A, B son
números difusos, AB es también un número difuso.
Ejemplo 3.2 Considere dos numeros difusos de forma triangular A, B definidos:

o




x+1
2
para x ≤ −1yx > 3
para − 1 < x ≤ 1



para 1 < x ≤ 3
 3−x
2

o
para x ≤ 1y x > 5



 x−1
para 1 < x ≤ 3
B(x) =
2


5−x

para 3 < x ≤ 5

2
A(x) =
Sus cortes α son:
α
α
A = [2α − 1, 3 − 2α]
B = [2α + 1, 5 − 2α].
Con base en la definición de operación difusa en intervalos, se tiene
α
(A + B) − [4a, 8 − 4a] para α ∈ (0, 1],
α
(A − B) = [4a − 6, 2 − 4a] para α ∈ (0, 1],
43
α
(A, B) =
αA
B

 [−4a2 + 12α − 5, 4α2 − 16α + 15] para α ∈ (0, ,5]
[4a2 − 1, 4a2 − 16α + 15]

para α ∈ (,5, 1]
 2α−1 3−2α

,
para α ∈ (0, ,5]

 2α+1 2α+1
=
2α−1 3−2α

para α ∈ (,5, −1]

 5−2α , 2α+1
los numeros difusos resultantes son entonces:

0
para x ≤ 0 y x > 8



 x
para 0 < x ≤ 4
(A + B)(x) =
4


8−x

para 4 < x ≤ 8

4
(A − B)(x) =
(A · B)(x) =
A
)(x) =
(B

0








para − 6 < x ≤ −2
para − 2 < x ≤ 2

0 para x < −5 y x ≥ 15




√

3− 2 4−x


para − 5 ≤ x < 0

2









0














x+6
4
2−x
4
para x ≤ −6 y x > 2
√
2
1+x
2
√
4− 2 1+x
2
x+1
2−2x
para 0 ≤ x < 3
para 3 ≤ x < 15
para x < −1 y x ≥ 3
5x+1
2x+2
3−x
2x+2
para − 1 ≤ x < 0
para 0 ≤ x <
para
1
3
1
3
≤x<3
Esto se representa gráficamente según muestra la fig. 15.
El segundo método esta basado en el principio de extensión. Empleando este
principio, se extienden operaciones aritméticas normales en los números reales
a los números difusos.
Sea cualquiera de las cuatro operaciones aritméticas básicas y sean A, B
numeros difusos. Entonces, se define un conjunto difuso en R, AB, por la
ecuación,
(AB)(z) = sup mı́n[A(x), B(y)],
z=x∗y
para todo z ∈ R.
Especificando para todo z ∈ R, se define:
44
(93)
Figura 15: Operaciones aritméticas con números difusos.
45
(A + B)(z) = sup mı́n[A(x), B(y)],
(94)
z=x+y
(A − B)(z) = sup mı́n[A(x), B(y)],
(95)
(A · B)(z) = sup mı́n[A(x), B(y)],
(96)
z=x−y
z=x·y
A
B
(z) = sup mı́n[A(x), B(y)],
z= x
y
(97)
Aunque A ∗ B definido por Ec 93 es un conjunto difuso en R, se tiene que
mostrar que es un numero difuso para cada ∈ {+, −, ·, /}.
Teorema 3.2 (Operación difusa contínua) Sea ∈ {+, −, ·, /}, y sean A, B
números difusos contínuos. Entonces, el conjunto difuso AB definido por (ec.
93):
(AB)(z) = sup mı́n[A(x), B(y)],
(98)
z=x∗y
es un número difuso contínuo.
Demostración. Primero, hay que demostrar Ec.?? mostrando que α (AB)
es un intervalo cerrado para α ∈ (0, 1]. Para cualquier z ∈α Aα B, existe algún
x0 ∈α A y y0 ∈α B tal que z = x0 y0 .
Así,
(AB)(z) =
sup mı́n [A(x), B(y)]
(99)
z=x∗y
≥ mı́n [A(x0 ), B(y0 )]
≥ α.
(100)
(101)
De aqui, z ∈α (AB) y, por consiguiente,
α
Aα B ⊆α (AB).
Para cualquier z ∈α (AB), se tiene (AB)(z) = sup mı́n[A(x), B(y)] ≥
z=x∗y
α.
más, para cualquier n > [ a1 ] + 1, donde [ a1 ] denota el entero más grande que
es igual a a1 , exista xn y yn tal que z = xn yn y
min[A(xn ), B(yn )] > a −
Es decir, xn ∈
a−1
n
A, yn ∈
a−1
n
1
.
n
B y se pueden considerar dos sucesiones, {xn }
46
y {yn }, siempre que
1
1
≤a−
,
n
n+1
a−
y se tiene
a−1
n+1
A⊆
a−1
n
a−1
A, n+1 B ⊆
De aqui, {xn } y {yn } entre en algunos
a−1
n
a−1
n
Ay
B.
a−1
n
B, respectivamente. Desde
el último son intervalos cerrados, {xn } y {yn } se limita las sucesiones. Así, existe
una sucesion convergente {xn,i } tal que xn,i → x0 . Para la correspondiente
secuencia {yn,i, }, también existe una subsequencia convergente {yn,i,j ) tal que
yn,i,j → y0 . Si se toma la correspondiente subsecuencia, {xn,i,j } desde {xn,j },
entoncesxn,i,j → x0 . Así, se tienen dos sucesiones, {xn,i,j } y{yn,i,j }, tal que
xn,i,j → x0 y yn,i,j → y0 y xn,i,j yn,i,j = z.
Ahora, desde que es contínuo,
z = lim xn,i,j yn,i,j =
j→∞
lim xn,i,j j→∞
También, desde A(xn,i,j ) > a −
1
ni,j
lim yn,i,j
j→∞
y B(yn,i,j ) > a −
1
ni,j
= x0 y0 .
,
1
)=a
j→∞
j→∞
j→∞
ni,j
1
B(x0 ) = B lim yn,i,j = lim B(yn,i,j ) ≥ lim (a −
)=a
j→∞
j→∞
j→∞
ni,j
A(x0 ) = A
a
lim xn,i,j
= lim A(xn,i,j ) ≥ lim (a −
Por consiguiente, existe x0 ∈ a A, y0 ∈ a B tal que z = x0 y0 . Es decir, z ∈
A a B . Así,
a
(AB) ⊆a Aa B,
luego,
a
(AB) =a Aa B.
Ahora se demuestra que AB debe ser continuo. Se puede demostrar que la
función de pertenencia de AB debe ser de la forma general. Se asume AB
no es contínua en z0 ; es decir,
lim (AB)(z) < (AB)(z0 ) = sup min[A(x), B(y)].
z→z0−
z0 =x∗y
Entonces, debe existir x0 y y0 tal que z0 = x0 y0 y
lim (AB)(z) < min[A(x0 ), B(y0 )].
z→z0−
47
(102)
Dado que la operacion ∈ (+, −, ·, /} es monótona con respecto al primero
y segundo argumentos respectivamente, siempre se pueden encontrar dos sucesiones {xn } y {yn } tal que xn → x0 , yn → y0 , ya que n → ∞, y xn ∗ yn < z0
para cualquier n. Sea zn = xn yn ; entonces zn → z0 ya.que n → ∞.
Así.
lim (AB)(z) = lim (AB)(zn )
z→z0−
n→∞
= lim sup min[A(x), B(y)]
n→∞z0 =x∗y
≥ lim min[A(x0 ), B(y0 )]
n→∞
= min[A( lim xn ), B( lim yn )]
n→∞
n→∞
= min[A(x0 ), B(y0 )]. (103)
Esto contradice la ec. 102 y, por consiguiente, AB debe ser un número
difuso continuo.
3.4.
Reticula de Números Difusos
Como es bien conocido, el conjunto R de números reales es ordenado linealmente. Para cada par de numeros reales, x y y, se tiene x ≤ y o y ≤ x. El
par (R,≤) es una retícula que puede ser expresada por lo que se refiere a dos
operaciones:
x si x ≤ y
min(x, y) =
(104)
y si y ≤ x
y si x ≤ y
max(x, y) =
(105)
x si y ≤ x
para cada par x, y ∈ R. El orden lineal de los números reales no se extiende
a los numeros difusos. Para introducir un orden significante de números difusos,
primero se extendiende la operacion de la retícula min y max en los numeros
reales, como se define por Ec.104 y 105, para definir las operaciones correspondientes en los números difusos que se denotarán por MIN y M AX.
Definición 3.3 (Orden en números difusos) Para cualquier dos números
difusos A y B, esto se define como:
MIN(A, B)(z) =
sup
mı́n[A(x).B(y)]
(106)
mı́n[A(x), B(y)]
(107)
z=mı́n(x,y)
MAX(A, B)(z) =
sup
z=mı́n(x,y)
para todo z ∈ R.
48
1
B
A
-2
-1
0
1
2
1
3
B
A
-2
4
min
-1
0
1
2
1
3
4
B
A
-2
-1
0
1
2
3
4
-2
-1
0
1
2
3
4
Figura 16: Comparación de las operaciones MIN, min, MAX, max.
49
Observe que los símbolos MIN y MAX que denotan las operaciones introducidas en números difusos, debe distinguirse para los símbolos min y max, que
denotan la operacion usual de mínimo y máximo en los números reales, respectivamente. Tanto min y max son operaciones continuas, de Ec.106, ??, y del
Teorema 4.2 tanto MIN (A, B) y MAX (A, B) son números difusos.
Es importante comprender que las operaciones MIN y MAX son totalmente
diferentes de
la intersección y la union difusa normal, min y max. Esta diferencia se ilustra
en la fig ??, donde

 0 para x < −2 y x > 4
x+2
para -2 ≤ x ≤ 1
A(x) =
3
 4−x
para 1 ≤ x ≤ 4
3

 0 parax < 1 y x > 3
x − 1 para 1 ≤ x ≤ 2
B(x) =

3 − x para 2 ≤ x ≤ 3

0 para x < −2 y x > 3


 x+2
para − 2 ≤ x ≤ 1
3
M IN(A, B)(x) =
4−x
para 1 ≤ x ≤ 2,5

3


3 − x para 2,5 < x < 3

0 para x < 1 y x > 4



x − 1 para 1 ≤ x ≤ 2
MAX(A, B)(x) =
3 − x para 2 ≤ x ≤ 2,5


 4−x
para 2,5 < x ≤ 4
3
Si se tiene que R que denota el conjunto de números difusos. Entonces,
operaciones MIN y M AX son claramente funciones de la forma R × R → R.
El teorema siguiente que establece las propiedades básicas de estas operaciones,
asegura que la tripleta (, MIN, M AX) es una retícula distributiva en donde
MIN y M AX representan la reunión y unión, respectivamente.
Teorema 3.3 Sea MIN y M AX las operaciones binarias en R definidas en la
ec. 106 y ??. Entonces:
M IN (A, B)(z) =
sup
mı́n[A(x).B(y)]
(108)
mı́n[A(x), B(y)]
(109)
z=mı́n(x,y)
MAX(A, B)(z) =
sup
z=mı́n(x,y)
Y además, para cualquier A, B, C ∈ R, se cumplen las siguientes propiedades:
1. Propiedad conmutativa:
M IN(A, B) = M IN(B, A),
M AX(A, B) = M AX(B, A).
50
2. Propiedad asociativa:
M IN [MIN (A, B), C] = MIN [A, M IN (B, C)],
M AX[MAX(A, B), C] = M AX[A, MAX(B, C)].
3. Propiedad de idempotencia:
M IN (A, A) = A, M AX(A, A) = A.
4. Propiedad de absorción:
M IN [A, MAX(A, B)] = A,
M AX[A, MIN (A, B)] = A.
5. Propiedad distributiva:
M IN [A, MAX(B, C)] = MAX[MIN(A, B), M IN(A, C)],
M AX[A, MIN (B, C)] = MIN [M AX(A, B), M ÁXIM O(A, C)].
Demostración. Se desarrollará la demostración de las propiedades asociativa, de absorción y distributiva, ya que las propiedades conmutativa y de idempotencia son triviales. Por ejemplo, para demostrar la propiedad asociativa se
tiene que, para todo z ∈ R,
M IN [A, M IN(B, C)](z) =
sup
min[A(x), M IN (B, C)(y)]
z=mı́n(x,y)
=
sup
min[A(x),
z=mı́n(x,y)
=
sup
min[B(u), C(v)]]
y=mı́n(u,v)
sup
sup
min[A(x), B(u), C(v)]
z=mı́n(x,y) y=mı́n(u,v)
=
sup
min[A(x), B{u), C(v)]
z=mı́n(x,u,v)
=
sup
sup
min[A(x), B(u), C(v)]
z=mı́n(s,v) s=mı́n(x,u)
=
sup
min[
z=mı́n(x,v)
=
sup
sup
min [A(x), B(u)] , C(v)]
s=mı́n(x,u)
min[MIN (A, B)(s), C(v)]
z=mı́n(s,v)
= MIN [M IN (A, B), C](z).
La prueba de la asociatividad de M AX se realiza de manera análoga. Para
probar la propiedad de absorción se tiene que para todo z ∈ R,
MIN [A, M AX(A, B)](z) =
sup
min[A(x), MAX(A, B)(y)]
z=mı́n(x,y)
=
sup
min[A(x),
z=mı́n(x,y)
=
sup
min[A(u), B(v)]]
min[A(x), A(u), B(v)].
z=mı́n(x,máx(u,v))
51
sup
z=máx(x,y)
Se utilizará M para denotar el lado derecho de la última ecuación. Desde que B sea un número difuso, existe v0 ∈ , tal que B(v0 ) = 1. Por z =
min[z, max(z, v0 )], se tiene
M ≥ min[A(z), A(z), B(v0 )] = A(z).
Por otro lado, desde que z = min[x, max(u, v)], se tiene
min(x, u) ≤ z ≤ x ≤ max(x, u).
Por la convexidad de números difusos [Gky95].
A(z) ≥ min[A[min(x, u)], A[max(x, u)]]
= min[A(x), A(u)]
≥ min[A(x), A(u), B(v)]
(110)
Así, M = A(z) y, por consiguiente, M IN [A, MAX(B, C)] = A. La prueba
de la propiedad de absorción es similar.
Para demostrar la propiedad distributiva se toma z ∈ R, y se ve claramente
que:
M IN [A, M AX(B, C)](z) =
sup
min[A(x), B(u), C(v)],
(111)
z=mı́n[x,máx(u,v)]
M AX[MIN (A, B), MIN (A, C)](Z) = supmin[A(m), B(n), A(s), C(t)] (112)
z
mı́n(m, n),
mı́n(s, t)
Para demostrar que Ec.111 y 112 son iguales, se muestra primero que E ⊆ F
donde
donde x = máx
E
F
= {min[A(x), B(u), C(v)]/min[x, max(u, v)] = z}
= {min[A(m), B(n), A(s), C(t)]/max[min(m, n), min(s, t)] = z}
Para cada a = min[A(x), B(u), C(v)] tal que min[x, max(u, v) = z (es decir,
a ∈ E), donde existe m = s = x, n = u, y t = v tal que,
max[min(m, n), min(s, t)] = max[min(x, u), min(x, v)]
= min[x, max(u, v)] = z
donde a = min[A(x), B(u), A(x), C(v)] = min[A(m), B(n), A(s), C(t)]. Es
decir, a ∈ F y, por consiguiente, E ⊆ F . Esto significa que la ec.112 es mayor
que o igual a la ec.111. Ahora, se muestra que estas dos funciones son iguales
mostrando que para cualquier número b en F , existe un número a en E tal que
b ≤ a.
52
Para cualquier b ∈ F , existe m, n, s, y t tales que max[min(m, n), min(s, t)] =
z, b = min[A(m), B(n), A(s), C(t)] de donde,
z = min[max(s, m), max(s, n), max(t, m), max(t, n)].
Sea x = min[max(s, m), max(s, n), max(t, m)], u = n, y v = t. Entonces, z = min[x, max(u, v)]. Por otro lado, es fácil ver que min(s, m) ≤ x ≤
max(s, m).
Por la convexidad de A,
A(x) ≥ min[A(min(s, m)), A(max(s, m))]
= min[A(s), A(m)]
De allí, existe a = min[A(x), B(u), C(v)] con min[x, max(u, v)] = z (es
decir, a ∈ F ), y
a = min[A(x), B(u), C(ti)] ≥ min[A(s), A(m), B(n), C(t)] = b
Es decir, para cualquier b ∈ F , existe a ∈ F , tal que b ≤ a. Esto implica que
supF ≤ supE.
Esta desigualdad, junto con el resultado anterior, asegura que (111) y (112)
son iguales. Esto concluye la prueba de la primera ley distributiva. La prueba
de la segunda ley distributiva se realiza de manera análoga.
La reticula (R, M IN, M AX) también puede expresarse como el par (R, ≤),
donde ≤ es una clasificación parcial definida como:
A ≤ B si M IN(A, B) = A ó
A ≤ B si M AX(A, B) = B
para cualquier A, B ∈ R. También se puede definir la clasificación parcial
por lo que se refiere a los cortes α pertinentes:
A ≤ B si min(α A,a B) =a A ó
A ≤ B si max(a A,a B) =a B
para cualquier A, B ∈ R y a ∈ (0, 1], donde a A y a B son los intervalos
cerrados a A = [a1 , a2 ], a B = [b1 , b2 ]. Entonces,
min(a A,a B) = [min(a1 , b1 ), min(a2 , b2 )]
max(a A,a B) = [max(a1 , b1 ), max(a2 , b2 )]
53
Si se define la clasificación parcial de intervalos cerrados de la manera usual,
eso es, [a1 , a2 ] ≤ [b1 , b2 ] si a1 ≤ b1 y a2 ≤ b2 , entonces para cualquier A, B ∈ R,
se tiene
A B si a A ≤a B
para todo α ∈ (0, 1]. Esto significa por ejemplo, que los dos números difusos
A y B en la fig. ??, no son comparables. Sin embargo, los valores de las variables lingüísticas en la mayoría de las aplicaciones son definidos por números
difusos que son comparables. Por ejemplo, los valores de la variable lingüística la .a ctuación" definido anteriormente forma una cadena de la forma: "muy
pequeñopequeñomedianograndemuy grande".
Aunque el conjunto R no es de orden lineal, hay algunos subconjuntos que
se comportan como tal, y son subconjuntos muy importnates en las aplicaciones
comunes de la teoría difusa.
54
4.
Inferencia Difusa
Las reglas de la inferencia dentro del armazón de lógica difusa son usadas
para facilitar el razonamiento aproximado. Ellas pueden describir generalizaciones de tres inferencias clásicas, que son: las reglas modus ponens, modus
tolens, y el silogismo hipotético. Estas generalizaciones se basan en la regla
composicional que se llama inferencia.
4.1.
Inferencia para Proposiciones Difusas Condicionales
Considerense las variables χ y γ que toman valores de los conjuntos X y Y ,
respectivamente, y asumase que para todo x ∈ X y todo y ∈ Y las variables
estan relacionadas por una función y = f (x). Entonces, dado X = x, se puede
inferir que y = f (x). Igualmente, sabiendo que el valor de X está en un conjunto
dado A, se infiere que el valor de V está en el conjunto B = {y ∈ Y /y = f(x), x ∈
A}.
Se asume ahora que las variables están relacionadas por una relación arbitraria en X × Y , no necesariamente una función. Entonces, dado X = u y una
relación R, se infiere que y ∈ B donde B = {y ∈ Y/(x, y) ∈ R}, como se ilustra
en la fig.17(a). Igualmente, se sabe que X ∈ A, se puede inferir que γ ∈ B,
donde B = {y ∈ Y | (x, y) ∈ R, x ∈ A}, como se ilustra en la fig.17(b).
Observese que esta inferencia puede expresarse igualmente bien por lo que
se refiere a las funciones características χA , χB , χR de conjuntos A, B, R respectivamente, por la ecuación
χB (y) = sup n[χA (x), χR (x, y)]
(113)
x∈X
para todo y ∈ Y.
Se asume que R es una relación difusa en X × Y , y A, B son conjuntos
difusos en X y Y , respectivamente. Entonces, si R y A son dados, se puede
obtener B por la ecuación
B(y) = sup min [A(x), R(x, y)]
(114)
x∈X
para todo y ∈ Y . Lo anterior es una generalización de la ec 113 obtenida
reemplazando la función característica en ec. 113 con las funciones de pertenencia correspondientes. Esta ecuación también puede escribirse en forma matricial
como:
B = A ◦ R
y es llamada la Regla de Inferencia Composicional. Esta regla se ilustra en
Fig.18
55
Y
R
B
X
u
(a)
Y
R
B
A
X
(b)
Figura 17: Regla de Inferencia Composicional [Gky95].
56
Y
B
0
1
Relación Difusa R
X
0
A
1
Figura 18: Regla de inferencia composicional
La relación difusa que se empleó en la ec. 114 normalmente no es usada directamente, pero si es usada de otras formas, se considera el caso de proposición
difusa condicional.
4.1.1.
Modus Ponens Generalizado
Como se explico anteriormente, la relación R que se usado en una proposición
difusa condicional p de la forma
p : Si χ es A, entonces γ es B
es determinado para todo x ∈ X y todo y ∈ Y mediante la expresión
R(x, y) = j[A(x), B(y)],
(115)
donde j denota una implicación difusa .Usando la relación R obtenida de la
proposición dada p en Ec.115, y dado otra proposición q de la forma
q : χ es A
57
se puede concluir que γ es B por la regla de inferencia composicional de la ec.
114. Este procedimiento se llama un modus ponens generalizado.
La proposición p es una regla y la proposición q como un hecho, el modus
ponens generalizado se expresa por el esquema siguiente:
Regla
si X es A, entoncesY es B
Factor ..........................
X es A
___________________________
Conclusion ......
Y es B
(116)
En este esquema B es calculado por la ec. 114, y R en esta determinado por
la ec. 115.
Se observa que ec.116 se vuelve el modus ponens clásico cuando los conjuntos
son los clásicos y A = A, B = B.
Ejemplo 4.1 Los conjuntos de valores de variables X y Y son X = {x1 , x2 , x3 }
y Y = {y1 , y2 ), respectivamente. Se asume una proposición ”si X es A, entonces
Y es B”, donde A = x,51 + x12 + x,63 y B = y11 + y,42 . Entonces, dado un hecho
expresado por la proposición ”x es A” donde A = x,61 + x,92 + x,73 , usar el modus
ponens generalizado, ec. ?? para derivar una conclusión de la forma "y es B
". Por ejemplo, usando la implicación de Lukasiewicz [Gky95]se obtiene
R = x11 , y1 + x,92 , y2 + x12 , y1 + x,42 , y2 + x13 , y1 + x,83 , y2 por ec. 115. Entonces,
por la regla de inferencia composicional ec. 114, se tiene
B(y1 ) =
sup min [A(x), R(x, y1 )]
x∈X
= max [min(,6, 1), min(,9, 1), min(,7, 1)] = ,9
B(y2 ) = sup min[A(x), R(x, y2 )]
x∈X
= max[min(,6, ,9), min(,9, ,4), min(,7, ,8)] = ,7
Ejemplo 4.2 se concluye que Y es B, donde B =
4.1.2.
,9
y1
+
,7
y2 .
Modus Tollens Generalizado
Otra regla de inferencia en lógica difusa es el modus tollens generalizado
y se expresa:
Regla:
Si χ es A, entonces γ es B
Hecho:
γ es B
____________________________________
Conclusión:
χ es A
En este caso, la regla de inferencia composicional tiene la forma
A(x) = supmin[.B(y), R(x, y)],
y∈Y
58
(117)
y R en esta ecuación es determinado mediante la ec. 115.
Ejemplo 4.3 Sean X, Y, j, A, B y R definidas en las líneas aneriores. Asuma
ahora que se da un hecho que se expresó por la proposición que ”y es B’ ” ,donde
B = y,91 + y,72 . Entonces, por ec. 117,
A(x1 ) = supmin [B(y), R(x1 , y)]
y∈Y
= max[min(,9, 1), min(,7, ,9)] = ,9,
A(x2 ) = supmin[B(y), R(x2 , y)]
y∈Y
= max[min(,9, 1), min(,7, ,4)] = ,9,
A(x3 ) = supmin[B(y), R(x3 , y)].
y∈Y
= max[min(,9, 1), min(,7, ,8)] = ,9.
se concluye que X es A donde A =
4.1.3.
,9
x1
+
,9
x2
+
,9
x3 .
Silogismo Hipotético Generalizado
Finalmente, una generalización de silogismo hipotético que es basado en
dos proposiciones difusas condicionales. El silogismo hipotético generalizado se
expresa por el esquema siguiente:
Regla1 :
Regla2 :
Conclusión :
Si χ esA, entonces γ es B
Si γ es B, entonces z es C
Si χ es A, entonces z es C
(118)
(119)
(120)
En este caso, χ, γ, z son variables que toman los valores en los conjuntos
X, Y, Z, respectivamente, y A, B, C son los conjuntos difusos en los conjuntos
X, Y, Z, respectivamente.
Para cada proposición difusa condicional en ec. 118, hay una relación difusa
determinada por ec. 115, estas relaciones son determinadas para cada x ∈ X,y ∈
Y , y z ∈ Z por las ecuaciones:
R1 (x, y) = j[A(x), B(y)]
R2 (y, z) = j[B(y), C(z)]
R3 (y, z) = j[A(y), C(z)]
(121)
Una vez obtenidas R1 , R2 , R3 ,mdiante estas ecuaciones, se tiene la regla de
silogismo hipotetico generalizado asi:
59
R3 (x, z) = sup mı́n [R1 (x, y), R2 (y, z)] ,
(122)
y∈Y
que de nuevo expresa la regla de inferencia composicional. Esta ecuación
también puede escribirse en forma matricial como:
R3 = R1 ◦ R2 .
(123)
Ejemplo 4.4 Sea X, Y como se han definido en las líneas anteriores , y sea
Z = {z1 , z2 }. Además, sea A =
,5
x1
+
l
x2
+
,6
x3 ,
B=
l
y1
+
,4
y2 ,
C=
,2
z1
+
1
z2 ,
y
j(a.b) = {1 si a ≤ b, b si a > b}
Entonces se puede verificar fácilmente que


1 0,4
R1 =  1 0,4 
1 0,4
0,2 1
R2 =
0,2 1


0,2 1
R3 =  0,2 1 
0,2 1
Y por tanto el silogismo hipotético generalizado se ha verificado en esete
caso, ya que R1 ◦ R2 = R3 .
4.2.
Inferencia para Proposiciones Difusas Condicionales
Calificadas
La regla de inferencia permite involucrar las proposiciones difusas condicionales con los calificadores de verdad difusos. Dado un condicional y la proposición difusa calificada p de la forma
p : Si X es A, entonces Y es B es S,
(124)
donde S es un calificador de verdad difuso, y a partir de un hecho de la
forma ”X es A”’, se quiere hacer una inferencia de la forma ”Y es B”.
Un método desarrollado para este propósito, se llama método de restricciones
de valores de verdad, método que se basa en la manipulación de valores de verdad
lingüísticos. El método involucra cuatro pasos, que se describen a continuación.
60
Paso 1 Calcule el valor de verdad difuso relativo de A con respecto a A, denotado por RT (A/A), que es un conjunto difuso en el intervalo unitario
definido por:
RT (A/A)(a) =
sup A(x),
(125)
x:A(x)=a
para todo a ∈ [0, 1]. El valor de verdad de la relacion difusa RT (A/A)
expresa el grado en que la proposición difusa ec. 124 es verdad dado el
hecho ”X es A ”.
Paso 2 Seleccione una implicación j difusa conveniente para la proposición
difusa de la ec. 124. Esto es similar a la selección de implicación difusa
cuyo propósito es para expresar un condicional.
Paso 3 Calcule el valor de verdad difuso relativo RT (B/B) mediante la expresión
RT (B/B)(b) = sup mı́n[RT (A/A)(a), S(j(a, b))]
(126)
a∈[0,1]
para todo a ∈ [0, 1], donde S es el calificador difuso de la ec. 124. Claramente, el papel del calificador S es modificar el valor de verdad de j(a, b).
Se nota que cuando S es verdadero (es decir, S(a) = a) para todo a ∈ [0, 1],
entonces S(j(a, b)) = j(a, b). El valor de verdad difuso relativo RT (B/B)
expresa el grado en que la conclusión de la proposición difusa ec.124 es
verdadera.
Paso 4 Calcule el conjunto B relacionado en la inferencia ”γes B ” mediante
la ecuación
B(y) = RT (B/B)(B(y))
para todo y ∈ Y .
Ejemplo 4.5 Se supone un condicional difuso y la proposición calificada,
p : "Si X es A, entonces Y es B es muy cierto"
donde A =
1
x1
+
,5
x2
+
,7
x3 ,
B=
,6
y1
+
1
y2 ,
y S es muy cierto; sea S(a) = a2
para todo a ∈ [0, 1]. Dado un hecho ”X es A”’, donde A =
,9
x1
+
,6
x2
+
concluye que ”Y es B”, donde B es calculado por los pasos siguientes.
Paso 1. Se calcula RT (A/A) por ec. 125:
RT (A/A)(1) = A(x1 ) = ,9,
RT (A/A)(,5) = A(x2) = ,6,
RT (A/A)(,7) = A(x3 ) = ,7,
RT (A/A)(a) = 0 para todo a ∈ [0, 1] - {,5, ,7, 1).
Paso 2. Se selecciona la implicación difusa j.
Paso 3. Se calcula RT (B/B):
61
,7
x3 ,
se
1
0.9
2
0.8
0.7
( 0.3 +x ) 2
0.6
0.5
2
0.4
0.3
0.2
0.1
0
0.1
0.2
0.3
0.4 0.5
0.375
0.6
0.537
0.375
0.7
0.8
0.9
1
0.737
0.849
Figura 19: Funcion RT (B/B)
RT (B/B)(b) = max {min[,9, S(j(,9, b))], min[,6, S(j(,6, b))], min[,7, S(j(,7, b))]}

(0,4 + B)2 para b ∈ [0, 0,375)




,6 para b ∈ [0,375, 0,475)



(0,3 + b)2 para b ∈ [0,475, 0,537)
=
0,7 para b ∈ [0,537, 0,737)




(0,1
+
b)2 para b ∈ [0,737, 0. − 849)



0,9 para b ∈ [0,849, 1]
Un gráfico de esta función RT (B/B) se muestra en Fig.??.
Paso 4. Se calcula B por Ec ??:
B(y1 ) = RT (B/B)(B(y1 )) = RT (B/B)(,6) = ,7,
B(y2 ) = RT (B/B)(B(y2 )) = RT (B/B)(1) = ,9
Donde, se infiere ”γ es B ” , B =
,7
y1
62
+
,9
y2 .
Cuando S en la ec. 124 es la función de identidad, el método de las restricciones del verdad-valor es equivalente al modus pones generalizado bajo una
condicion particular, expuesta en el teorema siguiente.
Teorema 4.1 Sea S una proposición difusa de la forma descrita en la ec. 124,
donde S es la función identidad (es decir, S posiciones para verdadero), y supóngase que se tiene un hecho de la forma ”X es A”’, donde
sup A(x) = A(x0 )
para todo a ∈ [0, 1] y algún x0 tal que A(x0 ) = a. Entonces, la inferencia ”V
es B ” obtenido por el método de restricciones del valor de verdad es igual al
obtenido por el modus generalizado.
Para la demostración se pueden consultar varios textos, en particular [Gky95].
4.3.
Inferencia de Proposiciones Cuantificadas
Todos los cuantificadores pueden expresar las proposiciones difusas de la
forma p : W es Q, donde W es una variable cuyos valores son |E|, cuando Q es
|E1 ∩E2 |
2
cuando Q es un cuantificador
un cuantificador absoluto, o es P ro( E
E2 ) =
|E1 |
relativo.
En general, el problema de inferencia de las proposiciones difusas cuantificadas puede declararse como se describe a continuación.
Si se tienen n proposiciones difusas cuantificadas de la forma
pi : Wi es Qi
(i ∈ Nn ),
(127)
donde Qi es un cuantificador absoluto o un cuantificador relativo, y Wi es una
variable compatible con el cuantificador Qi para cada i ∈ Nn , se puede inferir
de estas proposiciones un posible principio que es conocido en la literatura como
el principio de extensión de cuantificador. Para discutir este principio, se asume
que la probable inferencia se expresa por lo que se refiere a una proposición
difusa cuantificada de la forma
p : W es Q.
(128)
El principio declara que si existe una función
f : Rn → R
(129)
W = f (W1 , W2 , ...., Wn )
Q = f (Q1 , Q2 , ....Qn )
(130)
(131)
y tal que
63
donde el significado de f (Q1 , Q2 , ....Qn ) se define mediante el principio de la
extensión. Entonces se puede concluir p de la forma p1 , p2 , ..., pn .
Una alternativa más general para formular el principio se puede establecer,
afirmando que si existen dos funciones
f
g
: Rn → R
: Rn → R
(132)
(133)
tales que
f(W1 , W2 , ...., Wn ) ≤ W ≤ g(W1 , W2 , ...., Wn )
(134)
entonces se puede concluir que p es de la forma p1 , p2 , ..., pn , donde Q en la
proposición p es un cuantificador especial denotado por
Q = [≥ f(Q1 , Q2 , ....Qn )] ∩ [≤ g(Q1 , Q2 , ....Qn )]
(135)
que quiere decir ”por lo menos f (Q1 , Q2 , ....Qn ) y a lo sumo g(Q1 , Q2 , ....Qn )”.
Los conjuntos difusos f(Q1 , Q2 , ....Qn ) y g(Q1 , Q2 , ....Qn ) se obtienen de nuevo
por el principio de la extensión.
Ejemplo 4.6 Suponga que se tienen las siguientes proposiciones cuantificadas
difusas [Gky95]:
p1 : Hay aproximadamente 10 personas en el cuarto.
p2 : La mitad de las personas en el cuarto son mujeres.
Si se quiere hacer una inferencia a la proposición
p : Hay Q mujeres en el cuarto,
Sean Q1 , Q2 los cuantificadores ”aproximadamente 10” y ”sobre la mitad”
respectivamente.
Sean E, F el conjunto de personas y el conjunto de mujeres en el cuarto.
Usando estos símbolos, se pueden dar las proposiciones de la forma
p1 : W1 es Q1
p2 : W 2 es Q2
p : W es Q,
|
donde W, W1 , W2 son las variables con los valores |E|, |E∩F
|E| , |F |, respectivamente.
Existe una función f : R2 − > R tal que f(W1 , W2 ) = W para las variables
definiddas. Es la función del producto, f (a, b) = ab :
f (W1 , W2 ) = W1 W2 = |E|
|E ∩ F |
= |E ∩ F | = |F | = W
|E|
Por el principio de extensión de cuantificador, si Q = Q1 · Q2 es el cuantificador
en la proposición p, donde Q1 · Q2 es el producto aritmético de numeros difusos
Q1 y Q2 empleados en las proposiciones dadas. Entonces p es una inferencia
correcta de la forma p1 y p2 .
64
El principio de extensión de cuantificador puede usarse para derivar varias
reglas de inferencia para las proposiciones borrosas cuantificadas. Dos de las
reglas derivadas son:
Definición 4.1 (Inferencia del Silogismo Intersección - Producto) Esta
regla se expresa mediante el esquema
p1 : Q1 Es son F s
p2 : Q2 (E ∧ F )s son Gs,
p : (Q1 · Q2 ) Es son (F ∧ G)s
(136)
donde E, F, G son los conjuntos difusos del conjunto universal X, Q1 y Q2 son
los cuantificadores relativos (números difusos en [0, 1]), y Q1 ∗ Q2 es el producto
aritmético de los cuantificadores. Como se explicó previamente, proposiciones
p1 , p2 y p pueden expresarse de la forma:
p1 : W1 es Q1 ,
p2 : W 2 es Q2 ,
p : W es Q,
G
∩G
F
), W2 = P ro( E∩F
), y W = P ro( F E
).
y donde W1 = P ro( E
para probar que el esquema de la inferencia indicada en la ec.136 es válido,
se tiene que demostrar (según el cuantificador del principio de la extensión) que
”W = W1 · W2 ”. Esta demostración es como sigue:
W1 · W2
G
F
) ∗ P ro(
)
E
E∩F
|E ∩ F | |E ∩ F ∩ G|
∗
|E|
|E ∩ F |
|E ∩ F ∩ G|
|E|
F ∩G
)
P rop(
E
W.
= Pr op(
=
=
=
=
Luego el esquema de inferencia de la ec. 136 es válido.
Ejemplo 4.7 Considerense las proposiciones borrosas cuantificadas siguientes:
p1 : La mayoría de los estudiantes es joven.
p2 : la mitad de estudiantes jóvenes son hombres.
Mediante silogismo del interseccion producto en 136, se infiere la proposición
p : Q de estudiantes son jóvenes y hombres,
donde Q es un cuantificador obtenido tomando el producto aritmético de
números difusos que representa los cuantificadores la mayoría y sobre la mitad.
Definición 4.2 (Silogismo de la Conjunción Consecuente) Es una regla
de infernecia que se expresa mediante el esquema
65
p1 : Q1 E’s son F ’s
p2 : Q2 E’s son G’s
p : QE’s son (F y G)’s
donde E, F, G son los conjuntos difusos en algún conjunto universal X,
Q1 , Q2 son los cuantificadores relativos, y Q es un cuantificador relativo dado por
Q = [≥ MAX(0, Q1 + Q2 − 1)] ∩ [≤ M IN (Q1 , Q2 )]
es decir, Q es por lo menos MAX(0, Q1 + Q2 − 1) y a lo sumo M IN(Q1 , Q2 ).
Se tiene que M IN y M AX son extensiones de las operaciones min y max de
los números reales a los números difusos.
66
5.
Conclusiones
Los desarrollos matemáticos, en particular del análisis han permitido ofrecer una sólida fundamentación matemática a los sistemas difusos, aunque su
concepción filosófica ha sido criticada por algunos, afirmando, como W. Kahn,
que afirmaron que .E l peligro de la lógica borrosa es que da alas a esa suerte de
pensamiento impreciso que nos ha traído tantos problemas".
Sin embargo, uno de los aspectos más importantes que se perciben en el
trabajo con matemática difusa, es la importancia de replantear los conceptos
clásicos de verdad y falsedad, y pertenencia y no-pertenencia, para involucrar
en nuestras concepciones, de una manera formal, el concepto de borrosidad o
vaguedad [Kos94], en la cual los conceptos clásicos de la lógica bi-valuada son
tan solo un caso extremo. y particular. Incluso principios tal universalmente
aceptados como el principio del tercio excluido y el de no contradicción pierden
granparte de su validez, y pasan igualmente a ser comportamientos en casos
particulares.
La matemática difusa nos permite entender y manipular matemáticamente
conceptos que son a la vez parcialmente verdaderos y parcialmente falsos en
la mayoría de las veces, o conceptos de no están definidos de manera precisa
en el lenguaje y trabajo habitual (tales como alto, pesado, etc). Permite, (de
manera útil además), asignar valores de verdad a las proposiciones, en el intervalo unitario, y operar matemáticamente con ellos. Permite luego introducir
"borrosidades.en las propias proposiciones (las variables y los modificadores
lingüísticos). Estos aspectos, simples en apariencia, abren nuevas perspectivas
sobre conceptos aparentemente "trillados"basados en la lógica y teoría de conjuntos clásicos. Las reglas de inferencia toman gracias a esto una nueva dimensión, más cercana al razonamiento humano.
En este trabajo se introdujeron temas relativos a las operaciones con conjuntos, números e intervalos difusos. Se examinaron algunas reglas de inferencia
difusas, que aunque no abarcan la totalidad de las reglas que se pueden encontrar, son las más importantes desde un punto de vista teórico: modus ponens,
modus tollens y el silogismo hipotético generalizados.
Dentro de las muchas líneas posibles en las que conviene reforzar los temas
presentados, y que no se incluyeron por limitaciones de tiempo y espacio, se
encuentran:
Las relaciones difusas,
Los procedimientos de diseño de funciones de pertenencia adecuadas. El
buen diseño de una función de pertenencia es vital para el correcto modelamiento de un sistema difuso, y adaptarlo a las necesidades.
Las funciones de pertenencia se pueden diseñar mediante asignación directa, mediante una función propuesta por el diseñador del sistema, o bien
mediante procesos probabilísticos y estadísticos que sufieren un modelo
determinado.
67
Los sistemas de inferencia utilizados en la práctica. Son los mecanismos
que permiten la toma de decisiones por parte del sistema. Un proceso
práctico de inferencia difusa involucra la funciónde pertenencia, los operadores lógicos difusos y un conjunto de reglas si-entonces. Los sistemas
de inferencia difusa tienen asociados una cantidad de nombres, debido a
que sonutilizaods de manera interdisciplinaria: sistemas expertos difusos,
sistemas expertos basados en reglas difusas, modelamiento difuso, controladores lógicos difusos, entre otros.
Dentro de estos sistemas de inferencia sobresalen dos, que son prácticamente los más utilizados: el Sistema de Inferencia Difusa de Mamdani y el
Sistema de Inferencia Difusa de Sugeno. El primero de ellos, tal vez el más
común, fue desarrollado en 1975 por E. Mamdani basado en los trabajos
de L. Zadeh.
El trabajo con sistemas difusos aplicados tales como Mamdani o Sugeno
requieren de la aplicación precisa de gran parte de los conceptos aquí tratados.
Este tema se puede profundizar y llevar a la práctica de manera bastante ágil
utilizando el Toolbox de Lógica Difusa de Matlab.
68
Referencias
[Ros04] T. Ross, Fuzzy Logic with Engineering Applications. NJ, USA: John
Wilwy and Sons (2004)
[Gky95] G. Klir, B. Yuan, Fuzzy Sets and Fuzzy Logic. NJ, USA: Prentice Hall
(1995)
[Got01] S. Gottwald, A Treatise on Many Valued Logics. England: Research
Studies Press (2001)
[Bbs02] B. Martin, A, Sans, Redes Neuronales y Sistemas Difusos. México: Alfaomega (2002)
[Kos94] B. Kosko, Pensamiento Borroso. Barcelona: Ed. grijalbo (1992)
[Kos92] B. Kosko, Neural Networks and Fuzzy Logic. NewJersey: Prentice-Hall
(1992)
69
Descargar