Inteligencia Artificial - Departamento de Ciencias e Ingeniería de la

Anuncio
Departamento de Cs. e Ingenierı́a de la Computación
Universidad Nacional del Sur
Inteligencia Artificial
Trabajo Práctico N◦ 12
Razonamiento Probabilı́stico
Segundo Cuatrimestre de 2008
1. Razonamiento Probabilı́stico.
a) Existen dos interpretaciones principales de la Teorı́a de la Probabilidad [PMG98],
- interpretación estadı́stica
- interpretación subjetiva o Bayesiana
¿En qué se diferencia cada una de ellas? ¿qué relación hay entre estas dos visiones de la
probabilidad?
b) Dar un ejemplo en el que distintos agentes (con distinto conocimiento) asignen distinta
probabilidad a un mismo evento. ¿A cuál de las dos interpretaciones se debe esta situación?
c) ¿Qué significa para un agente que una sentencia p tenga un valor de probabilidad igual a
0? ¿y un valor igual a 1?
d ) ¿Qué sentencia es “más”verdadera (si la hay), una con probabilidad 0.5 o una con probabilidad 0.99?
2. Semántica de Mundos Posibles
a) Dar una interpretación de mundos posibles para un sistema de razonamiento que utilice
probabilidades.
b) Dada la definición anterior, ¿cuándo se dice que una fórmula f es verdadera en un mundo
ω (i.e ω |= f )?
c) Si Ω es el conjunto de todos los mundos posibles, a cada mundo ω se puede asociar una
medida µ(ω) tal que:
0 ≤ µ(ω) para todo ω ∈ Ω
X
µ(ω) = 1
ω∈Ω
Dada esta medida, ¿cómo se calcula la probabilidad de una fórmula f , P (f )?
d ) Dar una interpretación intuitiva adecuada a las siguientes proposiciones, de acuerdo a la
semántica de mundo posibles:
1) P (¬f ) = 1 − P (f )
2) P (f ) = P (f ∧ g) + P (f ∧ ¬g)
3) Si v es una variable aleatoria con dominio D, entonces para toda fórmula f ,
P (f ) =
X
d∈D
4) P (f ∨ g) = P (f ) + P (g) − P (f ∧ g)
3. Probabilidad Condicional
1
P (f ∧ v = d)
a) Explicar la diferencia que hay entre P (h) que es la probabilidad (a priori ) de una sentencia
h y P (h|e) que es la probabilidad condicional (a posteriori) de h que surge al considerar la
evidencia e.
b) ¿Cómo se interpretan las probabilidades P (pájaro → vuela) y P (vuela|pájaro)?
c) ¿Qué significa que P (h|e) = P (h|e ∧ f )?
d ) Probar que si una variable random x es independiente de una variable random y, dada una
variable random z, entonces, para todo valor ai , bj , ck , se verifica:
P (x = ai ∧ y = bj | z = ck )= P (x = ai | z = ck ) × P (y = bj | z = ck )
4. Considere el siguiente conjunto de mundos posibles Ω = {ω1 , ω2 , ω3 , ω4 , ω5 } junto con la siguiente
información
µ(ω1 ) = µ(ω3 ) = µ(ω5 )
µ(ω2 ) = µ(ω4 )
ω4 |= h y ωi 6|= h, ∀i 6= 4
P (¬ h) =
7
8
ω1 |= f ∧ v, ω2 |= f ∧ v ∧ n, ω3 |= f ∧ n, ω4 |= f , ω5 |= v
Aplicando las definiciones de probabilidad y probabilidad condicional dada por la semántica de
mundos posibles obtener las probabilidades P (f ), P (n), P (v) y las probabilidades condicionales;
P (h | n), P (v | f ), P (f | v) y P (f | h)
5. Redes de Creencias
a) ¿Cómo se define una Red de Creencias (RC)?
b) ¿Cuál es la principal suposición que se hace acerca de la dependencia de variables aleatorias
cuando se diseña una RC? ¿Cuál es la ventaja que esto ofrece al momento de razonar?
6. Suponga que para el diseño de un asistente de diagnóstico médico se ha definido una Red de
Creencia. Dibuje esta red considerando las probabilidades condicionales que deben especificarse
en su diseño son las siguientes:
p(dolorM anos | artritis ∧ distension) = 0,1
p(dolorM anos | artritis ∧ ¬ distension) = 0.99
p(dolorM anos | ¬ artritis ∧ distension) = 0,99
p(dolorM anos | ¬ artritis ∧ ¬ distension) = 0.00001
p(dolorCodo | artritis ∧ codoT enista) = 0,1
p(dolorCodo | artritis ∧ ¬ codoT enista) = 0.99
p(dolorCodo | ¬ artritis ∧ codoT enista) = 0,99
p(dolorCodo | ¬ artritis ∧ ¬ codoT enista) = 0.00001
p(codoT enista | artritis) = 0,0001
p(codoT enista | ¬ artritis) = 0.01
p(artritis) = 0,001
p(distension) = 0.01
7. Mycin
Mycin fue uno de los primeros sistemas expertos desarrollados en Stanford en los 70’s. Este
sistema diagnosticaba y recomendaba tratamiento para ciertas infecciones en la sangre. Es un
sistema que si bien realiza cierta manipulación numérica, no utiliza probabilidades sino que
utiliza factores de certeza. Cada sentencia tiene asignado un factor de certeza que va de -1 a 1.
2
Un factor de certeza de -1 indica que la sentencia se sabe que es falsa y un factor de certeza
1 indica que la sentencia es verdadera. Un factor de certeza 0 indica que no se tiene creencia
alguna acerca de la sentencia. Los factores de certeza de una sentencia compuesta se calculan de
la siguiente manera:
CF(p1 ∧, ..., ∧pn ) = min(CF(p1 ), ..., CF(pn ))
si CF(p) = c y CF(p → q) = d luego
½
CF(q) =
cd
0
si c es positivo
en otro caso
si hay dos argumentos (derivaciones) para una conclusión q que computan los factores de
certeza x e y respectivamente, el factor de certeza asociado a q se calcula combinando los
valores x e y de la siguiente manera:


 x + y − xy,
CF(x, y) =


x + y + xy,
x+y
1−min(|x|,|y|) ,
si x,y > 0;
si x,y < 0;
si x e y tienen signos opuestos.
a) Utilizando la propuesta Mycin, asignar los factores de certeza que considere adecuados
(según su intuición) a las siguientes sentencias:
- ‘no vuela una gallina’.
- ‘no cruza un lago un pato’.
- ‘no vuela Petete’.
b) Considerando la siguiente base de conocimiento:
CF(gallina(T uruleca)) = 1
CF(gallina(P etete)) = −0,3
CF(gallina(Donald)) = −1
CF(pato(Donald)) = 1
CF(pájaro(petete)) = 0,5
CF(pato(x) → pájaro(x)) = 1
CF(gallina(x) → pájaro(x)) = 1
CF(gallina(x) → anida en el suelo(x)) = 0,9
CF(pato(x) → anida en el suelo(x)) = 0,9
CF(pájaro(x) ∧ anida en el suelo(x) → ¬vuela(x)) = 0,7
CF(pájaro(x) ∧ ¬vuela(x) → ¬cruza un lago(x)) = 0,8
calcular los factores de certeza faltantes necesarios para completar la siguiente tabla, en
base a las convenciones adoptadas por el sistema MYCIN.
Predicado
Individuo
T uruleca P etete Donald
1
-0.3
-1
gallina
pájaro
anida en el suelo
¬vuela
¬cruza un lago
c) Suponiendo por un momento que CF(¬p) = −CF(p) ¿cuál serı́a el factor de certeza asociado
a la sentencia p ∨ ¬p? Comparar el resultado obtenido con respecto a la lógica clásica.
Referencias
[PMG98] Poole, D., Mackworth, A., and Goebel, R. Computational Intelligence: A Logical
Approach. Oxford University Press, 1998.
3
Descargar