El problema de las monedas ¿Cuál es la probabilidad de que la

Anuncio
El problema de las monedas
¿Cuál es la probabilidad de que la moneda sea justa si cae
de cara?
x
c
x
c
justa
trucada
¿ p(m = j | r = c) ?
El problema de las monedas
p(m = j | r = c) =
p (r = c | m = j ) p (m = j ) 0.5 × 0.5 0.25
=
=
= 0.4
p(r = c)
p (r = c) 0.625
p(m = t | r = c) =
p (r = c | m = t ) p (m = t ) 0.75 × 0.5 0.375
=
=
= 0.6
p (r = c)
p (r = c) 0.625
p(r = c) = p (r = c | m = j ) p(m = j ) + p(r = c | m = t ) p (m = t )
p(r = c) = 0.5 × 0.5 + 0.75 × 0.5 = 0.625
Existe un 40% de probabilidad de que la moneda sea justa
si cae de cara.
El problema de las monedas
p(m = j | r = c) =
p(r = c | m = j ) p (m = j ) 0.5 × 0.5 0.25
=
=
= 0.4
p(r = c)
p(r = c) 0.625
p(m = t | r = c) =
p(r = c | m = t ) p(m = t ) 0.75 × 0.5 0.375
=
=
= 0.6
p (r = c)
p (r = c) 0.625
p(m = j | r = x) =
p (r = x | m = j ) p (m = j ) 0.5 × 0.5 0.25
=
=
= 0.67
p (r = x)
p(r = x) 0.375
p(m = t | r = x) =
p (r = x | m = t ) p (m = t ) 0.25 × 0.5 0.125
=
=
= 0.33
p(r = x)
p(r = x) 0.375
El problema de las monedas
¿Qué porcentaje de monedas justas debe haber para que las
probabilidades a posteriori coincidan?
p(r = c | m = j ) p(m = j ) 0.5 × p (m = j )
=
p (r = c)
p(r = c)
p (r = c | m = t ) p (m = t ) 0.75 × p (m = t )
=
p(m = t | r = c) =
p (r = c)
p(r = c)
p(m = j | r = c) =
p(m = j | r = c) = p(m = t | r = c)
0.5 × p(m = j ) = 0.75 × p(m = t )
0.5 × p(m = j ) = 0.75 × (1 − p(m = j ))
p(m = j ) = 0.6
Cuatro clasificadores
Existen cuatro clasificadores para el problema de las monedas,
es decir, cuatro funciones del espacio de atributos en el de clases:
r ∈ {c, x} → m ∈{ j , t}
Modelo A
y (c ) = t
Modelo B
y ( x) = j
Modelo C
y (c ) = j
y ( x) = j
y (c ) = j
y ( x) = t
Modelo D
y (c ) = t
y ( x) = t
Probabilidad de equivocarse
Modelo A
y (c ) = t
y ( x) = j
El modelo A responde trucada cuando sale cara y justa cuando
sale cruz. Por lo tanto, la probabilidad de equivocarse es la
probabilidad de que: una moneda justa caiga de cara o una
moneda trucada caiga de cruz:
p(error ) = p (m = j , r = c) + p(m = t , r = x)
p(error ) = p (m = j | r = c) p(r = c) + p (m = t | r = x) p (r = x)
p(error ) = 0.4 × 0.625 + 0.33 × 0.375 = 0.37
Probabilidad de equivocarse
Modelo B
y (c ) = j
y ( x) = t
p(error ) = p (m = t , r = c) + p (m = j , r = x)
p(error ) = p (m = t | r = c) p (r = c) + p(m = j | r = x) p (r = x)
p (error ) = 0.6 × 0.625 + 0.67 × 0.375 = 0.63
Probabilidad de equivocarse
Modelo C
y (c ) = j
y ( x) = j
p(error ) = p (m = t , r = c) + p (m = t , r = x)
p(error ) = p (m = t | r = c) p (r = c) + p(m = t | r = x) p (r = x)
p(error ) = 0.6 × 0.625 + 0.33 × 0.375 = 0.5
Probabilidad de equivocarse
Modelo D
y (c ) = t
y ( x) = t
p(error ) = p(m = j , r = c) + p (m = j , r = x)
p(error ) = p (m = j | r = c) p (r = c) + p(m = j | r = x) p (r = x)
p (error ) = 0.4 × 0.625 + 0.67 × 0.375 = 0.5
Porcentaje de error de cada modelo
A
y (c ) = t
y ( x) = j
B
63 % 13
y (c ) = j
y ( x) = j
D
7
y (c ) = j
y ( x) = t
C
37 %
50 % 10
y (c ) = t
y ( x) = t
50 % 10
El mejor modelo (A)
es el que clasifica
cada ejemplo en la
clase con mayor
probabilidad a
posteriori.
Descargar