El problema de las monedas ¿Cuál es la probabilidad de que la moneda sea justa si cae de cara? x c x c justa trucada ¿ p(m = j | r = c) ? El problema de las monedas p(m = j | r = c) = p (r = c | m = j ) p (m = j ) 0.5 × 0.5 0.25 = = = 0.4 p(r = c) p (r = c) 0.625 p(m = t | r = c) = p (r = c | m = t ) p (m = t ) 0.75 × 0.5 0.375 = = = 0.6 p (r = c) p (r = c) 0.625 p(r = c) = p (r = c | m = j ) p(m = j ) + p(r = c | m = t ) p (m = t ) p(r = c) = 0.5 × 0.5 + 0.75 × 0.5 = 0.625 Existe un 40% de probabilidad de que la moneda sea justa si cae de cara. El problema de las monedas p(m = j | r = c) = p(r = c | m = j ) p (m = j ) 0.5 × 0.5 0.25 = = = 0.4 p(r = c) p(r = c) 0.625 p(m = t | r = c) = p(r = c | m = t ) p(m = t ) 0.75 × 0.5 0.375 = = = 0.6 p (r = c) p (r = c) 0.625 p(m = j | r = x) = p (r = x | m = j ) p (m = j ) 0.5 × 0.5 0.25 = = = 0.67 p (r = x) p(r = x) 0.375 p(m = t | r = x) = p (r = x | m = t ) p (m = t ) 0.25 × 0.5 0.125 = = = 0.33 p(r = x) p(r = x) 0.375 El problema de las monedas ¿Qué porcentaje de monedas justas debe haber para que las probabilidades a posteriori coincidan? p(r = c | m = j ) p(m = j ) 0.5 × p (m = j ) = p (r = c) p(r = c) p (r = c | m = t ) p (m = t ) 0.75 × p (m = t ) = p(m = t | r = c) = p (r = c) p(r = c) p(m = j | r = c) = p(m = j | r = c) = p(m = t | r = c) 0.5 × p(m = j ) = 0.75 × p(m = t ) 0.5 × p(m = j ) = 0.75 × (1 − p(m = j )) p(m = j ) = 0.6 Cuatro clasificadores Existen cuatro clasificadores para el problema de las monedas, es decir, cuatro funciones del espacio de atributos en el de clases: r ∈ {c, x} → m ∈{ j , t} Modelo A y (c ) = t Modelo B y ( x) = j Modelo C y (c ) = j y ( x) = j y (c ) = j y ( x) = t Modelo D y (c ) = t y ( x) = t Probabilidad de equivocarse Modelo A y (c ) = t y ( x) = j El modelo A responde trucada cuando sale cara y justa cuando sale cruz. Por lo tanto, la probabilidad de equivocarse es la probabilidad de que: una moneda justa caiga de cara o una moneda trucada caiga de cruz: p(error ) = p (m = j , r = c) + p(m = t , r = x) p(error ) = p (m = j | r = c) p(r = c) + p (m = t | r = x) p (r = x) p(error ) = 0.4 × 0.625 + 0.33 × 0.375 = 0.37 Probabilidad de equivocarse Modelo B y (c ) = j y ( x) = t p(error ) = p (m = t , r = c) + p (m = j , r = x) p(error ) = p (m = t | r = c) p (r = c) + p(m = j | r = x) p (r = x) p (error ) = 0.6 × 0.625 + 0.67 × 0.375 = 0.63 Probabilidad de equivocarse Modelo C y (c ) = j y ( x) = j p(error ) = p (m = t , r = c) + p (m = t , r = x) p(error ) = p (m = t | r = c) p (r = c) + p(m = t | r = x) p (r = x) p(error ) = 0.6 × 0.625 + 0.33 × 0.375 = 0.5 Probabilidad de equivocarse Modelo D y (c ) = t y ( x) = t p(error ) = p(m = j , r = c) + p (m = j , r = x) p(error ) = p (m = j | r = c) p (r = c) + p(m = j | r = x) p (r = x) p (error ) = 0.4 × 0.625 + 0.67 × 0.375 = 0.5 Porcentaje de error de cada modelo A y (c ) = t y ( x) = j B 63 % 13 y (c ) = j y ( x) = j D 7 y (c ) = j y ( x) = t C 37 % 50 % 10 y (c ) = t y ( x) = t 50 % 10 El mejor modelo (A) es el que clasifica cada ejemplo en la clase con mayor probabilidad a posteriori.