MÁS SOBRE PROBABILIDAD CONDICIONADA. ERRORES TÍPICOS. Probabilidad condicionada -Asociar el mismo valor a P(A|B) y a P(B|A). -Calcular el valor de P(A|no B) a partir del de P(A|B) aplicando la regla del suceso complementario. Ésta se cumple en el caso de P(A|B) y P(no A|B). Probabilidades condicionadas en árboles. P(noB|no A) Además P(A|B) =p(A y B)/ (p(A y B) + P(no A y B)) P(no A|B) =p(no A y B)/ (p(A y B) + P(no A y B)) P(A|no B) =p(A y no B)/ (p(A y no B) + P(no A y no B)) P(no A| no B) =p(no A y no B)/ (p(A y no B) + P(no A y noB)) Probabilidades condicionadas a partir de diagramas de Venn. Se extrae una carta de la baraja . Se consideran los siguientes sucesos. {extraer oro} y F={extraer figura}. a)Dibuja el diagrama de Venn correspondiente al problema y determina el área de sus zonas. b)¿Cómo se visualizaría P(oro|figura)? c)¿y P(figura|no oro)? Soluciones Probabilidad condicionada a partir de Tablas:Un problema resuelto. Consideremos la elección de un representante del alumnado teniendo en cuenta su procedencia y sexo. En la siguiente tabla se muestra la distribución del alumnado del centro de acuerdo a estas dos características. Pueblo A Pueblo B TOTAL Chico Chica 8 30 TOTAL 38 32 30 62 40 60 100 Consideremos los sucesos A={ser de A}, B={ser de B}, C={ser chica} a)Calcula P(A) Solución: usando la regla de Laplace: casos posibles 100, casos favorables: 38. Valor de P(A)=38/100=0,38. b) Calcula ahora la misma probabilidad pero conociendo el hecho de que la persona elegida ha sido una chica. Por tanto se pide P(A|C). Solución: Los casos posibles se han reducido de 100 a 60 (dado que se conoce la circunstancia de que la elegida es una alumna), mientras que el número de casos favorables pasa a ser de 30 (chicas que provienen de A). La probabilidad pedida es 30/60=0,5. El hecho de saber que la elegida es una chica da más certidumbre al hecho de ser de A al ser P(A)<P(A|C). c)Calcula P(C|A) (Probabilidad de elegir una chica conocido que el elegido proviene de C)para comprobar que no tiene nada que ver con P(A|C). Usando la Regla de Laplace los casos posibles son ahora 38 (habitantes de A) y los posibles son todas las chicas que residen en A (30). La probabilidad será igual a 30/38. APLICACIONES DE LA PROBABILIDAD CONDICIONADA. EJEMPLO 1 (Resuelto): Con este ejemplo se pone de manifiesto la relación entre frecuencias relativas y probabilidades en la línea de los expresado por la Ley de los Grandes números y cómo las probabilidades condicionadas pueden ayudarnos a interpretar informaciones. Tienen AHORA coche A Tenían ANTES coche A No tenían ANTES coche A 2000 No tienen AHORA coche A 1500 3800 4100 ¿Cómo usaría un representante de la marca la probabilidad para indicar algo positivo de su evolución comercial? Respuesta: Se debería remitir a la Regla de Laplace y a los totales por filas (distribución pasada de coches: 3500 de la marca A y 7900 de otras) y por columnas(distribución actual:5800 de la marca A y 5600 de otras).Si comprobamos cuál es la probabilidad de encontrarnos actualmente con un coche de la marca A en este momento observaremos que es igual a 0,508 (5800/11400) frente a la anterior , igual a 0,307 (3500/11400).A partir del calculo de P(A ahora|A antes) podemos concluir que más de la mitad de los antiguos usuarios (0,57) siguen confiando en la marca al comprar su nuevo coche. Finalmente del cálculo de P(no A antes|A ahora) (0,636) se concluye que entre los clientes actuales los recién llegados a la marca son mayoría. ¿Cómo se puede estudiar la fidelidad a la marca? Respuesta: El cálculo de P(A ahora|A antes).De nuevo este dato es positivo puesto que es más probable que un cl cliente antiguo de A repita en ella que que no lo haga (0,57 frente a 0,43). EJEMPLO 2 (Pendiente de resolver): Diagnóstico Clínico Para detectar enfermedades en los laboratorios y universidades se diseñan pruebas. Para probarlas se usan grupos de personas ya diagnosticadas de la enfermedad para la que se ha diseñado la prueba. También se usan grupos de personas que se sabe no padecen esa enfermedad. Llamamos E={tener la enfermedad} Se denomina sensibilidad de una prueba a la probabilidad de que ésta de positiva cuando se aplica a una persona que tiene la enfermedad. Interesa que la misma sea la mayor posible para el desarrollo de un test adecuado. Se denomina especificidad de la prueba a la probabilidad de que una persona que no tiene la enfermedad dé un resultado negativo . Interesa que también sea lo mayor posible. TAREAS: a)Mediante un esquema representa la situación planteada por la ausencia/existencia de enfermedad y la verificación o no de la prueba. ¿qué es lo ‘ideal’ en una prueba diagnóstica?. Justifica tu respuesta usando el esquema. Cuando se aplica la prueba se dispone de la información que da ésta y se pretende calcular la probabilidad de padecer o no la enfermedad. Analicemos cada una de ellas. P(E|+) : probabilidad de que la prueba haya acertado el diagnóstico. P(no E|+): probabilidad del falso positivo o lo que es lo mismo declarar a una persona enferma a partir del resultado de la prueba cuando realmente ésta no tiene la enfermedad. P(no E|-) :Probabilidad de que un negativo corresponda a un apersona no enferma. P(E|-): Probabilidad de que un negativo corresponda a una persona enferma (falso negativo) Para calcular esas probabilidades es necesario conocer la tasa de incidencia de la enfermedad en la población normal Considera los siguientes datos: P(+|E)=0,99, P(+|no E)=0,05 , P(E)=0,01 b)¿A qué se refieren cada una de ellas? c)¿Cuál es la probabilidad de tener un falso positivo? d)¿Cuál es la probabilidad de tener un falso negativo? e) De acuerdo a lo anterior valora la ‘calidad’ de la prueba diseñada. Profundizando en el concepto de probabilidad condicionada. Consideremos una nueva actividad que permite reflexionar en torno al concepto de probabilidad condicionada, así como sobre la forma de su cálculo a partir de una tabla: Una marca ofrece una garantía en sus vehículos de tres años.De 10000 coches vendidos hace tres años de una marca pertenecientes a los modelos A, By C se ha hecho un estudio acerca de sus problemas mecánicos durante el periodo de garantía. He aquí los resultados. Problemas Sin problemas TOTAL POR MODELOS A B C 650 49350 50000 200 19800 20000 150 29850 30000 TOTAL POR COLUMNA S 1000 99000 100000 -Compara P(Problemas) , P(problemas|A), P(Problemas|B), P(problemas|C). Interpreta los resultados obtenidos. -Compara P(problemas|A) con P(problemas|noA) y P(problemas|C) con P(problemas|no C) . Interpreta los resultados obtenidos. -Compara P(A)con P(A|problemas) y P(A|no problemas). Interpreta los resultados obtenidos. -Haz lo mismo con P(C con P(C|problemas) y P(C|no problemas).Interpreta los resultados obtenidos.