Estadística Probabilística 6. Tablas de contingencia y diagramas de árbol. En los problemas de probabilidad y en especial en los de probabilidad condicionada, resulta interesante y práctico organizar la información en una tabla de contingencia (Posibilidad de que algo suceda o no suceda)o en un diagrama de árbol. Las tablas de contingencia y los diagramas de árbol están íntimamente relacionados, dado uno de ellos podemos construir el otro. Unas veces, los datos del problema permiten construir fácilmente uno de ellos y a partir de él podemos construir el otro, que nos ayudará en la solución del problema. 6.1. Conversión de una tabla en diagrama de árbol Las tablas de contingencia están referidas a dos eventos que presenta cada uno dos o más posibilidades. En el caso de los sucesos A, Ac, B yBc, expresados en frecuencias absolutas, relativas o probabilidades, la tabla adopta la forma adjunta. A Ac TOTAL B P( A B) P(Ac B) P( B ) Bc P( A Bc) P( Ac Bc) P(Bc) TOTAL P( A ) P( Ac) 1 Dicha tabla adopta la forma del diagrama de árbol del dibujo. En éste, a cada uno de los sucesos A y Ac se les ha asociado los sucesos B y Bc. B P(B|A) A P(A) Bc P(Bc|A) P(B|Ac) B P(Ac) Ac P(Bc|A) Bc Sobre las ramas del diagrama de árbol se han anotado las probabilidades condicionadas correspondientes, deducidas de las relaciones análogas a: Juan Camilo Alzate Echeverri 34 [email protected] Estadística Probabilística 6.2. Conversión de un diagrama en tabla de contingencia De manera recíproca, dado el diagrama de árbol podemos construir la tabla de contingencia equivalente si más que utilizar la expresión P(A B ) = P( A ) P( B/A )· para calcular las probabilidades de las intersecciones de sucesos que forman la tabla. Ejemplo 1 Un taller sabe que por término medio acuden por la mañana 3 automóviles con problemas eléctricos, 8 con problemas mecánicos y 3 con problemas de chapa, y por la tarde 2 con problemas eléctricos, 3 con problemas mecánicos y 1 con problemas de chapa. a. Calcule el porcentaje de los que acuden por la tarde. b. Calcule el porcentaje de los que acuden por problemas mecánicos. c. Calcule la probabilidad de que un automóvil con problemas eléctricos, acuda por la mañana. Solución En las tablas de contingencia, con las frecuencias absolutas y los porcentajes, respectivamente, pueden verse recogidos los datos del enunciado. ELÉCTRICOS MECÁNICOS CHAPA TOTAL MAÑANA 3 8 3 14 TARDE 2 3 1 6 TOTAL 5 11 4 20 ELÉCTRICOS MECÁNICOS CHAPA TOTAL MAÑANA 0.15 0.40 0.15 0.70 TARDE 0.10 0.15 0.05 0.30 TOTAL 0.25 0.55 0.20 1.00 Las respuestas a las cuestiones planteadas basta leerlas en las tabla. Así, se obtiene: 35 Juan Camilo Alzate Echeverri [email protected] Estadística Probabilística a. El 30% de los automóviles acude al taller por la tarde. b. El porcentaje de vehículos ingresados con problemas mecánicos es el 55%. c. La probabilidad buscada es: P(acuda por la mañana/tiene problemas eléctricos) = (3/20)/(5/20) = 3/5 = 0.6 La probabilidad de que un automóvil con problemas eléctricos, acuda por la mañana es del 60%. 6.3. Teorema de la Probabilidad Total La probabilidad de un evento que se puede dar de varias formas es igual a la suma de los productos de las probabilidades de que se den estas formas P(An), por las probabilidades de éste en cada una de esas formas P(B/An). n P( B) P( An ) P( B / An ) I 1 Ejemplo 1 Una población está formada por tres grupos étnicos: A con un 30%, B con un 10% y C con un 6O%. Además se sabe que el porcentaje de personas con ojos claros en cada una de estas poblaciones es, respectivamente, del 20%, 40% y 5%. ¿Cuál es la probabilidad de que un individuo al azar de esta población tenga ojos claros? Solución Por el teorema de la probabilidad total, la probabilidad de que un individuo elegido al azar de esta población tenga ojos claros es: P(ojos claros) = P(A) x P(ojos claros/A) + P(B) x P(ojos claros/B) + P(C) x P(0jos claros/C ) = 0.3 x 0.2 + 0.1 x 0.4 + 0.6 x 0.05 = 0.13 La probabilidad de que un individuo escogido al azar de esta población sea de ojos claros es del 13%. Ejemplo 2 Se realizó un censo en la ciudad de Medellín para saber la cantidad de personas que habita la ciudad. Sus resultados fueron que el 0.6 son mujeres y el resto hombres. De las mujeres el 0.65 son menores de edad y el 0.35 son mayores de edad, mientras que en los hombres sucede lo contrario de las mujeres. Si se escoge una persona al azar de este estudio, encuentre la probabilidad de que sea menor de edad. Solución 36 Juan Camilo Alzate Echeverri [email protected] Estadística Probabilística M = {Sea mujer} A = {Sea menor de edad} H = {Sea hombre} B = {Sea mayor de edad} P(A|M)=0.65 P(M)=0.6 P(B|M)=0.35 P(A|H)=0.35 P(H)=0.4 P(B|H)=0.65 P(A) = P(M A)+ P(H A) P(A) = P(M).P(A|M)+P(H).P(A|H) P(A) = 0.6 * 0.65 + 0.4 * 0.35 P(A) = 0.39 + 0.14 P(A) = 0.53 = 53% Es la probabilidad de que sean menores de edad. Ejemplo 3 La aerolínea Avianca hizo una encuesta a igual número de usuarios en las ciudades de Bogotá y Medellín, con el fin de tener una visión acerca de cuál es la opinión que tienen los usuarios del servicio que se presta. Los resultados se presentan en la siguiente tabla: Bueno Regular Malo Medellín 24% 47% 29% Bogotá 22% 36% 42% Si un usuario encuestado es seleccionado al azar, encuentre la probabilidad de que considere que el servicio de Avianca es bueno. Solución P(B) = P(Med B)+ P(Btá B) P(B) = P(Med)*P(B|Med)+P(Btá)*P(B|Btá) P(B) = 0.5 * 0.24 + 0.5 * 0.22 = 0.12 + 0.11 = 0.23 La probabilidad de que esta persona haya dicho que el servicio es bueno es del 23 %. Para una mayor claridad puedes observar el diagrama adjunto. Bueno 37 Juan Camilo Alzate Echeverri [email protected] Estadística Probabilística P(B/Med) = 0.24 Medellín Inicio P(Med) = 0.5 P(Btá) = 0.5 Regular Malo P(R/Med) = 0.47 P(M/Med) = 0.29 Bueno P(B/Btá) = 0.22 Bogotá Regular P(R/Btá) = 0.36 Malo P(M/Btá) = 0.42 Ejemplo 4 Una compañía dedicada al transporte público explota tres líneas de una ciudad, de forma que el 60% de los autobuses cubre el servicio de la primera línea, el 30% cubre la segunda y el 10% cubre el servicio de la tercera línea. Se sabe que la probabilidad de que, diariamente, un autobús se averíe es del 2%, 4% y 1%, respectivamente, para cada línea. Determina la probabilidad de que, en un día, un autobús sufra una avería. Solución El suceso "sufrir una avería" (Av) puede producirse en las tres líneas, (L1, L2, L3). Según el teorema de la probabilidad total y teniendo en cuenta las probabilidades del diagrama de árbol adjunto, tenemos: P(Av) = P(L1)*P(Av/L1) + P(L2)*P(Av/L2) + P(L3)*P(Av/L3) = 0.6*0.02 + 0.3*0.04 + 0.1*0.01 = 0.012 + 0.012 + 0.001 = 0.025 La probabilidad de que un autobús sufra una avería es del 2.5% 38 Juan Camilo Alzate Echeverri [email protected] Estadística Probabilística 7. Teorema de Bayes La técnica más antigua y mejor definida para manejar la incertidumbre es la Regla de Bayes, la misma que está basada en la teoría clásica de la probabilidad. Las hipótesis son más o menos probables dependiendo de las posibilidades de los hechos o evidencias que las sostienen. La probabilidades se calculan con base a la fórmula general de la probabilidad condicional de Bayes o alguna transformación de la misma. En su esencia, esta regla nos indica qué información es necesaria y el método para invertir la condición cuando calculamos una probabilidad condicional. Si A y B son eventos y conocemos P(A/B), P(A/Bc), entonces podemos calcular P(B/A). La necesidad de calcular éste ultimo valor a partir de la información disponible es imprescindible para entender las consecuencias de algunas de nuestras decisiones. Suponga que en el ejemplo 3 de la página 36, el cual habla sobre la opinión que tienen los usuarios de Bogotá y Medellín acerca de la aerolínea Avianca, se quiere hallar la probabilidad de que al escoger una persona al azar del estudio, ésta sea de Medellín, dado que dijo que el servicio era bueno. Bueno Medellín Inicio P(Med) = 0.5 P(Btá) = 0.5 Bogotá P(B/Med) = 0.24 Regular P(R/Med) = 0.47 P(M/Med) = 0.29 Malo Bueno P(B/Btá) = 0.22 Regular P(R/Btá) = 0.36 Malo P(M/Btá) = 0.42 Solución Según lo preguntado, deberíamos encontrar la probabilidad siguiente: P(Med/B) 39 Juan Camilo Alzate Echeverri [email protected] Estadística Probabilística De la formula de probabilidad condicional tenemos que: P( Med B) P( B) P( Med ) P( B / Med ) P( Med / B) P( Med B) P( Btá B) P( Med ) P( B / Med ) P( Med / B) P( Med ) P( B / Med ) P( Btá ) P( B / Btá ) P( Med / B) Lo que hicimos fue simplemente: aplicar en el segundo paso la regla multiplicativa de la probabilidad para el numerador y la regla de la probabilidad total para el denominador. Ahora podemos reemplazar los valores en la última fórmula pues todos son conocidos. P( Med / B) 0.5 * 0.24 0.12 0.522 0.5 * 0.24 0.5 * 0.22 0.23 Lo cual quiere decir que la probabilidad de que la persona sea de Medellín, dado que dijo que el servicio es bueno, es del 52.2%. 7.1. Deducción de la Fórmula de Bayes Para realizar la deducción de esta última fórmula supongamos un espacio muestral que está dividido en n fuentes de las cuales puede provenir un suceso A, así A1, A2, A3, ..., An y sea B un suceso cualquiera del que se conocen las probabilidades condicionales P(B/Ai), luego, la probabilidad de que suceda algún evento A i, dado que B sucedió, P(Ai/B) viene dada por: P( Ai / B) P( Ai B) P( B) P( Ai / B) P( Ai ) P( B / Ai ) P( A1 ) P( B / A1 ) P( A2 ) P( B / A2 ) ... P( An ) P( B / An ) P( Ai / B) P( Ai ) P( B / Ai ) n P( A ) P( B / A ) j 1 j Teorema de Bayes j Expresando en palabras este numerador y denominador, tendríamos que: 40 Juan Camilo Alzate Echeverri [email protected] Estadística Probabilística P( Ai / B) Pr obabilidad ... para...el ...ca min o...de... Ai... y...B Suma...de...todas...las... probabilid ades... para...las...rutas..a...B Para i = 1,……n P(Ai) : Son llamadas probabilidades a priori, ya que están dadas antes de que tengamos cualquier conocimiento acerca del resultado de un evento que proviene de la fuente i. P(Ai/B) : Es la probabilidad condicional “típica” o normal que trata con la probabilidad de un resultado en la segunda etapa después que un resultado en la primera etapa ha ocurrido. P(B/Ai) : Es la probabilidad inversa o sea, que trata con la probabilidad de un resultado en la primera etapa dado que un resultado en la segunda etapa ha ocurrido. También se llama probabilidad a posteriori, (o posterior) ya que es encontrada después que el resultado de la prueba es conocido. En los problemas relacionados con la probabilidad, y en particular con la probabilidad condicionada, así como con la probabilidad total y el teorema de Bayes, es aconsejable que, con la información del problemas, construyas una tabla de contingencia o un diagrama de árbol. Ejemplo El gerente de marketing de una firma fabricante de juguetes planea la introducción de un nuevo juguete al mercado. En el pasado, 40% de los juguetes introducidos por esta firma han tenido éxito y 60% no lo han tenido. Antes de lanzar el juguete al mercado, se lleva a cabo una investigación de mercados y se elabora un informe, favorable o desfavorable. En el pasado, 80% de los juguetes con éxito recibieron informes favorables y 30% de los juguetes sin éxito también recibieron informes favorables. El gerente de marketing quería conocer la probabilidad de que el nuevo juguete tendrá éxito si recibe un informe favorable. El teorema de bayes se puede desarrollar a partir de las definiciones de probabilidad condicional y marginal en la siguiente forma: P(B A) = P(B) P(A/B) (1) P(A B) = P(A)P(B/A) (2) Con la ecuaciones (1) y (2) se tiene P(B)(P(A/B) = P(A) P(B/A) De modo que P (B/A) =P (A/B) P(B) P(A) 41 Juan Camilo Alzate Echeverri [email protected] Estadística Probabilística P (A)= P(A/B1) P(B1) + P(A/B2) P(B2)+..........+ P(A/BK) P(BK) El teorema de bayes es: P(Bi/A)= P(A/Bi) P(Bi) . P(A/B1) P(B1) + P(A/B2) P(B2)+..........+ P(A/BK) P(BK) En donde Bi es el i-esimo evento de k eventos mutuamente exclusivos. Ahora se puede usar el teorema de bayes para resolver el problema del fabricante de juguetes. Sean Evento E = juguete con éxito Ec =juguete sin éxito Evento F = informe favorable Fc = informe desfavorable Y P(E)= 0.40 P(Ec )= 0.60 Entonces P(E/F)= P(F/E)= 0.80 P(F/ Ec )= 0.30 P(F/E) P(E) . c c P(F/E) P(E) + P(F/ E ) P(E ) = (0.80) (0.40) . (0.80) (0.40) + (0.30) (0.60) = 0.32 . 0.32 + 0.18 = 0.64 La probabilidad de que un juguete tenga éxito, dado que se recibió un informe favorable, es de 0.64. por tanto, la probabilidad de que un juguete no tenga éxito puesto que recibió un informe favorable es de 0.36, porque solo hay dos eventos posibles: P(Ec’/F)= 1- P (E/F) El denominador del teorema de Bayes representa la probabilidad total del evento F, en este caso un informe favorable de la investigación de mercados. Por tanto, la proporción de juguetes que reciben informes favorables de la investigación de mercados es de 0.50. 42 Juan Camilo Alzate Echeverri [email protected]