Probabilidad Definición: El conjunto de todos los posibles resultados de un experimento aleatorio o estocástico ε recibe el nombre de Espacio Muestral (Ω) (Espacio Referencial o Universo). En el estudio de la probabilidad, se referirá como un experimento a cualquier proceso de observación. A los resultados de esta observación se le llama “resultados o salidas del experimento” Un experimento ε es aleatorio, si no se pueden predecir sus resultados o salidas. Definición: Se dice que un Espacio Muestral Ω es discreto si los resultados pueden colocarse en correspondencia uno a uno con el conjunto IN; y será continuo si sus resultados consisten en un intervalo de números reales. Definición: Un suceso A es un subconjunto del Espacio Muestral Ω. Se anota como A ⊂ Ω. Definición: Un Suceso Imposible es aquel en que la ocurrencia del suceso nunca es posible de efectuarse. Un Suceso Seguro es aquel en que la ocurrencia del suceso siempre es posible de efectuarse. Ejemplos: 1. - Sea el experimento aleatorio ε: “Lanzar un dado”. El conjunto Ω de todos los resultados posibles, en este caso es Ω = { 1, 2, 3, 4, 5, 6 }. Veamos ahora algunos ejemplos de sucesos relacionados a este caso: A = { El resultado es par } = { 2, 4, 6 } B = { El resultado es mayor que 3 } = { 4, 5, 6 } C = { El resultado es menor o igual a 6 } = Ω ( C es un suceso seguro ) D = { El resultado es mayor que 6 } = ∅ ( D es un suceso imposible ) 2 2.- Sea el experimento aleatorio ε: “Lanzar una moneda dos veces”. El conjunto Ω de todos los resultados posibles, en este caso es: Ω = { (c, c), (c, s), (s, c), (s, s) }. Donde el par ordenado (x, y) representa dos lanzamientos de la moneda, es decir, el valor “x” es para la primera tirada o lanzamiento y el valor “y” el segundo lanzamiento, así x e y pueden tomar los valores de c por una “cara” y s por un “sello”. Veamos ahora algunos ejemplos de sucesos relacionados a este caso: A = { resulta al menos una cara} = { (c, c), (c, s), (s, c) }. B = { resulta el mismo valor} = { (c, c), (s, s) } 3.- Sea el experimento aleatorio ε: “Lanzar dos monedas simultáneamente”. El conjunto Ω de todos los resultados posibles, en este caso es: Ω = { (c, c), (c, s), (s, c), (s, s) }. En este experimento el conjunto Ω de todos los resultados posibles es el mismo del ejemplo 2, solamente que en este caso, el par ordenado (x, y) Tiene una interpretación diferente. Ahora “x” representa el valor que resulta para la “primera moneda” y el valor resultante para la “segunda moneda” lo entrega “y”. Así, el suceso A del ejemplo 2 debe ser interpretado como el suceso donde al lanzar dos veces una moneda resulta por lo menos una cara en alguno de los lanzamientos, mientras que el suceso B nos indica que ambas monedas tienen igual valor. Nota: El espacio muestral Ω puede ser interpretado gráficamente para ambos experimentos así: 3 4.- El espacio muestral de un experimento consistente en la medición (en horas) del tiempo de vida de un microprocesador es: Ω = {τ / 0 ≤ τ ≤ ∞} Nótese que los tres primeros ejemplos corresponden a casos de espacios muestrales discretos, mientras que el último ejemplo corresponde al caso de un espacio muestral continuo. El concepto clásico de probabilidad nos dice que es una frecuencia relativa (concepto estadístico) sin necesidad de haber realizado el experimento. La frecuencia relativa se calcula sobre hechos estadísticos consumados, es decir, sobre un experimento realizado. Si el número de experimentos tiende a infinito, entonces la frecuencia relativa se convierte en la probabilidad. Axiomática de Probabilidades Conceptos Previos Operaciones de Boole Sean A y B sucesos de un Espacio Muestral Ω, entonces: A ∪B: es el suceso que ocurre sí y sólo si ocurre el suceso A o el suceso B o si ocurren ambos sucesos. A∩B: es el suceso que ocurre sí y sólo si ocurren ambos sucesos simultáneamente. AC : (Complemento de A) es el suceso que ocurre sí y sólo si el suceso A no ocurre. Dos sucesos A y B son Mutuamente Exclusivos o Mutuamente Excluyentes si son Disjuntos, o sea A∩B = ∅. En otras palabras, A y B son Mutuamente Excluyentes si no pueden suceder simultáneamente. 4 Axiomas de Probabilidad La probabilidad de ocurrencia del suceso A es P(A) si cumple los siguientes axiomas: A1.- ∀ A ⊂ Ω ⇒ 0 ≤ P(A) ≤ 1 A2.- P(Ω) = 1 A3.- Si A y B son Mutuamente Excluyentes: P(A∪B) = P(A) + P(B) La generalización también es válida P( A ∪ A ∪ A ∪........ .) = P(A ) + P(A ) + P(A ) +………. 1 2 3 1 2 3 Teoremas de Probabilidades T1.- Si ∅ es el suceso imposible, entonces P(∅) = 0 T2.- La probabilidad del suceso que ocurre si no ocurre el suceso A, es decir, la probabilidad del suceso complemento de A es 1 – P(A), donde P(A) es la probabilidad de ocurrencia del suceso A. P( AC ) = 1 – P(A) T3.- Si A ⊂ B ⇒ P(A) ≤ P(B) T4.- Si A y B son dos sucesos, entonces: P(A\B) = P(A) – P(A∩B) T5.- Si A y B son dos sucesos, entonces: P(A∪B) = P(A) + P(B) – P(A∩B) 5 Definición: Dos sucesos A y B se dicen Estadísticamente Independientes (independientes) sí y sólo si: P(A∩B) = P(A) · P(B) ; (EI1) CONSECUENCIAS A y B sucesos Independientes 1 P(A) = 0 ∨ P(B) = 0 A y B sucesos Excluyentes A y B sucesos Independientes 2 A y B son sucesos No Excluyentes P(A) > 0 ∧ P(B) > 0 A y B sucesos Excluyentes A y B son sucesos No Independientes 3 P(A) > 0 ∧ P(B) > 0 Probabilidad Condicional Definición: Sean A y B dos sucesos cualesquiera, donde P(B) > 0, entonces definimos: P ( A ∩ B) P ( A / B) = ; (PC1) P (B) Donde P(A/B) se lee como la probabilidad del suceso A dado que ocurre el suceso B. También se lee como la probabilidad que el suceso A ocurra una vez que ocurre el suceso B, es decir, la probabilidad condicional del suceso A dado el suceso B. Si además, A y B son Sucesos Independientes, entonces: P(A/B) = P(A) y P(B/A) = P(B) De donde obtenemos que independientes. P(A∩B) = P(A) · P(B) para sucesos 6 Ejemplo: Sean A y B dos sucesos tales que: P(A) = 0.8 P(B) = 0.6 P(A∩B) = 0.5 ( ⇐ A y B son sucesos no excluyentes ) Calcular las probabilidades de los siguientes sucesos: a.- No ocurre el suceso A b.- ocurre sólo el suceso A c.- ocurre al menos uno de los dos sucesos d.- ocurre sólo uno de los dos sucesos e.- no ocurre ninguno de los dos sucesos Respuestas: a.- No ocurre A ⇒ P( AC ) ⇒ P( AC ) = 1 – P(A) = 1 – 0.8 = 0.2 b.- ocurre sólo A ⇒ P(A\B) ⇒ P(A\B) = P(A) – P(A∩B) = 0.8 – 0.5 = 0.3 c.- ocurre al menos uno de los dos ⇒ P(A∪B): P(A∪B) = P(A) + P(B) – P(A∩B) = 0.8 + 0.6 – 0.5 = 0.9 d.- ocurre sólo uno de los dos ⇒ P[ (A\B) ∪ (B\A) ] Notemos que: P([ (A∩ BC ) ] ∪ [ (B∩ AC ) ] ) = P[ (A\B) ∪ (B\A) ] P([ (A∩ BC ) ] ∪ [ (B∩ AC ) ] ) = P(A∩ BC ) + P(B∩ AC ) por otra parte: P(A∩ BC ) = P(A) – P(A∩B) = 0.8 – 0.5 = 0.3 y P(B∩ AC ) = P(B) – P(A∩B) = 0.6 – 0.5 = 0.1 por lo tanto: P([ (A∩ BC ) ] ∪ [ (B∩ AC ) ] ) = P(A∩ BC ) + P(B∩ AC ) = 0.3 + 0.1 = 0.4 e.- no ocurre ninguno de los dos ⇒ P((A∪ B)C ) = 1 – P(A∪B) por otra parte: P(A∪B) = P(A) + P(B) – P(A∩B) = 0.8 + 0.60 – 0.5 = 0.9 así: P((A∪ B)C ) = 1 – P(A∪B) = 1 – 0.9 = 0.1 7 Ejemplo (la secretaria loca): Una secretaria escribe cuatro cartas con sus cuatro sobres respectivos. Si coloca las cartas en los sobres de manera aleatoria. ¿Cuál es la probabilidad que las coloque correctamente? Respuestas: Sea S y C el Sobre i y la Carta i respectivamente, con i = 1, 2, 3, 4. i i El diagrama de árbol nos muestra las siguientes posibilidades: Carta 1 Carta 2 Carta 3 Carta 4 Sobre 1 Sobre 1 Sobre 1 Sobre 1 Sobre 2 Sobre 2 Sobre 2 Sobre 2 Sobre 3 Sobre 3 Sobre 3 Sobre 3 Sobre 4 Sobre 4 Sobre 4 Sobre 4 El espacio muestral queda como: Ω = { (c1, s1), (c1, s2), (c1, s3), (c1, s4), (c2, s1), (c2, s2), ), (c2, s3), (c2, s4), (c3, s1), (c3, s2), ), (c3, s3), (c3, s4), (c4, s1), (c4, s2), (c4, s3), (c4, s4) } y la cardinalidad de Ω es 16 ( #Ω = 16) por que 16 son los sucesos posibles que consisten en colocar aleatoriamente las cartas en los sobres. El suceso de colocar la carta apropiada en el sobre apropiado lo denominaremos A : A = { (c1, s1), (c2, s2), (c3, s3), (c4, s4) } cuya cardinalidad es 4 (#A = 4) En consecuencia la probabilidad pedida es: P(A) = #A / #Ω = 4/16 = 1/4= 0.25 8 Ahora veremos la aplicación de los conceptos de probabilidad condicional. Ejemplo (el profesor cruel): Una estadística que manejan los profesores de un instituto de educación superior revela que el 25% de los estudiantes de las carreras que allí se imparten reprueba Cálculo, el 15% reprueba Estadísticas y el 10% reprueba ambas asignaturas. a.- Si un alumno reprueba Estadísticas, ¿cuál es la probabilidad que repruebe Cálculo? b.- Si un alumno reprueba Cálculo, ¿cuál es la probabilidad que repruebe Estadísticas? c.- ¿cuál es la probabilidad que tiene el alumno de reprobar una de las dos o ambas asignaturas? Respuestas: Presentemos esta situación en el diagrama de Venn-Euler: Donde C es el suceso consistente en reprobar Cálculo y E es el suceso que consiste en reprobar Estadísticas. a.- El teorema de la probabilidad condicional (pag. 5; PC1) nos dice que la probabilidad condicional que un alumno pierda Cálculo si reprobó Estadísticas es: P ( C ∩ E ) 0,1 2 P (C / E ) = = = = 0, 666.... P(E) 0,15 3 b.- La probabilidad que un alumno pierda Estadísticas dado que reprobó Cálculo es: P (C ∩ E ) 0,1 2 P (E / C ) = = = = 0, 4 P (C ) 0, 25 5 9 c.- La probabilidad que un alumno repruebe ya sea Cálculo o Estadísticas o ambas es: P(C ∪ E) = P ( C) + P ( E ) – P(C ∩ E) = 0, 25 + 0,15 – 0,1 = 0,3 De este problema nace una pregunta casi natural: ¿el reprobar Cálculo y Estadísticas son sucesos independientes. Veamos. Si los sucesos son independientes, debe darse (página 5): P(C ∩ E) = P ( C) × P ( E ) Pero vemos que P(C∩E) = 0.1 y que P(C) · P(E) = 0,15*0,25=0,0375y claramente 0,1 ≠ 0,0375 o sea P(C∩E) ≠ P(C) · P(E) lo que indica que reprobar Cálculo y Estadísticas no son sucesos independientes, es decir son sucesos dependientes. Nota: Cualquier situación con la vida real es simplemente intencional Nota: Siempre es importante tener en cuenta que: A ∪ B = (A ∩BC) ∪ (A ∩ B ) ∪ (AC∩ B ) A ∪ B = (A \ B) ∪ (A ∩ B ) ∪ (B \ A) Nótese que se trata de la unión de conjuntos disjuntos. 10 Se arrojan tres monedas legales. Calcular la probabilidad de obtener: a) Exactamente i caras ( i = 0,1, 2, 3 ) b) Por lo menos i caras M1 M2 M3 C Ω (C,C,C) S (C,C,S) C (C,S,C) S (C,S,S) C (S,C,C) S (S,C,S) C (S,S,C) S (S,S,S) C C S C S S i caras exactas Ω CCC CCS CSC CSS SCC SCS SSC SSS #Ω 8 0 1 2 Por lo menos i caras 3 * ♣ ♣ ♣ ■ ■ 0 1 2 3 ▼ ▼ ▼ ▼ ▼ ▼ ▼ □ ♦ □ □ □ ♪ ☻ 1 2 3 1 1 7 4 1 Probab. 1/8 1/4 3/8 1/8 1/8 7/8 1/2 1/8 Suceso pregunta a Suceso pregunta b Así la probabilidad de obtener exactamente 0 caras es 1/8, la de obtener exactamente 1 caras es 1/4, la de obtener exactamente 2 caras es 3/8, la de obtener 3 caras es 1/8. Mientras que la probabilidad de obtener al menos 0 caras alcanza a 1/8, al menos 1 cara es 7/8, la de obtener por lo menos 2 caras es 1/2, y la de obtener por lo menos 3 caras es de 1/8. 11 La probabilidad que un hombre siga vivo dentro de 25 años es 3/5, y la de su esposa es de 2/3. Determinar la probabilidad que en ese momento: a) ambos estén vivos b) sólo el hombre esté vivo c) sólo la mujer esté viva d) al menos uno de ellos esté vivo P(H) = 3/5 =: Probabilidad que el hombre siga viviendo dentro de 25 años. P(M) = 2/3 =: Probabilidad que la mujer siga viviendo dentro de 25 años. Respuesta a: P(H∩M) = : Probabilidad que ambos estén vivos dentro de 25 años. Como H y M son sucesos independientes, entonces : P(H∩M) = P(H)* P(M) y así P(H∩M) =3/5*2/3 = 2/5 = 0,4 Respuesta b: P(H \ M) =: Probabilidad que sólo el hombre siga vivo dentro de 25 años. P(H \ M) = P(H∩Mc) = P(H) - P(H∩M) = 3/5-2/5 = 1/5 = 0,2 Respuesta c: P(M \ H) =: Probabilidad que sólo la mujer siga viva dentro de 25 años. P(M \ H) = P(M∩Hc) = P(M) - P(H∩M) = 2/3-2/5 = 4/15 Respuesta d: P(H∪M) =: Probabilidad que al menos uno de ellos viva dentro de 25 años. P(H∪M) = P(H) + P(M) - P(H∩M) = 3/5+2/3-2/5 = 13/15 12 Un curso formado por 10 hombres y 20 mujeres, de los cuales la mitad de los hombres tienen ojos negros y la mitad de las mujeres tienen ojos negros. Hallar la probabilidad que una persona escogida al azar sea hombre o tenga ojos negros. Respuesta: NEGROS OTRO COLOR ∑ ♂ : Alumno hombre ♀ : Alumno mujer N : Alumno de ojos negros ♂ ♀ ∑ 5 10 15 5 10 15 10 20 30 P(♂) = : Probabilidad que el alumno sea hombre (10/30) P(♀) = : Probabilidad que el alumno sea mujer (20/30) P(N) = : Probabilidad que el alumno tenga ojos negros (15/30) P(♂∩N) = : Probabilidad que el alumno sea hombre y tenga ojos negros (5/30) Así la probabilidad pedida es: P(♂∪N) = P(♂) + P(N) - P(♂∩N) = 10/30+15/30 –5/30 = 2/3 Se desea determinar la probabilidad de encontrar dos microprocesadores defectuosos al azar dentro de una partida de 15 microprocesadores. Utilizaremos el Teorema de la Probabilidad Condicional (PC1): P(A∩B) P(A / B) = como P(A∩B) = P(B)* P(A / B) P(B) Esto último nos dice que la probabilidad que de dos sucesos, ocurran ambos es el producto de la probabilidad que ocurra uno de los sucesos y la probabilidad que ocurra el otro suceso si el primero ha ocurrido (ocurre o ocurrirá). Así: Sea B =: Encontrar un microchip defectuoso en la partida A / B =: Encontrar el otro microprocesador habiendo encontrado el primero A∩B =: Encontrar ambos microprocesadores en la partida con P(B) = 2/15 y P(A / B) = 1/14 13 En consecuencia: P(A∩B) = 2/15*1/14= 1/105 Ahora veamos la resolución de este problema mediante diagramas de árbol: P(B) P(A / B) 1/14 Acierto 2/15 Acierto 13/14 Error 2/14 Acierto 13/15 Error 12/14 Error Así vemos que la probabilidad de acertar en encontrar los dos microprocesadores fallados en la partida es 2/15*1/14 = 1/105 El circuito de la figura está constituido por 5 dispositivos que funcionan adecuadamente si y sólo si, existe una trayectoria de dispositivos en funcionamiento desde la entrada I hacia la salida O, y cuyas probabilidades de fallar se indican en cada uno de los dispositivos. Suponiendo que los dispositivos fallan de manera independiente. ¿Cuál es la probabilidad que el circuito funcione correctamente?. A 1/100 B 1/100 D 1/10 O I C 1/10 E 1/10 14 Sean: P(XYO) = : Probabilidad que el dispositivo X y el dispositivo Y se encuentren operativos (funcionando). P(XO) = : Probabilidad que el dispositivo X se encuentre operativo. Así: P(ABO) = P(AO ∩ BO) = P(AO)* P(BO) (sucesos independientes) P(ABO) = (1–1/100)*(1–1/100) = (99/100)2 = 0,9801 Por otra parte tenemos: P(ABO ∪ CO) = P(ABO) + P(CO) – P(ABO)* P(CO) P(ABO ∪ CO) = 0,9801+ 0,9 – 0,9801*0,9 P(ABO ∪ CO) = 0,99801 =: P(ABCO) Por otro lado también se tiene: P(DO ∪ EO) = P(DO) + P(EO) – P(DO)* P(EO) P(DO ∪ EO) = 0,9+ 0,9 – 0,9*0,9 =: P(DEO) Así el problema se soluciona si: P(ABCO ∩ DEO) = P(ABCO)* P(DEO) P(ABCO ∩ DEO) = 0,99801*0,99 = 0,9880299 = : P(ABCDEO) Ahora se procederá a resolver el mismo problema usando el diagrama decisional. Del gráfico del circuito se puede apreciar que existen 4 rutas posibles para la salida O a partir de la entrada I; a saber: 15 1. 2. 3. 4. IABDO IABEO I CD O I CE O A 1/100 B 1/100 D 1/10 O I C 1/10 E 1/10 Calculemos la probabilidad que falle el dispositivo A o el dispositivo B: P(AF ∪ BF) = P(AF) + P(BF) – P(AF ∩BF) y como son sucesos independientes P(AF ∪ BF) = P(AF) + P(BF) – P(AF)* P(BF) = 1/100+1/100-1/100*1/100 P(AF ∪ BF) = 0.0199 La probabilidad que no fallen estos dispositivos es: 1– P(AF ∪ BF) = 0,9801 Es decir, la probabilidad de mantenerse operativos es del 0,9801. Con estos datos confecciones el diagrama decisional: P(DF) 0,1 P(EO) 0,9 O P(EF) 0,1 P(AO ∪ BO) 0,9801 P(DO) 0,9 O I P(CF) 0,1 P(AF ∪ BF) 0,0199 P(DO) 0,9 P(CO) 0,9 O P(EF) 0,1 P(DF) 0,1 P(EO) 0,9 O 16 Así vemos que la probabilidad que el circuito funcione a la salida O es: 0,9801*0,1*0,9+0,9801*09+0,0199*0,9*0,9+0,0199*0,9*0,1*0,9=0,9880299. Así con esta configuración existe un casi 99% de probabilidades que el circuito funcione correctamente. En un curso, se presenta un caso de Tifoidea y tres casos de Gripe. Las edades de los alumnos fluctúan entre los 12 y los 15 años. Suponga que para este grupo etario la tasa de incidencia de la Tifoidea es de un 5% y la de Gripe un 8%. Se sabe a priori que ambos sucesos son independientes. Si se selecciona aleatoriamente un alumno del curso, indique cuál es la probabilidad que el alumno seleccionado: a) b) c) d) e) No enferme de Tifoidea No sufra de Gripe Enferme de Gripe y Tifoidea Presente cualquiera de las enfermedades pero no ambas No presente ninguna de las enfermedades Sean los sucesos definidos mediante G y T como: G = contraer la Gripe y T = contraer la Tifoidea con P(G) = 0,08 y P(T) = 0,05 Respuesta a: P( T c ) = 1– P( T ) = 1– 0,05 = 0,95 Respuesta b: P( G c ) = 1– P( G ) = 1– 0,08 = 0,92 Respuesta c: P(G ∩ T) = P( G )*P( T ) = 0,08*0,05 = 0,004 Respuesta d: P(G ∪ T) – P(G ∩ T) = P( G ) + P( T ) – 2P(G ∩ T) = P( G ) + P( T ) – 2P(G )*P( T ) = 0,08 + 0,05 – 2*0,08*0,05 = 0,122 17 Respuesta e: P(G c ∩ T c ) = P( G c)*P( T c) = ( 1– 0,08)*(1– 0,05) = 0,92*0,95 = 0,874 Sean A y B dos características genéticas independientes. La probabilidad que un individuo presente la característica A es 0,5 y la probabilidad que presente la característica B es 0,75. a) ¿Cuál es la probabilidad que un individuo presente ambas características? b) ¿Cuál es la probabilidad que un individuo presente por lo menos una de ellas? c) ¿Cuál es la probabilidad que un individuo no presente ninguna de ellas?. Respuesta a: P(A ∩ B) = ? ; A y B eventos independientes con P(A) = 0,5 y P(B) = 0,75 esto nos dice que A y B son sucesos no excluyentes. Por otro lado, A y B independientes si y sólo si P(A ∩ B) = P(A)* P(B) de modo que P(A ∩ B) = 0,5*0,75 = 0,375 Respuesta b: P(A ∪ B) = ? P(A ∪ B) = P(A) + P(B) – P(A ∩ B) = 0,5 + 0,75 – 0,375 = 0,875 Respuesta c: P([A ∪ B] c) = ? P([A ∪ B] c) = 1– P(A ∪ B) = 1– 0,875= 0,125 18 Teorema de la Probabilidad Total Sea { A } i n una partición de Ω tal que P(A ) > 0 ∀ i = 1, 2, ........, n y sea i i =1 B un suceso tal que P(B) > 0. Entonces: n P(B) = ∑ P(B / A ) · P(A ) i i=1 Partición: {A } i n i =1 ; (PT1) i donde los conjuntos A son mutuamente excluyentes i y de la unión de éstos resulta Ω, en lenguaje matemático: Ω= ∪{ Ai } y A 1 ∩A 2 n i =1 = A 1 =∅; A 2 ∪ A ∪ ......... ∪ A 2 n ∩ A=∅; ........................ ; A n−1 3 Ω A n . . . . . .. . . A 1 B . A 2 A 4 A 3 ∩A n =∅ 19 Teorema de Bayes Sea { A } i n i =1 una partición de Ω tal que P(A ) > 0 ;∀ i = 1, 2, ........, n y sea i B un suceso tal que P(B) > 0. Entonces para cualquier 1 ≤ k ≤ n se tiene: P( B / A ) * P( A ) ; 1≤ k ≤ n ; k k P( A / B) = n k ∑ P( B / A ) * P( A ) i =1 i (TB1) i DISCUSIÓN DEL TEOREMA DE LA PROBABILIDAD TOTAL Y DEL TEOREMA DE BAYES Procedamos a la discusión de estos teoremas a través del ejemplo de las máquinas que producen artículos defectuosos. En efecto, hagamos un partición del espacio muestral Ω, consistente en la producción de tres máquinas con artículos buenos y malos, en tres sucesos que corresponden a la producción de cada máquina individualmente. Cada máquina tiene una producción constituida por artículos buenos y defectuosos (malos). M1 Ω B M2 M3 Así, el Teorema de la Probabilidad Total nos proporciona para el suceso B definido como B: “Producción total de artículos defectuosos”, la probabilidad 20 P(B) de producir artículos defectuosos o malos. Esta se calcula como lo estipula la expresión PT1, es decir: 3 P( B) = ∑ P( B / M ) * P( M ) i =1 i donde P(B/Mi) es la probabilidad de que i el artículo defectuoso provenga de la máquina iésima y donde P(Mi) es la probabilidad de producción de artículos de la máquina iésima (buenos y defectuosos). En cambio el Teorema de Bayes responde a la contingencia que presenta la siguiente situación: Si al escoger aleatoriamente un artículo de la producción conjunta o total de las máquinas se obtuvo un artículo defectuoso, nace la pregunta ¿Cuál es la probabilidad que el artículo defectuoso obtenido provenga o lo haya fabricado una máquina determinada, digamos, la k-ésima máquina? Esta pregunta la responde el Teorema de Bayes calculándola como: P( B / M ) * P( M ) k k P( M / B) = 3 k ∑ P( B / M ) * P( M ) i =1 i ; 1≤k ≤ 3 i EJEMPLO: En una industria hay tres máquinas que fabrican el mismo artículo, y su producción diaria está detallada en el siguiente cuadro: Máquina 1 2 3 ∑ Artículos Artículos Producción defectuosos buenos total 5 195 200 4 246 250 6 144 150 15 585 600 21 a) Si de la producción total diaria se escoge un artículo al azar, ¿Cuál es la probabilidad que el artículo resulte defectuoso? b) Si al extraer un artículo de la producción total diaria, éste resultó defectuoso; ¿cuál es la probabilidad que este artículo haya sido fabricado por la máquina número 2 específicamente?. La respuesta a estas preguntas las entregan los teoremas discutidos anteriormente. Así para responderlas calcularemos las probabilidades necesarias y las presentaremos en la siguiente tabla: Máquina 1 2 3 Probab. Art. Defec. Probab. Art. Defec. fabricado por máquina i producción total 5/200 200/600 4/250 250/600 6/150 150/600 Respuesta a) El Teorema de la Probabilidad Total nos entrega la respuesta, Así la probabilidad que el artículo seleccionado resulte defectuoso es: 3 P( B) = ∑ P( B / M ) * P( M ) = i =1 i i 5 200 4 250 6 150 * + * + * 200 600 250 600 150 600 = 5 4 6 + + 600 600 600 = 0,025 = 15 600 = 1 40 22 Respuesta b) La respuesta nos la entrega el Teorema de Bayes. Así esta probabilidad es: P(B/ M )*P(M ) 4 250 * 2 2 250 600 = 4 = 0,2 6 P(M / B) = 3 = 1 15 2 P ( B / M ) * P ( M ) ∑ 40 i=1 i i Ahora se verá cómo resolver el mismo problema, pero usando la técnica de los diagramas decisionales o de árbol: Máquina i 1 2 3 % Producción Máquina i 200 600 250 600 150 600 % Calidad Máquina i (Defectuosos y Buenos) 5 ( D) 200 195 200 (B) 4 ( D) 250 246 ( B ) 250 6 ( D) 150 144 ( B ) 150 23 Directamente del diagrama podemos calcular la probabilidad que el artículo resulte defectuoso: P(Artículo Defectuoso) = 200 5 250 4 150 6 1 * + * + * = 600 200 600 250 600 150 40 Y la probabilidad que el artículo resulte bueno es: P(Artículo Bueno) = 200 195 250 246 150 144 39 * + * + * = 600 200 600 250 600 150 40 También la probabilidad que un artículo resulte ser defectuoso y haya sido fabricado por la máquina número 3 es: 150 6 * 2 P(M3/Defectuoso) = 600 150 = = 0,4 1 5 40 Veamos otros ejemplos de las aplicaciones de estos teoremas: Una empresa ha decidido ensayar un nuevo Test de Selección de Personal. La experiencia ha demostrado que sólo el 60% de los candidatos son adecuados para algún puesto de trabajo. De entre todas las personas que resultaron adecuadas para el cargo, sólo el 80% aprobó satisfactoriamente el Test de Selección, mientras que sólo el 40% de aquellas que no resultaron adecuadas aprobó dicho test. c) ¿Cuál es la probabilidad que una persona cualquiera apruebe el test? d) Si se utiliza el Test de Selección y se contrata solamente a las personas que lo aprueban, ¿Cuál resulta ser la probabilidad que una persona que aprueba el Test de Selección resulte adecuada para el cargo? 24 Sin Test de Selección Adecuado 60% Con Test de Selección Aprueba Test 80% Reprueba Test 20% Aprueba Test 40% Reprueba Test 60% 1 Inadecuado 40% P(a) = 0,6 * 0,8 + 0,4 * 0,4 = 0,64 es la probabilidad que una persona cualquiera apruebe el Test de Selección. 0 , 6 * 0 ,8 = 0,75 es la probabilidad que una persona que aprueba el Test 0 , 64 de Selección resulte adecuada para el cargo. P(b) = Se desea ir al centro de la ciudad y llegar antes de las 18:00 hrs. Se sabe que: Si se toma un taxi la probabilidad de llegar a tiempo es 0,8 Por otro medio de locomoción la probabilidad de llegar a tiempo es 0,4 La probabilidad de tomar un taxi es 0,3 a) ¿Cuál es la probabilidad de llegar al centro de la ciudad antes de las 18:00 hrs.? b) ¿Cuál es la probabilidad de llegar al centro de la ciudad después de las 18:00 hrs. Si no se recurre al taxi? TX OML AT T Taxi Otro medio de locomoción A tiempo (Antes de las 18:00 hrs.) Tarde (Después de las 18:00 hrs.) AT 0,8 TX 0,3 T 0,2 AT 0,4 OML 0,7 T 0.6 P(a) = 0,3 * 0,8 + 0,7 * 0,4 = 0,52 es la probabilidad de llegar al centro de la ciudad antes de las 18:00 hrs. 1 Los valores subrayados corresponden a los datos entregados por el enunciado del problema 25 P(b) = 0,7*0,6 = 0,875 es la probabilidad de llegar atrasado al 0,3*0, 2 + 0,7*0,6 centro de la ciudad si no se recurre al taxi. Un inversionista planea comprar una importante cantidad de acciones de una empresa. La cotización de las acciones de la empresa en la Bolsa durante los seis meses anteriores resulta de sumo interés para el inversionista. Con base a ese período, se observa que la cotización que afecta a las acciones se relaciona con el Producto Nacional Bruto (PNB) del país, observando que: Si el PNB sube, la probabilidad que el valor de la acción de la empresa suba es 0,8 Si el PNB se mantiene sin variación, la probabilidad que el valor de la acción suba de precio es 0,2 Si el PNB cae, la probabilidad que el valor de la acción incremente su precio es 0,1 Si para los siguientes 6 meses, los estudios estadísticos asignan las probabilidades de 0,4; 0,3 y 0,3 a los sucesos: alza del PNB; PNB sin variación y baja del PNB respectivamente. a) Determinar la probabilidad que el valor de la acción suba durante los próximos 6 meses. PNB A SV B VA SP DP Producto Nacional Bruto Alza Sin Variación Baja Valorización de las Acciones Subida del Precio Disminución del Precio PNB VA SP 0,8 A 0,4 DP 0,2 SP 0,2 SV 0,3 DP 0,8 SP 0,1 B 0,3 DP 0,9 P(a) = 0,4 * 0,8 + 0,3 * 0,2 + 0,3 * 0,1 = 0,41 es la probabilidad que la acción de la empresa suba de precio durante los próximos seis meses. 26 Para detectar el cáncer se ha desarrollado un examen que parece prometedor. Las estadísticas indican que el 98% de los pacientes con cáncer de un hospital reaccionaron positivamente a la prueba, mientras que solamente el 3% de los pacientes del hospital tienen cáncer. También se registró que sólo el 4% de aquellos pacientes que no tienen cáncer reaccionaron positivamente a la prueba. En base a estas estadísticas: a) ¿cuál es la probabilidad que un paciente elegido aleatoriamente y que reacciona positivamente a la prueba tenga realmente cáncer? Tipo de Paciente Reacción al Examen ( + ) 0,98 Con Cáncer 0,03 ( - ) 0,02 ( + ) 0,04 Sin Cáncer 0,97 P(a) = ( - ) 0,96 0,03*0,98 = 0,431 0,03*0,98+ 0,97*0,04 Se le pregunta a un Consultor en Recursos Humanos sobre su opinión en relación a si la secretaria insatisfecha de un ejecutivo de gerencia ha renunciado a su puesto sobre todo porque no le gustaba su trabajo, porque le parecía que se le remuneraba mal, o simplemente porque no le agradaba su jefe. Sin poder obtener ninguna información directa de la secretaria, toma los siguientes datos de un estudio a gran escala sobre la moral y motivación en las empresas: Entre todas las secretarias insatisfechas, el 20% lo están principalmente porque les disgusta el trabajo; el 50% se sienten mal pagadas, y al 30% no les agrada su jefe. Además las probabilidades que renuncien son, respectivamente: 0,6; 04 y 0,9. 27 Renuncia 0,6 No le gusta el trabajo 0,2 Continúa 0,4 Renuncia 0,4 Remuneración insuficiente 0,5 Continúa 0,6 Renuncia 0,9 Le disgusta el Jefe 0,3 Continúa 0,1 La probabilidad que una secretaria renuncie está dada por el Teorema de la Probabilidad Total y es: 0,2 * 0,6 + 0,5 * 0,4 + 0,3 * 0,9 = 0,59 La probabilidad que una secretaria renuncie debido a que no le gustó su trabajo está dada por el Teorema de Bayes y vale: La probabilidad que una secretaria renuncie debido a que se considera mal remunerada es: 0, 2*0,6 = 0,203 0,59 0,5*0, 4 = 0,339 0,59 La probabilidad que una secretaria renuncie debido a que no le agradó su jefe es: 0,3*0,9 = 0,458 0,59 Así la mejor respuesta que puede dar el Consultor, es que lo más probable es que la secretaria renunció principalmente porque le desagradó el jefe para el cual tenía que trabajar (45,8 %). También podemos inferir, que la estabilidad laboral para las secretarias es relativamente baja, debido a que la probabilidad que una secretaria continúe trabajando es del 41 %, que no es otro que el valor dado por la probabilidad del suceso contrario, es decir: 0,41 = 1- 0,59. 28 La probabilidad que un accidente de aviación sea debido a defectos estructurales se diagnostica correctamente en el 72 % de los casos, y la probabilidad que un accidente de aviación que no se deba a defectos estructurales se diagnostica erróneamente como debido a fallas estructurales es de un 12 %. Si el 40 % de los accidentes de aviación se deben a defectos estructurales, ¿Cuál es la probabilidad que un accidente de aviación que se ha diagnosticado como debido a defectos estructurales se deba realmente a esta causa? Causas del Accidente Aéreo Diagnóstico Correcto 72% Defectos estructurales 40% Erróneo 28% Correcto 88% Otras causas 60% Erróneo 12% Así, la probabilidad que un accidente aéreo que se ha diagnosticado como debido a defectos estructurales, se deba realmente a esa causa es: 0, 4*0,72 = 0,353 0, 4*0,72+ 0,6*0,88 La compañía RCR está considerando comercializar un nuevo tipo de teléfono móvil, cuya principal característica es permitir la marcación mental del número deseado. Las investigaciones de mercado dicen que la probabilidad que éste tenga éxito es de 0,4 siempre que la única firma competidora, la compañía CLV, no introduzca al mercado un tipo similar de teléfono móvil. RCR ha estimado en 0,3 la probabilidad que CLV introduzca al mercado el teléfono móvil alternativo, además de estimar en 0,548 la probabilidad que el teléfono RCR no tenga éxito. Si el teléfono RCR tuvo éxito, ¿cuál es la probabilidad que CLV haya introducido al mercado su nuevo tipo de teléfono móvil? Éxito RCR 0,7 Fracaso 0,6 Éxito CLV 0,3 0,4 0,452 Fracaso 0,548 29 Así, la probabilidad que CLV haya lanzado su teléfono móvil de marcación mental, dado que el de RCR tuvo éxito es: 0,3*0, 452 = 0,326 0,3*0, 452+ 0,7*0, 4 Una urna contiene 3 bolas blancas y 5 bolas negras. Se extrae una bola al azar y se la separa. Luego se extrae otra bola; ¿Cuál es la probabilidad que esta segunda bola sea blanca?. Primera extracción Segunda extracción Blanca 2 / 7 Blanca 3 / 8 Negra 5/7 Blanca 3 / 7 Negra 5/8 Negra La probabilidad que esta segunda bola sea negra es: 4/7 3 2 5 3 3 * + * = = 0,375 8 7 8 7 8 La siguiente figura explica la forma de asignar las probabilidades al diagrama decisional: B B N N B B B B N N N N N B B B N N N N N N N N 30 Un hombre va de pesca por primera vez, disponiendo de tres tipos de carnadas, de las cuales sólo una es inadecuada para la clase de peces que pretende capturar. La probabilidad de capturar un pez usando la carnada apropiada es 1/3. La probabilidad de capturar un pez usando la carnada inapropiada es 1/5. a) ¿Cuál es la probabilidad de pescar un pez? b) Dado que el pescador logró atrapar un pez, ¿cuál es la probabilidad que haya utilizado el tipo correcto de carnada? Tipo de Carnada ( Ci ) Resultado Acierto 1/3 C1 (Apropiada) 1/3 Falla 2/3 Acierto 1/3 C2 (Apropiada) 1/3 Falla 2/3 Acierto 1/5 C3 (Inapropiada) 1/3 Falla 4/5 Asignamos probabilidades de 1/3 al hecho de elegir uno de los tres tipos de carnada por tratarse de un novato que sale de pesca por primera vez. El desconocimiento de la carnada por usar hace que el hecho de utilizar un tipo de carnada cualquiera sea un suceso equiprobable. Así, la respuesta a la pregunta a) es: P(a) = 1 1 1 1 1 1 * + * + * 3 3 3 3 3 5 = 13 45 = 0,2 8 La respuesta a la pregunta b) la podemos obtener, calculando la probabilidad de ocurrencia del suceso contrario, es decir, dado que ha logrado pescar un pez, la probabilidad que lo haya hecho usando la carnada inapropiada es: 31 1 1 * 3 5 13 45 = 3 13 ⇒ P(b) = 1 - 3 10 = ≈ 0,769 13 13 También se puede contestar esta pregunta fijándose directamente en el diagrama y notando que la probabilidad pedida es: P(b) = 1 1 1 1 * + * 3 3 3 3 13 45 1 1 2* * 3 3 = 13 45 = 10 13 , puesto que según el diagrama y usando la notación de los teoremas de la Probabilidad Total y de Bayes: P(C1 / B) = P(C2 / B) = C1 1 1 * 3 3 13 45 siendo B el suceso de atrapar un pez. Ω B C2 Mono explicatorio C3 Con Ω = {C1, C2, C3} donde Ci es el suceso “ usar la carnada i” y B el suceso “atrapar un pez”, con P(Ci) = 1/3 ; i = 1, 2, 3 y C3 representan el suceso de usar la carnada inapropiada. Además P(B / C3) = 1/5 y P(B / C1) = P(B / C2) = 1/3 donde: P(B) = P(B / C1) * P(C1) + P(B / C2) * P(C2) + P(B / C3) * P(C3) = 13 / 45 32 En una determinada población las autoridades de Salud han detectado una enfermedad muy grave (A), cuyo síntoma más importante es X, pero este síntoma también se presenta en personas que padecen una enfermedad no tan grave (B) e incluso, en personas que no padecen nada serio (C). El síntoma X se presenta en el 99% de los que padecen la enfermedad A, en el 50% de los que padecen la enfermedad B y en el 0,4% de los que no tienen nada serio. Examinando a un individuo de dicha población que presenta el síntoma X, se pretende conocer la probabilidad que tenga la enfermedad A, sabiendo que el 2% tiene esa enfermedad A, el 0,5% la enfermedad B y el 97,5% no tienen nada serio. Enfermedad Sintomatología X 99% A 2% ~X 1% X 50% B 0,5% ~X 50% X 0,4% C 97,5% ~X 99,6% Nota: ~X representa la aparición de otros síntomas diferentes del cuadro sintomático X Así lo que se pide, la probabilidad que un individuo tenga la enfermedad A habiendo presentado el síntoma X es: 0,02*0,99 ≈ 0,756 0,02*0,99+ 0,005*0,5+ 0,975*0,004 Esto quiere decir que algo más de las 3/4 partes de la población que presenta el síntoma X ha contraído la enfermedad A de alta gravedad. Es importante destacar, que la probabilidad que un individuo presente la sintomatología X es de 0,02*0,99+0,005*0,5+0,975*0,004 = 0,0262. Esto significa que sólo un poco más de la cuarta parte de la población presenta el síntoma X. 33 La probabilidad que una cervecería decida patrocinar la televisación de un torneo de fútbol en un determinado país de América del Sur, es de un 50%, la transmisión de una telenovela es de un 30% y la transmisión de una ópera es un 20%. Si la cervecería se decide por el fútbol, la probabilidad de obtener más de 40 puntos de sintonía es del 60%, si se decide por la telenovela, alcanza un 45% y si se decide por la ópera, un 18%. Si resultó un bajo nivel de sintonía. ¿Cuál es la probabilidad que la cervecería haya decidido auspiciar la ópera?. Programa Nivel de Sintonía Alto Fútbol 50% Bajo 40% Alto Novela 30% Opera 20% 60% 45% Bajo 55% Alto 18% Bajo 82% Del diagrama tenemos que la probabilidad pedida es: 0, 2*0,82 ≈ 0,31 0, 2*0,82+ 0,3*0,55+ 0,5*0, 4 Crítica optativa Un análisis más a fondo del problema nos indica que la calidad de la televisión de ese país de América del Sur parece no ser muy buena, puesto que un simple cálculo de la probabilidad de obtener bajas tasas de sintonía alcanza al 52,9%. El valor agregado de usar los diagramas de decisión consiste en obtener toda la información relativa al problema, que del modo tradicional no se clarificaría de manera inmediata. 34 De tres cajas PortaCDs idénticas una contiene dos CDs musicales de moda (CD In) y otro pasado de moda (CD Out), una segunda caja contiene un CD de moda y un CD pasado de moda, y la tercera contiene dos CDs pasados de moda. Todos los CDs fueron grabados en forma pirata, y ninguno posee etiquetas de identificación. Tras tomar una de las cajas al azar, un empleado toma al azar un CD de la misma. Si este CD resultó ser uno de moda, ¿Cuál es la probabilidad que el otro CD tomado de la misma caja sea también un CD de moda? CDIN CD de moda CDOUT CD pasado de moda Caja PortaCD i (i = 1, 2, 3 ) Ci Ci C1 C2 C3 CDIN CDIN CDOUT CDIN CDOUT CDOUT 1° Elección CDIN 2° Elección CDIN (1/1) (2/2) CDOUT (0/1) C1 (1/3) CDIN (0/1) CDOUT (0/2) CDOUT (0/1) CDIN CDIN (0/1) (1/2) CDOUT (1/1) C2 (1/3) CDIN (1/1) CDOUT (1/2) CDOUT (0/1) CDIN CDIN (0/1) (0/2) CDOUT (1/1) C3 (1/3) CDIN (0/1) CDOUT (2/2) CDOUT (1/1) Así la probabilidad solicitada es: 1/ 3*2 / 2*1/ 1 = 2/3 1/ 3*2 / 2*1/ 1+1/ 3*0 / 2*0 / 1+1/ 3*1/ 2*0 / 1+1/ 3*1/ 2*1/ 1+1/ 3*0 / 2*0 / 1+1/ 3*2 / 2*0 / 1 35 Resumen Teoremas de la Probabilidad Total y de Bayes En las páginas 11 y 12 vimos que el cálculo de las probabilidades condicionales requiere del Teorema de la Probabilidad Total y del Teorema de Bayes, una partición finita del espacio muestral Ω y un suceso B. Así la Probabilidad Total de ocurrencia del suceso B está dada por: ∑ n P(B) = P(B / A ) · P(A ) i i=1 ; i (PT1) P(B) = P(B/A1)*P(A1) + P(B/A2)*P(A2) +. . . . . + P(B/An)*P(An) Ω . A . . . . . n . A 1 B . . A 2 A 3 A 4 36 P(B / A ) * P( A ) P(A / B) = k (TB1) k ∑ ; k 1≤ k ≤ n n P(B / A ) * P( A ) i i i =1 La representación en diagramas de árbol para estos teoremas queda como: P(A1) P(A2) P(A3) A1 P(B/A1) A2 P(B/A2) A3 P(B/A3) Ak P(B/Ak) An P(B/An) B B B ▪ ▪ ▪ P(Ak) B ▪ ▪ ▪ P(An) B ; 37 Ejemplos de distribuciones de probabilidades equiprobables y no equiprobables Sea una moneda “cargada”, donde la probabilidad que al lanzarla resulte cara es 2/3 y que salga sello es 1/3. ¿Cuál es la probabilidad que al lanzarla 3 veces seguidas, resulten 3, 2, 1 y 0 caras? Obtener el diagrama de la distribución de probabilidades, y comparar la situación con el diagrama de probabilidades de una moneda “buena”. L1 2/3 C 1/3 2/3 1/3 2/3 S 1/3 □ ♪ ♫ ■ L2 2/3 C 1/3 L3 C Ω (C,C,C) Conteo ■ S (C,C,S) ♫ 2/3 S 1/3 C (C,S,C) ♫ S (C,S,S) ♪ 2/3 C 1/3 C (S,C,C) ♫ S (S,C,S) ♪ 2/3 S 1/3 C (S,S,C) ♪ S (S,S,S) □ P(i) Resultado P(0) P(1) P(2) P(3) ∑P(i) 1/3*1/3*1/3 2/3*/1/3*1/3+1/3*2/3*1/3+1/3*1/3*2/3 2/3*/2/3*1/3+2/3*1/3*2/3+1/3*2/3*2/3 2/3*2/3*2/3 1 Se puede realizar mediante el tratamiento hasta ahora visto, pero nuestro objetivo es ilustrar la distribución binomial de probabilidad. La probabilidad que en una variable aleatoria X se tengan k aciertos en n pruebas repetidas con probabilidad de acierto q y de falla 1-q está dada por: n−k k n −k ⎛ n⎞ k n! P( X = x) = P( x = k ) = ⎜ ⎟q × (1 − q) = q × (1 − q) (n − k )!×k! ⎝k ⎠ Si n = 1, la distribución binomial recibe el nombre de distribución de Bernoulli 38 Así para estos casos se tiene, n = 3, q = 2/3, 1- q = 1/3, para k = 0, 1, 2 y 3 ⎛ 3 ⎞⎡2 ⎤k P (k ) = ⎜ ⎟⎢ ⎥ ⎝ k ⎠⎣3 ⎦ ⎛ 3 ⎞⎡ 2 ⎤0 P (0 ) = ⎜ ⎟ ⎢ ⎥ ⎝ 0 ⎠⎣ 3 ⎦ ⎛ 3 ⎞ ⎡ 2 ⎤1 P (1 ) = ⎜ ⎟ ⎢ ⎥ ⎝ 1 ⎠⎣ 3 ⎦ ⎛ 3 ⎞⎡2 ⎤2 P (2) = ⎜ ⎟⎢ ⎥ ⎝ 2 ⎠⎣3 ⎦ ⎛ 3 ⎞⎡ 2 ⎤3 P (3 ) = ⎜ ⎟ ⎢ ⎥ ⎝ 3 ⎠⎣ 3 ⎦ Probabilidad ⎡1 ⎤ × ⎢ ⎥ ⎣3⎦ 3− k ⎡1 ⎤ × ⎢ ⎥ ⎣3 ⎦ ⎡1 ⎤ × ⎢ ⎥ ⎣3 ⎦ ⎡1 ⎤ × ⎢ ⎥ ⎣3⎦ = 3− 0 3−1 3− 2 = = = 3! ⎡2 ⎤ ( 3 − k )! × k ! ⎢⎣ 3 ⎥⎦ k ⎡1 ⎤ × ⎢ ⎥ ⎣3⎦ 3! ⎡ 2 ⎤ 3 !× 0 ! ⎢⎣ 3 ⎥⎦ 0 ⎡1 ⎤ × ⎢ ⎥ ⎣3 ⎦ 3 3! ⎡ 2 ⎤ 2 !× 1 ! ⎢⎣ 3 ⎥⎦ 1 ⎡1 ⎤ × ⎢ ⎥ ⎣3 ⎦ 2 3! ⎡ 2 ⎤ 1 !× 2 ! ⎢⎣ 3 ⎥⎦ 2 ⎡1 ⎤ × ⎢ ⎥ ⎣3⎦ 1 = 3− k = 1 27 = 6 27 = = 4 9 12 27 2 9 3− 3 0 3! ⎡ 2 ⎤ 3 8 ⎡1 ⎤ ⎡1 ⎤ × ⎢ ⎥ = × = ⎢ ⎥ ⎢ ⎥ 0 !× 3 ! ⎣ 3 ⎦ 27 ⎣3 ⎦ ⎣3 ⎦ Distribución de Probabilidad Binomial No Equiprobable (Moneda cargada) 1/2 4/9 9/20 2/5 7/20 8/27 3/10 1/4 2/9 1/5 3/20 1/10 1/20 1/27 0 0 1 2 3 X 39 Ahora veamos el caso de una moneda buena para el caso de 3 lanzamientos se tiene lo siguiente: L1 1/2 C 1/2 1/2 1/2 1/2 S 1/2 L2 1/2 C 1/2 L3 C Ω (C,C,C) Conteo ■ S (C,C,S) ♫ 1/2 S 1/2 C (C,S,C) ♫ S (C,S,S) ♪ 1/2 C 1/2 C (S,C,C) ♫ S (S,C,S) ♪ 1/2 S 1/2 C (S,S,C) ♪ S (S,S,S) □ □ ♪ ♫ ■ P(i) Resultado P(0) P(1) P(2) P(3) ∑P(i) 1/2*1/2*1/2 1/2*/1/2*1/2+1/2*1/2*1/2+1/2*1/2*1/2 1/2*/1/2*1/2+1/2*1/2*1/2+1/2*1/2*1/2 1/2*1/2*1/2 1 Así para estos casos se tiene, n = 3, q = 1/2, 1- q = 1/2, para k = 0, 1, 2 y 3 3− k 3 ⎛ 3 ⎞⎡ 1 ⎤ k 3! ⎡ 1 ⎤ ⎡ 1 ⎤ P (k ) = ⎜ = × ⎢ ⎥ ⎟⎢ ⎥ ( 3 − k )! × k ! ⎢⎣ 2 ⎥⎦ ⎣ 2 ⎦ ⎝ k ⎠⎣ 2 ⎦ 3 3 ⎛ ⎞⎡1 ⎤ 1 = P (0 ) = ⎜ ⎟ ⎢ ⎥ 8 ⎝ 0 ⎠⎣ 2 ⎦ 3 ⎛ 3 ⎞⎡ 1 ⎤ 3 = P (1 ) = ⎜ ⎟ ⎢ ⎥ 8 ⎝ 1 ⎠⎣ 2 ⎦ 3 ⎛ 3 ⎞⎡ 1 ⎤ 3 P (2 ) = ⎜ = ⎟⎢ ⎥ 8 ⎝ 2 ⎠⎣ 2 ⎦ ⎛ 3 ⎞⎡ 1 ⎤3 1 = P (3 ) = ⎜ ⎟ ⎢ ⎥ 8 ⎝ 3 ⎠⎣ 2 ⎦ Probabilidad Distribución de Probabilidad Binomial Equiprobable (Moneda buena) 3/8 2/5 3/8 7/20 3/10 1/4 1/5 3/20 1/8 1/8 1/10 1/20 0 0 1 2 3 X 40 Comentario: Obsérvese que en el caso de la moneda cargada el suceso más probable es que resulten dos caras seguidas en tres lanzamientos (4/9), en comparación con la moneda buena en que lo más probable es que resulte una cara o dos caras seguidas en los tres lanzamientos (3/8). Hallar la probabilidad que un trabajador opere, de una manera adecuada, una nueva maquinaria en la i-ésima oportunidad de manejarla. Es razonable suponer que P(F). La probabilidad que el trabajador no la maneje correctamente (Falla) al i -ésimo intento esté dada por: P ( F ) = 1 i ∧ P (O ) = ∀ i = 1 , 2 , 3 ,...... i + 1 i + 1 donde P(O) es la probabilidad que la máquina sea operada correctamente al i-ésimo intento. Para ilustrar esto, hállese la probabilidad que el operario maneje correctamente la máquina durante tres veces en cuatro intentos. I2 I1 I3 I4 Ω Conteo 4/5 O OOOO 1/5 F OOOF * 4/5 O OOFO * 1/5 F OOFF 4/5 O OFOO 1/5 F OFOF 4/5 O OFFO O 3/4 O 1/4 2/3 F O 1/3 3/4 * O F 1/2 1/4 F 1/2 3/4 1/5 F OFFF 4/5 O FOOO O 1/5 F FOOF 4/5 O FOFO 1/5 F FOFF 4/5 O FFOO 1/5 F FFOF 4/5 O FFFO 1/5 F FFFF * P(Suceso) Operatoria Resultado P(OOOF) 1/2*2/3*3/4*1/5 P(OOFO) 1/2*2/3*1/4*4/5 P(OFOO) 1/2*1/3*3/4*4/5 1/20 1/15 1/10 1/5 5/12 P(FOOO) 1/2*2/3*3/4/4/5 P(X=3) 1/20+1/15+1/10+1/5 O 2/3 1/4 F F 1/3 3/4 O F 1/4 F Donde la variable X representa el número de veces en que se opera correctamente la máquina en 4 intentos. 41 Obsérvese que el espacio muestral Ω no es equiprobable, y P(F) no es constante, en consecuencia no se trata de una distribución binomial de probabilidades. X 0 1 2 3 4 Σ P(X) 1/120 1/12 7/24 5/12 1/5 1 Explicación P(FFFF) P(FFFO) + P(FFOF) + P(FOFF) + P(OFFF) P(OOFF) + P(OFOF) + P(OFFO) + P(FOOF) + P(FOFO) + P(FFOO) P(FOOO) + P(OFOO) + P(OOFO) + P(OOOF) P(OOOO) P(0) + P1) + P(2) + P(3) + P(4) De la tabla de distribución de probabilidades y su gráfica se puede ver que lo más probable es que el operador maneje la maquinaria correctamente tres veces en 4 intentos (5/12, para una distribución en que la probabilidad de operar incorrectamente la maquinaria es inversamente proporcional al número de intentos) Distribución de Probabilidad No Binomial Probabilidad 9/20 5/12 2/5 7/20 7/24 3/10 1/4 1/5 1/5 3/20 1/12 1/10 1/20 1/120 0 0 1 2 3 4 [ X ] N° de operaciones correctas en 4 intentos 42 El Servicio Nacional de Pesca y Caza, desea estimar el número N correspondiente a la población de peces en un río (el cual tiene una forma irregular y es de longitudes desconocidas) de tal forma que un estadístico es contratado para realizar tal trabajo operando de la siguiente forma: 1. Se contrata a un número adecuado y suficiente de pescadores para que hagan una pesca grande y que cada uno de los peces pescados sean marcados y devueltos al agua. En total se marcaron M peces. 2. Luego los mismos pescadores hacen una segunda pesca, obteniendo n peces, de los cuales hay m marcados. Determinar cuál es la idea del estadístico para determinar la estimación del número N de la población de peces y calcular tal estimación. Comentar el método usado, en términos de eficacia. La probabilidad de capturar un pez marcado al realizar la segunda pesca es: i) m n Por otra parte, la probabilidad de capturar un pez marcado tomando como espacio muestral la población total N de peces está dada por: ii) M N Así, igualando ambas probabilidades, puesto que según los conocimientos del estadístico, deberían ser iguales: M m = N n de donde se obtiene para el número N de la población: iii) N= M m n Se ve que la idea del estadístico es sencilla, pero en términos de eficacia, sería mucho más eficiente repetir la experiencia de las etapas 1° y 2° un número k de veces -por ejemplo, k = 15- para así obtener los valores medios de M y de la probabilidad m/n y expresar el número N como el cuociente entre los 43 promedios anteriormente mencionados con el objetivo que las dispersiones sean mínimas, es decir: iv) N= M m n 44 Unidades estándar Supóngase que en un curso de diez alumnos se tienen las notas finales de los ramos de Estadísticas y Contabilidad que a continuación se detallan: Estadísticas Contabilidad Alumno Nota Alumno Nota 1 5,60 1 4,80 2 6,40 2 6,40 3 4,50 3 3,60 4 6,80 4 3,80 5 3,50 5 6,40 6 4,60 6 5,20 7 5,60 7 5,60 8 6,80 8 4,20 9 5,40 9 4,00 10 4,40 10 3,50 Promedio 5,36 Promedio 4,75 Desv. Típica 1,05 Desv. Típica 1,05 Se ve que el alumno 2 tiene igual promedio en ambas asignaturas (6,40). Entonces surge de manera natural la pregunta: ¿En qué asignatura le fue mejor a este alumno? Para responder a esta interrogante, se recurre a la herramienta del puntaje estándar zi. Este puntaje estándar se define como: x − μ = Z i i σ donde xi es el valor i-ésimo de la variable x μ el promedio de la variable x σx la desviación típica de la variable X x Así para el alumno 2 se tiene que los puntajes estandarizados obtenidos en estadísticas y contabilidad son: Z Z 2 Est 2 Cont = 6 , 40 − 5 , 36 1 , 05 = 6 , 40 − 4 , 75 = 1 , 57 1 , 05 = 0 , 99 Ahora podemos comparar ambos puntajes estandarizados: 45 Como Z2Cont > Z2Est entonces la nota 6,40 obtenida por el alumno 2 en contabilidad es mejor que el 6,40 que obtuvo en estadísticas. Nota: Los puntajes estandarizados, por tratarse de números reales, son mejores mientras más a la derecha se ubiquen en la recta numérica de los reales. Un psicólogo, con motivo de un estudio académico, fue sometido a tres diferentes tests. Los resultados de los puntajes obtenidos, junto con las medias y sus desviaciones típicas son: Test 1 2 3 D48 Zulliger PMA Resultado 96 88 110 Media 95 90 100 Desv. Típica 2 10 11 ¿En cuál de estos tests el psicólogo tuvo mejor desempeño? Al calcular los puntajes estandarizados se obtiene: 96 − 95 = 0 ,5 2 1 88 − 90 Z = = − 0 ,2 10 2 110 − 100 Z = = 0 ,9 11 3 Z = Así se puede apreciar que el psicólogo se desempeñó mejor en el test PMA con un Z3 de 0,9, luego su segundo mejor desempeño lo obtuvo en el D48, con un Z1 de 0,5 y finalmente su mínimo rendimiento lo obtuvo en el test de Zulliger donde obtuvo un Z2 de –0,2. 46 Funciones de cuantía y distribuciones de probabilidad Dada la siguiente función de cuantía, donde x representa el número de goles marcados en determinados partidos: 0 1/p x p(x) 1 1/p 2 4/p 3 5/p 4 3/p 5 2/p 6 1/p 7 1/p a) Calcular el valor p, y graficar la distribución de probabilidades. b) Calcular la probabilidad que en un partido cualquiera se marquen más de tres goles. c) Calcular E(x) y V(x) e interpretar Respuesta a) Como 7 ∑ p(x) = 1 x= 0 entonces 1 = 1/p + 1/p + 4/p + 5/p + 3/p + 2/p + 1/p + 1/p y así 18/p = 1, en consecuencia p = 18 Así la tabla de la función cuantía resulta: 0 1/18 x p(x) 1 1/18 2 4/18 3 5/18 4 3/18 5 2/18 6 1/18 7 1/18 Distribución de Probabilidad Probabilidad 5/18 3/10 1/4 2/9 1/5 1/6 3/20 1/10 1/9 1/18 1/18 0 1 1/18 1/18 6 7 1/20 0 2 3 4 5 x [ N° goles marcados ] 47 Respuesta b) P(X ≥ 3) = P(3) + P(4) + P(5) + P(6) + P(7) = 5/18+1/6+1/9+1/18+1/18 = 2/3 Respuesta c) La esperanza matemática, o el valor esperado del número de goles, E(X), es: 7 E( X ) = ∑ xp ( x ) = 0 × 118 + 1 × 118 + 2 × 2 9 + 3 × 518 + 4 × 1 6 + 5 × 19 + 6 × 118 + 7 × 118 = 59 18 = 3 518 x =0 La varianza V(X) está dada por: 7 V( X ) = ∑ 2 2 2 2 2 2 2 2 2 2 ( )2 x p(x) − E (X) = 0 × 118+1 × 118+ 2 × 29 + 3 × 518+ 4 × 16 + 5 × 19 + 6 × 118+ 7 × 118− 59 18 x=0 V ( X ) = 2 281 324 = 929 ⇒ σ = 324 X V (X ) = 929 324 ≅ 1 , 693305 La interpretación de esto es que el verdadero valor de la esperanza de X (con un 66,7 % de probabilidad de ser así) se encuentra entre los valores: [ E(X) - σX , E(X) + σX ] es decir: 1,58447 ≤ E(X) ≤ 4,97108, se puede interpretar con el mismo rango de probabilidad que el promedio de goles por partido varía entre 2 y 4 tantos. Se tiene la información gráfica de las ventas de combustible de una estación de servicio durante un período semanal entre miércoles y miércoles, en miles de litros. a) Encontrar el valor del parámetro k para que f(x) sea una función de distribución de probabilidad (fdp) b) Definir la fdp c) Calcular la probabilidad que la venta semanal haya sido a lo menos de 1.500 l. d) La probabilidad de vender exactamente 1.500 l. f(x) k x 0 1 2 3 48 Respuesta a) Del gráfico se tiene para f(x): kx ∀ x ∈ [0 ,1 [ ⎫ ⎧ ⎪ ⎪ ∀ x ∈ [1 , 2 [ ⎬ f (x) = ⎨ k ⎪ − kx + 3 k ∀ x ∈ [2 , 3 ]⎪ ⎩ ⎭ Se sabe que para que f(x) sea una fdp debe cumplir con: +∞ ∫ 0 f ( x ) dx = 1 ⇔ 1 = −∞ 1 kxdx + 0 lo que da como resultado k=1 kdx + 1 2 ∞ 3 ∫ ∫ ∫ ∫ 0 dx + −∞ Respuesta b) 2 ( − kx + 3 k ) dx + 2 ∫ 0 dx 3 y así la fdp queda como: 1 x ⎧ ∀ x ∈ [0 ,1[ ⎫ 2 ⎪ ⎪ 1 [ [ x f ( x) = ⎨ ∀ ∈ 1 , 2 ⎬ 2 ⎪ − 1 x + 3 ∀ x ∈ [2 ,3 ]⎪ ⎭ ⎩ 2 2 Respuesta c) Se sabe que la probabilidad que los valores de la variable aleatoria estén entre a y b son: b P (a ≤ x ≤ b) = en consecuencia, se tiene: ∫ a +∞ P (1,5 ≤ x ∠ + ∞ ) = ∫ 1,5 ∀ a ∧ b ∈ℜ f ( x ) dx 2 f ( x ) dx = ∫ 1, 5 +∞ 3 1 dx + 2 ∫ 2 ( −1 2 x + 3 2 ) dx + ∫ 0 dx 3 P (1 , 5 ≤ x ∠ + ∞ ) = 1 2 = 0 , 5 Esta es la probabilidad que la venta semanal haya sido de al menos 1.500 litros de combustible. 49 Respuesta d) El cálculo para que la probabilidad la venta semanal haya sido de exactamente 1.500 litros está dado por: P ( X = 1,5 ) = P (1,5 ≤ x ≤ 1,5 ) = lim ε →0 1,5+ε P ( X = 1,5) = lim ε →0 ∫ P (1,5 − ε ≤ x ≤ 1,5 + ε ) 1,5+ε f (t )dt = lim ε →0 ∫ 1 tdt = lim ε =0 2 ε →0 1,5−ε 1,5−ε Efectivamente, para esta variable aleatoria, la probabilidad que la venta semanal de combustible haya sido de 1.500 litros exactos es cero, tal como se infiere de la teoría. Nota: Para una variable aleatoria continua, la probabilidad que ésta alcance un valor determinado siempre es nula, sin embargo, no lo es cuando la probabilidad se calcula en torno a un rango de un valor de la variable. Ejemplo: En un curso de 35 alumnos cuyas estaturas van desde 1.42 m hasta 1,78 m, se puede calcular una probabilidad no nula que la estatura varíe, por ejemplo entre 1,58m y 1,65 m. Sin embargo, la probabilidad que la estatura sea de exactamente 1,61 m es nula, porque este valor de la estatura, que se puede dar dentro del curso, puede variar según la precisión del instrumento de medición. Justificación Matemática La probabilidad que el valor x de una variable aleatoria X se encuentre entre x y x + Δx es: x+Δx P (x ≤ X ≤ x + Δx) = ∫ x f ( t ) dt de manera que si Δx→ 0, se tiene aproximadamente P ( x ≤ X ≤ x + Δ x ) = f ( x ) Δ x y calculando el límite cuando x tiende a cero se obtiene que P(X = x) = 0. 50 Variable Aleatoria Definición: Sea ε un experimento y Ω el espacio muestral asociado con él. Una función X que asigna a cada uno de los elementos s de Ω, un número real X(s), se llama variable aleatoria. Ejemplo: Supóngase que se lanzan dos monedas “buenas” y considérese el espacio muestral Ω asociado a dicho experimento: Ω = {(C,C); (C,S); (S,C); (S,S)} = {CC, CS, SC, SS} Definiremos X =: el número de caras obtenidas en dos lanzamientos, en consecuencia se tiene: X(CC) = 2 X(CS) = X(SC) = 1 X(SS) = 0 Ω RX s X(s) Nota: El espacio RX, es decir, el conjunto de todos los valores posibles de X, algunas veces se llama Recorrido. En cierto sentido se puede considerar a RX como otro espacio muestral. El espacio muestral original Ω corresponde a los resultados no numéricos (posiblemente) del experimento ε, mientras que RX el espacio muestral asociado con la variable aleatoria (v.a.) X, que representa la característica numérica que puede ser de interés. Si X(s) = s se tiene que Ω = RX 51 Definición: Sea ε un experimento y Ω el espacio muestral asociado con él. Sea X una variable aleatoria definida y sea RX su recorrido. Sea B un evento respecto a RX, es decir, B ⊆ RX. Supóngase que A se define como: A={ s ∈ Ω / X(s) ∈ B} (*) Es decir, A consta de todos los resultados en Ω para los cuales X(s) ∈ B. En este caso se dice que A y B son eventos equivalentes. Ω RX A B s X(s) Definición: Sea B un evento en RX, entonces: P(B) = P(A) donde A = { s Ω / X(s) B} (**) es decir, se define P(B) igual a la probabilidad del evento A sentido dado por (*) ∈ ∈ ⊆ Ω en el Ejemplo: Respecto de mismo ejemplo de las monedas “buenas” o “normales”, se tiene: P(CS) = P(SC) =1/4 En consecuencia: P(CS, SC) = 1/4 + 1/4 = 2/4 =1/2 Como el evento {X = 1} ↔ {CS, SC}, entonces usando (*) se tiene que: P(X = 1) = P(CS, SC) = 1/2. (En realidad no había elección acerca del valor P(X = 1) consistente con (**), una vez determinada P(CS, SC). En este sentido, se inducen las probabilidades asociadas con eventos de RX) 52 Definición: Se dice que X es una variable aleatoria continua, si existe una función f, llamada función de densidad de probabilidad (fdp) de X, que satisface las siguientes condiciones: a) f(x) ≥ 0 para todo x ∈ ℜ b) + ∞ ∫ f ( x ) dx = 1 − ∞ c) ∀ a<b∈ ℜ b se tiene: P (a ≤ x ≤ b ) = ∫ f ( x ) dx a Nota i: De c) se deduce c P (x = c) = ∫ f ( x ) dx = 0 c P ( A) = 0 ⇒ A = ∅ Es decir, en el caso continuo Nota ii: Si X sólo toma valores en un intervalo finito, por ejemplo, [ ] [a, b], se puede establecer que f(x) = 0 ∀x ∉ a, b . En consecuencia, la fdp está definida para todos los valores reales de x, y se debe exigir que +∞ ∫ −∞ f ( x ) dx = 1 Cuando quiera que la fdp se especifique sólo para ciertos valores de x, se supondrá que es nula para cualquier otro. Nota iii: Cuando se escribe P(c < X < d), quiere decir, como siempre P(c < X(s) < d), que a su vez es igual a P[s / c < X(s) < d], puesto que estos eventos son equivalentes. La definición c) estipula básicamente la existencia de una fdp definida en un RX tal que P[s / c < X(s) < d] es igual a 53 b ∫ f ( x ) dx a Definición: La función de distribución acumulada (fda) o simplemente la función de distribución, para una variable aleatoria continua o discreta X se define por: F(x) = P(X ≤ x) x F (x) = P ( X ≤ x) = ∫ f ( t ) dt − ∞ con -∞ < x < +∞ para el caso de una v.a. continua y F ( x ) = P ( X ≤ x ) = ∑ p ( x ) j J para el caso de una v.a. discreta. Donde la suma se toma sobre todos los índices j que satisfacen xj ≤ x F(x) se caracteriza por las siguientes propiedades: i) F(x) no es decreciente ( ie, F(x) ≤ F(y) si x ≤ y ) ii) lim x→-∞ F(x) = 0 ; lim x→+∞ F(x) = 1 Nota: i) y ii) implican que F(x) es continua y monótona creciente de 0 a 1. También se puede ver que partiendo de: x F (x ) = P ( X ≤ x) = ∫ f ( t ) dt − ∞ y derivando ambos lados se tiene dF ( x ) = f ( x ) en todos los puntos dx donde f(x) es continua, es decir, la derivada de la función distribución acumulada es la función de densidad de probabilidad (fdp). 54 Si f(x) es la función de densidad (fdp) para una variable aleatoria continua X, entonces se puede representar gráficamente y = f(x) mediante una curva tal como en la figura 1 del gráfico. Dado que f(x) ≥ 0, la curva no puede caer por debajo del eje x. El área completa limitada por la curva y el eje de las x debe ser igual a 1. Geométricamente, la probabilidad que X se encuentre entre a y b, o sea, P(a ≤ X ≤ b), se representa por el área achurada de la figura 1. La función de distribución acumulada F(x) = P(X ≤ x) es monótona creciente, que se incrementa de 0 a 1, se representa por la curva de la figura 2. f(x) Figura 1 F(x) Figura 2 1 a 0 b x 0 x Definición: Sea X una v.a. discreta con valores posibles x1, x2, x3, . . . ., y supóngase que es posible rotular esos valores de modo que x1 < x2 < x3 < . . . . Sea F la función de distribución acumulada (fda) de X. Entonces: P(xj) = P(X = xj) = F(xj) – F(xj-1) Dada la función de cuantía del problema resuelto en la página 46, donde x representa el número de goles marcados en determinados partidos: 0 1/18 x p(x) 1 1/18 2 4/18 3 5/18 4 3/18 5 2/18 6 1/18 7 1/18 a) Calcular y graficar la función de distribución acumulada de probabilidades F. b) Calcular la probabilidad que se hagan entre 2 y 4 goles por partido. Respuesta a) x 0 p(x) 1/18 1 2 3 4 5 6 7 1/18 4/18 5/18 3/18 2/18 1/18 1/18 F(x) 1/18 1/18+1/18 F(x) 1/18 1/9 4/18+2/18 1/3 5/18 +6/18 3/18+11/18 2/18+14/18 1/18+16/18 1/18+17/18 11/18 7/9 8/9 17/18 1 55 En las dos últimas filas de la tabla anterior se encuentra el modo de cálculo de la fda. La definición funcional de la fda y su gráfico se presentan a continuación F ( x ) = ]− ∀ x ∈ ∀ x ∈ 0 ⎧ ⎪ 1 18 ⎪ 1 ⎪ 9 ⎪ 1 ⎪ 3 ⎪ 11 ⎨ 18 ⎪ 7 9 ⎪ 8 ⎪ 9 ⎪ 17 ⎪ 18 ⎪⎩ 1 ∞ ,0 [0 , 1 [ [1 , 2 [2 , 3 [3 , 4 [4 , 5 [5 , 6 [6 , 7 ∀ x ∈ ∀ x ∈ ∀ x ∈ ∀ x ∈ ∀ x ∈ ∀ x ∈ ∀ x ∈ [7 , +∞ [⎫ ⎪ ⎪ [ ⎪ [ ⎪⎪ [ ⎪⎬ [ ⎪⎪ [ ⎪ [ ⎪⎪ [ ⎪⎭ F(x) Función Distribución Acumulada de Probabilidades 1 17/18 8/9 7/9 11/18 1/3 1/9 1/18 x 0 1 2 3 4 5 6 7 Respuesta b) La probabilidad que se hagan entre 2 y 3 goles por partido está dada por: P(2 ≤ x ≤ 3) = F(3) – F(2) = 11/18 – 1/3 = 5/18 El concepto de probabilidad condicional se puede aplicar con propiedad a las variables aleatorias continuas. A continuación se verá dicha aplicación respecto al ejercicio propuesto en la página 47. 56 A partir de la información gráfica y funcional de las ventas de combustible de una estación de servicio durante un período semanal entre miércoles y miércoles, en miles de litros: 1 x ⎧ ∀ x ∈ [0 ,1[ ⎫ 2 ⎪ ⎪ 1 f (x) = ⎨ ∀ x ∈ [1, 2 [ ⎬ 2 ⎪ − 1 x + 3 ∀ x ∈ [2 , 3 ]⎪ ⎩ ⎭ 2 2 a) Calcular la probabilidad que las ventas semanales alcancen a lo menos 1.500 litros, dado que lo más probable es que se vendan entre 1.000 litros y 2.000 litros de combustibles. f(x) 1/2 x (kl) 0 1 2 3 Respuesta a) Lo que se pide evaluar es la probabilidad de vender 1.500 litros sujeto al suceso consistente en que se venderán entre 1.000 y 2.000 litros de combustibles, esto expresado en notación de probabilidades condicionales es P(x ≤ 1,5 / 1 ≤ x ≤ 2). Así: +∞ 2 +∞ 3 ∫ f (x)dx 1,5∫ dx + ∫2 (− x + )dx + ∫3 0dx 1 P( x ≥ 1,5) 1,5 P( x ≥ 1,5/1 ≤ x ≤ 2) = = 2 = = 2 2 1 P(1 ≤ x ≤ 2) 2 1 1 ∫ 2 dx ∫ 2 dx 1 2 1 P( x ≥ 1,5 /1 ≤ x ≤ 2) = 1 2 3 2 1 P( x ≥ 1,5) = 1 Esto indica que es un suceso seguro. P(1 ≤ x ≤ 2) 57 Calcular y graficar la función F (fda) correspondiente a la relación funcional cuya gráfica adjunta para la fdp es: ∀ x ∈ ]0 , 1 [⎫ ⎧ 2 x f (x) = ⎨ ⎬ ∀ x ∉ ]0 , 1 [⎭ ⎩ 0 f(x) 2 x 0 1 Respuesta: De acuerdo con lo estudiado se tiene para la fda F: F ( x ) = ⎧ ⎪ ⎪ 2 ⎪ ⎨ x ⎪ ⎪ ⎪⎩ ]− ∀ x ∈ 0 ∞ ,0 ]⎫ x ∫ = 2 tdt 0 ]0 ∀ x ∈ ]1 ∀ x ∈ 1 Función de Distribución Acumulada F(x) 1 x 0 1 ,1 , +∞ ] [ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪⎭ 58 Se sabe que el 75% de las veces durante el mes de agosto llueve más de 20 cm3 y un 35% de las veces llueve menos de 30 cm3. Suponiendo normalidad en las precipitaciones durante agosto: a) Hallar la cantidad media de precipitaciones durante agosto b) Hallar la probabilidad que precipiten entre 40 y 60 cm3. c) Hallar la probabilidad que entre 6 y 10 días de agosto precipiten entre 40 y 60 cm3. Respuesta a) i) 75% del mes de agosto > 20 cc ↔ 25% ≤ 20cc ii) 35% del mes de agosto < 30 cc Así: iii) Z(25%) = -0,674 = (20 - μ) / σ iv) Z(35%) = -0,385 = (30 - μ) / σ (según tabla de distribución normal) (según tabla de distribución normal) Resolviendo el sistema de ecuaciones formado por iii) y iv) se tiene: μ = 43,3 cc y una σ = 34,6 cc En consecuencia la media de las precipitaciones en agosto alcanza a 43,3 cc. Respuesta b) Ahora se debe encontrar para la v.a. X definida como precipitaciones durante agosto en cm3, P(40cc ≤ X ≤ 60 cc) = P(X ≤ 60 cc) – P( X ≤ 40 cc), para lo cual se debe calcular los valores estandarizados Z(40 cc) y Z(60 cc): Así, de la tabla de distribución normal se tiene: Z(60cc) = (60 – 43,3) / 34,6 = 0,483 ≈ P( 0,48) = 0,6844 = 68,44% Z(40cc) = (40 – 43,3) / 34,6 = -0,095 ≈ P(-0,10) = 0,4602 = 46,02% En consecuencia, la probabilidad solicitada es: P(40cc ≤ X ≤ 60 cc) = 68,44% – 46,02% = 22,42% =0,2242 Respuesta c) La probabilidad que llueva entre 40 cc y 60 cc entre 6 y 10 días de agosto es: [(10 – 6) / 3 1]* P(40cc ≤ X ≤ 60 cc) = (4/31)*22,42% = 2,89% ≈ 3,0% 59 Tabla de la distribución normal tipificada N(0,1) Proporciona el área a la izquierda para valores positivos de z z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.0 4.1 4.2 4.3 4.4 0'00 0.50000 0.53983 0.57926 0.61791 0.65542 0.69146 0.72575 0.75804 0.78814 0.81594 0.84134 0.86433 0.88493 0.90320 0.91924 0.93319 0.94520 0.95543 0.96407 0.97128 0.97725 0.98214 0.98610 0.98928 0.99180 0.99379 0.99534 0.99653 0.99744 0.99813 0.99865 0.99903 0.99931 0.99952 0.99966 0.99977 0.99984 0.99989 0.99993 0.99995 0.99997 0.99998 0.99999 0.99999 0.99999 0'01 0.50399 0.54380 0.58317 0.62172 0.65910 0.69497 0.72907 0.76115 0.79103 0.81859 0.84375 0.86650 0.88686 0.90490 0.92073 0.93448 0.94630 0.95637 0.96485 0.97193 0.97778 0.98257 0.98645 0.98956 0.99202 0.99396 0.99547 0.99664 0.99752 0.99819 0.99869 0.99906 0.99934 0.99953 0.99968 0.99978 0.99985 0.99990 0.99993 0.99995 0.99997 0.99998 0.99999 0.99999 0.99999 0'02 0.50798 0.54776 0.58706 0.62552 0.66276 0.69847 0.73237 0.76424 0.79389 0.82121 0.84614 0.86864 0.88877 0.90658 0.92220 0.93574 0.94738 0.95728 0.96562 0.97257 0.97831 0.98300 0.98679 0.98983 0.99224 0.99413 0.99560 0.99674 0.99760 0.99825 0.99874 0.99910 0.99936 0.99955 0.99969 0.99978 0.99985 0.99990 0.99993 0.99996 0.99997 0.99998 0.99999 0.99999 1.00000 0'03 0.51197 0.55172 0.59095 0.62930 0.66640 0.70194 0.73565 0.76730 0.79673 0.82381 0.84849 0.87076 0.89065 0.90824 0.92364 0.93699 0.94845 0.95818 0.96637 0.97320 0.97882 0.98341 0.98713 0.99010 0.99245 0.99430 0.99573 0.99683 0.99767 0.99831 0.99878 0.99913 0.99938 0.99957 0.99970 0.99979 0.99986 0.99990 0.99994 0.99996 0.99997 0.99998 0.99999 0.99999 1.00000 0'04 0.51595 0.55567 0.59483 0.63307 0.67003 0.70540 0.73891 0.77035 0.79955 0.82639 0.85083 0.87286 0.89251 0.90988 0.92507 0.93822 0.94950 0.95907 0.96712 0.97381 0.97932 0.98382 0.98745 0.99036 0.99266 0.99446 0.99585 0.99693 0.99774 0.99836 0.99882 0.99916 0.99940 0.99958 0.99971 0.99980 0.99986 0.99991 0.99994 0.99996 0.99997 0.99998 0.99999 0.99999 1.00000 0'05 0.51994 0.55962 0.59871 0.63683 0.67364 0.70884 0.74215 0.77337 0.80234 0.82894 0.85314 0.87493 0.89435 0.91149 0.92647 0.93943 0.95053 0.95994 0.96784 0.97441 0.97982 0.98422 0.98778 0.99061 0.99286 0.99461 0.99598 0.99702 0.99781 0.99841 0.99886 0.99918 0.99942 0.99960 0.99972 0.99981 0.99987 0.99991 0.99994 0.99996 0.99997 0.99998 0.99999 0.99999 1.00000 0'06 0.52392 0.56356 0.60257 0.64058 0.67724 0.71226 0.74537 0.77637 0.80511 0.83147 0.85543 0.87698 0.89617 0.91309 0.92786 0.94062 0.95154 0.96080 0.96856 0.97500 0.98030 0.98461 0.98809 0.99086 0.99305 0.99477 0.99609 0.99711 0.99788 0.99846 0.99889 0.99921 0.99944 0.99961 0.99973 0.99981 0.99987 0.99991 0.99994 0.99996 0.99998 0.99998 0.99999 0.99999 1.00000 0'07 0.52790 0.56749 0.60642 0.64431 0.68082 0.71566 0.74857 0.77935 0.80785 0.83398 0.85769 0.87900 0.89796 0.91466 0.92922 0.94179 0.95254 0.96164 0.96926 0.97558 0.98077 0.98500 0.98840 0.99111 0.99324 0.99492 0.99621 0.99720 0.99795 0.99851 0.99893 0.99924 0.99946 0.99962 0.99974 0.99982 0.99988 0.99992 0.99995 0.99996 0.99998 0.99998 0.99999 0.99999 1.00000 0'08 0.53188 0.57142 0.61026 0.64803 0.68439 0.71904 0.75175 0.78230 0.81057 0.83646 0.85993 0.88100 0.89973 0.91621 0.93056 0.94295 0.95352 0.96246 0.96995 0.97615 0.98124 0.98537 0.98870 0.99134 0.99343 0.99506 0.99632 0.99728 0.99801 0.99856 0.99897 0.99926 0.99948 0.99964 0.99975 0.99983 0.99988 0.99992 0.99995 0.99997 0.99998 0.99999 0.99999 0.99999 1.00000 0'09 0.53586 0.57535 0.61409 0.65173 0.68793 0.72240 0.75490 0.78524 0.81327 0.83891 0.86214 0.88298 0.90147 0.91774 0.93189 0.94408 0.95449 0.96327 0.97062 0.97670 0.98169 0.98574 0.98899 0.99158 0.99361 0.99520 0.99643 0.99736 0.99807 0.99861 0.99900 0.99929 0.99950 0.99965 0.99976 0.99983 0.99989 0.99992 0.99995 0.99997 0.99998 0.99999 0.99999 0.99999 1.00000 60 Del detalle de la cuenta mensual de electricidad, se obtiene que el consumo promedio de los últimos 13 meses de una familia alcanza a 151,92 Kw-h con una desviación típica de 8,24 Kw-h: a) Asumiendo un comportamiento normal en el consumo de energía eléctrica, se desea averiguar, la probabilidad que el consumo de energía eléctrica se encuentre entre los 144 y los 160 Kw-h al mes. b) La probabilidad que el consumo eléctrico mensual no sobrepase los 160 Kw-h. Respuesta a) La probabilidad solicitada está dada por P(144 Kw-h ≤ x ≤ 160 Kw-h). Los valores estandarizados están dados por: x − 151,92 Z ( x) = 8,24 Así para x = 144 Kw-h y x = 160 Kw-h se tiene: 144 − 151 ,92 Z (144 ) = = − 0,9614 8, 24 160 − 151 ,92 Z (160 ) = = 0 ,9801 8, 24 Así se tiene: P(144 Kw-h ≤ x ≤ 160 Kw-h) = P( x ≤ 160 Kw-h) – P( x ≤ 144 Kw-h) y usando los valores estandarizados y la tabla se tiene: P(144 Kw-h ≤ x ≤ 160 Kw-h) = P( X ≤ 0,9801) – P(X ≤- 0,9614) P(144 Kw-h ≤ x ≤ 160 Kw-h) = 0,8365 – 0,1685 = 0,668 Respuesta b) La probabilidad solicitada es: P( x ≤ 160 Kw-h) = P( X ≤ 0,9801) = 0,8365 61 1) Supóngase que para una variable aleatoria, en un experimento, son posibles sólo tres resultados: a1, a2, y a3. Además supóngase que la ocurrencia de a1 es dos veces más probable que la de a2, la cual, a su vez, es dos veces más probable que la de a3. a) Hallar la distribución de probabilidades de la variable b) Calcular la esperanza de la variable c) Calcular la varianza de la variable d) Calcular la desviación típica de la variable Respuesta a) Debe cumplirse con la condición: n ∑ p( x ) =1 i) i =1 i ; p ( xi ) > 0 además de las condiciones dadas por el problema: ii) p ( a1 ) = 2 p ( a2 ) iii) p ( a2 ) = 2 p ( a3 ) al reemplazar ii) y iii) en i) se tiene: 2 × 2 p ( a3 ) + 2 p ( a3 ) + p ( a3 ) = 1 Así, se tiene: 7 p ( a3 ) = 1 1 7 2 4 ∴ p ( a2 ) = y p ( a1 ) = 7 7 con estos resultados se tiene la distribución de probabilidades: p ( a3 ) = x p( x) a1 4 7 a2 2 7 a3 1 7 62 Respuesta b) El valor esperado o esperanza para la variable X es: 3 E ( X ) = ∑ xi × p( xi ) = x1 × p( x1 ) + x2 × p( x2 ) + x3 × p( x3 ) i =1 4 2 1 1 E ( X ) = a1 × + a2 × + a3 × = ( 4a1 + 2a2 + a3 ) 7 7 7 7 2i) Respuesta c) Para calcular la varianza es necesario calcular previamente E ( X 2 ) 3 E ( X 2 ) = ∑ x 2i × p( xi ) = x 21 × p( x1 ) + x 2 2 × p( x2 ) + x23 × p( x3 ) i =1 4 2 1 E ( X 2 ) = a 21 × + a 2 2 × + a 23 × 7 7 7 1 E ( X 2 ) = ( 4a 21 + 2a 2 2 + a 23 ) 7 Así de 2i) y de 3i) se tiene la varianza: 3i ) Va( X ) = E ( X 2 ) − E 2 ( X ) 1 ⎡1 ⎤ Va( X ) = ( 4a 21 + 2a 2 2 + a 23 ) − ⎢ ( 4a1 + 2a2 + a3 ) ⎥ 7 ⎣7 ⎦ 2 Respuesta c) La desviación típica es: ⎡1 2 ⎡1 ⎤ ⎤ 2 2 2 + + − + + 4 a 2 a a 4 a 2 a a ( 1 2 3 ) ⎢⎣ 7 ( 1 2 3 )⎥⎦ ⎥ ⎣⎢ 7 ⎦⎥ σ= ⎢ = 1 ⎡ 2 7 ( 4a 21 + 2a 2 2 + a 23 ) − ( 4a1 + 2a2 + a3 ) ⎤ ⎣ ⎦ 7 Distribución de Probabilidades 4/7 2/7 1/7 a1 a2 a3 x 63 Una variable aleatoria X que representa el número de pólizas vendidas semanalmente por un agente de seguros tiene una distribución de probabilidades dada por: 2) X 0 1 2 3 4 5 6 7 8 p( X ) 0,05 0,09 2k 0,11 0,22 0,18 0,10 0,20 4k a) Hallar el valor de k b) Hallar la distribución de probabilidad con sus valores numéricos correspondientes. c) Hallar la probabilidad que el agente venda menos de tres pólizas semanales. d) Si el agente vende más de cinco pólizas en la semana, recibe un bono. Determinar la probabilidad que el agente reciba el bono. e) Determinar el número de pólizas que se espera que el agente venda semanalmente. f) Hallar la probabilidad que el agente venda exactamente cuatro pólizas semanales. Respuesta a) Usando las condiciones de una ddp: n ∑ p( x ) =1 i =1 9 ∑x i =1 i i p ( xi ) > 0 ; p( x i ) = 1 = 0 × 0,05 + 1× 0,09 + 2 × 2k + 3 × 0,11 + 4 × 0, 22 + 5 × 0,18 + 6 × 0,10 + 7 × 0, 20 + 8 × 4k 1 = 0,95 + 6k 6k = 1 − 0,95 = 0,05 = 5 100 5 1 k = 100 = 6 120 Respuesta b) Así, la ddp queda: X 0 1 2 3 4 5 6 7 8 p( X ) 1 20 9 100 1 60 11 100 11 50 9 50 1 10 1 5 1 30 64 Respuesta c) La probabilidad que el agente venda menos de tres pólizas semanales está dada por: P ( X < 3) = P ( X = 0 ) + P ( X = 1) + P ( X = 2 ) 1 9 1 + + 20 100 60 47 P ( X < 3) = = 0,156 300 P ( X < 3) = Respuesta d ) La probabilidad que el agente reciba el bono está dada por: P ( X > 5) = P ( X = 6 ) + P ( X = 7 ) + P ( X = 8) 1 1 1 + + 10 5 30 1 P ( X > 5) = = 0, 3 3 P ( X > 5) = Respuesta e) El número de pólizas que se espera que el agente venda semanalmente corresponde a: 9 E ( X ) = ∑ x i p( x i ) = 0 × i =1 5 9 1 11 11 9 1 1 1 + 1× + 2 × + 3× + 4 × + 5× + 6 × + 7 × + 8× 100 100 60 100 50 50 10 5 30 9 = 4,5 2 Respuesta f ) La probabilidad que el agente venda exactamente cuatro pólizas se obtiene directamente de la distribución de probabilidades: 11 P ( X = 4) = = 0, 22 50 E(X ) = Distribución de Probabilidad 11/50 1/5 9/50 11/100 1/10 9/100 1/20 1/30 1/60 0 1 2 3 4 5 6 7 8 X 65 3) Calcular, para una variable aleatoria binomial con probabilidad de éxitos q y con probabilidad de fracasos 1-q en n pruebas de Bernoulli: a) La esperanza b) La varianza y la desviación típica Respuesta a) n E( X ) = ∑ xi P ( xi ) i =0 n n n ⎛ n⎞ n! n(n −1)! E( X ) = ∑k ⎜ ⎟ qk (1− q)n−k = ∑k qk (1− q)n−k = ∑k qqk −1 (1− q)n−k k =0 ⎝ k ⎠ k =0 k !( n − k ) ! k =0 k (k −1)!( n − k ) ! n n(n −1)! (n −1)! qqk −1 (1− q)n−k = nq∑ qk −1 (1− q)n−k ( k − 1)! n − k ! k (k −1)!( n − k ) ! ( ) k =1 n =∑k k =0 n−1 = nq∑ j =0 Sea : k −1 = j n−1 n −1 ⎛ ⎞ j (n −1)! n−1 n−1− j q j (1− q)n−1− j = nq∑⎜ = nq ( q + (1− q)) = nq(1)n−1 ⎟ q (1− q) j !( n −1− j ) ! j =0 ⎝ j ⎠ E( X ) = nq Respuesta b) Para calcular la varianza de la v.a. X , es necesario calcular E( X 2 ) n n n k ( n −1) ! ⎛ n⎞ n! E( X 2 ) = ∑k 2 ⎜ ⎟ qk (1− q)n−k = ∑k 2 qk (1− q)n−k = nq∑ qk −1(1− q)n−k Sea : k −1 = j k !( n − k )! k =0 k =0 k =1 ( k −1) !( n − k ) ! ⎝k ⎠ ( j +1)( n −1)! q j (1− q)n−1− j = nq ⎡ n−1 j ( n −1)! q j (1− q)n−1− j + n−1 ( n −1)! q j (1− q)n−1− j ⎤ ⎢∑ ⎥ ∑ j =0 j !( n −1− j ) ! j =0 j !( n −1− j ) ! ⎣ j =0 j !( n −1− j ) ! ⎦ n−1 = nq∑ n−1 n −1 ⎡ n−1 j ( n −1)! j ⎤ ⎛ ⎞ j n−1− j q (1− q)n−1− j + ∑⎜ = nq ⎢∑ ⎥ = nq ⎡⎣( n −1) q +1⎤⎦ = nq [ nq +1− q] ⎟ q (1− q) j =0 ⎝ j ⎠ ⎣ j =0 j !( n −1− j ) ! ⎦ E( X 2 ) = ( nq) + nq (1− q) y con este resultado, usando Va( X ) = E( X 2 ) − E2 ( X ) = ( nq) + nq (1− q) − ( nq) 2 2 se tiene finalmente para la varianza de la v.a. binomial: Va( X ) = σ 2 = nq (1− q) y para la desviación típica: σ = + nq (1− q) 2 66 4) a) Determinar el número esperado de niños hombres de una familia de ocho hijos, suponiendo la distribución de sexos igualmente probable. b) Calcular la probabilidad que el número esperado de hijos suceda Respuesta a) Se trata de una ddp binomial, donde la probabilidad de éxito, es decir, un hijo hombre, es igual a la probabilidad de un fracaso, o sea tener una hija. Así q = 1 = 1 − q . El número de intentos 2 para tener hijos es 8: Así el número esperado de hijos varones es: E ( X ) = nq = 8 × 1 = 4 2 Respuesta b) Por otra parte, la probabilidad que el número esperado de hijos varones suceda es: ( ) ( 12 ) ⎛8⎞ P ( X = 4) = ⎜ ⎟ 1 ⎝ 4⎠ 2 4 8− 4 ( ) 8 ⎛8⎞ 70 70 35 = ≈ 0, 27 =⎜ ⎟ 1 = 8 = 2 2 256 128 ⎝ 4⎠