Capítulo 4 Modelos de probabilidad 4.1 4.1.1 Modelos discretos Pruebas de Bernoulli Definición 4.1.1. Una prueba de Bernoulli es un experimento aleatorio cuyos posibles resultados se agrupan en dos conjuntos excluyentes que llamaremos éxito (E) y fracaso (F ), con respectivas probabilidades: p = P (E) y 1 − p = P (F ). Ejemplos 31 En el lanzamiento de una moneda podemos tomar E = { Cara } y F = { Cruz }. Si la moneda no está trucada, p = 21 . En una población se elige al azar una persona y consideramos los sucesos E = { altura ≥ 1.80} y F = { altura < 1.80}. La probabilidad de éxito dependerá de la distribución de la variable altura en la población. En el lanzamiento de un dado podemos tomar E = {6} y F = {1, 2, 3, 4, 5}. Si el dado es perfecto, p = 61 ; si está trucado y, por ejemplo, el 2 tiene probabilidad doble que cualquiera de los demás resultados, p = 17 . La distribución de Bernoulli es el modelo más sencillo obtenido a partir de pruebas de Bernoulli. Definición 4.1.2. Realizada una prueba de Bernoulli con P (E) = p se considera la variable aleatoria ½ X= 1 si obtenemos éxito 0 si obtenemos fracaso La función de masa es: P (X = 0) = 1 − p y P (X = 1) = p. Los parámetros esperanza y varianza de una variable X con distribución de Bernoulli son: E[X] = p , V [X] = p (1 − p) ; obtenidos ambos de manera sencilla a partir de la definición. Para abreviar escribiremos X ∼ B(1; p) para indicar que X es una variable aleatoria con distribución de Bernoulli con esperanza p. 63 Modelos discretos 4.1.2 Distribución binomial Definición 4.1.3. Supongamos que realizamos n pruebas de Bernoulli independientes, con P (E) = p en cada prueba. Sea X la variable “número de éxitos obtenidos en las n pruebas”. Llamamos distribución binomial a la distribución de esta variable X. Denotaremos por B(n; p) la distribución binomial de parámetros n = “número de pruebas de Bernoulli” y p = P (E) en cada prueba. Si X sigue una distribución B(n; p), escribiremos X ∼ B(n; p), y su función de masa es: µ ¶ n i p (1 − p)n−i , P (X = i) = i i = 0, 1, 2, . . . , n . Obsérvese que si tomamos una prueba de Bernoulli con p(E) = p, y consideramos la variable X con valores 1 si éxito, 0 si fracaso, entonces X ∼ B(1; p). También, si tomamos n variables Xi independientes, todas y cada una de ellas siguiendo la misma distribución B(1; p), entonces la variable X = X1 + X2 + · · · + Xn sigue una distribución B(n; p). En particular, la esperanza y la varianza de X ∼ B(n; p) son: E[X] = n · p , V [X] = n · p · (1 − p) ; puesto que p = E[Xi ] y p · (1 − p) = V [Xi ] para cada una de las variables independientes que sumamos. 4.1.3 Otros modelos basados en pruebas de Bernoulli Definición 4.1.4. Realizamos pruebas de Bernoulli independientes con la misma distribución dada por P (E) = p. La distribución geométrica de parámetro p es la de la variable aleatoria: X = “número de pruebas hasta el primer éxito”. Su función de masa es: P (X = j) = (1 − p)j−1 · p , j = 1, 2, 3, . . . . Se puede probar que: E[X] = 1 ; p V [X] = 1−p . p2 Ejercicio 1 Demostrar que si X sigue una distribución geométrica de parámetro p, entonces E[X] = 64 1 . p Modelos de probabilidad Solución: Por definición se tiene: E[X] = 1 · p + 2 · (1 − p) · p + 3 · (1 − p)2 · p + 4 · (1 − p)3 + 5(1 − p)4 + · · · ¡ ¢ = p · 1 + 2(1 − p) + 3(1 − p)2 + 4 · (1 − p)3 + 5(1 − p)4 + · · · ¡ = p · 1 + (1 − p) + (1 − p)2 + (1 − p)3 + (1 − p)4 + · · · + (1 − p) + (1 − p)2 + (1 − p)3 + (1 − p)4 + · · · + (1 − p)2 + (1 − p)3 + (1 − p)4 + · · · + (1 − p)3 + (1 − p)4 + · · · ¢ + (1 − p)4 + · · · ´ ³ 1 1 − p (1 − p)2 (1 − p)3 (1 − p)4 = p + + + + + ··· p p p p p 1 = 1 + (1 − p) + (1 − p)2 + (1 − p)3 + (1 − p)4 + · · · = . p Definición 4.1.5. Consideramos pruebas de Bernoulli independientes con la misma distribución dada por p = P (E). Para cada número fijo r, se define la variable X = “número de pruebas hasta el r–ésimo éxito” . Decimos que la variable X sigue una distribución binomial negativa de parámetros r y p, X ∼ BN (r; p), y su función de masa viene dada por: ¶ µ r+j−1 r p (1 − p)j , j = 0, 1, 2, . . . . P (X = r + j) = j La distribución BN (r; p) para r = 1 es una geométrica. De hecho, si realizamos pruebas de Bernoulli con p = P (E), hasta conseguir r éxitos y se definen las variables: Xi = número de pruebas entre el (i − 1)–ésimo éxito y el i–ésimo, i = 1, 2, . . . , r cada Xi es una geométrica de parámetro p. Entonces X = X1 + X2 · · · + Xr sigue una distribución BN (r; p). Así vemos que si X ∼ BN (r; p) entonces: E[X] = 4.1.4 r ; p V [X] = r(1 − p) . p2 Distribución de Poisson Supongamos que estamos interesados en estudiar el número de éxitos obtenidos en un número grande de pruebas independientes de Bernoulli, teniendo una probabilidad pequeña de éxito en cada prueba. Es razonable pensar que la distribución venga dada como límite de una distribución B(n; p) con n → ∞, p → 0. De hecho si se tiene cierto control sobre el producto np, digamos np → λ < ∞ 65 Modelos continuos cuando n → ∞ y p → 0, podemos calcular el límite. Surge así la distribución de Poisson de parámetro λ > 0 definida por la función de masa: P (X = j) = λj · e−λ , j! j = 0, 1, 2, . . . . Si X ∼ Poisson(λ), informalmente, se obtiene: E[X] = lı́m n · p = λ y V [X] = lı́m np(1 − p) = λ. Usaremos la distribución de Poisson cuando estemos estudiando un modelo binomial, B(n ; p), con un número grande de pruebas, cada una con probabilidad de éxito pequeña. A título orientativo, sustituiremos la B(n ; p) por una Poisson(λ), con λ = np, cuando n ≥ 30 y p ≤ 0.1. Es fácil comprobar que la función dada arriba es una función de masa puesto que: ∞ X ∞ ∞ X X λj · e−λ λj −λ P (X = j) = =e = e−λ · eλ = 1 . j! j! j=0 j=0 j=0 Ejercicio 2 Demostrar que el límite cuando n → ∞, p → 0, con np → λ, de la función de masa de una B(n; p) es la función de masa de una distribución de Poisson con parámetro λ, en otras palabras si np → λ cuando n → ∞ y p → 0: µ ¶ n j λj · e−λ lı́m p (1 − p)n−j = , cuando n → ∞, p → 0 . j j! Solución: : µ ¶ n j n(n − 1)(n − 2) · · · · · (n − j + 1) j (1 − p)n lı́m p (1 − p)n−j = lı́m ·p · j j! (1 − p)j µ ¶µ ¶ µ ¶ 1 1 2 j−1 (1 − p)n j = lı́m n · 1 − 1− · ··· · 1 − · pj · j! n n n (1 − p)j µ ¶µ ¶ µ ¶ n 1 2 j−1 1 j (1 − p) = lı́m 1 − 1− · ··· · 1 − · (n · p) · j! n n n (1 − p)j 1 e−λ λj · e−λ = 1 · λj = . j! 1 j! 4.2 4.2.1 Modelos continuos Distribución uniforme Definición 4.2.1. Decimos que una variable aleatoria X sigue una distribución uniforme en un intervalo (a, b) de la recta real, X ∼ U (a, b), si su función de densidad es: f (x) = 1 b−a si x ∈ (a, b) , Si X ∼ U (a, b) entonces µ = E[X] = f (x) = 0 en otro caso. 1 a+b y σ 2 = V [X] = (b − a)2 . 2 12 66 Modelos de probabilidad 4.2.2 Distribución exponencial Definición 4.2.2. Una variable aleatoria X se dice que sigue una distribución exponencial de parámetro λ > 0, X ∼ Exp(λ), si su función de densidad es f (x) = λe−λx si x > 0 , Si X ∼ Exp(λ) entonces: µ = E[X] = 4.2.3 1 , λ f (x) = 0 σ 2 = V [X] = si x ≤ 0 . 1 . λ2 Distribución Normal Definición 4.2.3. De una variable aleatoria X diremos que sigue una distribución normal de media µ y desviación típica σ, X ∼ N(µ; σ), si su función de densidad es: (x−µ)2 1 f (x) = √ e− 2σ2 , σ 2π para todo x ∈ R . Si X ∼ N(µ; σ) entonces: E[X] = µ , V [X] = σ 2 . La función de densidad de una distribución N (µ; σ) tiene propiedades muy interesantes: 1. Su gráfica es simétrica respecto a la media µ: µ−σ µ µ+σ de manera que: P (X < µ − a) = P (X > µ + a), para todo a > 0. X −µ 2. Si X ∼ N(µ; σ) y Z = entonces Z ∼ N(0; 1). En esta situación, nos referiremos al cambio σ X −µ de variable Z = , como tipificación de la variable X ∼ N(µ; σ), y a la correspondiente σ Z ∼ N(0; 1) como la distribución normal tipificada. La tipificación de cualquier normal, X ∼ N(µ; σ), nos permitirá calcular la probabilidad de un suceso correspondiente a ella a partir de la tabla de la distribución normal tipificada N(0; 1). Así, por ejemplo, si X ∼ N(µ; σ) entonces: P (a < X < b) = P ¡b − µ¢ ¡a − µ¢ ¡a − µ b − µ¢ <Z< = FZ − FZ , σ σ σ σ donde Z ∼ N(0; 1) y FZ (z) = P (Z ≤ z) es su función de distribución, cuyos valores vienen dados por una tabla. 67 Problemas 3. La distribución B(n; p) tiende a una distribución normal cuando n → ∞ y p es fijo. Así si estamos con una distribución binomial con n grande, la podremos aproximar por una normal N (µ; σ) con parámetros: p µ = n · p , σ = n p (1 − p) . A título orientativo es aconsejable realizar esta sustitución cuando n ≥ 30 y 0.1 < p < 0.9. 4. Si X1 ∼ N(µ1 ; σ1 ), X2 ∼ N(µ2 ; σ2 ), . . . , Xn ∼ N(µn ; σn ) son variables independientes entonces: q X = X1 + X2 + · · · + Xn ∼ N(µ = µ1 + µ2 + · · · + µn ; σ = σ12 + σ22 + · · · + σn2 ) q Y = X1 − X2 ∼ N(µ = µ1 − µ2 ; σ = σ12 + σ22 ) . Problemas 1. En una cadena de producción dos robots funcionan conectados, respectivamente, a cinco y seis ordenadores independientes entre sí, de manera que en un tiempo dado t de funcionamiento falla un ordenador del primer robot (resp. segundo) con probabilidad 0.1 (resp. 0.2). Calcúlense las probabilidades de que en un tiempo t de funcionamiento fallen: (a) un ordenador del primer robot; (b) al menos un ordenador del primer robot; (c) cinco ordenadores del segundo robot; (d) no más de cinco ordenadores del segundo robot; (e) exactamente dos ordenadores del primer robot y tres del segundo; (f) tres ordenadores más del primero que del segundo robot. 2. Un lote de piezas contiene una proporción p de defectuosas. Para realizar un control de calidad se seleccionan n piezas y se denomina X el número de piezas defectuosas encontradas. (a) Calcúlese P (X = 0). (b) Si p = 0.1, ¿cuál debe ser el número de piezas, n, examinadas para tener P (X = 0) < 0.05? (c) Si n = 40, ¿para qué valores de p es P (X = 0) < 0.01? (d) Si se examinan n = 80 piezas y se encuentran dos defectuosas, ¿cuál es la proporción más verosímil de piezas defectuosas en el lote total: el 1 %, el 4 % ó el 7 %? 3. En una población se sabe que, en promedio, uno de cada 20 habitantes tiene teléfono móvil. ¿Cuál es la probabilidad de que al realizar una encuesta, el cuarto encuestado sea el primero con teléfono móvil? 4. Se extraen una a una con reemplazamiento cartas de una baraja española. Calcúlese la probabilidad de obtener 5 cartas que no sean oros antes de obtener el tercer oro. 68 Modelos de probabilidad 5. El dueño de una ferretería, extrae al azar 50 tornillos de cada lote que recibe. Si en la muestra no encuentra más de 3 defectuosos, se queda el lote, en caso contrario lo rechaza. Un representante le envía un lote que contiene un 10 % de tornillos defectuosos, ¿cuál es la probabilidad de que acepte el lote? 6. En cierto tramo de una carretera la probabilidad de que un coche supere la velocidad máxima permitida es 0.0001. Si recorren ese tramo 20000 coches, calcúlese la probabilidad de que (a) ninguno supere la velocidad máxima permitida; (b) a lo sumo 5 superen la velocidad máxima permitida. 7. Se ha observado el número de fallos cometidos en un folio por un mecanógrafo en un tiempo fijado. Estos fallos se han anotado en la siguiente tabla: número de fallos frecuencia 0 42 1 30 2 16 3 12 4 4 5 1 Ajústese una distribución de Poisson y calcúlese la probabilidad de que en un folio seleccionado al azar, de entre los escritos por este mecanógrafo, aparezcan más de tres fallos. 8. Se sabe que la demanda de un producto de consumo sigue una distribución normal de media 95 y desviación típica 7. Calcúlese: (a) la probabilidad de que la demanda sea menor que 97; (b) la probabilidad de que la demanda sea mayor que 99; (c) la probabilidad de que la demanda esté entre 92 y 96; (d) la mínima cantidad disponible necesaria para poder atender la demanda con una probabilidad no menor que 0.95 . 9. En cierto país, el 20 % de la población se muestra preocupada por el incremento de las emisiones de dióxido de carbono. Se hace una encuesta a 15 personas. (a) ¿Cuál es la probabilidad de que ninguna de ellas esté preocupada por el incremento de las emisiones de dióxido de carbono? (b) Halla la probabilidad de que no haya más de tres personas preocupadas. (c) Calcula la probabilidad de que al menos tres personas entre las 15 estén preocupadas. (d) ¿Cuál es la esperanza y la desviación típica del número de personas preocupadas entre las 15? Si en lugar de al 20 %, sólo al 2 % de los habitantes del país les preocupa el problema, ¿cómo cambian la esperanza y la desviación típica? 10. Consideramos un experimento aleatorio consistente en tirar 400 veces una moneda. (a) Halla la probabilidad aproximada de que el número de caras obtenido esté comprendido entre 160 y 190. (b) Halla el intervalo (a, b) centrado en 200, tal que la probabilidad aproximada de que el número de caras obtenido esté en dicho intervalo sea 0.95. 69 Problemas 11. Un zoólogo estudia cierta especie de ratones de campo. Para ello, captura ejemplares de ratones en un bosque en el que la proporción de ratones de campo de la especie que le interesa es p. (a) Si p = 0.3, calcula la probabilidad de que entre 6 ejemplares capturados haya al menos 2 de la especie que le interesa. (b) Si p = 0.05, calcula la probabilidad de que entre 200 ejemplares capturados, haya exactamente 3 de la especie que le interesa. (c) Si p = 0.4, calcula la probabilidad de que entre 200 ejemplares capturados, haya entre 75 y 110 de la especie que le interesa. (d) ¿Cuál es el número medio de ejemplares que tendrá que capturar hasta encontrar uno de la especie que le interesa, si p = 0.2 ? 12. Se supone que el número de bacterias por cm3 de agua en un estanque es una variable aleatoria X con distribución de Poisson de parámetro λ = 0.5. (a) ¿Cuál es la probabilidad de que en un cm3 de agua del estanque no haya ninguna bacteria? (b) En 40 tubos de ensayo se toman muestras de agua del estanque (1 cm3 de agua en cada tubo). ¿Qué distribución sigue la variable Y que representa el número de tubos de ensayo, entre los 40, que no contienen bacterias? Calcula P (Y ≥ 20). (c) Si sabemos que en un tubo hay bacterias, ¿cuál es la probabilidad de que haya menos de tres? 13. En el sur de California se produce, en promedio, un terremoto al año de magnitud 6.1 o mayor en la escala de Richter1 . Se supone que el número de terremotos al año en esta zona sigue un proceso de Poisson. (a) ¿Cuál es la probabilidad de que se produzcan más de dos terremotos en cinco años? (b) ¿Cuál es la probabilidad de que haya un periodo de 15 meses sin que haya terremotos? (c) ¿Cuál es la probabilidad de que haya que esperar más de tres años y medio para que se produzcan dos terremotos? 14. La probabilidad de que una pieza tenga un fallo durante el primer año de funcionamiento es 0.001. Halla la probabilidad de que, entre 2000 piezas, presenten un fallo (a) exactamente tres, (b) más de 2. 1 Magnitud menos de 3.5 3.5–5.4 5.5–6.0 6.1–6.9 7.0–7.9 8 ó mayor Escala Ritcher Efectos del terremoto Generalmente no se siente, pero es registrado A menudo se siente, pero sólo causa daños menores Ocasiona daños ligeros a edificios Puede ocasionar daños severos en áreas muy pobladas Terremoto mayor. Causa graves daños Gran terremoto. Destrucción total a comunidades cercanas Fuente: http://www.angelfire.com/ri/chterymercalli 70 Modelos de probabilidad 15. La variable X expresa el tiempo en segundos que tarda una depuradora en filtrar 10 mm3 de agua y sigue una distribución exponencial con media 10. Calcula la probabilidad de que tarde entre tres y doce segundos en depurar 10 mm3 . 16. Para estudiar la viabilidad económica de una mina de carbón, consideramos la variable aleatoria X=“Kilogramos de carbón obtenidos por tonelada de mineral”. Supongamos que, en cierta mina, X sigue una N(µ = 150; σ = 25). (a) Calcula la probabilidad de que, en una tonelada de mineral, el contenido de carbón sea superior a 130 kg. (b) Calcula la probabilidad de que, en 2 toneladas de mineral extraídas independientemente, la diferencia en el contenido de carbón sea inferior a 30 kg. (c) Extraemos independientemente 100 toneladas de mineral. Calcula la probabilidad de que en más de 80 de ellas el contenido de carbón sea superior a 130 kg. 17. En una fábrica, se están produciendo cuerdas con cierta fibra sintética. La resistencia a la tensión de estas cuerdas sigue una distribución N(µ = 30; σ = 2). (a) ¿Cuál es el porcentaje de cuerdas cuya resistencia a la tensión está entre 28 y 32? (b) En un pedido de 200 cuerdas, ¿cuál es la probabilidad de que más de 140 presenten una resistencia a la tensión entre 28 y 32? (c) En un pedido de 250 cuerdas, ¿cuál es la probabilidad de que alguna presente una resistencia inferior a 25? 18. Un fabricante produce varillas y recipientes para insertar las varillas. Ambos tienen secciones circulares. Los diámetros de las varillas siguen una distribución N(µ = 1; σ = 0.2); los diámetros de los recipientes siguen una distribución N (µ = 1.05; σ = 0.15). Un ingeniero selecciona al azar una varilla y un recipiente. ¿Cuál es la probabilidad de que la varilla pueda insertarse en el recipiente? 19. Para analizar si las aguas próximas a la costa están contaminadas cuando se produce una marea negra por el hundimiento de un petrolero, se analizan varias muestras con un test que se divide en tres pruebas independientes. Los resultados varían aleatoriamente de unas muestras a otras y se sabe que siguen distribuciones normales dadas por: X Y Z = = = resultados de la primera prueba del test, X ∼ N(7; 1) resultados de la segunda prueba del test, Y ∼ N(5; σ = 2) resultados de la tercera prueba del test, Z ∼ N(6; 1) Se elige una muestra al azar. Contesta a las siguientes preguntas: (a) Si el resultado final del test es el promedio de los valores que se obtienen en las tres pruebas, ¿cuál es la probabilidad de que el resultado del test sea superior a 5? (b) ¿Cuál es la probabilidad de que el resultado de las tres pruebas sea superior a 5? 20. Una compañía de petróleo tiene un contrato para vender grasa en envases de 500 gramos. La cantidad de grasa que la máquina de llenado pone en los envases sigue una Normal con la media que el encargado elija y σ = 25. ¿Qué valor medio deberá elegir el encargado si la compañía no desea que le rechacen más del 2 % de los envases por tener un peso por debajo de lo especificado? 71 Problemas 21. Una máquina de envasado llena sacos de fertilizante de aproximadamente 30 kg. La “cantidad de fertilizante por saco” sigue una distribución N (µ = 30; σ = 1). (a) Se desea que la cantidad de fertilizante por saco esté entre 29 y 31 kg. Calcula la probabilidad de que la cantidad esté dentro de esos límites. (b) Una empresa realiza un pedido de 80 de estos sacos de fertilizante. Calcular la probabilidad de que más de 50 estén dentro de los límites indicados. 22. La permeabilidad intrínseca del hormigón producido en una fábrica química sigue una distribución N (µ = 40; σ = 5). Se reciben 60 remesas de hormigón. (a) ¿Cuál es la probabilidad de que alguna remesa tenga una permeabilidad intrínseca inferior a 30? (b) El 30 % de las remesas de hormigón enviadas a un almacén tiene una permeabilidad que sigue una N (µ = 40; σ = 5). El 70 % de las remesas restantes tiene una permeabilidad que sigue una N (µ = 45; σ = 10). ¿Cuál es el porcentaje total de remesas que tienen una permeabilidad inferior a 35? 72