5.- Distribuciones de Probabilidad Discretas Función de Probabilidad p(X = x) = 5.1.- Distribución Binomial 5.2.- Distribución Hipergeométrica 5.5.- Distribución de Poisson n! p x qn- x x!(n - x)! k N k x nx p ( x) N n e x P( X x) x! 5.2.1 Aproximación de la Hipergeométrica por la Binomial 5.6 Aproximación de la Binomial por la de Poisson 5.3.- Distribución Geométrica 5.4.- Distribución Multinomial 5.7.- Distribución Binomial Negativa 5.8.- Distribución Uniforme (Discreta) Se llama función de probabilidad de una variable aleatoria discreta X a la aplicación que asocia a cada valor de xi de la variable su probabilidad pi. La función de masa de probabilidad de un dado. Todos los números tienen la misma probabilidad de aparecer cuando este es tirado. X 1 2 3 4 5 6 Pi 1/6 1/6 1/6 1/6 1/6 1/6 Hay que advertir que el concepto de función de probabilidad sólo tiene sentido para variables aleatorias que toman un conjunto discreto de valores. Para variables aleatorias continuas el concepto análogo es el de función de densidad. Distribución Binomial Notación: X ~ B( n,p ) Una v.a. Binomial representa el número de éxitos que ocurren en n repeticiones independientes de un ensayo de Bernoulli cuya probabilidad de éxito es p. Función de probabilidad: p(x) = n px (1-p)n-x, x = 0,1,2,3,..., n. x x = variable aleatoria n es el número de pruebas n! x es el número de éxitos p(X = x) = p x qn- x x!(n - x)! p es la probabilidad de éxito q es la probabilidad de fracaso Función de probabilidad de la distribución Binomial o también denominada función de la distribución de Bernoulli. Verificándose: 0 < p < 1 Supongamos que un experimento aleatorio tiene las siguientes características: En cada prueba del experimento sólo son posibles dos resultados: el suceso A (éxito) y su contrario A` (fracaso). El resultado obtenido en cada prueba es independiente de los resultados obtenidos anteriormente. La probabilidad del suceso A es constante, la representamos por p, y no varía de una prueba a otra. La probabilidad de A` es 1- p y la representamos por q . El experimento consta de un número n de pruebas. Todo experimento que tenga estas características diremos que sigue el modelo de la distribución Binomial. A la variable X que expresa el número de éxitos obtenidos en cada prueba del experimento, la llamaremos variable aleatoria binomial. La v.a. binomial es una v.a. aleatoria discreta, sólo puede tomar los valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas. Como hay que considerar todas las maneras posibles de obtener kéxitos y (n-k) fracasos debemos calcular éstas por combinaciones (número combinatorio n sobre k). • La distribución binomial es una distribución de probabilidad ya que: P(x) 0 y P(x) = 1 • La distribución binomial tiene dos parámetros: n y p • La media de la distribución binomial es: x = np • La desviación estándar es: x = npq Ejemplo 1: En cierta población la prevalencia de alergia es de 20%. Si se selecciona una muestra aleatoria de 10. Calcular: a) La probabilidad de que la muestra contenga exactamente un alérgico. éxito = tener alergia p=0.2 y q=0.8 n = 10 x=1 nCx * p^x * q^(n-x) P(X=1) = 10! (0.2)1 (0.8)9 1!9! = 10 (0.2) (0.8)9 = 0.2684 b. La probabilidad de que la muestra incluya menos de dos alérgicos p = 0.2; q = 0.8; n = 10 P(X<2) = P(X=0) + P(X=1) = 10! (0.2)0 (0.8)10 + 0.2684 0!10! = 0.1074 + 0.2684 = 0.3758 c. La probabilidad que la muestra incluya 2 o más alérgicos. p(x); x = 2,3,4,5,6……. p(x>=2)….. :. 1- P=(0,1) 1-0.3758 = 0.6242 d. La probabilidad que la muestra incluya entre uno y tres alérgicos inclusive. x = 1,2,3 Ejemplo 2: Una máquina fabrica una determinada pieza y se sabe que produce un 7 por 1000 de piezas defectuosas. Hallar la probabilidad de que al examinar 50 piezas sólo haya una defectuosa. p = 7/1000 = 0.007 n = 50 x=1 Se trata de una distribución binomial de parámetros B(50, 0.007) y debemos calcular la probabilidad p(X=1). Ejemplo 3: La probabilidad de éxito de una determinada vacuna es 0.72. Calcula la probabilidad de a que una vez administrada a 15 pacientes: a) Ninguno sufra la enfermedad (x = 15) b) Todos sufran la enfermedad (x = 0) c) Dos de ellos contraigan la enfermedad (x = 13) Distribución binomial de parámetros B(15, 0.72) Ejemplo 4: La probabilidad de que el carburador de un coche salga de fábrica defectuoso es del 4 por 100. Hallar: a) El número de carburadores defectuosos esperados en un lote de 1000 μ = n*p = 1000*0.04 = 40 carburadores defectuosos b) La varianza y la desviación típica σ2 = n*p*q = 1000*0.04*0.96 = 38.4; σ = = 6.19 Ejemplo 5: Imaginemos una escuela primaria donde los alumnos llegan tarde a menudo. 5 alumnos están en el jardín de niños. La directora lleva tiempo estudiando el problema, habiendo llegado a la conclusión de que hay una probabilidad de 0.4 de que un alumno llegue tarde y de que los alumnos lleguen independientemente uno de otro ¿Cómo trazamos una distribución binomial de probabilidad que ilustre las probabilidades de que 0,1,2,3,4 ó 5 estudiantes lleguen tarde simultáneamente? nCx * p^x * q^(n-x) p = 0.4; k = 0.6; n=5 Realicemos el cálculo de cada valor de x: Para x = 0 obtenemos que : P(0) = 5!/0!(5-0)! (0.4 )^0 (0.6)^5 P(0) = 0.07776 Para x = 3 obtenemos que : P(3) = 5!/3!(5-3)! (0.4 )^3 (0.6)^2 P(3) = 0.2304 Para x = 1 obtenemos que : P(1) = 5!/1!(5-1)! (0.4 )^1 (0.6)^4 P(1) = 0.2592 Para x = 4 obtenemos que : P(4) = 5!/4!(5-4)! (0.4 )^4 (0.6)^1 P(4) = 0.0768 Para x = 2 obtenemos que: P(2) = 5!/2!(5-2)! (0.4 )^2 (0.6)^3 P(2) = 0.3456 Para x = 5 obtenemos que : P(5) = 5!/5!(5-5)! (0.4 )^5 (0.6)^0 P(5) = 0.01024 Distribución Hipergeométrica Población: N k éxitos N-k fracasos Muestra n Notación: X ~ H(N, k, n) Un conjunto de N objetos contiene: k objetos clasificados como éxitos y N-K como fracasos. Se toma una muestra de tamaño n, al azar y (sin reemplazo) de entre los N objetos. La v.a. Hipergeométrica X representa el nº de éxitos en la muestra Función de probabilidad k N k x n x p( x) N n k E ( X ) np siendo p N N n V ( X ) np(1 p) N 1 Si el tamaño muestral n es muy pequeño en relación al número total de elementos, N, las probabilidades hipergeométricas son muy parecidas a las binomiales, y puede usarse la distribución binomial en lugar de la hipergeométrica. ÉXITO es el numero de valores “verdaderos” que se desean tener en una muestra y que tiene una población. FRACASO es el complemento del los éxitos (tanto en la muestra como en la población) De esta manera concluimos que: N = Nf + Ne La distribución hipergeometrica considera experimentos que obedezcan 3 de las 4 propiedades de un experimento binomial: • El experimento consiste en una secuencia de n intentos, donde n se fija antes del experimento. • Los intentos son idénticos, y cada uno de ellos puede resultar en dos posibles resultados, que se denotan por éxito (S) o fracaso (F) (p(S)+p(F)=1). • La probabilidad de éxito es constante de un intento a otro. Se debilitara la propiedad de independencia entre los intentos, es decir, los intentos individuales se consideraran dependientes, el experimento resultante se llamara experimento hipergeometrico. Es fácil describir la situación que nos lleva a la distribución hipergeometrica. Debe de haber una población que contenga cierto número de éxitos y fracasos. La selección se hace sin reemplazo, y estamos interesados en el numero de éxitos escogidos; el numero total de formas de escoger n objetos de N objetos es el N coeficiente binomial: n Y el numero de formas de escoger y éxitos y (n-y) fracasos es el producto Ne Nf n - y y (Si y>Ne, tome Nye y Py(y) igual a 0; Nf Si n-y>Nf, tome n - y y Py(y) igual a 0. ( ) ( )( ( ) ( ) ) Así concluimos que la formula para la distribución hipergeometrica será: PY(y)= Ne y Nf n - y ( )( ) N (n ) N: población n: muestra k: éxitos :. N-k: fracasos x: éxitos en la muestra k N k x n x p ( x) N n Ejemplo 1: En una jaula hay 30 pericos rusos y 20 pericos chinos si extraemos 10 pericos al azar, calcular posibilidad de que 3 de ellos hablen chino (característica deseada). N n k x = 50 = 10 = 20 = 3 k N k x n x p ( x) N n N: población n: muestra k: éxitos :. N-k: fracasos x: éxitos en la muestra 20 3 30 7 ( )( ) P(x)= =0.2259 50 (10) Ejemplo 2: De los 20 hombres y 18 mujeres del salón el 50% réprobo el examen de estadística, si tomamos 10 alumnos al azar probabilidad. a) 4 alumnos reprobados y b) 3 mujeres reprobadas a) N k n x = 38 = 19 = 10 = 4 19 19 ( 4)( 6 ) PY(y)= =0.2224 38 (10 ) N: población n: muestra b) N k n x = 38 = 9 = 10 = 3 9 29 k: éxitos :. N-k: fracasos ( 3 )( 7 ) PY(y)= =0.2273 38 (10 ) x: éxitos en la muestra Ejemplo 2: De los 20 hombres y 18 mujeres del salón el 50% réprobo el examen de estadística, si tomamos 10 alumnos al azar probabilidad. N: población c) 5 hombres reprobados n: muestra c) N k n x = 38 = 10 = 10 = 5 10 28 k: éxitos :. N-k: fracasos ( 5 )( 5 ) PY(y)= =0.05239 38 (10 ) x: éxitos en la muestra Distribución de Poisson Notación: X ~ P() El experimento observado es la aparición de sucesos en un soporte continuo: *Tiempo (llegada de autobuses a una parada,...) *Espacio (errores por página, ...) Características del proceso: Es estable: produce a largo plazo un número medio de sucesos constante λ por unidad de observación (tiempo, espacio, área) y los sucesos aparecen aleatoriamente de forma independiente , es decir, el proceso no tiene memoria, ya que conocer sucesos en un intervalo no ayuda a predecir sucesos en el siguiente. Expresa la probabilidad de que ocurra un evento un determinado número de veces en una medida dada (tiempo, distancia, piezas, etc). Cabe destacar que las ocurrencias son discretas. Si el numero esperado de ocurrencias en el intervalo es λ, entonces la probabilidad de que haya exactamente k ocurrencias es: Función de probabilidad: p(x)= e – x x= 0,1,2, ... x! λ y x deben de estar expresadas en la misma medida. Si el número promedio de ocurrencias en un intervalo de tiempo o en una región específica es λ>0. La v.a. X que es igual al número de ocurrencias independientes en el intervalo o región tiene una distribución de Poisson con tasa λ Distribución de Poisson Si n muy grande y p muy pequeño, es conveniente utilizar la distribución de Poisson, ya que se consigue una buena aproximación. Esta distribución se emplea para describir sucesos discretos que ocurren con poca frecuencia en el tiempo o en el espacio; por ello a veces recibe el nombre de distribución de sucesos raros. Variable aleatoria X: esta representa la cantidad de veces que ocurre un suceso de interés en un intervalo dado. Ya que X es una cuenta, puede tomar teóricamente cualquier valor entero entre 0 e infinito. Sea λ una constante que indica el número promedio de veces que acontece un suceso en un intervalo. Distribución de Poisson Si la probabilidad de que X tome el valor de x es P( X x) x e x! se dice que X tiene distribución de Poisson parámetro λ. una con e = 2.71828, este es la base de los log. naturales Usos: describir la cantidad de ambulancias que se requieren en una ciudad en una noche particular, describir la cantidad de partículas emitidas por una cantidad específica de material radiactivo o describir el número de colonias de bacterias que crecen en una caja de Petri. Determinar la cantidad de personas de una población de 10,000 que se involucra en un accidente vehicular cada año. El número de personas implicadas sería la siguiente la cual también es la varianza: ʎ = np donde p = 0.00024. ¿Cual es la probabilidad de que máximo 3 personas tengan un accidente en un año. 0.091 + 0.218 + 0.261 + 0.209 = 0.779 = (10000)(0.00024) = 2.4 = e 2.4 ( 2.4)1 0.091 + P ( X 1) 1! 0.218 e 2.4 (2.4) 2 + P( X 2) 2! 0.261 ¿Cual es la probabilidad de que más de 7 personas tengan un accidente en un año. P( X 7) 1 P( X 7) P(x>7) = 1 – (0.091 + 0.218 + 0.261 + 0.209 + 0.125 + 0.060 + 0.024 ) = 0.012 Ejemplo en clase En la inspección de hojalata producida por un proceso electrolítico continuo, se identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar a) una imperfección en 3 minutos b) al menos dos imperfecciones en 5 minutos c) cuando más una imperfección en 15 minutos. a) Un solo éxito b) Un rango indeterminado de éxitos, pero sí de fracasos c) Un rango determinado de éxitos RESUMEN DE CONVERGENCIAS DE DISTRIBUCIONES Normal N(, 2) n20 10 =np 2 =np(1-p) Binomial B(n,p) N>50 n/N0,1 Hipergeométrica H(N, k, n) = 2 = =np np7 Poisson P() Distribución Binomial Notación: X ~ B( n,p ) n! p(X = x) = p x qn- x x!(n - x)! Características Distribución Hipergeométrica Notación: X ~ H(N, k, n) k N k x nx p ( x) N n Características Aproximación de la Hipergeométrica por la Binomial Ejemplo Conclusión Distribución de Poisson Notación: X ~ P() e x P( X x) x! Ejemplo Aproximación de la Binomial a la Poisson Cierta enfermedad tiene una probabilidad muy baja de ocurrir, p=1/100.000. Calcular la probabilidad de que en una ciudad con 500.000 habitantes haya más de 3 personas con dicha enfermedad. Calcular el número esperado de habitantes que la padecen. Si consideramos la v.a. X que contabiliza el número de personas que padecen la enfermedad es claro que sigue un modelo binomial, pero que puede ser bien aproximado por un modelo de Poisson de modo que Distribución Geométrica G(P) Cumple con los supuestos de Bernoulli X número de fracasos que tienen lugar antes de que aparezca el primer éxito. Función Cuantía f(x)=qxp x=0,1,2,....n Momentos: Media = E[x]= q/p Función de distribución F(x)= 1-qx+1 x0 0 x<0 Varianza Var(x)= q/p2 F. Característica F. Generatriz de momentos x(t)= E[eitx]=p/(1- e it) gx(t)= E[etx]= p/(1- e t) Distribución Multinomial Generalización de la ley Binomial cuando el experimento en cuestión permite más de dos resultados posibles. Resultados: A1,A2,...Ak Porb. Asociadas: P1,P2,....Pk Pi=1 X número de veces que se presenta cada uno de los sucesos cuando se realizan n-repeticiones independientes del experimento. Función Cuantía f(x1,x2,..,xk)= n! Momentos: P1x1...Pkxk X1!...Xk! F. Generatriz de momentos gx(t)= E[etx]= ( Pi eti) Media = E[x]= npi Varianza Var(x)=npi(1-pi) Distribución Binomial Negativa o de Pascal XNB(p,k) NB(p,k) cumple con los supuestos de Bernoulli X número de repeticiones necesarias hasta observar k éxitos. Función Cuantía x 1 k x k P ( X x ) f ( x ) p (1 p ) k 1 Momentos: Media = E[x]= k/p Varianza Var(x)= k/p(1/q) Distribución Uniforme Discreta Decimos que una variable aleatoria discreta sigue una distribución uniforme discreta, cuando la probabilidad en todos los puntos es la misma. Función de distribución Función Cuantía f(x)= 0 si xxi i=1,2,..k 1/k si x=xi i=1,2,..k F(x)= 0 si x<x1 1/k si x1x2 2/k si x2x3 ............ 1 si xxk Distribución Uniforme Discreta Momentos: •Media •Varianza = E[x]= 1/k xi Var(x)= E[x2]- [E[x]2]=1/k (xi- )2 •Función Característica x(t)= E[eitx]= eitx1/n •Función generatriz de momentos gx(t)= E[etx]= etx1/n