Distribución de Probabilidad Variables discretas Álvaro José Flórez 1 Escuela de Ingeniería Industrial y Estadística Facultad de Ingenierías Febrero - Junio 2012 Modelos probabilísticos Un modelo es una traducción de la realidad para poder aplicar los instrumentos y técnicas de las teorías matemáticas para estudiar el comportamiento de sistemas complejos. Simplificación de la realidad. Determinista: Se conoce de manera puntual la forma del resultado ya que no hay incertidumbre. Estocástico (probabilístico): No se conoce el resultado puntual, sino su probabilidad y existe por tanto incertidumbre. Tiene como objetivo estudiar los resultados de un experimento aleatorio y predecir su comportamiento futuro, cuando se realiza bajo las mismas condiciones dadas inicialmente. Algunos conceptos Variable aleatoria: Sea S un espacio muestral sobre el que se encuentra definida una función de probabilidad. Sea X una función de valor real definida sobre S, de manera que transforme los resultados de S en puntos sobre la recta de los reales. Se dice entonces que X es una variable aleatoria. Variable aleatoria discreta: Se dice que una variable aleatoria X es discreta si el númerica de valores que pueden tomar es contable (ya sea finito o infinito). Variables aleatoria continua: Se dice que una variable aleatoria X es continua si sus valores consisten en uno o más intervalos de la recta de los reales. Distribución de probabilidad Si una v.a toma valores x1 , x2 , . . . , xn la regla que asocia a cada uno de ellos las probabilidades p1 , p2 , . . . , pn respectivamente, se denomina función de probabilidad. Ejemplo: En un proceso de inspección de elementos fabricados por una máquina se observan 3 elementos para determinar si se puede clasificar como correcto o defectuoso. Suponiendo que la probabilidad de que el elemento sea defectuoso es de 0.05. Sea la variable aleatoria X el número de piezas que están defectuosas. Determine la función de probabilidad de X Distribución de probabilidad Definición: para una variable aleatoria X con posibles valores x1 , x2 , . . . , xn , la función de probabilidad es una función f (x) tal que: 1 2 3 f (xi ) ≥ 0 Pn i=1 f (xi ) = 1 f (xi ) = P (X = xi ) Definición: La distribución de probabilidad acumulada de una variable aleatoria discreta X, se denota como F (x), está determinada como: F (x) = P (X ≤ x) = X xi ≤X Esta función debe satisfacer: 1 2 0 ≤ F (x) ≤ 1 Si xi ≤ xj , entonces F (xi ) ≤ F (xj ) f (xi ) Valor Esperado y Varianza La esperanza (Valor esperado) de una variable aleatoria tiene sus orígenes en los juegos de azar. En este sentido, el valor esperado representa la cantidad de dinero promedio que el jugador está dispuesto a ganar o perder después de un número grande de apuestas. Este valor, que representa centralidad, al igual que la varianza, que describe dispersión, sirven de medidas que resumen una distribución de probabilidad La media o valor esperado de una variable discreta X, se denota como µ o E(X), es: E(X) = n X xi f (xi ) i=1 La varianza de X, se denota como σ 2 o V (X), es: V (X) = n X i=1 2 (xi − E(X)) f (xi ) Ejemplo Suponga que se tiene tres oportunidades para lanzar una moneda hasta que aparezca una cara. El juego termina en el momento en el que cae una cara o después de los tres intentos. Si en el primero, segundo o tercer lanzamiento aparece cara, el jugador recibe $500, $1000, $2000 Si no cae cara en ninguno de los lanzamientos el jugador pierde $5000 ¿Estaría usted dispuesto a jugar? Propiedades Para cualquier constante a y b se cumple que: E(aX) = aE(X) E(X + b) = E(X) + b E(aX + b) = aE(X) + b V (aX) = a2 V (X) V (X + b) = V (X) V (aX + b) = a2 V (X) Ejemplo Una compañía proveedora de productos químicos tiene en existencia 100 libras de un producto que vende a los clientes en lotes de 5 libras. Sea X = número de lotes que pide un cliente seleccionado al azar y suponga que X tiene la siguiente función de probabilidad: X f (X) 1 0.2 2 0.4 3 0.3 4 0.1 1 Calcule E(X) y V (X) 2 Calcule el número esperado, y la varianza, de libras sobrantes después que se envía el pedido al cliente. Distribuciones de probabilidad Existen varias distribuciones especificas de probabilidad que se ha demostrado, empíricamente, ser modelos útiles para diversos problemas prácticos. La elección de la distribución de probabilidad para representar un fenómeno de interés debe ser motivada tanto por la comprensión de la naturaleza del fenómeno, como por la verificación de la distribución seleccionada a través de la evidencia empírica. En el caso discreto algunas de estas distribuciones son: • Binomial • Poisson • Hipergeométrica Distribuciones de probabilidad Proceso Bernoulli Un experimento Bernoulli debe tener las siguientes propiedades: • El experimento consiste en n intentos repetidos. • Los resultados de cada uno de los intentos pueden clasificarse como un éxito o como un fracaso. • La probabilidad de éxito (p), permanece constante para todos los intentos. • Los experimentos son independientes. Saber el resultado de una observación no te indica nada sobre las restantes observaciones Distribución Binomial Definición: Un experimento Bernoulli puede resultar en un éxito con una probabilidad p y un fracaso con una probabilidad 1 − p. Entonces la distribución de probabilidad de la variable aleatoria binomial X, que determina el número de éxitos en n ensayos independientes, es: n f (x) = px (1 − p)n−x x = 0, 1, . . . , n x Donde 0 ≤ p ≤ 1. E(X) = np V (X) = np(1 − p) Distribución Binomial Fig: Representación gráfica Binomial(N=10,p=0.3) 0.20 0.15 0.0 0.00 0.05 0.1 0.10 Y 0.2 Y 0.3 0.25 0.4 Binomial(N=10,p=0.1) 2 4 6 8 10 0 2 4 6 Número de éxitos Número de éxitos Binomial(N=10,p=0.5) Binomial(N=10,p=0.8) 8 10 8 10 0.15 Y 0.00 0.00 0.05 0.05 0.10 0.10 Y 0.15 0.20 0.20 0.25 0.30 0.25 0 0 2 4 6 Número de éxitos 8 10 0 2 4 6 Número de éxitos Ejemplos Un examen de estadística consta de 5 preguntas cada una de ellas con cuatro respuestas de las cuales una sola es correcta. Un alumno responde al azar (es decir, sin tener la menor idea sobre las preguntas). ¿Cuál es la probabilidad de que resuelva bien a 3 o más preguntas? Ejemplos Un examen de estadística consta de 5 preguntas cada una de ellas con cuatro respuestas de las cuales una sola es correcta. Un alumno responde al azar (es decir, sin tener la menor idea sobre las preguntas). ¿Cuál es la probabilidad de que resuelva bien a 3 o más preguntas? Un catador de vinos afirma que el 90 % de las veces puede distinguir entre un vino fino y uno corriente con sólo degustar un sorbo. Para comprobar su afirmación, se le aplicará una pequeña prueba: degustar 9 muestras de vino y decidir en cada caso si se trata de vino fino o corriente. El criterio para aceptar su afirmación es que si acierta por lo menos en 6 muestras se aceptará su afirmación, y en caso contrario se rechazará como falsa. Determine la probabilidad de si el sujeto no conoce nada de vinos y sólo está adivinando, logre pasar esa prueba. Calcule la probabilidad de aun suponiendo que es cierto lo que afirma (que es capaz de acertar el 90 % de las veces), no logre pasar la prueba. Distribución Hipergeométrica Sea N el número total de objetos en una población finita, de manera tal que k de éstos es de un tipo y N − k de otros. Si se selecciona una muestra aleatoria de la población constituida por n objetos de la probabilidad de que x sea de un tipo exactamente y n − x sea del otro, está dada por la función de probabilidad hipergeométrica: k N −k x n−x , x = 0, 1, . . . , n; f (x) = N n x ≤ k, n − x ≤ N − k, N, n, k enteros positivos. El valor esperado y la varianza quedan definidos como: nk N −n V (X) = np(1 − p) E(X) = N −1 N Ejemplo La policía sospecha que en un camión cargado con 40 bultos de arroz se han camuflado paquetes de cocaína. Para confirmar su sospecha, la policía escoge al azar 5 bultos para inspeccionarlos. Si en efecto, de los 40 bultos de arroz, que contiene el camión, 10 tienen camufladas cocaína, ¿Cuál es la probabilidad de que por lo menos uno de los bultos de la muestra contenga cocaína? Ejemplo La policía sospecha que en un camión cargado con 40 bultos de arroz se han camuflado paquetes de cocaína. Para confirmar su sospecha, la policía escoge al azar 5 bultos para inspeccionarlos. Si en efecto, de los 40 bultos de arroz, que contiene el camión, 10 tienen camufladas cocaína, ¿Cuál es la probabilidad de que por lo menos uno de los bultos de la muestra contenga cocaína? Cinco individuos de una población animal se cree está cerca de la extinción en cierta región, fueron capturados, marcados y liberados para mezclarse con la población. Después que tuvieron la oportunidad de mezclarse, se seleccionó una muestra aleatoria de 10 de estos animales. Si en realidad hay 25 animales de este tipo en la región, ¿Cuál es la probabilidad de que se encuentren más de 2 animales marcados? Distribución Poisson Distribución muy útil en la que la variable aleatoria representa el número de eventos independientes que ocurren a una velocidad constante en el tiempo o espacio. Algunos ejemplos comunes son: • Número de fallas que presenta una máquina por día • Número de defectos por metro de cable. • Cantidad de fracturas por km2 en la superficie de una caldera. • Número de hormigas de una cierta especie por m3 de tierra. Proceso Poisson Algunas condiciones que se deben cumplir en un proceso poisson son: • El número de resultados que ocurren en un intervalo de tiempo o región específico es independiente del número que ocurre en cualquier otro intervalo disjunto de tiempo o región del espacio disjunto. • La probabilidad de que un resultado sencillo ocurra en un intervalo de tiempo muy corto o una región pequeña es proporcional a la longitud del intervalo de tiempo o al tamaño de la región. Distribución Poisson Sea X una variable aleatoria que representa el número de eventos aleatorios independientes que ocurren a una rapidez constante sobre el tiempo o el espacio. Se dice entonces que la variable aleatoria X tiene una distribución de Poisson con función de probabilidad: λx −λ e , x = 0, 1, 2, . . . x! Para λ > 0. La media y la varianza son: f (X) = E(X) = λ V (X) = λ Distribución Poisson Fig: Representación gráfica Poisson(λ=3) Y 0.0 0.00 0.05 0.10 0.2 0.1 Y 0.15 0.3 0.20 Poisson(λ=1) 5 10 15 20 0 5 10 Número de eventos por intervalo Número de eventos por intervalo Poisson(λ=5) Poisson(λ=10) 15 20 15 20 Y 0.06 0.00 0.00 0.02 0.05 0.04 Y 0.10 0.08 0.10 0.15 0.12 0 0 5 10 Número de eventos por intervalo 15 20 0 5 10 Número de eventos por intervalo Ejemplo El número de grietas en un tramo de una autopista que son lo suficientemente importantes como para requerir reparación sigue una distribución Poisson con una media de 1.2 grietas por kilometro ¿Cuál es la probabilidad de que se requiera reparar máximo 2 grietas en un tramo de 1 kilometro? ¿Cuál es la probabilidad de que en trayecto de 5 kilómetros no se encuentre ninguna grieta? Se puede emplear un proceso Poisson para representar la ocurrencia de cargas estructurales con el tiempo. Suponga que el tiempo promedio entre ocurrencias de cargas es medio año. ¿Cuántas cargas se espera que ocurran durante dos años? ¿Cuál es la probabilidad de que ocurran más de cinco cargas durante dos años? Otras distribuciones de probabilidad Algunas otras distribuciones de probabilidad discretas son: • Uniforme. • Geométrica • Binomial Negativa. • Multinomial Bibliografía Canavos, G. (1988). Probabilidad y Estadística: Aplicaciones y métodos. Mc Graw Hill, México, vol. 1 edition. Devore, J. L. (2008). Probabilidad y estadística para ingeniería y ciencias. Thomson Paraninfo, México, vol. 7 edition. Montgomery, D. and Runger, G. (2004). Probabilidad y estadística aplicadas la ingeniería. Limusa-Wiley, México, 2 edition.