Métodos Estadı́sticos de la Ingenierı́a Práctica 5: Distribuciones de Probabilidad y el Teorema Central del Lı́mite Área de Estadı́stica e Investigación Operativa Mariano Amo Salas y Licesio J. Rodrı́guez-Aragón Abril 2010 Contenidos Práctica 5 . . . . . Variables Aleatorias . . . . . . . Variable Aleatoria Discreta . . Distribución de Bernoulli. . . . Distribución Binomial . . . . . . Otras distribuciones discretas. Variable Aleatoria Continua . . Distribución Uniforme. . . . . . Distribución Normal . . . . . . . Distribución Exponencial. . . . Teorema Central del Lı́mite . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 3 4 5 6 7 8 9 10 11 12 13 Contenidos Práctica 5 Variables Aleatorias Discretas. – Distribución de Bernoulli. – Distribución Binomial. – Otras Distribuciones Discretas. Variables Aleatorias Continuas – Distribución Uniforme. – Distribución Normal. – Distribución Exponencial. Teorema Central del Lı́mite. Ejercicios. Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 2 / 13 Variables Aleatorias El cálculo de probabilidades utiliza variables numéricas, que denominamos aleatorias, cuyos valores vienen determinados por el azar. Mediciones de un resultado numérico. Resultados cualitativos a los que se les asigna un número. Definiremos una Variable Aleatoria especificando los posibles valores de la variable y sus probabilidades respectivas o especificando el espacio de posibles valores y una función de densidad. Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 3 / 13 2 Variable Aleatoria Discreta Una V.A. es Discreta cuando toma un número de valores finito o numerable. Normalmente estos valores son los resultados de experimentos, número de ocurrencias de un determinado suceso. Función de Probabilidad: f (xi ) = P (x = xi ) Función de Distribución: F (xi ) = P (x ≤ xi ) = Métodos Estadı́sticos de la Ingenierı́a X f (xj ) j≤i Práctica 6 – 4 / 13 Distribución de Bernoulli Una Variable Aleatoria Discreta X seguirá una distribución de Bernoulli si únicamente puede tomar dos valores, 0 y 1. La distribución viene caracterizada por p = P (X = 1). Ejemplos de distribuciones de Bernoulli son lanzar una moneda al aire y observar su resultado o realizar un control de calidad sobre un producto y determinar si se acepta o se rechaza. Con R podemos generar una muestra aleatoria de variables aleatorias que sigan una distribución de Bernoulli(p): >sample(0:1,size=10,replace=TRUE, + prob=c(0.5,0.5)) Una V.A.D. que siga una distribución de Bernoulli tiene media µ = p y varianza σ 2 = p(1 − p). Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 5 / 13 3 Distribución Binomial La V.A. Discreta que sigue una distribución Binomial es aquella que surge al contabilizar los éxitos en n experimentos de Bernoulli. n k f (X = k) = p (1 − p)n−k k Para evaluar la función de probabilidad f (x) en R: >dbinom(k, size=n, prob=p) >dbinom(5,size=10,prob=1/2) P (X = 5), 5 éxitos en 10 experimentos de Bernoulli con p = 1/2 Para evaluar la función de distribucion F (x): >pbinom(k,size=n,prob=p) >pbinom(5,size=10,prob=1/2) P (x ≤ 5), 0, 1, . . . , 5 éxitos en 10 experimentos Gráfica de la función de probabilidad, f (x): >binomialf<-dbinom(0:10,size=10, prob=1/2) >plot(0:10,binomialf,type="h") Gráfica de la función de distribución, F (x): >binomialF<-pbinom(0:10,size=10, prob=1/2) >plot(0:10,binomialF,type="s") Además R permite simular una variable aleatoria, podemos entonces simular 1000 valores de una distribución Binomial: >binomialS<-rbinom(1000,size=10,pro=0.5) >barplot(table(binomialS)) Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 6 / 13 Otras distribuciones discretas Otra distribución común de V.A. Discretas es: Distribución de Poisson: número de sucesos en un intervalo de longitud fija. >dpois(x,lambda) >ppois(x,lambda) >rpois(n,lambda) Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 7 / 13 4 Variable Aleatoria Continua Diremos que una V.A. es Continua cuando puede tomar cualquier valor en un intervalo o unión de intervalos. No es posible conocer el valor exacto de una V.A. Continua, medir su valor es clasificarlo en un intervalo. Función de densidad: f (x) tal que Z x2 x1 f (x)dx = P (x1 < x < x2 ) Función de distribución: F (xi ) = P (x < xi ) = Z xi f (x)dx −∞ Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 8 / 13 Distribución Uniforme Un ejemplo de una distribución aleatoria continua es la distribución Uniforme en el intervalo [a, b], U(a, b): Esta distribución tendrá la función de densidad: 1 b−a a < x < b f (x) = 0 en el resto >dunif(x,a,b) y función de distribución: 0 x<a x−a a<x<b F (x) = b−a 1 x>b >punif(x,a,b) Podemos simular una variable aleatoria uniforme, U(2, 8): Para n = 10 simulaciones: >uniformeS<-runif(10,2,8) >hist(uniformeS,prob=TRUE) Para n = 100 simulaciones: >uniformeS<-runif(100,2,8) >hist(uniformeS,prob=TRUE) Para n = 1000 simulaciones: >uniformeS<-runif(1000,2,8) >hist(uniformeS,prob=TRUE) Para n = 10000 simulaciones: >uniformeS<-runif(10000,2,8) >hist(uniformeS,prob=TRUE) Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 9 / 13 5 Distribución Normal El modelo de distribución de probabilidad para variables continuas más importante es la distribución normal N (µ, σ), con función de densidad: (x−µ)2 1 f (x) = √ e− 2σ2 σ 2π La función de densidad, f (x), se obtiene: >dnorm(x,µ,σ) La de distribución, F (x): >pnorm(x,µ,σ) Y podemos simular n valores de una distribución normal: >rnorm(n,µ,σ) >normalS<-rnorm(10,0,1) >hist(normalS) >qqnorm(normalS) Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 10 / 13 Distribución Exponencial La distribución exponencial se utiliza para modelar la duración de vidas de personas, animales, componentes fı́sicos, tiempos de servicio, etc. Es una distribución que puede tomar cualquier valor positivo, no acotado. Su función de densidad viene dada por la expresión, f (x) = λe−λx , con media µ = 1/λ y desviación tı́pica σ = 1/λ. dexp y pexp nos proporcionan las funciones de densidad y de distribución. >exponencialS<-rexp(100,rate=1/5) >boxplot(exponencialS) >hist(exponencialS,prob=TRUE) Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 11 / 13 6 Teorema Central del Lı́mite El Teorema central del lı́mite establece que si x1 , x2 , . . . , xn son variables aleatorias independientes de media µi y varianza σi2 y formamos la variable suma: Y = x1 + x2 + · · · + xn , entonces para n grande podemos aproximar, Y ∼N X µi , qX σi2 El Teorema Central del Lı́mite indica que, bajo condiciones muy generales, la distribución de la suma de variables aleatorias tiende a una Distribución Normal cuando la cantidad de variables es muy grande. Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 12 / 13 Ejercicios Ejercicio 5.1:Estudiar el comportamiento de algunas variables aleatorias descritas por su distribución. Para ello se utilizarán los histogramas y las medias de tendencia o de dispersión. Ejercicio 5.2:Comprobar el Teorema Central del Lı́mite. Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 13 / 13 7