Algunas Distribuciones Notables de Variables Aleatorias

Estadı́stica Tema 3: Cálculo de Probabilidades Unidad 4: Algunas Distribuciones Notables de Variables Aleatorias Área de Estadı́stica e Investigación Operativa Licesio J. Rodrı́guez-Aragón Noviembre 2010 Contenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Variables Aleatorias Discretas Distribución Uniforme . . . . . . . Distribución de Bernoulli . . . . . Distribución Binomial . . . . . . . Distribución Binomial con R . . . Distribución de Poisson . . . . . . Distribución de Poisson con R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Variables Aleatorias Continuas Distribución Uniforme . . . . . . . . . Distribución de Uniforme con R . . Distribución Exponencial . . . . . . . Distribución de Exponencial con R Distribución Normal. . . . . . . . . . . Distribución Normal con R . . . . . . Distribución Normal Estándar. . . . Teorema Central del Lı́mite . . . . . Aproximaciones por la Normal . . . Distribución χ2n de Pearson . . . . . . Distribución tn de Student . . . . . . Distribución Fm,n de Snedecor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . . . . . 3 4 5 6 8 9 11 12 13 14 15 16 17 18 19 23 24 26 30 34 Contenidos Variables Aleatorias Discretas. – Uniforme, Bernoulli, Binomial, Poisson. Variables Aleatorias Continuas. – Uniforme, Exponencial, Normal, aproximaciones por la Normal, χ2 de Pearson, t de Student y F de Snedecor. Presentamos en este tema algunas Distribuciones de Variables Aleatorias, primero discretas y luego contı́nuas, a continuación presentaremos su Esperanza y Varianza. Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 2 / 37 3 / 37 Variables Aleatorias Discretas Distribución Uniforme Sea X una variable aleatoria que toma valores x1 , x2 , . . . , xk con igual probabilidad, entonces la Función de Probabilidad de esta Variable Aleatoria Uniforme viene dada por, f (x; k) = 1/k para x = x1 , x2 , . . . , xk , siendo k un parámetro de la distribución de probabilidad. Su Esperanza y Varianza vienen dadas por las expresiones: E(X) = µ = k X xi f (xi ) = i=1 Var(X) = σ 2 = i=1 k X (xi − µ)2 i=1 k X xi k Licesio J. Rodrı́guez-Aragón = k X x2 i i=1 k k − . k X xi i=1 k !2 Tema 3, Unidad 4 – 4 / 37 2 Distribución de Bernoulli Daniel Bernoulli (1700-1782). Se conoce como prueba de Bernoulli, todo experimento aleatorio en el que sólo son posibles dos resultados, eg. “éxito” o “fracaso”. Definamos X como la variable aleatoria que toma el valor 1 con probabilidad p, “éxito”, y 0 con probabilidad 1 − p, “fracaso”. La Función de Probabilidad de la Variable Aleatoria X vendrá dada por, f (x; p) = px · (1 − p)1−x , para x = 0, 1. Su Esperanza y Varianza vienen dadas por las expresiones: E(X) = 0 · f (0) + 1 · f (1) = 0 · (1 − p) + 1 · p = p. Var(X) = E(X 2 ) − E(X)2 = (0 · f (0) + 1 · f (1)) − p2 = p − p2 = p(1 − p). Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 5 / 37 3 Distribución Binomial Supongamos que realizamos n experimentos de Bernoulli, con probabilidad de “éxito” p para cada uno de ellos. Definamos la Variable Aleatoria X como el número de éxitos en esas n ejecuciones del experimento. La Función de Probabilidad es la siguiente: n x f (x; n, p) = p (1 − p)n−x , para x = 0, 1, 2, . . . , n, x siendo n y p parámetros de la distribución de probabilidad. Su Esperanza y Varianza vienen dadas por las expresiones, E(X) = µ = E(X1 + · · · + Xn ) = E(X1 ) + · · · + E(Xn ) = np. Var(X) = σ 2 = Var(X1 ) + · · · + Var(Xn ) = np(1 − p). Con Xi variables aleatorias independientes de Bernoulli. Las gráficas de la Función de Probabilidad y la Función de Distribución de una variable aleatoria Binomial, de parámetros n = 10, p = 0.3. Distribución Binomial: n = 10, p = 0.3 0.6 Probabilidad Acumulada 0.0 0.00 0.2 0.4 0.15 0.05 0.10 Probabilidad 0.20 0.8 0.25 1.0 Distribución Binomial: n = 10, p = 0.3 0 2 4 6 8 10 0 Número de Exitos 2 4 6 8 10 Número de Exitos Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 6 / 37 4 Distribución Binomial Variable Aleatoria Binomial de parámetros n = 10, p = 0.6. Distribución Binomial: n = 10, p = 0.6 0.6 0.4 0.0 0.00 0.2 0.05 0.10 Probabilidad 0.15 Probabilidad Acumulada 0.8 0.20 1.0 0.25 Distribución Binomial: n = 10, p = 0.3 0 2 4 6 8 10 0 Número de Exitos 2 4 6 8 10 Número de Exitos Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 7 / 37 Distribución Binomial con R Función de Probabilidad: > > + + > > x <- 0:10 plot(x, dbinom(x, size=10, prob=0.6), xlab="Número de Exitos", ylab="Probabilidad", main="Distribución Binomial: n = 10, p = 0.3", type="h") points(x, dbinom(x, size=10, prob=0.6), pch=16) abline(h=0, col="gray") Función de Distribución: > > > + + > x <- 0:10 x <- rep(x, rep(2, length(x))) plot(x[-1], pbinom(x, size=10, prob=0.6)[-length(x)], xlab="Número de Exitos", ylab="Probabilidad Acumulada", main="Distribución Binomial: n = 10, p = 0.6", type="l") abline(h=0, col="gray") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 8 / 37 5 Distribución de Poisson Siméon Denis Poisson (1781-1840). Una Variable Aleatoria discreta X se dice que es una variable de Poisson si su función de probabilidad es de la forma: f (x; λ) = λx e−λ x! , para x = 0, 1, 2, . . . , siendo λ un parámetro positivo. Su Esperanza y Varianza vienen dadas por las expresiones, E(X) = µ = ∞ X xf (x) = x=0 ∞ ∞ X X λx e−λ λx−1 x = λe−λ = λ. x! (x − 1)! x=0 x=0 Var(X) = σ 2 = E(X 2 ) − E(X)2 = E(X(X − 1)) + µ − µ2 = µ = λ. La distribución de Poisson se presenta en experimentos en los que se estudia la ocurrencia de sucesos en un intervalo de tiempo dado. Usualmente para sucesos “raros”, pi <<. El número de vehı́culos que pasan a través de un cierto punto en una ruta durante un periodo definido de tiempo. El número de errores de ortografı́a que uno comete al escribir una única página. El número de llamadas telefónicas en una central telefónica por minuto. El número de servidores web accedidos por minuto. El número de mutaciones de determinada cadena de ADN después de cierta cantidad de radiación. Función de Probabilidad y de Distribución, Distribución Poisson: Media = 3 0.6 Probabilidad Acumulada 0.4 0.10 0.00 0.2 0.05 Probabilidad 0.15 0.8 0.20 1.0 Distribución Poisson: Media = 3 0 2 4 6 8 10 0 x 2 4 6 8 10 x λ=3 Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 9 / 37 6 Distribución de Poisson Función de Probabilidad y de Distribución, Distribución Poisson: Media = 6 0.6 0.4 0.0 0.00 0.2 0.05 Probabilidad Probabilidad Acumulada 0.10 0.8 0.15 1.0 Distribución Poisson: Media = 6 0 5 10 15 0 5 10 x 15 x λ=6 La distribución de Poisson aproxima de forma muy acertada a la distribución Binomial cuando n > 25 y p < .1 y np = λ < 5 Distribución Poisson: Media = 3 Probabilidad 0.10 0.05 0.10 0.00 0.00 0.05 Probabilidad 0.15 0.15 0.20 0.20 Distribución Binomial: n = 30, p = 0.1 0 2 4 6 8 10 0 Número de Exitos 2 4 6 8 10 x n x λx e−λ f (x; n, p) = p (1 − p)n−x → f (x; λ) = x x! Para un proceso de Poisson, la probabilidad de obtener exactamente x éxitos en n intentos viene dada por el lı́mite de la distribución binomial. Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 10 / 37 7 Distribución de Poisson con R Función de Probabilidad: > > + > > x <- 0:15 plot(x, dpois(x, lambda=6), xlab="x", ylab="Probabilidad", main="Distribución Poisson: Media = 6", type="h") points(x, dpois(x, lambda=6), pch=16) abline(h=0, col="gray") Función de Distribución: > > > + + > x <- 0:15 x <- rep(x, rep(2, length(.x))) plot(x[-1], ppois(x, lambda=6)[-length(.x)], xlab="x", ylab="Probabilidad Acumulada", main="Distribución Poisson: Media = 6", type="l") abline(h=0, col="gray") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 11 / 37 8 12 / 37 Variables Aleatorias Continuas Distribución Uniforme Cuando el valor de la variable aleatoria se mide y no se cuenta, entramos dentro del concepto de variable aleatoria continua. Una Variable Aleatoria será Uniforme en el intervalo (a, b) si su Función de Densidad es constante, es decir:  1  b−a para a < x < b f (x) =  0 en el resto. Su Función de Distribución, viene dada por: F (x) = x Z f (t)dt = −∞   0 x−a b−a  1 si x ≤ a, para a < x < b si x ≥ b. Siendo a y b los parámetros de la distribución. Su Esperanza y Varianza vienen dadas por las expresiones: E(X) = Var(X) = Z ∞ −∞ Z ∞ xf (x)dx = −∞ Z b xf (x)dx = a a+b . 2 (x − µ)2 f (x)dx = E(X 2 ) − E(X)2 = (b − a)2 . 12 Las gráficas de la Función de Densidad y de la Función de Distribución para una Variable Aleatoria Uniforme en (0, 1), 0.8 0.6 0.4 0.2 0.0 0.0 0.2 0.4 Densidad 0.6 Probabilidad Acumulada 0.8 1.0 Uniform Distribution: min=0, max=1 1.0 Distribución Uniforme: mín=0, máx=1 −0.5 0.0 0.5 1.0 1.5 −0.5 x 0.0 0.5 1.0 1.5 x Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 13 / 37 9 Distribución de Uniforme con R Función de Densidad: > x <- seq(-.5, 1.5, length=100) > plot(x, dunif(x, min=0, max=1), xlab="x", ylab="Densidad", + main="Distribución Uniforme: mı́n=0, máx=1", type="l") > abline(h=0, col="gray") Función de Distribución: > x <- seq(-0.5, 1.5, length=100) > plot(x, punif(x, min=0, max=1), xlab="x", + ylab="Probabilidad Acumulada", + main="Uniform Distribution: min=0, max=1", type="l") > abline(h=0, col="gray") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 14 / 37 10 Distribución Exponencial Una Variable Aleatoria X sigue una distribución Exponencial si su Función de Densidad viene dada por,  −λx para x ≥ 0 y λ > 0  λe f (x; λ) =  0 en el resto. Su función de Distribución será, F (x) = Z x f (t)dt = 0 0 1 − e−λx si x ≤ 0, para x ≥ 0 Su Esperanza y Varianza vienen dadas por las expresiones, Z ∞ 1 E(X) = µ = xf (x)dx = . λ 0 Var(X) = σ 2 = E(X 2 ) − E(X)2 = 1/λ2 . La representacón gráfica de las Funciones de Densidad y de Distribución para una Variable aleatoria que siga una distribución Exponencial de parámetro λ = 5, Distribución Exponencial: λ = 5 0 0.6 0.4 0.0 1 0.2 2 Densidad 3 Probabilidad Acumulada 4 0.8 5 1.0 Distribución Exponencial: λ = 5 0.0 0.5 1.0 1.5 0.0 x 0.5 1.0 1.5 x La distribución Exponencial modeliza el tiempo transcurrido entre dos sucesos “raros” consecutivos modelizados por la distribución de Poisson. Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 15 / 37 11 Distribución de Exponencial con R Función de Densidad: > x <- seq(0, 1.52, length=100) > plot(x, dexp(x, rate=5), xlab="x", ylab="Densidad", + main=expression(paste("Distribución Exponencial: ",lambda," = 5")), + type="l") > abline(h=0, col="gray") Función de Distribución: > x <- seq(0, 1.52, length=100) > plot(x, pexp(x, rate=5), xlab="x", + ylab="Probabilidad Acumulada", + main=expression(paste("Distribución Exponencial: ",lambda," = 5")), + type="l") > abline(h=0, col="gray") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 16 / 37 12 Distribución Normal Johann Carl Friedrich Gauss (1777-1855). La Distribución Normal es clave en multitud de fenómenos naturales. Sobre todo destacar la distribución de errores de medida, que siguen una distribución Normal. Una variable aleatoria X, se dice que sigue una distribución Normal si su Función de Densidad es de la forma, (x − µ)2 1 , f (x; µ, σ) = √ exp − 2σ 2 σ 2π con −∞ < x < ∞ siendo µ y σ parámetros de la distribución. En estadı́stica esta distribución se conoce como la “distribución normal”. Mientras en otros campos se conoce con el nombre de distribución Gaussiana o Campana Gaussiana. Representación gráfica de las funciones de densidad de diferentes N (µ, σ), Distribución Normal: µ = 0 , σ = 0.5, 1, 1.5 0.4 0.8 Distribución Normal: µ =−1, 0, 1, σ =1 µ = −1 µ=0 σ = 0.5 0.4 Densidad 0.2 Densidad 0.3 0.6 µ=1 σ = 1.5 0.0 0.0 0.1 0.2 σ=1 −3 −2 −1 0 1 2 3 −3 −2 −1 0 x 1 2 3 x La Esperanza y la Varianza de una variable aleatoria X de distribución N (µ, σ), son respectivamente, 1 E(X) = xf (x)dx = √ σ 2π −∞ Z ∞ σ2 Var(X) = E((X − µ)2 ) = √ 2π Z Z ∞ xe − (x−µ) 2 2σ 2 dx = −∞ z = (x − µ)/σ, dx = σdz ∞ z 2 e−z 2 /2 1 =√ 2π Z ∞ (µ + σz)e−z 2 /2 dz = µ −∞ dz = −∞ 2 u = z, dv = ze−z /2 dz h Z ∞ i∞ σ2 −z 2 /2 −z 2 /2 =√ −ze + e dz = σ 2 (0 + 1) = σ 2 −∞ 2π −∞ Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 17 / 37 13 Distribución Normal con R Función de Densidad: > x <- seq(-3.291, 3.291, length=100) > plot(x, dnorm(x, mean=0, sd=1),col="blue",xlab="x", ylab="Densidad", + main=expression(paste("Distribución Normal: ", mu, " = 0 , ", sigma, " = 1")), + type="l") > abline(h=0, col="gray") Función de Distribución: > x <- seq(-3.291, 3.291, length=100) > plot(x, pnorm(x, mean=0, sd=1),col="blue",xlab="x", ylab="Probabilidad Acumulada", + main=expression(paste("Distribución Normal: ", mu, " = 0 , ", sigma, " = 1")), + type="l") > abline(h=0, col="gray") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 18 / 37 14 Distribución Normal Estándar La función de Distribución de una N (µ, σ), 1 F (x) = √ σ 2π Z x (t − µ)2 exp − dt. 2σ 2 −∞ La transformación Z = (X − µ)/σ nos proporciona valores de una distribución normal de media cero y varianza uno, N (0, 1). 0.6 0.4 0.0 0.2 Probabilidad Acumulada 0.8 1.0 Distribución Normal: µ = 0, σ = 1 −3 −2 −1 0 1 2 3 x Definimos entonces la Función de Distribución de la Normal Estandarizada o Tipificada, 2 Z z 1 t Φ(z) = √ exp − dt 2 2π −∞ Esta integral no puede calcularse por métodos ordinarios, debemos acudir a integración numérica, esta función Φ se encuentra recogida en las Tablas de la Normal Tipificada. De esta forma si X sigue una distribución N (0, 1), para el cálculo de P(a < X < b) podemos hacer uso de las tablas, P(a < X < b) = Φ(b) − Φ(a). La “distribución normal estandar” se obtiene al tomar una distribución normal con parámetros µ = 0 y σ 2 = 1. Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 19 / 37 15 Distribución Normal Estándar X ≡ N (0, 1), P(1 < X < 2) = Φ(2) − Φ(1) 0.3 0.2 Density 0.0 0.1 0.2 0.0 0.1 Densidad 0.3 0.4 Φ(1) 0.4 Φ(2) −3 −2 −1 0 1 2 3 −3 −2 −1 0 x 1 2 3 x 0.2 0.0 0.1 Density 0.3 0.4 Φ(2)−Φ(1) −3 −2 −1 0 1 2 3 x P(1 < X < 2) = Φ(2) − Φ(1) Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 20 / 37 16 Distribución Normal Estándar Si X sigue una distribución Normal cualquiera, N (µ, σ), la P(a < X < b) puede calcularse realizando la transformación, Z = (X − µ)/σ, es decir: P(a < X < b) = P((a − µ)/σ < Z < (b − µ)/σ) = = Φ((b − µ)/σ) − Φ((a − µ)/σ). Una conclusión de la definición de Φ es que, Φ(−x) = 1 − Φ(x), esta relación es muy útil ya que en la mayorı́a de las tablas, Φ sólo aparece tabulada para valores positivos de x. Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 21 / 37 17 Distribución Normal Estándar Vamos ahora a calcular, P(µ − kσ < X < µ + kσ), para X ≡ N (µ, σ), P(µ − kσ < X < µ + kσ) = P(−k < (X − µ)/σ < k) = = Φ(k) − Φ(−k) = 2Φ(k) − 1, que no depende ni de µ ni de σ. P(µ − σ < X < µ + σ) = 2Φ(1) − 1 = 0.6826895 P(µ − 2σ < X < µ + 2σ) = 2Φ(2) − 1 = 0.9544997 P(µ − 3σ < X < µ + 3σ) = 2Φ(3) − 1 = 0.9973002 > 2*pnorm(1,mean=0,sd=1)-1 [1] 0.6826895 Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 22 / 37 Teorema Central del Lı́mite • Si X1 , X2 , . . . , Xn son n variables aleatorias independientes y X = k1 · X1 + k2 · X2 + · · · + kn · Xn , entonces X es otra v.a. de media y varianza: X X E(X) = ki E(Xi ) Var(X) = ki2 Var(Xi ) i i Si las Xi son normales, también lo será X. • Si lasP v.a. X1 , . . . , Xn , constituyen una muestra de una población de media µ y varianza σ 2 y 1 X=n Xi , es la media muestral: E(X) = 1X E(Xi ) = µ n Var(X) = i 1 X nσ 2 σ2 Var(X ) = = i n2 n2 n i Además se tendrá que X ≡ N (µ, σ 2 /n), n > 30. Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 23 / 37 18 Aproximaciones por la Normal Si X es una variable Binomial, de parámetros n y p, entonces si n es grande y ni p ni 1 − p son próximos a cero: podemos considerar que X sigue aproximadamente una distribución N (µ = n · p, σ 2 = n · p · (1 − p)). Z=p X −n·p n · p · (1 − p) ≡ N (0, 1). Distribución Normal: µ = 40, σ = 4.8989 0.06 0.00 0.00 0.02 0.04 Densidad 0.04 0.02 Probabilidad 0.06 0.08 0.08 Distribución Binomial: n = 100, p = 0.4 25 30 35 40 45 50 55 25 30 35 Número de Exitos 40 45 50 55 x Si X es una distribución de Poisson de parámetro λ grande, λ > 25, en la práctica se puede considerar que X sigue una distribución N (µ = λ, σ 2 = λ). Z= X −λ √ ≡ N (0, 1). λ Distribución Normal: µ = 36, σ = 6 0.04 Densidad 0.00 0.00 0.01 0.01 0.02 0.03 0.03 0.02 Probabilidad 0.04 0.05 0.05 0.06 0.06 Distribución de Poisson: λ = 36 20 30 40 50 20 x 30 40 50 x Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 24 / 37 19 Aproximaciones por la Normal con R Aproximación de la Binomial por la Normal: > > + + > > x <- seq(24, 56, length=100) plot(x, dnorm(x, mean=40, sd=sqrt(24)), xlab="x", ylab="Densidad", main=expression(paste("Distribución Normal: ", mu, " = 40, ", sigma, " = 4.89")), type="l") x <- 24:56 points(x, dbinom(x, size=100, prob=0.4), col="red", pch=16) Aproximación de la distribución de Poisson por la Normal: > > + + > > x <- seq(18, 57, length=100) plot(x, dnorm(x, mean=40, sd=sqrt(40)), xlab="x", ylab="Densidad", main=expression(paste("Distribución Normal: ", mu, " = 40, ", sigma, " = 6.32")), type="l") x <- 18:57 points(x, dpois(x, lambda=40), col="blue", pch=16) Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 25 / 37 20 Distribución χ2n de Pearson Karl Pearson (1857-1936). Sean X1 , X2 , . . . , Xn , n variables aleatorias independientes entre sı́, del tipo N (0, 1). La variable: X = X12 + X22 + · · · + Xn2 , se dice que es una χ2n , ji-cuadrado de Pearson con n grados de libertad. La función de densidad de una variable aleatoria χ2n es:  n/2−1 −x/2 x e  si x > 0  2n/2 ·Γ(n/2) f (x; n) =   0 en el resto. R∞ Siendo Γ la función gamma definida: Γ(α) = 0 xα−1 e−x dx para α > 0. Varianza de la distribución χ2n , son respectivamente, La Esperanza y E(X) = µ = n Var(X) = σ 2 = 2n 1.0 Distribución χ2 : n = 1,2,3,4,5 0.6 0.4 Densidad 0.8 n=1 n=2 n=3 n=4 0.0 0.2 n=5 0 2 4 6 8 10 12 χ2 Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 26 / 37 21 Distribución χ2n de Pearson Propiedad: La suma de χ2n1 , χ2n2 , . . . , independientes, es otra χ2n siendo n = n1 + n2 + . . . . La Función de Distribución F (x) nos permite saber, dada una variable aleatoria X ≡ χ2n , Z a f (x; n)dx. P(X < a) = p = 0 El cálculo de esta integral se encuentra en la Tabla de distribución χ2n de Pearson. > qchisq(0.95,df=3) [1] 7.814728 Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 27 / 37 22 Distribución χ2n de Pearson Más en concreto la Función de Distribución Inversa: para distintos valores de n y de p se puede buscar en la tabla su cuantil a. 0.10 Densidad 0.15 0.20 0.25 χ2 n=3, P(X<a)=p=F(a) 0.00 0.05 p a 0 2 4 6 8 10 x Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 28 / 37 χ2n de Pearson con R Distribución χ2n de Pearson: > > + > > > > > > > > > > > x <- seq(0, 12.116, length=100) plot(x, dchisq(x, df=1), xlab=expression(chi^2), ylab="Densidad", main=expression(paste("Distribución ", chi^2," : n = 1,2,3,4,5")), type="l") abline(h=0, col="gray") abline(v=0, col="gray") text(1,1,"n = 1",col="black") lines(x, dchisq(x, df=2),col="blue") text(2,.34,"n = 2",col="blue") lines(x, dchisq(x, df=3),col="green") text(3,.31,"n = 3",col="green") lines(x, dchisq(x, df=4),col="red") text(4,.28,"n = 4",col="red") lines(x, dchisq(x, df=5),col="pink") text(5,.25,"n = 5",col="pink") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 29 / 37 23 Distribución tn de Student William Sealy Gosset (1876-1937). Sea Z una variable aleatoria N (0, 1) e Y una χ2n ambas independientes, entonces la variable aleatoria, X=p Z Y /n , se denomina tn de Student con n grados de libertad. La función de densidad de una variable aleatoria tn es:  2 −(n+1)/2   √nβ(11 , n ) 1 + xn 2 2 f (x; n) =   0 para − ∞ < x < ∞ yn>0 en el resto. 1 )·Γ(α2 ) Siendo β la función beta definida: β(α1 , α2 ) = Γ(α Γ(α1 +α2 ) para α1 , α2 > 0. La Esperanza y Varianza de la distribución tn , son: E(X) = µ = 0, para n > 1, indefinida para otros valores. Var(X) = σ 2 = n , para n > 2, indefinida para otros valores. n−2 0.4 Distribución t Student : n = 1,2,3,4 N(0,1) n=1 n=2 0.2 n=4 0.0 0.1 Densidad 0.3 n=3 −3 −2 −1 0 1 2 3 x Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 30 / 37 24 Distribución tn de Student Propiedad: A medida que aumenta n, tn −→ N (0, 1). La Función de Distribución F (x) nos permite saber, dada una variable aleatoria X ≡ tn , Z a f (x; n)dx. P(X < a) = p = −∞ El cálculo de esta integral se encuentra en la Tabla de distribución tn de Student. > qt(0.975,df=5) [1] 2.570582 Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 31 / 37 25 Distribución tn de Student Más en concreto la Función de Distribución Inversa: para distintos valores de n y de p se puede buscar en la tabla su cuantil a. 0.2 0.1 Densidad 0.3 t n=3, P(X<a)=p=F(a) 0.0 p a −4 −2 0 2 4 x Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 32 / 37 tn de Student con R Distribución tn de Student: > > + > > > > > > > > > > x <- seq(-3.291, 3.291, length=100) plot(x, dnorm(x, mean=0, sd=1), xlab="x", ylab="Densidad", main="Distribución t Student : n = 1,2,3,4",, type="l") abline(h=0, col="gray") text(2,.38,"N(0,1)",col="black") lines(.x, dt(x, df=1),col="blue") text(2,.36,"n = 1",col="blue") lines(.x, dt(x, df=2),col="green") text(2,.34,"n = 2",col="green") lines(.x, dt(x, df=3),col="red") text(2,.32,"n = 3",col="red") lines(.x, dt(x, df=4),col="pink") text(2,.30,"n = 4",col="pink") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 33 / 37 26 Distribución Fm,n de Snedecor George Waddel Snedecor (1881-1974). Sean U y V dos variables independientes distribuidas según leyes ji-cuadrado de m y n grados de libertad respectivamente, la variable X, X= U/m , V /n se dice que es una variable Fm,n de Snedecor con m y n grados de libertad, en el numerador y denominador respectivamente. La función de densidad viene dada por la expresión, f (x; m, n) =      (m/n)m/2 β( m ,n) 2 2 · xm/2−1 (m+n)/2 m 1+ ( n x) 0 para x > 0 y m, n > 0 en el resto. La Esperanza y la Varianza de una distribución Fm,n son: E(X) = µ = Var(X) = σ 2 = n , para n > 2, indefinida para otros valores. n−2 2n2 (m + n − 2) , para n > 4, indefinida para otros valores. m(n − 2)2 (n − 4) 2.0 Distribución F: m,n m=1, n=1 m=2, n=1 1.5 m=5, n=2 1.0 m=100, n=100 0.0 0.5 Densidad m=100, n=1 0 2 4 6 8 f Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 34 / 37 27 Distribución Fm,n de Snedecor Propiedad: Si X ≡ Fm,n entonces 1 X ≡ Fn,m . La Función de Distribucón F (x) nos permite saber, dada una variable aleatoria X ≡ Fm,n , Z a f (x; m, n)dx. P(X < a) = p = 0 El cálculo de esta integral se encuentra en la Tabla de distribución Fm,n de Snedecor. > qf(0.95,df1=3,df2=4) [1] 6.591382 Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 35 / 37 28 Distribución Fm,n de Snedecor Más en concreto la Función de Distribución Inversa: para distintos valores de m, n y de p se puede buscar en la tabla su cuantil a. 0.3 0.2 Densidad 0.4 0.5 F m=5,n=2, P(X<a)=p=F(a) 0.0 0.1 p a 0 1 2 3 4 5 6 x Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 36 / 37 Fm,n de Snedecor con R Distribución Fm,n de Snedecor: > > + > > > > > > > > > > > x <- seq(0, 8, length=400) plot(x, df(x, df1=1, df2=1), xlab="f", ylab="Densidad", main="Distribución F: m,n", type="l") abline(h=0, col="gray") abline(v=0, col="gray") text(6,2,"m=1, n=1",col="black") lines(.x, df(x, df1=2, df2=1),col="blue") text(6,1.8,"m=2, n=1",col="blue") lines(.x, df(x, df1=5, df2=2),col="green") text(6,1.6,"m=5, n=2",col="green") lines(.x, df(x, df1=100, df2=1),col="red") text(6,1.4,"m=100, n=1",col="red") lines(.x, df(x, df1=100, df2=100),col="pink") text(6,1.2,"m=100, n=100",col="pink") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 37 / 37 29

Algunas Distribuciones Notables de Variables Aleatorias

Documentos relacionados

Productos

Apoyo

Algunas Distribuciones Notables de Variables Aleatorias

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib