Estadı́stica Tema 3: Cálculo de Probabilidades Unidad 4: Algunas Distribuciones Notables de Variables Aleatorias Área de Estadı́stica e Investigación Operativa Licesio J. Rodrı́guez-Aragón Noviembre 2010 Contenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Variables Aleatorias Discretas Distribución Uniforme . . . . . . . Distribución de Bernoulli . . . . . Distribución Binomial . . . . . . . Distribución Binomial con R . . . Distribución de Poisson . . . . . . Distribución de Poisson con R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Variables Aleatorias Continuas Distribución Uniforme . . . . . . . . . Distribución de Uniforme con R . . Distribución Exponencial . . . . . . . Distribución de Exponencial con R Distribución Normal. . . . . . . . . . . Distribución Normal con R . . . . . . Distribución Normal Estándar. . . . Teorema Central del Lı́mite . . . . . Aproximaciones por la Normal . . . Distribución χ2n de Pearson . . . . . . Distribución tn de Student . . . . . . Distribución Fm,n de Snedecor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . . . . . 3 4 5 6 8 9 11 12 13 14 15 16 17 18 19 23 24 26 30 34 Contenidos Variables Aleatorias Discretas. – Uniforme, Bernoulli, Binomial, Poisson. Variables Aleatorias Continuas. – Uniforme, Exponencial, Normal, aproximaciones por la Normal, χ2 de Pearson, t de Student y F de Snedecor. Presentamos en este tema algunas Distribuciones de Variables Aleatorias, primero discretas y luego contı́nuas, a continuación presentaremos su Esperanza y Varianza. Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 2 / 37 3 / 37 Variables Aleatorias Discretas Distribución Uniforme Sea X una variable aleatoria que toma valores x1 , x2 , . . . , xk con igual probabilidad, entonces la Función de Probabilidad de esta Variable Aleatoria Uniforme viene dada por, f (x; k) = 1/k para x = x1 , x2 , . . . , xk , siendo k un parámetro de la distribución de probabilidad. Su Esperanza y Varianza vienen dadas por las expresiones: E(X) = µ = k X xi f (xi ) = i=1 Var(X) = σ 2 = i=1 k X (xi − µ)2 i=1 k X xi k Licesio J. Rodrı́guez-Aragón = k X x2 i i=1 k k − . k X xi i=1 k !2 Tema 3, Unidad 4 – 4 / 37 2 Distribución de Bernoulli Daniel Bernoulli (1700-1782). Se conoce como prueba de Bernoulli, todo experimento aleatorio en el que sólo son posibles dos resultados, eg. “éxito” o “fracaso”. Definamos X como la variable aleatoria que toma el valor 1 con probabilidad p, “éxito”, y 0 con probabilidad 1 − p, “fracaso”. La Función de Probabilidad de la Variable Aleatoria X vendrá dada por, f (x; p) = px · (1 − p)1−x , para x = 0, 1. Su Esperanza y Varianza vienen dadas por las expresiones: E(X) = 0 · f (0) + 1 · f (1) = 0 · (1 − p) + 1 · p = p. Var(X) = E(X 2 ) − E(X)2 = (0 · f (0) + 1 · f (1)) − p2 = p − p2 = p(1 − p). Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 5 / 37 3 Distribución Binomial Supongamos que realizamos n experimentos de Bernoulli, con probabilidad de “éxito” p para cada uno de ellos. Definamos la Variable Aleatoria X como el número de éxitos en esas n ejecuciones del experimento. La Función de Probabilidad es la siguiente: n x f (x; n, p) = p (1 − p)n−x , para x = 0, 1, 2, . . . , n, x siendo n y p parámetros de la distribución de probabilidad. Su Esperanza y Varianza vienen dadas por las expresiones, E(X) = µ = E(X1 + · · · + Xn ) = E(X1 ) + · · · + E(Xn ) = np. Var(X) = σ 2 = Var(X1 ) + · · · + Var(Xn ) = np(1 − p). Con Xi variables aleatorias independientes de Bernoulli. Las gráficas de la Función de Probabilidad y la Función de Distribución de una variable aleatoria Binomial, de parámetros n = 10, p = 0.3. Distribución Binomial: n = 10, p = 0.3 0.6 Probabilidad Acumulada 0.0 0.00 0.2 0.4 0.15 0.05 0.10 Probabilidad 0.20 0.8 0.25 1.0 Distribución Binomial: n = 10, p = 0.3 0 2 4 6 8 10 0 Número de Exitos 2 4 6 8 10 Número de Exitos Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 6 / 37 4 Distribución Binomial Variable Aleatoria Binomial de parámetros n = 10, p = 0.6. Distribución Binomial: n = 10, p = 0.6 0.6 0.4 0.0 0.00 0.2 0.05 0.10 Probabilidad 0.15 Probabilidad Acumulada 0.8 0.20 1.0 0.25 Distribución Binomial: n = 10, p = 0.3 0 2 4 6 8 10 0 Número de Exitos 2 4 6 8 10 Número de Exitos Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 7 / 37 Distribución Binomial con R Función de Probabilidad: > > + + > > x <- 0:10 plot(x, dbinom(x, size=10, prob=0.6), xlab="Número de Exitos", ylab="Probabilidad", main="Distribución Binomial: n = 10, p = 0.3", type="h") points(x, dbinom(x, size=10, prob=0.6), pch=16) abline(h=0, col="gray") Función de Distribución: > > > + + > x <- 0:10 x <- rep(x, rep(2, length(x))) plot(x[-1], pbinom(x, size=10, prob=0.6)[-length(x)], xlab="Número de Exitos", ylab="Probabilidad Acumulada", main="Distribución Binomial: n = 10, p = 0.6", type="l") abline(h=0, col="gray") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 8 / 37 5 Distribución de Poisson Siméon Denis Poisson (1781-1840). Una Variable Aleatoria discreta X se dice que es una variable de Poisson si su función de probabilidad es de la forma: f (x; λ) = λx e−λ x! , para x = 0, 1, 2, . . . , siendo λ un parámetro positivo. Su Esperanza y Varianza vienen dadas por las expresiones, E(X) = µ = ∞ X xf (x) = x=0 ∞ ∞ X X λx e−λ λx−1 x = λe−λ = λ. x! (x − 1)! x=0 x=0 Var(X) = σ 2 = E(X 2 ) − E(X)2 = E(X(X − 1)) + µ − µ2 = µ = λ. La distribución de Poisson se presenta en experimentos en los que se estudia la ocurrencia de sucesos en un intervalo de tiempo dado. Usualmente para sucesos “raros”, pi <<. El número de vehı́culos que pasan a través de un cierto punto en una ruta durante un periodo definido de tiempo. El número de errores de ortografı́a que uno comete al escribir una única página. El número de llamadas telefónicas en una central telefónica por minuto. El número de servidores web accedidos por minuto. El número de mutaciones de determinada cadena de ADN después de cierta cantidad de radiación. Función de Probabilidad y de Distribución, Distribución Poisson: Media = 3 0.6 Probabilidad Acumulada 0.4 0.10 0.00 0.2 0.05 Probabilidad 0.15 0.8 0.20 1.0 Distribución Poisson: Media = 3 0 2 4 6 8 10 0 x 2 4 6 8 10 x λ=3 Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 9 / 37 6 Distribución de Poisson Función de Probabilidad y de Distribución, Distribución Poisson: Media = 6 0.6 0.4 0.0 0.00 0.2 0.05 Probabilidad Probabilidad Acumulada 0.10 0.8 0.15 1.0 Distribución Poisson: Media = 6 0 5 10 15 0 5 10 x 15 x λ=6 La distribución de Poisson aproxima de forma muy acertada a la distribución Binomial cuando n > 25 y p < .1 y np = λ < 5 Distribución Poisson: Media = 3 Probabilidad 0.10 0.05 0.10 0.00 0.00 0.05 Probabilidad 0.15 0.15 0.20 0.20 Distribución Binomial: n = 30, p = 0.1 0 2 4 6 8 10 0 Número de Exitos 2 4 6 8 10 x n x λx e−λ f (x; n, p) = p (1 − p)n−x → f (x; λ) = x x! Para un proceso de Poisson, la probabilidad de obtener exactamente x éxitos en n intentos viene dada por el lı́mite de la distribución binomial. Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 10 / 37 7 Distribución de Poisson con R Función de Probabilidad: > > + > > x <- 0:15 plot(x, dpois(x, lambda=6), xlab="x", ylab="Probabilidad", main="Distribución Poisson: Media = 6", type="h") points(x, dpois(x, lambda=6), pch=16) abline(h=0, col="gray") Función de Distribución: > > > + + > x <- 0:15 x <- rep(x, rep(2, length(.x))) plot(x[-1], ppois(x, lambda=6)[-length(.x)], xlab="x", ylab="Probabilidad Acumulada", main="Distribución Poisson: Media = 6", type="l") abline(h=0, col="gray") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 11 / 37 8 12 / 37 Variables Aleatorias Continuas Distribución Uniforme Cuando el valor de la variable aleatoria se mide y no se cuenta, entramos dentro del concepto de variable aleatoria continua. Una Variable Aleatoria será Uniforme en el intervalo (a, b) si su Función de Densidad es constante, es decir: 1 b−a para a < x < b f (x) = 0 en el resto. Su Función de Distribución, viene dada por: F (x) = x Z f (t)dt = −∞ 0 x−a b−a 1 si x ≤ a, para a < x < b si x ≥ b. Siendo a y b los parámetros de la distribución. Su Esperanza y Varianza vienen dadas por las expresiones: E(X) = Var(X) = Z ∞ −∞ Z ∞ xf (x)dx = −∞ Z b xf (x)dx = a a+b . 2 (x − µ)2 f (x)dx = E(X 2 ) − E(X)2 = (b − a)2 . 12 Las gráficas de la Función de Densidad y de la Función de Distribución para una Variable Aleatoria Uniforme en (0, 1), 0.8 0.6 0.4 0.2 0.0 0.0 0.2 0.4 Densidad 0.6 Probabilidad Acumulada 0.8 1.0 Uniform Distribution: min=0, max=1 1.0 Distribución Uniforme: mín=0, máx=1 −0.5 0.0 0.5 1.0 1.5 −0.5 x 0.0 0.5 1.0 1.5 x Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 13 / 37 9 Distribución de Uniforme con R Función de Densidad: > x <- seq(-.5, 1.5, length=100) > plot(x, dunif(x, min=0, max=1), xlab="x", ylab="Densidad", + main="Distribución Uniforme: mı́n=0, máx=1", type="l") > abline(h=0, col="gray") Función de Distribución: > x <- seq(-0.5, 1.5, length=100) > plot(x, punif(x, min=0, max=1), xlab="x", + ylab="Probabilidad Acumulada", + main="Uniform Distribution: min=0, max=1", type="l") > abline(h=0, col="gray") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 14 / 37 10 Distribución Exponencial Una Variable Aleatoria X sigue una distribución Exponencial si su Función de Densidad viene dada por, −λx para x ≥ 0 y λ > 0 λe f (x; λ) = 0 en el resto. Su función de Distribución será, F (x) = Z x f (t)dt = 0 0 1 − e−λx si x ≤ 0, para x ≥ 0 Su Esperanza y Varianza vienen dadas por las expresiones, Z ∞ 1 E(X) = µ = xf (x)dx = . λ 0 Var(X) = σ 2 = E(X 2 ) − E(X)2 = 1/λ2 . La representacón gráfica de las Funciones de Densidad y de Distribución para una Variable aleatoria que siga una distribución Exponencial de parámetro λ = 5, Distribución Exponencial: λ = 5 0 0.6 0.4 0.0 1 0.2 2 Densidad 3 Probabilidad Acumulada 4 0.8 5 1.0 Distribución Exponencial: λ = 5 0.0 0.5 1.0 1.5 0.0 x 0.5 1.0 1.5 x La distribución Exponencial modeliza el tiempo transcurrido entre dos sucesos “raros” consecutivos modelizados por la distribución de Poisson. Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 15 / 37 11 Distribución de Exponencial con R Función de Densidad: > x <- seq(0, 1.52, length=100) > plot(x, dexp(x, rate=5), xlab="x", ylab="Densidad", + main=expression(paste("Distribución Exponencial: ",lambda," = 5")), + type="l") > abline(h=0, col="gray") Función de Distribución: > x <- seq(0, 1.52, length=100) > plot(x, pexp(x, rate=5), xlab="x", + ylab="Probabilidad Acumulada", + main=expression(paste("Distribución Exponencial: ",lambda," = 5")), + type="l") > abline(h=0, col="gray") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 16 / 37 12 Distribución Normal Johann Carl Friedrich Gauss (1777-1855). La Distribución Normal es clave en multitud de fenómenos naturales. Sobre todo destacar la distribución de errores de medida, que siguen una distribución Normal. Una variable aleatoria X, se dice que sigue una distribución Normal si su Función de Densidad es de la forma, (x − µ)2 1 , f (x; µ, σ) = √ exp − 2σ 2 σ 2π con −∞ < x < ∞ siendo µ y σ parámetros de la distribución. En estadı́stica esta distribución se conoce como la “distribución normal”. Mientras en otros campos se conoce con el nombre de distribución Gaussiana o Campana Gaussiana. Representación gráfica de las funciones de densidad de diferentes N (µ, σ), Distribución Normal: µ = 0 , σ = 0.5, 1, 1.5 0.4 0.8 Distribución Normal: µ =−1, 0, 1, σ =1 µ = −1 µ=0 σ = 0.5 0.4 Densidad 0.2 Densidad 0.3 0.6 µ=1 σ = 1.5 0.0 0.0 0.1 0.2 σ=1 −3 −2 −1 0 1 2 3 −3 −2 −1 0 x 1 2 3 x La Esperanza y la Varianza de una variable aleatoria X de distribución N (µ, σ), son respectivamente, 1 E(X) = xf (x)dx = √ σ 2π −∞ Z ∞ σ2 Var(X) = E((X − µ)2 ) = √ 2π Z Z ∞ xe − (x−µ) 2 2σ 2 dx = −∞ z = (x − µ)/σ, dx = σdz ∞ z 2 e−z 2 /2 1 =√ 2π Z ∞ (µ + σz)e−z 2 /2 dz = µ −∞ dz = −∞ 2 u = z, dv = ze−z /2 dz h Z ∞ i∞ σ2 −z 2 /2 −z 2 /2 =√ −ze + e dz = σ 2 (0 + 1) = σ 2 −∞ 2π −∞ Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 17 / 37 13 Distribución Normal con R Función de Densidad: > x <- seq(-3.291, 3.291, length=100) > plot(x, dnorm(x, mean=0, sd=1),col="blue",xlab="x", ylab="Densidad", + main=expression(paste("Distribución Normal: ", mu, " = 0 , ", sigma, " = 1")), + type="l") > abline(h=0, col="gray") Función de Distribución: > x <- seq(-3.291, 3.291, length=100) > plot(x, pnorm(x, mean=0, sd=1),col="blue",xlab="x", ylab="Probabilidad Acumulada", + main=expression(paste("Distribución Normal: ", mu, " = 0 , ", sigma, " = 1")), + type="l") > abline(h=0, col="gray") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 18 / 37 14 Distribución Normal Estándar La función de Distribución de una N (µ, σ), 1 F (x) = √ σ 2π Z x (t − µ)2 exp − dt. 2σ 2 −∞ La transformación Z = (X − µ)/σ nos proporciona valores de una distribución normal de media cero y varianza uno, N (0, 1). 0.6 0.4 0.0 0.2 Probabilidad Acumulada 0.8 1.0 Distribución Normal: µ = 0, σ = 1 −3 −2 −1 0 1 2 3 x Definimos entonces la Función de Distribución de la Normal Estandarizada o Tipificada, 2 Z z 1 t Φ(z) = √ exp − dt 2 2π −∞ Esta integral no puede calcularse por métodos ordinarios, debemos acudir a integración numérica, esta función Φ se encuentra recogida en las Tablas de la Normal Tipificada. De esta forma si X sigue una distribución N (0, 1), para el cálculo de P(a < X < b) podemos hacer uso de las tablas, P(a < X < b) = Φ(b) − Φ(a). La “distribución normal estandar” se obtiene al tomar una distribución normal con parámetros µ = 0 y σ 2 = 1. Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 19 / 37 15 Distribución Normal Estándar X ≡ N (0, 1), P(1 < X < 2) = Φ(2) − Φ(1) 0.3 0.2 Density 0.0 0.1 0.2 0.0 0.1 Densidad 0.3 0.4 Φ(1) 0.4 Φ(2) −3 −2 −1 0 1 2 3 −3 −2 −1 0 x 1 2 3 x 0.2 0.0 0.1 Density 0.3 0.4 Φ(2)−Φ(1) −3 −2 −1 0 1 2 3 x P(1 < X < 2) = Φ(2) − Φ(1) Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 20 / 37 16 Distribución Normal Estándar Si X sigue una distribución Normal cualquiera, N (µ, σ), la P(a < X < b) puede calcularse realizando la transformación, Z = (X − µ)/σ, es decir: P(a < X < b) = P((a − µ)/σ < Z < (b − µ)/σ) = = Φ((b − µ)/σ) − Φ((a − µ)/σ). Una conclusión de la definición de Φ es que, Φ(−x) = 1 − Φ(x), esta relación es muy útil ya que en la mayorı́a de las tablas, Φ sólo aparece tabulada para valores positivos de x. Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 21 / 37 17 Distribución Normal Estándar Vamos ahora a calcular, P(µ − kσ < X < µ + kσ), para X ≡ N (µ, σ), P(µ − kσ < X < µ + kσ) = P(−k < (X − µ)/σ < k) = = Φ(k) − Φ(−k) = 2Φ(k) − 1, que no depende ni de µ ni de σ. P(µ − σ < X < µ + σ) = 2Φ(1) − 1 = 0.6826895 P(µ − 2σ < X < µ + 2σ) = 2Φ(2) − 1 = 0.9544997 P(µ − 3σ < X < µ + 3σ) = 2Φ(3) − 1 = 0.9973002 > 2*pnorm(1,mean=0,sd=1)-1 [1] 0.6826895 Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 22 / 37 Teorema Central del Lı́mite • Si X1 , X2 , . . . , Xn son n variables aleatorias independientes y X = k1 · X1 + k2 · X2 + · · · + kn · Xn , entonces X es otra v.a. de media y varianza: X X E(X) = ki E(Xi ) Var(X) = ki2 Var(Xi ) i i Si las Xi son normales, también lo será X. • Si lasP v.a. X1 , . . . , Xn , constituyen una muestra de una población de media µ y varianza σ 2 y 1 X=n Xi , es la media muestral: E(X) = 1X E(Xi ) = µ n Var(X) = i 1 X nσ 2 σ2 Var(X ) = = i n2 n2 n i Además se tendrá que X ≡ N (µ, σ 2 /n), n > 30. Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 23 / 37 18 Aproximaciones por la Normal Si X es una variable Binomial, de parámetros n y p, entonces si n es grande y ni p ni 1 − p son próximos a cero: podemos considerar que X sigue aproximadamente una distribución N (µ = n · p, σ 2 = n · p · (1 − p)). Z=p X −n·p n · p · (1 − p) ≡ N (0, 1). Distribución Normal: µ = 40, σ = 4.8989 0.06 0.00 0.00 0.02 0.04 Densidad 0.04 0.02 Probabilidad 0.06 0.08 0.08 Distribución Binomial: n = 100, p = 0.4 25 30 35 40 45 50 55 25 30 35 Número de Exitos 40 45 50 55 x Si X es una distribución de Poisson de parámetro λ grande, λ > 25, en la práctica se puede considerar que X sigue una distribución N (µ = λ, σ 2 = λ). Z= X −λ √ ≡ N (0, 1). λ Distribución Normal: µ = 36, σ = 6 0.04 Densidad 0.00 0.00 0.01 0.01 0.02 0.03 0.03 0.02 Probabilidad 0.04 0.05 0.05 0.06 0.06 Distribución de Poisson: λ = 36 20 30 40 50 20 x 30 40 50 x Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 24 / 37 19 Aproximaciones por la Normal con R Aproximación de la Binomial por la Normal: > > + + > > x <- seq(24, 56, length=100) plot(x, dnorm(x, mean=40, sd=sqrt(24)), xlab="x", ylab="Densidad", main=expression(paste("Distribución Normal: ", mu, " = 40, ", sigma, " = 4.89")), type="l") x <- 24:56 points(x, dbinom(x, size=100, prob=0.4), col="red", pch=16) Aproximación de la distribución de Poisson por la Normal: > > + + > > x <- seq(18, 57, length=100) plot(x, dnorm(x, mean=40, sd=sqrt(40)), xlab="x", ylab="Densidad", main=expression(paste("Distribución Normal: ", mu, " = 40, ", sigma, " = 6.32")), type="l") x <- 18:57 points(x, dpois(x, lambda=40), col="blue", pch=16) Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 25 / 37 20 Distribución χ2n de Pearson Karl Pearson (1857-1936). Sean X1 , X2 , . . . , Xn , n variables aleatorias independientes entre sı́, del tipo N (0, 1). La variable: X = X12 + X22 + · · · + Xn2 , se dice que es una χ2n , ji-cuadrado de Pearson con n grados de libertad. La función de densidad de una variable aleatoria χ2n es: n/2−1 −x/2 x e si x > 0 2n/2 ·Γ(n/2) f (x; n) = 0 en el resto. R∞ Siendo Γ la función gamma definida: Γ(α) = 0 xα−1 e−x dx para α > 0. Varianza de la distribución χ2n , son respectivamente, La Esperanza y E(X) = µ = n Var(X) = σ 2 = 2n 1.0 Distribución χ2 : n = 1,2,3,4,5 0.6 0.4 Densidad 0.8 n=1 n=2 n=3 n=4 0.0 0.2 n=5 0 2 4 6 8 10 12 χ2 Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 26 / 37 21 Distribución χ2n de Pearson Propiedad: La suma de χ2n1 , χ2n2 , . . . , independientes, es otra χ2n siendo n = n1 + n2 + . . . . La Función de Distribución F (x) nos permite saber, dada una variable aleatoria X ≡ χ2n , Z a f (x; n)dx. P(X < a) = p = 0 El cálculo de esta integral se encuentra en la Tabla de distribución χ2n de Pearson. > qchisq(0.95,df=3) [1] 7.814728 Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 27 / 37 22 Distribución χ2n de Pearson Más en concreto la Función de Distribución Inversa: para distintos valores de n y de p se puede buscar en la tabla su cuantil a. 0.10 Densidad 0.15 0.20 0.25 χ2 n=3, P(X<a)=p=F(a) 0.00 0.05 p a 0 2 4 6 8 10 x Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 28 / 37 χ2n de Pearson con R Distribución χ2n de Pearson: > > + > > > > > > > > > > > x <- seq(0, 12.116, length=100) plot(x, dchisq(x, df=1), xlab=expression(chi^2), ylab="Densidad", main=expression(paste("Distribución ", chi^2," : n = 1,2,3,4,5")), type="l") abline(h=0, col="gray") abline(v=0, col="gray") text(1,1,"n = 1",col="black") lines(x, dchisq(x, df=2),col="blue") text(2,.34,"n = 2",col="blue") lines(x, dchisq(x, df=3),col="green") text(3,.31,"n = 3",col="green") lines(x, dchisq(x, df=4),col="red") text(4,.28,"n = 4",col="red") lines(x, dchisq(x, df=5),col="pink") text(5,.25,"n = 5",col="pink") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 29 / 37 23 Distribución tn de Student William Sealy Gosset (1876-1937). Sea Z una variable aleatoria N (0, 1) e Y una χ2n ambas independientes, entonces la variable aleatoria, X=p Z Y /n , se denomina tn de Student con n grados de libertad. La función de densidad de una variable aleatoria tn es: 2 −(n+1)/2 √nβ(11 , n ) 1 + xn 2 2 f (x; n) = 0 para − ∞ < x < ∞ yn>0 en el resto. 1 )·Γ(α2 ) Siendo β la función beta definida: β(α1 , α2 ) = Γ(α Γ(α1 +α2 ) para α1 , α2 > 0. La Esperanza y Varianza de la distribución tn , son: E(X) = µ = 0, para n > 1, indefinida para otros valores. Var(X) = σ 2 = n , para n > 2, indefinida para otros valores. n−2 0.4 Distribución t Student : n = 1,2,3,4 N(0,1) n=1 n=2 0.2 n=4 0.0 0.1 Densidad 0.3 n=3 −3 −2 −1 0 1 2 3 x Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 30 / 37 24 Distribución tn de Student Propiedad: A medida que aumenta n, tn −→ N (0, 1). La Función de Distribución F (x) nos permite saber, dada una variable aleatoria X ≡ tn , Z a f (x; n)dx. P(X < a) = p = −∞ El cálculo de esta integral se encuentra en la Tabla de distribución tn de Student. > qt(0.975,df=5) [1] 2.570582 Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 31 / 37 25 Distribución tn de Student Más en concreto la Función de Distribución Inversa: para distintos valores de n y de p se puede buscar en la tabla su cuantil a. 0.2 0.1 Densidad 0.3 t n=3, P(X<a)=p=F(a) 0.0 p a −4 −2 0 2 4 x Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 32 / 37 tn de Student con R Distribución tn de Student: > > + > > > > > > > > > > x <- seq(-3.291, 3.291, length=100) plot(x, dnorm(x, mean=0, sd=1), xlab="x", ylab="Densidad", main="Distribución t Student : n = 1,2,3,4",, type="l") abline(h=0, col="gray") text(2,.38,"N(0,1)",col="black") lines(.x, dt(x, df=1),col="blue") text(2,.36,"n = 1",col="blue") lines(.x, dt(x, df=2),col="green") text(2,.34,"n = 2",col="green") lines(.x, dt(x, df=3),col="red") text(2,.32,"n = 3",col="red") lines(.x, dt(x, df=4),col="pink") text(2,.30,"n = 4",col="pink") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 33 / 37 26 Distribución Fm,n de Snedecor George Waddel Snedecor (1881-1974). Sean U y V dos variables independientes distribuidas según leyes ji-cuadrado de m y n grados de libertad respectivamente, la variable X, X= U/m , V /n se dice que es una variable Fm,n de Snedecor con m y n grados de libertad, en el numerador y denominador respectivamente. La función de densidad viene dada por la expresión, f (x; m, n) = (m/n)m/2 β( m ,n) 2 2 · xm/2−1 (m+n)/2 m 1+ ( n x) 0 para x > 0 y m, n > 0 en el resto. La Esperanza y la Varianza de una distribución Fm,n son: E(X) = µ = Var(X) = σ 2 = n , para n > 2, indefinida para otros valores. n−2 2n2 (m + n − 2) , para n > 4, indefinida para otros valores. m(n − 2)2 (n − 4) 2.0 Distribución F: m,n m=1, n=1 m=2, n=1 1.5 m=5, n=2 1.0 m=100, n=100 0.0 0.5 Densidad m=100, n=1 0 2 4 6 8 f Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 34 / 37 27 Distribución Fm,n de Snedecor Propiedad: Si X ≡ Fm,n entonces 1 X ≡ Fn,m . La Función de Distribucón F (x) nos permite saber, dada una variable aleatoria X ≡ Fm,n , Z a f (x; m, n)dx. P(X < a) = p = 0 El cálculo de esta integral se encuentra en la Tabla de distribución Fm,n de Snedecor. > qf(0.95,df1=3,df2=4) [1] 6.591382 Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 35 / 37 28 Distribución Fm,n de Snedecor Más en concreto la Función de Distribución Inversa: para distintos valores de m, n y de p se puede buscar en la tabla su cuantil a. 0.3 0.2 Densidad 0.4 0.5 F m=5,n=2, P(X<a)=p=F(a) 0.0 0.1 p a 0 1 2 3 4 5 6 x Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 36 / 37 Fm,n de Snedecor con R Distribución Fm,n de Snedecor: > > + > > > > > > > > > > > x <- seq(0, 8, length=400) plot(x, df(x, df1=1, df2=1), xlab="f", ylab="Densidad", main="Distribución F: m,n", type="l") abline(h=0, col="gray") abline(v=0, col="gray") text(6,2,"m=1, n=1",col="black") lines(.x, df(x, df1=2, df2=1),col="blue") text(6,1.8,"m=2, n=1",col="blue") lines(.x, df(x, df1=5, df2=2),col="green") text(6,1.6,"m=5, n=2",col="green") lines(.x, df(x, df1=100, df2=1),col="red") text(6,1.4,"m=100, n=1",col="red") lines(.x, df(x, df1=100, df2=100),col="pink") text(6,1.2,"m=100, n=100",col="pink") Licesio J. Rodrı́guez-Aragón Tema 3, Unidad 4 – 37 / 37 29