Algunas Distribuciones Notables de Variables Aleatorias

advertisement
Estadı́stica
Tema 3: Cálculo de Probabilidades
Unidad 4: Algunas Distribuciones Notables
de Variables Aleatorias
Área de Estadı́stica e Investigación Operativa
Licesio J. Rodrı́guez-Aragón
Noviembre 2010
Contenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Variables Aleatorias Discretas
Distribución Uniforme . . . . . . .
Distribución de Bernoulli . . . . .
Distribución Binomial . . . . . . .
Distribución Binomial con R . . .
Distribución de Poisson . . . . . .
Distribución de Poisson con R. .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Variables Aleatorias Continuas
Distribución Uniforme . . . . . . . . .
Distribución de Uniforme con R . .
Distribución Exponencial . . . . . . .
Distribución de Exponencial con R
Distribución Normal. . . . . . . . . . .
Distribución Normal con R . . . . . .
Distribución Normal Estándar. . . .
Teorema Central del Lı́mite . . . . .
Aproximaciones por la Normal . . .
Distribución χ2n de Pearson . . . . . .
Distribución tn de Student . . . . . .
Distribución Fm,n de Snedecor . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
.
.
.
.
.
3
4
5
6
8
9
11
12
13
14
15
16
17
18
19
23
24
26
30
34
Contenidos
Variables Aleatorias Discretas.
– Uniforme, Bernoulli, Binomial, Poisson.
Variables Aleatorias Continuas.
– Uniforme, Exponencial, Normal, aproximaciones por la Normal, χ2 de Pearson, t de
Student y F de Snedecor.
Presentamos en este tema algunas Distribuciones de Variables Aleatorias, primero
discretas y luego contı́nuas, a continuación presentaremos su Esperanza y Varianza.
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 2 / 37
3 / 37
Variables Aleatorias Discretas
Distribución Uniforme
Sea X una variable aleatoria que toma valores x1 , x2 , . . . , xk con igual probabilidad, entonces la
Función de Probabilidad de esta Variable Aleatoria Uniforme viene dada por,
f (x; k) = 1/k
para x = x1 , x2 , . . . , xk ,
siendo k un parámetro de la distribución de probabilidad.
Su Esperanza y Varianza vienen dadas por las expresiones:
E(X) = µ =
k
X
xi f (xi ) =
i=1
Var(X) = σ 2 =
i=1
k
X
(xi − µ)2
i=1
k
X
xi
k
Licesio J. Rodrı́guez-Aragón
=
k
X
x2
i
i=1
k
k
−
.
k
X
xi
i=1
k
!2
Tema 3, Unidad 4 – 4 / 37
2
Distribución de Bernoulli
Daniel Bernoulli (1700-1782). Se conoce como prueba de Bernoulli, todo experimento aleatorio en
el que sólo son posibles dos resultados, eg. “éxito” o “fracaso”. Definamos X como la variable
aleatoria que toma el valor 1 con probabilidad p, “éxito”, y 0 con probabilidad 1 − p, “fracaso”.
La Función de Probabilidad de la Variable Aleatoria X vendrá dada por,
f (x; p) = px · (1 − p)1−x
, para x = 0, 1.
Su Esperanza y Varianza vienen dadas por las expresiones:
E(X) = 0 · f (0) + 1 · f (1) = 0 · (1 − p) + 1 · p = p.
Var(X) = E(X 2 ) − E(X)2 = (0 · f (0) + 1 · f (1)) − p2 = p − p2 = p(1 − p).
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 5 / 37
3
Distribución Binomial
Supongamos que realizamos n experimentos de Bernoulli, con probabilidad de “éxito” p para cada
uno de ellos. Definamos la Variable Aleatoria X como el número de éxitos en esas n ejecuciones
del experimento.
La Función de Probabilidad es la siguiente:
n x
f (x; n, p) =
p (1 − p)n−x , para x = 0, 1, 2, . . . , n,
x
siendo n y p parámetros de la distribución de probabilidad.
Su Esperanza y Varianza vienen dadas por las expresiones,
E(X) = µ = E(X1 + · · · + Xn ) = E(X1 ) + · · · + E(Xn ) = np.
Var(X) = σ 2 = Var(X1 ) + · · · + Var(Xn ) = np(1 − p).
Con Xi variables aleatorias independientes de Bernoulli.
Las gráficas de la Función de Probabilidad y la Función de Distribución de una variable aleatoria
Binomial, de parámetros n = 10, p = 0.3.
Distribución Binomial: n = 10, p = 0.3
0.6
Probabilidad Acumulada
0.0
0.00
0.2
0.4
0.15
0.05
0.10
Probabilidad
0.20
0.8
0.25
1.0
Distribución Binomial: n = 10, p = 0.3
0
2
4
6
8
10
0
Número de Exitos
2
4
6
8
10
Número de Exitos
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 6 / 37
4
Distribución Binomial
Variable Aleatoria Binomial de parámetros n = 10, p = 0.6.
Distribución Binomial: n = 10, p = 0.6
0.6
0.4
0.0
0.00
0.2
0.05
0.10
Probabilidad
0.15
Probabilidad Acumulada
0.8
0.20
1.0
0.25
Distribución Binomial: n = 10, p = 0.3
0
2
4
6
8
10
0
Número de Exitos
2
4
6
8
10
Número de Exitos
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 7 / 37
Distribución Binomial con R
Función de Probabilidad:
>
>
+
+
>
>
x <- 0:10
plot(x, dbinom(x, size=10, prob=0.6), xlab="Número de Exitos",
ylab="Probabilidad",
main="Distribución Binomial: n = 10, p = 0.3", type="h")
points(x, dbinom(x, size=10, prob=0.6), pch=16)
abline(h=0, col="gray")
Función de Distribución:
>
>
>
+
+
>
x <- 0:10
x <- rep(x, rep(2, length(x)))
plot(x[-1], pbinom(x, size=10, prob=0.6)[-length(x)],
xlab="Número de Exitos", ylab="Probabilidad Acumulada",
main="Distribución Binomial: n = 10, p = 0.6", type="l")
abline(h=0, col="gray")
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 8 / 37
5
Distribución de Poisson
Siméon Denis Poisson (1781-1840). Una Variable Aleatoria discreta X se dice que es una variable
de Poisson si su función de probabilidad es de la forma:
f (x; λ) =
λx e−λ
x!
, para x = 0, 1, 2, . . . ,
siendo λ un parámetro positivo.
Su Esperanza y Varianza vienen dadas por las expresiones,
E(X) = µ =
∞
X
xf (x) =
x=0
∞
∞
X
X
λx e−λ
λx−1
x
= λe−λ
= λ.
x!
(x
−
1)!
x=0
x=0
Var(X) = σ 2 = E(X 2 ) − E(X)2 = E(X(X − 1)) + µ − µ2 = µ = λ.
La distribución de Poisson se presenta en experimentos en los que se estudia la ocurrencia de
sucesos en un intervalo de tiempo dado. Usualmente para sucesos “raros”, pi <<.
El número de vehı́culos que pasan a través de un cierto punto en una ruta durante un
periodo definido de tiempo.
El número de errores de ortografı́a que uno comete al escribir una única página.
El número de llamadas telefónicas en una central telefónica por minuto.
El número de servidores web accedidos por minuto.
El número de mutaciones de determinada cadena de ADN después de cierta cantidad de
radiación.
Función de Probabilidad y de Distribución,
Distribución Poisson: Media = 3
0.6
Probabilidad Acumulada
0.4
0.10
0.00
0.2
0.05
Probabilidad
0.15
0.8
0.20
1.0
Distribución Poisson: Media = 3
0
2
4
6
8
10
0
x
2
4
6
8
10
x
λ=3
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 9 / 37
6
Distribución de Poisson
Función de Probabilidad y de Distribución,
Distribución Poisson: Media = 6
0.6
0.4
0.0
0.00
0.2
0.05
Probabilidad
Probabilidad Acumulada
0.10
0.8
0.15
1.0
Distribución Poisson: Media = 6
0
5
10
15
0
5
10
x
15
x
λ=6
La distribución de Poisson aproxima de forma muy acertada a la distribución Binomial cuando
n > 25 y p < .1 y np = λ < 5
Distribución Poisson: Media = 3
Probabilidad
0.10
0.05
0.10
0.00
0.00
0.05
Probabilidad
0.15
0.15
0.20
0.20
Distribución Binomial: n = 30, p = 0.1
0
2
4
6
8
10
0
Número de Exitos
2
4
6
8
10
x
n x
λx e−λ
f (x; n, p) =
p (1 − p)n−x → f (x; λ) =
x
x!
Para un proceso de Poisson, la probabilidad de obtener exactamente x éxitos en n intentos viene
dada por el lı́mite de la distribución binomial.
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 10 / 37
7
Distribución de Poisson con R
Función de Probabilidad:
>
>
+
>
>
x <- 0:15
plot(x, dpois(x, lambda=6), xlab="x", ylab="Probabilidad",
main="Distribución Poisson: Media = 6", type="h")
points(x, dpois(x, lambda=6), pch=16)
abline(h=0, col="gray")
Función de Distribución:
>
>
>
+
+
>
x <- 0:15
x <- rep(x, rep(2, length(.x)))
plot(x[-1], ppois(x, lambda=6)[-length(.x)], xlab="x",
ylab="Probabilidad Acumulada",
main="Distribución Poisson: Media = 6", type="l")
abline(h=0, col="gray")
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 11 / 37
8
12 / 37
Variables Aleatorias Continuas
Distribución Uniforme
Cuando el valor de la variable aleatoria se mide y no se cuenta, entramos dentro del concepto de
variable aleatoria continua.
Una Variable Aleatoria será Uniforme en el intervalo (a, b) si su Función de Densidad es
constante, es decir:
 1
 b−a para a < x < b
f (x) =

0
en el resto.
Su Función de Distribución, viene dada por:
F (x) =
x
Z
f (t)dt =
−∞

 0
x−a
b−a

1
si x ≤ a,
para a < x < b
si x ≥ b.
Siendo a y b los parámetros de la distribución.
Su Esperanza y Varianza vienen dadas por las expresiones:
E(X) =
Var(X) =
Z
∞
−∞
Z
∞
xf (x)dx =
−∞
Z
b
xf (x)dx =
a
a+b
.
2
(x − µ)2 f (x)dx = E(X 2 ) − E(X)2 =
(b − a)2
.
12
Las gráficas de la Función de Densidad y de la Función de Distribución para una Variable
Aleatoria Uniforme en (0, 1),
0.8
0.6
0.4
0.2
0.0
0.0
0.2
0.4
Densidad
0.6
Probabilidad Acumulada
0.8
1.0
Uniform Distribution: min=0, max=1
1.0
Distribución Uniforme: mín=0, máx=1
−0.5
0.0
0.5
1.0
1.5
−0.5
x
0.0
0.5
1.0
1.5
x
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 13 / 37
9
Distribución de Uniforme con R
Función de Densidad:
> x <- seq(-.5, 1.5, length=100)
> plot(x, dunif(x, min=0, max=1), xlab="x", ylab="Densidad",
+
main="Distribución Uniforme: mı́n=0, máx=1", type="l")
> abline(h=0, col="gray")
Función de Distribución:
> x <- seq(-0.5, 1.5, length=100)
> plot(x, punif(x, min=0, max=1), xlab="x",
+
ylab="Probabilidad Acumulada",
+
main="Uniform Distribution: min=0, max=1", type="l")
> abline(h=0, col="gray")
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 14 / 37
10
Distribución Exponencial
Una Variable Aleatoria X sigue una distribución Exponencial si su Función de Densidad viene
dada por,
 −λx
para x ≥ 0 y λ > 0
 λe
f (x; λ) =

0
en el resto.
Su función de Distribución será,
F (x) =
Z
x
f (t)dt =
0
0
1 − e−λx
si x ≤ 0,
para x ≥ 0
Su Esperanza y Varianza vienen dadas por las expresiones,
Z ∞
1
E(X) = µ =
xf (x)dx = .
λ
0
Var(X) = σ 2 = E(X 2 ) − E(X)2 = 1/λ2 .
La representacón gráfica de las Funciones de Densidad y de Distribución para una Variable
aleatoria que siga una distribución Exponencial de parámetro λ = 5,
Distribución Exponencial: λ = 5
0
0.6
0.4
0.0
1
0.2
2
Densidad
3
Probabilidad Acumulada
4
0.8
5
1.0
Distribución Exponencial: λ = 5
0.0
0.5
1.0
1.5
0.0
x
0.5
1.0
1.5
x
La distribución Exponencial modeliza el tiempo transcurrido entre dos sucesos “raros”
consecutivos modelizados por la distribución de Poisson.
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 15 / 37
11
Distribución de Exponencial con R
Función de Densidad:
> x <- seq(0, 1.52, length=100)
> plot(x, dexp(x, rate=5), xlab="x", ylab="Densidad",
+
main=expression(paste("Distribución Exponencial: ",lambda," = 5")),
+
type="l")
> abline(h=0, col="gray")
Función de Distribución:
> x <- seq(0, 1.52, length=100)
> plot(x, pexp(x, rate=5), xlab="x",
+
ylab="Probabilidad Acumulada",
+
main=expression(paste("Distribución Exponencial: ",lambda," = 5")),
+
type="l")
> abline(h=0, col="gray")
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 16 / 37
12
Distribución Normal
Johann Carl Friedrich Gauss (1777-1855). La Distribución Normal es clave en multitud de
fenómenos naturales. Sobre todo destacar la distribución de errores de medida, que siguen una
distribución Normal.
Una variable aleatoria X, se dice que sigue una distribución Normal si su Función de Densidad es
de la forma,
(x − µ)2
1
,
f (x; µ, σ) = √ exp −
2σ 2
σ 2π
con −∞ < x < ∞ siendo µ y σ parámetros de la distribución.
En estadı́stica esta distribución se conoce como la “distribución normal”. Mientras en otros
campos se conoce con el nombre de distribución Gaussiana o Campana Gaussiana.
Representación gráfica de las funciones de densidad de diferentes N (µ, σ),
Distribución Normal: µ = 0 , σ = 0.5, 1, 1.5
0.4
0.8
Distribución Normal: µ =−1, 0, 1, σ =1
µ = −1
µ=0
σ = 0.5
0.4
Densidad
0.2
Densidad
0.3
0.6
µ=1
σ = 1.5
0.0
0.0
0.1
0.2
σ=1
−3
−2
−1
0
1
2
3
−3
−2
−1
0
x
1
2
3
x
La Esperanza y la Varianza de una variable aleatoria X de distribución N (µ, σ), son
respectivamente,
1
E(X) =
xf (x)dx = √
σ 2π
−∞
Z
∞
σ2
Var(X) = E((X − µ)2 ) = √
2π
Z
Z
∞
xe
− (x−µ)
2
2σ
2
dx =
−∞
z = (x − µ)/σ, dx = σdz
∞
z 2 e−z
2 /2
1
=√
2π
Z
∞
(µ + σz)e−z
2 /2
dz = µ
−∞
dz =
−∞
2
u = z, dv = ze−z /2 dz
h
Z ∞
i∞
σ2
−z 2 /2
−z 2 /2
=√
−ze
+
e
dz = σ 2 (0 + 1) = σ 2
−∞
2π
−∞
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 17 / 37
13
Distribución Normal con R
Función de Densidad:
> x <- seq(-3.291, 3.291, length=100)
> plot(x, dnorm(x, mean=0, sd=1),col="blue",xlab="x", ylab="Densidad",
+
main=expression(paste("Distribución Normal: ", mu, " = 0 , ", sigma, " = 1")),
+
type="l")
> abline(h=0, col="gray")
Función de Distribución:
> x <- seq(-3.291, 3.291, length=100)
> plot(x, pnorm(x, mean=0, sd=1),col="blue",xlab="x", ylab="Probabilidad Acumulada",
+
main=expression(paste("Distribución Normal: ", mu, " = 0 , ", sigma, " = 1")),
+
type="l")
> abline(h=0, col="gray")
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 18 / 37
14
Distribución Normal Estándar
La función de Distribución de una N (µ, σ),
1
F (x) = √
σ 2π
Z
x
(t − µ)2
exp −
dt.
2σ 2
−∞
La transformación Z = (X − µ)/σ nos proporciona valores de una distribución normal de media
cero y varianza uno, N (0, 1).
0.6
0.4
0.0
0.2
Probabilidad Acumulada
0.8
1.0
Distribución Normal: µ = 0, σ = 1
−3
−2
−1
0
1
2
3
x
Definimos entonces la Función de Distribución de la Normal Estandarizada o Tipificada,
2
Z z
1
t
Φ(z) = √
exp −
dt
2
2π −∞
Esta integral no puede calcularse por métodos ordinarios, debemos acudir a integración numérica,
esta función Φ se encuentra recogida en las Tablas de la Normal Tipificada.
De esta forma si X sigue una distribución N (0, 1), para el cálculo de P(a < X < b) podemos
hacer uso de las tablas,
P(a < X < b) = Φ(b) − Φ(a).
La “distribución normal estandar” se obtiene al tomar una distribución normal con parámetros
µ = 0 y σ 2 = 1.
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 19 / 37
15
Distribución Normal Estándar
X ≡ N (0, 1),
P(1 < X < 2) = Φ(2) − Φ(1)
0.3
0.2
Density
0.0
0.1
0.2
0.0
0.1
Densidad
0.3
0.4
Φ(1)
0.4
Φ(2)
−3
−2
−1
0
1
2
3
−3
−2
−1
0
x
1
2
3
x
0.2
0.0
0.1
Density
0.3
0.4
Φ(2)−Φ(1)
−3
−2
−1
0
1
2
3
x
P(1 < X < 2) = Φ(2) − Φ(1)
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 20 / 37
16
Distribución Normal Estándar
Si X sigue una distribución Normal cualquiera, N (µ, σ), la P(a < X < b) puede calcularse
realizando la transformación, Z = (X − µ)/σ, es decir:
P(a < X < b) = P((a − µ)/σ < Z < (b − µ)/σ) =
= Φ((b − µ)/σ) − Φ((a − µ)/σ).
Una conclusión de la definición de Φ es que,
Φ(−x) = 1 − Φ(x),
esta relación es muy útil ya que en la mayorı́a de las tablas, Φ sólo aparece tabulada para valores
positivos de x.
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 21 / 37
17
Distribución Normal Estándar
Vamos ahora a calcular,
P(µ − kσ < X < µ + kσ),
para X ≡ N (µ, σ),
P(µ − kσ < X < µ + kσ) = P(−k < (X − µ)/σ < k) =
= Φ(k) − Φ(−k) = 2Φ(k) − 1,
que no depende ni de µ ni de σ.
P(µ − σ < X < µ + σ) = 2Φ(1) − 1 = 0.6826895
P(µ − 2σ < X < µ + 2σ) = 2Φ(2) − 1 = 0.9544997
P(µ − 3σ < X < µ + 3σ) = 2Φ(3) − 1 = 0.9973002
> 2*pnorm(1,mean=0,sd=1)-1
[1] 0.6826895
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 22 / 37
Teorema Central del Lı́mite
• Si X1 , X2 , . . . , Xn son n variables aleatorias independientes y
X = k1 · X1 + k2 · X2 + · · · + kn · Xn , entonces X es otra v.a. de media y varianza:
X
X
E(X) =
ki E(Xi ) Var(X) =
ki2 Var(Xi )
i
i
Si las Xi son normales, también lo será X.
• Si lasP
v.a. X1 , . . . , Xn , constituyen una muestra de una población de media µ y varianza σ 2 y
1
X=n
Xi , es la media muestral:
E(X) =
1X
E(Xi ) = µ
n
Var(X) =
i
1 X
nσ 2
σ2
Var(X
)
=
=
i
n2
n2
n
i
Además se tendrá que X ≡ N (µ, σ 2 /n), n > 30.
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 23 / 37
18
Aproximaciones por la Normal
Si X es una variable Binomial, de parámetros n y p, entonces si n es grande y ni p ni 1 − p son
próximos a cero:
podemos considerar que X sigue aproximadamente una distribución
N (µ = n · p, σ 2 = n · p · (1 − p)).
Z=p
X −n·p
n · p · (1 − p)
≡ N (0, 1).
Distribución Normal: µ = 40, σ = 4.8989
0.06
0.00
0.00
0.02
0.04
Densidad
0.04
0.02
Probabilidad
0.06
0.08
0.08
Distribución Binomial: n = 100, p = 0.4
25
30
35
40
45
50
55
25
30
35
Número de Exitos
40
45
50
55
x
Si X es una distribución de Poisson de parámetro λ grande, λ > 25, en la práctica se puede
considerar que X sigue una distribución N (µ = λ, σ 2 = λ).
Z=
X −λ
√
≡ N (0, 1).
λ
Distribución Normal: µ = 36, σ = 6
0.04
Densidad
0.00
0.00
0.01
0.01
0.02
0.03
0.03
0.02
Probabilidad
0.04
0.05
0.05
0.06
0.06
Distribución de Poisson: λ = 36
20
30
40
50
20
x
30
40
50
x
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 24 / 37
19
Aproximaciones por la Normal con R
Aproximación de la Binomial por la Normal:
>
>
+
+
>
>
x <- seq(24, 56, length=100)
plot(x, dnorm(x, mean=40, sd=sqrt(24)), xlab="x", ylab="Densidad",
main=expression(paste("Distribución Normal: ", mu, " = 40, ", sigma, " = 4.89")),
type="l")
x <- 24:56
points(x, dbinom(x, size=100, prob=0.4), col="red", pch=16)
Aproximación de la distribución de Poisson por la Normal:
>
>
+
+
>
>
x <- seq(18, 57, length=100)
plot(x, dnorm(x, mean=40, sd=sqrt(40)), xlab="x", ylab="Densidad",
main=expression(paste("Distribución Normal: ", mu, " = 40, ", sigma, " = 6.32")),
type="l")
x <- 18:57
points(x, dpois(x, lambda=40), col="blue", pch=16)
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 25 / 37
20
Distribución χ2n de Pearson
Karl Pearson (1857-1936). Sean X1 , X2 , . . . , Xn , n variables aleatorias independientes entre sı́, del
tipo N (0, 1). La variable:
X = X12 + X22 + · · · + Xn2 ,
se dice que es una χ2n , ji-cuadrado de Pearson con n grados de libertad.
La función de densidad de una variable aleatoria χ2n es:
 n/2−1 −x/2
x
e

si x > 0
 2n/2 ·Γ(n/2)
f (x; n) =


0
en el resto.
R∞
Siendo Γ la función gamma definida: Γ(α) = 0 xα−1 e−x dx para α > 0.
Varianza de la distribución χ2n , son respectivamente,
La Esperanza y
E(X) = µ = n
Var(X) = σ 2 = 2n
1.0
Distribución χ2 : n = 1,2,3,4,5
0.6
0.4
Densidad
0.8
n=1
n=2
n=3
n=4
0.0
0.2
n=5
0
2
4
6
8
10
12
χ2
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 26 / 37
21
Distribución χ2n de Pearson
Propiedad: La suma de χ2n1 , χ2n2 , . . . , independientes, es otra χ2n siendo n = n1 + n2 + . . . .
La Función de Distribución F (x) nos permite saber, dada una variable aleatoria X ≡ χ2n ,
Z a
f (x; n)dx.
P(X < a) = p =
0
El cálculo de esta integral se encuentra en la Tabla de distribución χ2n de Pearson.
> qchisq(0.95,df=3)
[1] 7.814728
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 27 / 37
22
Distribución χ2n de Pearson
Más en concreto la Función de Distribución Inversa: para distintos valores de n y de p se puede
buscar en la tabla su cuantil a.
0.10
Densidad
0.15
0.20
0.25
χ2 n=3, P(X<a)=p=F(a)
0.00
0.05
p
a
0
2
4
6
8
10
x
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 28 / 37
χ2n de Pearson con R
Distribución χ2n de Pearson:
>
>
+
>
>
>
>
>
>
>
>
>
>
>
x <- seq(0, 12.116, length=100)
plot(x, dchisq(x, df=1), xlab=expression(chi^2), ylab="Densidad",
main=expression(paste("Distribución ", chi^2," : n = 1,2,3,4,5")), type="l")
abline(h=0, col="gray")
abline(v=0, col="gray")
text(1,1,"n = 1",col="black")
lines(x, dchisq(x, df=2),col="blue")
text(2,.34,"n = 2",col="blue")
lines(x, dchisq(x, df=3),col="green")
text(3,.31,"n = 3",col="green")
lines(x, dchisq(x, df=4),col="red")
text(4,.28,"n = 4",col="red")
lines(x, dchisq(x, df=5),col="pink")
text(5,.25,"n = 5",col="pink")
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 29 / 37
23
Distribución tn de Student
William Sealy Gosset (1876-1937). Sea Z una variable aleatoria N (0, 1) e Y una χ2n ambas
independientes, entonces la variable aleatoria,
X=p
Z
Y /n
,
se denomina tn de Student con n grados de libertad.
La función de densidad de una variable aleatoria tn es:

2 −(n+1)/2

 √nβ(11 , n ) 1 + xn
2 2
f (x; n) =


0
para − ∞ < x < ∞
yn>0
en el resto.
1 )·Γ(α2 )
Siendo β la función beta definida: β(α1 , α2 ) = Γ(α
Γ(α1 +α2 ) para α1 , α2 > 0.
La Esperanza y Varianza de la distribución tn , son:
E(X) = µ = 0, para n > 1, indefinida para otros valores.
Var(X) = σ 2 =
n
, para n > 2, indefinida para otros valores.
n−2
0.4
Distribución t Student : n = 1,2,3,4
N(0,1)
n=1
n=2
0.2
n=4
0.0
0.1
Densidad
0.3
n=3
−3
−2
−1
0
1
2
3
x
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 30 / 37
24
Distribución tn de Student
Propiedad: A medida que aumenta n, tn −→ N (0, 1).
La Función de Distribución F (x) nos permite saber, dada una variable aleatoria X ≡ tn ,
Z a
f (x; n)dx.
P(X < a) = p =
−∞
El cálculo de esta integral se encuentra en la Tabla de distribución tn de Student.
> qt(0.975,df=5)
[1] 2.570582
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 31 / 37
25
Distribución tn de Student
Más en concreto la Función de Distribución Inversa: para distintos valores de n y de p se puede
buscar en la tabla su cuantil a.
0.2
0.1
Densidad
0.3
t n=3, P(X<a)=p=F(a)
0.0
p
a
−4
−2
0
2
4
x
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 32 / 37
tn de Student con R
Distribución tn de Student:
>
>
+
>
>
>
>
>
>
>
>
>
>
x <- seq(-3.291, 3.291, length=100)
plot(x, dnorm(x, mean=0, sd=1), xlab="x", ylab="Densidad",
main="Distribución t Student : n = 1,2,3,4",, type="l")
abline(h=0, col="gray")
text(2,.38,"N(0,1)",col="black")
lines(.x, dt(x, df=1),col="blue")
text(2,.36,"n = 1",col="blue")
lines(.x, dt(x, df=2),col="green")
text(2,.34,"n = 2",col="green")
lines(.x, dt(x, df=3),col="red")
text(2,.32,"n = 3",col="red")
lines(.x, dt(x, df=4),col="pink")
text(2,.30,"n = 4",col="pink")
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 33 / 37
26
Distribución Fm,n de Snedecor
George Waddel Snedecor (1881-1974). Sean U y V dos variables independientes distribuidas
según leyes ji-cuadrado de m y n grados de libertad respectivamente, la variable X,
X=
U/m
,
V /n
se dice que es una variable Fm,n de Snedecor con m y n grados de libertad, en el numerador y
denominador respectivamente.
La función de densidad viene dada por la expresión,
f (x; m, n) =





(m/n)m/2
β( m
,n)
2 2
·
xm/2−1
(m+n)/2
m
1+
( n x)
0
para x > 0 y m, n > 0
en el resto.
La Esperanza y la Varianza de una distribución Fm,n son:
E(X) = µ =
Var(X) = σ 2 =
n
, para n > 2, indefinida para otros valores.
n−2
2n2 (m + n − 2)
, para n > 4, indefinida para otros valores.
m(n − 2)2 (n − 4)
2.0
Distribución F: m,n
m=1, n=1
m=2, n=1
1.5
m=5, n=2
1.0
m=100, n=100
0.0
0.5
Densidad
m=100, n=1
0
2
4
6
8
f
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 34 / 37
27
Distribución Fm,n de Snedecor
Propiedad: Si X ≡ Fm,n entonces
1
X
≡ Fn,m .
La Función de Distribucón F (x) nos permite saber, dada una variable aleatoria X ≡ Fm,n ,
Z a
f (x; m, n)dx.
P(X < a) = p =
0
El cálculo de esta integral se encuentra en la Tabla de distribución Fm,n de Snedecor.
> qf(0.95,df1=3,df2=4)
[1] 6.591382
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 35 / 37
28
Distribución Fm,n de Snedecor
Más en concreto la Función de Distribución Inversa: para distintos valores de m, n y de p se
puede buscar en la tabla su cuantil a.
0.3
0.2
Densidad
0.4
0.5
F m=5,n=2, P(X<a)=p=F(a)
0.0
0.1
p
a
0
1
2
3
4
5
6
x
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 36 / 37
Fm,n de Snedecor con R
Distribución Fm,n de Snedecor:
>
>
+
>
>
>
>
>
>
>
>
>
>
>
x <- seq(0, 8, length=400)
plot(x, df(x, df1=1, df2=1), xlab="f", ylab="Densidad",
main="Distribución F: m,n", type="l")
abline(h=0, col="gray")
abline(v=0, col="gray")
text(6,2,"m=1, n=1",col="black")
lines(.x, df(x, df1=2, df2=1),col="blue")
text(6,1.8,"m=2, n=1",col="blue")
lines(.x, df(x, df1=5, df2=2),col="green")
text(6,1.6,"m=5, n=2",col="green")
lines(.x, df(x, df1=100, df2=1),col="red")
text(6,1.4,"m=100, n=1",col="red")
lines(.x, df(x, df1=100, df2=100),col="pink")
text(6,1.2,"m=100, n=100",col="pink")
Licesio J. Rodrı́guez-Aragón
Tema 3, Unidad 4 – 37 / 37
29
Descargar