Tema 1 1. Muestreo y distribuciones en el muestreo

Anuncio
Problemas tema 1 MUESTREO Y DISTRIBUCIONES EN EL MUESTREO
Inferencia Estadı́stica Avanzada, 2013-2014
Problemas para realizar en clase
Tema 1
1.
Muestreo y distribuciones en el muestreo
1. Sean X1 , X2 . . . v.a.i.i.d. cada una de ellas con densidad f (x). Supongamos que cada Xi mide la cantidad anual de precipitaciones en un determinado
emplazamiento. Da la distribución del número de años que transcurren hasta
que las lluvias del primer año, X1 , son superadas por primera vez.
2. Sean X1 , . . . , Xn v.a.i.i.d. con densidad fX (x). Sea X su media muestral.
Prueba que
fX (x) = nfX1 +···+Xn (nx).
3. Sea X1 , . . . , Xn una muestra aleatoria simple de X, a partir de la que se
calcula la media y la varianza muestral de la forma usual:
n
X=
n
1 X
1X
Xi , S 2 =
(Xi − X)2 .
n i=1
n − 1 i=1
a) Prueba que
n
S2 =
n
XX
1
(Xi − Xj )2 .
2n(n − 1) i=1 j=1
Supongamos que E(X 4 ) < ∞. Sean θ1 = E(X) y θj = E((X − θ1 )j ), j = 2, 3, 4.
b) Prueba que
1
V (S ) =
n
2
n−3 2
θ4 −
θ .
n−1 2
c) Da la expresión de Cov(X, S 2 ) en términos de θ1 , . . . , θ4 . ¿Bajo qué condiciones son X y S 2 incorreladas?
d) Si la distribución de X es simétrica respecto de θ1 , ¿es posible que la
covarianza de esos estadı́sticos sea no nula?
e) Si la distribución de X no es simétrica respecto de θ1 , ¿es posible que la
covarianza de esos estadı́sticos sea nula?
4. Llamemos X n y Sn2 a la media y la varianza muestrales calculadas a
partir de n observaciones X1 , . . . , Xn . Supongamos que se observa un nuevo
valor Xn+1 . Demuestra las siguientes fórmulas recursivas.
a)
X n+1 =
Inferencia Estadı́stica Avanzada
1
(Xn+1 + nX n ).
n+1
1
Problemas tema 1
2
b)
2
nSn+1
= (n − 1)Sn2 +
ESTADÍSTICOS DE ORDEN
n
(Xn+1 − X n )2 .
n+1
5. Sean X 1 y X 2 las medias muestrales calculadas a partir de dos muestras
independientes de tamaño n de una población con varianza σ 2 . Halla el menor
valor de n que garantiza que
σ
P |X 1 − X 2 | <
5
es al menos 0.99. Para ello, utiliza tanto la desigualdad de Chebychev como el
Teorema Central del Lı́mite. Comenta los resultados obtenidos.
6. Sean Xi ∼ N (i, i2 ), i = 1, 2, 3, tres variables aleatorias independientes
independientes. Construye a partir de estas variables aleatorias independientes
otras que tengan las siguientes distribuciones.
a) χ23 .
b) t2 .
c) F1,2 .
2.
Estadı́sticos de orden
7. Sean Ui , i = 1, 2, . . . , variables aleatorias independientes independientes
con distribución U (0, 1). Sea X una variable aleatoria con distribución
P (X = x) =
1
, x = 1, 2, 3, . . .
(e − 1)x!
Da la distribución de
Z = mı́n{U1 , . . . , UX }.
Indicación: Observar que Z|X = x es el primer estadı́stico de orden de una
muestra de tamaño x de una U (0, 1).
8. Sea X1 , . . . , Xn una muestra aleatoria simple de una población con densidad
1
fX (x) = I(0,θ) (x).
θ
Sean X(1) , . . . , X(n) los estadı́sticos orden. Prueba que X(1) /X(n) y X(n) son
independientes.
9. Sea X1 , . . . , Xn una muestra aleatoria simple de una población con densidad fX (x), −∞ < x < ∞.
Rx
a) Para i = 1, 2, ..., n, sea Ui = FX (Xi ), siendo FX (x) = −∞ fx (t)dt. Encuentra la distribución de la variable Ui . La transformación Ui = FX (Xi )
se conoce con el nombre de transformada integral en probabilidad.
Inferencia Estadı́stica Avanzada
2
Problemas tema 1
3
FAMILIAS EXPONENCIALES
b) Sean U(1) , U(2) , ..., U(n) los n estadı́sticos de orden correspondientes a las
variables aleatorias i.i.d. U1 , U2 , ..., Un . Para 1 ≤ r < s ≤ n demostrar que
la variable aleatoria
Vrs = [U(s) − U(r) ] ∼ BET A(α = s − r, β = n − s + r + 1)
.
3.
Familias exponenciales
10. Prueba que las siguientes son familias exponenciales y describe el espacio
paramétrico natural de cada una de ellas.
a) Familia normal con alguno de los parámetros µ o σ conocidos.
b) Familia gamma con alguno de los parámetros α o β conocidos.
c) Familia beta con alguno de los parámetros α o β conocidos.
d) Familia Poisson.
e) Binomial negativa con el parámetro r conocido y 0 < p < 1.
11. Considera la familia exponencial expresada en términos de su espacio
paramétrico natural con densidad
k
X
f (x; η ) = h(x)c(η ) exp{
ηi ti (x)}.
e
e
i=1
Prueba que
∂
log(c(η )).
Eη (ti (X)) = −
∂η
i
e
e
Indicación: Usa el hecho de que para una familia exponencial se tiene que
Z ∞
Z ∞
∂
∂
f
(x)dx
=
f (x)dx.
η
j η
∂ηij −∞ e
∂η
−∞
i e
12. Considera la familia de distribuciones normales con media θ y varianza
θ2 , donde θ puede tomar cualquier valor real. Prueba que esta familia es una
familia exponencial y determina el espacio paramétrico natural.
13. Sean X1 , . . . , Xn v.a.i.i.d. con distribución perteneciente a una familia exponencial expresada en términos del espacio paramétrico natural. Prueba
que la distribución conjunta de las n variables también pertenece a la familia
exponencial.
14. Sean X1 , . . . , Xn v.a. independientes tales que Xi ∼ Poisson(iθ), θ > 0.
Prueba que la familia de distribuciones conjuntas de las n variables es una
familia exponencial.
Inferencia Estadı́stica Avanzada
3
Problemas tema 1
4
FAMILIAS DE LOCALIZACIÓN Y ESCALA
15. Sean X1 , . . . , Xn v.a. independientes tales que Xi ∼ N (iθ, 1), θ ∈ R.
Prueba que la familia de distribuciones conjuntas de las n variables es una
familia exponencial.
16. Sean X1 , . . . , Xn v.a. independientes tales que Xi ∼ Exp(1/(iθ)), E(Xi ) =
iθ, θ > 0. Prueba que la familia de distribuciones conjuntas de las n variables
es una familia exponencial.
4.
Familias de localización y escala
17. Considera la función de densidad
f (x) =
63 6
(x − x8 ), −1 < x < 1.
4
Dibuja el gráfico de
1
f
σ
x−µ
σ
para los siguientes valores de µ y σ en el mismo sistema de ejes cartesianos.
a) µ = 0, σ = 1.
b) µ = 3, σ = 1.
c) µ = 3, σ = 2.
18. Muestra que si f (x) es una función de densidad simétrica alrededor de
0, entonces la mediana de la densidad
1
x−µ
f
σ
σ
es µ.
19. Sea Z una variable aleatoria con densidad f (z). Se define zα como un
número que satisface que
Z ∞
α = P (Z > zα ) =
f (z)dz.
zα
Sea X una variable aleatoria con densidad en la familia de localización y escala
de f
1
x−µ
f
σ
σ
y sea xα = µ + σzα . Prueba que P (X > xα ) = α. (Nota: Ası́, los valores de
xα se calculan fácilmente para cualquier miembro de la familia de localización
y escala si se dispone de una tabla de valores zα .)
20. Considera la distribución de Cauchy, con densidad
f (x) =
Inferencia Estadı́stica Avanzada
1
, x ∈ R,
π(1 + x2 )
4
Problemas tema 1
4
FAMILIAS DE LOCALIZACIÓN Y ESCALA
y la familia de localización y escala definida a partir de ella: X tiene distribución
de Cauchy con parámetros µ y σ si su densidad es
f (x; µ, σ) =
σ
, x ∈ R.
π(σ 2 + (x − µ)2 )
No existen la esperanza ni la varianza de estas distribuciones, luego µ y σ 2 no
son la media y la varianza. No obstante, tienen un importante significado.
a) Prueba que µ es la mediana de X.
b) Prueba que µ − σ y µ + σ son los cuartiles primero y tercero, respectivamente, de X.
21. Sea f (x) una función de densidad con media µ y varianza σ 2 . Indica cómo
crear una familia de localización y escala basada en f (x) tal que la densidad
estándar de la familia, f ∗ (x), tenga esperanza 0 y varianza 1.
Inferencia Estadı́stica Avanzada
5
Descargar