Probabilidad y Estadıstica Segundo del grado en

Anuncio
Probabilidad y Estadı́stica
Segundo del grado en Telecomunicaciones, UAM, 2013-2014
Breve solucionario del examen parcial, 18-12-2013
1. (2 puntos) Contesta razonadamente a las siguientes preguntas:
a) Se lanza un dado 600 veces y se anotan los resultados obtenidos. Describe el procedimiento
que seguirı́as para contrastar, a la vista de esos resultados, si el dado es regular.
Solución. Se fija un nivel de significación α, digamos el 5 % y se contrasta, mediante un
text χ2 , si el dado sigue el modelo (dado regular). Para ello se consideran k = 6 clases, los valores
1, 2, . . . , 6, se cuentan cuántas observaciones hay en cada una de ellas (los valores O1 , . . . , O6 )
y se comparan con los valores esperados, que como el dado es regular, son
constantes en cada
clase: ei = 600 · 1/6 = 100 para i = 1, . . . , 6. Se calcula el estadı́stico B = 6i=1 (Oi − ei )2 /ei y se
comprueba si ese número está por encima o por debajo del percentil χ26−1,α . En el primer caso,
se rechaza la hipótesis.
b) En un contraste de hipótesis, ¿qué significa el nivel de significación α?
Solución. La (máxima) probabilidad de rechazar la hipótesis nula cuando ésta es cierta.
c) Tenemos una muestra de una variable X que sigue una N (μ, σ), con σ conocida. Estamos
contrastando la hipótesis H0 : μ = 2. Al nivel de significación α = 5 %, se rechaza la
hipótesis. ¿Cómo será el p-valor, mayor o menor que 5 %?
Solución. El p-valor asociado a una muestra es el mı́nimo α para el que se rechazarı́a la
hipótesis nula. Como en este caso con α = 5 % se rechaza, el p-valor debe ser ≤ 5 %.
d) Con N muestras de una variable X que sigue una N (μ, σ), con σ conocida, el intervalo
de confianza al 95 % para la media tiene tamaño 0.1. Querrı́amos reducir en un factor 10
el tamaño de este intervalo de confianza. ¿Cómo de grande deberı́a ser la nueva muestra?
√
Solución. El enunciado nos dice que z2.5 % σ/ N = 0.1. Como σ es fija, reducir un factor 10
el error (pasando a 0.01) significa que la muestra debe ser de tamaño 100N (o mayor).
2. (2 puntos) Se analiza el peso en dos grupos, el primero formado por 400 personas, y el
segundo por 600. Se cuentan cuántos de cada grupo tienen peso menor de 60 kg, cuántos lo
tienen entre 60 y 80, y cuántos superan los 80 kg, obteniéndose los siguientes resultados:
< 60
60 − 80
> 80
grupo 1
30
200
170
grupo 2
70
300
230
¿Se puede concluir, con un nivel de significación del 5 %, que los dos grupos presentan caracterı́sticas similares en cuanto al peso?
Solución. Hacemos un text χ2 de homogeneidad. Éstas son las tablas de datos observados, esperados,
y diferencias relativas:
observados
30
70
200 300
170 230
400 600
100
500
400
1000
10 %
50 %
40 %
esperados
40
60
200 300
160 240
(O − e)2 /e
100/40
100/60
0
0
100/160 100/240
Los esperados se calculan con los porcentajes (10 %, 50 % y 40 %) de los tamaños muestrales, 400 y 600.
Ası́ que basta sumar
100
100
100
5
5
5
5
60 + 40 + 15 + 10
135
100
+
+
+
= + + +
=
=
= 5.208.
40
60
160
240
2
3
8
12
24
24
El ejercicio termina comparando este número con el percentil χ22;5 % = 5.99, lo que determina la aceptación de la hipótesis de homogeneidad. El número de grados de libertad es (3 − 1) · (2 − 1) = 2.
3. (2 puntos) El tiempo (en √
segundos) que la máquina M1 tarda en producir una pieza sigue
una N (μ1 , σ1 ), donde σ1 = 3/ 2, mientras que el tiempo para la máquina M2 es una N (μ2 , σ2 ),
donde σ2 = 4. Queremos contrastar, al nivel de significación del 5 %, si las dos máquinas son
igual de rápidas. Para ello, se fabrican 50 piezas con M1, obteniéndose que el tiempo medio
de fabricación es de 54 segundos. Al fabricar 100 piezas con M2 se mide un tiempo medio de
fabricación de 55.5 segundos. ¿Qué se puede concluir?
Solución. La cuestión sugiere plantear, como hipótesis nula, H0 : μ1 = μ2 . La diferencia de medias
muestrales es |x̄1 − x̄2 | = 1.5 segundos. Por otro lado,
16
+ 100
= 1.960 25/100 = 1.960/2 = 0.98 .
z2.5 % σ12 /n1 + σ22 /n2 = 1.960 9/2
50
Ası́ que rechazamos la hipótesis nula.
1 4. (2 puntos) Se quiere estudiar la proporción p de declaraciones de la renta que presentan algún defecto. ¿Cuál es el tamaño muestral necesario para estimar p cometiendo un error
máximo del 1 % con una probabilidad de 95 %?
Soluci
ón. Queremos hallar n (tamaño de la muestra) para que el intervalo de confianza
z2.5 % x (1 − x)/n sea menor que 0.01. No podemos usar x̄ porque no tenemos muestra, justamente
estamos intentando estimar su tamaño. Nos ponemos en el “peor caso”, en el que x̄ = 1/2, y el cálculo
es ya directo:
√
1
1.96 · 100
1/4
≤
=⇒
= 98,
n≥
z2.5 %
n
100
2
de manera que n ≥ 982 . Si n cumple esta condición, el intervalo de confianza será menor que 0.01 en
el peor de los casos, y con más razón en los restantes.
5. a) (2 puntos) La variable aleatoria X tiene como función de densidad
3 x2 /θ3 si x ∈ [0, θ],
fθ (x) =
0
en caso contrario.
Aquı́ θ es un parámetro, θ ∈ [1, 2]. Dada una muestra x1 , . . . , xN de la variable X, obtén un
estimador de θ por el método de los momentos.
b) (1 punto extra) ¿Qué se obtendrı́a por máxima verosimilitud?
Solución. a) Basta hallar la esperanza de X:
θ
θ
x2
3
3
E(X) =
x 3 3 dx = 3
x3 dx = θ.
θ
θ 0
4
0
El estimador por momentos es solución de E(X) = x̄, con x̄ la media muestral. Ası́ que θ̂ =
4
3
x̄.
b) La función de verosimilitud de una muestra x1 , . . . , xN serı́a
L(θ; x1 , . . . , xN ) =
N
j=1
3
N
N
x2j
3N 2
= 3N
xj =⇒ ln L(θ; x1 , . . . , xN ) = N ln(3) − 3N ln(θ) +
2 ln(xj ).
3
θ
θ
j=1
j=1
Pero derivar esta última función con respecto a θ e igualar a 0,
3N
d
ln(L) = −
=0
dθ
θ
no tiene solución (para θ ∈ [1, 2]). Ası́ que este método (de cálculo de máximos derivando) no es
útil aquı́. Sin embargo, el logaritmo de la función de verosimilitud es decreciente con θ, y por tanto
alcanzará su máximo en θ = 1.
Descargar