Práctica 6: Regresión log´ıstica con R

Anuncio
Estadı́stica II
Curso 2010/2011
Licenciatura en Matemáticas
Práctica 6: Regresión logı́stica con R
1.
Los datos: defectos en transbordadores espaciales
En 1986, el transbordador espacial Challenger tuvo un accidente catastrófico debido a un
incendio en una de las piezas de sus propulsores. Era la vez 25 en que se lanzaba un transbordador espacial. En todas las ocasiones anteriores se habı́an inspeccionado los propulsores
de las naves, y en algunas de ellas se habı́an encontrando defectos. El fichero challenger
contiene 23 observaciones de las siguientes variables: defecto, que toma los valores 1 y 0
en función de si se encontraron defectos o no en los propulsores; y temp, la temperatura (en
grados Fahrenheit) en el momento del lanzamiento. Una representación gráfica de los datos,
puede obtenerse mediante:
attach(challenger)
plot(temp,defecto,pch=1+15*defecto)
●
● ●
●
●
●
0.2
0.4
defecto
0.6
0.8
1.0
legend(’bottomleft’,c(’No defecto’,’Si defecto’),pch=c(1,16))
0.0
●
●
No defecto
Si defecto
55
● ● ● ● ●
60
65
70
● ●
● ●
75
● ●
●
80
temp
Parece razonable, a la vista de los datos, pensar que la temperatura puede influir en la
probabilidad de que los propulsores tengan defectos. En esta práctica, vamos a ajustar un
modelo de regresión logı́stica para estudiar la posible relación.
1
2.
Ajuste del modelo
Para ajustar el modelo y obtener los resultados principales:
> reg = glm(defecto ~ temp,family=binomial)
> summary(reg)
Call:
glm(formula = defecto ~ temp, family = binomial)
Deviance Residuals:
Min
1Q
Median
3Q
Max
-1.0611
-0.7613
-0.3783
0.4524
2.2175
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept)
15.0429
7.3786
2.039
0.0415 *
temp
-0.2322
0.1082
-2.145
0.0320 *
--Signif. codes:
0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 28.267
on 22
degrees of freedom
Residual deviance: 20.315
on 21
degrees of freedom
AIC: 24.315
Number of Fisher Scoring iterations: 5
En el modelo de regresión logı́stica la raı́z de las desviaciones representa el papel de los
residuos:
Di = ∓
p
−2[Yi log p̂i + (1 − Yi ) log(1 − p̂i )],
donde el signo coincide con el signo de Yi − p̂i . En la salida anterior estas cantidades se
denominan deviance residuals. Para calcular estos pseudo-residuos, podemos ejecutar res =
resid(reg).
2
Cuestiones
¿Se puede afirmar a nivel α = 0,05, que la temperatura influye en la probabilidad de
que los propulsores tengan defectos? ¿Y a nivel α = 0,01? Usa el test de Wald.
Contesta a las preguntas anteriores, pero utilizando un test de razón de verosimilitudes
(comparando las desviaciones).
Interpreta el valor del coeficiente estimado para la variable temp, β̂1 = −0,2322
¿Con qué cantidad de la salida de R coincide la suma de los pseudo-residuos al cuadrado?
Representa gráficamente la curva de las probabilidades estimadas de que aparezcan
defectos en función de la temperatura:
p̂(t) =
1
1 + exp(−β̂0 − β̂1 t)
.
●
● ●
●
●
●
0.6
0.4
0.0
0.2
P(defectos)
0.8
1.0
El resultado debe ser similar al siguiente gráfico:
● ● ● ● ●
55
60
65
70
● ●
● ●
75
● ●
●
80
temp
¿Para qué valores de la temperatura se predice que se van a producir defectos?
3
Descargar