Estadı́stica II Curso 2010/2011 Licenciatura en Matemáticas Práctica 6: Regresión logı́stica con R 1. Los datos: defectos en transbordadores espaciales En 1986, el transbordador espacial Challenger tuvo un accidente catastrófico debido a un incendio en una de las piezas de sus propulsores. Era la vez 25 en que se lanzaba un transbordador espacial. En todas las ocasiones anteriores se habı́an inspeccionado los propulsores de las naves, y en algunas de ellas se habı́an encontrando defectos. El fichero challenger contiene 23 observaciones de las siguientes variables: defecto, que toma los valores 1 y 0 en función de si se encontraron defectos o no en los propulsores; y temp, la temperatura (en grados Fahrenheit) en el momento del lanzamiento. Una representación gráfica de los datos, puede obtenerse mediante: attach(challenger) plot(temp,defecto,pch=1+15*defecto) ● ● ● ● ● ● 0.2 0.4 defecto 0.6 0.8 1.0 legend(’bottomleft’,c(’No defecto’,’Si defecto’),pch=c(1,16)) 0.0 ● ● No defecto Si defecto 55 ● ● ● ● ● 60 65 70 ● ● ● ● 75 ● ● ● 80 temp Parece razonable, a la vista de los datos, pensar que la temperatura puede influir en la probabilidad de que los propulsores tengan defectos. En esta práctica, vamos a ajustar un modelo de regresión logı́stica para estudiar la posible relación. 1 2. Ajuste del modelo Para ajustar el modelo y obtener los resultados principales: > reg = glm(defecto ~ temp,family=binomial) > summary(reg) Call: glm(formula = defecto ~ temp, family = binomial) Deviance Residuals: Min 1Q Median 3Q Max -1.0611 -0.7613 -0.3783 0.4524 2.2175 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 15.0429 7.3786 2.039 0.0415 * temp -0.2322 0.1082 -2.145 0.0320 * --Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 28.267 on 22 degrees of freedom Residual deviance: 20.315 on 21 degrees of freedom AIC: 24.315 Number of Fisher Scoring iterations: 5 En el modelo de regresión logı́stica la raı́z de las desviaciones representa el papel de los residuos: Di = ∓ p −2[Yi log p̂i + (1 − Yi ) log(1 − p̂i )], donde el signo coincide con el signo de Yi − p̂i . En la salida anterior estas cantidades se denominan deviance residuals. Para calcular estos pseudo-residuos, podemos ejecutar res = resid(reg). 2 Cuestiones ¿Se puede afirmar a nivel α = 0,05, que la temperatura influye en la probabilidad de que los propulsores tengan defectos? ¿Y a nivel α = 0,01? Usa el test de Wald. Contesta a las preguntas anteriores, pero utilizando un test de razón de verosimilitudes (comparando las desviaciones). Interpreta el valor del coeficiente estimado para la variable temp, β̂1 = −0,2322 ¿Con qué cantidad de la salida de R coincide la suma de los pseudo-residuos al cuadrado? Representa gráficamente la curva de las probabilidades estimadas de que aparezcan defectos en función de la temperatura: p̂(t) = 1 1 + exp(−β̂0 − β̂1 t) . ● ● ● ● ● ● 0.6 0.4 0.0 0.2 P(defectos) 0.8 1.0 El resultado debe ser similar al siguiente gráfico: ● ● ● ● ● 55 60 65 70 ● ● ● ● 75 ● ● ● 80 temp ¿Para qué valores de la temperatura se predice que se van a producir defectos? 3