Veri cación de supuestos en el modelo

Anuncio
Grácos de residuales
Grácos con R
Vericación de supuestos en el modelo
Ms Carlos López de Castilla Vásquez
Universidad Nacional Agraria La Molina
2011-2
Ms Carlos López de Castilla Vásquez
Vericación de supuestos en el modelo
Grácos de residuales
Grácos con R
Valores inuenciales
Relación lineal entre cada
X
j
y
Y
Gráco de DFBETAS y DFFITS
Para observar el efecto de cada observación sobre los
coecientes de regresión se pueden gracar los DFBETAS y los
DFFITS.
Si algún DFBETAS se aleja demasiado del resto entonces la
observación inuye de manera importante sobre el coeciente
de regresión respectivo.
Si algún DFFITS se aleja demasiado del resto entonces la
observación inuye de manera importante sobre el vector de
coecientes de regresión.
Ms Carlos López de Castilla Vásquez
Vericación de supuestos en el modelo
Grácos de residuales
Grácos con R
Residuales versus cada
X
Valores inuenciales
Relación lineal entre cada
X
j
y
Y
j
Se grácan los residuales del modelo de regresión completo
versus cada variable predictora, es decir:
ê versus
Xj
Si la variable predictora presenta una relacion lineal con Y los
puntos en el gráco anterior se deberían alinear a lo largo de
una franja horizontal.
Si se observa algún patrón no lineal entonces la variable
predictora debería ser transformada.
Ms Carlos López de Castilla Vásquez
Vericación de supuestos en el modelo
Grácos de residuales
Grácos con R
Residuales versus cada
Valores inuenciales
Relación lineal entre cada
X
j
y
Y
X no incluida
j
Se grácan los residuales del modelo de regresión completo
excluyendo Xj versus Xj , es decir:
êY/X−j
versus
Xj
Si la variable predictora presenta una relación lineal con Y
entonces la gráca debería mostrar una tendencia lineal.
Si se observa una tendencia no lineal habría que considerar
realizar alguna transformación sobre Xj .
Ms Carlos López de Castilla Vásquez
Vericación de supuestos en el modelo
Grácos de residuales
Grácos con R
Valores inuenciales
Relación lineal entre cada
X
j
y
Y
Gráco de regresiones parciales
Se grácan los residuales del modelo de regresión completo
excluyendo Xj versus los residuales obtenidos de la regresión
de Xj con respecto a las demas variables predictoras, es decir:
êY/X−j
versus êXj /X−
j
Si la variable predictora presenta una relación lineal con Y
entonces su gráco de regresión parcial debería mostrar una
tendencia lineal que pasa por el origen.
Si se observa una tendencia no lineal habría que considerar
realizar alguna transformación sobre Xj .
Ms Carlos López de Castilla Vásquez
Vericación de supuestos en el modelo
Grácos de residuales
Grácos con R
Valores inuenciales
Relación lineal entre cada
X
j
y
Y
Gráco de residuales parciales
Se grácan los residuales del modelo de regresión completo
más Xj βj versus Xj , es decir:
ê + Xj βj
versus
Xj
Este gráco es mucho más efectivo para detectar algún tipo de
relación no lineal en Xj que el gráco de regresión parcial.
Ms Carlos López de Castilla Vásquez
Vericación de supuestos en el modelo
Grácos de residuales
Grácos con R
Valores inuenciales
Relación lineal entre cada
X
j
y
Y
Gráco de residuales parciales aumentados
Se grácan los residuales del modelo de regresión completo
más Xj βj + Xj2 βjj versus Xj , es decir:
ê + Xj βj + Xj2 βjj
versus
Xj
βj y βjj son los coecientes de la regresión de
Xj2 .
Y versus Xj y
Este gráco fue propuesto por Mallows (1986) y es el más
adecuado para vericar si la variable Xj debe entrar en forma
cuadrática al modelo.
Ms Carlos López de Castilla Vásquez
Vericación de supuestos en el modelo
Grácos de residuales
Grácos con R
Homogeneidad de variancia
Normalidad en los errores
Valores inuenciales
Residuales versus valores estimados
Se deben gracar los residuales estudiantizados internamente
versus los valores estimados.
Un gráco que muestra puntos en forma de embudo o con
tendencia no lineal podría sugerir la falta de homogeneidad de
variancia o la falta de inclusión de términos no lineales para las
variables predictoras en el modelo.
Tambien se debe gracar la raiz cuadrada de los residuales
estudiantizados internamente versus los valores estimados.
Si el supuesto de homogeneidad se cumple el lowess para el
gráco anterior debería ser aproximadamente una linea
horizontal.
Ms Carlos López de Castilla Vásquez
Vericación de supuestos en el modelo
Grácos de residuales
Grácos con R
Homogeneidad de variancia
Normalidad en los errores
Valores inuenciales
Gráco Q-Q
Para vericar el supuesto de normalidad de los errores se
gracan los cuantiles de la distribucion normal estándar versus
los residuales estudiantizados internamente ordenados en
magnitud.
Si el supuesto es verdadero deberia observarse los puntos en el
gráco con una marcada tendencia lineal.
También se podría aplicar alguna prueba no paramétrica como
la de Shapiro-Wilks o la prueba de Anderson Darling.
Ms Carlos López de Castilla Vásquez
Vericación de supuestos en el modelo
Grácos de residuales
Grácos con R
Gráco de
r ∗ versus leverages
Homogeneidad de variancia
Normalidad en los errores
Valores inuenciales
i
Se gracan los residuales estudentizados internamente versus
leverage, es decir:
ri∗ versus hii
En este mismo gráco se muestran los contornos
correspondientes a la distancia de Cook.
Este gráco permite identicar los valores inuenciales ya sean
éstos valores extremos o valores leverages altos.
Ms Carlos López de Castilla Vásquez
Vericación de supuestos en el modelo
Descargar