Estadística .FBA I 2011_2012 Práctica 4. Extensiones del modelo de regresión PRÁCTICA 4. REGRESIÓN CURVILÍNEA. INTRODUCCIÓN DE VARIABLES ARTIFICIALES EN REGRESIÓN LINEAL 4.1. Regresión exponencial 4.2. Regresión cúbica 4.3. Regresión con variables artificiales M. Carmen Carollo, Beatriz Pateiro Página 1 Estadística .FBA I 2011_2012 Práctica 4. Extensiones del modelo de regresión 4.1 Regresión exponencial Ejemplo : Estamos interesados en establecer la relación que existe entre la reacción a un estímulo (variable dependiente) y el tiempo de exposición a ese estímulo (variable independiente). Para ello disponemos de 14 observaciones que aparecen en el archivo tiempo_estimulo.sav. Si construímos el diagrama de dispersión, vemos que puede ajustarse por una función exponencial. El ajuste puede puede hacerse con el SPSS de la siguiente forma: Analizar / Regresión / Estimación Curvilínea... Dependiente : estim Independientes : tiempo Modelo : Exponencial M. Carmen Carollo, Beatriz Pateiro Página 2 Estadística .FBA I 2011_2012 Práctica 4. Extensiones del modelo de regresión El procedimiento nos devuelve la siguiente tabla: Resumen del modelo y estimaciones de los parámetros Variable dependiente:respuesta al estímulo Ecuación Resumen del modelo R cuadrado Exponencial ,930 F 158,997 gl1 Estimaciones de los parámetros gl2 1 Sig. 12 ,000 Constante 5,384 La variable independiente estiempo. estímulo = 5,38e −0,33tiempo Si además activamos: ver Tabla ANOVA M. Carmen Carollo, Beatriz Pateiro Página 3 b1 -,333 Estadística .FBA I 2011_2012 Práctica 4. Extensiones del modelo de regresión Analizar / Regresión / Estimación Curvilínea... Dependiente : estim Independientes : tiempo Modelo : Exponencial - ver tabla ANOVA Nos devuelve las siguientes tablas: ANOVA Suma de cuadrados Regresión Residual Total Media cuadrática gl 20,190 1 20,190 1,524 12 ,127 21,714 13 F Sig. 158,997 ,000 La variable independiente es tiempo. Coeficientes Coeficientes Coeficientes no estandarizados B estandarizados Error típico tiempo -,333 ,026 (Constante) 5,384 ,978 Beta t -,964 Sig. -12,609 ,000 5,507 ,000 La variable dependiente es ln(respuesta al estímulo). Las dos tablas anteriores ponen de manifiesto que la reacción al estímulo depende exponencialmente del tiempo de exposición a ese estímulo. M. Carmen Carollo, Beatriz Pateiro Página 4 Estadística .FBA I 2011_2012 Práctica 4. Extensiones del modelo de regresión 4.2 Regresión cúbica Ejemplo: Para los datos del archivo datos_NL.sav establecer la relación que existe entre la variable Ycub y la variable Xcub . Dibujamos primero el diagrama de dispersión y vamos haciendo ajustes. Decidimos entonces realizar un ajuste cúbico, es decir, ajustamos un modelo de la forma: M. Carmen Carollo, Beatriz Pateiro Página 5 Estadística .FBA I 2011_2012 Práctica 4. Extensiones del modelo de regresión Y =β 0 + β1 X + β 2 X 2 + β3 X 3 Las estimaciones de los parámetros del modelo se pueden obtener con el SPSS: Analizar / Regresión / Estimación curvilínea / Cúbica Dependiente: Ycub Independiente: Xcub Modelo: cúbico Podemos activar: Ver ANOVA Obtenemos las siguientes tablas: Resumen del modelo R R cuadrado ,832 R cuadrado Error típico de corregida la estimación ,693 ,688 ,819 La variable independiente esXcub. M. Carmen Carollo, Beatriz Pateiro Página 6 Estadística .FBA I 2011_2012 Práctica 4. Extensiones del modelo de regresión ANOVA Suma de Media cuadrados gl cuadrática Regresión 296,837 3 98,946 Residual 131,594 196 ,671 Total 428,431 199 F 147,373 Sig. ,000 La variable independiente esXcub. El modelo ajustado es : Yˆ = −0, 05 − 2 X + 3 X 2 + 2 X 3 M. Carmen Carollo, Beatriz Pateiro Página 7 Estadística .FBA I 2011_2012 Práctica 4. Extensiones del modelo de regresión 4.3 Regresión con variables artificiales Ejemplo: Se quiere obtener un modelo de regresión que explique el colesterol a partir de las grasas y el ejercicio físico ( 0=”no hace”, 1=”ejercicio moderado” y 2=”ejercicio intenso”). Los datos aparecen en el archivo colesterol.sav Dado que el ejercicio físico es un factor (variable cualitativa) con tres modalidades, debemos crear dos variables artificiales (con la opción Transformar/Recodificar en distintas variables): EM = 1 si hace ejercicio mod erado 0 en otro caso EI = 1 si hace ejercicio int enso 0 en otro caso Realizamos la regresión con el SPSS de la siguiente forma: Analizar / Regresión / Regresión lineal Dependiente : colesterol Independientes : grasas, EM, EI M. Carmen Carollo, Beatriz Pateiro Página 8 Estadística .FBA I 2011_2012 Práctica 4. Extensiones del modelo de regresión Obtenemos: Resumen del modelo Modelo R di 1 ,636 R cuadrado a R cuadrado Error típ. de la corregida estimación ,404 ,330 57,809 me nsi on 0 a. Variables predictoras: (Constante), Grasas, ejintenso, ejmodera b ANOVA Modelo Suma de cuadrados 1 Media gl cuadrática Regresión 54412,310 3 18137,437 Residual 80205,547 24 3341,898 134617,857 27 Total F 5,427 Sig. ,005 a a. Variables predictoras: (Constante), Grasas, ejintenso, ejmodera b. Variable dependiente: colesterol M. Carmen Carollo, Beatriz Pateiro Página 9 Estadística .FBA I 2011_2012 Práctica 4. Extensiones del modelo de regresión Coeficientes Modelo Coeficientes no Coeficiente estandarizados s tipificados B 1 a Error típ. (Constante) 236,730 27,483 ejmodera -36,815 29,613 ejintenso -82,196 1,365 Grasas Beta t Sig. 8,614 ,000 -,218 -1,243 ,226 24,716 -,579 -3,326 ,003 ,551 ,394 2,477 ,021 a. Variable dependiente: colesterol El modelo ajustado es: Colesterol = 236,73 - 36,81ejmoderado - 82,196ejintenso + 1,365 grasas que puede interpretarse de la siguiente forma: Para un mismo tipo de ejercicio, el colesterol medio aumenta en 1,365 cuando el contenido en grasas aumenta una unidad. Para un mismo contenido en grasas, el colesterol medio disminuye en 36,81 cuando pasamos de no hacer ejercicio (categoría de referencia) a hacer ejercicio moderado. Para un mismo contenido en grasas, el colesterol medio disminuye en 82,196 cuando pasamos de no hacer ejercicio a hacer ejercicio intenso. Observemos que aunque el coeficiente asociado a ejmoderado no es significativo (p-valor = 0,226), debemos mantener esta variable en el modelo para que pueda entenderse la estructura del mismo. El modelo es adecuado pues el p-valor asociado al contraste de regresión es muy pequeño. M. Carmen Carollo, Beatriz Pateiro Página 10