PRÁCTICA 4. REGRESIÓN CURVILÍNEA. INTRODUCCIÓN DE

Anuncio
Estadística .FBA I 2011_2012
Práctica 4. Extensiones del modelo de regresión
PRÁCTICA 4. REGRESIÓN CURVILÍNEA. INTRODUCCIÓN DE VARIABLES
ARTIFICIALES EN REGRESIÓN LINEAL
4.1. Regresión exponencial
4.2. Regresión cúbica
4.3. Regresión con variables artificiales
M. Carmen Carollo, Beatriz Pateiro
Página 1
Estadística .FBA I 2011_2012
Práctica 4. Extensiones del modelo de regresión
4.1 Regresión exponencial
Ejemplo :
Estamos interesados en establecer la relación que existe entre la reacción a un
estímulo (variable dependiente) y el tiempo de exposición a ese estímulo (variable
independiente). Para ello disponemos de 14 observaciones que aparecen en el
archivo tiempo_estimulo.sav.
Si construímos el diagrama de dispersión, vemos que puede ajustarse por una función
exponencial.
El ajuste puede puede hacerse con el SPSS de la siguiente forma:
Analizar / Regresión / Estimación Curvilínea...
Dependiente : estim
Independientes : tiempo
Modelo : Exponencial
M. Carmen Carollo, Beatriz Pateiro
Página 2
Estadística .FBA I 2011_2012
Práctica 4. Extensiones del modelo de regresión
El procedimiento nos devuelve la siguiente tabla:
Resumen del modelo y estimaciones de los parámetros
Variable dependiente:respuesta al estímulo
Ecuación
Resumen del modelo
R cuadrado
Exponencial
,930
F
158,997
gl1
Estimaciones de los parámetros
gl2
1
Sig.
12
,000
Constante
5,384
La variable independiente estiempo.
estímulo = 5,38e −0,33tiempo
Si además activamos: ver Tabla ANOVA
M. Carmen Carollo, Beatriz Pateiro
Página 3
b1
-,333
Estadística .FBA I 2011_2012
Práctica 4. Extensiones del modelo de regresión
Analizar / Regresión / Estimación Curvilínea...
Dependiente : estim
Independientes : tiempo
Modelo : Exponencial
- ver tabla ANOVA
Nos devuelve las siguientes tablas:
ANOVA
Suma de
cuadrados
Regresión
Residual
Total
Media
cuadrática
gl
20,190
1
20,190
1,524
12
,127
21,714
13
F
Sig.
158,997
,000
La variable independiente es tiempo.
Coeficientes
Coeficientes
Coeficientes no estandarizados
B
estandarizados
Error típico
tiempo
-,333
,026
(Constante)
5,384
,978
Beta
t
-,964
Sig.
-12,609
,000
5,507
,000
La variable dependiente es ln(respuesta al estímulo).
Las dos tablas anteriores ponen de manifiesto que la reacción al estímulo depende
exponencialmente del tiempo de exposición a ese estímulo.
M. Carmen Carollo, Beatriz Pateiro
Página 4
Estadística .FBA I 2011_2012
Práctica 4. Extensiones del modelo de regresión
4.2 Regresión cúbica
Ejemplo:
Para los datos del archivo datos_NL.sav establecer la relación que existe entre la
variable Ycub y la variable Xcub .
Dibujamos primero el diagrama de dispersión y vamos haciendo ajustes.
Decidimos entonces realizar un ajuste cúbico, es decir, ajustamos un modelo de la forma:
M. Carmen Carollo, Beatriz Pateiro
Página 5
Estadística .FBA I 2011_2012
Práctica 4. Extensiones del modelo de regresión
Y =β 0 + β1 X + β 2 X 2 + β3 X 3
Las estimaciones de los parámetros del modelo se pueden obtener con el SPSS:
Analizar / Regresión / Estimación curvilínea / Cúbica
Dependiente: Ycub
Independiente: Xcub
Modelo: cúbico
Podemos activar: Ver ANOVA
Obtenemos las siguientes tablas:
Resumen del modelo
R
R cuadrado
,832
R cuadrado
Error típico de
corregida
la estimación
,693
,688
,819
La variable independiente esXcub.
M. Carmen Carollo, Beatriz Pateiro
Página 6
Estadística .FBA I 2011_2012
Práctica 4. Extensiones del modelo de regresión
ANOVA
Suma de
Media
cuadrados
gl
cuadrática
Regresión
296,837
3
98,946
Residual
131,594
196
,671
Total
428,431
199
F
147,373
Sig.
,000
La variable independiente esXcub.
El modelo ajustado es :
Yˆ =
−0, 05 − 2 X + 3 X 2 + 2 X 3
M. Carmen Carollo, Beatriz Pateiro
Página 7
Estadística .FBA I 2011_2012
Práctica 4. Extensiones del modelo de regresión
4.3 Regresión con variables artificiales
Ejemplo:
Se quiere obtener un modelo de regresión que explique el colesterol a partir de las
grasas y el ejercicio físico ( 0=”no hace”, 1=”ejercicio moderado” y 2=”ejercicio
intenso”). Los datos aparecen en el archivo colesterol.sav
Dado que el ejercicio físico es un factor (variable cualitativa) con tres
modalidades, debemos crear dos variables artificiales (con la opción
Transformar/Recodificar en distintas variables):
EM = 1 si hace ejercicio mod erado

0 en otro caso

EI = 1 si hace ejercicio int enso

0 en otro caso

Realizamos la regresión con el SPSS de la siguiente forma:
Analizar / Regresión / Regresión lineal
Dependiente : colesterol
Independientes : grasas, EM, EI
M. Carmen Carollo, Beatriz Pateiro
Página 8
Estadística .FBA I 2011_2012
Práctica 4. Extensiones del modelo de regresión
Obtenemos:
Resumen del modelo
Modelo
R
di
1
,636
R cuadrado
a
R cuadrado
Error típ. de la
corregida
estimación
,404
,330
57,809
me
nsi
on
0
a. Variables predictoras: (Constante), Grasas, ejintenso, ejmodera
b
ANOVA
Modelo
Suma de
cuadrados
1
Media
gl
cuadrática
Regresión
54412,310
3
18137,437
Residual
80205,547
24
3341,898
134617,857
27
Total
F
5,427
Sig.
,005
a
a. Variables predictoras: (Constante), Grasas, ejintenso, ejmodera
b. Variable dependiente: colesterol
M. Carmen Carollo, Beatriz Pateiro
Página 9
Estadística .FBA I 2011_2012
Práctica 4. Extensiones del modelo de regresión
Coeficientes
Modelo
Coeficientes no
Coeficiente
estandarizados
s tipificados
B
1
a
Error típ.
(Constante)
236,730
27,483
ejmodera
-36,815
29,613
ejintenso
-82,196
1,365
Grasas
Beta
t
Sig.
8,614
,000
-,218
-1,243
,226
24,716
-,579
-3,326
,003
,551
,394
2,477
,021
a. Variable dependiente: colesterol
El modelo ajustado es:
Colesterol = 236,73 - 36,81ejmoderado - 82,196ejintenso + 1,365 grasas
que puede interpretarse de la siguiente forma:
 Para un mismo tipo de ejercicio, el colesterol medio aumenta en 1,365
cuando el contenido en grasas aumenta una unidad.
 Para un mismo contenido en grasas, el colesterol medio disminuye en
36,81 cuando pasamos de no hacer ejercicio (categoría de referencia) a
hacer ejercicio moderado.
 Para un mismo contenido en grasas, el colesterol medio disminuye en
82,196 cuando pasamos de no hacer ejercicio a hacer ejercicio intenso.
Observemos que aunque el coeficiente asociado a ejmoderado no es
significativo (p-valor = 0,226), debemos mantener esta variable en el modelo
para que pueda entenderse la estructura del mismo.
El modelo es adecuado pues el p-valor asociado al contraste de regresión es
muy pequeño.
M. Carmen Carollo, Beatriz Pateiro
Página 10
Descargar