Subido por Byron Cárcamo

Tarea3

Anuncio
Tarea 3
-
Utilizar los grupos de las tareas del prof. Enrique Canessa.
Fecha de entrega: hasta las 23:59 hrs. del 04/07/2022 vía webcursos.
Consideremos el conjunto de datos dados en el archivo BIRTHWT.TXT. Los datos
corresponden a un estudio de factores de riesgo asociados con el bajo peso de los recién
nacidos. Los datos fueron recogidos en el Baystate Medical Center, Springfield,
Massachusetts, en 1986. El siguiente cuadro describe las variables consideradas.
(a) Clasifique por tipo de variable a cada una de las variables observadas.
(b) Realice un ajuste univariado (modelo de regresión lineal simple) para cada una de las
variables independientes (excepto a LOW) tomando a BWT como variable repuesta.
(c) Observe los valores de los estadísticos de bondad de ajuste (R2) y su significación.
¿Cuáles son sus conclusiones?
(d) Realice un ajuste considerando en su modelo las variables AGE, LWT, RACE, SMOKE,
PTL, HT, UI y el intercepto. Analice la significación de cada una de las variables. ¿Es AGE
significativa?
(e) Repita (d) sin la variable AGE. ¿Cuáles son sus conclusiones?
(f) Se sabe que la variable AGE es biológicamente importante. Es posible que la relación
entre la variable respuesta BWT y la covariable AGE sea una función cuadrática o con forma
de U. Realice un análisis para evaluar esta posibilidad. De acuerdo con este análisis ¿le
parece razonable suponer que hay una tendencia lineal o cuadrática significativa para esta
variable?
(g) Repita (f) para la variable LWT. ¿Le parece que hay evidencias de linealidad?
(h) Dado que la variable PTL tiene muy pocos casos con valores superiores a 1,
consideraremos una nueva variable dicotómica PTD definida como 0 si PTL=0 y 1 en caso
contrario. Evalúe si modelar la covariable PTD de esta forma es mejor que en la forma
original.
(i) Utilizando el método de selección de variables paso a paso. ¿Cuál es el modelo final?.
(j) Utilice técnicas de regularización Ridge, lasso y elactic net para predecir la variable BWT.
Compare sus resultados con aquellos obtenidos en (i).
(k) ¿Cuál es el mejor modelo para predecir el BWT? Justifique su elección.
Descargar