1 - Universidad Nacional Agraria La Molina

Anuncio
Universidad Nacional Agraria La Molina
Departamento de Estadística e Informática
Maestría en Estadística Aplicada
Ciclo 2011 – 2
Examen Final de Regresión Aplicada
El plazo de entrega vence el 20 de diciembre. La solución del examen debe enviarse a
[email protected] incluyendo su trabajo final. Use un nivel de significación del 5%.
Los resultados se publicaran el 21 de diciembre en la página web del curso. Cualquier
reclamo debe ser comunicado de inmediato al correo mencionado.
1. Se sospecha que en los pacientes con ulcera péptica que han seguido un tratamiento, el
tiempo que tarda en reaparecer la sintomatología ulcerosa está relacionado con el tiempo
que tarda el paciente en responder al tratamiento. Para comprobarlo se somete a
tratamiento a un conjunto de pacientes con ulcera péptica, siendo todos ellos fumadores, y
periódicamente (cada semana) se comprueba si la sintomatología ulcerosa persiste o ha
reaparecido. Una vez desaparecida el paciente sigue sometido a revisiones mensuales para
comprobar el tiempo que tardan en reaparecer los síntomas. Antes de comenzar el
tratamiento, algunos de los pacientes han decidido abandonar el hábito de fumar, por lo
que se sospecha que en la reaparición de los síntomas, además del tiempo de respuesta al
tratamiento, puede influir el abandono del tabaco, así como otros aspectos relacionados
con los hábitos del individuo tales como el consumo de alcohol. Para predecir el tiempo
de reaparición de los síntomas, conocidos el tiempo de respuesta al tratamiento y los
distintos hábitos del paciente, se aplicará un análisis de regresión lineal a partir de una
muestra de 312 pacientes. Las variables son:
Y  Tiempo de reaparición de la sintomatología ulcerosa (en meses)
X 1  Tiempo de respuesta al tratamiento de la sintomatología ulcerosa (en semanas)
X 2  El paciente ha dejado de fumar durante el tratamiento. (Sí = 0 y No = 1)
X 3  Consumo de alcohol (en gramos diarios)
Hallar el mejor modelo de regresión lineal e interprete sus parámetros estimados. Los
datos se encuentran en el archivo Ulcera.txt.
4.0 ptos
2. El archivo Grasa.txt contiene información que sirve para estimar el porcentaje de grasa en
el cuerpo humano en función de X 1  Edad (en años), X 2  Peso (en libras), X 3  Altura
(en pulgadas), X 4  Longitud del cuello (en cm), X 5  Longitud del pecho (en cm),
X 6  Longitud del abdomen (en cm), X 7  Longitud de la cadera (en cm),
X 8  Longitud del muslo (en cm), X 9  Longitud de la rodilla, X 10  Longitud del tobillo
(en cm), X 11  Longitud del bíceps (en cm), X 12  Longitud del antebrazo (en cm) y
X 13  Longitud de la muñeca (en cm). Se tomaron las mediciones anteriores en 252
sujetos.
a. Analice el problema de multicolinealidad para luego encontrar el mejor modelo de
regresión. Comente.
4.0 ptos
b. Para el modelo anterior detectar la presencia de posibles observaciones influyentes e
inusuales. Comente.
4.0 ptos
c. Aplique el procedimiento de Box and Tidwell en el modelo anterior. ¿Se puede
establecer un mejor modelo de regresión? Comente.
4.0 ptos
1
3. Una empresa desea investigar la relación que existe entre X la antigüedad de sus
vendedores en meses y Y el número de balanzas electrónicas de laboratorio que venden.
Los datos en el archivo Ventas.txt presentan la información correspondiente a 15 de sus
vendedores elegidos al azar. Determine a partir de un diagrama de dispersión el mejor
modelo de regresión no lineal. Comente sus resultados.
4.0 ptos
La Molina, 19 de diciembre del 2011
2
Descargar