tarea 2 - Facultad de Matemáticas - Pontificia Universidad Católica

Anuncio
PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE
FACULTAD DE MATEMÁTICA
DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA
Análisis estadístico para datos discretos
ELM2450
Profesor: Reinaldo Arellano
Segundo Semestre 2000
Tarea Nº2
EJERCICIO 2
Usando la base de datos ICU, descrita en la tarea anterior, considere un modelo
de regresión logística múltiple para la variable “estado vital” (STA), con la edad
(“AGE”), presencia de problemas de cáncer (“CAN”), CPR anterior al ingreso a la
admisión ICU (“CPR”), probable infección (“INF”) y raza (“RACE”).
1.1 La variable RACE está codificada en tres niveles. Prepare una tabla
mostrando la codificación en los dos niveles para incluir esta variable en
regresión logística.
1.2-. Escriba las ecuaciones del modelo de regresión logística de STA con AGE,
CAN, CPR, INF, y RACE. Escriba las ecuaciones de la transformación logit del
modelo de regresión logística. ¿Cuántos parámetros contiene este modelo?
1.3-. Escriba una expresión para la verosimilitud y para la log-verosimilutud
del modelo de regresión logística del problema 1.2. ¿ Cuántas ecuaciones de
verosimilitud hay ? Escriba una expresión para la forma típica de las
ecuaciones de verosimilitud de este problema.
1.4-. Usando un software de regresión logística obtenga el estimador de
máxima verosimilitud de los parámetros del modelo de regresión logística del
problema 1.2. Usando estos estimadores, escriba las ecuaciones de los valores
ajustados, esto es, las estimaciones de probabilidad logísticas.
1.5-. Usando los resultados de la salida desde el software, analizar la
significación del modelo usando el test de razón de verosimilitud. ¿ Qué
supuestos son necesarios para el cálculo de los “valores p” para validar este
test? ¿Cuál es el valor de la lejanía para el modelo ajustado?
1.6-. Use el estadístico de Wald para obtener una aproximación para la
significancia de los coeficientes individuales en el modelo. Ajuste un modelo
reducido que elimine las variables no significativas de acuerdo al test de Wald.
Presente los resultados de la ajuste del modelo reducido en una tabla.
Definición de Variables:
STA: Estado vital de la persona ( 0 = Vivo; 1 = muerto)
AGE: Edad en años cumplidos.
CAN : Presencia de problemas de cáncer (0 = No; 1 = Si)
CPR: CPR anterior a la admisión en ICU (0 = No; 1 = Si)
INF : Presencia de infección al momento de ingreso a ICU 0 = No; 1 = Si)
RACE: Raza ( 1= blanco; 2 = negro; 3 = otro).
Descargar