Facultad de Medicina. Examen Final de Bioestadı́stica. 7/2/2002. (SOLO SEGUNDO PARCIAL) Nombre y Apellidos: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Cuestión 1) Escribir verdadero (V) o falso (F) según corresponda al lado de cada una de las siguiente afirmaciones: Si, en una tabla de contingencias r × s, el test χ2 para contrastar la independencia dos variables cualitativas resulta significativo, admitiremos que hay diferencias significativas entre las cantidades marginales por columnas C1 , . . . , Cr . Cuando vale -1 el coeficiente de correlación r para una muestra (xi , yi ), 1 ≤ i ≤ n, de la distribución de dos variables cuantitativas X e Y , todos los puntos (xi , yi ) están alineados. En el análisis de la varianza de una vı́a, la variación “dentro” dividida por sus grados de libertad constituye un estimador de la varianza común de las variables que observamos. Para una muestra de tamaño 26 de una distribución normal con ambos parámetros desconocidos se ha obtenido una varianza muestral igual 35. El test bilateral para contrastar la hipótesis nula de que la desviación tı́pica es igual 5 resulta no significativo. Si [100, 200] es el intervalo al 95% de confianza obtenido para la media de una distribución normal con ambos parámetros desconocidos a partir de una muestra de tamaño 100 de la misma, entenderemos que 95 de los 100 valores observados se situarán entre 100 y 200. Cuestión 2) Escribir verdadero (V) o falso (F) según corresponda al lado de cada una de las siguiente afirmaciones: El valor experimental del test F para comparar 4 tratamientos a partir de una muestra de tamaño 24 en un modelo de clasificación simple en análisis de la varianza es igual a 6.57. El test es, por tanto, muy significativo. Supongamos conocido que para contrastar la hipótesis µ = µ0 contra µ 6= µ0 a partir de una muestra de una distribución normal se ha obtenido un nivel mı́nimo de significación P = 0.07. Entonces, el nivel mı́nimo de significación para el problema de contrastar µ ≤ µ0 contra µ > µ0 es igual a 0.035. Si en una tabla de contingencias r × s para la comparación de varias muestras en el caso discreto se supone cierta la hipótesis nula de que todas las muestras han sido extraı́das de la misma población, la cantidad Eij esperada en la casilla (i, j) es T Fi Cj , (Fi =número de individuos en la fila i, Cj =número de individuos en la columna j, y T =número total de individuos). En el modelo de clasificación simple en análisis de la varianza, si la parte de la variación total explicada por la diferencia entre los distintos niveles del factor aumenta y la parte de la variación total explicada por el azar se mantiene constante, entonces el nivel mı́nimo de significación del test F de homogeneidad de las medias disminuye. Consideremos el problema de contrastar la hipótesis unilateral H0 : µ1 ≤ µ2 contra H1 : µ1 > µ2 a partir de dos muestras de dos distribuciones normales con varianza común desconocida. Siempre que la media muestral de la primera muestra sea mayor que la de la segunda rechazaremos la hipótesis nula. Observaciones: 1) Los dos problemas y cada una de las cuatro cuestiones serán puntuadas del mismo modo (10 puntos). 2) En las cuestiones 1 y 2, cada respuesta acertada valdrá 2 puntos, una respuesta en blanco valdrá 0 puntos, una respuesta equivocada valdrá -1 punto. 3) Procura ajustar las soluciones de las cuestiones 3 y 4 y de los problemas al espacio reservado al efecto, y utilı́cese el revés de los folios para los cálculos, separadamente para teorı́a y problemas. 4) Escribe tu nombre en cada uno de los cuatro folios del examen. (SOLO SEGUNDO PARCIAL) Nombre y Apellidos: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Cuestión 3) Rosenberg et al. estudiaron en 1980 la relación entre el consumo de café y el infarto de miocardio en mujeres de edad comprendida entre los 30 y los 49 años. Su estudio incluye 487 mujeres hospitalizadas por infarto de miocardio y 980 mujeres (que sirven de control) que fueron hospitalizadas por causas traumatológicas, enfermedad respiratoria aguda o apendicitis. 152 de las mujeres que sufrieron infarto de miocardio y 183 de los controles tomaban 5 o más tazas de café con cafeı́na diarias, mientras que el resto consumı́a menos de 5 tazas de café. Lleva a cabo un test (facilita también un intervalo al 95% de confianza) apropiado que permita decidir si existen diferencias en el consumo de 5 o más tazas de café por dı́a entre el grupo de mujeres que sufrieron un infarto y el grupo de control. Cuestión 4) Se lleva a cabo un estudio sobre caracterı́sticas corporales de levantadores de peso olı́mpicos y su rendimiento. Se estudian sólo dos variables: X, peso corporal del sujeto, e Y , mejor levantamiento medido en Kg. La tabla siguiente proporciona los datos obtenidos: X Y 134 138 154 178 176 190 190 205 205 206 74 95 104 116 125 134 136 136 143 144 P P P P P (a) Calcula i xi , i x2i , i yi , i yi2 , i xi yi , (xx), (yy) y (xy). (b) Calcula e interpreta el coeficiente de determinación. (c) Determinar la recta de regresión de Y sobre X, decidir si esas variables son linealmente independientes y utilizar el modelo de regresión lineal para predecir el rendimiento de un levantador con 170 Kg de peso, facilitando un intervalo de predicción para ella. (SOLO SEGUNDO PARCIAL) Nombre y Apellidos: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Problema 1) Un ensayo clı́nico pretendı́a comprobar si el chenodiol hace desaparecer las piedras biliares de colesterol, lo que se traducirı́a en un aumento del nivel de colesterol en la sangre. La siguiente tabla presenta los datos de 14 individuos antes y 12 meses después de la administración del fármaco (la variable medida es el nivel de colesterol en sangre). ¿A qué conclusiones podemos llegar? Plantea y resuelve el test de hipótesis correspondiente, comprobando previamente si se pueden asumir las condiciones para aplicar un test paramétrico. En todos los casos calcula y comenta la probabilidad de significación. Si concluyes que hay incremento en el nivel de colesterol en sangre, valora su magnitud. Individuo Basal 12 Meses 1 178 295 2 254 278 3 185 215 4 219 241 5 205 265 6 182 173 7 310 290 8 191 227 9 245 209 10 229 238 11 245 261 12 240 251 13 234 277 14 210 275 (SOLO SEGUNDO PARCIAL) Nombre y Apellidos: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Problema 2) Para saber si la captación de noradrenalina en el bazo de ratas se ve incrementada al inyectarles a estas cantidades crecientes de una sustancia (diazóxido), se tomaron tres grupos de seis ratas (homogéneas), aplicándole a cada uno de ellos dosis sucesivas de diazóxido (150, 300 y 600 unidades). Sacrificando los animales, se midió por radioinmunoensayo el nivel de noradrenalina en el bazo, obteniéndose la siguiente tabla de resultados: Tratamientos Diazóxido 150 Diazóxido 300 Diazóxido 600 44.972 54.171 67.734 38.121 23.773 84.749 Mediciones 83.754 51.544 40.953 40.120 115.978 88.308 52.125 92.491 68.933 80.139 48.828 116.761 ¿A qué conclusión podemos llegar sobre la influencia de diferentes dosis de diazóxido en el nivel de noradrenalina del bazo? Responde a la pregunta de la manera más completa que sepas, planteando y resolviendo el (o los) correspondiente(s) test de hipótesis, calculando y comentando la(s) probabilidad(es) de significación. Facultad de Medicina. Examen Final de Bioestadı́stica. 7/2/2002 (TODA LA ASIGNATURA) Nombre y Apellidos: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Cuestión 1) Escribir verdadero (V) o falso (F) según corresponda al lado de cada una de las siguiente afirmaciones: Sean X una v.a.r. con distribución N (4, σ 2 ) e Y una v.a.r. con distribución N (0, 1). Entonces P (X − 4 > σ) = P (Y ≥ 1). Supongamos conocido que un test de diagnóstico clasifica como positivos al 40% de los individuos que no están enfermos. Entonces la probabilidad de falso positivo del test es 0.6. Sea C la v.a. que asigna a cada individuo de una población Ω su nivel de colesterol, y consideremos los sucesos A = {130 ≤ C < 150} y B = {120 < C ≤ 140}. Entonces A ∩ B c = [140, 150[. Si X1 , . . . , Xn es una muestra de tamaño n de una distribución real, la media de la varianza muestral S 2 es la varianza de las Xi . Supongamos conocido que la cuarta parte de los individuos declarados sanos por un test de diagnóstico están realmente sanos. Entonces, el valor predictivo negativo del test es 0.25. Cuestión 2) Escribir verdadero (V) o falso (F) según corresponda al lado de cada una de las siguiente afirmaciones: Si [100, 200] es el intervalo al 95% de confianza obtenido para la media de una distribución normal con ambos parámetros desconocidos a partir de una muestra de tamaño 100 de la misma, entenderemos que 95 de los 100 valores observados se situarán entre 100 y 200. Supongamos conocido que para contrastar la hipótesis µ = µ0 contra µ 6= µ0 a partir de una muestra de una distribución normal se ha obtenido un nivel mı́nimo de significación P = 0.07. Entonces, el nivel mı́nimo de significación para el problema de contrastar µ ≤ µ0 contra µ > µ0 es igual a 0.035. Para una muestra de tamaño 26 de una distribución normal con ambos parámetros desconocidos se ha obtenido una varianza muestral igual 35. El test bilateral para contrastar la hipótesis nula de que la desviación tı́pica es igual 5 resulta no significativo. Si, en una tabla de contingencias r × s, el test χ2 para contrastar la independencia dos variables cualitativas resulta significativo, admitiremos que hay diferencias significativas entre las cantidades marginales por columnas C1 , . . . , Cr . En el modelo de clasificación simple en análisis de la varianza, si la parte de la variación total explicada por la diferencia entre los distintos niveles del factor aumenta y la parte de la variación total explicada por el azar se mantiene constante, entonces el nivel mı́nimo de significación del test F de homogeneidad de las medias disminuye. Observaciones: 1) Los dos problemas y cada una de las cuatro cuestiones serán puntuadas del mismo modo (10 puntos). 2) En las cuestiones 1 y 2, cada respuesta acertada valdrá 2 puntos, una respuesta en blanco valdrá 0 puntos, una respuesta equivocada valdrá -1 punto. 3) Procura ajustar las soluciones de las cuestiones 3 y 4 y de los problemas al espacio reservado al efecto, y utilı́cese el revés de los folios para los cálculos, separadamente para teorı́a y problemas. 4) Escribe tu nombre en cada uno de los cuatro folios del examen. (TODA LA ASIGNATURA) Nombre y Apellidos: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Cuestión 3) Se dispone de un tetraedro irregular cuyas caras están numeradas del 1 al 4. Se ha comprobado que el 1 se obtiene con probabilidad 1/2, el 2 con probabilidad 1/4, el 3 con probabilidad 1/6 y el 4 con probabilidad 1/12. Se efectúan dos lanzamientos independientes del tetraedro y se denota por X el resultado del primer lanzamiento y por Y el resultado del segundo lanzamiento. (a) Describir el espacio de probabilidad correspondiente a ese experimento. (b) Determinar todos y cada uno de los sucesos elementales de los sucesos A = {X −Y = 2}, B = {X +Y > 5} y C = {|X −Y | = 2}. (c) Decidir si los sucesos A y B del apartado (b) son independientes. Cuestión 4) Se lleva a cabo un estudio sobre caracterı́sticas corporales de levantadores de peso olı́mpicos y su rendimiento. Se estudian sólo dos variables: X, peso corporal del sujeto, e Y , mejor levantamiento medido en Kg. La tabla siguiente proporciona los datos obtenidos: X Y 134 138 154 178 176 190 190 205 205 206 74 95 104 116 125 134 136 136 143 144 P P P P P (a) Calcula i xi , i x2i , i yi , i yi2 , i xi yi , (xx), (yy) y (xy). (b) Calcula e interpreta el coeficiente de determinación. (c) Determinar la recta de regresión de Y sobre X, decidir si esas variables son linealmente independientes y utilizar el modelo de regresión lineal para predecir el rendimiento de un levantador con 170 Kg de peso, facilitando un intervalo de predicción para ella. (TODA LA ASIGNATURA) Nombre y Apellidos: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Problema 1) Es conocido que el nivel de suero sanguı́neo de una determinada sustancia sigue una distribución normal de media 5 mg/l y desviación tı́pica 1.1 mg/l para individuos con una cierta patologı́a y de media 9 mg/l y desviación tı́pica 1.4 mg/l en individuos sanos. Se construye un test de diagnóstico para esa enfermedad del siguiente modo: Se dice que un individuo es patológico si el nivel en suero de esa sustancia es inferior a 6.5 mg/l y sano en otro caso. 1. Determina la sensibilidad y la especificidad del citado test. 2. Es conocido que dicha enfermedad tiene una prevalencia de un 10%. Además otra prueba que se utiliza habitualmente para diagnosticar dicha enfermedad (PRUEBA HABITUAL) tiene una sensibilidad de 0.93 y una probabilidad de falsos positivos de 0.06 ¿Para qué es mejor esta prueba habitual, para reconocer individuos sanos o enfermos? Da la respuesta de la forma más completa que sepas razonándola adecuadamente. 3. Se tomaron 100 individuos enfermos y se les aplicó a todos la prueba diagnóstico habitual (la del apartado 2 del problema) ¿Cuál es la probabilidad de que a lo sumo se declaren 5 individuos como sanos? ¿Y al menos 4? Razona las respuestas. (TODA LA ASIGNATURA) Nombre y Apellidos: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Problema 2) Para saber si la captación de noradrenalina en el bazo de ratas se ve incrementada al inyectarles a estas cantidades crecientes de una sustancia (diazóxido), se tomaron tres grupos de seis ratas (homogéneas), aplicándole a cada uno de ellos dosis sucesivas de diazóxido (150, 300 y 600 unidades). Sacrificando los animales, se midió por radioinmunoensayo el nivel de noradrenalina en el bazo, obteniéndose la siguiente tabla de resultados: Tratamientos Diazóxido 150 Diazóxido 300 Diazóxido 600 44.972 54.171 67.734 38.121 23.773 84.749 Mediciones 83.754 51.544 40.953 40.120 115.978 88.308 52.125 92.491 68.933 80.139 48.828 116.761 ¿A qué conclusión podemos llegar sobre la influencia de diferentes dosis de diazóxido en el nivel de noradrenalina del bazo? Responde a la pregunta de la manera más completa que sepas, planteando y resolviendo el (o los) correspondiente(s) test de hipótesis, calculando y comentando la(s) probabilidad(es) de significación.