3. Un grupo de investigadores de Ecología midieron la concentración de células rojas en la sangre de 29 lagartos (Sceloporis occidentales) capturados en el campo. También observaron si los lagartos estaban infectados por el parásito de Malaria Plasmodium. Los recuentos de células rojas proporcionaron los siguientes valores. Animales infectados: n1 13 Animales no infectados: n2 16 s1 245,1 s2 251,2 X 1 972,1 X 2 843,4 a) Construye un intervalo de confianza al 99% para la diferencia entre la concentración media de células rojas en la sangre de animales infectados y no infectados (se supone normalidad). b) ¿Se podría afirmar que la malaria reduce el número de células rojas? Razona la respuesta. Solución: a) Se trata de comparar dos poblaciones: P1, lagartos infectados con el parásito, y P2, lagartos no infectados. Concretamente, nos interesa comparar las medias poblacionales. En consecuencia, buscamos I 1 2 . Asumimos que las varianzas poblacionales NO son conocidas. Para verificar si pueden considerarse iguales o no, como s 2 s1 , calculamos s 22 251,22 1,05 2 s12 245,12 Por lo tanto, consideramos que 12 22 (caso b1). X 1 X 2 972,1 843,4 128,7 Como y n1 13, n2 16 t / 2,n1 n2 2 t 0,005, 27 2,771 Finalmente, s 2p 1% n1 1s12 n2 1s22 n1 n2 2 (0,01 en tanto por uno), ; operando se tiene s p 248,507 Sustituyendo en la fórmula del intervalo de confianza, obtenemos I (128'424, 385'82) b) Si el intervalo contuviera sólo números negativos, estaríamos diciendo que la diferencia entre el número medio de células rojas de P1 y P2 es negativa, o equivalentemente que el número medio de células rojas de P1 (lagartos infectados con malaria) es inferior al de P2 (lagartos no infectados). En ese caso, se podría afirmar que la malaria reduce el número de células rojas. Pero vemos que el intervalo contiene tanto números negativos como positivos, con lo cuál tan aceptables es que sea mayor la media de los infectados, como la de los no infectados. En consecuencia, NO se puede afirmar que la malaria reduzca el número de células rojas. 4. En un estudio sobre el efecto del dióxido de azufre como agente contaminante del aire, se dispuso de cierto tipo de semillas de habichuelas en cámaras que se mantuvieron a lo largo del experimento abiertas por su parte superior. Se asignaron aleatoriamente seis de esas cámaras a un tratamiento consistente en fumigarlas con dióxido de azufre, y en las otras seis no se efectuó ningún proceso. Transcurrido un mes, se registraron las cosechas totales (en kg) de habichuelas en cada cámara, obteniéndose los siguientes datos: Con Diox. Sin Diox. 1,52 1,49 1,85 1,55 1,39 1,21 1,15 0,65 1,30 0,76 1,57 0,69 Halla un intervalo de confianza al 90% para la diferencia de producción media de habichuelas con y sin dióxido de azufre. Interprétalo. Queremos comparar dos poblaciones, P1 y P2. Llamamos: P1: cosechas de habichuelas criadas con dióx. Podemos comprobar que X 1 1,463 , n1 6 , s1 0,243 . P2: cosechas de habichuelas criadas sin dióx. Podemos comprobar que X 2 1,058 , n2 6 , s2 0,410 Queremos determinar un intervalo para la diferencia de medias poblacionales, I 1 2 Para comprobar si las varianzas poblacionales (que suponemos desconocidas) pueden s2 considerarse iguales o no, como s 2 s1 , calculamos 22 2,847 2 . Por lo tanto, s1 consideramos que 12 22 (caso b2) Necesitamos calcular f ; podemos comprobar que f 9,38 9 Además, 10% . Por tanto, necesitamos t 0.05,9 1'833 Finalmente, sustituyendo en la expresión para I 1 2 , tenemos I (0.049, 0.761) Como el intervalo contiene sólo números positivos, se tiene que 1 2 0 , luego 1 2 , es decir, la cosecha media con dióxido de azufre es superior a la cosecha media sin él. En otras palabras, efectivamente el dióxido de azufre favorece el crecimiento de las semillas. 5. Se realizó un estudio para comparar el contenido en sodio en el plasma de las focas peleteras australes jóvenes, con el nivel de sodio en la leche de las focas. Se obtuvieron las siguientes observaciones sobre el contenido de sodio (en minimoles) por litro de leche (o plasma) en 10 focas aleatoriamente seleccionadas: Sujeto 1 2 3 4 5 6 7 8 9 10 Leche 93 104 95 81,5 95 95 76,5 80,5 79,5 87 Plasma 147 157 142 141 142 147 148 144 144 146 Halla un intervalo de confianza del 95% para la diferencia de niveles de sodio en los dos líquidos corporales. ¿Hay pruebas de que exista alguna diferencia? ¿En qué sentido? Sea X el nivel de sodio en la Leche, y sea Y el nivel de sodio en el plasma. Queremos estudiar la diferencia de las medias de Y, y X. Sin embargo, como los valores que tenemos para ambas provienen de los mismos individuos, en principio los valores de X e Y NO son pueden considerarse independientes. Por lo tanto, estamos ante el caso de datos emparejados. En consecuencia, formamos una nueva variable, D=X-Y, cuyos datos corresponden a las diferencias entre los valores de X e Y; es decir: Sujeto 1 2 3 4 5 6 7 8 9 10 Total: Y=Sodio en Leche 93 104 95 81,5 95 95 76,5 80,5 79,5 87 887 X=Sodio en plasma 147 157 142 141 142 147 148 144 144 146 1458 D =X-Y 54 53 47 59,5 47 52 71,5 63,5 64,5 59 571 Sobre los datos de D, calculamos media y cuasivarianza, obteniéndose D 57.1 , s D 1.033 . Como t 0.025,9 2.262 , aplicando la fórmula del intervalo de confianza se tiene I = (56.361, 57.839). Es decir, la presencia del sodio en el plasma es claramente superior. Ejercicio: Utilizando los datos del Ejercicio 1, calcula el tamaño de la muestra que deberíamos tomar para que el error en la estimación de la media poblacional, manteniendo el mismo nivel de confianza, fuera menor que una milésima.