1.6 ESTIMACIÓN DE UNA DIFERENCIA ENTRE DOS PROPORCIONES POBLACIONALES (Población 1 y 2). (Caso de muestras grandes) El intervalo de 1001 % , resulta ser: Límite inferior: p1 p 2 z tabla * p1 * q 1 p 2 * q 2 n1 n2 Límite superior: p1 p 2 z tabla * p1 * q 1 p 2 * q 2 n1 n2 donde: ; n1: es el tamaño de la muestra tomada de la población 1 n2: es el tamaño de la muestra tomada de la población 2 p1 : es la proporción en la muestra tomada de la población 1; q1 1 p1 p 2 : es la proporción en la muestra tomada de la población 1; q 2 1 p 2 N es el tamaño de la población z tabla : es el valor z de la tabla Ejemplo1. En Hermosillo se toma una muestra aleatoria de 100 votantes y se encuentra que 25 de ellos están a favor de un candidato a Senador. En Caborca se toma una muestra aleatoria de 100 votantes y se encuentra que 45 de ellos están a favor del candidato. Estimar con un intervalo de 95% de confianza la diferencia de proporciones. Solución: Los datos son: En ciudad 1 (Caborca) se tiene: n 1 100; p1 0,45; q1 0,55; z tabla 1,96 ; En ciudad 2 (Hermosillo) se tiene: n 2 100; p2 0,25; q2 0,75 Nota: tomar siempre como población 1 la que tenga p mas grande pˆ pˆ 2 z tabla * 1 0.45 0.25 1.96 Pˆ1 * Qˆ 1 Pˆ2 * Qˆ 2 n1 n2 0,45 * 0,55 0,25 * 0,75 0,06595 ; 100 100 por lo tanto: Límite inferior: p̂1 p̂ 2 z tabla P̂1 Q̂1 P̂2 Q̂ 2 0,20 0,1293 0,0707 n1 n2 Límite superior: p̂1 p̂ 2 z tabla P̂1 Q̂1 P̂2 Q̂ 2 0,20 0,1293 0,3293 n1 n2 36 “Se estima con un 95% de confianza que en Caborca el % a favor del candidato es mayor que en Hermosillo, en un % que va entre 7,07% y 32,93%. Utilizamos el siguiente procedimiento: Aparece el siguiente recuadro donde introduciremos los datos de las dos muestras de cómo aparece, procurando dar a la muestra 1 el valor de x que sea más grande En Options… introduciremos el intervalo de confianza. 37 Ya que a la vez se calculan pruebas de hipótesis , tomaremos los datos del intervalo de confianza (CI) Difference = p (1) - p (2) Estimate for difference: 0.2 95% CI for difference: (0.0707315, 0.329269) Test for difference = 0 (vs not = 0): Z = 3.03 P-Value = 0.002 Si se diera que el intervalo contiene al cero (0), entonces se dice que no hay diferencias en los % a favor en las dos ciudades”. Ejemplo 2. Investigadores en genética del Centro Médico de la Duke University han identificado el factor de transcripción E2F1 como un componente importante del control de proliferación de las células. Los investigadores indujeron la síntesis de DNA en dos lotes de células privadas de suero. Cada una de las células de un lote se microinyectó con el gen E2F1, mientras las células del segundo lote (los controles) no se expusieron al E2F1. Después de 30 horas se determinó el número de células en cada lote que exhibieron un crecimiento alterado. Los resultados del experimento se resumen en la tabla. 38 Control Número total de células Número de células crecimiento alterado con 158 15 Células tratadas con E2F1 92 41 a). Compare los porcentajes de células que exhiben crecimiento alterado en los dos lotes con un intervalo de confianza de 90%. b). Utilice el intervalo del inciso anterior para hacer una inferencia acerca de la capacidad del factor de transcripción E2F1 para inducir crecimiento en las células Solución: n1 92; P̂1 0,4456; Q̂1 0,5544; z tabla 1,645 ; n2 158; P̂2 0,095; Q̂ 2 0,905 pˆ 1 pˆ 2 z tabla * Pˆ1 * Qˆ 1 Pˆ2 * Qˆ 2 n1 n2 0.4455 0.095 1.645 * 0.44561 * 0.5544 0.095 * 0.905 92 158 0.3505 1.645 0.002685 0.000544 0.3505 0.09347 Límite inferior: 0.3505-0.09347=0.257 Límite superior:0.3505+0.09347=0.444 “Existe una mayor proliferación en las células tratadas con E2F1 en un rango que va de 25% al 44% aproximadamente” 39 EJERCICIO 1.6 ESTIMACIÓN DE UNA DIFERENCIA ENTRE DOS PROPORCIONES POBLACIONALES. 1. En el Journal of fish Biology (agosto 1990) se informó de un estudio comparativo de la frecuencia de parásitos (solitarias) hallados en especies de peces del Mediterráneo y del Atlántico. En el mar Mediterráneo se capturaron y disectaron 588 rodaballos, encontrándose el parásito en 211 de ellos. En el Océano Atlántico se capturaron y disectaron 123 rodaballos, encontrándose infección en 26 de ellos. Compare las proporciones de rodaballos infectados en los dos puntos de captura empleando un intervalo de confianza de 90%. Interprete el intervalo. R. 0.147± 0.069 2. El percance nuclear en Three Mile Island cerca de Harrisburg Pennsylvania, el 28 de Marzo de 1979 obligó a muchos residentes locales a evacuar sus hogares, algunos de forma temporal, otros de forma permanente. A fin de evaluar el impacto del accidente sobre la población del área, se diseñó un cuestionario que se envió por correo a una muestra de 150 hogares antes de transcurridas dos semanas después de que ocurriera el accidente. Se les preguntó a los residentes que opinión tenían antes y después del accidente del hecho de que parte de la electricidad que consumían se generara a partir de energía nuclear. En la siguiente tabla se proporcionan resultados resumidos. Actitud hacia la energía nuclear En favor En contra Indiferente Totales Antes del accidente 62 35 53 150 Después del accidente 52 72 26 150 a. Establez ca un intervalo de confianza de 99% para la diferencia en las verdaderas proporciones de residentes de Three Mile Island que estaban en favor de la energía nuclear antes y después del accidente b. Establezca un intervalo de confianza de 99% para la diferencia en las verdaderas proporciones de residentes de Three Mile Island que estaban en contra de la energía nuclear antes y después del accidente 40 TAREA 1.6 1. En dos ciudades se tomaron muestras de automóviles, cada una de 100 automóviles. En una ciudad 72 automóviles pasaron con éxito la prueba de seguridad, en la otra solamente lo hicieron 66. Construya un intervalo de 95% de confianza para estimar la diferencia de proporciones de autos seguros en las dos ciudades. 41