8.3. INTERVALOS DE CONFIANZA PARA VARIABLES DICOTÓMICAS 195 8.3. Intervalos de confianza para variables dicotómicas Cuando tenemos una variable dicotómica (o de Bernoulli) a menudo interesa saber en qué proporción de casos, p ocurre el éxito en la realización de un experimento. También nos puede interesar el comparar la diferencia existente entre las proporciones en distintas poblaciones. También es de interés calcular para un nivel de significación dado, el tamaño muestral necesario para calcular un intervalo de confianza de cuyo radio sea menor que cierta cantidad. 8.3.1. Intervalo para una proporción Sean X1 , . . . , Xn ;Ber (p). Si queremos estimar el parámetro p, la manera más natural de hacerlo consiste en definir la suma de estas —lo que nos proporciona una distribución Binomial X = X1 + · · · + Xn ;B (n, p) y tomar como estimador suyo la v.a. p̂ = X . n Es decir, tomamos como estimación de p la proporción de éxitos obtenidos en las n pruebas. p̂. La distribución del número de éxitos es binomial, y puede ser aproximada a la normal cuando el tamaño de la muestra n es grande, y p no es una cantidad muy cercana a cero o uno: ≈ X;B (n, p) ⇒ X ; N (np, npq) El estimador p̂ no es más que un cambio de escala de X, por tanto X ≈ pq p̂ = ; N p, n n =⇒ p̂ − p r ≈ Z ;N (0, 1) pq n 196 Bioestadı́stica: Métodos y Aplicaciones Esta expresión presenta dificultades para el cálculo, siendo más cómodo sustituirla por la siguiente aproximación: p̂ − p r ≈ Z ;N (0, 1) p̂q̂ n Para encontrar el intervalo de confianza al nivel de significación α para p se considera el intervalo que hace que la distribución de Z;N (0, 1) deje la probabilidad α fuera del mismo. Es decir, se considera el intervalo cuyos extremos son los cuantiles α/2 y 1 − α/2. Ası́ se puede afirmar con una confianza de 1 − α que: s p = p̂ ± z1−α/2 p̂q̂ con una confianza de 1 − α n Ejemplo Se quiere estimar el resultado de un referéndum mediante un sondeo. Para ello se realiza un muestreo aleatorio simple con n = 100 personas y se obtienen 35 % que votarán a favor y 65 % que votarán en contra (suponemos que no hay indecisos para simplificar el problema a una variable dicotómica). Con un nivel de significación del 5 %, calcule un intervalo de confianza para el verdadero resultado de las elecciones. Solución: Dada una persona cualquiera (i) de la población, el resultado de su voto es una variable dicotómica: Xi ;Ber (p) El parámetro a estimar en un intervalo de confianza con α = 0, 05 es p, y tenemos sobre una muestra de tamaño n = 100, la siguiente estimación puntual de p: 35 p̂ = = 0, 35 =⇒ q̂ = 0, 65 100 El intervalo de confianza buscado es: p = 0, 65 ± 0, 0935 Por tanto, tenemos con esa muestra un error aproximado de 9, 3 puntos al nivel de confianza del 95 %.