8.3. Intervalos de confianza para variables dicotómi

Anuncio
8.3. INTERVALOS DE CONFIANZA PARA VARIABLES DICOTÓMICAS 195
8.3.
Intervalos de confianza para variables dicotómicas
Cuando tenemos una variable dicotómica (o de Bernoulli) a menudo
interesa saber en qué proporción de casos, p ocurre el éxito en la realización
de un experimento. También nos puede interesar el comparar la diferencia
existente entre las proporciones en distintas poblaciones. También es de
interés calcular para un nivel de significación dado, el tamaño muestral
necesario para calcular un intervalo de confianza de cuyo radio sea menor
que cierta cantidad.
8.3.1.
Intervalo para una proporción
Sean X1 , . . . , Xn ;Ber (p). Si queremos estimar el parámetro p, la manera más natural de hacerlo consiste en definir la suma de estas —lo que
nos proporciona una distribución Binomial
X = X1 + · · · + Xn ;B (n, p)
y tomar como estimador suyo la v.a.
p̂ =
X
.
n
Es decir, tomamos como estimación de p la proporción de éxitos obtenidos
en las n pruebas. p̂.
La distribución del número de éxitos es binomial, y puede ser aproximada a la normal cuando el tamaño de la muestra n es grande, y p no es
una cantidad muy cercana a cero o uno:
≈
X;B (n, p) ⇒ X ; N (np, npq)
El estimador p̂ no es más que un cambio de escala de X, por tanto
X ≈
pq
p̂ =
; N p,
n
n
=⇒
p̂ − p
r
≈ Z ;N (0, 1)
pq
n
196
Bioestadı́stica: Métodos y Aplicaciones
Esta expresión presenta dificultades para el cálculo, siendo más cómodo
sustituirla por la siguiente aproximación:
p̂ − p
r
≈ Z ;N (0, 1)
p̂q̂
n
Para encontrar el intervalo de confianza al nivel de significación α para
p se considera el intervalo que hace que la distribución de Z;N (0, 1) deje
la probabilidad α fuera del mismo. Es decir, se considera el intervalo cuyos
extremos son los cuantiles α/2 y 1 − α/2. Ası́ se puede afirmar con una
confianza de 1 − α que:
s
p = p̂ ± z1−α/2
p̂q̂
con una confianza de 1 − α
n
Ejemplo
Se quiere estimar el resultado de un referéndum mediante un sondeo.
Para ello se realiza un muestreo aleatorio simple con n = 100 personas y
se obtienen 35 % que votarán a favor y 65 % que votarán en contra (suponemos que no hay indecisos para simplificar el problema a una variable
dicotómica). Con un nivel de significación del 5 %, calcule un intervalo de
confianza para el verdadero resultado de las elecciones.
Solución: Dada una persona cualquiera (i) de la población, el resultado
de su voto es una variable dicotómica:
Xi ;Ber (p)
El parámetro a estimar en un intervalo de confianza con α = 0, 05 es p,
y tenemos sobre una muestra de tamaño n = 100, la siguiente estimación
puntual de p:
35
p̂ =
= 0, 35 =⇒ q̂ = 0, 65
100
El intervalo de confianza buscado es:
p = 0, 65 ± 0, 0935
Por tanto, tenemos con esa muestra un error aproximado de 9, 3 puntos al
nivel de confianza del 95 %.
Descargar