Anuncio
1.1. INTERVALO
POBLACIONAL
DE
CONFIANZA
PARA
LA
PORPORCION
En el caso de una población proporcional, el parámetro es la proporción de éxitos, p (en
muchos casos se emplea π ); puesto que la población es Bernoulli, con p, la
probabilidad de éxito.

En una muestra aleatoria proporcional, el estadístico

=p
debe ser un estimador de
=p
De manera que el Intervalo de Confianza para la proporción poblacional, p, proviene de
P(|    |  )  1   ; lo que reemplazando los respectivos valores obtenemos
P( | p  p |   )  1  
Esto indica que p    p  p   será el intervalo.
Sólo nos falta determinar el valor del error de estimación para proporciones.
En efecto: P( | p  p |   )  P(  p  p   )  1   (*)

Pasando a N(0, 1), tenemos P(


2



p(1  p)
n



 1  1
p(1  p) 

n

De esta forma encontramos:
p p

p(1  p)
n



de donde 




p(1  p)
n
 Z 1

p(1  p)
n
)  1


 =1-α/2
p(1  p ) 

n


(**)
2
Si de esta ecuación despejamos ε, entonces tendremos el Error de Estimación para una
proporción. Cuál es? ......................................................
Despejando ε y reemplazándolo en (*), obtenemos el Intervalo de Confianza del 100(1)% para la proporción poblacional.
p 
Z
1
2
p(1  p)
n

Observación importante
p 
p 
Z
1
2
p(1  p)
n
¿Cuál es el Intervalo de Confianza de la proporción poblacional en los casos de
muestreo sin reposición o si la población desde donde se extrae la muestra es finita?
Como ya se ha dicho antes, sólo debemos tomar en cuenta el factor de corrección que
incluye en el cálculo de la varianza del estimador. Por ello el intervalo es:
p 
Z
1.2.
1
2
p(1  p) N  n
n
N 1

p 
p 
Z
1
2
p(1  p) N  n
n
N 1
TAMAÑO DE MUESTRA PARA UNA PROPORCION POBLACIONAL
De (**) despeje n: ........................................................................................
Esta es la fórmula que se emplea para calcular el tamaño de muestra en el caso de una
proporción poblacional.
Observación 1:
En muchos casos, cuando no se conoce la proporción de éxitos; es decir, p es
desconocido, se asume que la distribución tiene la mayor desviación estándar.
Y cómo saber esto?
Basta con encontrar el máximo valor para p tal que p(1-p) sea también máximo.
Por ejemplo si p = 0.1 entonces p(1-p) = 0.09
Si p = 0.4 entonces p(1-p) = 0.24
Se logra el máximo producto (que determina la mayor varianza) si p = 0.5
En este caso, el tamaño de muestra es
Z
n
2
1 
4
2
2
Observación 2:
Si el muestreo se hace sin reposición o se tiene poblaciones finitas, se debe tomar en
N n
cuenta el factor
con lo cual, el tamaño de muestra será
N 1
n 
Z

2
p(1  p ) N
2
1
2
( N  1)  Z 1 p(1  p)
2
2
Ejemplo 5
Una compañía dedicada al estudio de opinión, decidió realizar una encuesta sobre el
voto en urna, de una determinada población electoral. Para ello tomó una muestra
aleatoria de 600 electores que terminaban de votar y encontró que 240 de ellos votaron a
favor del candidato de la reelección.
a) Estimar el porcentaje de electores a favor de la reelección en toda la población,
encontrando un intervalo del 95% de confianza.
b) Si la proporción a favor de la reelección se estima en 40%, ¿cuánto es el error
máximo de la estimación, si se quiere tener una confianza del 98%?
c) Si con la misma muestra la proporción a favor del candidato R se estima en 38%
con una confianza del 98% de que el error no es mayor a 4.62%, ¿se puede
proclamar al candidato a la reelección como ganador de la contienda?
d) Qué tan grande se requiere que sea la muestra si se desea tener una confianza del
94% de que el error de estimación de p no sea superior al 2%?
Solución
Según los datos: n = .............;
Si definimos a p como la proporción muestral de electores a favor del candidato de la
reelección, entonces p = ..............
a) Como sabemos, el intervalo de confianza para una proporción (que asumimos
infinita ya que N no es conocido) es
p 
Z
1
p(1  p)
n
2

p 
p 
Z
1
2
p(1  p)
n
Como el nivel de confianza es del 98% , 1 - /2 = ....... y Z1 - /2 = .............
Reemplazando estos datos y simplificando, tenemos:
.................................................................
b) Como el nivel de confianza debe ser del 98%, entonces Z1 - /2 = .............
p(1  p)
2
Si p = 0.40 y el Error de Estimación es   Z 1
2
n
Reemplazando valores y simplificando tenemos: ε = ...................
En este caso el intervalo de confianza será: 0.40 – 0.0466 < p < 0.40 + 0.0466
c) Para el candidato R, se tiene p = 0.38; n = 600; Z1 - /2 = .........; ε = 0.0462
El intervalo correspondiente será:
0.38 - 0.0462 < p < 0.38 + 0.0462
Puesto que la intersección de ambos intervalos no es nula, se dice que hay un
empate técnico, ya que es probable que la estimación del parámetro en ambos casos,
coincida.
d) En este caso para encontrar el tamaño de muestra usaremos la ecuación:
n 
Z
p(1  p)
2
1
2

2
Como el nivel de confianza es el 94% entonces 1 - /2 = ........ y Z1 - /2 = ......
ε = 0.02 y p = 0.4 , de acuerdo a los datos del problema.
Luego n = 2122
Nota:
Si no se usa el dato p = 0.4, entonces asumiríamos que p es desconocido, en cuyo caso,
tomamos p = 0.5; con lo cual n = 2210.
Ejemplo 6
La empresa PROTEC está interesada en introducir un nuevo tipo de producto en el
mercado limeño. Para medir el nivel de aceptación de los potenciales consumidores,
decide realizar un estudio de mercado a una población de 30,000 consumidores
potenciales.
a. Qué tamaño de muestra deberá escoger si desea tener una confianza del 95% de que
el error de la estimación de la proporción a favor del nuevo producto no sea superior
al 4%?
b. Si con el tamaño de muestra calculado en a) se usa p = 0.70 como estimación de la
proporción de todos los consumidores que prefieren su producto. Qué grado de
confianza utilizó, si estimó de 19,783 a 22,217 el total de los consumidores de la
población que prefieren su producto?
Solución
a) De acuerdo a los datos: N = ...............; 1 - /2 = ........ y Z1 - /2 = ........
ε = ...............
El muestreo es con o sin reposición? ......................
Según esto la fórmula para estimar el tamaño de muestra es:
.............................................................
Reemplazando todos los datos y simplificando se tiene n = 589.
b) En este caso p = 0.70. Si N es el total de la población, de los cuales el 70% está a
favor del nuevo producto, el total de la población que está a favor del nuevo
producto es Np; es decir, 30,000x0.70 = 21,000 habitantes.
Según el problema, este total a favor del nuevo producto está en el intervalo 19,783
a 22,217.
Según esto, 19,783 < Np < 22,217. Por otro lado, como
p(1  p)
p(1  p)
p  Z 1
 p  p  Z 1
2
2
n
n
Multiplicando a toda la desigualdad debemos tener
p(1  p)
19,783 = p  Z 1
2
n
p(1  p)
y del mismo modo 22,217 = p  Z 1
2
n
Reemplazando en las dos ecuaciones: p = 0.70 y n = 589 y con  desconocido,
encontramos un Z = ..........................
Usando Minitab encontramos el nivel de confianza: 100(1-α)% = ............
Usando Excel, para encontrar 1- α , se debe usar =Distr.Norm.Estand.Inv(Z)
Ejercicio 5
En un estudio socioeconómico se tomó una muestra aleatoria a 100 comerciantes
informales y se encontró lo siguiente: un ingreso medio de $600, una desviación
estándar de $50 y sólo el 30% de ellos tienen ingresos superiores a $800.
b) Estimar la proporción de todos los comerciantes con ingresos superiores a $800
usando para ello un intervalo del 98% de confianza.
c) Si la proporción de todos los comerciantes con ingresos superiores a $800 se estima
entre 20.06% y 39.94%, qué grado de confianza se utilizó?
1.3. INTERVALO
PROPORCIONES
DE
CONFIANZA
PARA
LA
DIFERENCIA
DE
Sea X1, X2, ..., Xn1 una muestra aleatoria extraída de una población Bernoulli con
parámetro p1. Sea Y1, Y2, ..., Yn2 una muestra aleatoria extraída de una población
Bernoulli con parámetro p2 . Supongamos que ambas muestras son independientes.
son los estadísticos muestrales y definimos a   p  p como el
1
2
estimador de la diferencia de proporciones poblacionales   p  p entonces se debe
Si
p
p
y
1
2
1
2
cumplir que
P( | ( p 
1
p )(p  p )
2
1
2
|   )  1
A partir del cual debemos encontrar el intervalo del 100(1-α)% de confianza
(p 
1
p)Z
2
1
p (1  p ) p (1  p)

n
n
1
2
1
1
2
2
2

pp
1
2

( p1 p 2)  Z
p (1  p ) p (1  p)

n
n
1
1
2
1
1
2
2
2
Nota:
Si n1 y n2 son bastante grandes el radical se calcula usando los estadísticos de la
muestra.
El criterio usado es el mismo dado en los temas anteriores.
Consulte la página 263 del libro Inferencia Estadística de Máximo Mitacc, para una
explicación un poco más detallada de este tema.
Ejemplo 7
Una empresa investigadora de mercado es requerida para hacer un estudio sobre la
preferencia de un producto. Se le pide que estime la proporción de hombres y mujeres
que conocen el producto que está siendo promocionado en toda la ciudad. En una
muestra aleatoria de 100 hombres y 200 mujeres se determina que 20 hombres y 60
mujeres están familiarizados con el producto indicado. Construya el intervalo de
confianza del 95% para la diferencia de proporciones de hombres y mujeres que
conocen el producto. En base a estos resultados, ¿se estaría inclinado a concluir que
existe una diferencia significativa entre las dos proporciones?
Solución
Según los datos: Se trata de un problema de .................................
Sea p1: La proporción de hombres que conocen el producto
Sea p2 : La ...............................................................................
n1 = ...........;
n2 = ........;
1-/2 = ..........
p  ..........; p  .............;
1
2
El intervalo de confianza pedido tendrá la forma:
......................................................................................................................
Calculemos por partes:
p
1  p2

Z
1 
 ...........;
2
p (1  p )  p (1  p )
n
n
1
1
1
2
2
pp
1
2
= ....................
= ......................................................
2
Luego el intervalo de confianza del 95% será .............. < p1 – p2 < .................
Según esto, existe diferencia significativa? .............................. por qué ...............
Ejercicio 6
El gerente de control interno de una empresa le encarga a dos de sus técnicos, la
verificación de la validez de un conjunto de certificados de ventas. Para ello se toma una
muestra de 120 y se les distribuye 60 a cada uno de ellos. Después de presentar su
informe, se encuentra que el primer técnico examina a 40 y encuentra 10 falsos,
mientras que el segundo técnico examina 50 y encuentra 15 falsos. Debido a la
diferencia de entre estos porcentajes el gerente solicitó un intervalo de confianza del
95% para la diferencia de verdadera. ¿Este intervalo de confianza justificará la creencia
del gerente de que los dos técnicos emplean métodos diferentes?
Descargar