Subido por nadiaim7

01 Intervalos de Confianza - Guia

Anuncio
Intervalos de Confianza
INFERENCIA ESTADISTICA
Estimación por intervalo
En general, la construcción de un intervalo de confianza para un parámetro desconocido de
encontrar una estadística suficiente T y relacionarla con otra variable aleatoria W = f(T;
involucra a

pero la distribución de W no contiene a
,

consiste en
 ), en donde W
así como tampoco a ningún otro parámetro
desconocido.
Entonces se seleccionan dos valores a y b, tal que:
Pa  W  b  1  
o bien:
Pg1    T  g 2    1  
donde:
1   recibe el nombre de coeficiente de confianza.
Mediante algunas manipulaciones algebraicas, se obtiene:
Ph1 T     h2 T   1  
Donde: h1(T) y h2(T) son funciones de la estadística T y de ésta forma, variables aleatorias.
El intervalo de confianza para

se obtiene sustituyendo en h1(T) y h2(T) los estimadores calculados a partir
de los datos muestrales, dando origen a lo que se conoce como intervalo de confianza bilateral.
P f 1 T      1   ; Intervalo de confianza unilateral inferior para 
P  f 2 T   1   ; Intervalo de confianza unilateral superior para 
NOTA:
1)
W se conoce como variable aleatoria pivotal, el método en general, recibe el nombre de método
pivotal.
2)
Los pasos a seguir por este método son:
1º
Obtener los estimadores insesgados MV de los parámetros
2º
Encontrar la distribución de los estimadores
3º
Construir la variable aleatoria pivotal W.
4º
Obtener el intervalo de confianza pedido.
Profesor : Raúl Ruiz Zamorano

ˆ .
Página 1 de 15
Intervalos de Confianza
1.-
Intervalo de confianza para µ cuando se muestrea una distribución normal con varianza conocida
Sea X1,...,Xn una ma(n) de una distribución normal con media desconocida µ, pero con una varianza
 02
conocida, es decir: X ~ N[µ ,
El intervalo de
 02 ]. Dado:   0,1
100  1   % de confianza para µ, sabiendo que la distribución normal es simétrica,
resulta ser:
P z 1-α/2  Z  z 1-α/2   1  
Reemplazando Z y realizando algunas manipulaciones algebraicas, se obtiene:




0
0 

 X    z 1-α/2 
 1
P   z 1-α/2 

n
n
 


g


 
g  


1
2
o bien:




0
0 

   X  z 1-α/2 
 1
P X  z 1-α/2 

n
n
 



h1 X 
h2 X 


Observaciones:
X  z 1-α/2 
1)
La probabilidad de que el intervalo aleatorio:
verdadero valor de la media µ es
2)
n
a X  z 1-α/2 
0
n
contenga el
1
Reemplazando la variable aleatoria
la ma(n), un intervalo de
0
X por su estimación x calculado a partir de los datos de
100  1   % de confianza para µ, resulta ser:
x  z 1-α/2 
0
n
o
bien:


 
I  ;1   x  z 1-α/2  0 ; x  z1-α/2  0 
n
n

Profesor : Raúl Ruiz Zamorano
Página 2 de 15
Intervalos de Confianza
x  z 1-α/2 
donde:
0
n
y x  z 1-α/2 
0
n
reciben el nombre de límites de confianza inferior y
superior respectivamente.
3)
Nótese que si
de confianza
n   , entonces, más pequeño es el ancho del intervalo o para un coeficiente
1   más grande, mayor es el ancho del intervalo de confianza.
long I  ;1  2  z 1-α/2 
4)
La longitud del intervalo de confianza, resulta ser:
0
n
Ejemplo. Los datos que a continuación se dan son los pesos en gramos del contenido de 16 cajas de
cereal que se seleccionaron de un proceso de llenado con el propósito de verificar el peso promedio:
506; 508; 499; 503; 504; 510; 497; 512; 514; 505; 493; 496; 506; 502; 509 y 496. Si el peso de cada
caja es una variable aleatoria normal con una desviación estándar
  5 gr. , obtener los intervalos
de confianza del 90, 95 y 99%, para la media de llenado de este proceso.
Solución:
La media muestral es: x  503,75 gr.
503,75  z 1-α/2  1,25
Los intervalos de confianza, están dados por:
Cuadro resumen
Confianza
z 1-α/2
Límite
inferior
Límite
superior
Longitud
90%
1,645
501,69
505,81
4,12
95%
1,96
501,30
506,20
4,90
99%
2,575
500,53
506,97
6,44
Observación
Supóngase que el muestreo se realiza sobre una población que tiene distribución normal con media
2
 desconocida y varianza  0 conocida. Se desea estimar el tamaño necesario de la muestra de
100  1   % , la media muestral X se encuentre en un
intervalo igual a  unidades alrededor de la media poblacional  .
manera tal que, con una probabilidad
Profesor : Raúl Ruiz Zamorano
Página 3 de 15
Intervalos de Confianza
Solución:


P X      1   en donde :   z 1-α/2 
Resolviendo para n, se tiene:
2.-


n   z 1-α/2  



n
2
Intervalo de confianza para µ cuando se muestrea una distribución normal con varianza
desconocida.
Sea X1,...,Xn una ma(n) de una distribución normal con media desconocida µ, y varianza
desconocida, es decir: X ~ N[µ ,
El intervalo de
2
]. Dado:
2
  0,1
100  1   % de confianza para µ, sabiendo que la distribución t de Student es
simétrica, resulta ser:
P  t α/2 n  1 T  t α/2 n  1 1  
Reemplazando T y realizando algunas manipulaciones algebraicas, se obtiene:

s
s 
  1
   X  t α/2 n  1 
P X  t α/2 n  1

n
n

Observaciones:
X  t α/2 n  1
La probabilidad de que el intervalo aleatorio:
contenga el verdadero valor de la media µ es
1)
Reemplazando la variable aleatoria
la ma(n), un intervalo del
s
n
a X  t α/2 n  1
s
n
1
X por su estimación x calculado a partir de los datos de
100  1   % para µ, resulta ser:
x  t α/2
n  1
s
n
o bien:
Profesor : Raúl Ruiz Zamorano
Página 4 de 15
Intervalos de Confianza

s
s 
I  ;1   x  t α/2 n  1
; x  t α/2 n  1

n
n

Donde:
x  t α/2
n  1
s
n
n  1
y x  t α/2
s
n
Reciben el nombre de límites de confianza inferior y superior respectivamente.
2)
Nótese que si
de confianza
3)
n   , entonces, más pequeño es el ancho del intervalo o para un coeficiente
1   más grande, mayor es el ancho del intervalo de confianza.
La longitud del intervalo de confianza, resulta ser:


long I  ;1  2  t α/2 n  1
s
n
Ejemplo; usando la información del ejemplo anterior, obtener intervalos de confianza estimados del
90, 95 y 99%, para la media de llenado de este proceso.
Solución:
2
La media muestral es: x  503,75 gr. La estimación de la varianza es: s  6,20
2
Los intervalos de confianza, están dados por:
503,75 tα/2 151,55
Cuadro resumen
3.-
Límite
Límite
inferior
superior
1,753
501,03
506,47
5,44
95%
2,131
500,45
507,05
6,02
99%
2,947
499,18
508,32
9,14
Confianza
t α/2 15 
90%
Longitud
Intervalo de confianza para la diferencia de medias cuando se muestrean dos distribuciones
normales e independientes.
Profesor : Raúl Ruiz Zamorano
Página 5 de 15
Intervalos de Confianza
Sean X1,...,Xn y Y1,...,Yn dos muestras aleatorias de dos distribuciones independientes, con medias
 X , Y y varianzas  X2 y  Y2 , respectivamente.
CASO 1: Varianzas conocidas e iguales o desiguales
El intervalo de
100  1   % de confianza para  X   Y , sabiendo que la distribución normal es
simétrica, resulta ser:
P  z 1-α/2  Z  z 1-α/2  1  
Reemplazando Z y realizando algunas manipulaciones algebraicas, se obtiene:

 X2  Y2
 X2  Y2 

  X  Y  X  Y  z 1-α/2 

 1
P X  Y  z 1-α/2 
nX
nY
nX
nY 


Observaciones:
1)
La probabilidad de que el intervalo aleatorio:
X  Y  z 1-α/2 
 X2
nX

 Y2
nY
a X  Y  z 1-α/2 
Contenga al verdadero valor de la diferencia de medias
2)
 X  Y
 X2
nX
es

 Y2
nY
1 .
Reemplazando la variable aleatoria X  Y por su estimación x  y calculado a partir de los
datos de la ma(n), un intervalo del
x  y  ztabla 
 X2
nX

100  1   % para  X   Y , resulta ser:
 Y2
nY
o bien:

 X2  Y2
 X2  Y2 


I  X  Y ;1 ;   x  y  z1-α/2 
; x  y  z1-α/2 

n X nY
n X nY 

Profesor : Raúl Ruiz Zamorano
Página 6 de 15
Intervalos de Confianza
x  y  z1-α/2 
Donde:
 X2
nX

 Y2
nY
y x  y  z1-α/2 
 X2

nX
 Y2
nY
reciben el nombre de límites
de confianza inferior y superior respectivamente.
3)
Nótese que si
de confianza
4)
n   , entonces, más pequeño es el ancho del intervalo o para un coeficiente
1   más grande, mayor es el ancho del intervalo de confianza.
La longitud del intervalo de confianza, resulta ser:


long I  X  Y ;1 ;  2  z 1-α/2 
 X2

nX
 Y2
nY
CASO 2: Varianzas desconocidas, pero iguales
El intervalo de
100  1   % de confianza para  X   Y , sabiendo que la distribución t de Student
es simétrica, resulta ser:
P t
α/2
nX  nY  2 T  t
α/2
nX  nY  2 1  
Reemplazando T y realizando algunas manipulaciones algebraicas, se obtiene:

P X  Y  t α/2


n X
 nY  2  s común 
1
1

  X   Y  X  Y  t α/2
n X nY
n X
 nY  2  s común 
1
1 

1 
n X nY 
Donde la varianza común es:
2
s común
n
 X
 1  s X2  nY  1  sY2
n X  nY  2
Observaciones:
1)
La probabilidad de que el intervalo aleatorio:
X  Y  tα/2 n X  nY  2 scomún 
1
1
1
1


a X  Y  t α/2 n X  nY  2 scomún 
n X nY
n X nY
Contenga al verdadero valor de la diferencia de medias  X  Y es
Profesor : Raúl Ruiz Zamorano
1 .
Página 7 de 15
Intervalos de Confianza
2)
Reemplazando la variable aleatoria X  Y por su estimación x  y calculado a partir de los
datos de la ma(n), un intervalo del
100  1   % para  X   Y , resulta ser:
x  y  t α/2 n X  nY  2 s común 
Profesor : Raúl Ruiz Zamorano
1
1

n X nY
Página 8 de 15
Intervalos de Confianza
o bien:

1
1
1
1 


I  X  Y ;1   x  y  t α/2 n X  nY  2 s común 
; x  y  t α/2 n X  nY  2 scomún 

n X nY
n X nY 

x  y  tα/2 n X  nY  2 scomún 
Donde:
1
1
1
1


y x  y  t α/2 n X  nY  2 scomún 
n X nY
n X nY
reciben el
nombre de límites de confianza inferior y superior respectivamente.
3)
de confianza
4)
n   , entonces, más pequeño es el ancho del intervalo o para un coeficiente
Nótese que si
1   más grande, mayor es el ancho del intervalo de confianza.
La longitud del intervalo de confianza, resulta ser:


long I  X  Y ;1  2  t α/2
n X
 nY  2  s c 
1
1

n X nY
Ejemplo; se piensa que los estudiantes de INGECO pueden esperar un mayor salario promedio al
egresar, que el que esperan los estudiantes de COAUD. Se obtuvieron muestras aleatorias de ambos
grupos de un área geográfica relativamente homogénea, proporcionando los datos que se encuentran
en la tabla adjunta. Calcule un intervalo de confianza unilateral inferior del 90 % para la diferencia
entre los salarios promedios para los egresados de INGECO y COAU
las varianzas
 A2 y  B2
 A  B
al egresar (suponga que
son iguales).
Salarios iniciales anuales para recién graduados(en miles de U$)
INGECO (A)
16,3
18,2
17,5
16,1
15,9
15,4
15,8
17,3
14,9
15,1
AUDITORIA (B)
13,2
15,1
13,9
14,7
15,6
15,8
14,9
18,1
15,6
15,3
16,2
15,2
15,4
Solución:
1)
A partir de los datos muestrales se puede calcular las siguientes cantidades:
n A  10
n B  14
A  16,25
B  15,4
s 2A  1,1872
s B2  1,3523
2
s común
 1,2848  s común  1,1335
Profesor : Raúl Ruiz Zamorano
Página 9 de 15
16,6
Intervalos de Confianza
2)
Un intervalo de confianza unilateral inferior del 90% está dado por:
A  B  t α/2 22 scomún 
 I  A   B ;90%  230; 
1
1
1 1

 16,25  15,4  1,321 1,1335 

n X nY
10 14
Interpretación. Un intervalo de confianza unilateral del 90% para la diferencia real entre los salarios
promedio es de U$ 230,05, es decir, en el 90% de las muestras posibles, el verdadero valor de la media
poblacional será mayor o igual a U$230,05.
4.-
Intervalos de confianza para
2
cuando se muestrea una distribución normal con media
desconocida
Sea X1,...,Xn una ma(n) de una distribución normal, es decir: X ~ N[µ ,
El intervalo de
2
]. Dado:
  0,1
100  1   % de confianza para  2 , resulta ser:
Pa  W  b  1  
Es decir:
 n  1  s 2
n  1  s 2   1  
P
 2 


b
a


Para que el intervalo sea de longitud mínima:
2
n  1
a   tabla
y
2
n  1
b   tabla
Observaciones:
n  1 s 2
1)
La probabilidad de que el intervalo aleatorio:
valor de la media µ es
2)
b
a
n  1 s 2
b
contenga el verdadero
1
Reemplazando la variable aleatoria s2 por su realización calculada a partir de los datos de la
ma(n), un intervalo del
100  1   % para  2 , resulta ser
 n  1  s 2 n  1  s 2 
I  2 ;1  
;

b
a


Profesor : Raúl Ruiz Zamorano
Página 10 de 15
Intervalos de Confianza
n  1 s 2
Donde:
b
y
n  1 s 2
a
reciben el nombre de límites de confianza inferior y superior
respectivamente.
3)
La longitud del intervalo de confianza, resulta ser:


1 1
long I  2 ;1  n  1  s 2    
a b
Ejemplo; un proceso produce cierta clase de cojinetes de bola cuyo diámetro interior es de 3 cm. Se
seleccionan, en forma aleatoria, 12 de estos cojinetes y se miden sus diámetros internos, que resultan
ser: 3,01; 3,05; 2,99; 3,00; 3,02; 2,99; 2,97; 2,97; 3,02 y 3,01. Suponiendo que el diámetro es una
variable aleatoria normalmente distribuida, determinar un intervalo de confianza del 99% para la
varianza
2.
Solución:
A partir de los datos muestrales se pueden calcular las cantidades siguientes:
n  12  los grados de libertad son n - 1  11
s 2  0,0005455
2
2
11  2,60 ; b   tabla
11  26,75
a   tabla
1)
El intervalo de confianza del 99%, está dado por:
 n  1  s 2 n  1  s 2 
I  2 ;99%  
;

b
a


Al sustituir los resultados numéricos, se obtiene:
 11  0,0005455 11  0,0005455 
I 2 ;99%  
;
  0,0002246;0,0023079
26,71
2,6


Profesor : Raúl Ruiz Zamorano
Página 11 de 15
Intervalos de Confianza
5.-
Intervalo de confianza para el cociente de dos varianzas cuando se muestrean dos distribuciones
normales independientes
En el medio industrial muchas veces surge la necesidad de medir y comparar las variabilidades de dos
procesos distintos.
Supóngase que se tienen m.a de dos distribuciones normales con medias y varianzas desconocidas.
2
2
Sea nx y ny, el tamaño de las muestras y s X y s Y las varianzas muestrales.
El intervalo de 100  1   % de confianza, tal que:


s X2


2


X
P a  2  b   1  
sY


2



Y


2
2


s

P a  X2  Y2  b   1  


sY  X


2
2

s

s2 
P a  Y2  Y2  b  Y2   1  

sX  X
s X 

De ésta forma un intervalo de 100  1   % de confianza para
I 2
Y
 X2
;1
 Y2
 X2
está dado por:

s2
s2 
 a  Y2 ; b  Y2 
s X 
 s X
Donde:
a
1
; b  f tabla n X  1; nY  1
f tabla nY  1; n X  1
Ejemplo (ver datos del ejemplo de recién graduados). Se desea un intervalo de confianza del 90%
 Y2
2
para  X
Profesor : Raúl Ruiz Zamorano
Página 12 de 15
Intervalos de Confianza
Solución
A partir de los datos muestrales se puede calcular las siguientes cantidades:
n A  10
s 2A
a
n B  14
 1.187.222,22
1
f tabla 9;13

s B2  1.352.307,69
1
f tabla 9;12

1
 0,3257 ; con 90% de confianza
3,07
b  f tabla 13;9  2,71 ; con 90% de confianza
 Y2
2
Un intervalo de 90% de confianza para  X está dado por:
I 2
Y
 X2
;1

s2
s2 
 a  Y2 ; b  Y2 
s X 
 s X
Al sustituir los resultados numéricos, se obtiene:
I 2
Y
 X2
;0,90

1.352.307,69
1.352.307,69 
 0,3257 
; 2,71 
 0,3710 ; 3,0868
1.187.222,22
1.187.222,22 

Interpretación. Un intervalo de confianza del 90% para el cociente de varianzas real entre los salarios
es de [ 0,3736; 3,0868 ], es decir, en el 90% de las muestras posibles, el verdadero valor del cociente
entre las varianzas poblacionales será de 0,3710 hasta 3,0868.
6.-
Intervalo de confianza para el parámetro de proporción P cuando se muestrea una distribución
binomial
El porcentaje de productos defectuosos de un proceso de manufactura es el barómetro más
importante para medir la calidad del proceso para manufacturar un producto dado. Ya que un artículo
puede estar defectuoso o no, el número de unidades defectuosas es una variable aleatoria binomial,
si se supone una probabilidad constante e independiente.
En una ma(n) el parámetro P que representa la proporción de artículos defectuosos es desconocido.
Determinar un intervalo de confianza para P, basado en una muestra grande.
Sea X1,...,Xn una ma(n) de una distribución binomial, es decir: X ~ b(n ; P). Dado:
Profesor : Raúl Ruiz Zamorano
  0,1
Página 13 de 15
Intervalos de Confianza
El intervalo de
100  1   % de confianza para P, y por simetría de la distribución normal, resulta
ser:
P ztabla  Z  ztabla   1  
Reemplazando Z y realizando algunas manipulaciones algebraicas, se obtiene:

P pˆ  ztabla 


pˆ  1  pˆ 
 P  pˆ  ztabla 
n
pˆ  1  pˆ  
 1

n

o bien:

I P;1   pˆ  ztabla 

pˆ  1  pˆ 
; pˆ  ztabla 
n
pˆ  1  pˆ  

n

Ejemplo: Un fabricante asegura, a una compañía que le compra un producto en forma regular, que el
porcentaje de productos defectuosos no es mayor del 5 %. La compañía decide comprobar la
afirmación del fabricante seleccionado, de su inventario, 200 unidades de este producto y
probándolos. ¿Deberá sospechar la compañía de la afirmación del fabricante si se descubre un total
de 19 unidades defectuosas en la muestra?
Solución
La sospecha estará apoyada si existe un intervalo de confiabilidad alta para el cual la proporción P se
encuentra completamente a la derecha del valor asegurado 0,05. Tomemos una confiabilidad de un
95%.
Como la realización de la variable aleatoria X de x = 19 y n = 200, el estimado de P es
pˆ 
19
 0,095
200
Luego el intervalo aleatorio, resulta ser:

pˆ  1  pˆ 
pˆ  1  pˆ  
I P;95%   pˆ  z tabla 
; pˆ  z tabla 

n
n



0,095  1  0,095
0,095  1  0,095 
I P;95%  0,095  1,96 
; 0,095  1,96 
  0,05436 ; 0,1356
200
200


Aparentemente existe una razón para sospechar de la afirmación del fabricante, ya que el intervalo
de confianza se encuentra completamente a la derecha del valor asegurado.
Observaciones:
Profesor : Raúl Ruiz Zamorano
Página 14 de 15
Intervalos de Confianza
1)
Los métodos presentados deben usarse sólo cuando el tamaño de la muestra es suficientemente
grande. De otro modo deberán emplearse los intervalos de confianza exactos.
La distribución t de Student sigue siendo válida para inferencias con respecto a las medias, aun
a pesar de que se haga un muestreo una distribución que no es normal, el efecto que se tiene
por una violación t de Student, parece ser pequeño, aun para un tamaño n relativamente
modesto.
2)
Para estimar un intervalo de confianza para la diferencia de medias con varianzas desconocidas
y distintas cuando se haga un muestreo una población normal, se utiliza la variable aleatoria
pivotal:
T
X  Y   X  Y 
s X2
s2
 Y
n X nY
que tiene una distribución t de Student con v grados de libertad, donde:
v
 s X2
s2 
 Y

 n X nY 
2
2
2
 s X2 
 s2 
1
1
 Y  
  
n
n

1
n
n
 X 
 Y 
X
Y 1
2
Texto basado en apuntes “Manual
de Estadística” del Profesor Juan
Zambrano Challapa.
Profesor : Raúl Ruiz Zamorano
Página 15 de 15
Descargar