01 Intervalos de Confianza - Guia

Intervalos de Confianza INFERENCIA ESTADISTICA Estimación por intervalo En general, la construcción de un intervalo de confianza para un parámetro desconocido de encontrar una estadística suficiente T y relacionarla con otra variable aleatoria W = f(T; involucra a  pero la distribución de W no contiene a ,  consiste en  ), en donde W así como tampoco a ningún otro parámetro desconocido. Entonces se seleccionan dos valores a y b, tal que: Pa  W  b  1   o bien: Pg1    T  g 2    1   donde: 1   recibe el nombre de coeficiente de confianza. Mediante algunas manipulaciones algebraicas, se obtiene: Ph1 T     h2 T   1   Donde: h1(T) y h2(T) son funciones de la estadística T y de ésta forma, variables aleatorias. El intervalo de confianza para  se obtiene sustituyendo en h1(T) y h2(T) los estimadores calculados a partir de los datos muestrales, dando origen a lo que se conoce como intervalo de confianza bilateral. P f 1 T      1   ; Intervalo de confianza unilateral inferior para  P  f 2 T   1   ; Intervalo de confianza unilateral superior para  NOTA: 1) W se conoce como variable aleatoria pivotal, el método en general, recibe el nombre de método pivotal. 2) Los pasos a seguir por este método son: 1º Obtener los estimadores insesgados MV de los parámetros 2º Encontrar la distribución de los estimadores 3º Construir la variable aleatoria pivotal W. 4º Obtener el intervalo de confianza pedido. Profesor : Raúl Ruiz Zamorano  ˆ . Página 1 de 15 Intervalos de Confianza 1.- Intervalo de confianza para µ cuando se muestrea una distribución normal con varianza conocida Sea X1,...,Xn una ma(n) de una distribución normal con media desconocida µ, pero con una varianza  02 conocida, es decir: X ~ N[µ , El intervalo de  02 ]. Dado:   0,1 100  1   % de confianza para µ, sabiendo que la distribución normal es simétrica, resulta ser: P z 1-α/2  Z  z 1-α/2   1   Reemplazando Z y realizando algunas manipulaciones algebraicas, se obtiene:     0 0    X    z 1-α/2   1 P   z 1-α/2   n n     g     g     1 2 o bien:     0 0      X  z 1-α/2   1 P X  z 1-α/2   n n      h1 X  h2 X    Observaciones: X  z 1-α/2  1) La probabilidad de que el intervalo aleatorio: verdadero valor de la media µ es 2) n a X  z 1-α/2  0 n contenga el 1 Reemplazando la variable aleatoria la ma(n), un intervalo de 0 X por su estimación x calculado a partir de los datos de 100  1   % de confianza para µ, resulta ser: x  z 1-α/2  0 n o bien:     I  ;1   x  z 1-α/2  0 ; x  z1-α/2  0  n n  Profesor : Raúl Ruiz Zamorano Página 2 de 15 Intervalos de Confianza x  z 1-α/2  donde: 0 n y x  z 1-α/2  0 n reciben el nombre de límites de confianza inferior y superior respectivamente. 3) Nótese que si de confianza n   , entonces, más pequeño es el ancho del intervalo o para un coeficiente 1   más grande, mayor es el ancho del intervalo de confianza. long I  ;1  2  z 1-α/2  4) La longitud del intervalo de confianza, resulta ser: 0 n Ejemplo. Los datos que a continuación se dan son los pesos en gramos del contenido de 16 cajas de cereal que se seleccionaron de un proceso de llenado con el propósito de verificar el peso promedio: 506; 508; 499; 503; 504; 510; 497; 512; 514; 505; 493; 496; 506; 502; 509 y 496. Si el peso de cada caja es una variable aleatoria normal con una desviación estándar   5 gr. , obtener los intervalos de confianza del 90, 95 y 99%, para la media de llenado de este proceso. Solución: La media muestral es: x  503,75 gr. 503,75  z 1-α/2  1,25 Los intervalos de confianza, están dados por: Cuadro resumen Confianza z 1-α/2 Límite inferior Límite superior Longitud 90% 1,645 501,69 505,81 4,12 95% 1,96 501,30 506,20 4,90 99% 2,575 500,53 506,97 6,44 Observación Supóngase que el muestreo se realiza sobre una población que tiene distribución normal con media 2  desconocida y varianza  0 conocida. Se desea estimar el tamaño necesario de la muestra de 100  1   % , la media muestral X se encuentre en un intervalo igual a  unidades alrededor de la media poblacional  . manera tal que, con una probabilidad Profesor : Raúl Ruiz Zamorano Página 3 de 15 Intervalos de Confianza Solución:   P X      1   en donde :   z 1-α/2  Resolviendo para n, se tiene: 2.-   n   z 1-α/2      n 2 Intervalo de confianza para µ cuando se muestrea una distribución normal con varianza desconocida. Sea X1,...,Xn una ma(n) de una distribución normal con media desconocida µ, y varianza desconocida, es decir: X ~ N[µ , El intervalo de 2 ]. Dado: 2   0,1 100  1   % de confianza para µ, sabiendo que la distribución t de Student es simétrica, resulta ser: P  t α/2 n  1 T  t α/2 n  1 1   Reemplazando T y realizando algunas manipulaciones algebraicas, se obtiene:  s s    1    X  t α/2 n  1  P X  t α/2 n  1  n n  Observaciones: X  t α/2 n  1 La probabilidad de que el intervalo aleatorio: contenga el verdadero valor de la media µ es 1) Reemplazando la variable aleatoria la ma(n), un intervalo del s n a X  t α/2 n  1 s n 1 X por su estimación x calculado a partir de los datos de 100  1   % para µ, resulta ser: x  t α/2 n  1 s n o bien: Profesor : Raúl Ruiz Zamorano Página 4 de 15 Intervalos de Confianza  s s  I  ;1   x  t α/2 n  1 ; x  t α/2 n  1  n n  Donde: x  t α/2 n  1 s n n  1 y x  t α/2 s n Reciben el nombre de límites de confianza inferior y superior respectivamente. 2) Nótese que si de confianza 3) n   , entonces, más pequeño es el ancho del intervalo o para un coeficiente 1   más grande, mayor es el ancho del intervalo de confianza. La longitud del intervalo de confianza, resulta ser:   long I  ;1  2  t α/2 n  1 s n Ejemplo; usando la información del ejemplo anterior, obtener intervalos de confianza estimados del 90, 95 y 99%, para la media de llenado de este proceso. Solución: 2 La media muestral es: x  503,75 gr. La estimación de la varianza es: s  6,20 2 Los intervalos de confianza, están dados por: 503,75 tα/2 151,55 Cuadro resumen 3.- Límite Límite inferior superior 1,753 501,03 506,47 5,44 95% 2,131 500,45 507,05 6,02 99% 2,947 499,18 508,32 9,14 Confianza t α/2 15  90% Longitud Intervalo de confianza para la diferencia de medias cuando se muestrean dos distribuciones normales e independientes. Profesor : Raúl Ruiz Zamorano Página 5 de 15 Intervalos de Confianza Sean X1,...,Xn y Y1,...,Yn dos muestras aleatorias de dos distribuciones independientes, con medias  X , Y y varianzas  X2 y  Y2 , respectivamente. CASO 1: Varianzas conocidas e iguales o desiguales El intervalo de 100  1   % de confianza para  X   Y , sabiendo que la distribución normal es simétrica, resulta ser: P  z 1-α/2  Z  z 1-α/2  1   Reemplazando Z y realizando algunas manipulaciones algebraicas, se obtiene:   X2  Y2  X2  Y2     X  Y  X  Y  z 1-α/2    1 P X  Y  z 1-α/2  nX nY nX nY    Observaciones: 1) La probabilidad de que el intervalo aleatorio: X  Y  z 1-α/2   X2 nX   Y2 nY a X  Y  z 1-α/2  Contenga al verdadero valor de la diferencia de medias 2)  X  Y  X2 nX es   Y2 nY 1 . Reemplazando la variable aleatoria X  Y por su estimación x  y calculado a partir de los datos de la ma(n), un intervalo del x  y  ztabla   X2 nX  100  1   % para  X   Y , resulta ser:  Y2 nY o bien:   X2  Y2  X2  Y2    I  X  Y ;1 ;   x  y  z1-α/2  ; x  y  z1-α/2   n X nY n X nY   Profesor : Raúl Ruiz Zamorano Página 6 de 15 Intervalos de Confianza x  y  z1-α/2  Donde:  X2 nX   Y2 nY y x  y  z1-α/2   X2  nX  Y2 nY reciben el nombre de límites de confianza inferior y superior respectivamente. 3) Nótese que si de confianza 4) n   , entonces, más pequeño es el ancho del intervalo o para un coeficiente 1   más grande, mayor es el ancho del intervalo de confianza. La longitud del intervalo de confianza, resulta ser:   long I  X  Y ;1 ;  2  z 1-α/2   X2  nX  Y2 nY CASO 2: Varianzas desconocidas, pero iguales El intervalo de 100  1   % de confianza para  X   Y , sabiendo que la distribución t de Student es simétrica, resulta ser: P t α/2 nX  nY  2 T  t α/2 nX  nY  2 1   Reemplazando T y realizando algunas manipulaciones algebraicas, se obtiene:  P X  Y  t α/2   n X  nY  2  s común  1 1    X   Y  X  Y  t α/2 n X nY n X  nY  2  s común  1 1   1  n X nY  Donde la varianza común es: 2 s común n  X  1  s X2  nY  1  sY2 n X  nY  2 Observaciones: 1) La probabilidad de que el intervalo aleatorio: X  Y  tα/2 n X  nY  2 scomún  1 1 1 1   a X  Y  t α/2 n X  nY  2 scomún  n X nY n X nY Contenga al verdadero valor de la diferencia de medias  X  Y es Profesor : Raúl Ruiz Zamorano 1 . Página 7 de 15 Intervalos de Confianza 2) Reemplazando la variable aleatoria X  Y por su estimación x  y calculado a partir de los datos de la ma(n), un intervalo del 100  1   % para  X   Y , resulta ser: x  y  t α/2 n X  nY  2 s común  Profesor : Raúl Ruiz Zamorano 1 1  n X nY Página 8 de 15 Intervalos de Confianza o bien:  1 1 1 1    I  X  Y ;1   x  y  t α/2 n X  nY  2 s común  ; x  y  t α/2 n X  nY  2 scomún   n X nY n X nY   x  y  tα/2 n X  nY  2 scomún  Donde: 1 1 1 1   y x  y  t α/2 n X  nY  2 scomún  n X nY n X nY reciben el nombre de límites de confianza inferior y superior respectivamente. 3) de confianza 4) n   , entonces, más pequeño es el ancho del intervalo o para un coeficiente Nótese que si 1   más grande, mayor es el ancho del intervalo de confianza. La longitud del intervalo de confianza, resulta ser:   long I  X  Y ;1  2  t α/2 n X  nY  2  s c  1 1  n X nY Ejemplo; se piensa que los estudiantes de INGECO pueden esperar un mayor salario promedio al egresar, que el que esperan los estudiantes de COAUD. Se obtuvieron muestras aleatorias de ambos grupos de un área geográfica relativamente homogénea, proporcionando los datos que se encuentran en la tabla adjunta. Calcule un intervalo de confianza unilateral inferior del 90 % para la diferencia entre los salarios promedios para los egresados de INGECO y COAU las varianzas  A2 y  B2  A  B al egresar (suponga que son iguales). Salarios iniciales anuales para recién graduados(en miles de U$) INGECO (A) 16,3 18,2 17,5 16,1 15,9 15,4 15,8 17,3 14,9 15,1 AUDITORIA (B) 13,2 15,1 13,9 14,7 15,6 15,8 14,9 18,1 15,6 15,3 16,2 15,2 15,4 Solución: 1) A partir de los datos muestrales se puede calcular las siguientes cantidades: n A  10 n B  14 A  16,25 B  15,4 s 2A  1,1872 s B2  1,3523 2 s común  1,2848  s común  1,1335 Profesor : Raúl Ruiz Zamorano Página 9 de 15 16,6 Intervalos de Confianza 2) Un intervalo de confianza unilateral inferior del 90% está dado por: A  B  t α/2 22 scomún   I  A   B ;90%  230;  1 1 1 1   16,25  15,4  1,321 1,1335   n X nY 10 14 Interpretación. Un intervalo de confianza unilateral del 90% para la diferencia real entre los salarios promedio es de U$ 230,05, es decir, en el 90% de las muestras posibles, el verdadero valor de la media poblacional será mayor o igual a U$230,05. 4.- Intervalos de confianza para 2 cuando se muestrea una distribución normal con media desconocida Sea X1,...,Xn una ma(n) de una distribución normal, es decir: X ~ N[µ , El intervalo de 2 ]. Dado:   0,1 100  1   % de confianza para  2 , resulta ser: Pa  W  b  1   Es decir:  n  1  s 2 n  1  s 2   1   P  2    b a   Para que el intervalo sea de longitud mínima: 2 n  1 a   tabla y 2 n  1 b   tabla Observaciones: n  1 s 2 1) La probabilidad de que el intervalo aleatorio: valor de la media µ es 2) b a n  1 s 2 b contenga el verdadero 1 Reemplazando la variable aleatoria s2 por su realización calculada a partir de los datos de la ma(n), un intervalo del 100  1   % para  2 , resulta ser  n  1  s 2 n  1  s 2  I  2 ;1   ;  b a   Profesor : Raúl Ruiz Zamorano Página 10 de 15 Intervalos de Confianza n  1 s 2 Donde: b y n  1 s 2 a reciben el nombre de límites de confianza inferior y superior respectivamente. 3) La longitud del intervalo de confianza, resulta ser:   1 1 long I  2 ;1  n  1  s 2     a b Ejemplo; un proceso produce cierta clase de cojinetes de bola cuyo diámetro interior es de 3 cm. Se seleccionan, en forma aleatoria, 12 de estos cojinetes y se miden sus diámetros internos, que resultan ser: 3,01; 3,05; 2,99; 3,00; 3,02; 2,99; 2,97; 2,97; 3,02 y 3,01. Suponiendo que el diámetro es una variable aleatoria normalmente distribuida, determinar un intervalo de confianza del 99% para la varianza 2. Solución: A partir de los datos muestrales se pueden calcular las cantidades siguientes: n  12  los grados de libertad son n - 1  11 s 2  0,0005455 2 2 11  2,60 ; b   tabla 11  26,75 a   tabla 1) El intervalo de confianza del 99%, está dado por:  n  1  s 2 n  1  s 2  I  2 ;99%   ;  b a   Al sustituir los resultados numéricos, se obtiene:  11  0,0005455 11  0,0005455  I 2 ;99%   ;   0,0002246;0,0023079 26,71 2,6   Profesor : Raúl Ruiz Zamorano Página 11 de 15 Intervalos de Confianza 5.- Intervalo de confianza para el cociente de dos varianzas cuando se muestrean dos distribuciones normales independientes En el medio industrial muchas veces surge la necesidad de medir y comparar las variabilidades de dos procesos distintos. Supóngase que se tienen m.a de dos distribuciones normales con medias y varianzas desconocidas. 2 2 Sea nx y ny, el tamaño de las muestras y s X y s Y las varianzas muestrales. El intervalo de 100  1   % de confianza, tal que:   s X2   2   X P a  2  b   1   sY   2    Y   2 2   s  P a  X2  Y2  b   1     sY  X   2 2  s  s2  P a  Y2  Y2  b  Y2   1    sX  X s X   De ésta forma un intervalo de 100  1   % de confianza para I 2 Y  X2 ;1  Y2  X2 está dado por:  s2 s2   a  Y2 ; b  Y2  s X   s X Donde: a 1 ; b  f tabla n X  1; nY  1 f tabla nY  1; n X  1 Ejemplo (ver datos del ejemplo de recién graduados). Se desea un intervalo de confianza del 90%  Y2 2 para  X Profesor : Raúl Ruiz Zamorano Página 12 de 15 Intervalos de Confianza Solución A partir de los datos muestrales se puede calcular las siguientes cantidades: n A  10 s 2A a n B  14  1.187.222,22 1 f tabla 9;13  s B2  1.352.307,69 1 f tabla 9;12  1  0,3257 ; con 90% de confianza 3,07 b  f tabla 13;9  2,71 ; con 90% de confianza  Y2 2 Un intervalo de 90% de confianza para  X está dado por: I 2 Y  X2 ;1  s2 s2   a  Y2 ; b  Y2  s X   s X Al sustituir los resultados numéricos, se obtiene: I 2 Y  X2 ;0,90  1.352.307,69 1.352.307,69   0,3257  ; 2,71   0,3710 ; 3,0868 1.187.222,22 1.187.222,22   Interpretación. Un intervalo de confianza del 90% para el cociente de varianzas real entre los salarios es de [ 0,3736; 3,0868 ], es decir, en el 90% de las muestras posibles, el verdadero valor del cociente entre las varianzas poblacionales será de 0,3710 hasta 3,0868. 6.- Intervalo de confianza para el parámetro de proporción P cuando se muestrea una distribución binomial El porcentaje de productos defectuosos de un proceso de manufactura es el barómetro más importante para medir la calidad del proceso para manufacturar un producto dado. Ya que un artículo puede estar defectuoso o no, el número de unidades defectuosas es una variable aleatoria binomial, si se supone una probabilidad constante e independiente. En una ma(n) el parámetro P que representa la proporción de artículos defectuosos es desconocido. Determinar un intervalo de confianza para P, basado en una muestra grande. Sea X1,...,Xn una ma(n) de una distribución binomial, es decir: X ~ b(n ; P). Dado: Profesor : Raúl Ruiz Zamorano   0,1 Página 13 de 15 Intervalos de Confianza El intervalo de 100  1   % de confianza para P, y por simetría de la distribución normal, resulta ser: P ztabla  Z  ztabla   1   Reemplazando Z y realizando algunas manipulaciones algebraicas, se obtiene:  P pˆ  ztabla    pˆ  1  pˆ   P  pˆ  ztabla  n pˆ  1  pˆ    1  n  o bien:  I P;1   pˆ  ztabla   pˆ  1  pˆ  ; pˆ  ztabla  n pˆ  1  pˆ    n  Ejemplo: Un fabricante asegura, a una compañía que le compra un producto en forma regular, que el porcentaje de productos defectuosos no es mayor del 5 %. La compañía decide comprobar la afirmación del fabricante seleccionado, de su inventario, 200 unidades de este producto y probándolos. ¿Deberá sospechar la compañía de la afirmación del fabricante si se descubre un total de 19 unidades defectuosas en la muestra? Solución La sospecha estará apoyada si existe un intervalo de confiabilidad alta para el cual la proporción P se encuentra completamente a la derecha del valor asegurado 0,05. Tomemos una confiabilidad de un 95%. Como la realización de la variable aleatoria X de x = 19 y n = 200, el estimado de P es pˆ  19  0,095 200 Luego el intervalo aleatorio, resulta ser:  pˆ  1  pˆ  pˆ  1  pˆ   I P;95%   pˆ  z tabla  ; pˆ  z tabla   n n    0,095  1  0,095 0,095  1  0,095  I P;95%  0,095  1,96  ; 0,095  1,96    0,05436 ; 0,1356 200 200   Aparentemente existe una razón para sospechar de la afirmación del fabricante, ya que el intervalo de confianza se encuentra completamente a la derecha del valor asegurado. Observaciones: Profesor : Raúl Ruiz Zamorano Página 14 de 15 Intervalos de Confianza 1) Los métodos presentados deben usarse sólo cuando el tamaño de la muestra es suficientemente grande. De otro modo deberán emplearse los intervalos de confianza exactos. La distribución t de Student sigue siendo válida para inferencias con respecto a las medias, aun a pesar de que se haga un muestreo una distribución que no es normal, el efecto que se tiene por una violación t de Student, parece ser pequeño, aun para un tamaño n relativamente modesto. 2) Para estimar un intervalo de confianza para la diferencia de medias con varianzas desconocidas y distintas cuando se haga un muestreo una población normal, se utiliza la variable aleatoria pivotal: T X  Y   X  Y  s X2 s2  Y n X nY que tiene una distribución t de Student con v grados de libertad, donde: v  s X2 s2   Y   n X nY  2 2 2  s X2   s2  1 1  Y      n n  1 n n  X   Y  X Y 1 2 Texto basado en apuntes “Manual de Estadística” del Profesor Juan Zambrano Challapa. Profesor : Raúl Ruiz Zamorano Página 15 de 15

01 Intervalos de Confianza - Guia

Documentos relacionados

Productos

Apoyo

01 Intervalos de Confianza - Guia

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib