Tema 3. Estimación por intervalos de confianza.

Anuncio
Intervalos de confianza
Estadística aplicada a la empresa II
Prof. D. Juan José Pérez Castejón
1
INTERVALOS DE CONFIANZA.
La técnica estadística de estimación por intervalos de confianza
surge frente a la de estimación puntual. Esta última no puede ser
considerada un técnica inductiva en el sentido pleno de ese término
pues sus resultados no son acompañados de medidas que
cuantifiquen su grado de fiabilidad.
En cualquier ciencia, cuando se estima que una magnitud vale
co con un error máximo de eo unidades, una forma de indicar tal
cosa es señalar que esa magnitud se encuentra en el intervalo (c0–
e0 , c0+e0). La Estadística adopta ese mismo formato pero al error
máximo e0 solo está en condiciones de asegurarle un cierto grado
de fiabilidad, por lo que el intervalo anterior debe ir acompañado de
una medida de ella.
La combinación de los dos elementos señalados en el párrafo
anterior es lo que se conoce como una estimación estadística por
intervalo de confianza.
Definición de intervalo de confianza y de otros elementos
relacionados.
Examinemos el siguiente ejemplo:
Ejemplo 1: La compañía Manufacturas Textiles quiere disminuir el tiempo que
sus obreros tardan en confeccionar una pieza. Con ese fin decide probar una
nueva maquinaria con 18 de ellos seleccionados aleatoriamente. Tras
aleccionarlos convenientemente en su uso, les hace a cada uno emplearla para
elaborar una pieza. El tiempo que en ello consumen se muestra en la tabla. Se
admite que la dispersión de lo que tarda cada trabajador en la tarea no es
alterada por la nueva maquinaria. En particular, la desviación típica de esa
variable se mantiene en el nivel de 5.5 minutos en el que se encontraba
establecida. Se pretende realizar una estimación por intervalo, del tiempo
medio que consumen los trabajadores con la nueva maquinaria. La variable se
puede considerar distribuida normalmente.
Minutos consumidos por cada trabajador
81.2
74.4
79.5
75.7
71.9
81.6
Prof. D. Juan José Pérez Castejón
72.1
74.1
73.5
74.4
2
69.9
77.4
63.6
66.8
65.4
70.4
74.6
69.3
En la situación que acabamos de describir, la característica de
interés X en la población analizada –el tiempo que un obrero tarda
en confeccionar una pieza empleando la nueva maquinaria– sigue
una distribución N(µ,σ2=5.52). La atención se centra en el único
parámetro desconocido µ=E(X). Para aumentar inductivamente la
información que se dispone sobre él, se ha decidido realizar su
estimación por intervalo. Para ello, se dispone de una m.a.s.
X1,...,Xn con n=18 y los Xi~N(µ,5.52) independientes entre sí.
El único resultado inductivo que hasta ahora sabemos obtener
acerca del parámetro µ es su estimación puntual, estimación que
por la razón comentada en la introducción no nos satisface
plenamente. Para poblaciones normales, el estimador eficiente de µ
es la media muestral
18
∑X
X=
i=1
i
18
= 73.1
Olvidándonos de su realización concreta en esta muestra, ese
estadístico tiene un comportamiento estocástico conocido sobre el
que podemos realizar la siguientes afirmaciones:
σ 2 5 .5 2
X−µ
X ~ N(µ,
=
= 1.296 2 ) ⇒ Z ≡
~ N(0,1) ⇒
1.296
n
18
⇒ P( −1.96 < Z =
X−µ
< 1.96) = 0.95
1.296
Si consideremos las desigualdades que definen ese suceso y la
siguiente transformación algebraica de equivalencia de ellas:
− 1.96 <
X−µ
< 1.96 ⇔ X − 2.54 < µ < X + 2.54
1.296
tendremos que se cumple la igualdad:
Pµ ( X − 2.54 < µ < X + 2.54) = P( −1.96 < Z < 1.96) = 95%
Prof. D. Juan José Pérez Castejón
3
Como consecuencia de
( X − 2.54 , X + 2.54) cumplirá:
todo
lo
anterior,
el
intervalo
− que es un intervalo aleatorio de la recta real.
− que tiene una probabilidad del 95% de contener a µ.
Por otro lado, (73.1–2.54,73.1+2.54)=(70.56,75.64)
realización muestral y cumple:
es
su
− no sabemos si contiene a µ.
− podemos cifrar en un 95% la confianza en que sea una de
las realizaciones del intervalo aleatorio que sí la contienen.
Es por ello la estimación en forma de intervalo de confianza para µ
buscada.
Este ejemplo nos sugiere ya los dos conceptos básicos
asociados con la técnica de estimación por intervalo de confianza.
Para definirlos formalmente, establezcamos las HIPÓTESIS
GENERALES bajo las que realizaremos este tipo de inducción:
• La distribución de la variable X estudiada en la población de
interés ha sido especificada a excepción de unos
determinados parámetros desconocidos π, X~fπ(x).
• Se desea realizar inducción sobre π, en particular, se pretende
realizar una estimación por intervalo de confianza de cierta
función suya h(π).
• Se dispone de una muestra X1,...,Xn (no necesariamente
aleatoria) de la población, Xi~fπ(x).
En esas circunstancias estamos en condiciones de efectuar las
dos definiciones siguientes:
Definición: Dados dos estadísticos muestrales S(X1,...,Xn) y
T(X1,...,Xn), diremos que el intervalo aleatorio (S,T) es un intervalo
aleatorio para h(π) de probabilidad c si Pπ(S<h(π)<T)=c para todo
valor de π posible.
Definición: Sea un intervalo (S,T) como el de la definición anterior.
Sea x1,...,xn una realización de la muestra. Denominaremos
intervalo de confianza de nivel c a su realización muestral
correspondiente, (S(x1,...,xn)=s,T(x1,...,xn)=t).
Prof. D. Juan José Pérez Castejón
4
El intervalo de confianza definido en último lugar, será la estimación
buscada para h(π).
PRECISIONES.
Es necesario resaltar algunos hechos explícita o implícitamente
señalados en las definiciones anteriores:
• h(π) es una cantidad unidimensional. La estimación conjunta
de confianza de varias cantidades exige definiciones específicas
de las que vamos a comentar algo pero muy por encima. Por otro
lado, el requerimiento no afecta al parámetro poblacional π, que sí
que puede estar compuesto de más de una componente.
Si la cantidad a estimar h(π)=(h1(π),...hr(π)) tiene dimensión r>1,
entonces, la definición anterior debería ser extendida para
permitir la posibilidad de que el conjunto donde confiemos que
esté la cantidad desconocida sea una región de Rj que contenga
de manera conjunta a los j valores desconocidos. Sólo
indicaremos que lo que se hace en ese caso es hablar de
regiones aleatorias S(X1,...,Xn)⊆Rr. De una región aleatoria como
esa se dice que es de probabilidad c para h(π) si Pπ(h(π)∈S)=c
para todo valor de π. Una realización muestral suya S(x1,...,xn) se
conoce como una región de confianza c para h(π).
• Para que la realización del intervalo aleatorio (S,T) de lugar a
un intervalo de confianza que podamos situar con exactitud en la
recta real, es necesario que las expresiones de S y T no vengan
dadas en función de ninguna cantidad desconocida, en particular,
han de ser independientes de π.
• La igualdad Pπ(S<h(π)<T)=c debe cumplirse para todo valor
de π posible pues esta es la única forma de que después, una vez
obtenida la estimación por intervalo de confianza, en ella
podamos depositar la confianza c que se ha señalado.
• Dos criterios se oponen a la hora de seleccionar c. Por un
lado el deseo de poder depositar la mayor fiabilidad posible en la
estimación. Por el otro, el deseo de obtener una estimación lo
más precisa posible, precisión que viene dada por la longitud del
intervalo T-S y que disminuye al aumentar c.
• Es posible hallar otros tipos de conjuntos de confianza en la
recta real, diferentes de los intervalos, para una cantidad
Prof. D. Juan José Pérez Castejón
5
unidimensional.
Métodos de construcción de intervalos de confianza. El método
pivotal.
El método práctico más útil para construir intervalos de
confianza es el método pivotal o método del pivote. Su aplicación
procede en cuatro etapas que coinciden con las que se han seguido
al resolver el Ejemplo 1.
Etapa 1: Hallar el estadístico pivotal o estadístico pivote,
Vπ(X1,...,Xn). Este estadístico se debe caracterizar por el hecho de
que su distribución de probabilidad esté libre de parámetros
desconocidos, en particular, no puede depender de π.
Etapa 2: Seleccionar dos percentiles de Vπ, q1 y q2, tales que
P(q1<Vπ<q2)=c. La propiedad que caracteriza a Vπ asegura que esos
percentiles también serán constantes conocidas independientes de
π.
Etapa 3: ‘Pivotar’ sobre las desigualdades q1<Vπ<q2 para llegar a
otras equivalentes S(X1,...,Xn)<h(π)<T(X1,...,Xn) que tengan la forma
de intervalo aleatorio para h(π). El proceso debe ser tal que S y T no
dependan de π y que las desigualdades finales sean equivalentes a
las
iniciales.
En
ese
caso,
se
tendrá
que
Pπ(S<h(π)<T)=P(q1<Vπ<q2)=c por lo que el intervalo (S,T) será un
intervalo aleatorio de probabilidad c para h(π).
Etapa 4: Una vez observada la muestra, X1=x1,...,Xn=xn, el intervalo
(s,t) donde S(x1,...,xn)=s y T(x1,...,xn)=t es un intervalo de confianza
de nivel c para h(π).
A lo largo de las etapas que componen el método pivotal, la
aplicación de algunos pasos hace surgir algunas dudas cuya
aclaración requiere ampliar los comentarios que se han hecho.
Veámoslas.
• ¿Es siempre posible hallar un estadístico pivotal?. Y en todo
caso, ¿cómo proceder a su búsqueda?.
Prof. D. Juan José Pérez Castejón
6
Para proceder a buscar el estadístico pivote se puede tomar
como punto de partida, un estimador de π, por ejemplo, el estimador
máximo–verosímil. Por supuesto, en ese estadístico serán
necesarias las transformaciones pertinentes que lo conviertan en un
estadístico pivotal válido –con distribución independiente de π–.
Incluso como inicio de esa misma búsqueda se puede escoger un
estadístico suficiente para π.
• Si ya se dispone de un estadístico pivotal, ¿el proceso de
pivotar es siempre factible?
Se puede demostrar que si Vπ(x1,...,xn) –la función determinista
a partir de la que se define el estadístico pivotal– y la cantidad que
se desea estimar h(π) tienen ambas un comportamiento
monónotono como funciones de π –que aquí supondremos
unidimensional–, el proceso de pivotar está, teóricamente al menos,
asegurado. De no cumplirse ea condición, tal vez se pueda aún
pivotar aunque quizá ocurra que no se llegue a un conjunto
aleatorio de R que tenga forma de intervalo.
• ¿Es posible siempre usar el nivel de confianza c deseado?.
La clave para poder hacerlo radica en encontrar los percentiles
qi adecuados. Obviamente ello va ser siempre posible si la
distribución de Vπ es de tipo continuo, aunque no está asegurado
que existan en el caso discreto. Caso de no poder hallar los
percentiles que precisemos, tomaremos como norma de conducta
escoger aquellos que den el nivel de confianza superior más
cercano posible al inicialmente buscado.
• Caso de existir los qi para un valor de c determinado, ¿son
siempre únicos?. Si no lo son ¿hay algún criterio para
seleccionar los más adecuados?.
Es obvio que de existir, los qi no tiene porqué ser únicos. De
hecho, en el caso de estadísticos pivotales de tipo continuo, la no
unicidad está asegurada.
De no ser únicos, sí que existe un criterio válido para
seleccionarlos. Tal criterio requiere volver a considerar el aspecto
de la precisión en la estimación, precisión que viene dada por T–S.
Parece adecuado que empleemos aquellos qi que provoquen la
menor imprecisión en la estimación. Se trataría de escoger los que
Prof. D. Juan José Pérez Castejón
7
resuelvan el siguiente problema:
Min: T(X1,...,Xn)–S(X1,...,Xn)
s.a.: P(q1<Vπ<q2) = c
En el caso del Ejemplo 1, la forma de S y T para los distintos qi
posibles sería S = X − 1.296q 2 y T = X − 1.296q1, por lo que el
problema de minimización anterior quedaría convenientemente
expresado de la forma siguiente:
Min: T – S = 1.296 (q2–q1)
s.a.: P(q1<N(0,1)<q2) = 0.95
Su resolución mediante su correspondiente función lagrangiana

 q 1 − 1 x2
2

2
L(q1, q 2 , λ ) = 1.296(q 2 − q1 ) − λ ∫q
e
dx − 0.95 

 1 2π


es bastante sencilla y lleva a los dos percentiles simétricos que ya
se comentaron: z(1-0.95)/2 y z(1+0.95)/2=–z(1-0.95)/2. La notación que se ha
utilizado para esos percentiles es la habitual en inferencia. Con la
letra z se denotan los percentiles de una N(0,1) y con el subíndice,
se hace referencia a la probabilidad que dejan a su derecha, esto
es, zk indica un número tal que P(N(0,1)≤zk)=1–k.
Hay que advertir que el problema anterior no siempre
encuentra una solución tan sencilla, y que, a veces, tal solución ni
siquiera existe. Por ello, con frecuencia se trabaja con valores de
los percentiles que únicamente son aproximaciones de los
verdaderos valores óptimos.
Conviene cerrar las referencias al método pivotal con un nuevo
ejemplo de cómo se aplica. Su examen nos servirá incluso para
insistir en algunos aspectos comentados en relación a las
definiciones fundamentales de este tema. El nuevo ejemplo consiste
en una revisión del análisis dado al Ejemplo 1 anterior.
Ejemplo 1 (continuación): Como resulta difícilmente creíble, eliminemos la
hipótesis de que la dispersión en el tiempo consumido por los trabajadores
empleando la nueva maquinaria, no se modifica. ¿Cómo obtener en ese caso
una estimación por intervalo de µ?
Ahora la variable X sigue una distribución N(µ,σ2). El parámetro
desconocido es π=(µ,σ) y la cantidad a estimar es h(π)=µ.
Prof. D. Juan José Pérez Castejón
8
Aunque el resultado Z ≡ X − µ (σ n ) ~ N(0,1) sigue siendo
válido, deja de ser útil para realizar inducción pues la cantidad
desconocida σ que aparece en su denominador genera intervalos
inadecuados en los que sus extremos S y T dependen de esa
cantidad no conocida.
De temas anteriores, sabemos que el estadístico que se
obtiene sustituyendo σ en la expresión de Z por su estimador
muestral SX cumple que:
X−µ
SX
n −1
~ t n−1
Su posible papel como nuevo estadístico pivotal se ve confirmado
por el hecho de que resulta inmediato pivotar con él, generando el
siguiente intervalo aleatorio:
SX 
SX

, X − q1
 X − q2

n −1
n −1

En esa expresión, aún queda pendiente la selección de los qi.
Según lo ya comentado, esos dos percentiles se pueden escoger
iguales a los que resuelvan el siguiente problema de minimización:
SX
Min: (q2 − q1 )
n −1
s.a.: P(q1 < t n−1 < q 2 ) = c
Su resolución es análoga a la del problema de minimización ya
examinado en el análisis inicial del Ejemplo 1, dando lugar a los
valores q2 = tn-1,(1-c)/2 y q1= tn–1,(1+c)/2 = – tn-1,(1-c)/2= – q2. En esas dos
igualdades, hemos usado el convenio notacional por el que tn,k
representaría la cantidad tal que P(tn≤ tn,k)=1–k.
Finalmente, emplearemos los datos muestrales para sustituirlos
en las fórmulas obtenidas. Seleccionando dos niveles de confianza
adecuados, c=95% y c=99%, se obtiene las siguientes estimaciones
en minutos para µ.
Con una confianza del 95%, µ está entre 70.51 m. y 75.69 m.
Con una confianza del 99%, µ está entre 69.54 m. y 76.66 m.
Comparando los resultados conseguidos bajo uno y otro
planteamiento del Ejemplo 1, aún es posible derivar interesantes
Prof. D. Juan José Pérez Castejón
9
conclusiones adicionales. Las expresiones de los intervalos a las
que se ha llegado, según que se suponga σ conocida o no, son:
σ
σ 

, X + z (1−c ) 2
 X − z (1−c ) 2

n
n

SX
SX 

, X + t n−1,(1−c ) 2
σ desconocida:  X − t n−1,(1−c ) 2

n −1
n − 1

σ conocida:
De su examen y comparación se deduce que:
• La forma general estimación puntual ± error máximo,
anunciada para los intervalos, se confirma como la que
normalmente estos adoptan.
• Siempre se debe tener presente que el nivel de confianza
señala la fiabilidad que se puede depositar en que realmente
ese sea el error máximo cometido.
• El error máximo que se confía haber cometido aumenta con la
fiabilidad que queramos darle y con la varianza de la
estimación puntual.
• La necesidad de estimar el error debido a la presencia de
parámetros ‘molestos’ desconocidos provoca menor precisión.
• Como intuitivamente se puede prever, mayor tamaño muestral
y el consiguiente aumento en la cantidad de información
disponible, provoca estimaciones estadísticas mas precisas.
Intervalos de confianza asintóticos.
Usando combinadamente el método pivotal y resultados
asintóticos, se obtienen intervalos que son asintóticamente válidos.
Esto significa que su nivel de confianza es solo aproximado y que
tal aproximación es aceptable únicamente si la muestra es lo
bastante grande. Por ello siempre es preferible usar un resultado en
muestra finita si es posible.
Revisaremos dos casos concretos donde se presenta la
posibilidad de usar combinadamente los dos elementos citados. Por
supuesto, existen otras situaciones en las que un desarrollo análogo
puede ser aplicado:
• Estimación por intervalo de E(X) mediante X dada una
especificación paramétrica cualquiera de la distribución de la
población, e incluso, sin ninguna especificación concreta para ella.
• Estimación por intervalo de π –unidimensional– mediante su
Prof. D. Juan José Pérez Castejón
10
estimación máximo–verosímil π̂.
Los resultados asintóticos a usar en cada una de esas dos
opciones son, respectivamente:
d
• X ≈ N( µ , varπ ( X)) .
d
• πˆ ≈ N( π, cotaCR( π))
De ellos se derivan los siguientes estadísticos pivotales de validez
asintótica:
X−µ
•Z≡
d
varπ ( X)
≈ N(0,1)
d
πˆ − π
≈ N(0,1)
cotaCR( π)
•Z≡
En principio, el método pivotal debe utilizarse con esos estadísticos,
de la forma como se empleó con el estadístico Z del Ejemplo 1.
Sin embargo, la dependencia respecto de π que presentan los
denominadores de ambos estadísticos puede complicar el proceso
de pivotar. Si así ocurriera, las propiedades de la convergencia en
ley permiten sustituir ambos denominadores por una estimación
consistente suya. A su vez, las propiedades de la convergencia en
probabilidad permiten que tal estimación se pueda hallar
sustituyendo en las expresiones función de π de ambas cantidades,
ese parámetro desconocido por alguna de sus estimaciones que
sea consistente, por ejemplo, la propia estimación máximo–
verosímil. Todo ello, daría lugar a los siguientes estadísticos pivotes
asintóticos alternativos:
X−µ
•Z≡
vârπ ( X)
=
πˆ − π
•Z≡
cot̂ aCR( π)
X−µ
varπˆ ( X)
=
d
≈ N(0,1)
d
πˆ − π
≈ N(0,1)
cot aCR( πˆ )
Empleándolos, se obtienen los siguientes intervalos aleatorios para
E(X) y π respectivamente:
•
•
(X − z
(πˆ − z
(1−c ) 2
(1−c ) 2
vârπ ( X) , X + z (1−c ) 2 vârπ ( X)
)
cot̂ aCR( π) , πˆ + z (1−c ) 2 cot̂ aCR( π)
Prof. D. Juan José Pérez Castejón
11
)
Una última dificultad puede surgir al aplicar todo lo comentado.
Se presentaría en el caso de que expresiones analíticas como
funciones de π de la varianza de la media muestral o de la cota CR
no fueran factibles. Pero tampoco en esas circunstancias se cierra
la posibilidad de disponer de estimadores asintóticos adecuados
para esas dos cantidades. Por ser el caso de más sencilla
resolución y uno de los que más frecuente se presentan, citaremos
lo que se hace en la primera de esas dos situaciones, la de la
estimación de E(X). Ahí, la falta de la expresión analítica se puede
dar, por ejemplo, si se pretende una estimación de esa media sin
ninguna hipótesis paramétrica previa acerca de la distribución de X.
Es por tanto una situación de inferencia de tipo no paramétrico, la
única de ese tipo que citaremos dentro del ámbito de la estimación
por intervalo. Para resolverla, se usa una estimación consistente de
la varianza de la media muestral que no esté basada en la
expresión analítica de la que se carece. Tal estimación, por lo que
sabemos de temas anteriores, se puede conseguir en este caso a
través de la varianza muestral si la muestra es aleatoria simple:
• vârπ ( X) = S 2X n
Finalicemos este apartado aplicando el método revisado a un
ejemplo:
Ejemplo 2: La compañía NPC ha decidido mejorar la calidad de fabricación de
uno de sus principales productos, un componente electrónico. Quiere empezar
por estudiar la fiabilidad de los que fabrica actualmente. Con ese fin, selecciona
aleatoriamente 60 de ellos y mide el tiempo de funcionamiento continuo que
cada uno soporta. Esa variable, medida en días, arroja los resultados indicados
en la tabla. Su comportamiento aleatorio sigue una distribución e(1/λ). Se
pretende una estimación por intervalo para la esperanza de vida de los
componentes.
Tiempo de vida de los componentes (medido en días)
339.0
68.1
21.6
386.7
319.6
224.2 283.6 557.1 800.0 86.3 329.3 534.2 142.6 221.4 162.0 826.5
275.2 211.5 101.6 168.0 69.2 446.3 611.7
8.6 20.6 72.5 23.0
125.2 59.5 330.7 182.2 244.4 12.8 204.8 60.7 62.5 136.8 147.1
75.6 44.8 459.9 121.6 223.5 122.8 36.2 24.6 22.5 56.7 19.7
152.1 511.6 227.6 34.6
3.1 30.6 91.8 935.4 402.6 65.0 12.6
En la nueva situación planteada, X~e(1/λ), población que
cumple que λ=E(X). En consecuencia, con el fin de la estimación
que se persigue, cualquiera de los dos métodos asintóticos
comentados
es
adecuado.
Aún
más,
como
Prof. D. Juan José Pérez Castejón
12
X = λˆ y varλ ( X) = λ2 n = cotaCR(λ ), resulta que ambos métodos son
equivalentes pues los estadísticos pivotales correspondientes
coinciden:
X−λ
X−λ d
λˆ − λ
Z≡
=
=
≈ N(0,1)
cota
CR
(
)
n
λ
λ
varλ ( X)
La dependencia respecto de λ que el denominador de ese
estadístico presenta, aconseja su sustitución –en este caso,
simplemente para poder pivotar mejor– por su estimación máximo–
verosímil:
λˆ − λ
X−λ d
X−λ
=
=
≈ N(0,1)
Z≡
ˆ
X
n
varλˆ ( X)
cotaCR(λ )
El intervalo aleatorio de probabilidad c para λ que se obtiene a partir
de él, tiene la siguiente expresión:

X
X 
 X − z (1−c ) 2

, X + z (1−c ) 2
n
n 

Finalmente, los resultados muestrales nos permiten hacer las
siguientes estimaciones a tres niveles de confianza diferentes, para
la esperanza de vida de los componentes estudiados:
Con una confianza del 90%, λ está entre 164.9 y 253.5 días.
Con una confianza del 95%, λ está entre 156.3 y 262.1 días.
Con una confianza del 99%, λ está entre 139.5 y 278.9 días.
Intervalos de confianza en poblaciones normales.
Vamos a revisar ahora la expresión y obtención, de los
principales intervalos de confianza para poblaciones normales.
Supondremos pues, a partir de ahora, que la v.a. X analizada es
normal. Para simplificar, añadiremos la hipótesis de que la muestra
obtenida de ella, es una m.a.s. Los distintos intervalos que iremos
presentando se organizarán según las diferentes situaciones
inferenciales que se pueden presentar en este tipo de poblaciones,
que coinciden con las que se distinguían cuando analizábamos los
más importantes resultados muestrales para poblaciones normales
en el tema dedicado a inferencia y estadísticos. De hecho, bajo
cada uno de los diferentes epígrafes iremos haciendo uso de los
correspondientes resultados que allí se expusieron.
Prof. D. Juan José Pérez Castejón
13
INTERVALO PARA µ SIENDO σ CONOCIDA.
Cuando se desea hace la estimación por intervalo de µ, y σ es
una cantidad conocida, a partir del siguiente resultado,
Z = ( X − µ ) /( σ / n ) ~ N(0,1) , se puede deducir que Z quizá haga el
papel de estadístico pivote. Efectivamente, pivotar con él es sencillo
y los qi que llevan al intervalo de longitud mínima para un
determinado nivel de confianza c son z(1-c)/2 y z(1+c)/2=–z(1-c)/2. De
hecho esta situación fue la que se abordó con el primer enfoque
que se dio al Ejemplo 1. Recuérdese que el intervalo de confianza
σ
σ 

final obtenido fue  X − z (1−c ) 2
, X + z (1−c ) 2
.
n
n

INTERVALO PARA µ SIENDO σ DESCONOCIDA.
X−µ
~ t n −1 y de ahí
S / n −1
podemos derivar el estadístico pivote T. Como esta situación es a la
que nos enfrentamos en el segundo enfoque que dimos al Ejemplo
1, no hace falta repetir todo el desarrollo que lleva a la siguiente
expresión final para el correspondiente intervalo de amplitud mínima
S
S 

, X + t n −1,(1− c ) 2
para µ y de nivel c:  X − t n −1,(1− c ) 2
.
n −1
n − 1

En este caso, sabemos que T =
INTERVALO PARA σ SIENDO µ CONOCIDA.
Cuando se desea hace la estimación por intervalo de σ o σ2
siendo la media µ una cantidad conocida, el siguiente resultado,
T=Σ(Xi–µ)2/σ2~χ2n, aporta un estadístico pivote adecuado.
Efectivamente, encontrados los qi tales que P(q1<T~χ2n<q2)=c,
pivotar sobre las desigualdades en q1<T<q2 es muy sencillo y lleva
al intervalo aleatorio (Σ(Xi–µ)2/q2)<σ2<(Σ(Xi–µ)2/q1) para σ2, y a este
otro, (Σ(Xi–µ)2/q2)½<σ<(Σ(Xi–µ)2/q1)½, para σ.
Escoger dos valores para los qi válidos es bastante sencillo
pues la distribución χ2n está tabulada. Más difícil resulta escogerlos
de manera óptima, esto es, que minimicen la longitud del intervalo
aleatorio final. De hecho, ese problema tiene una solución que varía
con n y también precisa una tabla propia de tabulación. Por todo
ello, y para simplificar, lo que habitualmente se hace es tomar la
Prof. D. Juan José Pérez Castejón
14
siguiente aproximación a sus valores óptimos: q2=χ2n,(1–c)/2 y
q1=χ2n,(1+c)/2. Siguiendo con el convenio notacional antes acordado,
χ2n,k representa la cantidad tal que que P(χ2n≤χ2n,k)=1–k. Nótese que
mientras que en los dos casos anteriores, los percentiles escogidos
eran percentiles simétricos y a dos colas iguales (la cola de
probabilidad de la izquierda del menor y la de la derecha del mayor
valían lo mismo), ahora, sin embargo, aunque las colas siguen
siendo iguales, la simetría desaparece.
INTERVALO PARA σ SIENDO µ DESCONOCIDA.
Ya se comentó en el tema anterior que, en esta situación, el
resultado que afirma que nS2/σ2~χ2n–1, sería el empleado para hacer
inferencia. Efectivamente, en relación con los intervalos de
confianza para σ o σ2, es el que aporta el estadístico pivote.
Procediendo como en al apartado anterior, se llega al siguiente
intervalo aleatorio de nivel c para σ2: (nS2/q2)<σ2<(nS2/q1), donde
q2=χ2n–1,(1–c)/2 y q1=χ2n–1,(1+c)/2. El intervalo para σ es muy fácil de
obtener a partir de ese otro. Hay que señalar también que tampoco
en este caso la selección de los qi es la óptima, sino solo una
aproximación a ella.
INTERVALO PARA LA DIFERENCIA DE MEDIAS SIENDO LAS
VARIANZAS CONOCIDAS.
Al comparar las medias µX y µY entre dos poblaciones
normales, lo que se precisa a veces es la estimación por intervalo
de µX–µY. Obtener ese intervalo cuando las varianzas σ2X y σ2Y son
conocidas es bastante sencillo, a partir del resultado que en su
momento se razonó: ( X − Y − (µ X − µ Y )) / (σ 2X / n) + (σ 2Y / m) ~ N(0,1).
La analogía se da hasta en la obtención de los valores óptimos de
los qi. El intervalo sería el que se formaría con los siguientes
extremos: X − Y ± z (1− c ) / 2 (σ 2X / n) + (σ 2Y / m) ~ N(0,1).
INTERVALO PARA LA DIFERENCIA DE MEDIAS SIENDO LAS
VARIANZAS DESCONOCIDAS.
Distinguiremos los dos casos siguientes:
Prof. D. Juan José Pérez Castejón
15
1.– Varianzas desconocidas de las que se sabe que son iguales.
n + m − 2  ( X − Y ) − (µ X − µ Y ) 
,
~t
 n+m−2
2
2
n+m 
nS X + mS Y


el estadístico que aparece en esa expresión es el usado como
pivote aquí. El intervalo aleatorio final que queda tendría los
Al cumplirse que
nm
n + m nS 2X + mS 2Y
.
nm
n+m−2
siguientes extremos: X − Y ± t n + m − 2,(1− c ) / 2
2.– Varianzas desconocidas sin ninguna otra información.
En este caso, como
entero más cercano a
(
(S
( X − Y ) − (µ X − µ Y )
S c2, X / n + S c2, Y / m
2
c, X
S c2, X
n
n −1
n + S c2, Y m
) +(
2
S c2, Y
2
m
)
2
, entonces el intervalo
m −1
S c2,X
S c2,Y
+
es un intervalo
n
m
válido, al menos, aproximadamente. Cuando n y m son ambas
grandes, esa t de Student y sus percentiles se pueden sustituir por
una N(0,1).
con los extremos
X − Y ± t ν,(1−c ) / 2
)
≈ t ν donde ν es el
INTERVALO PARA EL COCIENTE DE VARIANZAS SIENDO LAS
MEDIAS CONOCIDAS.
Como
∑ ( Xi − µ X )2 /(nσ 2X ) ~ F ,
n,m
∑ ( Yi − µ Y )2 /(mσ 2Y )
se obtiene el siguiente
intervalo de confianza para σ2X/σ2Y:
1
1
∑ ( Xi − µ X )2 / n < σ 2X <
Fn,m,(1− c ) / 2 ∑ ( Yi − µ Y )2 / m σ 2Y Fn,m,(1+ c ) / 2
∑ ( Xi − µ X )2 / n
∑ ( Yi − µ Y )2 / m
Sobre la selección de los percentiles de la distribución F habría que
señalar lo mismo que se dijo al estimar por intervalo de confianza la
varianza en el caso de una sola población normal.
Prof. D. Juan José Pérez Castejón
16
INTERVALO PARA EL COCIENTE DE VARIANZAS SIENDO LAS
MEDIAS DESCONOCIDAS.
En este caso, de
nS 2X /((n − 1)σ 2X )
mS 2Y /((m − 1)σ 2Y )
=
S c2, X / σ 2X
S c2, Y / σ 2Y
~ Fn −1,m −1 se
obtiene el siguiente intervalo de confianza para σ2X/σ2Y:
S c2, X σ 2X
S c2, X
1
1
<
<
Fn −1,m −1,(1− c ) / 2 S c2, Y σ 2Y Fn −1,m −1,(1+ c ) / 2 S c2, Y
Aunque hay que tener en cuenta que ese intervalo tampoco es el de
longitud mínima.
Prof. D. Juan José Pérez Castejón
17
Descargar