Intervalos de confianza Estadística aplicada a la empresa II Prof. D. Juan José Pérez Castejón 1 INTERVALOS DE CONFIANZA. La técnica estadística de estimación por intervalos de confianza surge frente a la de estimación puntual. Esta última no puede ser considerada un técnica inductiva en el sentido pleno de ese término pues sus resultados no son acompañados de medidas que cuantifiquen su grado de fiabilidad. En cualquier ciencia, cuando se estima que una magnitud vale co con un error máximo de eo unidades, una forma de indicar tal cosa es señalar que esa magnitud se encuentra en el intervalo (c0– e0 , c0+e0). La Estadística adopta ese mismo formato pero al error máximo e0 solo está en condiciones de asegurarle un cierto grado de fiabilidad, por lo que el intervalo anterior debe ir acompañado de una medida de ella. La combinación de los dos elementos señalados en el párrafo anterior es lo que se conoce como una estimación estadística por intervalo de confianza. Definición de intervalo de confianza y de otros elementos relacionados. Examinemos el siguiente ejemplo: Ejemplo 1: La compañía Manufacturas Textiles quiere disminuir el tiempo que sus obreros tardan en confeccionar una pieza. Con ese fin decide probar una nueva maquinaria con 18 de ellos seleccionados aleatoriamente. Tras aleccionarlos convenientemente en su uso, les hace a cada uno emplearla para elaborar una pieza. El tiempo que en ello consumen se muestra en la tabla. Se admite que la dispersión de lo que tarda cada trabajador en la tarea no es alterada por la nueva maquinaria. En particular, la desviación típica de esa variable se mantiene en el nivel de 5.5 minutos en el que se encontraba establecida. Se pretende realizar una estimación por intervalo, del tiempo medio que consumen los trabajadores con la nueva maquinaria. La variable se puede considerar distribuida normalmente. Minutos consumidos por cada trabajador 81.2 74.4 79.5 75.7 71.9 81.6 Prof. D. Juan José Pérez Castejón 72.1 74.1 73.5 74.4 2 69.9 77.4 63.6 66.8 65.4 70.4 74.6 69.3 En la situación que acabamos de describir, la característica de interés X en la población analizada –el tiempo que un obrero tarda en confeccionar una pieza empleando la nueva maquinaria– sigue una distribución N(µ,σ2=5.52). La atención se centra en el único parámetro desconocido µ=E(X). Para aumentar inductivamente la información que se dispone sobre él, se ha decidido realizar su estimación por intervalo. Para ello, se dispone de una m.a.s. X1,...,Xn con n=18 y los Xi~N(µ,5.52) independientes entre sí. El único resultado inductivo que hasta ahora sabemos obtener acerca del parámetro µ es su estimación puntual, estimación que por la razón comentada en la introducción no nos satisface plenamente. Para poblaciones normales, el estimador eficiente de µ es la media muestral 18 ∑X X= i=1 i 18 = 73.1 Olvidándonos de su realización concreta en esta muestra, ese estadístico tiene un comportamiento estocástico conocido sobre el que podemos realizar la siguientes afirmaciones: σ 2 5 .5 2 X−µ X ~ N(µ, = = 1.296 2 ) ⇒ Z ≡ ~ N(0,1) ⇒ 1.296 n 18 ⇒ P( −1.96 < Z = X−µ < 1.96) = 0.95 1.296 Si consideremos las desigualdades que definen ese suceso y la siguiente transformación algebraica de equivalencia de ellas: − 1.96 < X−µ < 1.96 ⇔ X − 2.54 < µ < X + 2.54 1.296 tendremos que se cumple la igualdad: Pµ ( X − 2.54 < µ < X + 2.54) = P( −1.96 < Z < 1.96) = 95% Prof. D. Juan José Pérez Castejón 3 Como consecuencia de ( X − 2.54 , X + 2.54) cumplirá: todo lo anterior, el intervalo − que es un intervalo aleatorio de la recta real. − que tiene una probabilidad del 95% de contener a µ. Por otro lado, (73.1–2.54,73.1+2.54)=(70.56,75.64) realización muestral y cumple: es su − no sabemos si contiene a µ. − podemos cifrar en un 95% la confianza en que sea una de las realizaciones del intervalo aleatorio que sí la contienen. Es por ello la estimación en forma de intervalo de confianza para µ buscada. Este ejemplo nos sugiere ya los dos conceptos básicos asociados con la técnica de estimación por intervalo de confianza. Para definirlos formalmente, establezcamos las HIPÓTESIS GENERALES bajo las que realizaremos este tipo de inducción: • La distribución de la variable X estudiada en la población de interés ha sido especificada a excepción de unos determinados parámetros desconocidos π, X~fπ(x). • Se desea realizar inducción sobre π, en particular, se pretende realizar una estimación por intervalo de confianza de cierta función suya h(π). • Se dispone de una muestra X1,...,Xn (no necesariamente aleatoria) de la población, Xi~fπ(x). En esas circunstancias estamos en condiciones de efectuar las dos definiciones siguientes: Definición: Dados dos estadísticos muestrales S(X1,...,Xn) y T(X1,...,Xn), diremos que el intervalo aleatorio (S,T) es un intervalo aleatorio para h(π) de probabilidad c si Pπ(S<h(π)<T)=c para todo valor de π posible. Definición: Sea un intervalo (S,T) como el de la definición anterior. Sea x1,...,xn una realización de la muestra. Denominaremos intervalo de confianza de nivel c a su realización muestral correspondiente, (S(x1,...,xn)=s,T(x1,...,xn)=t). Prof. D. Juan José Pérez Castejón 4 El intervalo de confianza definido en último lugar, será la estimación buscada para h(π). PRECISIONES. Es necesario resaltar algunos hechos explícita o implícitamente señalados en las definiciones anteriores: • h(π) es una cantidad unidimensional. La estimación conjunta de confianza de varias cantidades exige definiciones específicas de las que vamos a comentar algo pero muy por encima. Por otro lado, el requerimiento no afecta al parámetro poblacional π, que sí que puede estar compuesto de más de una componente. Si la cantidad a estimar h(π)=(h1(π),...hr(π)) tiene dimensión r>1, entonces, la definición anterior debería ser extendida para permitir la posibilidad de que el conjunto donde confiemos que esté la cantidad desconocida sea una región de Rj que contenga de manera conjunta a los j valores desconocidos. Sólo indicaremos que lo que se hace en ese caso es hablar de regiones aleatorias S(X1,...,Xn)⊆Rr. De una región aleatoria como esa se dice que es de probabilidad c para h(π) si Pπ(h(π)∈S)=c para todo valor de π. Una realización muestral suya S(x1,...,xn) se conoce como una región de confianza c para h(π). • Para que la realización del intervalo aleatorio (S,T) de lugar a un intervalo de confianza que podamos situar con exactitud en la recta real, es necesario que las expresiones de S y T no vengan dadas en función de ninguna cantidad desconocida, en particular, han de ser independientes de π. • La igualdad Pπ(S<h(π)<T)=c debe cumplirse para todo valor de π posible pues esta es la única forma de que después, una vez obtenida la estimación por intervalo de confianza, en ella podamos depositar la confianza c que se ha señalado. • Dos criterios se oponen a la hora de seleccionar c. Por un lado el deseo de poder depositar la mayor fiabilidad posible en la estimación. Por el otro, el deseo de obtener una estimación lo más precisa posible, precisión que viene dada por la longitud del intervalo T-S y que disminuye al aumentar c. • Es posible hallar otros tipos de conjuntos de confianza en la recta real, diferentes de los intervalos, para una cantidad Prof. D. Juan José Pérez Castejón 5 unidimensional. Métodos de construcción de intervalos de confianza. El método pivotal. El método práctico más útil para construir intervalos de confianza es el método pivotal o método del pivote. Su aplicación procede en cuatro etapas que coinciden con las que se han seguido al resolver el Ejemplo 1. Etapa 1: Hallar el estadístico pivotal o estadístico pivote, Vπ(X1,...,Xn). Este estadístico se debe caracterizar por el hecho de que su distribución de probabilidad esté libre de parámetros desconocidos, en particular, no puede depender de π. Etapa 2: Seleccionar dos percentiles de Vπ, q1 y q2, tales que P(q1<Vπ<q2)=c. La propiedad que caracteriza a Vπ asegura que esos percentiles también serán constantes conocidas independientes de π. Etapa 3: ‘Pivotar’ sobre las desigualdades q1<Vπ<q2 para llegar a otras equivalentes S(X1,...,Xn)<h(π)<T(X1,...,Xn) que tengan la forma de intervalo aleatorio para h(π). El proceso debe ser tal que S y T no dependan de π y que las desigualdades finales sean equivalentes a las iniciales. En ese caso, se tendrá que Pπ(S<h(π)<T)=P(q1<Vπ<q2)=c por lo que el intervalo (S,T) será un intervalo aleatorio de probabilidad c para h(π). Etapa 4: Una vez observada la muestra, X1=x1,...,Xn=xn, el intervalo (s,t) donde S(x1,...,xn)=s y T(x1,...,xn)=t es un intervalo de confianza de nivel c para h(π). A lo largo de las etapas que componen el método pivotal, la aplicación de algunos pasos hace surgir algunas dudas cuya aclaración requiere ampliar los comentarios que se han hecho. Veámoslas. • ¿Es siempre posible hallar un estadístico pivotal?. Y en todo caso, ¿cómo proceder a su búsqueda?. Prof. D. Juan José Pérez Castejón 6 Para proceder a buscar el estadístico pivote se puede tomar como punto de partida, un estimador de π, por ejemplo, el estimador máximo–verosímil. Por supuesto, en ese estadístico serán necesarias las transformaciones pertinentes que lo conviertan en un estadístico pivotal válido –con distribución independiente de π–. Incluso como inicio de esa misma búsqueda se puede escoger un estadístico suficiente para π. • Si ya se dispone de un estadístico pivotal, ¿el proceso de pivotar es siempre factible? Se puede demostrar que si Vπ(x1,...,xn) –la función determinista a partir de la que se define el estadístico pivotal– y la cantidad que se desea estimar h(π) tienen ambas un comportamiento monónotono como funciones de π –que aquí supondremos unidimensional–, el proceso de pivotar está, teóricamente al menos, asegurado. De no cumplirse ea condición, tal vez se pueda aún pivotar aunque quizá ocurra que no se llegue a un conjunto aleatorio de R que tenga forma de intervalo. • ¿Es posible siempre usar el nivel de confianza c deseado?. La clave para poder hacerlo radica en encontrar los percentiles qi adecuados. Obviamente ello va ser siempre posible si la distribución de Vπ es de tipo continuo, aunque no está asegurado que existan en el caso discreto. Caso de no poder hallar los percentiles que precisemos, tomaremos como norma de conducta escoger aquellos que den el nivel de confianza superior más cercano posible al inicialmente buscado. • Caso de existir los qi para un valor de c determinado, ¿son siempre únicos?. Si no lo son ¿hay algún criterio para seleccionar los más adecuados?. Es obvio que de existir, los qi no tiene porqué ser únicos. De hecho, en el caso de estadísticos pivotales de tipo continuo, la no unicidad está asegurada. De no ser únicos, sí que existe un criterio válido para seleccionarlos. Tal criterio requiere volver a considerar el aspecto de la precisión en la estimación, precisión que viene dada por T–S. Parece adecuado que empleemos aquellos qi que provoquen la menor imprecisión en la estimación. Se trataría de escoger los que Prof. D. Juan José Pérez Castejón 7 resuelvan el siguiente problema: Min: T(X1,...,Xn)–S(X1,...,Xn) s.a.: P(q1<Vπ<q2) = c En el caso del Ejemplo 1, la forma de S y T para los distintos qi posibles sería S = X − 1.296q 2 y T = X − 1.296q1, por lo que el problema de minimización anterior quedaría convenientemente expresado de la forma siguiente: Min: T – S = 1.296 (q2–q1) s.a.: P(q1<N(0,1)<q2) = 0.95 Su resolución mediante su correspondiente función lagrangiana q 1 − 1 x2 2 2 L(q1, q 2 , λ ) = 1.296(q 2 − q1 ) − λ ∫q e dx − 0.95 1 2π es bastante sencilla y lleva a los dos percentiles simétricos que ya se comentaron: z(1-0.95)/2 y z(1+0.95)/2=–z(1-0.95)/2. La notación que se ha utilizado para esos percentiles es la habitual en inferencia. Con la letra z se denotan los percentiles de una N(0,1) y con el subíndice, se hace referencia a la probabilidad que dejan a su derecha, esto es, zk indica un número tal que P(N(0,1)≤zk)=1–k. Hay que advertir que el problema anterior no siempre encuentra una solución tan sencilla, y que, a veces, tal solución ni siquiera existe. Por ello, con frecuencia se trabaja con valores de los percentiles que únicamente son aproximaciones de los verdaderos valores óptimos. Conviene cerrar las referencias al método pivotal con un nuevo ejemplo de cómo se aplica. Su examen nos servirá incluso para insistir en algunos aspectos comentados en relación a las definiciones fundamentales de este tema. El nuevo ejemplo consiste en una revisión del análisis dado al Ejemplo 1 anterior. Ejemplo 1 (continuación): Como resulta difícilmente creíble, eliminemos la hipótesis de que la dispersión en el tiempo consumido por los trabajadores empleando la nueva maquinaria, no se modifica. ¿Cómo obtener en ese caso una estimación por intervalo de µ? Ahora la variable X sigue una distribución N(µ,σ2). El parámetro desconocido es π=(µ,σ) y la cantidad a estimar es h(π)=µ. Prof. D. Juan José Pérez Castejón 8 Aunque el resultado Z ≡ X − µ (σ n ) ~ N(0,1) sigue siendo válido, deja de ser útil para realizar inducción pues la cantidad desconocida σ que aparece en su denominador genera intervalos inadecuados en los que sus extremos S y T dependen de esa cantidad no conocida. De temas anteriores, sabemos que el estadístico que se obtiene sustituyendo σ en la expresión de Z por su estimador muestral SX cumple que: X−µ SX n −1 ~ t n−1 Su posible papel como nuevo estadístico pivotal se ve confirmado por el hecho de que resulta inmediato pivotar con él, generando el siguiente intervalo aleatorio: SX SX , X − q1 X − q2 n −1 n −1 En esa expresión, aún queda pendiente la selección de los qi. Según lo ya comentado, esos dos percentiles se pueden escoger iguales a los que resuelvan el siguiente problema de minimización: SX Min: (q2 − q1 ) n −1 s.a.: P(q1 < t n−1 < q 2 ) = c Su resolución es análoga a la del problema de minimización ya examinado en el análisis inicial del Ejemplo 1, dando lugar a los valores q2 = tn-1,(1-c)/2 y q1= tn–1,(1+c)/2 = – tn-1,(1-c)/2= – q2. En esas dos igualdades, hemos usado el convenio notacional por el que tn,k representaría la cantidad tal que P(tn≤ tn,k)=1–k. Finalmente, emplearemos los datos muestrales para sustituirlos en las fórmulas obtenidas. Seleccionando dos niveles de confianza adecuados, c=95% y c=99%, se obtiene las siguientes estimaciones en minutos para µ. Con una confianza del 95%, µ está entre 70.51 m. y 75.69 m. Con una confianza del 99%, µ está entre 69.54 m. y 76.66 m. Comparando los resultados conseguidos bajo uno y otro planteamiento del Ejemplo 1, aún es posible derivar interesantes Prof. D. Juan José Pérez Castejón 9 conclusiones adicionales. Las expresiones de los intervalos a las que se ha llegado, según que se suponga σ conocida o no, son: σ σ , X + z (1−c ) 2 X − z (1−c ) 2 n n SX SX , X + t n−1,(1−c ) 2 σ desconocida: X − t n−1,(1−c ) 2 n −1 n − 1 σ conocida: De su examen y comparación se deduce que: • La forma general estimación puntual ± error máximo, anunciada para los intervalos, se confirma como la que normalmente estos adoptan. • Siempre se debe tener presente que el nivel de confianza señala la fiabilidad que se puede depositar en que realmente ese sea el error máximo cometido. • El error máximo que se confía haber cometido aumenta con la fiabilidad que queramos darle y con la varianza de la estimación puntual. • La necesidad de estimar el error debido a la presencia de parámetros ‘molestos’ desconocidos provoca menor precisión. • Como intuitivamente se puede prever, mayor tamaño muestral y el consiguiente aumento en la cantidad de información disponible, provoca estimaciones estadísticas mas precisas. Intervalos de confianza asintóticos. Usando combinadamente el método pivotal y resultados asintóticos, se obtienen intervalos que son asintóticamente válidos. Esto significa que su nivel de confianza es solo aproximado y que tal aproximación es aceptable únicamente si la muestra es lo bastante grande. Por ello siempre es preferible usar un resultado en muestra finita si es posible. Revisaremos dos casos concretos donde se presenta la posibilidad de usar combinadamente los dos elementos citados. Por supuesto, existen otras situaciones en las que un desarrollo análogo puede ser aplicado: • Estimación por intervalo de E(X) mediante X dada una especificación paramétrica cualquiera de la distribución de la población, e incluso, sin ninguna especificación concreta para ella. • Estimación por intervalo de π –unidimensional– mediante su Prof. D. Juan José Pérez Castejón 10 estimación máximo–verosímil π̂. Los resultados asintóticos a usar en cada una de esas dos opciones son, respectivamente: d • X ≈ N( µ , varπ ( X)) . d • πˆ ≈ N( π, cotaCR( π)) De ellos se derivan los siguientes estadísticos pivotales de validez asintótica: X−µ •Z≡ d varπ ( X) ≈ N(0,1) d πˆ − π ≈ N(0,1) cotaCR( π) •Z≡ En principio, el método pivotal debe utilizarse con esos estadísticos, de la forma como se empleó con el estadístico Z del Ejemplo 1. Sin embargo, la dependencia respecto de π que presentan los denominadores de ambos estadísticos puede complicar el proceso de pivotar. Si así ocurriera, las propiedades de la convergencia en ley permiten sustituir ambos denominadores por una estimación consistente suya. A su vez, las propiedades de la convergencia en probabilidad permiten que tal estimación se pueda hallar sustituyendo en las expresiones función de π de ambas cantidades, ese parámetro desconocido por alguna de sus estimaciones que sea consistente, por ejemplo, la propia estimación máximo– verosímil. Todo ello, daría lugar a los siguientes estadísticos pivotes asintóticos alternativos: X−µ •Z≡ vârπ ( X) = πˆ − π •Z≡ cot̂ aCR( π) X−µ varπˆ ( X) = d ≈ N(0,1) d πˆ − π ≈ N(0,1) cot aCR( πˆ ) Empleándolos, se obtienen los siguientes intervalos aleatorios para E(X) y π respectivamente: • • (X − z (πˆ − z (1−c ) 2 (1−c ) 2 vârπ ( X) , X + z (1−c ) 2 vârπ ( X) ) cot̂ aCR( π) , πˆ + z (1−c ) 2 cot̂ aCR( π) Prof. D. Juan José Pérez Castejón 11 ) Una última dificultad puede surgir al aplicar todo lo comentado. Se presentaría en el caso de que expresiones analíticas como funciones de π de la varianza de la media muestral o de la cota CR no fueran factibles. Pero tampoco en esas circunstancias se cierra la posibilidad de disponer de estimadores asintóticos adecuados para esas dos cantidades. Por ser el caso de más sencilla resolución y uno de los que más frecuente se presentan, citaremos lo que se hace en la primera de esas dos situaciones, la de la estimación de E(X). Ahí, la falta de la expresión analítica se puede dar, por ejemplo, si se pretende una estimación de esa media sin ninguna hipótesis paramétrica previa acerca de la distribución de X. Es por tanto una situación de inferencia de tipo no paramétrico, la única de ese tipo que citaremos dentro del ámbito de la estimación por intervalo. Para resolverla, se usa una estimación consistente de la varianza de la media muestral que no esté basada en la expresión analítica de la que se carece. Tal estimación, por lo que sabemos de temas anteriores, se puede conseguir en este caso a través de la varianza muestral si la muestra es aleatoria simple: • vârπ ( X) = S 2X n Finalicemos este apartado aplicando el método revisado a un ejemplo: Ejemplo 2: La compañía NPC ha decidido mejorar la calidad de fabricación de uno de sus principales productos, un componente electrónico. Quiere empezar por estudiar la fiabilidad de los que fabrica actualmente. Con ese fin, selecciona aleatoriamente 60 de ellos y mide el tiempo de funcionamiento continuo que cada uno soporta. Esa variable, medida en días, arroja los resultados indicados en la tabla. Su comportamiento aleatorio sigue una distribución e(1/λ). Se pretende una estimación por intervalo para la esperanza de vida de los componentes. Tiempo de vida de los componentes (medido en días) 339.0 68.1 21.6 386.7 319.6 224.2 283.6 557.1 800.0 86.3 329.3 534.2 142.6 221.4 162.0 826.5 275.2 211.5 101.6 168.0 69.2 446.3 611.7 8.6 20.6 72.5 23.0 125.2 59.5 330.7 182.2 244.4 12.8 204.8 60.7 62.5 136.8 147.1 75.6 44.8 459.9 121.6 223.5 122.8 36.2 24.6 22.5 56.7 19.7 152.1 511.6 227.6 34.6 3.1 30.6 91.8 935.4 402.6 65.0 12.6 En la nueva situación planteada, X~e(1/λ), población que cumple que λ=E(X). En consecuencia, con el fin de la estimación que se persigue, cualquiera de los dos métodos asintóticos comentados es adecuado. Aún más, como Prof. D. Juan José Pérez Castejón 12 X = λˆ y varλ ( X) = λ2 n = cotaCR(λ ), resulta que ambos métodos son equivalentes pues los estadísticos pivotales correspondientes coinciden: X−λ X−λ d λˆ − λ Z≡ = = ≈ N(0,1) cota CR ( ) n λ λ varλ ( X) La dependencia respecto de λ que el denominador de ese estadístico presenta, aconseja su sustitución –en este caso, simplemente para poder pivotar mejor– por su estimación máximo– verosímil: λˆ − λ X−λ d X−λ = = ≈ N(0,1) Z≡ ˆ X n varλˆ ( X) cotaCR(λ ) El intervalo aleatorio de probabilidad c para λ que se obtiene a partir de él, tiene la siguiente expresión: X X X − z (1−c ) 2 , X + z (1−c ) 2 n n Finalmente, los resultados muestrales nos permiten hacer las siguientes estimaciones a tres niveles de confianza diferentes, para la esperanza de vida de los componentes estudiados: Con una confianza del 90%, λ está entre 164.9 y 253.5 días. Con una confianza del 95%, λ está entre 156.3 y 262.1 días. Con una confianza del 99%, λ está entre 139.5 y 278.9 días. Intervalos de confianza en poblaciones normales. Vamos a revisar ahora la expresión y obtención, de los principales intervalos de confianza para poblaciones normales. Supondremos pues, a partir de ahora, que la v.a. X analizada es normal. Para simplificar, añadiremos la hipótesis de que la muestra obtenida de ella, es una m.a.s. Los distintos intervalos que iremos presentando se organizarán según las diferentes situaciones inferenciales que se pueden presentar en este tipo de poblaciones, que coinciden con las que se distinguían cuando analizábamos los más importantes resultados muestrales para poblaciones normales en el tema dedicado a inferencia y estadísticos. De hecho, bajo cada uno de los diferentes epígrafes iremos haciendo uso de los correspondientes resultados que allí se expusieron. Prof. D. Juan José Pérez Castejón 13 INTERVALO PARA µ SIENDO σ CONOCIDA. Cuando se desea hace la estimación por intervalo de µ, y σ es una cantidad conocida, a partir del siguiente resultado, Z = ( X − µ ) /( σ / n ) ~ N(0,1) , se puede deducir que Z quizá haga el papel de estadístico pivote. Efectivamente, pivotar con él es sencillo y los qi que llevan al intervalo de longitud mínima para un determinado nivel de confianza c son z(1-c)/2 y z(1+c)/2=–z(1-c)/2. De hecho esta situación fue la que se abordó con el primer enfoque que se dio al Ejemplo 1. Recuérdese que el intervalo de confianza σ σ final obtenido fue X − z (1−c ) 2 , X + z (1−c ) 2 . n n INTERVALO PARA µ SIENDO σ DESCONOCIDA. X−µ ~ t n −1 y de ahí S / n −1 podemos derivar el estadístico pivote T. Como esta situación es a la que nos enfrentamos en el segundo enfoque que dimos al Ejemplo 1, no hace falta repetir todo el desarrollo que lleva a la siguiente expresión final para el correspondiente intervalo de amplitud mínima S S , X + t n −1,(1− c ) 2 para µ y de nivel c: X − t n −1,(1− c ) 2 . n −1 n − 1 En este caso, sabemos que T = INTERVALO PARA σ SIENDO µ CONOCIDA. Cuando se desea hace la estimación por intervalo de σ o σ2 siendo la media µ una cantidad conocida, el siguiente resultado, T=Σ(Xi–µ)2/σ2~χ2n, aporta un estadístico pivote adecuado. Efectivamente, encontrados los qi tales que P(q1<T~χ2n<q2)=c, pivotar sobre las desigualdades en q1<T<q2 es muy sencillo y lleva al intervalo aleatorio (Σ(Xi–µ)2/q2)<σ2<(Σ(Xi–µ)2/q1) para σ2, y a este otro, (Σ(Xi–µ)2/q2)½<σ<(Σ(Xi–µ)2/q1)½, para σ. Escoger dos valores para los qi válidos es bastante sencillo pues la distribución χ2n está tabulada. Más difícil resulta escogerlos de manera óptima, esto es, que minimicen la longitud del intervalo aleatorio final. De hecho, ese problema tiene una solución que varía con n y también precisa una tabla propia de tabulación. Por todo ello, y para simplificar, lo que habitualmente se hace es tomar la Prof. D. Juan José Pérez Castejón 14 siguiente aproximación a sus valores óptimos: q2=χ2n,(1–c)/2 y q1=χ2n,(1+c)/2. Siguiendo con el convenio notacional antes acordado, χ2n,k representa la cantidad tal que que P(χ2n≤χ2n,k)=1–k. Nótese que mientras que en los dos casos anteriores, los percentiles escogidos eran percentiles simétricos y a dos colas iguales (la cola de probabilidad de la izquierda del menor y la de la derecha del mayor valían lo mismo), ahora, sin embargo, aunque las colas siguen siendo iguales, la simetría desaparece. INTERVALO PARA σ SIENDO µ DESCONOCIDA. Ya se comentó en el tema anterior que, en esta situación, el resultado que afirma que nS2/σ2~χ2n–1, sería el empleado para hacer inferencia. Efectivamente, en relación con los intervalos de confianza para σ o σ2, es el que aporta el estadístico pivote. Procediendo como en al apartado anterior, se llega al siguiente intervalo aleatorio de nivel c para σ2: (nS2/q2)<σ2<(nS2/q1), donde q2=χ2n–1,(1–c)/2 y q1=χ2n–1,(1+c)/2. El intervalo para σ es muy fácil de obtener a partir de ese otro. Hay que señalar también que tampoco en este caso la selección de los qi es la óptima, sino solo una aproximación a ella. INTERVALO PARA LA DIFERENCIA DE MEDIAS SIENDO LAS VARIANZAS CONOCIDAS. Al comparar las medias µX y µY entre dos poblaciones normales, lo que se precisa a veces es la estimación por intervalo de µX–µY. Obtener ese intervalo cuando las varianzas σ2X y σ2Y son conocidas es bastante sencillo, a partir del resultado que en su momento se razonó: ( X − Y − (µ X − µ Y )) / (σ 2X / n) + (σ 2Y / m) ~ N(0,1). La analogía se da hasta en la obtención de los valores óptimos de los qi. El intervalo sería el que se formaría con los siguientes extremos: X − Y ± z (1− c ) / 2 (σ 2X / n) + (σ 2Y / m) ~ N(0,1). INTERVALO PARA LA DIFERENCIA DE MEDIAS SIENDO LAS VARIANZAS DESCONOCIDAS. Distinguiremos los dos casos siguientes: Prof. D. Juan José Pérez Castejón 15 1.– Varianzas desconocidas de las que se sabe que son iguales. n + m − 2 ( X − Y ) − (µ X − µ Y ) , ~t n+m−2 2 2 n+m nS X + mS Y el estadístico que aparece en esa expresión es el usado como pivote aquí. El intervalo aleatorio final que queda tendría los Al cumplirse que nm n + m nS 2X + mS 2Y . nm n+m−2 siguientes extremos: X − Y ± t n + m − 2,(1− c ) / 2 2.– Varianzas desconocidas sin ninguna otra información. En este caso, como entero más cercano a ( (S ( X − Y ) − (µ X − µ Y ) S c2, X / n + S c2, Y / m 2 c, X S c2, X n n −1 n + S c2, Y m ) +( 2 S c2, Y 2 m ) 2 , entonces el intervalo m −1 S c2,X S c2,Y + es un intervalo n m válido, al menos, aproximadamente. Cuando n y m son ambas grandes, esa t de Student y sus percentiles se pueden sustituir por una N(0,1). con los extremos X − Y ± t ν,(1−c ) / 2 ) ≈ t ν donde ν es el INTERVALO PARA EL COCIENTE DE VARIANZAS SIENDO LAS MEDIAS CONOCIDAS. Como ∑ ( Xi − µ X )2 /(nσ 2X ) ~ F , n,m ∑ ( Yi − µ Y )2 /(mσ 2Y ) se obtiene el siguiente intervalo de confianza para σ2X/σ2Y: 1 1 ∑ ( Xi − µ X )2 / n < σ 2X < Fn,m,(1− c ) / 2 ∑ ( Yi − µ Y )2 / m σ 2Y Fn,m,(1+ c ) / 2 ∑ ( Xi − µ X )2 / n ∑ ( Yi − µ Y )2 / m Sobre la selección de los percentiles de la distribución F habría que señalar lo mismo que se dijo al estimar por intervalo de confianza la varianza en el caso de una sola población normal. Prof. D. Juan José Pérez Castejón 16 INTERVALO PARA EL COCIENTE DE VARIANZAS SIENDO LAS MEDIAS DESCONOCIDAS. En este caso, de nS 2X /((n − 1)σ 2X ) mS 2Y /((m − 1)σ 2Y ) = S c2, X / σ 2X S c2, Y / σ 2Y ~ Fn −1,m −1 se obtiene el siguiente intervalo de confianza para σ2X/σ2Y: S c2, X σ 2X S c2, X 1 1 < < Fn −1,m −1,(1− c ) / 2 S c2, Y σ 2Y Fn −1,m −1,(1+ c ) / 2 S c2, Y Aunque hay que tener en cuenta que ese intervalo tampoco es el de longitud mínima. Prof. D. Juan José Pérez Castejón 17