NOTA SOBRE INTERVALOS DE CONFIANZA. Si tenemos dos poblaciones normales, X1=N(µ1,σ1), X2=N(µ2,σ2), donde las varianzas poblacionales σ12, σ22 son desconocidas, y tomamos sendas muestras de tamaños n1 y n2 respectivamente, entonces siempre que n1+n2>30 se puede construir un intervalo de confianza para la diferencia de las medias poblacionales a partir de la siguiente fórmula: s2 s2 I μ1 μ2 x1 x2 z α/ 2 1 2 n1 n2 donde x , x son las medias muestrales, y s , s son las cuasidesviaciones típicas muestrales. En el caso de que n1+n2≤30, será necesario analizar si σ12, σ22 pueden considerarse iguales o no (por ejemplo, analizando el valor del cociente de s12 y s22, y después utilizar las fórmulas correspondientes a los casos σ12=σ22 y σ12≠σ22, respectivamente. 1 2 1 2 EJEMPLOS INICIALES CONTRASTE DE HIPOTESIS Ejemplo 1: El nivel máximo aceptable de exposición a radiación de microondas en Estados Unidos se ha establecido en una media de 10 microvatios por centímetro cuadrado. Se teme que un gran transmisor de televisión pueda contaminar el aire del entorno inmediato, elevando el nivel de radiación de microondas por encima del límite de seguridad. Para estudiar esta situación, se tomó una muestra de 9 observaciones de la variable X=”número de microvatios por centímetro cuadrado”, medidas en lugares próximos al transmisor: 9, 11, 14, 14, 10, 12, 13, 8, 12 Suponemos, además, que la variable estudiada es normal, y que su varianza poblacional coincide con la cuasivarianza muestral. Considerando un nivel de confianza del 95%, ¿avalan los datos la hipótesis de que la radiación media, en las proximidades del transmisor, es efectivamente de 10? Ejemplo 2: En el caso del ejercicio 1, ¿puede aceptarse, con un nivel de significación del 95%, que la radiación media sea inferior a 10? Ejemplo 3: Con el mismo nivel de confianza de los ejemplos anteriores, ¿puede aceptarse en el caso del ejercicio 1 que la radiación media sea superior a 10? Ejemplo 4: Los ecologistas que se oponen a la construcción de una presa en cierto tramo de un río creen que los residentes que viven a lo largo de su curso están divididos, de modo que hay aproximadamente el mismo porcentaje de personas a favor y e contra de la presa. Para comprobar esta creencia, se realiza un estudio con 500 personas aleatoriamente seleccionadas, de las cuáles 270 están en contra de la presa. ¿Representan estos datos, a un nivel de significación del 5%, evidencia suficiente para aceptar lo que dicen los ecologistas? Definiciones: Se llama hipótesis nula (H0) a una afirmación sobre la población que se da por cierta “a priori” (pero sobre cuya validez podemos tener ciertas dudas); las más frecuentes son las del tipo 0 , donde es un parámetro poblacional (media, desviación típica, etc.). Se llama hipótesis alternativa (H1) a la afirmación que aceptamos cuando H0 es rechazada. Para una hipótesis nula del tipo 0 , la alternativa puede ser de tres tipos: (1) 0 (2) 0 (3) 0 Un contraste de hipótesis es un proceso de decisión en base a herramientas y criterios estadísticos. Siempre consta de una hipótesis nula, y una alternativa. Veremos tres tipos de contrastes posibles: H 0 : 0 H 1 : 0 (1) H 0 : 0 H 1 : 0 (2) H 0 : 0 H 1 : 0 (3) El primero se llama bilateral o de dos colas, y los otros dos, unilaterales o de una cola. Además, si el propósito del contraste es comparar dos poblaciones, entonces tendremos también tres posibilidades, correspondientes a: H 0 : 1 2 H 1 : 1 2 (1) H 0 : 1 2 H 1 : 1 2 (2) H 0 : 1 2 H 1 : 1 2 (3) Para aceptar o rechazar H0 tomamos una muestra, utilizamos un estadístico del contraste, ε, que involucra al parámetro muestral más relacionado con el parámetro poblacional al cuál se refiere la hipótesis nula (para un contraste sobre la media poblacional utilizaremos la media muestral, etc.). Siempre utilizamos estadísticos cuya distribución sea conocida. Además, necesitamos fijar un nivel de significación α (próximo a cero: 0’1, 0’05, 0’01, etc.). Utilizando la distribución del estadístico y conociendo el nivel de significación, podemos entonces determinar una región crítica Icrit para el estadístico. Dicha región verifica lo siguiente: la probabilidad de que siendo cierta H0 el valor del estadístico esté en Icrit , es α; puesto que α es muy pequeño, puede considerarse “muy raro” que, siendo cierta la hipótesis, el estadístico tome ese valor. En consecuencia, si el valor que toma el estadístico en la muestra está en Icrit, concluímos que la hipótesis es falsa. Resumiendo, el criterio para rechazar H0 es: “rechazar H0 si el estadístico ε pertenece a Icrit” Por lo tanto, la región crítica es el intervalo donde debe caer el estadístico del contraste para que la hipótesis nula sea rechazada. En cambio, la región de aceptación es el intervalo donde debe caer el estadístico para que la hipótesis nula no sea rechazada.