CONCEPTOS DE PRUEBAS DE HIPOTESIS

Anuncio
CONCEPTOS DE PRUEBAS DE HIPOTESIS
Definición de la hipótesis nula (H0) y de la hipótesis alternativa (H1) del test
En general para un test de hipótesis cualquiera, se define hipótesis nula aquélla para la cual se
desea controlar la probabilidad† de equivocarse al afirmar que dicha hipótesis no se cumple,
cuando en realidad sí se cumple (que es lo que después, una vez que está definida H0 es lo que se
denomina probabilidad de error tipo I).
Por ej., en un experimento que se realiza para saber si una nueva droga que se desea lanzar al
mercado es mejor que una droga ya existente, la hipótesis nula es suponer que la nueva droga no
es mejor. Esto es así porque el objetivo es controlar la probabilidad de llegar a la conclusión de
que la nueva droga es mejor, cuando en realidad no lo es. De hecho, tomar la decisión de que el
nuevo fármaco es mejor que el anterior implica muchos costos operativos: poner en marcha la
producción en serie del nuevo producto, lanzar una campaña publicitaria, establecer los sistemas
de distribución del fármaco, etc., costos que no vale la pena asumir si el nuevo fármaco en
realidad no es mejor que el ya existente. En términos de parámetros, la hipótesis nula se
expresaría por ej. como H0: m = m0, donde m es un valor que mide la bondad de la nueva droga y
m0 el correspondiente valor que mide la bondad de la droga ya existente (por ej., m podría
corresponder al número de días promedio en que el paciente se recupera si toma la nueva droga, y
m0 el número de días promedio en caso de que tome la droga ya existente).
En el problema que nos ocupa, quizás no quede tan claro cuál sería el error a controlar, pero la
situación podría ser la siguiente: el fabricante es proveedor de acero para una industria y el
responsable de producción de ésta, por alguna razón (por ej. que muchos de los productos tienen
menor calidad que la esperada), desconfía de la afirmación del fabricante, quien asegura
entregarle aceros que en promedio tienen una dureza de 75. Por lo tanto, el responsable de
producción diseña un experimento para probar si esta afirmación es cierta. Es claro que lo más
costoso para él es decidir que el fabricante no cumple con las especificaciones de dureza
requeridas, ya que eso implicaría salir a buscar otro proveedor, hacer las pruebas de calidad al
acero entregado por éste, etc, etc. La probabilidad de que esta decisión esté equivocada es la que
el responsable de producción querrá controlar. De aquí que la hipótesis nula resulte en H0: m =
75.
(Moraleja: lo menos costoso es que las cosas sigan como están. O sea, equivocarse al tomar una
decisión que implique no cambiar una cierta situación ya existente, cuando en realidad habría que
cambiarla, es menos grave que decidir cambiarla cuando no hacía falta (al menos visto solamente
desde el punto de vista de los costos). En consecuencia no es tan crucial controlar la probabilidad
de cometer este tipo de error.)
La hipótesis alternativa por otro lado, como la prueba a realizar es a dos colas (porque la calidad
de los productos generados por la industria disminuye ya sea si la dureza media del acero es
mayor o menor que 75), debe ser:
† Controlar una probabilidad significa mantenerla tan chica como se quiera (en la medida de lo posible).
H1: m ¹ 75.
O sea, se considera que la hipótesis nula no se cumple cualquiera sea el signo del apartamiento de
la media verdadera respecto a la media supuesta (75), y no solamente los apartamientos que estén
por encima o solamente por debajo de la media supuesta. (Cualquiera de estos dos últimos casos
correspondería a una prueba a una cola, y la hipótesis alternativa resultaría por ej. H1: m > 75 ó
H1: m < 75, respectivamente.)
Por lo tanto, la hipótesis a ensayar queda:
H0: m = 75 vs. H1: m ¹ 75
2.- Definición del estadístico (T) a usar para ensayar la hipótesis nula
Recordemos que un estadístico es una variable aleatoria que depende de la muestra obtenida (de
su tamaño y de los valores observados para la variable aleatoria de interés X) y que se utiliza para
ensayar la hipótesis planteada.
Como la hipótesis planteada incluye afirmaciones que involucran a la media poblacional (m)
(cosas como “m = 75”, “m ¹ 75”), conviene usar como estadístico la media muestral, pues su valor
nos da una estimación del m de la población.
Es decir, el estadístico es: n X T = ,
donde el subíndice n resalta que T depende del tamaño n de la muestra.
Una condición que debe cumplir el estadístico, además de que sea una variable que nos permita
inferir valores del parámetro involucrado en la hipótesis, es que su distribución sea conocida bajo
cada una de las hipótesis planteadas (es decir, tanto cuando H0 es verdadera como cuando H1 es
verdadera). En este caso, esto es cierto pues Xi tiene distribución N(m, 1) bajo cualquiera de las
hipótesis. Por lo tanto T, al ser una combinación lineal de las Xi, también tiene distribución
normal, con media m y desvío 1/÷n (ya que las Xi se suponen mutuamente independientes). Ahora
bien, bajo la hipótesis nula T tiene distribución N(75, 1/÷n), pues m = 75. Bajo la hipótesis
alternativa, para un valor prefijado de m, digamos m1, T tiene distribución N(m1, 1/÷n)‡.
Resumiendo, la variable aleatoria n X T = puede utilizarse como estadístico para evaluar la
hipótesis planteada, pues cumple con las dos condiciones pedidas a un estadístico:
· Permite estimar el parámetro involucrado en la hipótesis evaluada.
· Su distribución es conocida tanto bajo la hipótesis nula como bajo la alternativa.
‡ En rigor la distribución de T no es conocida bajo la hipótesis alternativa porque depende del tamaño n de
la muestra, que es desconocida al ser una de las incógnitas del problema. En realidad lo que aquí importa es
que la distribución de T sea conocida en términos de los datos y/o de las incógnitas del problema.
3.- Definición de la regla de decisión en términos cualitativos
La idea es definir, en forma cualitativa, la regla de decisión sobre la veracidad o no de la hipótesis
nula. Esto quiere decir definir para qué valores de T (en términos cualitativos, es decir si para
valores grandes, chicos, medianos, etc.) se decidirá rechazar la hipótesis nula, y para qué valores
se decidirá aceptarla.
En este caso, es claro que valores muy grandes o muy chicos respecto del valor 75 supuesto para
m bajo la hipótesis nula, serán indicativos de que la hipótesis nula casi seguramente es falsa. Por
lo tanto, la regla de decisión en términos cualitativos puede expresarse como:
· Rechazar H0 si T se aparta “mucho” del valor supuesto para m (75).
· Aceptar§ H0 si T se aparta “poco” del valor supuesto para m (75).
Descargar