Clase 6 - Universidad del CEMA

Anuncio
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
VI - TEORIA DE PRUEBA DE HIPÓTESIS
6.1 Prueba de Hipótesis
En esta sección miraremnos a una rama principal de los métodos cuantitativos y de la
estadística, conocida como Pruebas de Hipótesis. Estamos interesados en la elección de una
de dos decisiónes en base a la evidencia de los datos que se encuentran sujetos a
aleatoriedad y pueden, por consiguiente, ser considerados como realizaciónes de una
variable aleatoria. Las decisiónes se realizan entre dos afirmaciónes en conflicto entre si
acerca de la población, y estas afirmaciónes son conocidas como hipótesis. Si denotamos
las mismas como H0 y H1, entonces ejemplos de estas hipótesis pueden ser:
H0
H1
Un proceso modificado no produce
Un proceso modificado produce un
un rendimiento mayor que un proceso
rendimiento mayor que un proceso
estándar.
estándar.
Un índice económico no se ha incrementado
Un índice económico se ha
en un año
incrementado en un año
Una persona no esta dotada de
Una persona esta dotada de
sentidos extrasensoriales
sentidos extrasensoriales.
1
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
Una división no es mas productiva
Una división es mas productiva
que otra en la compañía
que otra en la compañia
Debe notarse que siempre la Hipótesis H0 presupone falta de cambio, no diferencia,
etc., es por ello que es llamada Hipótesis nula, mientras que la hipótesis H1 es denominada
Hipótesis alternativa.
La mayoria de los procedimientos estadísticos pueden ser representados por afirmaciónes
sobre los valores de algunos parámetros poblaciónales como ser la media o la varianza, no
obstante existe una rama de las estadísticas que trata con métodos no paramétricos. El
primer paso, en consiguiente, en cualquier problema de test de hipótesis es trasladar el
problema “real” a su equivalente técnico. Por ejemplo, las hipótesis menciónadas
anteriormente pueden ser trasladadas a su equivalente técnico de la forma:
“Observamos y1, y2...yn de una distribución N (µ, σ2) y deseamos testear
H0: µ = µ0 v H1: µ > µ0 o H1: µ < µ0 en los µ0 representa un valor especifico”.
Mas adelante veremos como resolver esto. Es muy importante que la formulación del
problema sea realizado correctamente, y es sorprendente como el analista muchas veces
obtiene intuiciónes (“insights”) con el solo hecho de pensar en el problema. Una palabra de
advertencia aquí- generalmente el problema es descripto como : “Deseamos testear la
hipótesis que la media poblaciónal es cero”. En otras palabras, la hipótesis alternativa se
deja sin especificar. Debe de haber una, por supuesto, o caso contrario no habría problema!.
La hipótesis alternativa implicita en esta afirmación es H1: µ ≠ 0, pero es mejor establecerla
en forma explícita, debido a que muchas veces la naturaleza de la hipótesis alternativa
puede afectar tanto el test como el tamaño muestral requerido.
2
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
6.2 El Test
El procedimiento de prueba en si mismo es un cálculo directo de un dato, cuyo resultado es
comparado con una constante obtenida de las tablas estadísticas. La elección de la hipótesis
resulta de esta comparación. Para muchos problemas de prueba de hipótesis existen
procedimientos estándar. En capítulos posteriores describiremos varios de los mismos, y
demostraremos sus aplicaciones. Pero primero analicemos la lógica detrás de estos
procedimientos de prueba porque ello, además de ser interesante en si mismo, nos posibilita
a decidir sobre el tamaño muestral en una manera razonable, y a apreciar el valor de las
conclusiones obtenidas a partir del test. No obstante no intentaremos derivar el
procedimiento del test –es muy complicado- desde el punto de vista matemático- es un
reaseguro saber que todos los tests se basan en conceptos lógicos descriptos en las siguiente
dos secciones.
6.3 Lógica del Test.
En orden de comprender los conceptos detrás de Pruebas de Hipótesis, debemos empezar
por describir dos ejemplos simples pero extremos.
1. Una moneda es lanzada 100 veces a los efectos de determinar en que medida
esta bien balanceada o no. Observamos 98 caras y 2 cecas. El sentido común nos
dirá que existe una evidencia fuerte que la moneda se encuentra desbalanceada
en favor de “cara”. Más formalmente, rechazamos la hipótesis que la moneda se
encuentra bien balanceada porque la chance de obtener 98 caras con una moneda
bien balanceada es extremadamente baja. La observación o resultado del
experimento, es incompatible con una moneda bien balanceada.
3
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
2. Supongamos que ha sido sugerido que el retorno medio de cierta industria es tal
que supera el 25% anual. A los efectos de evaluar la verdad de tal afirmación,
tomamos una muestra de los balances de 50 empresas de la industria y
obtenemos que la media es 24% y el error estándar 0.2%, lo que dividido por la
raiz cuadrada de 50 nos da 0.028%, de manera tal que nuestra hipótesis de
rendimiento se encuentra a mas de 35 desviaciónes estandar de la media
muestral – muy improbable!. En base a esta evidencia rechazamos el valor
sugerido de rendimiento de la media de retorno de la industria.
En estos ejemplo es perfectamente razonable hacer una evaluación de sentido común y
descartar una hipótesis en base a la evidencia, siendo los datos tan extremos, pero aún un
juicio de sentido común esta usando la lógica en algún sentido, y entendiendo cabalmente
esta lógica estaremos en condiciones de tomar decisiones acertadas en situaciones menos
extremas y mas complicadas. Una segunda ventaja de este enfoque formal es que nos
posibilita expresar confianza en nuestro procedimiento de inferencia; esto puede ser de
extremada importancia al comunicar nuestras conclusiones a traves de un reporte,
presentaciones, etc., y a entenderlas.
El procedimiento a seguir es el siguiente. Con una hipótesis en particular en mente
procedemos a observar un set de información relevante. Medimos la compatibilidad de
estos datos con nuestra hipótesis computando la probabilidad de observar este o un dato
mas extremo bajo el supuesto que la hipótesis es correcta. Si esta probabilidad es baja,
entonces se dice que los datos se juzgan como refutantes de la hipótesis, y en consecuencia
es rechazada a favor de la hipótesis alternativa dado que los datos son mas probables de
haber ocurrido bajo el supuesto de esta alternativa.
Otra forma de ver el procedimiento es la siguiente. Aun cuando el real retorno de la
industria sea 25%, no esperamos el retorno medio igual a exactamente 25%. Esperamos que
4
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
el retorno medio pueda encontrarse cerca de 25% y esperamos que pueda existir alguna
desviación debido al azar. La pregunta importante aquí es “es una desviación de 25%
debida al azar solamente, o es muy grande para ser explicada unicamente por el azar?”. La
desviación de 24% a 25% es muy grande (dada la desviación estándar) para ser explicada
únicamente por azar.
También debemos decidir cuando consideraremos una probabilidad como tan baja que
implique incompatibilidad. Los standards, arbitrarios pero aceptados son:-
Probabilidad < .05, rechazar H0
Probabilidad < .01, rechazar definitivamente H0 con confianza.
Probabilidad < .10, no rechazar H0 pero mirarlo con sospecha.
Estos son comunmente conocidos como niveles de significancia para un test estadístico.
Son estandares aceptados, no obstante los niveles efectivamente utilizados deben depender
en las consecuencias de cometer errores.
6.4 Tipos de errores
En cualquier problema que implique una decisión sobre dos alternativas existen dos errores
involucrados, y nuestro propósito es trata de reducir las probabilidades de cometer estos
errores, tanto como nos posibilite una decisión raciónal de procedimiento de selección. Para
ilustrar estos errores, consideremos el problema simple de todos los días de cruzar una calle
o ruta. Si cruzamos cuando no hubiésemos debido (un tipo de error) terminamos en un
Hospital, o peor todavía. Si no cruzamos cuando podríamos haberlo hecho en forma segura,
podemos llegar tarde a una cita, por ejemplo (otro tipo de error). Dos puntos importantes
surgen de este ejemplo:
5
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
1) los dos errores son indeseables, y debemos actuar de manera tal que sus probabilidades
sean bajas.
2) debemos requerir que las probabilidades del primer tipo de error sean bastantes menores
que las del segundo tipo.
Las pruebas de hipótesis que veremos mas adelante estan todos derivados con este criterio
de error en mente- de controlar y minimizar las probabilidades de cometer errores. Para ver
como es hecho, examinemos en detalle el simple problema de testear un valor puntual para
una media normal con respecto a otro valor puntual, cuando la varianza es conocida. Es
mas bien un ejemplo artificial, pero sirve al propósito de ilustrar el concepto claramente.
Todos los tests que veremos despues estan basados en estos conceptos.
Obsrevamos y1, y2, ...yn de una población con distribución N(µ, 36), de forma que s se
asume igual a 6, y deseamos testear
H0 : µ = 0 v H1 : µ = 5
Suponemos que no existen otros valores de µ posibles. Puede ser mostrado, y es obvio en
forma intuitiva, que el mejor test deberia ser de la forma – “elije H1 cuando m > a, para
una constante a, todavia a ser determinada”.
Si elegimos H1 cuando H0 era cierta, cometemos error Tipo I,
Si elegimos H0 cuando H1 era cierta, cometemos error Tipo II.
6
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
Sean α y β las probabilidades de cometer dichos errores, respectivamente. Entonces
podemos argumentar asi:
Error Tipo I
α = prob (Error tipo I) = prob (m > a cuando H0 es cierta), y siendo que m ~ N (0, 36/n)
bajo la hipótesis nula (tomándola a los efectos del cálculo como si fuera correcta), entonces
α = prob (Z > a√n/6) donde Z es una variable normal estandar,
de manera que
Zα = a√n/6
(1)
donde Zα es la variable normal estándar que corta la distribución a un nivel de probabilidad
de α.
Error Tipo II
β = prob (Error tipo II) = prob (m < a cuando H1 es cierta), y siendo que m ~ N (5, 36/n)
bajo la hipótesis alternativa (tomándola a los efectos del cálculo como si fuese correcta),
entonces
β = prob (Z < (a – 5) *√n/6)
donde Z es una variable normal estandar,
7
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
de manera que
-Zβ = (a- 5) * √n/6
(2)
donde Zβ es la variable normal estándar que corta la distribución a un nivel de probabilidad
de α.
Las ecuaciónes (1) y (2) relaciónan los cuatro valores α, β, a y n de manera tal que dados
dos, los otros dos son determinados en forma inequívoca
Por ejemplo, suipongamos que deseamos testear con un nivel de probabilidad de error tipo I
de 5%, y tipo II de 10%. Entonces el tamaño muestral estara dado por:
n = (36/25) * (Zα + Zβ)2
(3)
= (36/25) * (1.645 + 1.28)2 = 12.32
entonces utilizaremos una muestra de tamaño 13, y un valor limite a de:
a = 5* Zα/ (Zα + Zβ) = 5 * 1.645/(1.645 + 1.28) = 2.81
de aquí que si elegimos las probabilidades, podemos encontrar un punto de decisión a, y un
tamaño muestral n, que nos darán las probabilidades de error especificadas. Esto es lo que
queremos decir cuando hablamos de controlar las probabilidades de error.
8
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
DISTRIBUCIÓN BAJO HIPÓTESIS NULA Y ALTERNATIVA
H0
H1
a
Del diagrama podemos observar;
(a)
Si disminuimos α al movernos hacia la derecha, entonces automáticamente
incrementamos β, i.e. las probabilidades de errores actuan en forma contraria una de
otra.
(b)
Si incrementamos el tamaño de la muestra, entonces las dos curvas se hace mas
delgadas y tanto α como β disminuyen.Nos dice que podemos disminuir las
probabilidades de error al incrementar el tamaño de la muestra, pero esto
seguramente es mas costoso.
9
Universidad del CEMA
Métodos Cuantitativos
(c)
Prof. José P Dapena
Si las hipótesis se encontraran bastantemente distanciados, entonces los dos errores
serian menores.Esto confirma el punto que mientras mas diferentes sean las
hipótesis, mas facil es discriminar entre ellas.
En el ejemplo anterior, hubieramos cometido un error Tipo I si hubiesemos dicho que el
nivel de retorno de la industria es menor que 25% cuando era en realidad mayor, y
viceversa para un error Tipo II. Estos errores son tomados en consideración en la
formulación de procedimiento de prueba; las pruebas estándar descriptas en los siguientes
dos capitulos estan diseñados todos para minimizar las probabilidades de cometer estos
errores.
6.5 La Función de Poder
Las probabilidades de error descriptas son, de hecho, casos especiales de una importante
función conocida como la función de Poder. Su complemento (1 – función de poder) es
conocida como la función de Caracteristicas Operativas, y es muy utilizada en Control de
Calidad.
La función de Poder es una función del parámetro de consideración, y se define como:
P(θ) = Prob de aceptar H1 cuando el parámetro es igual a θ
La función complementaria es
P(θ) = Prob de aceptar H0 cuando el parámetro es igual a θ
10
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
Como ejemplo consideremos el test normal descripto precedentemente.
Para este test tomamos una muestra de trece valores (13) y elegimos a favor de H1 si m >
2.74. Entonces la función de poder es :P(µ) = p (m > 2.74) cuando la media poblaciónal es µ
= p (Z > 2.74 - µ) * (√13)/6
y podemos utilizarla para tabular P(µ) por µ.
El diagrama analizado muestra la función de Poder. Es una función importante porque
representa el desempeño de un procedimiento de decisión particular sobre los posibles
valores de un parámetro desconocido. Querremos una función de poder alta sobre valores
que deseamos rechazar, y baja para valores que deseamos aceptar. Es utilizada en gran
medida para evaluar el desempeño de un procedimiento de Control de Calidad; estudiada
tambien como función de caracteristicas operativas, simplemente {1 – función de poder}.
11
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
TESTS DE HIPÓTESIS – PRUEBAS DE SIGNIFICANCIA
6.6 Procedimiento de Prueba
En este capítulo veremos distintas pruebas básicas, todas basadas en los conceptos
elaborados en los capítulos anteriores. Empezamos por ver la prueba desde otro punto de
vista – uno que explica el procedimiento adoptado en los ejemplos que siguen.
El procedimiento de prueba es similar, de alguna manera, al método conocido en
matematicas como “reducción al absurdo”. Una vista simple del método es :
Queremos probar que A ≠ B, entonces asumimos que A = B, y bajo este supuesto
obtenemos una falsedad indudable del tipo 1 = 2, lo que prueba lo que inicialmente se
buscaba.
Los tests de hipótesis son similares excepto que no arribamos a un resultado imposible,
(como el anterior 1 = 2) sobre el que basamos nuestra conclusión, pero, debido a la
presnecia de aleatoriedad, arribamos a un resultado extremadamente similar, un resultadi
improbable. Esta comparación es resumida mas abajo, donde las flechas representan pasos
logicos y el resultado al final, no obstante posible, 1 chance en 10.000.000, es virtualmente
imposible.
REDUCTIO AD
ABSURDUM
A=B
1=2
PRUEBA DE
HIPÓTESIS
H0
P = 0.0000001
12
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
El procedimiento, en consecuencia, es trabajar como si la hipótesis nula fuese cierta, y
después computar la probabilidad de obtener datos tanto o mas extremos que aquellos que
han sido observados. Si esta probabilidad (conocida como valor P) es extremadamente
baja, entonces consideramos los datos como incompatibles con la hipótesis nula y la
rechazamos. Si, sin embargo, esta probabilidad no es extrema, entonces consideramos los
datos compatibles con la hipótesis nula y la aceptamos. Notese que nunca podemos probar
que sea cierta, solamente decimos que los datos observados son compatibles con ella en el
sentido que es bastante probable que se pudiesen producido cuando la hipótesis nula es
cierta.
El punto limite (“cut off o treshold point”) en considerar una probabilidad extrema o no es
de alguna manera subjetivo, y los costos relativos de equivocarse deben ser tenidos en
cuenta. Un punto límite ampliamente aceptado es 5% no obstante 1% y 10% son a veces
utilizados. Si utilizamos 5% entonces se dice que estamos testeando “a un nivel de
significancia del 5%”; esto es equivalente a testear de manera tal que la probabilidad de
cometer un error tipo I es 5%. La interpretación del nivel de significancia sera discutido
mas adelante.
El procedimiento estándar de prueba se encuentra resumido mas abajo; este enfoque es
demostrado en la sección 9.2 donde una forma general del estadístico de prueba es derivado
cuando los datos se distribuyen normalmente.
PROCEDIMIENTO DE PRUEBA
I ESTABLECER LAS HIPÓTESIS
II COMPUTAR EL ESTADÍSTICO DE PRUEBA
III COMPARALO CON LA DISTRIBUCIÓN
IV SACAR CONCLUSIONES
13
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
6.7 Pruebas para poblaciones normales.
Supongamos que, para una muestra de datos distribuídos normalmente tenemos un
estimador u de un parámetro desconocido θ, y u sigue la siguiente distribución muestral:
u ~
N{ θ, V}
donde, en primera instancia, asumimos V conocida, de manera que tambien conocemos el
valor del error estándar de u, SE = √V
Paso I
Deseamos testear la hipótesis H0: θ = θ0 v H1: θ > θ0 de manera que valores altos de u
tienden a soportar H1 mientras que valores bajo trabajan a favor de H0. Notese que, en este
caso, la hipótesis alternativa es de un solo lado, y esto posee un efecto en el fromato del test
– desarrollamos un test de “una cola”.
Paso II
Ahora computamos un estadístico de prueba. Este es elegido de manera tal que, condicional
en H0 cierta, posee una distribución tabulada estandar; en este caso la normal.
Computamos el valor de:
(u - θ0)/ SE
14
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
y puede ser fácilmente visto que, si θ0 es la media poblacional, este estadístico tiene una
distribución normal estandar.
Paso III
Ahora comparamos el valor del estadístico de prueba con la distribución normal estandar,
para ver donde yace. Si esta bien adentro para el lado derecho (cola derecha) esto implica
que los datos son incompatibles con la hipótesis nula, y de hecho la rechazamos. Si el
estadístico de prueba cae en el grueso de la distribución normal, entonces decimos que los
datos se corresponden con la hipótesis nula, y entonces la aceptamos. Solo valores
extremos nos conducen a rechazar la hipótesis nula H0 dado que la hipótesis alternativa
representa valores hacia la derecha.
En orden de decidir un valor límite para la toma de la decisión, podemos testear a un nivel
de significancia del 5%; para hacer esto, tomamos las tablas normales estandarizadas, y
buscamos el valor que corta la distribución por el lado derecho a un nivel de 5% de
probabilidades (o 95% acumulado), podemos ver que este valor es 1.65. Utilizando este
valor limite, rechazamos H0 si el estadístico de prueba es mayor a 1.65, y la aceptamos si es
menor.
Alternativamente podemos encontrar, de las tablas, la probabilidad de obtener valores mas
extremos que el estadístico de prueba que hemos observado; esto es conocido como el valor
P para la prueba. Valores bajo de P son evidencia en contra de la hipótesis nula, y valores
razonables la soportan. Si utilizamos 5% como limite para el valor P, es lo mismo que
encontrarse testeando a un nivel de significancia de 5%.
15
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
Paso IV
Finalmente debemos sacar conclusiones en el contexto de las variables del problema
original. No es suficiente con concluir que el test es significativo a un nivel de 5%. Este es
un paso técnico que nos guía para tomar mejores decisiónes acerca del problema real
original, y conclusiones finales deben ser elaboradas en estos términos.
Un importante aspecto de este test es la forma simple del estadístico
Estimador – valor hipotetico
Error Estándar
Esto se aplica unicamente a estimadores distribuidos normalmente pero cubre una amplia
gama de situaciónes tales como:
Prueba de media poblacional
Comparaciones de medias
Prueba de proporciones poblacionales
Comparaciones de proporciones
Prueba sobre el coeficiente de pendiente de la regresión
Prueba sobre el termino constante de la regresión
Prueba para coeficiente en series de tiempo
Veremos mas adelante alguna situaciones no-normales, donde esta forma de estadístico no
se aplica, pero el procedimiento general de prueba se mantiene para todas las pruebas y
distribuciones.
16
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
6.8 Niveles de Significancia
El nivel es significancia de un test es de hecho la probabilidad de cometer un error tipo I; si
llevamos a cabo una prueba a un nivel de 5%, estamos basando nuestra decisión en un
procedimiento que nos da un 5% de chance de cometer un error tipo I (cuando la hipótesis
nula es cierta).
En el desarrollo de la prueba normal general de la sección previa utilizamos un nivel de
significancia de 5%. Este es uno de los niveles de significancia mas comunmente
utilizados, no obstante 1% y 10% son tambien citados. El valor de citar el nivel de
significancia utilizado es que nos da un método aceptable de expresar la confianza del
usuario en la decisión que ha tomado. Un test significativo al 1% evidencia una fuerte
convicción que la hipótesis nula es falsa, en tanto que un test significativo al 10% expresa
ciertas dudas en la hipótesis nula, pero el usuario no se encuentra lo suficientemente
confiado para rechazarla.
Los niveles de significancia 10%, 5% y 15 proveen de un medio para decidir que valores
del estadístico son extremos. Consideremos por ejemplo un test de una cola:H0: µ = 2.24 v H1: µ > 2.24
Calculamos el estadístico y analizamos que tan lejos hacia la derecha de la distribución
normal estándar se encuentra . Si se encuentra adentro de la cola, rechazamos la hipótesis
nula, si se encuentra a la izquierda, en la distribución, la aceptamos. Pero donde establecer
la linea? Como fue mencionado, un criterio aceptable es utilizar el punto de probabilidad de
5%, que para la distribución normal estandar es 1.65, de forma que rechazamos la hipótesis
nula si el estadístico es mayor que dicho valor y lo aceptamos en caso contrario. Esto es
denominado prueba al nivel de significancia del 5%.
17
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
10%
5%
1%
1.28
1.65
2.33
Si el estadístico de prueba excede 2.33, entonces se dice que el test es significativo a un
nivel de 1%, proveyendo de evidencia fuerte en contra de H0; si excede solamente 1.28, se
dice que la prueba es significativa al 10%, proveyendo de una evidencia debil para rebatir
H0.
Claramente, significancia al 1% implica significancia al 5 y al 10%. Cuando un test es
significativo, se debe establecer siempre el nivel mas bajo posible de significancia, de
manera de proporciónar una medida correcta de la compatibilidad de datos con la hipótesis
nula.
Si el estadístico de prueba cae entre 1.28 y 1.65, entonces el test es significativo al 10%
pero no a un nivel de 5%. Este tipo de resultados surgen de datos incompletos, y seria una
buena decisión extender el tamaño de la muestra de manera tal de obtener conclusiónes
definitivas. Esta prueba estaria diciendo que la hipótesis nula debe ser tratado con alguna
sospecha, pero no tenemos evidencia concluyente para rechazarla. Estos puntos e ideas
seran reforzados en los siguientes puntos.
18
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
6.9 Pruebas de una y dos colas
Hasta ahora las pruebas que hemos descripto han sido de una cola (“one tailed”); esto es asi
porque la hipótesis alternativa es hacia un lado unicamente. Si la hipótesis alternativa a
H0: θ = θ0
fuese
H1: θ ≠ θ0
entonces las dos colas de la distribución muestral bajo la hipótesis nula seran utilizadas para
rechazar la misma, y el nivel de significancia se dividira en dos en parte iguales.
Si, por ejemplo, la distribución muestral nula es la estándar normal y la alternativa es de un
lado hacia la derecha, entonces el nivel de significancia total se asigna a la zona derecha y
la región de rechazo sera Z > 1.645. Por otra parte, si la hipótesis alternativa fuese hacia los
dos lados, entonces el nivel de significancia se compartira entre las dos colas, cada una con
un 2.5% y la zona de rechazo estara dada por Z < -1.96 o Z > 1.96. para muchas pruebas,
por consiguiente, la forma de la hipótesis alternativa es clave para la elección de una prueba
de una o dos colas.
Proporcionamos ahora una ennumeración de las pruebas básicas; estas se corresponden con
el detalle de situaciones para intervalos de confianza descriptos en el capitulo 7, y la teoria
de distribución muestral es de lo mismo; para no caer en repeticiones, por consiguiente, no
las consideraremos en detalle.
6.10
Prueba para una media (varianza conocida).
19
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
Dado un conjunto de datos independientes x1, x2, ...xn deseamos testear una hipótesis acerca
de la media poblaciónal µ. Dado que el error estándar de la media muestral m es σ/√n, el
estadístico de prueba a ser calculado es
(m - µ0 ) * √n /σ
y la prueba consiste en la comparación de este valor con el mismo de la distribución normal
estandar.
No es usual conocer σ pero si n es muy grande, la formula puede ser utilizada con σ
reemplazada por s; esto porque s es un muy buen estimador de σ debido al gran tamaño de
la muestra, y no existe razon para preocuparse por su volatilidad.
6.11
Prueba para la media (varianza desconocida)
Es igual que 9.5 excepto que utilizamos s en lugar de σ y el estadístico se transforma en
(m - µ0 ) * √n /s
y la prueba consiste en la comparación de este valor con su similar de la distribución t de
Student (en lugar de la estándar normal).
20
Universidad del CEMA
Métodos Cuantitativos
6.12
Prof. José P Dapena
Prueba de proporciones
Sabemos que la varianza de una proporción muestral es npq, donde p es la proporción, n el
tamaño de la muestra u q = 1- p. Cuando conducimos la prueba para la proporción, el
estadístico de prueba es computado bajo el supuesto que la hipótesis nula es cierta,
entonces utilizamos el valo nulo p en la formula para el error estándar. El estadístico de
prueba en este caso es,
(r/n – p0)/√
√ (p0q0/n)
donde p0 es el valor atribuido a p por la hipótesis nula, y la prueba es realizada a traves de
la comparación de este estadístico con la(s) cola (s) de la distribución normal standar.
6.13
Prueba para comparación de proporciones
El enfoque correcto para la comparación de proporciones es, naturalmente, a través de la
diferencia entre las proporciones poblacionales. Para muestras grandes, el estadístico
(r1/n1 – r2/n2)
~
N (p1 – p2 , p1q1/n1 + p2q2/n2)
bajo la hipótesis nula que las proporciones poblacionales son iguales, con un valor en
común pero desconocido p, el error estándar del estimador sera
√(pq/(1/n1 + 1/n2))
21
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
para computar este estadístico de prueba, sin embargo, es necesario estimar p, desde que
ningun valor le es atribuido por hipótesis nula. Dado que las proporciones poblacionales
son iguales bajo la hipótesis nula, entonces estimamos la proporción en comun por el ratio
del numero total de exitos respecto al tamaño total de la muestra, a saber,
p’ = (r1+ r2) /(n1 + n2)
y el estadístico de prueba es ahora
(r1/n1 – r2/n2)/√{p’q’(1/n1 + 1/n2)}
6.14
Comparación de medias poblacionales
En esta sección estamos principalmente interesados en la diferencia entre dos medias
poblaciónes, Como en el capitulo anterior, existen tres casos a considerar dependiendo del
tamaño de la muestra, y de que los datos esten matcheados o no.
Caso 1
Datos no matcheados, - muestras grandes o varianzas conocidas
Supongamos que tenemos muestras aleatorias de dos poblaciónes con medias desconocidas
y varianza conocidas.
Para la población 1
media= µ1
Tamaño muestral = n1
SD= σ1
media muestral= m1
22
Universidad del CEMA
Métodos Cuantitativos
Para la población 2
media= µ2
Prof. José P Dapena
SD= σ2
Tamaño muestral = n2
media muestral= m2
y deseamos estimar µ1 - µ2
Estimamos esto a traves de estimado insesgado que surge naturalmente
m1 - m2
entonces
m1 - m2 ~ N (µ1 - µ2, σ12/n1+ σ22/n2)
y el error estándar del estimador puntual es
SE = √(σ12/n1+ σ22/n2)
entonces
(m1 - m2) / √(σ12/n1+ σ22/n2)
provee un estadístico de prueba. Si las varianzas poblacionales no son conocidas, pero los
tamaños de las muestras son grandes, entonces la fórmula anterior puede ser utilizada
reemplazando las varianzas poblacionales por las varianzas muestrales.
23
Universidad del CEMA
Métodos Cuantitativos
Caso 2
Prof. José P Dapena
Datos no matcheados – tamaños muestrales pequeños
Este es un caso difícil que debe ser analizado con cuidado. El problema es similar al visto
en el caso 1 de manera tal que tenemos la siguiente distribución muestral
m1 - m2 ~ N (µ1 - µ2, σ12/n1+ σ22/n2)
como antes. Sin embargo, si procedemos a reemplazar las varianzas poblacionales por su
correspondiente estimador muestral, entonces encontraremos dificultades porque el
estadístico standarizado que obtenemos no sigue una distribución t y en consecuencia la
teoria de intervalo de confianza no es de aplicación. Este dificil problema ya fuen tratado
anteriormente.
En su lugar, si estamos en condiciones de hacer el supuesto que las poblaciones poseen la
misma variabilidad, entonces es materia simple el computar el intervalo de confianza.
Suponiendo σ1 = σ2 = σ, entonces el error estándar se transforma en σ√(1/n1 + 1/n2),
Que procedemos a estimar por s√(1/n1 + 1/n2) en n1 + n2 - 2 grados de libertad., donde s2 es
computada a traves de hacer un pool entre la suma corregida de cuadrados de ambas
muestras, asi
s2 = (SCC1 + SCC1) / (n1 + n2 - 2), o equivalentemente
s2 = {(n1 – 1)s12 + (n2 – 1)s22}/ (n1 + n2 - 2) con n1 + n2 - 2 grados de libertad.
Esta ultima formula muestra que s2 es una función ponderada de las varianzas muestrales –
ponderada por los grado de libertad.
24
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
El estadístico de prueba es entonces
(m1 - m2) / √{((n1 – 1)s12 + (n2 – 1)s22/ (n1 + n2 - 2))/(1/n1+ 1/n2)}
Caso 3
Datos matcheados – muestras pequeñas
Este es el caso mas facil de analizar, debido a que se reduce unicamente al analisis de
diferencias. Si, en cada par de datos, tomamos la diferencia de los mismos, tendremos
d1 = x1 – y1, d2 = x2 – y2, ........dn = xn – yn,
entonces µd = µx - µy, entonces utilizando los d’s podemos testear µd = 0, usando un
estadístico t, como en la sección 9.6.
6.15
Prueba para las varianzas
La teoría de distribuciones subyacentes en estas pruebas ya fué descripta, y el método de
prueba hace un paralelo con el correspondiente para la determinación de intervalos de
confianza, pero con el procedimiento usual de decisión de comparar el estadístico de prueba
con la(s) cola(s) de la distribución muestral bajo la hipótesis nula.
25
Universidad del CEMA
Métodos Cuantitativos
Prof. José P Dapena
Prueba para la varianza
En orden de testear una hipótesis nula como H0: σ2 = σ02 utilizamos el estadístico de prueba
(n – 1) s2 /σ02
y comparamos su valor con aquel correspondiente a la(s) cola(s) en la distribución chi
cuadrada con n – 1 grados de libertad
Prueba para la comparación de varianzas
En orden de testear la hipótesis nula H0: σ12 = σ22
utilizamos el estadístico F = {s12 / s22} y comparamos dicho valor con el correspondiente a
la(s) cola(s) de la distribución F con {n1 -1, n2 – 2} grados de libertad.
26
Descargar