Subido por Noelia Arce

U8- Contrastes de Hipótesis Especiales

Anuncio
PROBABILIDAD Y ESTADÍSTICA
U8: CONTRASTES DE HIPÓTESIS ESPECIALES
INTRODUCCIÓN
El contraste es paramétrico cuando las hipótesis planteadas son
paramétricas, es decir, cuando las hipótesis se refieren al valor de un
parámetro desconocido de la población, sin embargo el contraste es no
paramétrico cuando las hipótesis planteadas son no paramétricas, o lo que es
lo mismo, cuando las hipótesis se refieren a otras características (forma de la
distribución, localización, aleatoriedad de una muestra, etc.)
En la práctica difícilmente será conocida la forma funcional de la
distribución de donde proceden los datos, siendo por ello necesario considerar
métodos alternativos que no requieren el conocimiento de esa distribución pero
que sí nos permitan hacer inferencias sobre la población. A estos métodos los
llamamos métodos no paramétricos o de libre distribución y estarán
caracterizados por el desconocimiento de su distribución, aunque utilizan
estadísticos cuya distribución se puede obtener con independencia de la
distribución de la población de partida, siendo las condiciones menos
restrictivas que las exigidas en los métodos paramétricos; evidentemente
existirán condiciones, por ejemplo, que la distribución sea de tipo continuo.
En general los contrastes no paramétricos, necesitan pocas hipótesis
para su planteamiento y la mayoría de las veces son más fáciles de aplicar que
los contrastes paramétricos. Además, hasta ahora, en los contrastes
paramétricos venimos analizando caracteres cuantitativos y por tanto
perfectamente cuantificables, sin embargo en los contrastes no paramétricos
podemos trabajar con características (o variables) ordinales, en las que solo
interesa el orden o rango, e incluso nominales, en las que los valores se utilizan
para indicar las distintas modalidades o categorías, por ejemplo, el sexo,
podemos utilizar el 0 para el femenino y el 1 para el masculino, pero
evidentemente el número asignado es arbitrario, pues el número lo utilizamos
solamente para designar la categoría. Esto nos permite ampliar el campo de
aplicación de los test de hipótesis.
Hay muchos posibles test no paramétricos, así pues, algunos de los test
paramétricos estudiados en la unidad anterior tienen su correspondiente test no
paramétrico. Un test no paramétrico es más fácil de realizar y requiere menos
cálculo que su correspondientes test paramétrico y nos podemos preguntar,
¿porqué utilizamos test paramétricos? La respuesta es que los test no
paramétricos generalmente son menos potentes que sus correspondientes
paramétricos. Un test no paramétrico será preferido cuando el cálculo y el
procedimiento de ejecución aportan una simplificación importante frente al test
no paramétrico. Además los test no paramétricos, como ya hemos indicado,
tienen aplicación para datos cualitativos y por tanto, en algunas ocasiones el
test no paramétrico será el único que podamos aplicar.
Distribución Chí - cuadrado
Prof. Adj. Mónica G. Osuna – Profesorado en Matemática
1
PROBABILIDAD Y ESTADÍSTICA
Características de la distribución
La función de densidad de probabilidad para ji cuadrada se representa
matemáticamente con la siguiente ecuación:
(
)
( )(
)
donde k depende sólo de gl, es decir de los grados de libertad, 2 es ji
cuadrada, y es la base de los logaritmos naturales. No se tratará el desarrollo
de la ecuación anterior, sino que se hará referencia a las características de 2
que permitirán su aplicación para la inferencia estadística. Estas características
son las siguientes:
1') 2 es una variable aleatoria que no puede asumir valores negativos.
2') La distribución 2 tiene un sólo parámetro: los grados de libertad (gl).
3') La distribución 2 es continua y unimodal. Al igual que z y t, el área bajo la
curva 2 representa probabilidades.
4') La distribución 2 tiene sesgo a la derecha. A medida que aumenta gl, el
sesgo es menor, y se aproxima a una distribución normal.
5') La media de 2 está dada por los grados de libertad, E (2) = gl. La varianza
es el doble de los grados de libertad, Var (2) = 2 gl.
6') La ecuación representa una familia de distribuciones. Hay una distribución
diferente para cada grado de libertad.
Uso de las tablas de
Ya se estableció que la curva 2 representa probabilidades. Para cada posible
valor de gl puede construirse una tabla de probabilidades. No obstante, puede
utilizarse la tabla 2.
Prof. Adj. Mónica G. Osuna – Profesorado en Matemática
2
PROBABILIDAD Y ESTADÍSTICA
La tabla muestra los valores críticos 2 que se denota por 2 (gl,α). El subíndice
tiene dos números, gl indica los grados de libertad y α indica el porcentaje
cortado bajo la cola superior de la distribución.
Las probabilidades más comúnmente utilizadas se consignan en el
encabezamiento de la tabla, siendo representadas por el área de la cola
superior de la curva. En la columna izquierda se muestran los grados de
libertad. El valor por una gl y para una probabilidad dada constituye el valor
crítico 2 que corta la cola superior (o lado derecho) bajo la curva.
Por ejemplo el valor 2 que corta el 5% de la distribución con 8 grados de
libertad es:
2(8,0,05) = 15,507
Aplicaciones de
Existen problemas donde deben realizarse inferencias acerca de la
distribución de toda una población en base a observaciones muestrales donde
las hipótesis de las pruebas no son aseveraciones acerca del parámetro de una
población, sino verificar hipótesis tales como “una moneda es regular” o “las
variables desempeño e instrucción son independientes”.
Los datos son categorizados y los resultados se muestran en forma de
conteo. Por ejemplo, los salarios de los empleados de una compañía
representados a través de una tabla de frecuencias. Cada frecuencia se anota
en una celda o clase. Las frecuencias observadas de la muestra se denotan
por f01 f02, ....f0n. La suma de todas las frecuencias observadas es igual al
tamaño de la muestra, o sea:
f01 + f02 + .... + f0n = n
Estos valores observados, se comparan con frecuencias esperadas o teóricas
fe1, fe2 + ... + fen que se obtienen de distribuciones teóricas específicas,
también en este caso:
fe1 + fe2 + .... + f en = n
La prueba consiste en determinar si las frecuencias observadas concuerdan o
discrepan con las esperadas.
El estadístico de prueba es:
∑
(
)
El numerador es la diferencia al cuadrado, la cual sólo puede tomar
valores positivos. Mientras menor sea la diferencia, menor será el valor de 2.
Los valores pequeños de 2 indican concordancia, mientras que los valores
grandes indican discrepancia, entre los dos conjuntos frecuencias.
Debe observarse que es común que estas pruebas son de una sola cola.
Prof. Adj. Mónica G. Osuna – Profesorado en Matemática
3
PROBABILIDAD Y ESTADÍSTICA
Los valores calculados del estadístico de prueba2 se basan en datos discretos,
pero la distribución 2 es continua. Si las fe son grandes, la distribución del
estadístico de prueba puede aproximarse a la distribución de 2. Una regla
práctica es que la fe para cada clase debe ser por lo menos 5. Las categorías
que no cumplen este criterio deben combinarse con otras adyacentes cuando
sea posible.
El estadístico de prueba se utiliza para las pruebas de bondad de ajuste,
de independencia y de homogeneidad. La distribución 2 también se utiliza para
probar el valor de un parámetro, como es “la prueba de la varianza”.
Prueba para la bondad de ajuste
En esta prueba, H0 especifica una distribución uniforme (todos los
valores posibles de una variable aleatoria son igualmente probables), binomial,
Poisson, etc. Se elige una muestra y se prueba si la distribución muestral sigue
a la distribución teórica especificada en H 0. La hipótesis alternativa afirma que
la muestra no ha sido tomada de la distribución específica.
La prueba implica n observaciones que se clasifican en k clases o
categorías, donde en cada celda se anotan las frecuencias observadas que se
comparan con las esperadas a través de los cálculos, utilizando el estadístico
de prueba de 2.
El valor que se requiere de la estadística 2 para rechazar o aceptar H0
depende del nivel de significación y de los grados de libertad (gl). Para la
prueba de bondad de ajuste, los grados de libertad son iguales al número de
categorías o clases menos 1, es decir:
gl = k - 1 (32)
Si el valor del estadístico de prueba es mayor o igual al valor crítico se dice que
el ajuste es malo y se rechaza H 0. Si el valor 2 es pequeño, se dice que el
ajuste es bueno y se acepta H 0.
Ejemplo: Una empresa dedicada a estudios de mercados está interesada en
las preferencias de las amas de casa de 4 zonas de la ciudad respecto a una
marca de arroz. Selecciona una muestra al azar de 200 amas de casas con los
siguientes resultados:
ZONA
A
B
C
D
TOTAL
Preferencias
(fo)
35
43
64
58
200
Estas preferencias constituyen las frecuencias observadas. Bajo la
hipótesis de que p A = pB = pC = pD todas estas probabilidades son iguales a 1/4.
Entonces las frecuencias esperadas son cada una igual a 50 (1/4.200).
Prof. Adj. Mónica G. Osuna – Profesorado en Matemática
4
PROBABILIDAD Y ESTADÍSTICA
Planteando las hipótesis:
H0: Las preferencias están distribuidas de manera uniforme en las cuatro
zonas.
H1: Las preferencias no están distribuidas de manera uniforme en las cuatro
zonas.
Las categorías son 4, por lo tanto los grados de libertad son 3, ya que:
k = 4 gl = k - 1 gl = 4 - 1 = 3
Utilizando un nivel de significación del 5%, el valor crítico con 3 grados de
libertad es:
2(3,0,05) = 7,814
Rechazar H0 si 2 es mayor o igual a 7,814.
Los cálculos para obtener 2 se muestran a continuación:
(
Zona
)
(
)
A
35
50
-15
225
4,5
B
43
50
-7
49
0,98
C
64
50
14
196
3,92
D
58
50
8
64
1,28
10,68
∑
(
)
Como 2 es mayor que 7,814, se rechaza H 0 es decir no hay uniformidad
en las preferencias en las 4 zonas.
En el cálculo de las frecuencias teóricas, puede haber restricciones
adicionales. Si la media de la muestra X se utiliza para estimar para obtener
las frecuencias esperadas, esta restricción reduce el número de grados de
libertad en 1.
En general, si hay m estimaciones muestrales utilizadas para m
parámetros desconocidos en el cálculo de frecuencias teóricas, el número de
grados de libertad está aún más reducido por m, es decir:
gl = k - 1 - m
Prof. Adj. Mónica G. Osuna – Profesorado en Matemática
5
PROBABILIDAD Y ESTADÍSTICA
Test de Independencia
En los tests de independencia existen dos variables categóricas y la
prueba consiste en suponer que ambas variables son estadísticamente
independientes.
La independencia implica saber que la categoría en la que se clasifica
una observación con respecto a una variable, no tiene ningún efecto sobre la
probabilidad de caer también en alguna de las diversas categorías de las otras
variables5. Dicho de otra manera, el problema es determinar si existe alguna
relación entre dos conjuntos de atributos de una población.
La prueba
de independencia tiene una metodología parecida a la
prueba de bondad de ajuste. La misma se explicará con el siguiente problema:
En una empresa se desea conocer si hay alguna relación entre la
asistencia de los empleados y el sexo. La asistencia se clasifica en
“satisfactoria” (S) y “no satisfactoria” (NS). Para la prueba se toma una muestra
de 100 empleados.
1') Planteo de Hipótesis
H0: Sexo y Asistencia son variables independientes.
H1: Sexo y Asistencia son variables dependientes.
2') Las frecuencias observadas de la muestra se anotan en una tabla de
contingencia (o de clasificación doble) de dimensión r . k, donde:
r = el número de renglones.
k = el número de columnas.
Sexo
V
M
Total
S
45
25
70
NS
15
15
30
Total
60
40
100
Asistencia
La tabla tiene dos categorías de renglón (V y M) y dos de columnas (S y
NS), por lo tanto es una tabla de 2 x 2.
3') Las f0 deben compararse con las frecuencias esperadas. La f e de cada celda
de la tabla debe ser proporcional al total de f 0 es la frecuencia total del renglón y
fk es la frecuencia total de la columna, la frecuencia esperada se determina
como:
Prof. Adj. Mónica G. Osuna – Profesorado en Matemática
6
PROBABILIDAD Y ESTADÍSTICA
∑
La tabla de frecuencias esperadas para el problema del ejemplo queda
confeccionada así:
Sexo
V
M
Total
S
42
28
70
NS
18
12
30
Total
60
40
100
Asistencia
La fe de la primera celda (S y V) se obtiene:
(
)(
)
4') Los grados de libertad para la prueba de independencia se determinan por
la siguiente fórmula:
(
)(
)
Para este problema r = 2 y k = 2
(
) (
)
5') Si se usa a = 0,05, el valor crítico es:
, por lo tanto la regla de decisión es:
(
)
Rechazar H0 si
3,841
Aceptar H0 si
< 3,841
6') El estadístico de prueba es el mismo que se utilizó para la bondad de ajuste
o sea:
(
)
∑
En este caso, se eleva el cuadrado la diferencia entre f0 y
fe de cada celda y se
divide entre la fe de dicha celda.
(
)
(
)
(
)
(
)
= 1,786 es menor que el valor crítico. Se aceptar H 0 y se demuestra que la
asistencia y el sexo son independientes, es decir no hay ninguna relación.
Prof. Adj. Mónica G. Osuna – Profesorado en Matemática
7
PROBABILIDAD Y ESTADÍSTICA
Prueba de Homogeneidad
Esta prueba para
es una extensión del test de independencia donde
también se trabaja con datos clasificados cruzadamente y se utiliza el mismo
estadístico de prueba. Las diferencias entre ambas pruebas son las siguientes:
1) Las pruebas de independencia tienen como objetivo decidir si dos variables
son independientes, mientras que las pruebas de homogeneidad se aplican
cuando se desea saber si diferentes muestras provienen de la misma
población.
2) El test de independencia supone una sola muestra obtenida de una sola
población; la prueba de homogeneidad suponen dos o más muestras
independientes, donde cada una procede de cada una de las poblaciones
distintas bajo estudio.
3) El aspecto anterior implica que en la prueba de independencia, todas las
frecuencias marginales son cantidades al azar, mientras que en el criterio de
homogeneidad, los totales de los renglones (o filas) son tamaños de muestras
que son números elegidos.
Considérese el siguiente problema. Los técnicos de un establecimiento
que fabrica fiambres y embutidos deben decidir la adopción de un nuevo
proceso para elaborar jamón cocido tipo A. Eligen 200 piezas obtenidas
mediante el proceso nuevo y 200 mediante el proceso tradicional. Los
resultados son:
Piezas
Proceso
(1) Defectuoso
(2) Buenas
Total
Nuevo (a)
22
178
200
Tradicional (b)
36
164
200
Total
58
342
400
La hipótesis nula puede plantearse como que las dos muestras proceden de la
misma población, es decir que las dos clasificaciones son homogéneas en lo
que respecta al estado de las piezas. Esto significa que no hay diferencia entre
los dos métodos.
S se define:
p1a: probabilidad de nuevo y defectuoso
p2a: probabilidad de nuevo y buena
p1b: probabilidad de tradicional y defectuosa
p2b: probabilidad de tradicional y buena.
Prof. Adj. Mónica G. Osuna – Profesorado en Matemática
8
PROBABILIDAD Y ESTADÍSTICA
{
Con la expresión alternativa de H0 se puede determinar porque se
denomina homogeneidad. Al decir homogéneas se entiende que las cosas son
iguales o tiene algo en común.
Ahora, se estiman las proporciones de defectuosas y buenas, es decir:
58/400 y 342/400. Las frecuencias esperadas, por ejemplo, para el método
nuevo son:
(
)
(
)
Las frecuencias esperadas se muestran en el siguiente cuadro:
Piezas
(1) Defectuoso
Proceso
Total
(2) Buenas
Nuevo (a)
29
171
200
Tradicional (b)
29
171
200
Total
58
342
400
En resumen:
{
H1: alguna igualdad no se cumple. Los métodos son diferentes.
Los grados de libertad son:
(
)(
)
(
)(
)
Si = 0,01, entonces el valor crítico de
Rechazar H0 si
6,634
Aceptar H0 si
< 6,634
6,634, por lo tanto:
Aplicando el estadístico de prueba:
∑
(
)
(
)
(
(
)
)
(
)
Se acepta H0.
Prof. Adj. Mónica G. Osuna – Profesorado en Matemática
9
Descargar