para descargar el archivo

Anuncio
Cátedra I Estadística II
Autor I Marín Saino
Objetivos
Una vez estudiado este Capítulo, el estudiante estará en condiciones de:
•
•
•
Reconocer cuando es necesario aplicar procedimientos no paramétricos
para prueba para hipótesis.
Utilizar este tipo de metodología para probar hipótesis de independencia,
de bondad de ajuste y de homogeneidad.
Reconocer casos en que deban aplicarse otras pruebas no paramétricas.
Contenidos
1. Introducción.
2. Las pruebas Chi-cuadrado.
2.1. Prueba de la bondad de ajuste.
2.2. Prueba de independencia: Tablas de contingencia.
2.3. Prueba de homogeneidad.
2.3.1. Comparación de dos proporciones, muestras independientes.
Similitudes de la prueba Z y
χ2 .
2.3.2. Comparaciones múltiples de proporciones.
3. Prueba de Kolmogorov-Smirnov.
4. Otras pruebas no paramétricas.
4.1. Contraste de la mediana para muestras independientes.
4.2. Prueba de rangos con signo de Wilcoxon.
4.2.1. Para una muestra.
4.2.2. Para muestras dependientes.
4.2.3. Para muestras independientes.
4.3. Prueba U de Mann-Whitney: muestras independientes.
175
Cátedra I Estadística II
Autor I Marín Saino
176
Cátedra I Estadística II
Autor I Marín Saino
1. Introducción
Todos los métodos de inferencia que hasta aquí vimos se han circunscripto a
parámetros poblacionales (intervalos de confianza o pruebas de hipótesis). En general,
estos métodos están vinculados a una serie de supuestos bastante restrictivos acerca
de características de la población (v.gr.: distribución normal de la población, igualdad
de varianzas para diversos grupos, etc.).
En este Capítulo, encaramos el estudio de los denominados Métodos No Paramétricos
o de Distribución Libre1/. Estos métodos tienen la particularidad de realizar inferencias
estadísticas no sólo referidas a parámetros poblacionales, sino también a otras
situaciones como por ejemplo probar si dos variables cualitativas están asociadas o no
(pruebas de independencia), o si la distribución de cierta característica es similar en
varias poblaciones (pruebas de homogeneidad); o si la forma de la distribución
poblacional de cierta variable es normal, o Poisson, o si responde a cierta forma
específica (pruebas de la bondad de ajuste). A veces también se refieren a parámetros
poblacionales como la mediana, la media o la varianza.
Debe tenerse en cuenta que aún cuando puedan aplicarse de manera efectiva los
métodos no paramétricos, hay que proceder con prudencia ya que estas pruebas, para
un número dado de observaciones, tienen menor potencia (es decir, menor aptitud
para rechazar la hipótesis nula) que los tests paramétricos.
Si bien existe una gran cantidad de pruebas estadísticas no paramétricas, aplicables a
distintas situaciones concretas, especialmente nos ocuparemos de
las llamadas
“pruebas Chi-cuadrado” y de la prueba de Kolmogorov. No obstante ello, también
daremos una breve idea de otros procedimientos, tales como el Contraste de la
Mediana, las pruebas de Wilcoxon y la prueba de Mann-Withney.
2. Las pruebas Chi- cuadrado
Las pruebas Chi-cuadrado se utilizan para probar hipótesis referidas a los patrones de
comportamiento de frecuencias relacionadas con variables ya sean cuantitativas o
cualitativas. En este sentido, entre las pruebas más comunes se encuentran la de
Bondad del Ajuste, la de Independencia y la de Homogeneidad.
En general, tal como hemos visto en los Capítulos anteriores, el procedimiento de
prueba comienza con la formulación de las hipótesis; en particular, la hipótesis nula.
En ésta se plantea el modelo teórico que determinaría el comportamiento de las
frecuencias. Luego, se comparan con los datos efectivamente obtenidos y se
cuantifican las diferencias numéricas efectivamente halladas. Ahora bien, para juzgar
la significatividad de las diferencias halladas, Karl Pearson (1900) propuso el
estadístico de prueba Ji-Cuadrado2/, una prueba cuyos detalles de implementación se
presentan en el apartado siguiente. En esencia, la prueba consiste en determinar si
esas diferencias se deben a variaciones al azar y por lo tanto no son significativas o si
por el contrario son significativas. En el primer caso no se rechaza la hipótesis nula
planteada, mientras que en el segundo se rechaza.
1/
2/
Estos términos aunque se usen como sinónimos, estrictamente no lo son. Por ejemplo para entender la diferencia entre ellos, la desigualdad de Tchebycheff aunque no es estrictamente no
paramétrica dado que involucra a µ y σ, es una distribución libre puesto que es válida cuando
la distribución es desconocida.
Ji- Cuadrado es sinónimos de Chi-Cuadrado, en ambos casos nos referimos a la letra griega
χ elevada al cuadrado, y la razón por la que estas pruebas se designan con este nombre, es
que los estadísticos de prueba que se utilizan siguen la distribución
177
χ2 .
Cátedra I Estadística II
Autor I Marín Saino
Independientemente de los pasos (convencionales) a seguir para realizar una prueba
de hipótesis, seguidamente planteamos algunas cuestiones particulares acerca de
temas tales como el estadístico de prueba, las hipótesis, y algunas restricciones
referidas al tamaño necesario de las muestras.
El estadístico de prueba
Como se señaló más arriba, el método básicamente consiste en comparar las
frecuencias observadas (oi) con las frecuencias esperadas (ei) según el modelo que se
plantea en la hipótesis nula.3 Se diseña entonces, como medida de la diferencia, la
suma de los cuadrados de dichas diferencias en proporción a las frecuencias
esperadas4/, es decir:
(oi - ei ) 2
: c k2- m 5/
å
i= 1
ei
k
donde los grados de libertad se corresponden con el número de valores (categorías o
clases) comparados (k), menos el número de restricciones lineales independientes
impuestas a la comparación (m)6/.
Si la hipótesis nula es verdadera, el valor del estadístico debería estar cercano a cero,
ya que la diferencia del numerador sería muy pequeña. Por contraposición, si la
hipótesis nula es falsa el numerador será grande debido a que las diferencias están
elevadas al cuadrado.
La prueba de hipótesis: ¿unilateral o bilateral?
Este problema puede resolverse fácilmente de manera lógica. La prueba es lateral
derecha y se utilizan los valores de la cola superior de
χ2
para ubicar la zona de
rechazo, debido a que desviaciones grandes de los valores observados con los valores
esperados, tienden a contradecir la hipótesis nula respecto a las probabilidades
asociadas pi a las categorías (valores o clases). Por lo tanto la hipótesis nula se
rechazará cuando el estadístico de la prueba χ
2
(valor observado bajo el supuesto de
hipótesis nula cierta) asuma un valor grande.
Figura 1:
f ( χ k2− m )
α
χ k2− m;1−α
3/
4/
5/
6/
χ2
χi2i
oi y ei representan el valor observado y esperado de ni, respectivamente.
Lo que constituye una gran diferencia es relativo, ya que si la diferencia proviene de una categoría con pocas observaciones, esa diferencia va a contribuir más al valor del estadístico que si
esa misma diferencia proviene de una categoría con muchas observaciones. Es por ello que se
realiza un ajuste al tamaño de la celda, esto es considerando la frecuencia esperada en el
denominador.
En el Apéndice IV.A, se puede revisar una justificación intuitiva que permite aceptar su uso.
El número de grados de libertad es distinto para cada aplicación, esto quedará más claro cuando se estudien cada una de ellas y a través de los ejemplos prácticos. En cuanto a las restricciones lineales independientes, una que siempre está presente es porque la suma de los
conteos de las categorías siempre debe ser igual a n, es decir: o1 + o2 +...+ ok = n. Entonces
m = p +1, donde p es la cantidad de parámetros que estiman por máxima verosimilitud.
178
Cátedra I Estadística II
Autor I Marín Saino
Restricción al número de frecuencias en cada categoría
Como regla empírica, la experiencia ha demostrado que la frecuencia esperada
asociada a cada categoría debe ser por lo menos 5. Esta restricción se impone para
evitar valores sobreestimados de Chi-cuadrado al efectuar el cociente entre las
diferencias al cuadrado y frecuencias esperadas muy pequeñas. En aquellos casos en
que se presente una o más categorías con frecuencias menores a 5, se las puede
agrupar en una sola categoría antes de calcular las diferencias (entre las frecuencias
observadas y esperadas). Esto fijará el número de grados de libertad a utilizar dado
que en el cálculo del mismo intervendrá la cantidad de clases (k) luego del
reagrupamiento.
En los apartados siguientes se desarrollarán las aplicaciones de las pruebas Chicuadrado
2.1. Prueba de la bondad de ajuste
Esta es una prueba para decidir, a partir de una muestra particular, si se rechaza o no
la hipótesis de que una variable aleatoria7/ se ajusta a una distribución probabilística
específica. Por ejemplo, en los Capítulos anteriores los métodos aplicados se basaban
en el supuesto de población normal o tamaños de muestra lo suficientemente
grandes como para que proceda la aplicación del TCL.
Un procedimiento adecuado para contrastar ese supuesto es la prueba de la bondad
del ajuste, debiendo aclararse que no es en el único caso en que se puede aplicar esta
prueba ya que, ésta es susceptible de utilizarse cualquiera sea la distribución
especificada: uniforme, Poisson, exponencial, normal, entre otras.
El procedimiento comienza con el planteo de la hipótesis nula de que la variable
aleatoria bajo estudio tiene una distribución específica. Luego se toma una
muestra aleatoria de la población, la cual provee las frecuencias observadas. Seguidamente se compara con la distribución teórica. Los valores de las probabilidades
teóricos cuando se los multiplica por el tamaño de la muestra, se transforman en las
frecuencias esperadas.
Algunos ejemplos pueden describir mejor el procedimiento de prueba.
Supongamos el siguiente caso:
Una financiera registró el número de días de atraso por semana en el pago de los
préstamos acordados para los últimos 80 clientes. Los resultados se muestran en
la Tabla 1. Con el objeto de estimar intereses y saldos disponibles para próximos
préstamos, desea probar la hipótesis de que la variables aleatoria “días de atraso”
se ajusta a una distribución Poisson.
Tabla 1:
Días de atraso
0
1
2
3
4
5
6
Total
7/
Cantidad de clientes
19
25
22
8
3
2
1
80
La variable aleatoria se genera a partir de un experimento multinomial (Ver Apéndice IV.A).
179
Cátedra I Estadística II
Autor I Marín Saino
1.- Hipótesis:
Ho : El número de días de atraso se distribuye Poisson, P (x, λ=?)
H1 : El número de días de atraso no se distribuye Poisson
En primer lugar como se desconoce λ, se deberá encontrar su estimador de
∧
_
máxima verosimilitud: λ = x . Para los datos presentados en la Tabla 1,
(sugerimos que usted lo calcule y verifique este resultado).
∧
λ = 1, 51
2.- Nivel de significación:
Se elige un nivel de significación, para el ejemplo tomaremos α = 0,05 (asignado
arbitrariamente). Por lo tanto, 0,05 es la probabilidad de rechazar una hipótesis
nula verdadera.
3.- Cálculo del valor observado del estadístico:
El estadístico de prueba, según se especificó antes se calcula mediante la siguiente
(oi - ei ) 2
i= 1
ei
k
expresión:
2
c obs
= å
(bajo el supuesto de hipótesis nula cierta).
Los pasos necesarios para calcularlo se encuentran en la Tabla 2 y a continuación
se referencia cada columna de la misma.
Columna (1) y (2): corresponden a los valores observados en la muestra y sus
frecuencias asociadas (también observadas).
∧
Columna (3): cálculo de las probabilidades teóricas de Poisson: P(xi, λ = 1, 51 ), a
partir de las tablas estadísticas.
Columna (4): cómputo de las frecuencias esperadas o teóricas. Surgen de multiplicar el tamaño de muestra por la probabilidad teórica asociada a cada
valor de la variable. Luego, Las tres últimas clases se agrupan dado
que las frecuencias teóricas son menores que 5, entonces k = 5 (5
categorías después del reagrupamiento).
Columna (5): cálculo del cociente entre el cuadrado de las diferencias y la frecuencia esperada para cada línea. La suma es el valor de Chi-cuadrado
Tabla 2:
(1)
Días de atraso
0
1
2
3
4
5
4 o más
6
Total
Cantidad de
clientes (oi)
19
25
22
8
3
6
2
1
80
(3)
P (xi; 1,51)
0,2209
0,3336
0,2518
0,1268
0,0479
0,0145
0,0036
1,0000*
(4)
ei = 80.[P(xi)]
18
27
20
10
4
5
1
0
80*
(5)
(oi – ei)2 / ei
0,06
0,15
0,20
0,40
0,20
1,01
* Estos valores no son exactamente 1 y 80, respectivamente, debido a errores de redondeo.
4.- Regla de decisión:
Recuérdese que se necesita encontrar un valor (valor crítico) que separe la zona
de no rechazo de la zona de rechazo, tal como se muestra en la Figura 1.
180
Cátedra I Estadística II
Autor I Marín Saino
En cuanto a los grados de libertad8/, se obtienen de la siguiente manera:
g. l. = k – m = 5 – 2 = 3. Esto es debido a que k = 5, y se tienen m = 2
restricciones lineales ya que hay una restricción lineal porque la suma total de los
conteos tiene que ser igual a n, más una restricción de estimar un parámetro
desconocido que se requiere para calcular las frecuencias esperadas.
El valor crítico para 3 grados de libertad y al nivel de significación 0,05 (a la
derecha), se encuentra en las tablas estadísticas y es igual a 7,81. Es decir:
2
χ 2 = χ (3;0,95)
= 7, 81 ,
*
porque
P( χ i2(3) > 7, 81) = 0, 05
y podemos expresar la regla de decisión de la siguiente forma:
ZNR = { χ 2 / χ 2 ≤ 7, 81} ,
la zona de no rechazo está conformada por los valores
Chi-cuadrado tales que sean menores o iguales a 7,81.
El complemento:
ZR = { χ 2 / χ 2 > 7, 81} ,
la zona de rechazo está conformada por
todos los valores Chi-cuadrado tales que sean mayores a 7,81.
5.- Decisión o inferencia final:
El valor observado de
χ2
(1,01) es menor que 7,81. Por lo tanto no se rechaza la
hipótesis nula y podemos inferir, a un nivel de significación del 5%, que la
distribución del número de días de atraso se distribuye Poisson.
Para los siguientes datos comprobaremos si los mismos provienen de una
distribución normal:
Tabla 3:
N° de
observación
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Valor de la
variable
82,00
90,00
87,52
87,00
74,00
74,10
87,14
104,70
89,00
87,00
87,15
79,56
100,00
83,00
85,97
N° de
observación
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Valor de la
variable
73,93
76,28
100,00
96,62
95,26
91,00
82,08
102,00
87,60
89,87
102,27
88,07
87,13
97,00
81,17
La prueba Chi-cuadrado de la bondad de ajuste para probar la normalidad sigue el
procedimiento desarrollado. Su aplicación más frecuente se da cuando los datos
están disponibles tal como fueron recopilados y los parámetros µ y σ2 se estiman a
partir de dichos datos, por lo tanto su distribución tendrá (k-3) grados de libertad.
Cálculos necesarios para realizar la prueba.
8/
Recuerde que la distribución Chi-cuadrado es una familia de distribuciones, donde cada distribución depende de los grados de libertad.
181
Cátedra I Estadística II
Autor I Marín Saino
En este ejemplo ocurre lo mismo que en el anterior, se desconocen los parámetros
poblacionales entonces debemos estimarlos por el método de máxima
_
verosimilitud. Utilizamos a x y s2 como estimadores de los correspondientes
parámetros de la población, que para el ejemplo que presentamos arrojan los
siguientes resultados:
_
x=
i =1
n
_
30
30
∑ xi
= 88, 2810
y
s =
2
∑ ( xi − x)
i =1
n −1
2
= 73, 685 ⇒ s = 8, 584
Recordemos que, la frecuencia esperada asociada a cada intervalo no debería ser
menor que 5; en consecuencia, armaremos las clases teniendo en cuenta dicha
restricción y si bien no existe una forma preestablecida de cómo seleccionar la
cantidad de clases, existe una regla bastante difundida que es tomar intervalos
equiprobables (de igual probabilidad). Por ejemplo, si se decide armar 8 clases, la
probabilidad asociada a cada intervalo será igual a (1/8) entonces la frecuencia
esperada será ei = n. fi = 30 (0,125) = 3,75 que no cumple con la restricción
establecida; en cambio si para el caso planteado se decide armar 5 intervalos, la
probabilidad asociada será 0,20, ei = 6 y estamos en condiciones de aplicar el
procedimiento de Chi-cuadrado. La partición de la distribución en 5 intervalos, se
puede observar en el siguiente gráfico:
Figura 2:
z1
z2
z3
z4
zi
F(z1) = 0,20
F(z2) = 0,40
F(z3) = 0,60
F(z4) = 0,80
En primer lugar debemos calcular los límites de los intervalos de clase en términos
de la variable estandarizada, por ejemplo el primer intervalo es:
Límite inferior (LI): como la distribución normal es asintótica al eje de las abscisas,
el límite inferior es -∞.
Límite superior (LS): F(z1) = 0,20, entonces z1 = z0,20 = -z0,80 = -0,84.
El segundo intervalo, es:
LI : -0,84
LS: F(z2) = 0,40, entonces z2 = z0,40 = -z0,60 = -0,26 ... el procedimiento se repite
hasta construir los 5 intervalos de clase.
Luego se deberán calcular los intervalos en término de los valores reales para la
variable analizada. Por ejemplo, el límite superior del primer intervalo es:
_
x1 = x + z1.sx = 88, 281 − 0, 84.(8, 584) = 81, 06
182
Cátedra I Estadística II
Autor I Marín Saino
de la misma manera se calcularán los siguientes intervalos, quedando conformados tal como se muestran en la columna 1 de la Tabla 4.
Seguidamente se cuentan las observaciones que caen dentro de cada uno de los
intervalos construidos (oi). Las mismas se disponen en la columna 2 de la Tabla.
Tabla 4:
Intervalos de clase
-∞ ; 81,06
81,06 ; 86,04
86,04 ; 90,51
90,51 ; 95,49
95,49 ; ∞
Total
oi
5
5
10
3
7
30
ei = n/ k
6
6
6
6
6
30
(oi – ei)2 / ei
0,17
0,17
2,67
1,50
0,17
4,47
Valor del
estadístico
Hasta aquí se ha trabajado para obtener el valor del estadístico, en lo que sigue
realizaremos la prueba propiamente dicha:
1.- Ho: La variable se ajusta aproximadamente a una distribución normal
H1: La variable no se ajusta a una distribución normal
2.- Nivel de significación:
α
= 0,01
3.- Chi-cuadrado observado bajo el supuesto de hipótesis nula verdadera:
2
χ obs
= 4, 47
4.- Regla de decisión:
Los grados de libertad son: k – m = 2, donde k = 5 y m = p + 1 = 3; entonces: χ
2*
2
= χ (2;0,99)
= 9, 21 ≠ ,
debido a que
P( χ i2(2) > 9, 21) = 0, 01 ;
en conse-
cuencia podemos expresar la zona de no rechazo y la zona de rechazo como
sigue:
ZNR = { χ 2 / χ 2 ≤ 9, 21}
ZR = { χ 2 / χ 2 > 9, 21}
5.- Decisión o inferencia final: El valor observado de
χ2
(4,47) es menor al valor
crítico (9,21), por lo tanto no se rechaza la hipótesis nula y podemos inferir,
con un nivel de significación del 1%, que la distribución de la variable presentada se ajusta aproximadamente a la distribución normal.
El ejemplo que presentamos a continuación puede ser tratado de manera semejante al
anterior pero introduciremos dos variantes. La primera es que los intervalos vienen
dados, es decir tenemos una distribución de frecuencias presentada por intervalos de
las cuales no se poseen los datos originales. La segunda variante está referida a que la
distribución hipotética está especificada completamente, es decir se quiere inferir que
una determinada variable aleatoria se ajusta a un modelo teórico con parámetro/s
especificado/s.
183
Cátedra I Estadística II
Autor I Marín Saino
Analicemos el ejemplo:
Se afirma que el promedio de las comisiones por ventas de automóviles nuevos es
de $ 2500 por mes, con una desviación estándar de $ 360. Una muestra de 50
casos en la Ciudad de Córdoba reveló la siguiente distribución de las comisiones
(Tabla 5). Al nivel de significación de 5%, ¿se puede inferir que la población se
distribuye aproximadamente normal con la media y desviación estándar indicadas?
Tabla 5:
Comisiones
(en miles de $)
1,45 ; 1,75
1,75 ; 2,05
2,05 ; 2,35
2,35 ; 2,65
2,65 ; 2,95
2,95 ; 3,25
Cantidad de
ventas
3
12
14
9
7
5
Cálculos necesarios para realizar la prueba, referidos al estadístico
En el caso anterior las frecuencias esperadas surgieron directamente de particionar
la distribución teórica de probabilidad en intervalos equiprobables y luego se
calcularon los valores de zi para obtener seguidamente los valores de la variable
real correspondientes a los límites de clase. En este caso el proceso es inverso, los
límites de clase de la variable real ya están dados y necesitamos de los valores de
zi para calcular las probabilidades teóricas asociadas a cada clase. El límite inferior
teórico del primer intervalo será -∞ y el límite superior de ese intervalo, se obtiene
de la siguiente manera9/:
z1 =
x1 − µ
σ
=
1, 75 − 2, 5
0, 36
= −2, 08
El límite superior del segundo intervalo es:
z2 =
x2 − µ
σ
=
2, 05 − 2, 5
0, 36
= −1, 25
de la misma forma se obtienen los límites siguientes.
Una vez determinados los límites de clase que se muestran en la columna 2 de la
Tabla 6, debemos proceder a calcular las probabilidades teóricas asociadas. Para
ejemplificar, a continuación se calculan para los dos primeros intervalos (utilizando
la tabla estadística de la distribución normal).
Probabilidad asociada al primer intervalo:
P( zi < −2, 08) = 1 − 0, 9812 = 0, 0188
Probabilidad asociada al segundo intervalo:
P(−2, 08 ≤ zi < −1, 25) = F ( 2, 08) − F (1, 25) = 0, 0868
igual procedimiento se aplica para encontrar las sucesivas probabilidades. Los
resultados se muestran en la columna 4 de la Tabla 6.
9/
Nótese que en este caso se tienen los valores de los parámetros, por lo tanto se utilizan los
valores de los mismos en la fórmula de estandarización.
184
Cátedra I Estadística II
Autor I Marín Saino
Por último obtendremos las frecuencias esperadas para cada clase aplicando la
siguiente expresión: ei = n.(fi). Por ejemplo el área entre las comisiones de 1,75 y
2,05 (miles de pesos) es 0,0868, es decir se espera que 0,0868 x 50 = 4,34
operaciones de venta tengan una comisión entre 1750 y 2050 pesos. Los
resultados para todas las clases se muestran en la columna 5. En ella también
podemos observar que hay frecuencias esperadas menores que 5, en consecuencia
deberemos reagrupar dichas clases.
Tabla 6:
Comisiones
Valores z de Cantidad de
(en miles de $) los límites
ventas (oi)
-∞ ; -2,08
1,45 ; 1,75
3
15
1,75 ; 2,05
-2,08 ; -1,25 12
2,05 ; 2,35
-1,25 ; -0,42 14
2,35 ; 2,65
-0,42 ; 0,42
9
2,65 ; 2,95
0,42 ; 1,25
7
1,25 ; ∞
2,95 ; 3,25
5
Totales
50
f(z)
ei=n.fi
0,0188
0,0868
0,2316
0,3256
0,2316
0,1056
0,94
4,34
11,58
16,28
11,58
5,28
50
(oi – ei)2 / ei
5,28
17,89
0,51
3,26
1,81
0,01
23,48
Prueba de hipótesis:
1.- H0: La variable comisiones por ventas se distribuye aproximadamente normal
con media µ = 2500 $ y varianza σ2 = 360 $2.
H1: La variable comisiones por ventas no se distribuye aproximadamente
normal con media µ = 2500 $ y varianza σ2 = 360 $2.
2.- Nivel de significación:
α=0,05
3.- Chi-cuadrado observado, bajo supuesto de hipótesis nula verdadera:
2
χ obs
= 23, 48
4.- Regla de decisión:
Los grados de libertad son K – m = 4. No se estiman parámetros
poblacionales, por lo tanto m = 1, la única restricción lineal es porque el
conteo de las clases debe ser igual a n.
El valor crítico es χ
2*
2
= χ (4;0,95)
= 9, 49 , debido
a que P ( χ i (4)
2
> 9, 49) = 0, 05 ; en
consecuencia, podemos expresar la zona de no rechazo y la zona de rechazo
de la siguiente manera:
ZNR = { χ 2 / χ 2 ≤ 9, 49}
ZR = { χ 2 / χ 2 > 9, 49}
5.- Decisión o inferencia final: El valor observado de
χ2
(23,48) es mayor al valor
crítico (9,49), en consecuencia se rechaza la hipótesis nula y entonces podemos inferir, a un nivel de significación del 5%, que la distribución de la variable presentada no se ajusta a la distribución normal de parámetros µ = 2500 $
y σ2 = 360 $2.
Alguien puede preguntarse el porqué de estos dos métodos diferentes para efectuar la
misma prueba. Sucede que, por las características de la distribución normal (altas
probabilidades en el centro, bajas probabilidades en las colas), en muchos casos
cuando los intervalos son de igual amplitud, como en este último ejemplo, hay varios
intervalos con frecuencias esperadas muy bajas, que deben agruparse y disminuyen
rápidamente los grados de libertad. Trabajando de la otra manera (como en el
185
Cátedra I Estadística II
Autor I Marín Saino
segundo ejemplo), construyendo intervalos de igual probabilidad (pero no de igual
amplitud), nos aseguramos que cada intervalo tenga una frecuencia esperada no
inferior a 5 (esto se logra simplemente haciendo que n dividido la cantidad de
intervalos no sea menor que 5).
Hasta aquí estudiamos la prueba de bondad de ajuste para probar si los datos se
ajustan a un modelo probabilístico teórico, no obstante el procedimiento de la bondad
de ajuste se puede aplicar para determinar qué tan bien se ajusta un conjunto
observado de datos a una hipótesis que implica una determinada distribución de
frecuencias “esperadas” que pueden no corresponder a alguna distribución teórica
conocida. Las actividades 1 y 2 que se presentan a continuación son de este tipo.
Actividad 1:
El jefe de personal de una empresa quiere probar si el nivel de ausentismo por
parte de sus empleados es homogéneo durante los 5 días laborables, su
sospecha surge a partir de los registros de la cantidad de ausencias del último
mes ya que observa una mayor cantidad de ausencias los días lunes y viernes.
Si esa diferencia es probada entonces invertirá parte del presupuesto para
investigar las ausencias (por ejemplo visitas domiciliarias) el mes próximo. Los
registros del último mes se muestran en la Tabla siguiente:
Días
laborales
Lunes
Martes
Miércoles
Jueves
Viernes
Total
Cantidad de
ausencias
15
10
8
9
13
55
Probar si el ausentismo es similar durante todos los días laborales a un nivel
de significación del 5%.
Ayuda: las frecuencias esperadas deben calcularse suponiendo que las
ausencias se distribuyen igual durante los 5 días (11 cada día).
Actividad 2:
Con el objeto de investigar determinados hábitos de comportamiento de los
estudiantes de 5 Facultades, la Secretaría de Asuntos Estudiantiles de la UNC
seleccionó una muestra de ellos. La Tabla siguiente muestra el porcentaje de
alumnos inscriptos (respecto a la cantidad total de inscriptos en esas 5
Facultades = 79265) y la cantidad de entrevistas logradas, según las
Facultades.
Porcentaje de
inscriptos
29
22
22
16
11
100%
Facultad
Medicina y Enfermería
Derecho
Ciencias Económicas
Arquitectura
Filosofía y Humanidades
Total
Número de
entrevistas
240
200
200
100
60
800
Probar si el número de entrevistas logradas en la muestra se distribuye con
idéntica proporción que los estudiantes inscriptos en esas 5 Facultades.
Trabaje con un nivel de significación del 1%.
186
Cátedra I Estadística II
Autor I Marín Saino
Actividad 3:
Se tienen los siguientes datos históricos que corresponden al número de
llamadas a la central de una empresa de emergencia médica. El objeto es
encontrar un modelo que explique el comportamiento de las llamadas a fin de
establecer la cantidad de unidades móviles, médicos y asistentes necesarios
para atender la demanda. Se obtiene una muestra aleatoria de 100 intervalos
de 15 minutos y se registran las frecuencias de llamadas solicitando el
servicio, tal como se muestran en la siguiente Tabla:
Número de
llamadas
0
1
2
3
4
Total
Cantidad de
intervalos de 15’
20
52
15
10
3
100
Con un nivel de significación del 5% probar si la distribución Poisson es
apropiada para describir el número de llamadas a la central.
Actividad 4:
Con el fin de ajustar el período de garantía que ofrece, una empresa que
vende un modelo de PC, registró el número de requerimientos técnicos
solicitados durante el período de garantía de 3 años. Los resultados se
muestran en la Tabla siguiente:
Tiempo
(meses)
Hasta 6
6 ; 12
12 ; 18
18 ; 24
24 ; 30
30 ; 36
Total
Cantidad de
requerimientos
60
150
250
130
70
40
700
A un nivel de significación del 5%, ¿puede probar que el tiempo que transcurre
hasta que se efectúa el requerimiento técnico se distribuye normal?
Actividad 5:
Comprobar, a un nivel de significación del 5%, si los siguientes datos provienen de una distribución normal:
N° de observación variable
1
47,00
2
57,00
3
41,69
4
48,32
5
45,32
6
48,11
7
43,17
8
56,88
9
58,13
10
42,67
11
49,80
12
52,40
13
50,16
14
52,44
15
50,76
187
N° de observación
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
variable
48,09
54,96
50,40
50,36
51,85
42,84
33,56
54,77
58,43
55,00
52,46
43,00
47,30
64,38
44,00
Cátedra I Estadística II
Autor I Marín Saino
2.2. Prueba de independencia: Tablas de contingencia
En este caso, se trata de una situación en la que interesa poner a prueba si existe o no
independencia entre dos variables cualitativas (atributos) de una población. Para ello
se toma una muestra, se construye una tabla de contingencia con las dos variables
cualitativas de interés, y en base a la distribución de frecuencias conjunta observada
en esa tabla de contingencia y la frecuencia esperada, que se calcula de acuerdo a la
hipótesis nula planteada, se construye el estadístico Chi-cuadrado para evaluar las
diferencias entre ambas. Si la diferencia no es significativa, concluimos que las
variables son independientes. Caso contrario, decimos que esas dos variables de
clasificación están relacionadas o son dependientes.
Recurriremos nuevamente a un ejemplo para desarrollar la prueba.
En una encuesta de opinión pública se le solicito a 1000 habitantes de la ciudad su
calificación respecto del desempeño del intendente, siendo las respuestas posibles:
Bueno, Regular o Malo. La distribución de dichas respuestas, clasificadas según el
nivel educacional de los encuestados, es:
Tabla 7:
Nivel educacional Primario
Secundario
Universitario
(II)
427
110
63
600
(III)
191
60
49
300
Totales
Respuestas
Bueno
Regular
Malo
Totales
(A)
(B)
(C)
(I)
82
10
8
100
700
180
120
1000
Si el objetivo es contrastar la hipótesis nula de que la calificación respecto del
desempeño del intendente es independiente del nivel educacional de los
encuestados, la hipótesis nula establecerá que la clasificación por filas (f) es
independiente de la clasificación por columnas (c), frente a la alternativa que las
dos clasificaciones son dependientes o están relacionadas.
Llamaremos pA a la probabilidad marginal (no condicionada) de que la opinión sea
Bueno (A), como así también se definen pB y pC como las probabilidades que se
presenten las respuestas Regular (B) o Malo (C), respectivamente. De la misma
manera, pI, pII y pIII son las probabilidades que un individuo haya alcanzado el
nivel primario (I), secundario (II) o terciario (III), mutuamente. Se sabe además
que, la suma de las probabilidades filas y la suma de las probabilidades columnas
deben ser igual a la unidad, es decir:
pA + pB + pC = 1 (suma de las probabilidades filas)
pI + pII + pIII = 1 (suma de las probabilidades columnas)
Entonces, de acuerdo a la ley multiplicativa de probabilidad, si las dos variables
son independientes entre sí, la probabilidad de una celda (probabilidad conjunta)
será igual al producto de sus correspondientes probabilidades fila y columna
(probabilidades marginales):
pij = pi. pj,
Para el ejemplo
pAI = pA . pI
Teniendo las probabilidades estimadas para cada celda en caso de independencia, se
podrán obtener la frecuencias esperadas de cada celda multiplicando por el tamaño de
la muestra, las que se utilizarán en la construcción del estadístico Chi-cuadrado.
Luego, se puede obtener el estimador de máxima verosimilitud para cualquier probabilidad fila y columna como sigue:
188
Cátedra I Estadística II
Autor I Marín Saino
∧
p ij =
nij
,
n
(i=1,...,f ; j=1,...,c)
donde:
nij: frecuencia observada de la celda ij
pij: probabilidad que una observación caiga en la celda ij, que es simplemente la
frecuencia relativa observada para esa celda
Asimismo las probabilidades marginales, probabilidades fila y columna respectivamente, están dadas por:
∧
pi =
∧
fi
n
pj =
y
cj
n
(donde: fi y cj son las frecuencias absolutas de la fila i y las frecuencias absolutas de la
columna j, respectivamente) y constituyen los estimadores de máxima verosimilitud
de pi y pj.
Según lo planteado en la hipótesis nula el estimador de máxima verosimilitud de nij es:
∧
 f c  f .c
∧ ∧ 
eij = E (nij ) = n  p i . p j  = n  i . j  = i j
n


n n
Entonces para la primera celda de nuestro ejemplo se obtiene como se muestra a
continuación:
e11 =
700.(100)
= 70 ;
1000
de la misma manera se pueden calcular las siguientes
frecuencias esperadas que se muestran en la Tabla 8:
Tabla 8:
Nivel educacional Primario
Secundario
Universitario
(II)
420
108
72
600
(III)
210
54
36
300
Totales
Respuestas
Bueno
Regular
Malo
Totales
(I)
70
18
12
100
(A)
(B)
(C)
700
180
120
1000
Es decir, se puede observar que la frecuencia esperada para una celda particular
es igual al cociente del producto de sus respectivas frecuencias marginales y la
frecuencia total.
Ahora podemos calcular el valor del estadístico de prueba utilizando las frecuencias
observadas de la Tabla 7 y las frecuencias esperadas de la Tabla 8:
f
c
2
χ obs
=∑∑
i =1 j =1
(oij − eij ) 2
eij
=
(82 − 70)
2
70
+
(10 − 18)
18
2
+ ... +
(49 − 36)
36
2
= 15, 30
Finalmente nos resta obtener los grados de libertad asociados al estadístico de la
prueba, recordando que dichos grados de libertad se obtienen de la cantidad de celdas
luego de reagrupar (en este caso k = f.c) menos un grado de libertad por cada
restricción lineal independiente impuesta sobre las frecuencias observadas de las
celdas. Entonces, los grados de libertad se obtienen de la siguiente manera:
189
Cátedra I Estadística II
Autor I Marín Saino
Número total de celdas
Al valor anterior le restamos un grado de libertad porque la
suma de los conteos de las celdas debe ser igual a n.
Además utilizamos las frecuencias de las celdas para estimar
(c-1) probabilidades de la variable puesta en columna. Para el
ejemplo, 2 de las 3 probabilidades columna (ya que la tercera
queda determinada por las dos primeras). Entonces, perdemos
(c-1) g. l. de estimar las probabilidades columna.
De la misma manera, utilizamos las frecuencias de las celdas
para estimar (f-1) probabilidades fila
Entonces el número de grados de libertad asociados a una
tabla de contingencia es:
k=f.c
1
(c-1)
(f-1)
(f-1) . (c-1)
Es decir:
g.l.
g.l.
g.l.
g.l.
g.l.
=
=
=
=
=
(f.c) – 1 – (c-1) – (f-1)
f.c – 1 – c +1 –f +1
f.c – c – f + 1
c (f-1)- (f-1)
(f-1). (c-1)
Para el ejemplo los grados de libertad son: (3-1) . (3-1) = 4.
Planteamos ahora la prueba de independencia siguiendo todos los pasos:
1.- H0: la calificación del desempeño del intendente es independiente del nivel
educacional de los encuestados
H1: la calificación del desempeño del intendente depende del nivel educacional
de los encuestados
2.- Nivel de significación:
α=0,05
3.- Chi-cuadrado observado, bajo supuesto de hipótesis nula verdadera:
2
χ obs
= 15, 30
4.- Regla de decisión:
El número de grados de libertad, según los cálculos anteriores, es 4. El valor
2
χ 2 = χ (4;0,95)
= 9, 49 ,
*
crítico es
debido a que
P( χ i2(4) > 9, 49) = 0, 05 ;
en
consecuencia, podemos expresar la zona de no rechazo y la zona de rechazo
de la siguiente forma:
ZNR = { χ 2 / χ 2 ≤ 9, 49}
ZR = { χ 2 / χ 2 > 9, 49}
5.- Decisión o inferencia final: El valor observado de
χ2
(15,30) es mayor al valor
crítico (9,49), en consecuencia se rechaza la hipótesis nula y podemos inferir,
a un nivel de significación del 5%, que la calificación del desempeño del
intendente depende del nivel educacional de los encuestados.
Cabe aclarar que, cuando el tamaño de muestra es pequeño (menor que 30) y se tiene
una tabla de 2 x 2, es posible aplicar una prueba muy útil como es la Prueba Exacta de
Fisher, la cual nos permite conseguir las probabilidades de obtener exactamente la
distribución de frecuencias conforme a la hipótesis nula.
190
Cátedra I Estadística II
Autor I Marín Saino
A continuación proponemos realizar las siguientes actividades:
Actividad 6:
Una fábrica de automóviles quiere averiguar si el sexo de sus clientes tiene
relación con la preferencia del modelo. Se toma una muestra aleatoria de 2000
clientes que se clasifican así:
Modelo
Sexo
Varón
I
II
III
350
270
380
Mujer
340
400
260
A un nivel de significación de 0,01 ¿existe evidencia de que el sexo tiene relación
con la preferencia del modelo de auto?
Actividad 7:
Se cree que las familias de altos ingresos generalmente envían a sus hijos a
escuelas privadas y que las familias de bajos ingresos suelen enviar a sus hijos a
escuelas públicas. Se escogen 1600 familias al azar a fin de evaluar esta opinión,
y se obtienen los siguientes resultados:
Escuela
Ingresos
Bajos
Privada
Altos
Total
Pública
Total
506
494
1000
438
944
162
656
600
1600
Trabaje con α = 0,01.
2.3. Prueba de homogeneidad
La prueba Chi-cuadrado se puede aplicar para determinar si dos o más muestras
aleatorias independientes se extraen de la misma población. Para ello se clasifica a la
población en términos de una variable cualitativa en k grupos (categorías de la
variable) o niveles de un factor, con el objeto de evaluar si las proporciones
poblacionales son homogéneas. Por ejemplo, podríamos querer probar si las opiniones
(de acuerdo, en desacuerdo), respecto a la política del gobernador de la provincia de
Córdoba, son homogéneas en tres poblaciones como pueden ser Ciudad de Córdoba,
Río Cuarto y Villa María, de las cuales se obtuvieron tres muestras independientes.
También este tipo de prueba se puede aplicar para realizar un análisis confirmatorio de
los datos que se poseen de una encuesta ya efectivizada. En este último caso,
entonces, de acuerdo a las dos variables categóricas podremos armar una tabla de
contingencia con las frecuencias asociadas a lo que definiremos como éxito y fracaso
para cada grupo.
En la Tabla siguiente se presentan los resultados de las tres muestras
considerando la opinión de los encuestados: de acuerdo (éxito), en desacuerdo
(fracaso).
Tabla 9:
Localidad
Córdoba
Opinión
De acuerdo
115
En desacuerdo
35
Totales
150
191
Villa María
Río IV
Totales
53
22
75
40
35
75
208
92
300
Cátedra I Estadística II
Autor I Marín Saino
El procedimiento a aplicar es semejante al de prueba de independencia; no
obstante ello, su justificación es algo diferente.
Se puede observar que se tienen tres experimentos binomiales independientes,
con sus respectivas probabilidades asociadas al éxito p1, p2 y p3 de que un
encuestado esté de acuerdo con las políticas del gobierno. Por lo tanto, si lo que se
desea es contrastar la hipótesis de que las proporciones son homogéneas en las
tres poblaciones, la hipótesis nula es:
Ho: p1 = p2 = p3
Los estimadores máximo verosímiles de las frecuencias esperadas de las celdas son los
mismos que se presentaron en la prueba de independencia y están dados por:
∧
eij = E (nij ) =
f i .c j
n
y si la hipótesis nula es verdadera y pj es igual para cada población, una combinación
de las estimaciones de esas proporciones10/ nos estaría proporcionando una estimación
del parámetro poblacional p, que representa la proporción global de los individuos que
están de acuerdo con las políticas del gobierno (proporción de éxitos), es decir:
_
p=
_
y el complemento:
X1 + X 2 + X 3 X
=
n1 + n2 + n3
n
_
q = 1− p
representa una estimación de la proporción global de los
individuos que están en desacuerdo con las políticas del gobierno (proporción de
fracasos).
Para el ejemplo dichas estimaciones son:
_
p=
115 + 53 + 40
150 + 75 + 75
=
208
300
= 0, 69
_
;
q=
84
300
= 0, 31
Luego, para obtener las frecuencias esperadas de cada celda, multiplicaremos el
tamaño de muestra de cada una de las poblaciones por la estimación de las
proporciones p y q, según si pertenecen a la primera o a la segunda fila
respectivamente. Para la primera celda, es:
Frecuencia marginal
(total columna)
∧
_
e11 = E (n11 ) = n1. p = n1.
Frecuencia marginal
(total fila)
f i .c j
X
208
=
= 150.
= 104
n
n
300
Tamaño de muestra
(total de observaciones)
Procediendo de la misma forma para las restantes celdas obtenemos las frecuencias esperadas correspondientes. Todas las frecuencias esperadas se presentan en
la Tabla 10.
10/
Cada una de las proporciones, sería una estimación del parámetro poblacional (bajo hipótesis
nula cierta).
192
Cátedra I Estadística II
Autor I Marín Saino
Tabla 10:
Localidad
Opinión
De acuerdo
En desacuerdo
Totales
Córdoba
Villa María
Río IV
Totales
104
46
150
52
23
75
52
23
75
208
92
300
Se puede demostrar además que, la variable resultante tendrá distribución Chicuadrado con (f-1).(c-1) grados de libertad11/ y utilizando un nivel de significación
α, la hipótesis nula se rechazará si el estadístico de prueba Chi-cuadrado:
f
c
2
χ obs
=∑∑
i =1 j =1
(oij − eij ) 2
eij
=
(115 − 104)
2
104
+
(35 − 46)
2
46
+ ... +
(35 − 23)
2
23
= 12, 89
es mayor al valor crítico de la cola superior de una distribución Chi-cuadrado con
(c-1).(f-1) grados de libertad.
La prueba de homogeneidad para el ejemplo, es:
1.- H0: p1 = p2 = p3
H1: Existe por lo menos una pj distintas a las demás (j = 1, 2, 3)
2.- Nivel de significación:
α=0,05 (asignado arbitrariamente)
3.- Chi-cuadrado observado, bajo supuesto de hipótesis nula verdadera:
2
χ obs
= 12, 89
4.- Regla de decisión:
El número de grados de libertad, según lo expresado anteriormente, es
(c-1)=2.
2
χ 2 = χ (2;0,95)
= 5, 99 ,
*
El valor crítico es
debido a que
P( χ i2(2) > 5, 99) = 0, 05 ;
en consecuencia, podemos expresar la zona de no rechazo y la zona de
rechazo de la siguiente forma:
ZNR = { χ 2 / χ 2 ≤ 5, 99}
ZR = { χ 2 / χ 2 > 5, 99}
5.- Decisión o inferencia final: El valor observado de
χ2
(12,89) es mayor al valor
crítico (5,99), en consecuencia se rechaza la hipótesis nula y podemos inferir,
a un nivel de significación del 5%, que existe por lo menos una pj distinta a las
demás. Es decir, las opiniones respecto a las políticas del gobierno de la
provincia no son homogéneas en las tres ciudades relevadas.
Actividad 8:
Se pretende analizar la intención de voto para las próximas elecciones a
gobernador de una provincia. A tal fin se realiza una encuesta a 115
profesionales, a 110 hombres de negocios y a 125 empleados, a quienes se les
pregunta sobre su preferencia respecto del candidato A o del candidato B,
ambos postulados para ser gobernador de la provincia. Los resultados
obtenidos son:
11/
Nótese que una de las variables de la tabla de contingencia siempre es una variable dicotómica (o reagrupamos categorías para transformarla), por lo tanto si se tiene una tabla de 2 x c
los grados de libertad asociados son (c - 1) y si se tiene una tabla de f x 2 los grados de
libertad serán (f - 1).
193
Cátedra I Estadística II
Autor I Marín Saino
Candidato
A
B
Total
80
35
115
H. de negocios
72
38
110
Empleados
Total
69
221
56
129
125
350
Categoría
Profesionales
¿Existe diferencia de opiniones entre los tres grupos de personas? ( α = 0,10)
Actividad 9:
El director de comercialización de una empresa de televisión por cable está
interesado en determinar si existe alguna diferencia en la proporción de familias
que contratan un servicio de televisión por cable, basándose en el tipo de
residencia. Tres muestras de familias de tres tipos de residencia revelaron lo
siguiente:
Tipo de residencia Una sola
familia
Contrata TV por cable
Sí
94
No
Totales
De 2 a 4
familias
Edificio de
Departamentos
39
Totales
77
210
56
36
98
190
150
75
175
400
A un nivel de significación del 5%, ¿existe evidencia de una diferencia entre
los tipos de residencia respecto a la proporción de familias que contratan el
servicio de televisión por cable?
2.3.1. Comparación de dos proporciones, muestras independientes. Similitudes de la prueba Z y
χ2
En el caso que se extraigan muestras independientes de dos poblaciones podremos
aplicar indistintamente la prueba
χ2
(desarrollada en el punto anterior) o la prueba Z
para comparar proporciones (desarrollada en el Capítulo III), sin correr el riesgo de
obtener conclusiones contradictorias. Esto es así debido a la relación que existe entre
la distribución normal estándar y la distribución Chi-cuadrado con un grado de libertad.
Recuerde que una variable
χ2
se define como la suma de variables normales
estandarizadas elevadas al cuadrado. Para verificar esto, sugerimos realizar el ejemplo
desarrollado en el Capítulo III (pág. 133) mediante la prueba
χ2
y podrá observar
que el estadístico de prueba Z es 1,05 (si trabajamos con mayor cantidad de
decimales el valor de Z es 1,3176) y el que corresponde a
por error de redondeo, el valor de
χ2
χ2
es 1,73. Es decir, salvo
es el cuadrado del valor Z. Lo mismo sucede
con los valores críticos, en la prueba Z el valor crítico es 1,96 y en la prueba
χ2
es
3,84 (para un nivel de significación α de 0,05).
La ventaja de la prueba Z respecto a la
χ2 ,
se presenta cuando se quiere probar la
diferencia en una dirección, por ejemplo p1 > p2 (recuerde que si esto es posible
aumenta la potencia de la prueba). En la prueba
χ2
esto no es posible sólo se podrá
contrastar la homogeneidad con la hipótesis alternativa
ventaja de la prueba
χ
2
p1 ≠ p2. Mientras que la
radica en que permite extender la comparación cuando se
tienen más de dos poblaciones (o niveles del factor).
194
Cátedra I Estadística II
Autor I Marín Saino
Actividad 10:
Un ingeniero encargado del control de calidad de una fábrica, desea examinar
la eficiencia de dos operadores de una máquina ensambladora y que trabajan
en turnos diferentes. Se registraron datos de una semana de trabajo y se
obtuvo lo siguiente:
Operador A
16
551
567
Cantidad defectuosos
Cantidad no defectuosos
Total
Operador B
17
416
433
Total
33
967
1000
a) De acuerdo a estos datos, ¿se puede inferir que las muestras provienen de
dos poblaciones diferentes? Trabaje con α = 0,05.
b) Resolverlo también por un procedimiento paramétrico y compare con lo
obtenido en a).
2.3.2. Comparaciones múltiples de proporciones
En el caso que estemos investigando diferencias entre dos poblaciones, como se
discutió anteriormente, podemos determinar mediante la prueba Z el sentido de tal
diferencia. Sin embargo, cuando se tienen más de dos poblaciones, no podemos
comparar de a pares las proporciones de cada población mediante la prueba Z. Esto es
así debido a que la aplicación reiterada de tales técnicas (al igual que en ANOVA) para
todas las comparaciones entre proporciones si son independientes, llevaría a aumentar
considerablemente la probabilidad de cometer el error tipo I (α). Por ejemplo, si se
tienen cuatro poblaciones independientes, se tendrán c (c-1)/2 = 6 comparaciones12/
posibles, es decir: 1-2; 1-3; 1-4; 2-3; 2-4; 3-4.
El nivel de confianza para la comparación entre dos medias es 1 - α, pero ese nivel de
confianza para todas las comparaciones es (1 - α)6. Si 1 - α = 0,95 para cada comparación, este nivel se reduce a 0,74 para todas las comparaciones simultáneamente.
Para salvar este problema existen procedimientos, que independientemente del
número de hipótesis que se prueben, garantizan una probabilidad constante α de
rechazar la hipótesis nula cuando es verdadera. Estos procedimientos se conocen
como “test de comparaciones múltiples”. Para la comparación de proporciones
presentaremos aquí el procedimiento de Marascuilo.
El procedimiento de Marascuilo
Este procedimiento, entonces, nos permite probar simultáneamente las diferencias de
todos los pares posibles de proporciones cuando hay varias poblaciones bajo estudio y
determinar cuál o cuáles proporciones son distintas.
Si
p 1 ; p 2 ; ...; p c son las verdaderas proporciones de las c poblaciones, sus estima∧
dores son
∧
∧
p1 ; p 2 ; ...; p c ,
pero lo que se somete a prueba es que las proporciones
todo j ≠ j´) u otra forma de expresarlo es pj - pj´ = 0.
son iguales pj = pj´ (para
Entonces, el parámetro poblacional es
∧
θj
θj
= p j − p j´ y el estimador puntual de
∧ ∧
= p j − p j´ . Además es posible demostrar que el valor crítico con el cuál
θ j es
∧
θ j debe ser
comparado es:
∧
m jj ´ =
χ
2
1 − α /( c − 1)
.
∧
p j .(1 − p j )
nj
12/
∧
+
∧
p j ´ .(1 − p j ´ )
13/
n j´
Si las poblaciones o niveles de factor estuvieran dispuestas en filas, las comparaciones serían
f . (f - 1)/2.
13/
Observar que se debe obtener un valor crítico para cada par de proporciones a comparar.
195
Cátedra I Estadística II
Autor I Marín Saino
∧
Entonces si
θ j > m jj´
se concluye que hay diferencias entre las proporciones
poblacionales que se comparan, al nivel de significación especificado.
Resumiendo
∧
El primer paso del procedimiento consiste en calcular las diferencias
∧
p j − p j´
(para
todo j ≠ j´) entre todos los pares c . (c - 1)/2 de proporciones. El valor absoluto de
dicha diferencia es el estadístico de prueba para cada comparación.
El segundo paso es elegir el nivel de significación y calcular los valores críticos
correspondiente a cada diferencia.
El tercer y último paso radica en comparar cada uno de los valores de los estadísticos
de prueba con su correspondiente valor crítico. Aquellos pares que arrojan un valor del
estadístico de prueba mayor al valor crítico presentan diferencias significativas al nivel
α establecido.
Para aplicar el procedimiento, utilizamos los datos del ejemplo anterior. Dado que
hay 3 grupos o niveles del factor, existen 3.(3-1)/2=3 posibles comparaciones, de
pares de proporciones, que se deben realizar. Las proporciones estimadas de cada
uno de los tres grupos son:
∧
p1 =
X 1 115
=
= 0, 77 ;
n1 150
∧
p2 =
X 2 53
=
= 0, 71 ;
n2 75
∧
p3 =
X 3 40
=
= 0,53
n3 75
_
y la estimación global
p = 0, 69 .
Gráficamente, en la Figura 3 se representan
estos valores.
Figura 3:
_
0,8
p
0,6
0,4
0,2
1
2
3
Niveles del factor
Si realizamos la comparación entre 1 y 2, el estadístico de prueba es:
∧
∧
∧
θ 1 = p1 − p 2 = 0, 77 − 0, 71 = 0, 06
El valor crítico para esta comparación está dado por:
m12 = 5,99.
0, 77.(0, 23) 0, 71.(0, 29)
+
= 0,1534
150
75
196
Cátedra I Estadística II
Autor I Marín Saino
en consecuencia, no hay diferencias significativas entre la proporción de respuestas favorables de la ciudad de Córdoba y las respuestas de la Ciudad de Villa
María. Los cálculos para todos los pares posibles se presentan en la Tabla 11.
Tabla 11:
∧
Comparaciones
1–2
1-3
2-3
∧
∧
∧
∧
∧
p j − p j´ m = 2.45 p j .(1 − p j ) + p j´ .(1 − p j´ )
jj´
nj
n j´
0,06
0,24
0,18
0,1534
0,1642
0,1906
Conclusión
No significativa
Significativa
No significativa
A partir de este cuadro resumen de comparaciones se puede llegar concluir,
utilizando un nivel de significación del 5%, que hay diferencias significativas en la
proporción de opiniones favorables entre las ciudades de Córdoba y Río IV14/.
Actividad 11:
Concluya para la Actividad 8 ¿Qué categoría es la que opina diferente?
Actividad 12:
Retomando la Actividad 9, puede concluir ¿Qué tipo de residencia es la que
más influye en esta conclusión?
La prueba de K-S es una prueba de la bondad del ajuste de los datos de una muestra
a un modelo teórico continuo específico de la población15/.
El método K-S se basa en la comparación entre las frecuencias acumuladas de la
distribución de los datos ordenados de la muestra y la distribución teórica
propuesta en la hipótesis nula. De calcular previamente la distancia entre ambas
funciones de distribución, se observa cuál es la distancia máxima, es decir, el punto
que presenta mayor diferencia al que se denominará Dobs, entonces:
Dobs = máx Ft - Fo : Da / n
donde:
Dobs: estadístico de prueba
Ft : función de distribución teórica
Fo : función de distribución de la muestra (proporción del número de valores en la
muestra que son menores o iguales a xo).
La distribución del estadístico es independiente del modelo planteado en la hipótesis
nula, éste depende únicamente de los grados de libertad y está tabulado cuando Ft es
cierta.
14/
Se puede observar que la comparación 2-3, aunque no es significativa está cercana a serlo,
conduciéndonos a la sospecha que una mayor cantidad de observaciones podrían demostrar
que la población 3 es la que tiene una proporción de opiniones favorables distinta a las demás.
La experiencia nos dice que esta prueba puede en algunos casos no dar ninguna diferencia
significativa pero de todas maneras nos dará indicios del sentido de las diferencias.
15/
En el Apéndice del Capítulo III, se ha realizado otra presentación de esta prueba, así como de
otra equivalente, la de Shapiro-Wilk.
197
Cátedra I Estadística II
Autor I Marín Saino
Si la distancia calculada (Dobs) es mayor que la que figura en tablas para un nivel de
significación α determinado, se rechazará el modelo Ft. Esto significa que una
diferencia tan grande como la observada no puede deberse a azar y por tanto los
datos de la muestra no provienen de la distribución especificada. Si por el contrario,
Dobs es menor al valor de la tabla, entonces no se rechazará la hipótesis nula y las
observaciones muestrales se ciñen al modelo propuesto en la hipótesis nula.
Cuando los parámetros se estiman a partir de la muestra la prueba es muy
conservadora, es decir tiende a que no se rechace la hipótesis nula. En este caso se
utilizará el K-S, en la versión modificada por Lilliesfors (1967), quien simuló por el
método de Montecarlo alrededor de 1000 muestras del mismo tamaño y calculó los
estimadores media, varianza y los estadísticos D. El carácter conservador se refleja
cuando se compara la probabilidad acumulada según la distribución teórica y la
probabilidad estimada a partir de la simulación.
Por ejemplo:
• Para n = 20 y el mismo nivel de significación α = 0,05
Tabla K-S
Tabla K-S Lilliefors
D* = 0,294
D* = 0,19
Dónde D* es el valor crítico
• Para n = 20 y el mismo valor crítico
D* = 0,231
α = 0,20
α = 0,01
Tabla K-S
Tabla K-S Lilliefors
Cálculo
Dado que las frecuencias acumuladas observadas se comportan a “saltos”, la distancia
máxima entre Ft y Fo puede presentarse por debajo o por encima de la curva de Ft ,
para un valor particular cualquiera (Figura 4). Por lo tanto, al aplicar la prueba se
deben calcular ambas distancias para cada punto xh y luego tomar la máxima entre
estas dos.
Figura 4:
Representación gráfica.
En lo que sigue se presenta en forma de ecuación este concepto:
Di ( xh ) = máx{ Ft ( xh ) - Fo ( xh- 1 ) ; Ft ( xh ) - Fo ( xh ) }
144444442 44444443 144444442 44444443
d1i
198
d2i
Cátedra I Estadística II
Autor I Marín Saino
(Obsérvese la Tabla 13 en el ejemplo que sigue, columnas 6, 7 y 8).
Trabajemos con el siguiente ejemplo:
Comprobar si los datos de la muestra siguiente (Tabla 12) se ajustan a una
distribución normal. Trabajar con un nivel de significación del 5%.
Tabla 12:
Observac
1
2
3
4
5
6
7
8
9
Vble: xi
8,14
8,23
9,00
9,09
9,72
9,81
9,96
10,00
12,00
Como en este ejemplo se desconocen los valores de los parámetros poblacionales
se deberán estimar, en primer lugar, la media y la desviación estándar.
_
x = 9, 5519
s = 1,1565
Para resolver el ejercicio planteado se construye la Tabla siguiente:
Tabla 13:
Observaciones Vble: xi
(1)
1
2
3
4
5
6
7
8
9
(2)
8,14
8,23
9,00
9,09
9,72
9,81
9,96
10,00
12,00
F0
(3)
0,11
0,22
0,33
0,44
0,56
0,67
0,78
0,89
1
zi
(4)
-1,22
-1,14
-0,48
-0,40
0,15
0,22
0,35
0,39
2,12
Ft
d1i
d 2i
Di ( xh )
(5)
0,1112
0,1271
0,3156
0,3446
0,5596
0,5871
0,6368
0,6517
0,9830
(6)
0,1112
0,0171
0,0956
0,0146
0,1196
0,0271
0,0332
0,1283
0,0930
(7)
0,0012
0,0929
0,0144
0,0954
0,0004
0,0829
0,1432
0,2383
0,0170
(8)
0,1112
0,0929
0,0956
0,0954
0,1196
0,0829
0,1432
0,2383
0,0930
Columna 1: número de observación
Columna 2: valores de la variable de la muestra ordenados
Columna 3: frecuencias observadas relativas acumuladas. Cada valor de la variable se presenta una vez, por lo tanto la frecuencia relativa asociada a
cada valor de la variable es 1/9.
Columna 4: valores estandarizados de la variable
_
x - x
zi = i
s
por ejemplo:
z1 =
8,14 − 9, 5519
1,1565
= −1, 22
Columna 5: frecuencias teóricas relativas acumuladas, las cuales han sido extraídas de la tabla de la normal estandarizada.
F ( z ) = P[ Z ≤ z i ]
por ejemplo:
P[ z ≤ −1, 22] = 0,1112
Columna 6: diferencia entre la frecuencia teórica asociada al valor de la variable y
la frecuencia observada hasta el valor anterior.
199
Cátedra I Estadística II
Autor I Marín Saino
d1i = Ft ( xh ) − Fo ( xh −1 )
Columna 7: diferencia entre la frecuencia teórica asociada al valor de la variable y
la frecuencia observada hasta ese valor.
d 2i = Ft ( xh ) − Fo ( xh )
Columna 8: distancias máximas entre la distribución teórica y la distribución observada (de las columnas 6 y 7) para cada valor de la variable. Se
resalta la distancia máxima entre las máximas.
Si realizamos la prueba:
1.- Ho: Los valores de la variable se ajustan a una distribución normal
H1 : Los valores de la variable no se ajustan a una distribución normal
2.- Nivel de significación: α = 0,05
3.- Valor del estadístico observado: Dobs = 0,2383
4.- Regla de decisión:
D : D0,05;9
D* = 0, 271
Zona de no rechazo ZNR: {D/D ≤ 0,271}
Zona de rechazo ZR: {D/D > 0,271}
5.- Decisión o inferencia final: No se rechaza la hipótesis nula. Se puede inferir
que, con un nivel de significación del 5%, los valores de la muestra se ajustan
a una población normal.
Actividad 13:
Comprobar si los siguientes datos siguen una distribución normal mediante la
prueba de Kolmogorov-Smirnov. Determine con que nivel de significación
desea trabajar.
26,39; 23,04; 24,99; 27,12; 22,23; 24,44; 23,44; 24,37; 22,72; 27,29
Actividad 14:
Se desea comprobar la efectividad de un tratamiento sobre el Indice Cardíaco,
variable que debe distribuirse en forma normal a fin de realizar la prueba
estadística respectiva. Analice los siguientes resultados e informe al respecto.
Prueba de Kolmogorov para bondad de ajuste.
Variable
Indice cardíaco
Ajuste
Normal(2,73 ; 1,41)
media
2,73
varianza
1,41
n
65
Estadistico D
0,10
p-valor
0,5855
Actividad 15:
Se supone que la duración de vida de una determinada marca de pilas debe
distribuirse en forma exponencial. Analizada una muestra de pilas se realizó el
contraste correspondiente obteniendo los siguientes resultados. ¿Qué podría
concluir al 5%?
200
Cátedra I Estadística II
Autor I Marín Saino
One-Sample Kolmogorov-Smirnov Test
DURACIÓN
10
11,5000
,307
,124
N
Exponential parameter.a,b Mean
Most Extreme
Absolute
Differences
Positive
Negative
-,307
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
,969
,304
a. Test Distribution is Exponential.
b. Calculated from data.
Actividades complementarias
Actividad 16:
Comprobar si los siguientes datos siguen una distribución exponencial
mediante la prueba de Kolmogorov-Smirnov. Determine con que nivel de
significación desea trabajar.
0,81;
0,61;
0,02;
0,25;
0,13;
0,65;
1,07;
0,10;
0,16;
0,59
Actividad 17:
Las personas que mueren por accidente de tránsito en cierta ciudad, en un año
dado (52 semanas), siguen un modelo Poisson. Dicha información se muestra en
la siguiente tabla:
0
6
Número de personas muertas
Frecuencia
1
10
2
20
3
10
4
6
5
0
Total
52
Al nivel del 5%, ¿existe evidencia que avale el modelo planteado para las
frecuencias observadas?
Actividad 18:
Alguien afirma que los clientes varones de una tienda de pantalones vaqueros
son el doble de los clientes mujeres. Se toma una muestra aleatoria de 40
clientes y 25 resultan ser hombres y 15 mujeres. ¿Son los datos muestrales
consistentes con la hipótesis planteada, a un nivel del 5%?
CLIENTES
varones
mujeres
Total
Observed N
25
15
40
Expected N
26,8
13,2
Residual
-1,8
1,8
Test Statistics
Chi-Squarea
df
Asymp. Sig.
CLIENTES
,366
1
,545
a. 0 cells (,0%) have expected frequencies less than
5. The minimum expected cell frequency is 13,2.
201
Cátedra I Estadística II
Autor I Marín Saino
Actividad 19:
A efectos de diseñar su próxima campaña publicitaria, un fabricante de vinos
desea saber si la proporción de hombres que prefieren sus productos es igual
a la de mujeres, a un nivel del 5%. Una muestra al azar de 30 hombres y 35
mujeres arrojó como resultado que 20 hombres y 19 mujeres preferían sus
vinos.
¿Qué prueba estadística utilizaría a fin de asesorar al fabricante de vino?
Utilice un método paramétrico y uno no paramétrico. ¿Se llega a la misma
conclusión?
Actividad 20:
Una consultora que realiza trabajos de Investigación de Mercado desea estudiar
el Ingreso Familiar de un determinada zona de la ciudad. Para ello quiere
asegurarse de que dicha variable cumple el requisito de distribución normal a fin
de poder aplicar distintas técnicas de inferencia estadística. ¿Qué se puede
concluir a un nivel del 1%?
One-Sample Kolmogorov-Smirnov Test
N
Normal Parameters a,b
Most Extreme
Differences
Mean
Std. Deviation
Absolute
Positive
Negative
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
INGRESO
85
561,4040
135,8388
,093
,093
-,087
,859
,452
a. Test distribution is Normal.
b. Calculated from data.
Actividad 21:
Un fabricante de baterías de autos desea determinar si existe alguna diferencia
en tres medios de comunicación (revista, tv y radio) en términos de “recuerdo de
un anuncio publicitario por parte del público”. Los resultados de un estudio sobre
publicidad se presentan a continuación, acompañados de los resultados de un
procesamiento estadístico.
Tablas de contingencia
Frecuencias absolutas
En columnas: Medio de publicidad más visto
Habilidad
radio
revista
no recuerda
108
73
recuerda
7
25
Total
115
98
tv
93
10
103
Total
274
42
316 .
Frecuencias relativas al total
En columnas: Medio de publicidad más visto
Habilidad
radio
revista
tv
no recuerda
0,34
0,23
0,29
recuerda
0,02
0,08
0,03
Total
0,36
0,31
0,33
202
Total
0,87
0,13
1,00
Cátedra I Estadística II
Autor I Marín Saino
Estadístico
Chi Cuadrado Pearson
Chi Cuadrado MV-G2
Valor
19,02
17,98
gl
2
2
p
.
0,0001
0,0001
a) Interprete los elementos de las tablas de frecuencias presentadas.
b) ¿El hecho de recordar o no un anuncio publicitario se comporta diferente
según cuál sea el medio de comunicación más utilizado? En caso
afirmativo indique cómo se comportan las frecuencias en cada caso.
c) ¿Qué procedimiento estadístico se utilizó?
4.1. Contraste de la mediana para muestras independientes
Es un procedimiento para probar si dos grupos independientes difieren en sus
tendencias centrales, más precisamente consiste en probar que dos grupos se han
tomado de poblaciones que poseen la misma mediana. Entonces, la hipótesis nula es
H0: Me(X1) = Me(X2). Evidentemente que esta prueba puede aplicarse cuando la
variable bajo análisis se encuentre, por lo menos, en una escala ordinal.
El primer paso consiste en determinar la mediana para el grupo combinado. Es decir,
como si todas las observaciones provinieran de la misma población.
Luego clasificaremos, en una tabla de 2x2, la cantidad de observaciones por encima y
por debajo de la mediana para cada uno de los grupos en cuestión. En aquellos casos
que tengamos muchas observaciones iguales a la mediana combinada, se suele tomar
como criterio clasificar de acuerdo a si exceden o no exceden la mediana.
Ahora bien, si los dos grupos provienen de poblaciones con la misma mediana,
esperamos que las frecuencias por encima y por debajo de la mediana sean
aproximadamente iguales. Puede demostrarse además que si o11 y o12 son el número
de observaciones por encima de la mediana en el grupo 1 y en el grupo 2,
respectivamente, la distribución de o11+o12 (bajo el supuesto de hipótesis nula cierta)
es la distribución hipergeométrica y por consiguiente si el número total de casos es
suficientemente grande, podemos utilizar la prueba
χ2
con un grado de libertad para
probar la hipótesis nula. Si el número total de observaciones es pequeño podemos
utilizar otra prueba como es la de Fisher.
El contraste se puede extender para determinar si k grupos independientes provienen
de la misma población o poblaciones con medianas iguales. De tal manera que cada
uno de los grupos se divide por la mediana combinada y se colocan los resultados en
una tabla cx2. Con los datos de esta tabla se calcula el valor del estadístico de prueba
χ2
y el procedimiento pasa a ser en esencia una prueba
χ2
para k muestras. Luego,
si el estadístico de la prueba es mayor que el valor crítico se rechaza la hipótesis nula,
al nivel de significación especificado, y concluimos que las muestras no provienen de
una población o varias poblaciones de medianas iguales.
Veamos el siguiente ejemplo:
Se ha tomado un examen idéntico a dos grupos de estudiantes de 5º año, pero
pertenecientes a establecimientos distintos. Las puntuaciones obtenidas por cada
grupo están representadas en la Tabla 14.
203
Cátedra I Estadística II
Autor I Marín Saino
Tabla 14:
Grupo 1
Grupo 2
54
65
51
53
66
71
54
61
73
78
64
66
78
80
67
69
82
87
71
74
92
93
76
80
95
81
85
89
90
94
A un α = 0,05, contraste la hipótesis de que los dos grupos de estudiantes provienen
de poblaciones con idénticas medianas.
H0: Las dos muestras se extraen
Me(X1) = Me(X2).
H1: Las dos muestras se extraen de
Me(X1) ≠ M(X2).
de
poblaciones con medianas iguales ó
poblaciones con
medianas
diferentes ó
El primer paso consiste en obtener el valor de la mediana combinada de n1 + n2.
Para el ejemplo Me(X) = 75.
En segundo lugar dividiremos la observaciones correspondientes a cada grupo en la
mediana, (Tabla 15).
Tabla 15:
Grupo I
Grupo II
Total
Por encima de
Me(X)
5
10
15
Por debajo de Me(X)
8
7
15
13
17
30
Total
Dado que ninguna de las frecuencias esperadas es menor que 5 y como n1 + n2 >
20, podemos usar la prueba
χ2 .
χ1/2 0.95 = 3, 84 ,
El estadístico de la prueba es 1,22 y el valor
*
crítico de tabla es
por lo tanto podemos concluir que las muestras
provienen de dos poblaciones de medianas iguales.
204
Cátedra I Estadística II
Autor I Marín Saino
Actividad 22:
Se desea determinar si los sueldos mensuales de plomeros, carpinteros y electricistas de cierta comunidad difieren significativamente entre sí. Se toman 3
muestras independientes y se obtiene la siguiente información:
Plomeros
Carpinteros
Electricistas
317
322
316
319
316
316
321
320
320
316
318
314
322
317
318
316
320
328
317
322
315
320
320
327
324
328
313
328
322
317
316
320
315
311
323
320
313
316
321
316
323
324
323
318
Trabaje con un nivel de significación del 1%.
Actividad 23:
En un departamento de Control de Calidad desean comparar el tiempo que se
requiere para diagnosticar fallas de equipo, utilizando 3 sistemas alternativos. Se
asignan al azar 42 fallas de equipos para diagnosticarlas mediante los 3 sistemas.
La siguiente tabla muestra el tiempo total, en minutos, que cada sistema requirió
para diagnosticar cada una de las fallas:
Sistema I
Sistema II
Sistema III
25
29
42
16
31
14
33
45
26
34
30
43
28
19
18
37
40
56
49
28
20
34
39
47
31
65
38
32
24
49
21
36
34
19
46
25
38
31
20
26
30
18
Utilizando un nivel de significación del 10%, pruebe la hipótesis de que las
muestras provienen de poblaciones que tienen igual mediana.
205
Cátedra I Estadística II
Autor I Marín Saino
4.2. Prueba de rangos con signo de Wilcoxon
4.2.1. Para una muestra
Esta prueba puede utilizarse para probar la hipótesis nula referida a un valor de la
mediana poblacional. Para ello se considerará la magnitud de la diferencia entre cada
valor observado y el valor teórico de la mediana (Me(X)). Por lo tanto, bajo el
supuesto de hipótesis nula cierta, estas diferencias se distribuirían simétricamente en
torno al cero. Se puede observar además que, estamos considerando las magnitudes
de las diferencias, es por ello que los datos deben estar en una escala numérica.
El primer paso consiste en calcular las diferencias entre valores observados y la
mediana, a dicha diferencia la denominaremos di, de tal manera que di = xi – Me(X).
Si alguna de estas diferencias es igual a cero, se excluye y el tamaño de muestra se
reduce a la cantidad de diferencias distintas de cero (n´). Luego, los valores absolutos
de las diferencias se ordenan de menor a mayor asignándoles un rango, comenzando
por 1 para la mínima diferencia. Aquellos valores que son iguales en valores absolutos
se les asigna el promedio de los rangos que le corresponderían (por ejemplo: si
tenemos dos diferencias que arrojen el mismo resultado y estas están ubicadas en la
posición 6 y 7 de la serie ordenada, a esas dos diferencias se les asignará el valor de
rango 6,5, no obstante al valor siguiente a estas dos diferencias se le asignará 8 como
rango).
Por último se suman los rangos de las diferencias positivas (n´), cuyo resultado es el
valor del estadístico de prueba T de Wilcoxon para una prueba bilateral. Si la hipótesis
nula es verdadera, el estadístico tomará un valor cercano a la mediana, en cambio si
es falsa el valor del estadístico estará próximo a los extremos de la distribución.
Cuando el número de diferencias distintas de cero es igual o menor a 20 (n´ ≤ 20)
utilizamos la tabla de valores críticos inferiores y superiores de T de la prueba de
rangos con signo de Wilcoxon presentada al final del Capítulo, para comparar el valor
observado. En una prueba bilateral, si el valor observado de T es inferior al valor
crítico inferior o es mayor al valor crítico superior, para un nivel de significación
determinado, entonces existe evidencia para rechazar la hipótesis nula. Para una
prueba lateral derecha si el valor de T es mayor al valor crítico superior la hipótesis
nula puede ser rechazada; mientras que, para una prueba lateral izquierda se tomará
la decisión de rechazar la hipótesis nula si el valor del estadístico de prueba es menor
al valor crítico inferior, siempre a un nivel de significación determinado.
Cuando n´ > 20 y la hipótesis nula es cierta, el estadístico T tiene una distribución
aproximadamente normal de parámetros µT y σT, donde:
µT =
n´.(n´+1)
;
4
σT =
n´.(n´+1).(2n + 1)
24
Por lo tanto en una muestra relativamente grande utilizaremos la distribución normal,
calculando el estadístico de prueba de la siguiente forma:
T − µT
σT
N (0,1)
Consideremos un ejemplo para cuando n´≤ 20. La Tabla 16 muestra las ventas de
una nueva herramienta en 12 ferreterías durante el mes anterior. Pruebe la hipótesis
de que la mediana de las ventas mensuales en la población es menor o igual a 10
unidades por ferretería contra la alternativa que es mayor a 10 unidades, a un nivel
del 5%.
206
Cátedra I Estadística II
Autor I Marín Saino
Tabla 16:
1
Herramientas
vendidas
8
7
Herramientas
vendidas
16
2
3
18
9
8
9
7
14
4
5
12
10
10
11
11
10
6
14
12
20
Ferretería
Ferretería
Ho: Me(X) ≤ 10
H1: Me(X)> 10
El procedimiento detallado precedentemente lo resumimos en la Tabla 17.
Tabla 17:
1
Herramientas
vendidas
8
-2
3,5
(-)
2
3
18
9
8
-1
9
1,5
(-)
4
5
12
10
2
0
6
7
14
16
8
9
Ferretería
di
Ri
Signo de di
Ri (+)
(+)
9
3,5
elimine
(+)
3,5
4
6
6,5
8
(+)
(+)
6,5
8
7
14
-3
4
5
6,5
(+)
6,5
10
11
11
10
1
0
1,5
elimine
(+)
1,5
12
20
10
10
(+)
10
45
Totales
(-)
Valor del
estadístico T
observado
A continuación presentamos un resumen de la tabla a utilizar para encontrar el
valor crítico, (Tabla 18).
207
Cátedra I Estadística II
Autor I Marín Saino
Tabla 18:
Valores críticos inferiores, T*, para la prueba de rangos
con signo de Wilcoxon para una muestra
Una cola
Dos colas
n´
α =0,05
α =0,10
α =0,025
α =0,01
α =0,005
α =0,05
α =0,02
α =0,01
Límites
(Inferior; Superior)
5
0 ; 15
...;...
...;...
...;...
6
2 ; 19
0 ; 21
...;...
...;...
7
3 ; 25
2 ; 26
0 ; 28
...;...
8
5 ; 31
8 ; 37
3 ; 33
1 ; 35
0 ; 36
9
5 ; 40
3 ; 42
1 ; 44
10
10 ; 45
8 ; 47
5 ; 50
3 ; 52
11
13 ; 53
10 ; 56
7 ; 59
5 ; 61
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
20
60 ; 150
52 ; 158
43 ; 167
37 ; 173
El T* (valor crítico) que surge de tabla, para la muestra recortada de tamaño 10 y
un nivel de significación del 5% es 45; por lo tanto al nivel de significación del
5%, con un criterio conservador no se rechaza Ho. Se pude observar que el valor
crítico coincide con el valor observado, por lo que -en la medida que se pueda- se
debería ampliar el tamaño de muestra para decidir con mayor precisión si existe
evidencia o tal evidencia no existe para rechazar la Ho.
Actividad 24:
Se afirma que las unidades ensambladas por un nuevo sistema será mayor
que con el sistema antiguo, cuya mediana poblacional era de 80 unidades por
turno. Plantee la dócima que corresponda y trabaje con un nivel del 5%. Los
datos muestreados son los siguientes:
Turno
muestreado
1
2
3
4
5
6
Unidades
ensambladas
75
85
92
80
94
90
Turno
muestreado
7
8
9
10
11
12
Unidades
ensambladas
91
76
88
82
96
83
4.2.2. Para muestras dependientes
Un razonamiento similar se puede emplear cuando tenemos n observaciones
apareadas, por ejemplo: antes y después del tratamiento, que podemos denominar
(x1i; x2i), donde di = x1i - x2i y estamos interesados en probar que las X1 y las X2
provienen de la misma distribución frente a la alternativa que las distribuciones son
diferentes en cuanto a su posición respecto al eje de las abscisas. Bajo el supuesto de
hipótesis nula cierta, se esperaría que la mitad de las diferencias entre pares sean
negativas y la otra mitad sean positivas, a su vez con iguales valores absolutos,
respectivamente.
Una vez calculadas las diferencias, se ordenan en valores absolutos y se asigna el
rango correspondiente a cada diferencia excluyéndose, como antes, las diferencias
208
Cátedra I Estadística II
Autor I Marín Saino
iguales a cero y asignando el rango promedio para diferencias con iguales resultados.
Luego, se calculan las sumas de los rangos para diferencias positivas y para las
diferencias negativas. Para una prueba bilateral tomaremos la menor de esas sumas
como el valor del estadístico de prueba (T). Por lo tanto rechazaremos la hipótesis nula
en tanto T (valor observado) sea menor a un valor T* (T crítico). Si la prueba es
lateral izquierda, usamos como estadístico de la prueba (T) la suma de los rangos
negativos y si la prueba es lateral derecha utilizamos como estadístico de la prueba (T)
la suma de rangos positivos.
Cuando n´ ≤ 20 recurriremos a la tabla de valores críticos de T de la prueba de rangos
con signo de Wilcoxon para muestras dependientes presentada al final del Capítulo,
para comparar el valor observado.
Cuando n´ > 20, el estadístico T tiene una distribución aproximadamente normal de
parámetros µT y σT, tal como se especificó anteriormente y utilizaremos la distribución
normal para calcular tanto el estadístico de la prueba como los valores críticos que
definen la zona de rechazo y la zona de no rechazo.
Ejemplifiquemos:
A un grupo de consumidores que consta de 14 personas se le pide que califique dos
marcas de té, de acuerdo a un sistema de valuación por puntos que se basa en
diversos criterios. En la Tabla 19 se muestran los puntos asignados a cada marca de
té:
Tabla 19:
Miembro
del grupo
1
Marca 1
Marca 2
20
16
2
3
24
28
26
18
4
5
24
20
17
20
6
7
29
19
21
23
8
9
27
20
22
23
10
11
30
18
20
18
12
13
28
26
21
17
14
24
26
Pruebe la hipótesis de que no existe diferencia en el nivel de calificaciones para las
dos marcas de té, a un nivel de significación del 5%.
H0: No existe diferencia en el nivel de calificaciones para las dos marcas de té.
H1: Existen diferencias significativas en el nivel de calificaciones para las dos marcas
de té.
Los cálculos para determinar el valor del estadístico de prueba se resumen en la
Tabla 20:
209
Cátedra I Estadística II
Autor I Marín Saino
Tabla 20:
Miembro
del grupo
1
Marca 1
Marca 2
di
Ri
Ri (+) Ri (-)
20
16
4
4,5
4,5
2
3
24
28
26
18
-2
10
1,5
11,5
11,5
4
5
24
20
17
20
7
0
7,5
6
7
29
19
21
23
8
-4
elimine
9
4,5
8
9
27
20
22
23
5
-3
6
3
6
10
11
30
18
20
18
10
0
11,5
12
13
28
26
21
17
7
9
elimine
7,5
10
11,5
-.-
14
24
26
-2
1,5
Total 78
1,5
7,5
-.-
-.-
9
4,5
3
-.-
7,5
10
1,5
67,5
10,5
Valor del
estadístico T
De la Tabla 21obtenemos el valor de T* que separa la zona de rechazo, de la zona
de no rechazo.
Tabla 21:
Valores críticos, T*, para la prueba de rangos con signo
de Wilcoxon para muestras dependientes
Una cola
α =0,05
Dos colas α =0,10
α =0,025
α =0,05
.
.
.
α =0,005
.
.
.
α =0,01
N´
T*
5
6
0
2
...;...
0
.
.
.
.
.
.
...;...
...;...
7
.
3
.
2
.
.
.
.
.
...;...
.
.
.
.
.
13
14
21
25
.
.
17
.
.
.
.
21
.
.
.
.
.
.
.
.
.
100
2045
1955
.
.
.
.
.
.
.
.
.
.
.
.
.
9
12
.
.
1779
Cada una de la suma de los rangos debería ser aproximadamente 39 (78/2) y se
puede observar que hay un gran desequilibrio (67,5 y 10,5), por lo que el valor de
T observado de 10,5 es menor al valor crítico (21), entonces se rechaza la
hipótesis nula al nivel de significación del 5%. Ahora bien, si el valor del estadís-
210
Cátedra I Estadística II
Autor I Marín Saino
de prueba T hubiese tomado un valor entre 21 y 39 (inclusive), indicaría que la
suma de los rangos positivos y la suma de los rangos negativos se compensarían y
no habría diferencias significativas.
Actividad 25:
Se desea determinar la eficacia de cierta dieta para adelgazar. Se sometieron a la
dieta 17 personas, y sus pesos antes y después de la misma fueron:
Persona
Antes
Después
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
70
66
68
58
78
59
84
77
63
65
51
60
81
65
66
56
72
69
65
65
58
76
57
81
74
71
60
50
58
78
68
64
56
70
Pruebe la hipótesis de que la dieta disminuye significativamente el peso de las
personas utilizando un α = 0,01.
4.2.3. Para muestras independientes
Si tenemos dos conjuntos de datos de una variable a partir de dos muestras
independientes podemos utilizar la prueba de rangos con signos para probar las
diferencias entre las medianas de las dos poblaciones de las cuales se extrajeron
dichos conjuntos de datos. Esos datos deben ser por lo menos de nivel ordinal.
El procedimiento consiste en combinar dos muestras aleatorias independientes, con
n1 y n2 observaciones, y ordenarlas de menor a mayor asignándoles el rango 1 a la
menor hasta el rango n, es decir (n1 + n2), a la mayor. A aquellas observaciones que
son iguales se les asignará el promedio de los rangos tal como se especificó para las
dos pruebas anteriores. Entonces, si las observaciones fueron generadas a partir de
muestras independientes de la misma población, las sumas de los rangos
correspondientes a cada muestra deberían ser más o menos proporcionales a los
tamaños de muestras respectivos.
Luego el estadístico de la prueba T es la suma de los rangos asignados a la muestra
más chica (supongamos que es n1). No obstante, si las muestras son de igual tamaño
cualquiera de las dos puede elegirse para calcular T.
Cuando los tamaños de ambas muestras son iguales o menores que 10, utilizamos la
tabla de valores críticos de T de la prueba de rangos con signo de Wilcoxon para
muestras independientes, presentada al final del Capítulo, para comparar el valor
observado.
Cuando el tamaño de muestra es suficientemente grande, digamos n1 > 10, el
estadístico de prueba T se distribuye aproximadamente normal de parámetros µT y σT,
tal como se especificó en la sección 4.2.1. No obstante, los parámetros se calculan
mediante las expresiones que se presentan seguidamente:
µT =
n1.(n + 1)
2
;
σT =
211
n1.n2 .(n + 1)
12
Cátedra I Estadística II
Autor I Marín Saino
Trabajemos con el siguiente ejemplo:
Se desea determinar si el volumen anual de ventas logrado por vendedores que
tienen grado académico (Grupo 1) difiere del volumen logrado por vendedores que
no lo tienen (Grupo 2). Tomadas en forma independientes muestras de ambos
grupos de vendedores se obtuvo la siguiente información:
Tabla 22:
Ventas anuales (en miles)
Grupo 1
Grupo 2
82
92
73
75
90
72
70
90
71
65
89
68
60
86
67
58
85
66
50
83
64
50
81
63
46
81
52
42
78
40
76
A un nivel del 1%, ¿se puede concluir que las muestras provienen de poblaciones con
distintas medianas?
H0: Me(X1) = Me(X2)
H1: Me(X1) ≠ Me(X2)
En la Tabla 23 se asignaron los rangos según lo especificado anteriormente:
Tabla 23:
Grupo
1
Ri1
Grupo
2
Ri2
82
75
24
19
92
90
31
29,5
70
65
15
11
90
89
29,5
28
60
58
8
7
86
85
27
26
50
50
4,5
4,5
83
81
25
22,5
46
42
3
2
81
78
22,5
24
76
20
73
72
18
17
71
68
16
14
67
66
13
12
64
63
10
9
52
40
6
1
Total
Para tamaños de muestras grandes se dijo
que se utilizaba la distribución normal como
aproximación, de tal manera que:
Tobs = 118
11.(31 + 1)
µT =
= 176 ;
2
(11).(20).(32)
σT =
= 24, 22
12
118 − 176
entonces z =
= −2,395
24, 22
y el valor crítico es z*= ± 2,575, por lo tanto
la zona de no rechazo es:
{
}
ZNR = z / z < 2,575
En consecuencia, a un nivel de significación
del 1%, no se rechaza la hipótesis nula. Es
decir, las muestras provienen de poblaciones
con medianas idénticas.
118
212
Cátedra I Estadística II
Autor I Marín Saino
Actividad 26:
Se desea comparar los sueldos mensuales de vendedores y administrativos del
gremio comercial, en cierta zona de la ciudad. Los datos muestrales obtenidos de
15 empleados de cada área son:
Vendedores
350
351
351
355
361
365
366
369
370
375
375
382
387
390
392
Administrativos
352
360
367
370
371
375
377
378
380
381
385
389
393
394
395
A un nivel del 5% determine si la mediana de los sueldos mensuales de ambos
tipos de empleados es la misma.
4.3. Prueba U de Mann-Whitney: muestras aleatorias independientes
En 1947, dos años después que Wilcoxon propusiera la prueba estadística para
comparar dos poblaciones basadas en muestra aleatorias independientes, Mann y
Whitney propusieron la prueba U que también utiliza la suma de los rangos de las
muestras. Se puede demostrar que ambas pruebas son equivalentes.
El objeto de esta prueba es determinar si las dos muestras independientes provienen
de la misma población y es especialmente útil cuando los datos son al menos de nivel
ordinal.
Sea n1 la muestra más pequeña de los dos grupos de datos, para aplicar la prueba U
en primer lugar se deben combinar las observaciones para ordenarlos de menor a
mayor para luego asignarles un rango de 1 al más bajo y n al más alto y teniendo en
cuenta que a aquellas observaciones que empaten se les asignará el rango promedio,
tal como se especificó en las pruebas anteriores. Seguidamente se calculan dos valores
de estadísticos por medio de las siguientes expresiones:
U1 = n1.n2 +
U 2 = n1.n2 +
n2 .(n2 + 1)
2
n1.(n1 + 1)
2
n1
− ∑ Ri1 ;
i =1
n1
− ∑ Ri 2 ;
i =1
o bien:
U 2 = n1.n2 − U
donde Ri1 y Ri2 es el rango que corresponde a la observación i-ésima de la muestra n1
(la más pequeña) y n2 (la muestra más grande), respectivamente.
Obviamente las fórmulas anteriores arrojan distintos valores. Es el menor de ellos el
que nos interesa y lo denominaremos genéricamente como Uobs. Si ese valor de U es
menor al valor crítico que surge de tabla, rechazaremos la hipótesis nula al nivel de
significación especificado.
Ahora bien cuando la muestra más grande es mayor que 20 (n2 >20), la distribución
213
Cátedra I Estadística II
Autor I Marín Saino
muestral de U se aproxima rápidamente a la distribución normal de parámetros µU y
σU, donde:
µU =
n1.n2
;
σU =
y
2
n1.n2 .(n1 + n2 + 1)
12
Por lo tanto, cuando n1 y n2 aumentan de tamaño utilizaremos la distribución normal,
calculando el estadístico de prueba16/ de la siguiente forma:
T − µU
N (0,1)
σU
Si el valor de Z observado es menor al valor crítico de la cola izquierda de la
distribución o es mayor al valor crítico de la cola derecha de la distribución normal, se
rechazará la hipótesis nula.
Retomemos el ejemplo presentado en la sección 4.1. para aplicar la prueba de
Mann-Whitney
H0: Me(X1) = Me(X2)
H1: Me(X1) ≠ Me(X2)
En la Tabla siguiente se muestra la asignación de rangos para las muestras
combinadas
(n1 + n2):
Tabla 24:
Grupo 1
54
Ri1
3,5
Grupo 2
51
Ri2
1
65
66
7
8,5
53
54
2
3,5
71
73
12,5
14
61
64
5
6
78
78
17,5
17,5
66
67
8,5
10
80
82
19,5
22
69
71
11
12,5
87
92
24
27
74
76
15
16
93
95
28
30
80
81
19,5
21
85
89
23
25
90
94
26
29
Total
231
Procederemos al cálculo de U como
sigue:
U = (13).(17) +
13.(14)
2
− 231 = 81
U 2 = (13).(17) − 81 = 140
De la tabla de valores críticos de
U de la prueba de Mann-Whitney,
para una cola α = 0,025 y dos colas
α = 0,05, que se dispone (al final
del Capítulo y aquí se muestra un
resumen de la misma) extraemos el
valor crítico en la intercepción de
los tamaños de muestras de cada
grupo.
234
El valor crítico es 63 y el valor observado es 81, por lo tanto no se rechaza la
hipótesis nula, al nivel de significación del 5%.
16/
Cuando la distribución muestral de U se aproxima a la normal, no tiene importancia si se utiliza U1 ó U2 como valor de U porque el valor absoluto de Z será el mismo, lo que si depende de
U es el signo de Z.
214
Cátedra I Estadística II
Autor I Marín Saino
Tabla 25:
Valores críticos, U*, para la prueba de Mann-Whitney
para muestras independientes
n1
2
3
.
.
.
13
14
15
16
17
18
19
20
Una cola
α =0,025
Dos colas
α =0,05
n2
2
...;...
...;...
.
.
.
1
1
1
1
2
2
2
2
3
13
...;... . . . 1
...;... . . . 4
. .
.
.
.
.
.
. .
. . . 45
4
. . . 50
5
. . . 54
5
. . . 59
6
. . . 63
6
. . . 67
7
. . . 72
7
. . . 76
8
14
1
5
.
.
.
50
55
59
64
67
74
78
83
15
1
5
.
.
.
54
59
64
70
75
80
85
90
16
1
6
.
.
.
59
64
70
75
81
86
92
98
17
2 . . .
6 . . .
. .
.
.
.
.
63 . . .
67 . . .
75 . . .
81 . . .
87 . . .
93 . . .
99 . . .
105 . . .
20
2
8
.
.
.
76
83
90
98
105
112
119
127
Actividad 27:
Se desea comparar las calificaciones obtenidas por estudiantes varones y
mujeres de un mismo curso, en un determinado examen estándar. Dos muestras
tomadas al azar de 20 estudiantes cada una dieron los siguientes resultados (en
puntos):
Varones
51
90
68
83
65
75
71
85
79
84
87
72
76
92
69
91
63
71
78
59
Mujeres
45
55
95
80
70
50
99
88
74
60
67
82
86
98
62
97
93
61
73
94
Pruebe si las calificaciones medias de estudiantes varones y mujeres son las
mismas, a un α = 0,05.
215
Cátedra I Estadística II
Autor I Marín Saino
216
Cátedra I Estadística II
Autor I Marín Saino
Un experimento binomial consta de “n” pruebas independientes con dos resultados
posibles (éxito o fracaso), los cuales tienen probabilidades asociadas (p y q). No
obstante el experimento definido, es sólo un caso particular de un modelo denominado
multinomial, que trata de pruebas independientes con más de dos resultados (k), donde las dos probabilidades (p y q) se reemplazan por las k probabilidades p1, p2, ... pk;
son ejemplos de este tipo de experimentos los siguientes: la clasificación de individuos
según sus ingresos en 3 clases (hasta 500 $; entre 501 y 1000 $; más de $ 1000),
según el nivel máximo de educación alcanzado en 7 categorías (primario incompleto,
primario completo, secundario incompleto, ..., postgrado), la clasificación de individuos
según su opinión respecto a un producto (muy bueno, bueno, malo, muy malo).
Cualquiera sea la variable aleatoria que genere el experimento, todas tienen las
siguientes características que definen un experimento multinomial:
1.- El experimento consta de “n” pruebas idénticas.
2.- El resultado de cada prueba corresponde a una de las k categorías.
3.- La probabilidad que el resultado caiga en una categoría particular es:
pi (i = 1, 2, ..., k) y permanece constante de una prueba a otra.
4.- Las “n” pruebas son independientes.
5.- Nuestro interés está centrado básicamente en o1, o2, ..., ok, donde oi (i=1, 2,..., k)
es igual al número de pruebas cuyo resultado se asocia a la i-ésima categoría, de
manera tal que: o1 + o2 +...+ok = n.
Tomemos como ejemplo que se lanzan 100 tiros con jabalinas en un terreno que está
dividido en tres secciones. La primera sección es la que está más cerca del tirador y se
sabe que la probabilidad que una jabalina caiga en está sección es 0,30, mientras que
la probabilidad que caiga en la segunda sección es de 0,60 y la probabilidad que caiga
más allá del límite de la segunda sección (¡los mejores tiros!) es 0,10. Entonces nos
podríamos preguntar ¿cuántas jabalinas se espera que caigan en la tercera sección?
Se sabe que:
E (n3) = e3 = n p3 = (100) . (0,10) = 10
de la misma manera se podría calcular el valor esperado de jabalinas que caen en las
restantes secciones.
Según se dijo, si la hipótesis nula planteada es verdadera entonces los conteos de las
secciones no deberían desviarse demasiado de sus valores esperados, es decir:
o i – n pi ,
(i=1, 2,..., k)
para realizar la comparación definiremos la variable aleatoria
χ2
propuesta por
Pearson que incluye las k diferencias y se puede demostrar que,
suficientemente grande, tendrá distribución de probabilidad Chi-cuadrado.
c
2
obs
para
(oi - ei ) 2
= å
i= 1
ei
k
Consideremos el caso especial de k = 2 (binomial), para luego generalizar. Entonces:
(oi - ei )2 (o1 - np1 ) 2 (o2 - np2 ) 2
=
+
i= 1
ei
np1
np2
2
2
c obs
= å
217
n
Cátedra I Estadística II
Autor I Marín Saino
dado que o1 + o2 = n, entonces o2 = n - o1 , y que p1 + p2 = 1, se puede escribir :
c
2
obs
(o1 - np1 )2 [(n - o1 ) - n(1- p1 )]2
=
+
np1
np2
trabajando algebraicamente el segundo término del segundo miembro, resulta:
2
c obs
=
(o1 - np1 ) 2 (n - o1 - n + np1 ) 2
+
np1
np2
luego
2
c obs
=
(1- p1 )(o1 - np1 )2 + p1 (- o1 + np1 ) 2
(np1 )(1- p1 )
finalmente, se obtiene:
c
2
obs
(o1 - np1 )2
=
np1 (1- p1 )
Como
n
o1 = å x1 j
j= 1
ì
ïîï 0 en cualquier otro caso
ï 1 si el evento ocurre en la j-esima prueba
donde x = ïí
1j
Entonces o1 puede expresarse como la suma de n variables aleatorias independientes
y no es otra cosa que el número de observaciones (o1) y tendrá distribución binomial,
con E(o1) = n p1 y V(o1) = n p1 (1- p1), si p1 es el verdadero valor de p. Además,
cuando n es grande al ser p17/ chica, podemos tomar a la distribución Poisson como
límite de la binomial con λ = np1. Ahora bien, si λ > 5 la distribución Poisson se
aproximará a la distribución normal, entonces la variable aleatoria:
 o1 − np1 

 N (0,1)
n
.
p
1


luego para un n grande, la variable aleatoria
 o1 − np1 


 n. p1 
2
χ12 18/
Para un k mayor que 2 se puede demostrar que
χ2
puede expresarse como la suma
de cuadrados de k-1 variables independientes, cada una de ellas con distribución
N(0,1) si n es suficientemente grande.
17/
Cuando hay varias celdas la frecuencia en cada una de ellas es relativamente pequeña (p)
comparándola contra todas las demás (1-p).
18/
Recuerde que, si Z1; Z2;...;Zn son variables aleatorias independientes, cada una con distribución N(0,1), entonces: Z12 + Z22 + ... + Zn2 tiene distribución
218
χ n2 .
Cátedra I Estadística II
Autor I Marín Saino
TABLAS ANEXAS
Valores críticos de
Tamaño
muestral
n
1
2
3
4
5
0.2
0.9
0.684
0.565
0.494
0.446
6
7
8
9
10
Di = Ft − Fo
. Prueba de Kolmorogov-Smirnov
0.15
0.925
0.726
0.597
0.525
0.474
Nivel de
significación
0.1
0.95
0.776
0.642
0.564
0.51
0.05
0.975
0.842
0.708
0.624
0.565
0.01
0.995
0.929
0.828
0.733
0.669
0.41
0.381
0.358
0.339
0.322
0.436
0.405
0.381
0.36
0.342
0.47
0.438
0.411
0.388
0.368
0.521
0.486
0.457
0.432
0.41
0.618
0.577
0.543
0.514
0.49
11
12
13
14
15
0.307
0.295
0.284
0.274
0.266
0.326
0.313
0.302
0.292
0.283
0.352
0..8
0.325
0.314
0.304
0.391
0.375
0.361
0.349
0.338
0.468
0.45
0.433
0.418
0.404
16
17
18
19
20
0.258
0.25
0.244
0.237
0.231
0.274
0.266
0.259
0.252
0.246
0.295
0.286
0.278
0.272
0.264
0.328
0.318
0.309
0.301
0.294
0.392
0.381
0.371
0.363
0.356
25
30
35
0.21
0.19
0.18
0.22
0.2
0.19
0.24
0.22
0.21
0.27
0.24
0.23
0.32
0.29
0.27
1.07
1.14
1.22
1.36
1.63
n
n
n
n
n
> 35
Referencia
n: tamaño de muestra
219
Cátedra I Estadística II
Autor I Marín Saino
Valores críticos de
Di = Ft − Fo
. Prueba de Kolmorogov – Smirnov (Lilliefors)
Tamaño
Muestral
N
4
5
0.2
0.3
0.285
0.15
0.319
0.299
6
7
8
9
10
0.265
0.247
0.233
0.223
0.215
0.277
0.258
0.244
0.233
0.224
0.294
0.276
0.261
0.249
0.239
0.319
0.3
0.285
0.271
0.258
0.364
0.348
0.331
0.311
0.294
11
12
13
14
15
0.206
0.199
0.19
0.183
0.177
0.217
0.212
0.202
0.194
0.187
0.23
0.223
0.214
0.207
0.201
0.249
0.242
0.234
0.227
0.22
0.284
0.275
0.268
0.261
0.257
16
17
18
19
20
0.173
0.169
0.166
0.163
0.16
0.182
0.177
0.173
0.169
0.166
0.185
0.189
0.184
0.179
0.174
0.213
0.206
0.2
0.195
0.19
0.25
0.245
0.239
0.235
0.231
25
30
0.149
0.131
0.153
0.136
0.165
0.144
0.18
0.161
0.203
0.187
0.736
0.768
0.805
0.886
1.031
n
n
n
n
> 30
Nivel de
significación
0.1
0.05
0.352
0.381
0.315
0.337
220
0.01
0.417
0.405
n
Cátedra I Estadística II
Autor I Marín Saino
Valores críticos inferiores, T*, para la prueba de rangos
con signo de Wilcoxon para una muestra
Una cola
α =0,05
Dos colas
α =0,10
N´
5
6
7
8
9
10
11
12
13
14
15
0
2
3
5
8
10
13
17
21
25
30
;
;
;
;
;
;
;
;
;
;
;
15
19
25
31
37
45
53
61
70
80
90
16
17
18
19
20
35
41
47
53
60
;
;
;
;
;
101
112
124
137
150
α =0,025
α =0,01
α =0,05
α =0,02
Límites
(Inferior ; Superior)
α =0,005
α =0,01
...;...
0 ; 21
2 ; 26
3 ; 33
5 ; 40
8 ; 47
10 ; 56
13 ; 65
17 ; 74
21 ; 84
25 ; 95
...;...
...;...
0 ; 28
1 ; 35
3 ; 42
5 ; 50
7 ; 59
10 ; 68
12 ; 79
16 ; 89
19 ; 101
...;...
...;...
...;...
0 ; 36
1 ; 44
3 ; 52
5 ; 61
7 ; 71
10 ; 81
13 ; 92
16 ; 104
29
34
40
46
52
23
27
32
37
43
19
23
27
32
37
221
;
;
;
;
;
107
119
131
144
158
;
;
;
;
;
113
126
139
153
167
;
;
;
;
;
117
130
144
158
173
Cátedra I Estadística II
Autor I Marín Saino
Valores críticos, T*, para la pueba de rangos
con signo de Wilcoxon para muestras dependientes
Una cola
α =0,05
α =0,025
Dos colas
α =0,10
α =0,05
n´
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
40
50
60
70
80
90
100
α =0,01
α =0,005
α =0,02
α =0,01
...;...
...;...
0
1
3
5
7
9
12
15
19
23
27
32
37
43
49
55
62
69
76
84
92
101
110
120
130
140
151
162
173
238
397
600
846
1136
1471
1850
...;...
...;...
...;...
0
1
3
5
7
9
12
15
19
23
27
32
37
42
48
54
61
68
75
83
91
100
109
118
128
138
148
159
220
373
567
805
1086
1410
1779
T*
0
2
3
5
8
10
13
17
21
25
30
35
41
47
53
60
67
75
83
91
100
110
119
130
140
151
163
175
187
200
213
286
466
690
960
1276
1638
2045
...;...
0
2
3
5
8
10
13
17
21
25
29
34
40
46
52
58
65
73
81
89
98
107
116
126
137
147
159
170
182
195
264
434
648
907
1211
1560
1955
222
Cátedra I Estadística II
Autor I Marín Saino
Valores críticos, T*, para la pueba de rangos con signo
de Wilcoxon para dos muestras independientes
n1
α
n2
Una
cola
0,05
4
0,1
0,025 0,05
...;...
...;...
12 ; 28
19 ; 36
0,025 0,05
11 ; 29
17 ; 38
0,01
10 ; 30
16 ; 39
...;...
15 ; 40
0,1
0,02
0,005 0,01
8
9
10
6
13 ; 31
20 ; 40
28 ; 50
0,025 0,05
12 ; 32
18 ; 42
26 ; 52
0,01
0,05
7
5
0,1
7
0,02
11 ; 33
17 ; 43
24 ; 54
0,005 0,01
10 ; 34
16 ; 44
23 ; 55
0,05
14 ; 34
21 ; 44
29 ; 55
39 ; 66
0,025 0,05
13 ; 35
20 ; 45
27 ; 57
36 ; 69
0,01
0,1
8
9
0,02
11 ; 37
18 ; 47
25 ; 59
34 ; 71
0,005 0,01
10 ; 38
16 ; 49
24 ; 60
32 ; 73
0,05
15 ; 37
23 ; 47
31 ; 59
41 ; 71
51 ;
85
0,025 0,05
14 ; 38
21 ; 49
29 ; 61
38 ; 74
49 ;
87
0,01
0,1
0,02
12 ; 40
19 ; 51
27 ; 63
35 ; 77
45 ;
91
0,005 0,01
11 ; 41
17 ; 53
25 ; 65
34 ; 78
43 ;
93
0,05
16 ; 40
24 ; 51
33 ; 63
43 ; 76
54 ;
90 66 ; 105
0,025 0,05
14 ; 42
22 ; 53
31 ; 65
40 ; 79
51 ;
93
62 ; 109
0,01
0,1
10
10 ; 26
0,005 0,01
0,05
6
4
11 ; 25
0,02
0,01
5
Dos
colas
0,02
13 ; 43
20 ; 55
28 ; 68
37 ; 82
47 ;
97
59 ; 112
0,005 0,01
11 ; 45
18 ; 57
26 ; 70
35 ; 84
45 ;
99
56 ; 115
0,05
17 ; 43
26 ; 54
35 ; 67
45 ; 81
56 ;
96
69 ; 111 82 ; 128
0,025 0,05
15 ; 45
23 ; 57
32 ; 70
42 ; 84
53 ;
99
65 ; 115 78 ; 132
0,01
0,02
13 ; 47
21 ; 59
29 ; 73
39 ; 87
49 ; 103
61 ; 119 74 ; 136
0,005 0,01
12 ; 48
19 ; 61
27 ; 75
37 ; 89
47 ; 105
58 ; 122 71 ; 139
0,1
223
Cátedra I Estadística II
Autor I Marín Saino
224
Descargar