Subido por Liam Arnold

pruebas de hipotesis no parametricas

Anuncio
Pruebas No Paramétricas
Material elaborado por: Dr. Jorge Valera
Junio, 2019.
Pruebas de Hipótesis No Paramétricas o de Distribución Libre
Introducción
La mayoría de las pruebas de hipótesis tradicionales conocidas, como la de comparación
de medias o varianzas requieren que las muestras aleatorias a ser utilizadas en los
procedimientos de prueba de hipótesis provengan de poblaciones normales, de tal manera que
los resultados y conclusiones que se obtengan sean confiables. Por otra parte, en las pruebas no
paramétricas no se necesita hacer suposiciones acerca de la distribución de la población y por
ello en ocasiones se denominan pruebas libres de distribución.
En ocasiones requerimos llevar a cabo un procedimiento de prueba de hipótesis
relacionadas con la media poblacional μ, una diferencia de medias poblacionales o pruebas
relacionadas con las varianzas de la población donde el supuesto de normalidad no se cumple.
En estos casos las pruebas no paramétricas o de distribución libre representan una alternativa a
las pruebas tradicionales.
Por ejemplo supongamos que deseamos probar la hipótesis de que el tiempo promedio
para obtener un título profesional en una universidad reconocida no es de 5 años como se cree
sino que este tiempo es superior a los 5 años. Para ello deseamos contrastar las hipótesis
Ho: μ=5 años vs Ha: μ>5 años
Si se deseara aplicar la prueba tradicional para contrastar estas hipótesis tendríamos que
probar que la muestra aleatoria de los tiempos para obtener el título profesional, obtenida de la
población de graduandos de la universidad proviene de una población normal o bien apelar al
teorema del límite central en caso que el tamaño de la muestra sea grande (n>30) así como a
otros supuestos como si la varianza de la población es o no conocida.
En general, los contrastes de pruebas de hipótesis tradicionales exigen el cumplimiento
de supuestos relacionados tanto con la distribución de los datos como de algunos parámetros
para que los resultados de las mismas sean considerados válidos. Parte fundamental de estos
requerimientos es que las poblaciones de donde provienen los datos que conforman las
muestras aleatorias utilizadas en los contrastes sean poblaciones normales, así como supuestos
relativos a las varianzas poblacionales, de allí que a estas se les conozcan como pruebas de
hipótesis paramétricas. En contraparte, los métodos de contraste de distribución libre o no
paramétricos a menudo no requieren suponer conocimiento alguno de las distribuciones de
probabilidad de las poblaciones de donde se obtienen las muestras, excepto tal vez que estas
distribuciones sean continuas.
Cuando se utilizan pruebas no paramétricas para realizar un contraste de hipótesis hay
situaciones donde los datos disponibles son medidos en una escala ordinal y en estos casos se
asignan rangos a los datos a fin de aplicar las pruebas no paramétricas, como veremos más
adelante. En cambio las pruebas paramétricas requieren que los datos analizados sean producto
de una medición por lo menos en una escala de intervalo.
Una gran ventaja de las pruebas no paramétricas es que son una excelente alternativa de
las paramétricas en los casos donde no es posible justificar las suposiciones de normalidad o en
casos donde la escala de medición de la variable es ordinal y no de razón. Por otro lado, para
grandes desviaciones del supuesto de la normalidad de los datos el método no paramétrico es
mucho más eficiente que el procedimiento paramétrico. Claramente es preferible utilizar las
pruebas paramétricas sobre las no paramétricas en los casos donde sea posible verificar las
condiciones de normalidad ya que los contrastes paramétricos son más eficientes.
En resumen, las pruebas no paramétricas junto a las pruebas paramétricas constituyen
todo un conjunto de herramientas estadísticas para adaptar a una gran variedad de situaciones
experimentales.
La Prueba del Signo.
Prueba de signo para comparar una mediana.
Es una alternativa no paramétrica a la prueba paramétrica empleada para realizar el contraste
de hipótesis de la media μ de una población. Si en determinado estudio se requiere contrastar
la hipótesis
Ho: μ=μ0 vs
{
Ha: μ ≠ μ 0
Ha :μ < μ0 ,
Ha :μ > μ0
según sea el caso, pero no se cumple que la población de donde proviene la muestra es normal,
esta prueba es una alternativa para contrastar las hipótesis.
Metodología
De la teoría estadística se sabe que cuando una población posee una distribución de
probabilidad simétrica como la que se presenta en la figura 1 se cumple que la media μ y la
μ son iguales.
mediana ~
En este sentido, al no poder verificarse los supuestos requeridos por la prueba
paramétrica tradicional, se opta por la prueba del signo la cual en lugar de la media μ emplea a
μ como parámetro de tendencia central.
la mediana ~
μ es
Dado que la distribución es simétrica, llevar a cabo la prueba sobre la mediana ~
equivalente a realizarla sobre la media μ ya que en este caso la media y la mediana poblacional
son iguales.
μ estadísticamente se define como el valor para el cual la mitad de los valores de la
La mediana ~
población son menores o iguales a él y la otra mitad son mayores o iguales a él. En términos de
μ se define como el valor para el cual se cumple:
probabilidad ~
P( X > ~
μ)=P(X < ~
μ)=0.5.
La manera correcta de plantear las hipótesis cuando decidimos utilizar la prueba del signo
es
Ho: ~
μ=~
μ0 versus
{
Ha: ~
μ ≠~
μ0
~
~
Ha : μ < μ0 ,
Ha : ~
μ >~μ0
De esta manera, la prueba del signo en esencia consiste en determinar cuántos de los
μ . En este sentido, para
valores de la muestra aleatoria se encuentran arriba y abajo del valor ~
0
μ=~
μ0 contra alguna de las alternativas según se al caso, lo que se
contrastar la hipótesis Ho: ~
hace es asignar un símbolo positivo (“+”) a los valores de la muestra que se encuentran por
μ 0 y uno negativo (“-“) a los que se encuentren por debajo del valor ~
μ 0. Cuando un
arriba de ~
μ se asigna el valor cero y no se considera para la aplicación
valor en la muestra es igual al valor ~
0
de la prueba.
Por ejemplo, supóngase que en una muestra de tamaño n=11 se obtuvieron los siguientes
μ =1.8, entonces se
valores 1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0, 1.2, 1.7 y que el valor ~
0
obtendría el resultado
Donde el valor cero se corresponde con el valor 1.8 en los datos que al ser igual a μ0=1.8
no se le asigna signo y por lo tanto no se tomaría en cuenta para llevar a cabo el contraste de las
hipótesis de la prueba del signo. En este caso para la prueba se dispone de tres signos más ( “+”)
y siete signos menos (“-“) para un total de 10 signos.
El sentido lógico de la prueba.
Si la hipótesis nula Ho es verdadera, lo lógico es que estadísticamente la proporción de
signos positivos sea igual a la de signos negativos, ya que en este caso es de esperar que el 50%
μ y el otro 50% se encuentre
de los datos en la muestra se encuentren por arriba del valor ~
0
μ 0 como se muestra en las figuras 2. de allí que se espere que la proporción de signos
debajo de ~
positivos y negativos estadísticamente sean iguales.
μ=~
μ0 es verdadera, la cantidad de valores que se espera
De esta manera, si Ho: ~
μ 0 debe ser igual tal y como se muestra
estadísticamente se hallen arriba y abajo de la mediana ~
en la Figura N° 3.
Claramente entonces una cantidad mayor de alguno de los signos reflejaría que la
hipótesis nula es falsa y en consecuencia se rechazaría que el verdadero valor de la mediana es
~
μ . En la figura N° 4 se presenta el caso donde la cantidad de signos positivos es
0
estadísticamente significativamente menor que los positivos, indicando que el verdadero valor
μ sino un valor menor a este
de la mediana no es ~
0
Por otra parte, si la cantidad de signos positivos es estadísticamente mayor a la cantidad
μ> ~
μ
de signos negativos como se presenta en la Figura N° 5, es evidencia que la hipótesis Ho: ~
0
es cierta.
Basamento estadístico.
En la prueba del signo se toman en cuenta son los signos positivos y el estadístico de
prueba que se utiliza para contrastar las hipótesis sigue una distribución binomial con parámetro
μ=~
μ es verdadera, indicando en este caso, que las
p=1 /2 cuando la hipótesis nula Ho: ~
0
probabilidades de obtener un signo positivo o negativo son iguales.
Formalmente, la variable aleatoria
X = Número de signos positivos encontrados en la muestra aleatoria de tamaño n.
X =0 , 1, 2 , … , n.
posee distribución de probabilidad binomial con parámetro p=1 /2. En consecuencia la
distribución de probabilidad de X esta dada por:
1
f ( x )= n
x 2
x
1
2
n−x
1
= n
x 2
( )( ) ( ) ( )( )
n
Casos Particulares.
μ0
Caso 1. El valor verdadero de la mediana posiblemente es menor a ~
μ 0 las hipótesis a probar
Si se sospecha que el valor verdadero de la mediana es menor a ~
son:
Ho: ~
μ=~
μ0
Ha: ~
μ< ~
μ0
vs
Si la cantidad de signos positivos y negativos es similar, es de esperarse que no se rechace
la hipótesis nula. Por el contrario, la presencia de pocos signos positivos (en otras palabras hay
estadísticamente mas signos negativos que positivos), es un indicativo de que la hipótesis nula
no es cierta y en la medida que la cantidad de signos positivos disminuyan y aumenten los signos
μ< ~
μ.
negativos es más probable que se rechace la hipótesis nula a favor de la alternativa Ha: ~
0
En términos de probabilidad significa que se rechaza Ho a favor de Ha si la proporción de
signos positivos es estadísticamente menor a 1/2 y por lo tanto la cantidad x de signos positivos
observados en la muestra será pequeño y entonces el valor P dado por
x
x
P=P r ( X ≤ x cuando p=1 /2 ) =∑ P ( X=i )=∑ n 1/2n
i=0
i=0 i
será menor a α, el nivel de significancia establecido.
()
μ=~
μ0
Pasos para llevar a cabo el contraste de hipótesis Ho: ~
vs
Ha: ~
μ< ~
μ 0.
1. Establezca las hipótesis nula Ho y alternativa Ha.
μ=~
μ
Ha: ~
μ< ~
μ.
a. Ho: ~
vs
0
μ=~
μ0
b. Ho: ~
μ=~
μ
c. Ho: ~
0
0
vs
Ha: ~
μ> ~
μ 0.
vs
Ha: ~
μ ≠ ~μ0.
2. Elija un nivel de significancia α fijo.
3. Calcule el valor P con base en el valor x = número de signos positivos.
a. P=Pr ( X ≤ x cuando p=1/2 )
(
b. P=Pr X ≥ x cuando p=
1
2
)
n
1
c. Si x < ; P=2 Pr X ≤ x cuando p=
2
2
(
)
n
1
S i x > ; P=2 Pr ( X ≥ x cuando p= )
2
2
4. Rechace Ho a favor de Ha si P ≤ α
5. Conclusiones.
μ 0.
Caso 2. El valor verdadero de la mediana posiblemente es mayor a ~
μ 0 las hipótesis a
Cuando se sospecha que el valor verdadero de la mediana es mayor a ~
probar son:
Ho: ~
μ=~
μ0 vs Ha: ~
μ> ~
μ0
Equivalente al caso 1, si la cantidad de signos positivos es estadísticamente
significativamente mayor al número de signos negativos encontrados a partir de los valores de la
muestra, la hipótesis nula será rechazada a favor de la hipótesis alternativa. En este caso, para
llevar a realizar el contraste de hipótesis el valor P se calcula a partir de la expresión
(
n
n
1
1 n
=∑ P ( X =i )=∑ n
P
2 i= x
2
i=x i
( )( )
1
1
P ( X ≥ x cuando p= )=1−∑ ( n) ( )
2
i 2
P=P r X ≥ x cuando p=
)
x−1
n
i=0
y si este valor de P es menor o igual al nivel de significancia α seleccionado, se rechazaría la
μ> ~
μ.
hipótesis nula a favor de la alternativa Ha: ~
0
Los pasos a seguir son similares al caso 1 solo que la expresión para calcular el valor P es
diferente.
μ=~
μ0
Pasos para llevar a cabo el contraste de hipótesis Ho: ~
vs
Ha: ~
μ> ~
μ 0.
1. Establezca las hipótesis nula Ho y alternativa Ha.
2. Elija un nivel de significancia α fijo.
3. Calcule el valor P con base en el valor x = número de signos positivos obtenidos a partir
de la muestra de tamaño n.
4. Rechace Ho a favor de Ha si P ≤ α.
5. Conclusiones.
μ 0.
Caso 3. El valor verdadero de la mediana posiblemente es diferente a ~
μ 0, pero
En el caso que se sospecha que el valor verdadero de la mediana es diferente a ~
no se está seguro si es mayor o menor, las hipótesis a probar son:
Ho: ~
μ=~
μ vs Ha: ~
μ ≠ ~μ
0
0
Rechazaremos la hipótesis nula si la cantidad de signos positivos obtenidos a partir de la
muestra es estadísticamente menor o bien mayor a la cantidad de signos negativos. Como de
antemano no conocemos la proporción de signos positivos a encontrar respecto a los negativos,
para llevar a cabo el procedimiento de prueba de hipótesis lo primero que debemos hacer es
determinar si el número de signos positivos x <n/2 o si x >n/2.
En caso de que x <n/2; es decir, si la cantidad de signos positivos es menor a la mitad del
tamaño de muestra y por ende menor a la cantidad de signos negativos, el valor P a calcular esta
dado por
x
x
n
1
Si x < ; P=2 P r ( X ≤ x cuando p=1/2 )=2 ∑ P r ( X=i )=2 ∑ n
2
i
2
i=0
i=0
n
( )( )
pero si la cantidad de signos positivos es mayor a la mitad del tamaño de la muestra ( x >n/2 )y
por lo tanto mayor a la cantidad de signos negativos, el valor P a encontrar es
n
1
Si x < ; P=2 Pr X ≤ x cuando p=
2
2
(
)
n
1
Si x > ; P=2 Pr ( X ≥ x cuando p= )
2
2
1
1
P=2 P r ( X ≥ x cuando p= )=2 ∑ P r ( X =i )=2 ∑ ( n ) ( )
2
i 2
(
P=2 P r X ≥ x cuando p=
(
n
n
i=x
i=x
n
1
1
=2 1−P r X ≤ x−1 cuando p=
2
2
)
[ (
P=2 P X ≥ x cuando p=
x−1
1
1
=2 1−∑ n
2
i
2
i=0
)
[
n
( )( ) ]
)]
μ=~
μ0 a favor de Ha: ~
μ ≠ ~μ0 si el valor P obtenido
y una vez encontrado el valor P, se rechaza Ho: ~
es menor o igual al nivel de significancia α seleccionado.
μ=~
μ0 vs Ha: ~
μ ≠ ~μ0.
Pasos para llevar a cabo el contraste de hipótesis Ho: ~
1. Establezca las hipótesis nula Ho y alternativa Ha.
2. Elija un nivel de significancia α fijo.
3. Calcule el valor P con base en el valor x = número de signos positivos obtenidos a partir
de la muestra de tamaño n. Tome en consideración para el cálculo del valor P si x <n/2 o
bien si x >n/2.
4. Rechace Ho a favor de Ha si P ≤ α.
5. Conclusiones.
Ejemplo de Aplicación.
Ejemplo1. Prueba de hipótesis sobre una mediana. Equivalente No Paramétrico de la prueba
de la media μ de una población normal.
Los siguientes datos representan el número de horas de entrenamiento de vuelo que reciben 18
estudiantes para piloto de cierto instructor antes de su primer vuelo solos:
9 12 18 14 12 14
12 10 16 11 9 11
13 11 13 15 13 14
Realice una prueba del signo al nivel de significancia de 0.02 para probar la afirmación del
instructor de que la mediana del tiempo que se requiere antes de que sus estudiantes vuelen
solos es 12 horas de vuelo de entrenamiento.
Solución.
Lo primero a hacer es plantear las hipótesis a contrastar.
Ho: ~
μ=12 vs Ha: ~
μ ≠ 12
1) Establecer el nivel de significancia α =0.02 para este caso.
2) Determinar el número de signos + y – y obtener el valor de P.
1
9 2
- 0
En este caso hay 9
1 1
8 4 12
+ + 0
signos “+”,
1 1 1
4 2 0 16
+ 0 - +
6 signos “-“y 3
muestra pasa de 18 datos inicialmente a n=15
1
1 9
- ceros
1
1 1
1 13 1 3
- + - +
(sin signo). Por
1
5 13 14
+ + +
lo tanto el tamaño de la
(
P=2 P X ≥ 9 cuando p=
8
1
1
=2 1−∑ 15
2
i
2
i=0
)
[
15
( )( ) ]=0.6072
μ=12.
3) Dado que α =0.02 y P=0.672 se cumple que P>α y por lo tanto no se rechaza Ho: ~
4) Conclusiones: Los datos no arrojan evidencia que contradiga la afirmación del instructor de
vuelo.
μ1 , ~
μ2 de dos poblaciones.
Prueba del signo para comparar la medianas ~
Ejemplo 2. Una empresa de taxis intenta decidir si al utilizar neumáticos radiales en vez de
neumáticos regulares con cinturón le serviría para ahorrar combustible. Para ello se equipan 16
automóviles con neumáticos radiales y se conducen por un recorrido de prueba previamente
establecido. Después los mismos automóviles se equipan con neumáticos regulares con cinturón
y los mismos conductores vuelvan a realizar el mismo recorrido de prueba. Se midió el
rendimiento de gasolina, en kilómetros por litro, y la data se muestra en la tabla más adelante.
¿Podemos concluir a un nivel de significancia de 0.05 que los autos equipados con neumáticos
radiales ahorran más combustible que los equipados con neumáticos regulares con cinturón?
Auto
Radiales
1
2
3
4.2 4.7 6.6
4
7
Cinturó
n
4.1 4.9 6.2 6.9
5
6.
7
6.
8
6
7
4.5 5.7
8
6
9 10 11
7.4 4.9 6.1
4.4 5.7 5.8 6.9 4.9
6
12
5.
2
4.
9
13 14 15 16
5.7 6.9 6.8 4.9
5.3 6.5 7.1 4.8
Solución.
Planteamiento de las Hipótesis.
H 0 :~
μ R −~
μC =0 vs H a : ~μR −~
μC >0
Nivel de Significancia. α =5 %.
Determinar el número de signos + y – y obtener el valor de P.
Auto
Radiales
1
4.2
Cinturó
n
Signo
Signo
4.1
1
+
2
4.
7
4.
9
-1
-
3
6.6
4
7
6.2
6.9
1
+
1
+
5
6.
7
6.
8
-1
-
6
4.5
4.4
1
+
7
5.
7
5.
7
0
8
6
9
7.4
5.8
6.9
1
+
1
+
10
4.
9
4.
9
0
11
6.1
6
1
+
12
5.
2
4.
9
1
+
13
5.7
14
6.9
5.3
6.5
1
+
1
+
15
6.
8
7.
1
-1
-
16
4.9
4.8
1
+
Hay 11 signos “+”, 3 signos “-“ y 2 ceros (sin signo). Por lo tanto el tamaño de la
muestra pasa de 16 datos inicialmente a n=14 datos.
10
1
1
P=P r X ≥11cuando p= =2 1−∑ 14
2
i 2
i=0
(
)
[
14
( )( ) ]=0.0287
Regla de Decisión. Rechazar Ho si P<α =0.05
Conclusiones. Dado que P=0.0287<0.05=α se concluye que efectivamente
los cauchos radiales ahorran más combustible.
μC ≠ 0. Para obtener el valor de P para la hipótesis
El SPSS produce la salida para el caso H a : ~μR −~
μC >0 se divide entre dos el valor P que da el programa; esto es,
alternativa unilateral H a : ~μR −~
μC >0 .
0.057 /2=0.0285 obteniéndose así el valor de P para la alternativa H a : ~μR −~
Prueba del Signo en Investigación de Mercados para estudiar la preferencia de los clientes.
La aplicación de la prueba en este caso consiste en determinar la preferencia hacia una
de dos marcas de un cierto producto utilizando una muestra de n opiniones de potenciales
clientes. En este sentido el objetivo es determinar si existen diferencias en las preferencias de los
clientes por algún producto como leche, refrescos, salsas, cafés, etcétera.
Para llevar a cabo la prueba del signo en este caso lo que se hace en preguntar a un
grupo de n clientes cual de los dos artículos prefieren. La variable que se mide entonces es del
tipo nominal y a través de la aplicación de esta prueba se determina si existen o no diferencias
entre las preferencias hacia los dos artículos que se comparan.
Ejemplo 3. Una empresa desea lanzar al mercado una nueva marca de mayonesa y por ello
decide llevar a cabo una prueba para comparar la preferencia de su producto con la mayonesa
de mayor popularidad que se encuentra en el mercado. Para ello se selecciona a 12 personas a
las que se les da a probar ambos productos de manera aleatoria. Los datos se muestran a
continuación:
Individuo
1
2
3
4
Preferenci
a
N E N E
5
6
7
8
9
10
N N E N N
N
1
1
E
12
N
donde N significa que se a la persona le gusta más el producto nuevo y E que le gusto la
mayonesa existente en el mercado.
Solución. En este caso la asignación del signo positivo es arbitraria, pudiendo asignarse el
signo”+” a la preferencia por la mayonesa nueva o a la mayonesa existente en el mercado. Para
efecto de este ejemplo se le asignara el signo “+” a la nueva mayonesa. De esta manera los
datos disponibles para aplicar la prueba del signo son:
Individuo
Preferenci
a
SPSS
Ref SPSS
1
+
2
-
3
+
4
-
5
+
6
+
7
-
8 9 10 11 12
+ + +
+
1 -1 1
0 0 0
-1
0
1
0
1 -1 1 1
0 0 0 0
1
0
-1
0
1
0
Planteamiento de las Hipótesis.
H o : No existe diferencias en la preferencia de los clientes por los dos articulos
H a :Si existe diferencia en la preferencia de los clientes por uno de los articulos
Nivel de Significancia. α =5 %.
Determinar el número de signos + y – y obtener el valor de P. Es este caso se obtuvieron x=8
signos '+' y 4 signos '-' para un total de n=12 elementos (individuos). Dado que x >n/2 se
calcula el valor de P a partir de la expresión:
7
1
1
P=2 P X ≥ 8 cuando p= =2 1−∑ 12
2
i 2
i=0
(
)
[
12
( )( ) ]=2 [ 1−0.8062]=0.3877
Conclusiones. Consérvese la hipótesis nula. No existen diferencias en la preferencia de los
clientes por los dos artículos.
Para realizar esta prueba con el SPSS se procede de acuerdo a lo que muestra las imágenes a
continuación, teniendo en cuenta el orden a la hora de seleccionar las variables.
Obsérvese que la variable Preferencia está compuesta por 1 y -1 y la variable RefPref está
compuesta de puros ceros. Esta codificación permite que la diferencia 1-0 de positiva y la
diferencia -1-0 un resultado negativo, coincidiendo estos resultados con los símbolos más y
menos.
Al seleccionar las variables primero se selecciona la variable RefPref y luego la variable
Preferencia.
Se selecciona el nivel de significancia
Y finalmente se ejecuta el procedimiento.
Resultado
Conclusiones. Consérvese la hipótesis nula. No existen diferencias en la preferencia de los
clientes por los dos artículos.
Prueba del Signo para medir si existen diferencias al comparar dos Tratamientos donde la
valoración de cada tratamiento se mide en una escala ordinal como es el caso de las escalas de
likert.
El siguiente ejemplo muestra como la prueba del signo se puede emplear para determinar si
existen diferencias significativas entre dos estrategias de enseñanza en las cuales en una un
profesor con experiencia se ocupa de instruir a un grupo numeroso de estudiantes y en la otra
un asistente de profesor ya graduado se encarga de instruir a un grupo más pequeño de
estudiantes.
Ejemplo 4. El rector de una universidad desea medir la eficiencia de dos estrategias de
enseñanza. La primera consiste en impartir clase a grupos numerosos de estudiantes a cargo de
profesores de tiempo completo y la segunda que las clases sean dadas por asistentes graduados
a grupos pequeños de alumnos. Para medir la calidad de la enseñanza se pidió a 40 profesores
con experiencia que evaluaran la Transmisión del conocimiento en la siguiente escala: excelente,
4; muy bueno, 3; bueno, 2, y deficiente. ¿Existen diferencias entre los métodos de enseñanza?.
Los resultados obtenidos se presentan en la siguiente tabla:
Evaluado
r
Puntaje a Grupo
Pequeño
Puntaje a Grupo
Grande
Evaluado
r
Puntaje a Grupo
Pequeño
Puntaje a Grupo
Grande
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
2
1
4
4
3
3
4
2
4
1
3
3
4
4
4
1
1
2
2
4
3
2
2
3
4
2
2
1
3
1
2
3
4
4
3
2
3
2
3
3
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
4
4
4
3
3
2
3
4
3
4
3
1
4
3
2
2
2
1
3
3
1
4
3
3
2
2
1
1
1
3
2
2
4
4
3
3
1
1
4
2
Solución. En este caso los signos positivos y negativos se obtienen a partir de las diferencias
Puntaje a Grupos Pequeños - Puntaje a Grupos Grandes
Planteamiento de las Hipótesis.
H o : No existe diferencias en la preferencia calidad de la enseñanza
H a : Noexiste diferencias en la preferencia calidad de laenseñanza
Nivel de Significancia. α =5 %.
Determinar el número de signos + y – y obtener el valor de P. Es este caso se obtuvieron x=19
signos “+” y 11 signos “-“ y 10 neutros para un total de n=30 elementos (mediciones). Dado
que x >n/2 se calcula el valor de P a partir de la expresión:
(
P=2 P X ≥ 19 cuando p=
18
1
1
=2 1−∑ 30
2
i 2
i=0
)
[
30
( )( ) ]
P=2 [ 1−0.8998 ] =0.2005
Conclusiones. Dado que el valor de P=0.2005>0.05=α no se rechaza la hipótesis nula y por
tanto no existen diferencias significativas en la calidad de enseñanza de ambos grupos.
Aproximación Normal para la Prueba del Signo.
Siempre que n > 10, las probabilidades binomiales con p = 1/2 se pueden aproximar a partir de la
curva normal, ya que np = nq > 5. En este caso μ=np=n/2 y σ =√ n∗p∗(1− p)=√ n/4= √n /2 y
para el ejemplo anterior por aproximación normal se tendría que
1
19−0.5−μ
≤
(
)2 =2 P ( X −μ
)
σ
σ
1
18.5−n /2
18.5−15
P=2 P ( X ≥ 19 cuando p= ) =2 P ( Z ≥
=2 P ( Z ≥
)
2
√ n/2
√30 /2 )
1
P=2 P ( X ≥ 19 cuando p= ) =2 P ( Z ≥1.2780 )=2∗ [ 0.1006 ] =0.2012
2
P=2 P X ≥ 19 cuando p=
Dado que el valor de P=0.2012> 0.05=α no se rechaza la hipótesis nula y por tanto no
existen diferencias significativas en la calidad de enseñanza de ambos grupos. Obsérvese que
0.201 es el valor aproximado que da el SPSS ya que la muestra es grande.
En general para muestras grandes los valores de P se obtienen a partir de la aproximación
binomial al modelo normal.
Casos
μ> ~
μ0
Caso 1: Cuando Ha: ~
P=P ( X ≤ x cuando p=1/2 )=P
x +0.5−μ
≤
( X −μ
)
σ
σ
(
P=P X ≤ x cuando p=
1
x +0.5−n/2
=P Z ≤
2
√ n/2
) (
)
μ< ~
μ0
Caso 2: Cuando Ha: ~
x−0.5−μ
≤
( X −μ
)
σ
σ
1
x−0.5−n /2
P=P ( X ≥ x cuando p= ) =P ( Z ≥
2
√ n/2 )
P=P ( X ≥ x cuando p=1/2 )=P
μ ≠ ~μ0
Caso 3: Cuando Ha: ~
Si x <n/2 el valor de P se obtiene a partir de la expresión
1
x +0.5−μ
≤
(
)2 =2 P ( X−μ
)
σ
σ
1
x +0.5−n/2
P=2 P ( X ≤ x cuando p= )=2 P ( Z ≤
2
√ n/2 )
P=2 P X ≤ x cuando p=
Si x >n/2 el valor de P se obtiene de la expresión
1
x−0.5−μ
≥
(
)2 =2 P ( X−μ
)
σ
σ
1
x−0.5−n /2
P=2 P ( X ≥ x cuando p= )=2 P ( Z ≥
2
√ n /2 )
P=2 P X ≥ x cuando p=
En las expresiones anteriores el valor de 0.5 que se suma y resta es un factor de corrección por
continuidad de la aproximación binomial a la normal que hace mas precia la aproximación.
Obsérvese que en el caso 3 las probabilidades que se obtienen son iguales a las de los caso 1 y 2
solo que multiplicadas por 2.
Pruebas U de Mann Whitney y de Kruskall-Wallis
 A estas pruebas se les conoce como pruebas de suma de rangos porque dependen de los
rangos o clasificaciones de las observaciones de muestra.
 La prueba de Mann-Whitney se utiliza cuando se quiere comparar sólo dos poblaciones La
prueba de Kruskal-Wallis es la generalización de la prueba u de Mann Whitney para más de dos
poblaciones.
 En ambas pruebas las muestras se obtienen de manera independiente.
 Ambas permiten determinar si las muestras independientes se obtuvieron de la misma
población o de poblaciones distintas con la misma distribución de probabilidad.
 Estas pruebas consideran la magnitud de las observaciones a diferencia de la prueba de los
signos que solo toma en cuenta los signos más y menos y no la magnitud de los datos.
 La ventaja de este tipo de pruebas en relación a la prueba de los signos es que a través de los
rangos
Ejemplo 5. Asignación de rangos a un conjunto de datos.
Un ingeniero civil dispone de n=20 mediciones de tensión a la fractura de asfalto mezclado
caliente (en megapascales) producidos por una planta de asfalto para analizarlos. Los datos a
continuación:
Tensión a la fractura
8
0
12
6
17
9
8
0 30
10
5
17
5
13
8
17
9
17
9
13
8
17
5
17
9
17
9
17
9
17
9
17
9
17
9
Solución.
Lo primero es ordenar los datos.
Tensión a la fractura
3
0 80 80
10
5
12
6
Una vez ordenados se asignan los rangos.
Tensión a la fractura
Rango
3
0
10
5
80 80
2.
1 5
2.5 3
12
6
4
13
8
5
17
5
6
8
8
8
Al valor 80 le corresponde como rango 2.5=( 2+ 3 ) /2 y al valor 179 le corresponde el rango
8=(7+ 8+9)/3, los promedios de los rangos que les corresponderían si ellos fueran diferentes.
Prueba U de Mann - Whitney
El principio lógico en que se basa esta prueba consiste en lo siguiente. Si se tienen dos muestras
aleatorias tomadas de manera independientes y si las dos muestras provienen de dos
poblaciones idénticas, al mezclarse las muestras y asignarse los rangos al conjunto combinado de
datos, entonces rangos altos y bajos deben caer de manera similar entre las dos muestras. Si por
el contrario, los rangos bajos se relacionan de forma predominante en una de las muestras y los
rangos altos se encuentran de forma mayoritaria en la otra muestra, es de sospechar que las
muestras provengan de poblaciones con similar distribución de probabilidad pero con medianas
diferentes. En otras palabras, cuando los datos no provienen de distribuciones idénticas, a una
de las muestras le corresponderán en general los rangos más altos y a la otra muestra le serán
asignados de forma mayoritaria los rangos bajos y en consecuencia las sumas de los rangos
correspondientes a cada una de las muestras serán estadísticamente bastante diferentes en
magnitud.
La prueba U de Mann Whitney es la alternativa no paramétrica a la prueba paramétrica t de
Student en dos muestras cuando esta última no sea aplicable por no cumplirse todos las
suposiciones estrictas de que las muestras sean independientes y elegidas de poblaciones con
comportamiento normal, con variancias iguales conocidas y que los datos se midan cuando
menos en una escala de intervalo.
Notación:
n1 = número de elementos en la muestra 1.
n2 = número de elementos en la muestra 2.
R1 = suma de los rangos de los elementos en la muestra 1
R2 = suma de los rangos de los elementos en la muestra 2.
U = estadístico de la prueba
Para el cálculo del estadístico de prueba U debemos calcular
U 1=n1 n 2+
n1 ( n1 +1 )
−R1
2
y
U 2=n1 n 2+
n2 ( n2 +1 )
−R 2
2
Escogencia del estadístico U .
Si la hipótesis alterna es Ha: ~μ1 < ~μ2 , U ¿ min ⁡(U ¿ ¿1 , U 2 )¿
Si la hipótesis alterna es Ha: ~μ1 > ~μ2, U ¿ máx ⁡( U ¿ ¿ 1, U 2 )¿
En caso de que Ha: ~μ1 ≠ ~μ 2 podemos escoger a cualquiera
de los dos como valor del estadístico U .
Aproximación Normal
Cuando la hipótesis nula que las n +n observaciones provienen
de poblaciones idénticas es cierta y tanto n como n son mayores
que 8, entonces la distribución muestral del estadístico U tiene a
distribuirse normalmente con una media de
1
2
1
μU =
2
n1 n2
2
y desviación estándar
n 1 n2 ( n1 +n2 +1 )
12
√
en la medida que
σU =
zc=
U−μU
σU
n1
y
n2
son mayores y entonces la estadística
tiende a la distribución normal estándar.
Reglas de decisión. Dado que la estadística de prueba z c es normal la región crítica depende de
la forma de la hipótesis alternativa:
μ 2, se rechaza H 0 a favor de H a si el valor de P=Pr ( Z < z c ) <α .
Caso 1. Si H a : ~μ1< ~
μ 2, se rechaza H 0 a favor de H a si el valor de P=Pr ( Z > z c ) <α .
Caso 2. Si H a : ~μ1> ~
μ2, se rechaza H 0 a favor de H a cuando para z c < 0 el valor de
Caso 3. Si H a : ~μ1 ≠ ~
P=2 Pr ( Z < z c ) <α ó si z c > 0 el valor de P=2 Pr ( Z > z c ) <α .
En todos los casos cuando el valor de P es menor al valor de alfa se rechaza la hipótesis nula.
Ejemplo 6. Comparación de dos poblaciones.
Un profesor tiene dos grupos de psicología: uno en la mañana, con 9 alumnos, y otro en la tarde
con 12 alumnos. En el examen final, que es el mismo para ambos grupos, las calificaciones
obtenidas son las que se muestran en la tabla a continuación. ¿Puede concluirse a un nivel de
significancia de 0.05 que el grupo de la mañana posee un rendimiento menor al del grupo de la
tarde? Resolver el problema, primero a mano, dando todos los y luego utilizando el SPSS.
Grupo Mañana
Grupo Tarde
7
3
8
6
87
81
7
9
8
4
7
5
8
8
82
90
6
6
8
5
9
5
8
4
75
92
7
0
8
3
9
1
53 84
Solución.
Planteamiento de las hipótesis
Las hipótesis a probar son
Ho: ~
μ M =~
μ T vs
Ha: ~
μ M <~
μT
Ho : Calificaciones del grupo de la mañana son iguales a las calificaciones del grupo de la Tarde
vs
Ha: Calificaciones del grupo de la mañana son menores a las calificaciones del grupo de la Tarde
Establecer el nivel de significancia. α =0.05 .
Calculo del estadístico de prueba U .
n1 = numero de observaciones en la muestra 1 (mañana) = 9
n2 = numero de observaciones en la muestra 2 (tarde) = 12
R1 = suma de los rangos de la muestra 1 = 2+3+4+5.5+5.5+7+9+16+21 = 73
R2 = suma de los rangos de la muestra 2 = 1+8+10+12+12+12+14+15+17+18+19+20 = 158
Calificación
53
66
70
73
75
75
79
81
82
83
84
Grupo Rango Calificación Grupo Rango
Tarde
1
84
Tarde
12
Mañana
2
84
Tarde
12
Mañana
3
85
Tarde
14
Mañana
4
86
Tarde
15
Mañana
5.5
87
Mañana
16
Mañana
5.5
88
Tarde
17
Mañana
7
90
Tarde
18
Tarde
8
91
Tarde
19
Mañana
9
92
Tarde
20
Tarde
10
95
Mañana
21
Tarde
12
-
U 1=n1 n 2+
n1 ( n1 +1 )
9 ( 9+1 )
−R1 =9∗12+
−73=80
2
2
n2 ( n2 +1 )
12 ( 12+ 1 )
−R 2=9∗12+
−158=28
2
2
μ <~
μ , entonces U ¿ 28 ¿ ¿.
Dado que Ha: ~
U 2=n1 n 2+
M
T
Aproximación Normalón.
Dado que ambos tamaños de muestra son mayores a 8 se puede utilizar la aproximación normal.
Para ello calculamos la media y desviación estándar del estadístico U
Media
μU =
n1 n2 9∗12
=
=54
2
2
Desviación estándar
σU =
√
n 1 n2 ( n1 +n2 +1 )
9∗12 ( 9+ 12+1 )
=
= √198=14.07
12
12
√
luego obtenemos el valor de
zc=
U−μU 28−54
=
=−1.8477
σU
14.07
Regla de Decisión.
Dado que el valor de P=Pr ( Z ≤−1.8477 ) =0.0323,
se cumple que P<α y en consecuencia se rechaza la
μ =~
μ a favor de la alternativa
hipótesis nula H : ~
0
M
T
H a : ~μM < ~
μT .
Conclusión. Efectivamente el rendimiento de los
alumnos del grupo de la mañana es menor en
promedio al de los alumnos del grupo de la tarde.
Resultados obtenidos con el SPSS
Afortunadamente el uso de la tecnología nos facilita los cálculos. En este caso la manera como se
introducen los datos en el SPSS se muestra en la imagen a continuación. En ella se refleja la
codificación necesaria para realizar el análisis de Manny – Witney.
Esta codificación es necesaria para indicar al SPSS cuales datos pertenecen al grupo de la
mañana y cuales al grupo de la tarde. En este caso las primeras 9 observaciones de la variable
rendimiento son las del grupo de la mañana y se les asigna el código 1. El resto de los datos
pertenecen al grupo de la tarde y se les asigno el código cero.
Esta codificación es importante para que el signo del estadístico de prueba que calcula el SPSS
sea el correcto. En el caso del problema la hipótesis alternativa es posible plantearla de dos
maneras equivalentes:
Ha: ~
μ <~
μ que indica que la mediana del grupo de la mañana es menor al de la tarde
M
T
Ha: ~
μT > ~
μ M que indica que la mediana del grupo de la tarde es mayor al de la mañana
y ambas maneras significan lo mismo.
Regla para la codificación: Asignar el código 1 al grupo de datos que se encuentra a la izquierda
de la desigualdad.
μ M <~
μT el código 1 se debe asignar a los datos del grupo de la mañana y para
En el caso de Ha: ~
Ha: ~
μ >~
μ se debe asignar el 1 a los datos del grupo de la tarde.
T
M
En el caso del problema las hipótesis que se plantearon fueron
Ho: ~
μ =~
μ vs Ha: ~
μ <~
μ
M
T
M
T
μ M se
y por ello el código 1 se asignó a las observaciones del grupo de la mañana ya que ~
encuentra a la izquierda de la desigualdad.
Dado que por defecto el valor de P que genera el SPSS es para la hipótesis alterna de dos colas
Ha: ~
μ ≠~
μ para obtener el valor de P para la hipótesis unilateral simplemente se divide entre
1
2
dos el valor de P que produce el SPSS. En este caso el valor de P esta dado por
P=0.064/2=0.032 el cual coincide con nuestro valor calculado anteriormente.
Importante. El uso de la prueba de suma de rangos de Mann - Whitney no se restringe a
poblaciones no normales. Se puede utilizar en vez de la prueba t de dos muestras cuando las
poblaciones son normales, aunque la potencia será menor. La prueba de suma de rangos
siempre es superior a la prueba t para poblaciones definitivamente no normales.
Prueba de Kruskall-Wallis

Se le conoce también como la prueba H de Kruskal-Wallis.
 Es la generalización de la prueba de Mann - Whitney para más de dos muestras.
 Es la alternativa no paramétrica a la prueba F del análisis de la varianza para probar la
igualdad de k ≥ 2 medias poblacionales.
 No requiere que todas las k muestras provengan de poblaciones normales con varianzas
iguales.
Notación.
k = número total de grupos = número total de muestras .
n1 = número de elementos en la muestra 1.
n2 = número de elementos en la muestra 2.
…
n k = número de elementos en la muestra k.
n = número total de datos disponible.
n=n1 +n2 +n 3+ …+nk .
R1 = suma de los rangos de todos los elementos en la muestra 1.
R3 = suma de los rangos de todos los elementos en la muestra 2.
…
Rk = suma de los rangos de todos los elementos en la muestra k.
Planteamiento de las Hipótesis. Las hipótesis a contrastar con esta prueba son
H 0 :μ 1=μ2=μ3 vs H a :al menosuna de las μi es diferente
mismas del análisis de la varianza para determinar si dos o más muestras provienen de
poblaciones normales idénticas.
El estadístico de prueba es
k
2
Rj
12
H=
−3 ( n+1 )
∑
n ( n+1 ) j=1 n j
cuya distribución se aproxima a una distribución ji-cuadrada con k −1 grados de libertad cuando
los tamaños de todas las muestras son mayores o iguales a 5.
Regla de decisión. Dado que H posee distribución ji-cuadrada con k −1 grados de libertad, la
regla de decisión es rechazar la hipótesis nula de que todas las medias son iguales a favor de la
alternativa si
H > χ 2k −1 ;α
Ejemplo 7. La tienda “Styles boutique” tiene tres establecimientos en centros comerciales.
“Styles boutique” mantiene un registro diario del número de clientes que realmente compran en
cada establecimiento. La siguiente es una muestra de esos datos. Utilizando la prueba de
Kruskal-Wallis, ¿puede decir, al nivel de significancia de 0.05, que sus tiendas tienen el mismo
número de clientes que compran?
Centro Comenrcial
Plaza Mayor
San Diego
El Tesoro
Número de Clientes
99
64 101 85 79 88 97 95 90
83 102 125 61 91 96 94 89 93
89 98 56 105 87 90 87 101 76
100
75
89
Solución.
Planteamiento de las Hipótesis.
H 0 :μ 1=μ2=μ3 vs H a :al menosuna de las μi es diferente
En palabras las hipótesis para el caso del ejemplo son
H 0 : El número promedio de compradores es igual en las tres tiendas
vs
H a : Para al menos una de las tiendas el número promedio de compradores diferente.
Establecer el nivel de significancia. α =0.05 .
Lo primero es combinar los datos, ordenarlos de menor a mayor y asignar rangos. Luego se
obtiene las sumas de los rangos por tienda en cada centro comercial. En este caso hay k =3
grupos.
R1 = La suma de los rangos de la tienda en Plaza Mayor.
R2 = La suma de los rangos de la tienda en San Diego.
R3 = La suma de los rangos de la tienda en El Tesoro.
Centro
comercial
El Tesoro
El Tesoro
El Tesoro
El Tesoro
El Tesoro
El Tesoro
El Tesoro
El Tesoro
El Tesoro
El Tesoro
Clientes
Rango
56
76
87
87
89
89
90
98
101
105
1
5
9.5
9.5
13
13
15.5
23
26.5
29
R1=¿
145
Centro
comercial
Plaza Mayor
Plaza Mayor
Plaza Mayor
Plaza Mayor
Plaza Mayor
Plaza Mayor
Plaza Mayor
Plaza Mayor
Plaza Mayor
Plaza Mayor
Clientes
Rango
64
79
85
88
90
95
97
99
100
101
3
6
8
11
15.5
20
22
24
25
26.5
R1=¿
161
Centro
comercial
San Diego
San Diego
San Diego
San Diego
San Diego
San Diego
San Diego
San Diego
San Diego
San Diego
Clientes
Rango
61
75
83
89
91
93
94
96
102
125
2
4
7
13
17
18
19
21
28
30
R1=¿
159
Obtenidas las sumas de los rangos se procede a obtener el valor del estadístico H Kruskall-Wallis
con n=30, n1 =n2=n 3=10, R1=145 , R2=161 , R3=159 .
H=
3
R2j
12
∑ −3 ( n+1 )
n ( n+1 ) j=1 n j
H=
12
1452 1612 1592
+
+
−3∗31
30∗31 10
10
10
(
)
H=0.19613
Regla de Decisión.
Dado que el estadístico H tiene distribución aproximadamente ji-cuadrada, se rechaza la
2
hipótesis nula si H > χ 22 ;α =0.05=5.991, o bien si P=Pr ( χ 2 >0.19613 ) <α
Conclusión. En la grafica se aprecia
que
el valor H no cae en la región
crítica.El
valor
de
P=Pr ( χ 22 >0.19613 ) =0.9066> 0.05
por
lo tanto la hipótesis nula no se
rechaza, lo que significa que el
número de compradores promedio
las tres tiendas no son significativamente diferentes.
en
Prueba de Kolmogorov – Smirnov para ajuste de distribuciones.
El objetivo de esta prueba es determinar si los datos de una muestra aleatoria fueron obtenidos
de una distribución de probabilidad en específico. Se utiliza más a menudo cuando la variable
aleatoria que representan los datos es de tipo continuo. Se basa en la comparación de la función
de distribución de probabilidad teórica de la que se considera provienen los datos de la muestra
con la función de distribución empírica obtenida a partir de los datos.
Si X 1 , X 2 , X 3 ,… , X n es una muestra de una variable aleatoria X , F (x) representa a la función
de distribución de probabilidad teórica del modelo propuesto y por Sn (x ) a la función de
distribución empírica de la muestra, el estadístico que se utiliza para llevar a cabo el contraste de
hipótesis viene dado por
Dn =¿ x |F ( x )−S n( x)|
La hipótesis nula a contrastar es entonces
H 0 : Los datos de la muestra se ajustan a la distribución dada por F (x).
vs
H a : Los datos de la muestra no se ajustan a la distribución dada por F (x).
Para un valor de α de significancia, Se rechazará la hipótesis nula en favor de la alternativa
cuando el valor P asociado al estadístico de prueba Dn sea menor que el valor de α.
Pasos para realizar el contraste.
1. Planteamiento de las hipótesis.
2. Especificación del nivel de significancia α.
3. Obtención des estadístico de la prueba.
Para ello se ordenan los valores de la muestra de menor a mayor.
Se obtiene la función de distribución empírica Sn ( x i )=i /n en cada valor de la muestra;
esto es, para cada dato x i en la muestra.
Se calcula el valor
{
}}
d n=max max |F ( x(i) )−S n ( x (i ) )|;|F ( x (i ) )−Sn ( x (i−1) )|
1≤ i ≤n
{
x
4. Regla de decisión. Si el valor de la tabla para el nivel de significancia elegido es mayor
que el valor calculado de d n, entonces aceptaremos la hipótesis nula, o tambien en
base al valor P se rechazará la hipótesis nula en favor de la alternativa si el valor de
P=P ( D n > d n) < α .
La distribución de probabilidad de DN, necesaria para calcular el p-valor, no es muy conocida.
Para evaluar esta probabilidad hay que consultar tablas de dicha distribución.
Tablas estadísticas para la prueba de Kolmogorov – Smirnov.
Ejemplo 8. Los datos que aparecen en la tabla a continuación representan el tiempo necesario
para que un individuo sea atendido en una cafetería. Nos planteamos si una distribución normal
es adecuada para su ajuste.
Tiempo para 3.35 3.69 3.76 3.81 3.85 3.86 3.99 4.03 4.04 4.16
se atendido 4.17 4.22 4.23 4.23 4.31 4.42 4.46 4.6 4.66 5.12
Solución.
Planteamiento de las hipótesis.
H 0 : Los datos de la muestra se ajustan a la distribución normal
vs
H a : Los datos de la muestra no se ajustan a la distribución normal
Nivel de significancia. α =0.05
Obtención de estadístico de prueba.
Tiempo
Fi
3.35
1
3.69
2
3.76
3.81
3
4
F(x)
0.0216
3
0.1230
2
0.1628
7
0.1959
Fr(i) Fr(i-1)
0.05
0.10
0.15
0.20
di
0.00 0.0284
0.05 0.0230
0.10 0.0129
0.15 0.0040
di-1
-0.0216 Max dn= 0.1177
-0.0730 Min dn= -0.0730
-0.0629
-0.0460
d20 = 0.1177
3.85
5
3.86
6
3.99
7
4.03
8
4.04
9
4.16
10
4.17
11
4.22
12
4.23
13
4.23
14
4.31
15
4.42
16
4.46
17
4.6
18
4.66
19
5.12
20
Media
=
Desv =
7
0.2251
9
0.2328
6
0.3445
1
0.3825
2
0.3922
2
0.5121
2
0.5222
2
0.5723
5
0.5822
7
0.5822
7
0.6592
1
0.7545
7
0.7853
1
0.8738
6
0.9026
5
0.9930
9
0.25
0.20 0.0248 -0.0252
0.30
0.25 0.0671 0.0171
0.35
0.30 0.0055 -0.0445
0.40
0.35 0.0175 -0.0325
0.45
0.50
0.40 0.0578 0.0078
0.45 0.0121 -0.0621
0.55
0.50 0.0278 -0.0222
0.60
0.55 0.0276 -0.0224
0.65
0.60 0.0677 0.0177
0.70
0.65 0.1177 0.0677
0.75
0.70 0.0908 0.0408
0.80
0.75 0.0454 -0.0046
0.85
0.80 0.0647 0.0147
0.90
0.85 0.0261 -0.0239
0.95
0.90 0.0473 -0.0027
1.00
0.95 0.0069 -0.0431
4.148
0.395
Regla de decisión Dado que el valor de la tabla 0.294 es mayor que el valor calculado de
d 20=0.118 , entonces no se rechaza la hipótesis nula.
Si se utiliza el valor de P que da el SPSS se tiene que dado P=0.2> 0.05 se concluye que no se
rechaza la hipótesis nula.
Conclusión. Dado que el valor de P es 0.2 > 0.05 se concluye que los tiempos para ser atendidos
en la cafetería siguen una distribución normal con media μ=4.148y desviación estándar
σ =0.395.
Salida en SPSS
Obsérvese que el Max dn = 0.118 y Min dn = -0.073 coinciden con los valores arrojados por el
SPSS.
Prueba ji-cuadrada de independencia(datos categóricos)
Una tabla de contingencia de 2 x 2 es una tabla donde se organizan los datos de dos variables
categóricas, de tal manera que en ella se exhibe la cantidad de elementos en la muestra que
tienen en común dos características, una por cada variable asociada a la tabla.
Si la tabla tiene r filas y c columnas se denomina tabla r ×c (“ r ×c ” se lee “r por c ”). En una
tabla de contingencia los totales de las filas y columnas se denominan frecuencias marginales.
A continuación se presenta un ejemplo de una tabla de contingencia de 3 x 4; es decir tres filas y
cuatro columnas. En esta tabla A, B, C son las categorías de la variable Municipio y Asalto, Robo
de casas, Hurto, Homicidio las categorías de la variable Tipo de crimen. El valor 162 significa que
de los 2532 casos investigados 162 fueron asaltos que se cometieron en el Municipio A. El valor
919 significa que de los 2532 casos investigados 919 crímenes ocurrieron en el Municipio B. De
similar manera se interpretan el resto de los valores en la tabla.
Municipi
o
A
B
C
Total
Asalt
o
162
258
280
700
Tipo de crimen
Robo de casas Hurto
118
193
175
486
451
458
390
1299
Homicidio
Total
18
10
19
47
749
919
864
2532
La prueba ji cuadrada de independencia tiene como objetivo probar si existe alguna relación de
dependencia entre dos variables categóricas. Para el caso de la tabla anterior la prueba busca
determinar si el tipo de crimen que se comete y el municipio donde ocurre el delito guardan o
no
alguna
relación.
Para
este
ejemplo
las
hipótesis
a
contrastar
serian:
H 0 : El tipo de delito que se comete es independiente del municipio donde ocurre eldelit o
H a : E ltipo de delito que se comete y el municipio donde ocurre el delit o son dependientes
Si al llevar a cabo el proceso de prueba de hipótesis la evidencia estadística (contenida en la
muestra) la hipótesis nula no es rechazada, significa que no existe relación alguna entre el
Municipio y el tipo de robo cometido. Por otra parte, el rechazo de H 0 a favor de H a implica que
si hay algún tipo de relación entre el municipio donde ocurre el crimen y ei tipo de crimen.
Los pasos a seguir para llevar a cabo el contraste ji cuadrado de independencia son muy
sencillos.
1. Plantear las hipótesis a contrastar. Para el ejemplo serian
H 0 : El tipo de delito que se comete es independiente del municipio donde ocurre eldelit o
H a : E ltipo de delito que se comete y el municipio donde ocurre el delit o son dependientes
2. Elegir el nivel de significancia α. Para este ejemplo elegiremos α =0.02.
3. Obtener el valor del estadístico de la prueba. El estadístico de prueba a calcular se obtiene a
partir de la expresión:
r
2
c
χ =∑ ∑ c
i=1 j=¿¿
( O ij −Eij )
2
Eij
donde la sumatoria se extiende a todas las r ×c celdas en la tabla de contingencia y donde a
Oij y Eij se les conoce como las frecuencias observadas y esperadas. Lo complicado de la
formula no nos debe de preocupar ya que como veremos los cálculos son muy sencillos de
realizar.
Las frecuencias observadas O ij son sencillamente las frecuencias que se presentan en la
tabla de frecuencia que se obtienen a partir de los datos de la muestra. En nuestro ejemplo
las frecuencias observadas son O11 =162, O 12=118, O 13=451 y así sucesivamente hasta
O34=19.
De manera equivalente E11 se refiere a la frecuencia esperada correspondiente a la celda
que se encuentra en al interceptar la fila 1 con la columna 1, la cual se obtiene a partir de
multiplicar el total de las fila 1 (749) por el total de la columna 1 (700) y luego dividiendo este
producto por el GranTotal=n=2352; es decir a partir de la expresión:
E11 =
Total de la fila 1 x Total de la columna 1
GranTotal
E11 =
749∗700
=207.07
2532
y de esta manera para las demás frecuencias esperadas.
Obtenidas las frecuencias esperadas se calcula el aporte a la suma ji-cuadrado a través de la
expresión
( Oij −Eij )
2
Eij
que para el caso del Municipio A y tipo de crimen Asalto seria
( O11−E 11 )
2
E 11
(162−207.07 )2
=
=9.81
207.07
A continuación la tabla con las frecuencias observadas, esperadas y el aporta a la suma jicuadado
Tipo de crimen
Municipi
o
Asalto
A
162 207.07
9.81
B
258 254.07
0.06
C
280 238.86
7.08
Total
700
700
16.955
Robo de casas
11
8 143.77 4.62
19
3 176.40 1.56
17
5 165.84 0.51
48
6.68
6 486.00
7
Hurto
Homicidio
Total
451
384.26
11.59
18
13.90
1.21
749
458
471.48
0.39
10
2.92
919
390
129
9
443.26
6.40
19
17.06
238.8
6
269.8
2
0.55
4.67
5
864
1299
18.376 47
2532
Una vez realizados los cálculos se procede a obtener el valor del estadístico de prueba jicuadrado
r
2
c
χ =∑ ∑ c
i=1 j=¿¿
2
( Oij −Eij )
Eij
=16.955+6.687+18.376+ 4.675=46.693
El estadístico de prueba χ 2c posaee distribución ji-cuadrado con
4. Regla de decisión.
v=( r−1 ) ( c−1 ) grados de libertad
r
2
c
χ =∑ ∑ c
i=1 j=¿¿
2
( Oij −Eij )
Eij
2
χv
En consecuencia, para un nivel de significancia α se rechaza la hipótesis nula de
independencia de las variables categóricas si χ 2c > χ 2v; α; es decir, si el valor calculado χ 2c cae en
la región critica como se muestra en la figura.
Para el ejemplo, los grados de libertad son v=( r−1 ) ( c−1 ) =( 3−1 ) ( 4−1 )=6 grados de libertad.
En consecuencia como χ 2v; α = χ 26 ;0.05=12.592 y χ 2c =46.693 se sigue que χ 2c > χ 2v; α (46.693>12.592),
en consecuencia se rechaza la hipótesis nula de independencia; esto es, la ocurrencia de estos
tipos de delitos depende del Municipio.
Salida del SPSS
Resumen de procesamiento de casos
Casos
Válido
N
Municipio * Crimen
2532
Perdidos
Total
Porcentaje N Porcentaje
100.0% 0
N
0.0% 2532
Porcentaje
100.0%
Municipio*Crimen tabulación cruzada
Crimen
Asalto Robo de casas
Municipio A Recuento
Recuento esperado
B Recuento
Recuento esperado
C Recuento
Recuento esperado
Total
Recuento
Recuento esperado
Total
Hurto
Homicidio
162
118
451
18
749
207.1
143.8
384.3
13.9
749.0
258
193
458
10
919
254.1
176.4
471.5
17.1
919.0
280
175
390
19
864
238.9
165.8
443.3
16.0
864.0
700
486
1299
47
2532
700.0
486.0 1299.0
47.0 2532.0
Pruebas de chi-cuadrado
Valor
gl
Sig. asintótica (2 caras)
46.693a
6
.000
Razón de verosimilitud
47.405
6
.000
Asociación lineal por lineal
34.255
1
.000
Chi-cuadrado de Pearson
N de casos válidos
2532
a. 0 casillas (0.0%) han esperado un recuento menor que 5. El recuento mínimo esperado es
13.90.
Nota: Obsérvese que los resultados obtenidos con el SPSS coincides con los obtenidos
anteriormente
Descargar