Descargar archivo - Estadística inferencial Juan José Hernández

Anuncio
PRUEBAS PARAMETRICAS
Y PRUEBAS NO
PARAMETRICAS
.
[email protected]
JUAN JOSÉ HERNÁNDEZ OCAÑA
.
PRUEBAS PARAMETRICAS
Los métodos paramétricos se basan en el muestreo de una población con
parámetros específicos , como la media poblacional, la desviación
estándar o la proporción p .
Además deben de reunir ciertos requisitos como lo es, que los datos
muestrales provengan de una población que se distribuya normalmente.
Las pruebas paramétricas se emplean con datos en una escala ordinal, de
intervalo o de razón
.
Ventajas del empleo de pruebas no paramétricas
1.- Los métodos no paramétricos se aplican a una gran variedad
de situaciones, ya que no se requiere que cumplan ciertas
condiciones como lo es el de la distribución normal de los datos
como es el caso de los métodos paramétricos
2.- Se aplican principalmente cuando empleamos datos
nominales , como es el caso en muchas de las respuestas que se
emplean en las encuestas y en muchas pruebas de psicología y
pedagogía
3- Sus cálculos son más sencillos y nos permiten una
interpretación mas fácil de entender y aplicar, aunque la potencia
de las pruebas es menor a las pruebas paramétricas
PRUEBAS NO
PARAMETRICAS
Los métodos estadísticos paramétricos requieren del
empleo de datos medidos en una escala de intervalo o
de razón.
En estos niveles de medición tienen sentido las
operaciones aritméticas como el análisis de medias,
desviación estándar y varianzas
Se parte de los supuestos de que los datos se distribuyen
normalmente y que las varianzas son iguales
Los métodos no paramétricos se
pueden usar con datos nominales
No se emplean los parámetros de la
población como estadísticos de
prueba
El método se puede usar con datos
de intervalo o de razón cuando no
cabe supuesto alguno sobre la
distribución de probabilidad de la
población
Desventajas de las pruebas no paramétricas
Son menos confiables que las pruebas paramétricas
Por los general los métodos no paramétricos no
consideran las magnitudes de las diferencias entre los
datos, sino solamente el signo de las diferencias de
las mismas
PRUEBA DE SIGNOS DE
WILCOXON
ES LA ALTERNATIVA NO PARAMÉTRICA DE LA PRUEBA DE MUESTRAS
PARAMETRICAS DE DATOS APAREADOS
Prueba de rangos con signo de Wilcoxon

UTILIDAD
Es útil para probar la aseveración de que una muestra proviene de una
población con una mediana específica.
 Se emplea para grupos correlacionados ( datos apareados) y cuyos datos
no siguen una distribución normal
 Esta prueba toma en cuenta la magnitud como la dirección de los puntajes
de diferencia
 Puede emplearse en lugar de la prueba t para grupos dependientes cuando no
se tiene certeza de la distribución de la muestra y no se tiene datos sobre la
población

Prueba de signos de Wilcoxon

Es una prueba no parámetrica que utiliza rangos ordenados de datos muestrales
consistentes en datos apareados. Se usa para probar las diferencias en las
distribuciones poblacionales y se basa en los siguientes supuestos.
 Los datos consisten en datos apareados que se seleccionan aleatoriamente
 La podemos emplear para evaluar si dos grupos dependientes tienen
distribuciones similares
 La distribución de las diferencias tiene una distribución que es aproximadamente
simétrica
 Los datos dentro de cada pareja deben ser por lo menos de mediciones ordinales
 Para calcular Tobt hay que ordenar por rangos de puntaje de diferencia
Métodos por rangos
Los datos se ordenan de acuerdo a un criterio, por ejemplo del más pequeño al más grande, o
del mayor a menor, etc.
◦ El rango es el número que se asigna a un elemento muestral individual de acuerdo con su
orden en la lista ordenada
Se descartan todas las diferencias iguales a cero y se ordenan y etiquetan las diferencias
absolutas restantes, desde la mínima hasta la máxima.
Cuando las diferencias son iguales se les asigna la clasificación media a sus posiciones
ordenadas en el conjunto combinado de datos
La idea básica que está detrás de la prueba del signo es el análisis de las frecuencias de los
signos positivos y negativos para determinar si son significativamente diferentes
Emplearemos el estadístico de prueba con base en el número de veces que ocurre el signo
menos frecuente.
Procedimiento
1.- Para cada par de datos, calcule la
diferencia d, restando el segundo valor
del primero, pero conserve los signos
2.- Descarte cualquier valor igual a cero.
3.- Ordene de menor a mayor en términos
de valor absoluto
4.- Cuando las diferencias tengan el
mismo valor numérico, asigne la media de
los rangos
Calcule la suma de los valores absolutos
de rangos positivos y de los negativos
Prueba de signos Wilcoxon

Criterios
 T= se elige a la más pequeña de las siguientes sumas:
 La suma de los valores absolutos de los rangos negativos de las
diferencias d
 La suma de los rangos positivos de las diferencias d
 Si el tamaño de la muestra es menor a 30 , entones empleamos
estadístico T y se compara con T critico de tablas.
 Si el valor de TOBT es menor o igual a TCRI
rechazamos Ho
 La suma de los rangos debe ser igual a
CRITERIO
 Si
el valor de TOBT es menor o igual a TCRI
rechazamos Ho
rechazo Ho sí
t obt ≤
t critico

𝑍=
𝑅𝑚𝑒𝑛𝑜𝑟 −µ
σ
𝑛(𝑛 + 1)
𝑢=
4
σ=
𝑛(𝑛 + 1)(2𝑛 + 1)
24
Prueba de signos de Wilcoxon
◦ La Ho sería: Las dos muestras provienen de poblaciones con la
misma distribución
◦ ESO SIGINFICA QUE NO EXISTE DIFERENCIA ENTRE LA
DISTRIBUCIÓN DE LOS DATOS DE LAS DOS POBLACIONES
◦ La hipótesis alternativa sería: Las dos muestras provienen de
poblaciones con distribuciones diferentes
Ejercicio

Las mediciones de la capacidad mental de niños pequeños se hacen
dándoles cubos y pidiéndoles que construyan una torre tan alta como sea
posible. Un investigador está interesado en comprobar sí ambientes de
aprendizaje modifican el desarrollo mental de los niños. Para ello realiza un
experimento de construcción con cubos y mide la capacidad mental de los
niños. Después les proporciona ambientes favorables al aprendizaje y
repite el experimento tres meses después con los mismos niños para verificar
si existen cambios. Los datos muestran los tiempos en segundos de la
construcción de determinados modelos
 Utilice un nivel de significancia de 0.05 y pruebe la aseveración de que
no hay diferencias entre los tiempos de la primera y la segunda prueba.
Niño
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
2ra
prueba
30
19
19
23
29
78
42
20
12
39
14
81
17
31
52
1da
prueba
30
6
14
8
14
42
14
22
17
8
11
30
14
17
15
Diferencia 0
s
13
5
15
15
36
28
-2
-5
31
3
51
3
14
37
Rangos de
diferencias
6
4.5 8.5
Rangos con
signos
6
4.5
8.5
8.5
8.5
12
12
10
1
10 1
4.5
4.5
Suma de signos positivos 99.5
Suma de signos negativos 5.5
11
2.5 14 2.5
7
13
11
2.5
7
13
14 2.5
EJERCICIO
Un investigador quiere determinar si la dificultad del material
que han de aprender afecta el nivel de ansiedad de los
estudiantes universitarios. A cada uno de los miembros de un
muestra aleatoria de 12 alumnos se les asigna ciertas tareas de
aprendizaje que se clasifican como tareas fáciles y difíciles.
Antes de que los estudiantes inicien cada tarea, se les presenta
algunos ejemplos de las diferentes tareas como muestra del
material que van a aprender. A continuación, se mide el nivel de
ansiedad que mostraron los alumnos, mediante un cuestionario.
De esta manera, se mide el nivel de ansiedad antes de cada
aprendizaje. Cuál es la conclusión utilizando la prueba de signo
de WilcOXON y una alfa de 0.05
estudiante
1
2
3
4
5
6
7
8
9
10
11
12
Tarea
Difícil
48
33
46
42
40
27
31
42
38
34
38
44
Tarea fácil
40
27
34
28
30
24
33
39
31
39
29
34
Diferencia
8
6
12
14
10
3
-2
3
7
-5
9
10
Rango de la
diferencia
7
5
11
12
9.5
2.5
1
2.5
6
4
8
9.5
Tobt es la suma de los valores absolutos de rango negativos que es 5
El valor de T critico es de 14 ( considerando n = 12)
Por lo que rechazamos Ho y concluimos que los materiales influyen en la
ansiedad de los estudiantes
Una de las principales compañías petroleras realizan un
experimento para averiguar sí una película filmada puede
promover actitudes más favorables hacia las grandes empresas .
Doce individuos participan en un diseño de medidas replicadas.
En la condición antes, cada sujeto llena un cuestionario para
evaluar su actitud actual hacia las grandes compañías petroleras.
En la condición después el mismo sujeto mira la película y después
contesta el cuestionario. Las calificaciones altas mostradas en la
tabla muestran actitudes más favorables. Considera que la muestra no
se distribuye normalmente
Con un alfa de 0,05 que podemos concluir:
◦ Ho La presentación de la película no incide en fomentar una actitud más favorable
hacia las compañías petroleras
◦ Ha La presentación de la película influye de manera favorable ( mas que ) en la
actitud hacia las compañías petroleras
Antes
43
48
25
24
15
18
35
28
41
28
34
12
después 45
60
22
33
6
22
41
21
55
33
44
23
diferenc 2
ia
12
-3
9
-9
4
6
-7
14
5
10
11
11
2
7.5
7.5
3
5
6
12
4
9
10
rango
1
Suma de negativos= 15.5
Lo consideramos como T obt
Suma de positivos= 62.5
Para una alfa de 0.05 de una cola el valor de T critico es de 11
Como 15.5 17 no Rechazo Ho
Las películas promueven una actitud más favorable hacía las compañías petroleras
PRUEBA DE U MANN WHITNEY O WILCOXON PARA
GRUPOS INDEPENDIENTES
ESTA PRUEBA SE EMPLEA EN COMBINACIÓN CON EL
DISEÑO DE GRUPOS INDEPENDIENTES, CON DATOS
QUE TIENEN POR LO MENOS UNA ESCALA ORDINAL
ESTA PRUEBA PUEDE SUSTITUIR A LA PRUEBA T
STUDENT CUANDO ÉSTA NO CUMPLE CON LA
SUPOSICIÓN DE NORMALIDAD DE SU POBLACIÓN.
LA HIPÓTESIS NULA Y ALTERNATIVA SE ENUNCIAN
SIN MENCIONAR LOS PARÁMETROS DE LA
POBLACIÓN
PRUEBA DE U MANN WHITNEY O WILCONOX PARA
GRUPOS INDEPENDIENTES
YA QUE SE REQUIERE ORDENAR LOS DATOS POR RANGOS
PARA CALCULAR U ESTA PRUEBA REQUIERE QUE LOS
DATOS ESTÉN POR LO MENOS EN UNA ESCALA ORDINAL.
TAMBIÉN PUEDE EMPLEARSE EN LUGAR DE LA PRUEBA T
CUANDO LOS DATOS NO SE ENCUENTRAN EN UNA ESCALA
DE RAZÓN O INTERVALO.
BÁSICAMENTE COMPARA LA DIFERENCIA ENTRE LAS
MEDIANAS DE DOS GRUPOS
MANN- WHITNEY
El ordenamiento de rangos es de menor a mayor y no se consideran
valores absolutos como en la prueba de signos
En este caso se combinan los dos grupos
Se ordenan los rangos y se asigna a cada uno un puntaje de rango
usando como 1 al puntaje más bajo
En este caso si s e toma en cuenta el signo para dar el orden
jerárquico en el rango
Sume los Rangos del grupo 1 y Sume los rangos del grupo 2
Resuelva las ecuaciones y asigne el valor de Uobt al valor del grupo
en el que se obtenga el valor más bajo
Obtenga U crit y compare
Si Uobt ≤ U crit Rechazo Ho ( si es menor o igual )
Si U´obt ≥ U´ crit Rechazo Ho ( Sí es mayor o igual)
Prueba z y rangos

Si una de las muestras o las dos exceden el tamaño
de 10 puede emplearse la aproximación a la
distribución normal empleando el estadístico Z. La
prueba es de dos colas, puesto que un valor grande
de z indicaría que los rangos más altos se encuentran
desproporcionalmente en la primera muestra



𝑍=
𝑅 −0.5 (𝑈)
σ
Factor de corrección para muestras pequeñas
Criterio para z


Rechazo Ho
si
ZOBT ≥ ZCRITICO
Ejercicio
Una psicóloga del desarrollo, tiene la sospecha de que el hecho de
consumir una dieta rica en proteínas a una edad mejora el
desarrollo intelectual. Para probarlo, se realiza un experimento en el
cual 17 niños son elegidos aleatoriamente entre los niños que tienen
un año de edad. Al grupo control se le alimenta durante 3 años con
una dieta usual, pobre en proteínas, mientras que el grupo
experimental ingiere una dieta rica en proteínas en ese mismo
período. Al final del experimento cada uno de los niños es sometido a
una prueba de CI. De acuerdo a los datos que se presentan en la tabla
siguiente y considerando que no se sabe sí los datos se distribuyen
normalmente y sí emplea un alfa de 0.05 , cuales serían sus
conclusiones?
GRUPO
1
EJERCICO
control
GRUPO 2
experimental
RANGO 1
1
102
8
113
11
118
15
130
16
135
17
140
12
120
14
125
7
111
13
122
5
108
10
117
4
107
9
115
3
105
6
110
2
104
Rango 2
Puntaje
102
104
105
107
108
110
111
113
115
Rango
1
2
3
4
5
6
7
8
9
Puntaje
117
118
120
122
125
130
135
140
Rango
10
11
12
13
14
15
16
17
N1 = 9
N2= 8
R1= 53
R1= 100
U= 64
U= 8
Z = -2. 69
Busco U critico en tablas con n1= y n2 = 8 y un alfa de 0.05 y
obtengo un valor de , por lo que rechazo Ho
En el caso de Z critico su valor es
ejercicio está interesada en averiguar si existe alguna diferencia
Una psicóloga
en la habilidad espacial entre las persona zurdas y las diestras. Para
averiguarlo toma una muestra de 10 zurdos y 10 diestros, entre los
estudiantes de esta universidad y los somete a una prueba para medir
su habilidad espacial. Tome nota que uno de los sujetos de la muestra
no se presentó para la prueba. No se sabe si los datos se distribuyen
normalmente y no se tienen datos poblacionales al respecto. Si
considera un alfa de 0.05 de dos colas cuál es sus conclusión
Zurdos
87
94
56
74
98
83
92
84
76
diestros
47
68
92
73
71
82
55
61
75
85
Zurdos
87
15
94
18
56
3
74
8
98
19
83
12
92
16.5
84
13
76
10
diestros
47
1
68
5
92
16.5
73
7
71
6
82
11
55
2
61
4
75
9
Zurdos
114.5
Diestros
75.5
85
14
Tarea
Un ornitólogo sospecha que las inyecciones de la hormona FSH
incrementa la habilidad de canto de los pájaros machos. Para
poner a prueba su hipótesis selecciona 20 pájaros y los dividen en
dos grupos de 10 cada uno. Sin embargo dos aves del segundo
grupo no pudieron ser evaluadas. Al primer grupo se les
administra la hormona y al segundo grupo solo una solución
salina como control. Después de ello se hace un registro de
resultados donde resultados mayores indican mayor cantidad de
cantos . Empleando una alfa de 0.05 y considerando que los datos
no se distribuyen normalmente
◦ Cual son sus hipótesis nula y alternativa?
◦ Cuáles son su conclusiones?
Solución
salina
17
31
14
12
29
23
7
19
FSH
10
29
37
41
16
45
34
57
Solución
salina
17
7
31
13
14
5
12
4
29
11.5
23
9
7
2
19
8
FSH
10
3
29
11.5
37
15
41
16
16
6
45
17
34
14
57
18
SOLUCION SALINA
70.5
FSH
100.5
28
28
10
3
3
1
Hipnosis
ordinario
20
42
21
35
33
30
40
53
24
57
43
26
48
37
31
30
22
51
44
62
30
59
• Un consejero universitario cree que la hipnosis
es más eficaz para reducir que el tratamiento
habitual que se aplica a los estudiantes que
muestran un alto nivel de ansiedad frente a los
exámenes. Para probar su sospecha, divide en
dos grupos a 22 estudiantes que muestran altos
niveles de ansiedad. Uno de los grupos recibe el
tratamiento a base de hipnosis y el otro recibe el
tratamiento ordinario. Una vez concluidos los
tratamientos, los estudiantes son sometidos a
pruebas sobre ansiedad. Considerando un alfa
de 0.05, resuelva:
– A) considere que los datos se distribuyen
normalmente
– B)Considere que los datos no se distribuyen
normalmente
– Cuáles son sus conclusiones en ambos casos?
Hipnosis
ordinario
20
(1)
42 (14)
21
(2)
35 (11)
33 (10)
30 (7)
40 (13)
53 (19)
24 (4)
57 (20)
43 (15)
26 (5)
48 (17)
37 (12)
31 (9)
30 (7)
22 (3)
51 (18)
44 (16)
62 (22)
30 (7)
59 (21)
R1 = 97
R2= 156
Prueba de KRUSKAL WALLIS
Esta prueba se utiliza para probar la hipótesis nula de que tres o
más muestras de grupos independientes provienen de poblaciones
idénticas.
◦ Es una prueba no parámetrica que utiliza rangos de muestras independientes
de tres o más poblaciones
Esta prueba tiene una distribución que pude aproximarse por la
distribución ji cuadrada siempre y cuando tenga al menos cinco
observaciones en cada grupo.
◦ La prueba es de cola derecha
◦ El estadístico de prueba H es básicamente una medida de la varianza de las
suma de los rangos Ri ,R2… Rk. Por ello si los rangos se distribuyen de manera
equitativa entre los grupos muestrales, entonces H debe ser un número
relativamente pequeño
KRUSKALS
PRUEBA DE KRUSKAL WALLIS
Esta prueba se emplea como sustituta del análisis de varianza ya que no supone
ni la normalidad de la población ni la homogeneidad de la varianza como la
ANOVA
No hace predicción alguna sobre las medias de la población, sólo afirma que
cuando menos una de las distribuciones poblaciones es diferente de algunas
de las otras distribuciones poblacionales
Por lo que la hipótesis nula afirma que las muestras son aleatorias, extraídas de
las mismas o idénticas distribuciones poblaciones
Condiciones
Esta prueba utiliza rango muestrales de tres o más poblaciones independientes
Cada muestra tiene al menos cinco observaciones
El estadístico de la prueba H es una mediad de la varianza de las sumas de los rangos R1, R2,
R3…Rn
Si los rangos se distribuyen de una manera equitativa entre los grupos muestrales, entonces H
debe ser un número relativamente pequeño por lo que no se rechazará la hipótesis nula
PRUEBA DE KRUSKAL WALLIS
Esta prueba es de cola derecha y la regla de decisión es
Si
Hobt ≥ H cri
rechazamos Ho
Se emplea tabla de CHI cuadrada con gl= k – 1
Una empresa está realizando una investigación sobre diferentes
métodos de capacitación para el área gerencial. El experimento implica
tres condiciones. En la condición 1 los sujetos reciben capacitación en
dos estilos gerenciales. En la condición 2, los individuos no reciben
capacitación adicional, sÍ no ,solo son asignados al trabajo de acuerdo a
su propio estilo gerencial. La condición 3 es de control y en ella los
sujetos no reciben capacitación alguna . Después de que se han
desempeñado en su trabajo durante 6 meses se hace una evaluación y
se califica su desempeño. Mientras más alta sea la calificación, mejor
será el rendimiento. Si considera un alfa de 0.05 y sabemos que los
datos no se distribuyen normalmente , cuáles son sus conclusiones?
EJERCICIO
Condición 1
Condición 2
cal
rango
cal
Rango
65
84
87
53
70
85
56
63
8
16
19.5
2
9
17
4
7
90
83
76
87
92
86
93
21
15
12
19.5
22
18
23
Condición 3
Cal
rango
55
82
71
60
52
81
73
57
3
14
10
6
1
13
11
5
EJERCICIO
Un investigador sospecha que los individuos de diferentes profesiones varía en
su grado de ser hipnotizados. Para el experimento son elegidos al azar 6
abogados, 6 médicos y 6 bailarines. A cada uno se les practica un examen de
susceptibilidad hipnótica . Mientras más alta sea la calificación mayor será la
susceptibilidad a ser hipnotizados. Suponga que los datos violan los supuestos
necesarios para el uso de la prueba F pero al menos están en una escala ordinal.
Si emplea un alfa de 0.05 . Cuáles serían sus conclusiones?
Abogados
26 17
27
32
20
25
Médicos
14 19
28
22
25
15
Bailarines
30 21
35
29
37
34
La manufacturera Gómez recluta y
contrata empleados para su equipo
gerencial en tres universidades . En los
últimos días, su departamento de
personal ha estado reuniendo y
revisando las calificaciones anuales de
desempeño para determinar si hay
diferencias en la eficiencia entre los
gerentes contratados de esas escuelas.
En la tabla se resumen los resultados , la
calificación de cada gerente está
expresada en una escala de 0 a 100.
Con un alfa de 0.05 se desea saber si las
tres poblaciones son idénticas en cuanto
a las evaluaciones de desempeño
Escuela 1
Escuela 2
Escuela 3
25
60
50
70
20
70
60
30
60
85
15
80
95
40
90
90
35
70
80
75
ANEXO
Métodos basados en rangos
Estamos ante un método que emplea una escala ordinal, esto
es, lo datos se ordenan de acuerdo a los siguientes criterios
◦ Del más pequeño a más grande ó de mejor a peor
◦ Un rango es un número que se asigna a un elemento muestral
individual de acuerdo con su orden en la lista ordenada
Cálculos de Rangos
3
5
5
10
12
1
2
3
4
5
3
5
5
10
12
1
2.5
2.5
4
5
11
12
12
14
15
16
17
17
17
19
20
1
2
3
4
5
6
7
8
9
10
11
11
12
12
14
15
16
17
17
17
19
20
1
2.5
2.5
4
5
6
8
8
8
10
11
Descargar