PRUEBAS PARAMETRICAS Y PRUEBAS NO PARAMETRICAS . [email protected] JUAN JOSÉ HERNÁNDEZ OCAÑA . PRUEBAS PARAMETRICAS Los métodos paramétricos se basan en el muestreo de una población con parámetros específicos , como la media poblacional, la desviación estándar o la proporción p . Además deben de reunir ciertos requisitos como lo es, que los datos muestrales provengan de una población que se distribuya normalmente. Las pruebas paramétricas se emplean con datos en una escala ordinal, de intervalo o de razón . Ventajas del empleo de pruebas no paramétricas 1.- Los métodos no paramétricos se aplican a una gran variedad de situaciones, ya que no se requiere que cumplan ciertas condiciones como lo es el de la distribución normal de los datos como es el caso de los métodos paramétricos 2.- Se aplican principalmente cuando empleamos datos nominales , como es el caso en muchas de las respuestas que se emplean en las encuestas y en muchas pruebas de psicología y pedagogía 3- Sus cálculos son más sencillos y nos permiten una interpretación mas fácil de entender y aplicar, aunque la potencia de las pruebas es menor a las pruebas paramétricas PRUEBAS NO PARAMETRICAS Los métodos estadísticos paramétricos requieren del empleo de datos medidos en una escala de intervalo o de razón. En estos niveles de medición tienen sentido las operaciones aritméticas como el análisis de medias, desviación estándar y varianzas Se parte de los supuestos de que los datos se distribuyen normalmente y que las varianzas son iguales Los métodos no paramétricos se pueden usar con datos nominales No se emplean los parámetros de la población como estadísticos de prueba El método se puede usar con datos de intervalo o de razón cuando no cabe supuesto alguno sobre la distribución de probabilidad de la población Desventajas de las pruebas no paramétricas Son menos confiables que las pruebas paramétricas Por los general los métodos no paramétricos no consideran las magnitudes de las diferencias entre los datos, sino solamente el signo de las diferencias de las mismas PRUEBA DE SIGNOS DE WILCOXON ES LA ALTERNATIVA NO PARAMÉTRICA DE LA PRUEBA DE MUESTRAS PARAMETRICAS DE DATOS APAREADOS Prueba de rangos con signo de Wilcoxon UTILIDAD Es útil para probar la aseveración de que una muestra proviene de una población con una mediana específica. Se emplea para grupos correlacionados ( datos apareados) y cuyos datos no siguen una distribución normal Esta prueba toma en cuenta la magnitud como la dirección de los puntajes de diferencia Puede emplearse en lugar de la prueba t para grupos dependientes cuando no se tiene certeza de la distribución de la muestra y no se tiene datos sobre la población Prueba de signos de Wilcoxon Es una prueba no parámetrica que utiliza rangos ordenados de datos muestrales consistentes en datos apareados. Se usa para probar las diferencias en las distribuciones poblacionales y se basa en los siguientes supuestos. Los datos consisten en datos apareados que se seleccionan aleatoriamente La podemos emplear para evaluar si dos grupos dependientes tienen distribuciones similares La distribución de las diferencias tiene una distribución que es aproximadamente simétrica Los datos dentro de cada pareja deben ser por lo menos de mediciones ordinales Para calcular Tobt hay que ordenar por rangos de puntaje de diferencia Métodos por rangos Los datos se ordenan de acuerdo a un criterio, por ejemplo del más pequeño al más grande, o del mayor a menor, etc. ◦ El rango es el número que se asigna a un elemento muestral individual de acuerdo con su orden en la lista ordenada Se descartan todas las diferencias iguales a cero y se ordenan y etiquetan las diferencias absolutas restantes, desde la mínima hasta la máxima. Cuando las diferencias son iguales se les asigna la clasificación media a sus posiciones ordenadas en el conjunto combinado de datos La idea básica que está detrás de la prueba del signo es el análisis de las frecuencias de los signos positivos y negativos para determinar si son significativamente diferentes Emplearemos el estadístico de prueba con base en el número de veces que ocurre el signo menos frecuente. Procedimiento 1.- Para cada par de datos, calcule la diferencia d, restando el segundo valor del primero, pero conserve los signos 2.- Descarte cualquier valor igual a cero. 3.- Ordene de menor a mayor en términos de valor absoluto 4.- Cuando las diferencias tengan el mismo valor numérico, asigne la media de los rangos Calcule la suma de los valores absolutos de rangos positivos y de los negativos Prueba de signos Wilcoxon Criterios T= se elige a la más pequeña de las siguientes sumas: La suma de los valores absolutos de los rangos negativos de las diferencias d La suma de los rangos positivos de las diferencias d Si el tamaño de la muestra es menor a 30 , entones empleamos estadístico T y se compara con T critico de tablas. Si el valor de TOBT es menor o igual a TCRI rechazamos Ho La suma de los rangos debe ser igual a CRITERIO Si el valor de TOBT es menor o igual a TCRI rechazamos Ho rechazo Ho sí t obt ≤ t critico 𝑍= 𝑅𝑚𝑒𝑛𝑜𝑟 −µ σ 𝑛(𝑛 + 1) 𝑢= 4 σ= 𝑛(𝑛 + 1)(2𝑛 + 1) 24 Prueba de signos de Wilcoxon ◦ La Ho sería: Las dos muestras provienen de poblaciones con la misma distribución ◦ ESO SIGINFICA QUE NO EXISTE DIFERENCIA ENTRE LA DISTRIBUCIÓN DE LOS DATOS DE LAS DOS POBLACIONES ◦ La hipótesis alternativa sería: Las dos muestras provienen de poblaciones con distribuciones diferentes Ejercicio Las mediciones de la capacidad mental de niños pequeños se hacen dándoles cubos y pidiéndoles que construyan una torre tan alta como sea posible. Un investigador está interesado en comprobar sí ambientes de aprendizaje modifican el desarrollo mental de los niños. Para ello realiza un experimento de construcción con cubos y mide la capacidad mental de los niños. Después les proporciona ambientes favorables al aprendizaje y repite el experimento tres meses después con los mismos niños para verificar si existen cambios. Los datos muestran los tiempos en segundos de la construcción de determinados modelos Utilice un nivel de significancia de 0.05 y pruebe la aseveración de que no hay diferencias entre los tiempos de la primera y la segunda prueba. Niño 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 2ra prueba 30 19 19 23 29 78 42 20 12 39 14 81 17 31 52 1da prueba 30 6 14 8 14 42 14 22 17 8 11 30 14 17 15 Diferencia 0 s 13 5 15 15 36 28 -2 -5 31 3 51 3 14 37 Rangos de diferencias 6 4.5 8.5 Rangos con signos 6 4.5 8.5 8.5 8.5 12 12 10 1 10 1 4.5 4.5 Suma de signos positivos 99.5 Suma de signos negativos 5.5 11 2.5 14 2.5 7 13 11 2.5 7 13 14 2.5 EJERCICIO Un investigador quiere determinar si la dificultad del material que han de aprender afecta el nivel de ansiedad de los estudiantes universitarios. A cada uno de los miembros de un muestra aleatoria de 12 alumnos se les asigna ciertas tareas de aprendizaje que se clasifican como tareas fáciles y difíciles. Antes de que los estudiantes inicien cada tarea, se les presenta algunos ejemplos de las diferentes tareas como muestra del material que van a aprender. A continuación, se mide el nivel de ansiedad que mostraron los alumnos, mediante un cuestionario. De esta manera, se mide el nivel de ansiedad antes de cada aprendizaje. Cuál es la conclusión utilizando la prueba de signo de WilcOXON y una alfa de 0.05 estudiante 1 2 3 4 5 6 7 8 9 10 11 12 Tarea Difícil 48 33 46 42 40 27 31 42 38 34 38 44 Tarea fácil 40 27 34 28 30 24 33 39 31 39 29 34 Diferencia 8 6 12 14 10 3 -2 3 7 -5 9 10 Rango de la diferencia 7 5 11 12 9.5 2.5 1 2.5 6 4 8 9.5 Tobt es la suma de los valores absolutos de rango negativos que es 5 El valor de T critico es de 14 ( considerando n = 12) Por lo que rechazamos Ho y concluimos que los materiales influyen en la ansiedad de los estudiantes Una de las principales compañías petroleras realizan un experimento para averiguar sí una película filmada puede promover actitudes más favorables hacia las grandes empresas . Doce individuos participan en un diseño de medidas replicadas. En la condición antes, cada sujeto llena un cuestionario para evaluar su actitud actual hacia las grandes compañías petroleras. En la condición después el mismo sujeto mira la película y después contesta el cuestionario. Las calificaciones altas mostradas en la tabla muestran actitudes más favorables. Considera que la muestra no se distribuye normalmente Con un alfa de 0,05 que podemos concluir: ◦ Ho La presentación de la película no incide en fomentar una actitud más favorable hacia las compañías petroleras ◦ Ha La presentación de la película influye de manera favorable ( mas que ) en la actitud hacia las compañías petroleras Antes 43 48 25 24 15 18 35 28 41 28 34 12 después 45 60 22 33 6 22 41 21 55 33 44 23 diferenc 2 ia 12 -3 9 -9 4 6 -7 14 5 10 11 11 2 7.5 7.5 3 5 6 12 4 9 10 rango 1 Suma de negativos= 15.5 Lo consideramos como T obt Suma de positivos= 62.5 Para una alfa de 0.05 de una cola el valor de T critico es de 11 Como 15.5 17 no Rechazo Ho Las películas promueven una actitud más favorable hacía las compañías petroleras PRUEBA DE U MANN WHITNEY O WILCOXON PARA GRUPOS INDEPENDIENTES ESTA PRUEBA SE EMPLEA EN COMBINACIÓN CON EL DISEÑO DE GRUPOS INDEPENDIENTES, CON DATOS QUE TIENEN POR LO MENOS UNA ESCALA ORDINAL ESTA PRUEBA PUEDE SUSTITUIR A LA PRUEBA T STUDENT CUANDO ÉSTA NO CUMPLE CON LA SUPOSICIÓN DE NORMALIDAD DE SU POBLACIÓN. LA HIPÓTESIS NULA Y ALTERNATIVA SE ENUNCIAN SIN MENCIONAR LOS PARÁMETROS DE LA POBLACIÓN PRUEBA DE U MANN WHITNEY O WILCONOX PARA GRUPOS INDEPENDIENTES YA QUE SE REQUIERE ORDENAR LOS DATOS POR RANGOS PARA CALCULAR U ESTA PRUEBA REQUIERE QUE LOS DATOS ESTÉN POR LO MENOS EN UNA ESCALA ORDINAL. TAMBIÉN PUEDE EMPLEARSE EN LUGAR DE LA PRUEBA T CUANDO LOS DATOS NO SE ENCUENTRAN EN UNA ESCALA DE RAZÓN O INTERVALO. BÁSICAMENTE COMPARA LA DIFERENCIA ENTRE LAS MEDIANAS DE DOS GRUPOS MANN- WHITNEY El ordenamiento de rangos es de menor a mayor y no se consideran valores absolutos como en la prueba de signos En este caso se combinan los dos grupos Se ordenan los rangos y se asigna a cada uno un puntaje de rango usando como 1 al puntaje más bajo En este caso si s e toma en cuenta el signo para dar el orden jerárquico en el rango Sume los Rangos del grupo 1 y Sume los rangos del grupo 2 Resuelva las ecuaciones y asigne el valor de Uobt al valor del grupo en el que se obtenga el valor más bajo Obtenga U crit y compare Si Uobt ≤ U crit Rechazo Ho ( si es menor o igual ) Si U´obt ≥ U´ crit Rechazo Ho ( Sí es mayor o igual) Prueba z y rangos Si una de las muestras o las dos exceden el tamaño de 10 puede emplearse la aproximación a la distribución normal empleando el estadístico Z. La prueba es de dos colas, puesto que un valor grande de z indicaría que los rangos más altos se encuentran desproporcionalmente en la primera muestra 𝑍= 𝑅 −0.5 (𝑈) σ Factor de corrección para muestras pequeñas Criterio para z Rechazo Ho si ZOBT ≥ ZCRITICO Ejercicio Una psicóloga del desarrollo, tiene la sospecha de que el hecho de consumir una dieta rica en proteínas a una edad mejora el desarrollo intelectual. Para probarlo, se realiza un experimento en el cual 17 niños son elegidos aleatoriamente entre los niños que tienen un año de edad. Al grupo control se le alimenta durante 3 años con una dieta usual, pobre en proteínas, mientras que el grupo experimental ingiere una dieta rica en proteínas en ese mismo período. Al final del experimento cada uno de los niños es sometido a una prueba de CI. De acuerdo a los datos que se presentan en la tabla siguiente y considerando que no se sabe sí los datos se distribuyen normalmente y sí emplea un alfa de 0.05 , cuales serían sus conclusiones? GRUPO 1 EJERCICO control GRUPO 2 experimental RANGO 1 1 102 8 113 11 118 15 130 16 135 17 140 12 120 14 125 7 111 13 122 5 108 10 117 4 107 9 115 3 105 6 110 2 104 Rango 2 Puntaje 102 104 105 107 108 110 111 113 115 Rango 1 2 3 4 5 6 7 8 9 Puntaje 117 118 120 122 125 130 135 140 Rango 10 11 12 13 14 15 16 17 N1 = 9 N2= 8 R1= 53 R1= 100 U= 64 U= 8 Z = -2. 69 Busco U critico en tablas con n1= y n2 = 8 y un alfa de 0.05 y obtengo un valor de , por lo que rechazo Ho En el caso de Z critico su valor es ejercicio está interesada en averiguar si existe alguna diferencia Una psicóloga en la habilidad espacial entre las persona zurdas y las diestras. Para averiguarlo toma una muestra de 10 zurdos y 10 diestros, entre los estudiantes de esta universidad y los somete a una prueba para medir su habilidad espacial. Tome nota que uno de los sujetos de la muestra no se presentó para la prueba. No se sabe si los datos se distribuyen normalmente y no se tienen datos poblacionales al respecto. Si considera un alfa de 0.05 de dos colas cuál es sus conclusión Zurdos 87 94 56 74 98 83 92 84 76 diestros 47 68 92 73 71 82 55 61 75 85 Zurdos 87 15 94 18 56 3 74 8 98 19 83 12 92 16.5 84 13 76 10 diestros 47 1 68 5 92 16.5 73 7 71 6 82 11 55 2 61 4 75 9 Zurdos 114.5 Diestros 75.5 85 14 Tarea Un ornitólogo sospecha que las inyecciones de la hormona FSH incrementa la habilidad de canto de los pájaros machos. Para poner a prueba su hipótesis selecciona 20 pájaros y los dividen en dos grupos de 10 cada uno. Sin embargo dos aves del segundo grupo no pudieron ser evaluadas. Al primer grupo se les administra la hormona y al segundo grupo solo una solución salina como control. Después de ello se hace un registro de resultados donde resultados mayores indican mayor cantidad de cantos . Empleando una alfa de 0.05 y considerando que los datos no se distribuyen normalmente ◦ Cual son sus hipótesis nula y alternativa? ◦ Cuáles son su conclusiones? Solución salina 17 31 14 12 29 23 7 19 FSH 10 29 37 41 16 45 34 57 Solución salina 17 7 31 13 14 5 12 4 29 11.5 23 9 7 2 19 8 FSH 10 3 29 11.5 37 15 41 16 16 6 45 17 34 14 57 18 SOLUCION SALINA 70.5 FSH 100.5 28 28 10 3 3 1 Hipnosis ordinario 20 42 21 35 33 30 40 53 24 57 43 26 48 37 31 30 22 51 44 62 30 59 • Un consejero universitario cree que la hipnosis es más eficaz para reducir que el tratamiento habitual que se aplica a los estudiantes que muestran un alto nivel de ansiedad frente a los exámenes. Para probar su sospecha, divide en dos grupos a 22 estudiantes que muestran altos niveles de ansiedad. Uno de los grupos recibe el tratamiento a base de hipnosis y el otro recibe el tratamiento ordinario. Una vez concluidos los tratamientos, los estudiantes son sometidos a pruebas sobre ansiedad. Considerando un alfa de 0.05, resuelva: – A) considere que los datos se distribuyen normalmente – B)Considere que los datos no se distribuyen normalmente – Cuáles son sus conclusiones en ambos casos? Hipnosis ordinario 20 (1) 42 (14) 21 (2) 35 (11) 33 (10) 30 (7) 40 (13) 53 (19) 24 (4) 57 (20) 43 (15) 26 (5) 48 (17) 37 (12) 31 (9) 30 (7) 22 (3) 51 (18) 44 (16) 62 (22) 30 (7) 59 (21) R1 = 97 R2= 156 Prueba de KRUSKAL WALLIS Esta prueba se utiliza para probar la hipótesis nula de que tres o más muestras de grupos independientes provienen de poblaciones idénticas. ◦ Es una prueba no parámetrica que utiliza rangos de muestras independientes de tres o más poblaciones Esta prueba tiene una distribución que pude aproximarse por la distribución ji cuadrada siempre y cuando tenga al menos cinco observaciones en cada grupo. ◦ La prueba es de cola derecha ◦ El estadístico de prueba H es básicamente una medida de la varianza de las suma de los rangos Ri ,R2… Rk. Por ello si los rangos se distribuyen de manera equitativa entre los grupos muestrales, entonces H debe ser un número relativamente pequeño KRUSKALS PRUEBA DE KRUSKAL WALLIS Esta prueba se emplea como sustituta del análisis de varianza ya que no supone ni la normalidad de la población ni la homogeneidad de la varianza como la ANOVA No hace predicción alguna sobre las medias de la población, sólo afirma que cuando menos una de las distribuciones poblaciones es diferente de algunas de las otras distribuciones poblacionales Por lo que la hipótesis nula afirma que las muestras son aleatorias, extraídas de las mismas o idénticas distribuciones poblaciones Condiciones Esta prueba utiliza rango muestrales de tres o más poblaciones independientes Cada muestra tiene al menos cinco observaciones El estadístico de la prueba H es una mediad de la varianza de las sumas de los rangos R1, R2, R3…Rn Si los rangos se distribuyen de una manera equitativa entre los grupos muestrales, entonces H debe ser un número relativamente pequeño por lo que no se rechazará la hipótesis nula PRUEBA DE KRUSKAL WALLIS Esta prueba es de cola derecha y la regla de decisión es Si Hobt ≥ H cri rechazamos Ho Se emplea tabla de CHI cuadrada con gl= k – 1 Una empresa está realizando una investigación sobre diferentes métodos de capacitación para el área gerencial. El experimento implica tres condiciones. En la condición 1 los sujetos reciben capacitación en dos estilos gerenciales. En la condición 2, los individuos no reciben capacitación adicional, sÍ no ,solo son asignados al trabajo de acuerdo a su propio estilo gerencial. La condición 3 es de control y en ella los sujetos no reciben capacitación alguna . Después de que se han desempeñado en su trabajo durante 6 meses se hace una evaluación y se califica su desempeño. Mientras más alta sea la calificación, mejor será el rendimiento. Si considera un alfa de 0.05 y sabemos que los datos no se distribuyen normalmente , cuáles son sus conclusiones? EJERCICIO Condición 1 Condición 2 cal rango cal Rango 65 84 87 53 70 85 56 63 8 16 19.5 2 9 17 4 7 90 83 76 87 92 86 93 21 15 12 19.5 22 18 23 Condición 3 Cal rango 55 82 71 60 52 81 73 57 3 14 10 6 1 13 11 5 EJERCICIO Un investigador sospecha que los individuos de diferentes profesiones varía en su grado de ser hipnotizados. Para el experimento son elegidos al azar 6 abogados, 6 médicos y 6 bailarines. A cada uno se les practica un examen de susceptibilidad hipnótica . Mientras más alta sea la calificación mayor será la susceptibilidad a ser hipnotizados. Suponga que los datos violan los supuestos necesarios para el uso de la prueba F pero al menos están en una escala ordinal. Si emplea un alfa de 0.05 . Cuáles serían sus conclusiones? Abogados 26 17 27 32 20 25 Médicos 14 19 28 22 25 15 Bailarines 30 21 35 29 37 34 La manufacturera Gómez recluta y contrata empleados para su equipo gerencial en tres universidades . En los últimos días, su departamento de personal ha estado reuniendo y revisando las calificaciones anuales de desempeño para determinar si hay diferencias en la eficiencia entre los gerentes contratados de esas escuelas. En la tabla se resumen los resultados , la calificación de cada gerente está expresada en una escala de 0 a 100. Con un alfa de 0.05 se desea saber si las tres poblaciones son idénticas en cuanto a las evaluaciones de desempeño Escuela 1 Escuela 2 Escuela 3 25 60 50 70 20 70 60 30 60 85 15 80 95 40 90 90 35 70 80 75 ANEXO Métodos basados en rangos Estamos ante un método que emplea una escala ordinal, esto es, lo datos se ordenan de acuerdo a los siguientes criterios ◦ Del más pequeño a más grande ó de mejor a peor ◦ Un rango es un número que se asigna a un elemento muestral individual de acuerdo con su orden en la lista ordenada Cálculos de Rangos 3 5 5 10 12 1 2 3 4 5 3 5 5 10 12 1 2.5 2.5 4 5 11 12 12 14 15 16 17 17 17 19 20 1 2 3 4 5 6 7 8 9 10 11 11 12 12 14 15 16 17 17 17 19 20 1 2.5 2.5 4 5 6 8 8 8 10 11