UNIVERSIDAD NACIONAL DE EDUCACIÓN Enrique Guzmán y Valle “Alma Mater del Magisterio Peruano” ESCUELA DE POST-GRADO. Sección: MAESTRÍA RESUMEN: ANÁLISIS NO PARAMÉTRICOS DE DATOS 1. INTRODUCCIÓN. El Análisis No Paramétrico de Datos es una metodología de la Estadística Inferencial; y ésta se define como parte de la Estadística que ayuda al investigador a encontrar la significatividad de los resultados (Sanchez-Meza,1984:110); proporciona una metodología para inferir las características de un colectivo a partir de una muestra.. En la Estadística inferencial hay dos metodologías de llevar a cabo el análisis de datos: mediante la Estadística Paramétrica y la Estadística No Paramétrica. La Estadística Paramétrica trabaja sobre la base de un conjunto de presupuestos como los siguientes:( Hernandez et al, 2003: 531) 1)La distribución poblacional de la variable dependiente es normal. No es sesgada. 2)El nivel de medición de la variable dependiente es por intervalos o razón. 3)Homogeneidad de la varianza. Cuando la dispersión de datos es similar. Los métodos o pruebas estadísticas paramétricas más utilizadas son:( Hernández:532) 1)El coeficiente de correlación de Pearson y regresión lineal 2)La prueba t de student 3)Análisis de varianza unidireccional (ANOVA oneway) 4)Análisis de varianza factorial (ANOVA) 5)Análisis de covarianza. La Estadística No Paramétrica no exige el cumplimiento de supuestos o en todo caso no requiere que la distribución de datos sea normal,puede ser sesgada; el nivel de medición es nominal u ordinal. Los métodos o pruebas estadísiticas no paramétricas más utilizadas son:( Hernández:557) 1)La chi cuadrada o 2 2)Los coeficientes de correlación e independencia para tabulaciones cruzadas. 3)Los coeficientes de correlación por rangos ordenados de Spearman y Kendall. 2.LA CHI CUADRA ó JI CUADRADA Es un método o prueba estadística para evaluar hipótesis acerca de la relación entre dos variables categórica,(1) es decir, para aquellos cuyos criterios de agrupación son eminentemente cualitativos. Se simboliza como 2 También se define como una medida de discrepancia existente entre las frecuencias observadas y la frecuencias esperadas o teóricas.(Murria-Spiegel:201) 1 2.1.Procedimiento: 1)El primer paso es el establecimiento de la hipótesis estadística, llamada también hipótesis nula. Las hipótesis estadísticas o nulas se formulan con el propósito de validarlas o rechazarlas. Por ejemplo si se quiere decidir que una moneda está cargada se formula la hipótesis nula de que la moneda está bien, es decir que p=0,5 , donde p es la probabilidad de que sea cara o sello. Otro ejemplo es cuando quiero decidir que el uso adecuado y frecuente de mapas conceptuales incrementa significativamente el rendimiento escolar, debo formular la hipótesis nula que niegue dicha afirmación. La hipótesis nula se formula contra la hipóteis de trabajo o alternativa. 2)La chi cuadrada(2) se calcula por medio de una tabla de contingencia o tabulación cruzada, que es un cuadrado de dos dimensiones y cada dimensión contiene una variable. A su vez cada variable se subdivide en dos o más categorías. 3)En esencia la chi cuadrada es una comparación entre la tabla de frecuencias observadas fo y las frecuencias esperadas o teóricas fe.Parte del supuesto “no relación entre variables”, de tal suerte que si realmente existe, la diferencia entre ambas tablas debe se significativa. Veámos la tabla 1 de frecuencias observadas.(Velásquez-Rey,1999:216) Hábito Sexo MACULINO FEMENINO TOTAL Tabla Nº1:Tabla de frecuencias observadas. FUMA NO FUMA 1 520 723 2 243 8 744 9 584 18 328 TOTAL 10 264 10 307 20 571 4)Para hallar los valores de la tabla de frecuencia esperadas se calcula mediante la siguiente fórmula: (totalfrecuenciadelafila)(totalfrecuenciadelacolum na) TotalGeneraldefrecuencias Aplicando la fórmula para cada celda resulta: fe = Fe11= (2243 )(10264 ) 1119 ,2 20571 fe12= (18328 )(10264 ) 9144 ,8 20571 2 fe21= (2243 )(10307 ) 1123,8 20571 fe22= (18328 )(10307 ) 9183,2 20571 Tabla 2:de Frecuencias esperadas Hábito Fuma No fuma Sexo Masculino Femenino TOTAL 1119,2 1123,8 2 243,0 9 144,8 9 183,2 18 328,0 TOTAL 10 264 10 307 20 571 5)Para saber si la diferencia entre las frecuencias observadas y las esperadas poseen significación estadística, procedemos a calcular la chi cuadrada 2 mediante la siguiente fórmula: ( fo fe) 2 fe 2 Aplicando la fórmula se construye la siguiente tabla. CELDA f11 f12 f21 f22 TOTAL Tabla Nº3: Para hallar el valor de chi cuadrada. fo fe fo -fe (fo-fe)2 1 520 1 119,2 400,8 160 640,6 8 744 9 144,8 -400,8 160 640,6 723 1 123,8 -400,8 160 640,6 9 584 9 183,2 400,8 160 640,6 (fo-fe)2/fe 143,6 17,6 142,0 17,5 321,0 En consecuencia el valor de 2 es= 321,0 6)Para Interpretar el valor de chi cuadrada, es necesario determinar los grados de libertad(G), el cual se calcula mediante la fórmula siguiente: G=(r-1)(c-1) Donde: r=número de filas c=número de columnas Entonces: G=(2-1)(2-1)= 1 3 7) Luego hay que determinar el nivel de significación, que sirve para saber la probabilidad máxima que se puede cometer un error del tipo I(3).En la práctica se acostumbra utilizar niveles de significación del 0,05 o 0,01 esto quiere decir que se trabaja con nivel de confianza del 95% y sólo existe un 5% de ser rechazada la hipótesis cuando debería ser aceptada.(Murria y Spiegel:168). 8)Para saber si la hipótesis nula ha sido aceptada o rechazada, se requiere utilizar la tabla de valores críticos de la chi cuadrada, en la que se muestra los grados de libertad y los niveles de significación, con el que se decide trabajar. Véase el anexo. 9)Teniendo en cuenta que hemos decidido un nivel de significación de 0,05 y si como hemos visto el grado de libertad es 1, el valor crítico de 2 es 3,841. 10)Criterio de decisión: 2 Se acepta H0 cuando 2 t (n 1) .en caso contrario se rechaza. Se acepta H1 cuando 2 t (n 1) .En caso contrario se rechaza y se acepta la H0 Donde t representa el valor critico proporcionado por la tabla de valores críticos de 2 ,según el nivel de significación decidido, 0,05 o 0,01. 2 La prueba de chi cuadrada se utiliza para hallar la significatividad de las hipótesis y variables en ciencias sociales, como las ciencias de la educación. Lima, 29 de diciembre del 2006. Dr. Humberto Ñaupas Paitán Profesor. NOTAS EXPLICATIVAS (1) Las variables categóricas se refieren a las variables discretas, es decir aquellas que representan categorías y su nivel de medición es nominal. Los individuos son clasificados o categorizados en virtud de un conjunto de características. Según Kerlinger “Las variables categóricas( y las medidas nominales) tienen requisitos simples: todos los miembros de un subconjunto son considerados iguales y a todos se le asigna el mismo nombre(nominal) y el mismo número. (2) El nombre de Chi, deriva de que la letra en griego se pronuncia chi. (3) Error del tipo I, es cuando se rechaza una hipótesis cuando debería ser aceptada. REFERENCIAS BIBLIOGRÁFICAS ARY, Donald, et al (1987) Introducción a la Investigación Pedagógica. México, Nueva Edit. Interamericana, pp. 169-173 HERNANDEZ S. Roberto et al(2003)Metodología de la investigación. México D.F. Edit. Mc Graw Hill, 558-562. MURRAY &SPIEGEL, (1970)Estadística. México. Edit. Mc Graw Hill, pp.167-205 SANCHEZ C.Hugo y MEZA R.Carlos( 1984) Metodología y Diseños en la Investigación Científica. Lima, (N.E.) pp. 110-114. VELASQUEZ Angel y REY, Nérida (1999). Lima, Edit. San Marcos, pp.215-218 4