análisis no paramétricos de datos

Anuncio
UNIVERSIDAD NACIONAL DE EDUCACIÓN
Enrique Guzmán y Valle
“Alma Mater del Magisterio Peruano”
ESCUELA DE POST-GRADO. Sección: MAESTRÍA
RESUMEN: ANÁLISIS NO PARAMÉTRICOS DE DATOS
1. INTRODUCCIÓN.
El Análisis No Paramétrico de Datos es una metodología de la Estadística Inferencial; y
ésta se define como parte de la Estadística que ayuda al investigador a encontrar la
significatividad de los resultados (Sanchez-Meza,1984:110); proporciona una metodología
para inferir las características de un colectivo a partir de una muestra..
En la Estadística inferencial hay dos metodologías de llevar a cabo el análisis de datos:
mediante la Estadística Paramétrica y la Estadística No Paramétrica.
La Estadística Paramétrica trabaja sobre la base de un conjunto de presupuestos como los
siguientes:( Hernandez et al, 2003: 531)
1)La distribución poblacional de la variable dependiente es normal. No es sesgada.
2)El nivel de medición de la variable dependiente es por intervalos o razón.
3)Homogeneidad de la varianza. Cuando la dispersión de datos es similar.
Los métodos o pruebas estadísticas paramétricas más utilizadas son:( Hernández:532)
1)El coeficiente de correlación de Pearson y regresión lineal
2)La prueba t de student
3)Análisis de varianza unidireccional (ANOVA oneway)
4)Análisis de varianza factorial (ANOVA)
5)Análisis de covarianza.
La Estadística No Paramétrica no exige el cumplimiento de supuestos o en todo caso no
requiere que la distribución de datos sea normal,puede ser sesgada; el nivel de medición es
nominal u ordinal.
Los métodos o pruebas estadísiticas no paramétricas más utilizadas son:( Hernández:557)
1)La chi cuadrada o  2
2)Los coeficientes de correlación e independencia para tabulaciones cruzadas.
3)Los coeficientes de correlación por rangos ordenados de Spearman y Kendall.
2.LA CHI CUADRA ó JI CUADRADA
Es un método o prueba estadística para evaluar hipótesis acerca de la relación entre dos
variables categórica,(1) es decir, para aquellos cuyos criterios de agrupación son
eminentemente cualitativos. Se simboliza como  2
También se define como una medida de discrepancia existente entre las frecuencias
observadas y la frecuencias esperadas o teóricas.(Murria-Spiegel:201)
1
2.1.Procedimiento:
1)El primer paso es el establecimiento de la hipótesis estadística, llamada también hipótesis
nula. Las hipótesis estadísticas o nulas se formulan con el propósito de validarlas o
rechazarlas.
Por ejemplo si se quiere decidir que una moneda está cargada se formula la hipótesis nula
de que la moneda está bien, es decir que p=0,5 , donde p es la probabilidad de que sea cara
o sello.
Otro ejemplo es cuando quiero decidir que el uso adecuado y frecuente de mapas
conceptuales incrementa significativamente el rendimiento escolar, debo formular la
hipótesis nula que niegue dicha afirmación. La hipótesis nula se formula contra la hipóteis
de trabajo o alternativa.
2)La chi cuadrada(2) se calcula por medio de una tabla de contingencia o tabulación
cruzada, que es un cuadrado de dos dimensiones y cada dimensión contiene una variable. A
su vez cada variable se subdivide en dos o más categorías.
3)En esencia la chi cuadrada es una comparación entre la tabla de frecuencias observadas fo
y las frecuencias esperadas o teóricas fe.Parte del supuesto “no relación entre variables”, de
tal suerte que si realmente existe, la diferencia entre ambas tablas debe se significativa.
Veámos la tabla 1 de frecuencias observadas.(Velásquez-Rey,1999:216)
Hábito
Sexo
MACULINO
FEMENINO
TOTAL
Tabla Nº1:Tabla de frecuencias observadas.
FUMA
NO FUMA
1 520
723
2 243
8 744
9 584
18 328
TOTAL
10 264
10 307
20 571
4)Para hallar los valores de la tabla de frecuencia esperadas se calcula mediante la siguiente
fórmula:
(totalfrecuenciadelafila)(totalfrecuenciadelacolum na)
TotalGeneraldefrecuencias
Aplicando la fórmula para cada celda resulta:
fe =
Fe11=
(2243 )(10264 )
 1119 ,2
20571
fe12=
(18328 )(10264 )
 9144 ,8
20571
2
fe21=
(2243 )(10307 )
 1123,8
20571
fe22=
(18328 )(10307 )
 9183,2
20571
Tabla 2:de Frecuencias esperadas
Hábito
Fuma
No fuma
Sexo
Masculino
Femenino
TOTAL
1119,2
1123,8
2 243,0
9 144,8
9 183,2
18 328,0
TOTAL
10 264
10 307
20 571
5)Para saber si la diferencia entre las frecuencias observadas y las esperadas poseen
significación estadística, procedemos a calcular la chi cuadrada  2 mediante la siguiente
fórmula:
( fo  fe) 2
 
fe
2
Aplicando la fórmula se construye la siguiente tabla.
CELDA
f11
f12
f21
f22
TOTAL
Tabla Nº3: Para hallar el valor de chi cuadrada.
fo
fe
fo -fe
(fo-fe)2
1 520
1 119,2
400,8
160 640,6
8 744
9 144,8
-400,8
160 640,6
723
1 123,8
-400,8
160 640,6
9 584
9 183,2
400,8
160 640,6
(fo-fe)2/fe
143,6
17,6
142,0
17,5
321,0
En consecuencia el valor de  2 es= 321,0
6)Para Interpretar el valor de chi cuadrada, es necesario determinar los grados de
libertad(G), el cual se calcula mediante la fórmula siguiente:
G=(r-1)(c-1)
Donde:
r=número de filas
c=número de columnas
Entonces:
G=(2-1)(2-1)= 1
3
7) Luego hay que determinar el nivel de significación, que sirve para saber la probabilidad
máxima que se puede cometer un error del tipo I(3).En la práctica se acostumbra utilizar
niveles de significación del 0,05 o 0,01 esto quiere decir que se trabaja con nivel de
confianza del 95% y sólo existe un 5% de ser rechazada la hipótesis cuando debería ser
aceptada.(Murria y Spiegel:168).
8)Para saber si la hipótesis nula ha sido aceptada o rechazada, se requiere utilizar la tabla de
valores críticos de la chi cuadrada, en la que se muestra los grados de libertad y los niveles
de significación, con el que se decide trabajar. Véase el anexo.
9)Teniendo en cuenta que hemos decidido un nivel de significación de 0,05 y si como
hemos visto el grado de libertad es 1, el valor crítico de  2 es 3,841.
10)Criterio de decisión:
2
Se acepta H0 cuando  2   t (n  1) .en caso contrario se rechaza.
Se acepta H1 cuando  2   t (n  1) .En caso contrario se rechaza y se acepta la H0
Donde t representa el valor critico proporcionado por la tabla de valores críticos de
 2 ,según el nivel de significación decidido, 0,05 o 0,01.
2
La prueba de chi cuadrada se utiliza para hallar la significatividad de las hipótesis y
variables en ciencias sociales, como las ciencias de la educación.
Lima, 29 de diciembre del 2006.
Dr. Humberto Ñaupas Paitán
Profesor.
NOTAS EXPLICATIVAS
(1) Las variables categóricas se refieren a las variables discretas, es decir aquellas que
representan categorías y su nivel de medición es nominal. Los individuos son
clasificados o categorizados en virtud de un conjunto de características. Según
Kerlinger “Las variables categóricas( y las medidas nominales) tienen requisitos
simples: todos los miembros de un subconjunto son considerados iguales y a todos
se le asigna el mismo nombre(nominal) y el mismo número.
(2) El nombre de Chi, deriva de que la letra  en griego se pronuncia chi.
(3) Error del tipo I, es cuando se rechaza una hipótesis cuando debería ser aceptada.
REFERENCIAS BIBLIOGRÁFICAS
ARY, Donald, et al (1987) Introducción a la Investigación Pedagógica. México, Nueva
Edit. Interamericana, pp. 169-173
HERNANDEZ S. Roberto et al(2003)Metodología de la investigación. México
D.F. Edit. Mc Graw Hill, 558-562.
MURRAY &SPIEGEL, (1970)Estadística. México. Edit. Mc Graw Hill, pp.167-205
SANCHEZ C.Hugo y MEZA R.Carlos( 1984) Metodología y Diseños en la
Investigación Científica. Lima, (N.E.) pp. 110-114.
VELASQUEZ Angel y REY, Nérida (1999). Lima, Edit. San Marcos, pp.215-218
4
Descargar