UNIVERSIDAD NACIONAL DE EDUCACIÓN Enrique Guzmán y Valle “Alma Mater del Magisterio Peruano” ESCUELA DE POST-GRADO. Sección: MAESTRÍA ANALISIS E INTERPRETACIÓN DE DATOS 1. INTRODUCCIÓN. El análisis e interpretación de datos se realiza con el concurso de la ciencia estadística que comprende: la estadística descriptiva y la estadística inferencial. La primera tiene como objeto fundamental, procesar, resumir y analizar un conjunto de datos obtenidos de las variables estudiadas. Estudia un conjunto de medidas o estadígrafos mediante los cuales es posible comprender la magnitud de las variables estudiadas, como las medidas de tendencia central y las medidas de dispersión. En cambio la estadistica inferencial pretende inferir, generalizar las cualidades observadas en una muestra a toda una población. Para ello se vale de un conjunto de procedimientos y técnicas estadísticas como la significación estadística, toma de decisión, pruebas estadísticas (paramétricas y no paramétricas) etc. Con el avance de la ciencia estadística, hoy es posible analizar e interpretar los datos recogidos, de manera electrónica, mediante el uso del paquete estadístico, (Statistic package of Social Sciencies SPSS) ,que traducido significa, Paquete Estadístico para las Ciencias Sociales. Sin embargo hay que aclarar que el uso del SPSS se justifica sólo en las grandes investigaciones, de carácter cuantitativo, en las que se trabajan con muchas hipótesis y variables en la que la población es grande y la muestra también es grande , para ser tratada con métodos tradicionales, manuales. Por ello, sin desconocer la importancia del SPSS, primero vamos a utilizar las técnicas estadísticas manuales en el análisis e interpretación de datos, haciendo uso de la estadística descriptiva y también de la estadística inferencial. 2. ANÁLISIS DE DATOS. Consiste básicamente en establecer medidas estadísticas, estadígrafos o parámetros, para analizar los datos recogidos. Como ya se dijo anteriormente se trata de dos grupos de medidas: de tendencia central y de variabilidad o dispersión. 2.1.Medidas de tendencia central :Las principales son: media aritmética, la mediana y la moda. *La Media Aritmética: es el estadígrafo más utilizado y expresa el promedio o punto central en una distribución de datos, sea esta inteligencia, peso, talla, edad etc. y siempre que los datos estén agrupados con intervalos de clase. Se expresa mediante el símbolo: X y se calcula mediante la siguiente fórmula simplificada: (Sánchez C, 1984:107). x X= N Donde: x= es el valor de las observaciones individuales N= cantidad total de observaciones La media artitmética se utiliza solamente en datos agrupados en escalas de intervalo.Carece de significación para variables medidas en nivel nominal u ordinal.(Hernández et al, 2003:506) Cuando se trata de datos agrupados la fórmula de la media aritmética es la siguiente: X= f i. Xi N *La Mediana: es el punto o la clase que contiene el 50% de las observaciones, por debajo y arriba.Por ejemplo,en una serie de datos como: 3,7,10,15,18,21,25, la mediana es 15.Para esa misma serie la media es 14.4. Si los valores extremos de la serie fueran 2 y 50, la mediana seguiría siendo 15, pero la media aritmética sería 17.57,esto significa que la variación de los extremos no ejerce ninguna influencia sobre la mediana.(Ander-egg, 1972: 219). Se expresa mediante el símbolo Me o Md y se calcula mediante la siguiente fórmula: N 2 (f ) i M d = L1+ w fm e Donde: Li=límite inferior del intervalo que contiene la mediana. N= número de casos en la distribución fi= sumatoria de frecuencia de todos las clases anteriores a la mediana. fme= frecuencia de la mediana w= amplitud del intervalo. *La Moda: en una serie de datos es el dato que más frecuencias tiene. Ejemplo: dada la serie 5,7,8,9,9,10,10,11,11,11,12,12,13,14, la moda sería 11.Se simboliza con Mo. Pero cuando se dan datos agrupados se requiere utilizar la formula de Pearson siguiente: Mo =3Me - 2 X Para aplicar las fórmulas de la media aritmética, mediana y moda, trabajemos con datos de inteligencia de 40 estudiantes, obtenidos mediante un test. Veamos la siguiente tabla de frecuencias. Tabla de Frecuencias,con Marca de clases y Producto. Clases Intervalos Marca de clase Frecuencias Producto K w xi fi fi .xi ========================================================================= 1 77-83 80 5 400 2 84-90 87 5 435 3 91-97 94 17 1 598 4 98-104 101 6 606 5 105-111 108 4 432 6 112-118 115 3 345 ================================================= fi= 40 fi.xi=3 816 *La Media aritmética de datos agrupados es: X = fi.xi N = 3816 40 X = 95.4 *La Mediana de datos agrupados es: 40 Me= 91+ (10) 7 2 17 Me= 91 + 4.13 Me= 95.13 = 91 + 20 10 7 = 91+0.59(7) = 17 *La Moda de datos será: Mo = 3( 95.13) - 2 (95.4) Mo =285.39 - 190.8 Mo = 94.59 Como se puede observar la semejanza entre las tres medidas es grande, con una ligera variación. 2.2.Medidas de Variabilidad: las principales son: el rango, la desviación estándar, la varianza. *La varianza: es una medida de dispersión de gran utilidad en la estadística descriptiva e inferencial.Se define como la sumatoria de los cuadrados de las desviaciones con respecto a la media aritmética. Se simboliza con V o 2 .Se calcula con la siguiente fórmula: ( x X ) 2 . f 1 N 2 Donde: =Es la varianza x = es el dato f1 = frecuencia X =Es la media aritmética N = Número de casos *La Desviación Estándar: es la raíz cuadrada de la varianza, de tal suerte que conociéndose la varianza podemos estimarla fácilmente.Se simboliza con la letra griega sigma: .La fórmula es la siguiente: 2= ( x X ) . f i = N 2 (*) Para aplicar esta fórmulas de medidas de dispersión utilicemos la tabla nº2 de frecuencias y desviaciones con respecto a la media aritmética. *Primero hallemos la varianza. Tabla Nº2, sobre frecuencias y cuadrado de las desviaciones . Intervalos xi fi (x- X ) (x- X )2 f (x X ) 2 ============================================================================== 77-83 80 5 -15.4 237.16 1 185.80 84-90 87 5 - 8.4 70.56 353.80 91-97 94 17 - 1.4 1.96 33.32 98-104 101 6 5.6 31.36 188.16 105-111 108 4 12.6 158.76 635.04 112-118 115 3 19.6 384.16 1 152.48 ===================================================== Si X = 95.4 ( x X )2 =883.96 3 546.80 3,546 .80 2= 40 2 =88.67 *Luego hallemos la desviación estándar.Por definición la desviación estándar es la raíz cuadrada de la varianza, por tanto la raíz cuadrada de 88.67 es 9.41 = 88.67 = 9.41 Lima, 18 de julio del 2007. ……………………………….. Dr. Humberto Ñaupas Paitán Profesor REFERENCIAS BIBLIOGRÁFICAS ANDER-EGG, Ezequiel (1972) Introducción a las Técnicas de Investigación Social.Buenos Aires, Edit. Humanitas, 335 pp. ARY, Donald et al (1987) Introducción a la Investigación Pedagógica. México, Edit.Interamericana, 496 pp BRAVO SIERRA, Restituto (1988)Técnicas de Investigación Social. Madrid, Edit.Paraninfo, 651 pp. FERNÁNDEZ CHAVESTA, Juan y José (1993) Estadística Aplicada. Lima, Edit. San Marcos, 218 pp. HERNÁNDEZ S. Roberto et al( 2003) Metodología de la Investigación..México, Edit. Mc Graw Hill, 703 pp. PARDINAS, Felipe (1972) Metodología y Técnicas de Investigación en Ciencias Sociales.México, Edit. Siglo XXI, 239 pp. SANCHEZ CARLESSI, Hugo y MEZA R. Carlos (1984) Metodología y Diseños en la Investigación Científica, Lima, (N.E.) 149 pp.