análisis e interpretación de datos

Anuncio
UNIVERSIDAD NACIONAL DE EDUCACIÓN
Enrique Guzmán y Valle
“Alma Mater del Magisterio Peruano”
ESCUELA DE POST-GRADO. Sección: MAESTRÍA
ANALISIS E INTERPRETACIÓN DE DATOS
1.
INTRODUCCIÓN.
El análisis e interpretación de datos se realiza con el concurso de la ciencia
estadística que comprende: la estadística descriptiva y la estadística
inferencial. La primera tiene como objeto fundamental, procesar, resumir y
analizar un conjunto de datos obtenidos de las variables estudiadas. Estudia un
conjunto de medidas o estadígrafos mediante los cuales es posible comprender
la magnitud de las variables estudiadas, como las medidas de tendencia central y
las medidas de dispersión.
En cambio la estadistica inferencial pretende inferir, generalizar las cualidades
observadas en una muestra a toda una población. Para ello se vale de un
conjunto de procedimientos y técnicas estadísticas como la significación
estadística, toma de decisión, pruebas estadísticas (paramétricas y no
paramétricas) etc.
Con el avance de la ciencia estadística, hoy es posible analizar e interpretar los
datos recogidos, de manera electrónica, mediante el uso del paquete estadístico,
(Statistic package of Social Sciencies SPSS) ,que traducido significa, Paquete
Estadístico para las Ciencias Sociales.
Sin embargo hay que aclarar que el uso del SPSS se justifica sólo en las grandes
investigaciones, de carácter cuantitativo, en las que se trabajan con muchas
hipótesis y variables en la que la población es grande y la muestra también es
grande , para ser tratada con métodos tradicionales, manuales.
Por ello, sin desconocer la importancia del SPSS, primero vamos a utilizar las
técnicas estadísticas manuales en el análisis e interpretación de datos, haciendo
uso de la estadística descriptiva y también de la estadística inferencial.
2.
ANÁLISIS DE DATOS.
Consiste básicamente en establecer medidas estadísticas, estadígrafos o
parámetros, para analizar los datos recogidos. Como ya se dijo anteriormente se
trata de dos grupos de medidas: de tendencia central y de variabilidad o
dispersión.
2.1.Medidas de tendencia central :Las principales son: media aritmética, la
mediana y la moda.
*La Media Aritmética: es el estadígrafo más utilizado y expresa el promedio
o punto central en una distribución de datos, sea esta inteligencia, peso, talla,
edad etc. y siempre que los datos estén agrupados con intervalos de clase. Se
expresa mediante el símbolo: X y se calcula mediante la siguiente fórmula
simplificada: (Sánchez C, 1984:107).
x
X=
N
Donde: x= es el valor de las observaciones individuales
N= cantidad total de observaciones
La media artitmética se utiliza solamente en datos agrupados en escalas de
intervalo.Carece de significación para variables medidas en nivel nominal u
ordinal.(Hernández et al, 2003:506)
Cuando se trata de datos agrupados la fórmula de la media aritmética es la
siguiente:
X=
f i. Xi
N
*La Mediana: es el punto o la clase que contiene el 50% de las observaciones,
por debajo y arriba.Por ejemplo,en una serie de datos como: 3,7,10,15,18,21,25,
la mediana es 15.Para esa misma serie la media es 14.4. Si los valores extremos
de la serie fueran 2 y 50, la mediana seguiría siendo 15, pero la media aritmética
sería 17.57,esto significa que la variación de los extremos no ejerce ninguna
influencia sobre la mediana.(Ander-egg, 1972: 219).
Se expresa mediante el símbolo Me o Md y se calcula mediante la siguiente
fórmula:
N

 2  (f ) i 
M d = L1+ 
w
 fm e 


Donde:
Li=límite inferior del intervalo que contiene la mediana.
N= número de casos en la distribución
 fi= sumatoria de frecuencia de todos las clases anteriores a la mediana.
fme= frecuencia de la mediana
w= amplitud del intervalo.
*La Moda: en una serie de datos es el dato que más frecuencias tiene. Ejemplo:
dada la serie 5,7,8,9,9,10,10,11,11,11,12,12,13,14, la moda sería 11.Se
simboliza con Mo.
Pero cuando se dan datos agrupados se requiere utilizar la formula de Pearson
siguiente:
Mo =3Me - 2 X
Para aplicar las fórmulas de la media aritmética, mediana y moda, trabajemos
con datos de inteligencia de 40 estudiantes, obtenidos mediante un test. Veamos
la siguiente tabla de frecuencias.
Tabla de Frecuencias,con Marca de clases y Producto.
Clases Intervalos
Marca de clase Frecuencias Producto
K
w
xi
fi
fi .xi
=========================================================================
1
77-83
80
5
400
2
84-90
87
5
435
3
91-97
94
17
1 598
4
98-104
101
6
606
5
105-111
108
4
432
6
112-118
115
3
345
=================================================
 fi= 40
 fi.xi=3 816
*La Media aritmética de datos agrupados es:
X =
fi.xi
N
=
3816
40
X = 95.4
*La Mediana de datos agrupados es:


 40

Me= 91+   (10) 7
2

 17

Me= 91 + 4.13
Me= 95.13
= 91 +
20  10
7 = 91+0.59(7) =
17
*La Moda de datos será:
Mo = 3( 95.13) - 2 (95.4)
Mo =285.39 - 190.8
Mo = 94.59
Como se puede observar la semejanza entre las tres medidas es grande, con una
ligera variación.
2.2.Medidas de Variabilidad: las principales son: el rango, la desviación
estándar, la varianza.
*La varianza: es una medida de dispersión de gran utilidad en la estadística
descriptiva e inferencial.Se define como la sumatoria de los cuadrados de las
desviaciones con respecto a la media aritmética. Se simboliza con V o  2 .Se
calcula con la siguiente fórmula:
( x  X ) 2 . f 1
N
2
Donde:  =Es la varianza
x = es el dato
f1 = frecuencia
X =Es la media aritmética
N = Número de casos
*La Desviación Estándar: es la raíz cuadrada de la varianza, de tal suerte que
conociéndose la varianza podemos estimarla fácilmente.Se simboliza con la letra
griega sigma:  .La fórmula es la siguiente:
2=
( x  X ) . f i
 =
N
2
(*)
Para aplicar esta fórmulas de medidas de dispersión utilicemos la tabla nº2 de
frecuencias y desviaciones con respecto a la media aritmética.
*Primero hallemos la varianza.
Tabla Nº2, sobre frecuencias y cuadrado de las desviaciones .
Intervalos
xi
fi
(x- X )
(x- X )2
f (x  X ) 
2
==============================================================================
77-83
80
5
-15.4
237.16
1 185.80
84-90
87
5
- 8.4
70.56
353.80
91-97
94
17
- 1.4
1.96
33.32
98-104
101
6
5.6
31.36
188.16
105-111
108
4
12.6
158.76
635.04
112-118
115
3
19.6
384.16
1 152.48
=====================================================
Si X = 95.4
( x  X )2 =883.96 3 546.80
3,546 .80
2=
40
 2 =88.67
*Luego hallemos la desviación estándar.Por definición la desviación estándar
es la raíz cuadrada de la varianza, por tanto la raíz cuadrada de 88.67 es 9.41
 = 88.67
 = 9.41
Lima, 18 de julio del 2007.
………………………………..
Dr. Humberto Ñaupas Paitán
Profesor
REFERENCIAS BIBLIOGRÁFICAS
ANDER-EGG, Ezequiel (1972) Introducción a las Técnicas de Investigación
Social.Buenos Aires, Edit. Humanitas, 335 pp.
ARY, Donald et al (1987) Introducción a la Investigación Pedagógica. México,
Edit.Interamericana, 496 pp
BRAVO SIERRA, Restituto (1988)Técnicas de Investigación Social. Madrid,
Edit.Paraninfo, 651 pp.
FERNÁNDEZ CHAVESTA, Juan y José (1993) Estadística Aplicada. Lima, Edit. San
Marcos, 218 pp.
HERNÁNDEZ S. Roberto et al( 2003) Metodología de la Investigación..México, Edit.
Mc Graw Hill, 703 pp.
PARDINAS, Felipe (1972) Metodología y Técnicas de Investigación en Ciencias
Sociales.México, Edit. Siglo XXI, 239 pp.
SANCHEZ CARLESSI, Hugo y MEZA R. Carlos (1984) Metodología y Diseños en la
Investigación Científica, Lima, (N.E.) 149 pp.
Descargar