INTRODUCCION El presente trabajo de Estadística Descriptiva reúne un estudio descriptivo... organización y representación de los datos estadísticos en la que... •

Anuncio
INTRODUCCION
• El presente trabajo de Estadística Descriptiva reúne un estudio descriptivo a la recopilación,
organización y representación de los datos estadísticos en la que se tomó como muestra la población
estudiantil del Colegio Centro Social Bachillerato Nocturno, para clasificarlo según sus edades.
• Luego se introducen algunos procedimientos tales como las medidas matemáticas y no matemáticas
de tendencia central, las medidas de dispersión absoluta y relativa con el fin de sintetizar la
información.
• Finalmente se hace un breve estudio sobre la regresión y correlación, los cuales nos ayudan a hacer
predicciones en eventos futuros con base en los datos actuales.
OBJETIVOS
• Describir estadísticamente la información recopilada para esta investigación.
• Conocer de que forma se puede medir las tendencias matemáticas y no matemáticas.
• Saber como se mide el grado de variabilidad de los datos.
• Ver como se pueden medir los cambios que sufren en el tiempo algunas variaciones como precios,
cantidades y valores.
METODOLGIA
El presente trabajo se realiza bajo el ámbito de un estudio estadístico acerca de las edades de los estudiantes
del Colegio Centro Social Bachillerato Nocturno, tomándose una muestra de 70 alumnos entre hombre y
mujeres, con el fin de determinar cuales son los promedios oscilantes de edades en que se encuentra la
población estudiantil de dicho plantel educativo.
JUSTIFICACION
Este estudio se realizó con el fin de adquirir un mayor conocimiento y precisión los datos estadísticos.
DE LA POBLACION ESTUDIANTIL DEL COLEGIO CENTRO SOCIAL BACHILLERATO
NOCTURNO, SE TOMO UNA MUESTRA DE 70 ALUMNOS Y SE DESEA CLASIFICAR SEGÚN SUS
EDADES ASÍ:
Y1
Y2
Y3
Y4
Y5
Y6
Y7
Y8
Y9
Y10
20
21
18
17
19
15
14
12
15
16
11
30
47
42
39
32
19
14
11
18
39
31
33
35
17
19
40
41
13
44
36
32
24
21
19
17
11
19
16
14
39
49
44
38
17
53
13
18
14
15
30
21
18
14
42
34
26
21
19
12
13
26
29
35
48
17
16
12
21
23
CLASIFICAR LOS DATOS EN SEIS INTERVALOS (M)
1
VARIABLE: LA VARIABLE ES CONTINUA
RECORRIDO : R = Dm − dm
R = 53−11
R = 42
AMPLITUD = R/M
A= 42/6 = 7
A=7
La amplitud indica la distancia que debe tener cada grupo. para formar los de clase, se parte del dato menor 11
y se le suma la amplitud 7.
MARCA DE CLASE
J
1
2
3
4
5
6
Y' j−1 − Y
11 − 18
18 − 25
25 − 32
32 − 39
39 − 46
46 − 53
Numero de estudiantes
//////////////////////////////
//////////////
////////
/////////
//////
///
total
30
14
8
9
6
3
DISTRIBUCION DE FRECUENCIAS
ORDEN
INTERVALO MARCA
FRECUENCIA FRECUENCIA
ACUMULADAS
DE LA
DE CLASE DE CLASE ABSOLUTA RELATIVA
CLASE
ABSOLUTAS RELATIVAS
j
Y'j−1 − Y'j
Yj
nj
hj
! Nj
! Nj
! Hj
! Hj
1
2
3
4
5
6
TOTAL
11 − 18
18 − 25
25 − 32
32 − 39
39 − 46
46 − 53
14.5
21.5
28.5
35.5
42.5
49.5
30
14
8
9
6
3
70
0.43
0.20
0.11
0.13
0.09
0.04
30
44
52
61
67
70
70
40
26
18
9
3
0.43
0.63
0.74
0.87
0.96
1.00
1.00
0.57
0.37
0.26
0.13
0.04
2
En el histograma está representado gráficamente una distribución de frecuencias con intervalos de amplitud.
Este polígono de frecuencias esta representado en una curva la tendencia de la información objeto de este
estudio, señalando la concentración de la información.
La ojiva nos muestra la forma como crece y decrece la información a través de los intervalos. Para realizar la
gráfica se tuvo en cuenta las frecuencias acumuladas (absoluta y relativa) en forma ascendente y descendente.
MEDIDAS MATEMATICAS
MEDIA ARITMETICA
Yj * nj
Yj
14.5
21.5
28.5
35.5
42.5
49.5
nj
30
14
8
9
6
3
70
Total del clase
435.00
301.00
228.00
319.50
255.00
148.50
1,687.00
MEDIA GEOMETRICA
La media geométrica G(X) de un conjunto de n valores es la raíz enésima del producto de las observaciones.
3
MEDIDAS NO MATEMATICAS
MEDIANA
Y'j−1 −
Y'j
nj
! Nj
11 − 18
18 − 25
25 − 32
32 − 39
39 − 46
46 − 53
30
14
8
9
6
3
30
44
52
61
67
70
La mediana es = 20.5
PERCENTILES
J
Y'j−1 −
Y'j
1
2
3
4
5
6
11 − 18
18 − 25
25 − 32
32 − 39
39 − 46
46 − 53
nj
! Nj
30
14
8
9
6
3
70
30
44
52
61
67
70
r = partes tomadas
n = Tamaño de la muestra (total de observaciones)
, corresponden al 68% de alumnos
alumnos
4
Esta cantidad indica que el 68% de los 70 alumnos tienen una edad máxima de 28.15 años y el 32% restante
supera esta edad.
MODA
Moda es el valor de la variable que se repite con más frecuencia.
Notación: Md(X)
Donde: Md = Moda
Y'j−1 = Limite de la clase modal
Cj = Amplitud de clase
nj−1 = Frecuencia anterior a la más lata frecuencia
nj = Frecuencia más alta
nj+1 = Frecuencia posterior a la más alta frecuencia
Y'j−1 −
Y'j
nj
11 − 18
18 − 25
25 − 32
32 − 39
39 − 46
46 − 53
30
14
8
9
6
3
alumnos
MEDIDAS DE DISPERSION
MEDIDAS DE DISPERSION ABSOLUTA
La dispersión se puede medir en términos de distancia (diferencial) entre los valores de un conjunto de datos y
se considera una medida de referencia de ese mismo conjunto.
• EL RANGO O RECORRIDO
Es la diferencia entre el dato mayor y el dato menor de los valores observados en la variable de estudio.
R = Rango
5
D = Valor de la observación mayor
d = Valor de la observación menor
El rango no analiza sino los datos extremos y no la variación de todo el conjunto de datos
R=D−d
R = 53 − 11
R = 42
Este valor indica la distancia que existe entre la edad mayor y la edad menor.
B) EL RANGO MODIFICADO
Y'j−1 −
Y'j
11 − 18
18 − 25
25 − 32
32 − 39
39 − 46
46 − 53
Nj
! Nj
30
14
8
9
6
3
70
30
44
52
61
67
70
R50
R40
0% P11 P20 P25 P55 P60 P65 70%
R60
70%
R = Rango
P60 = Percentil 60
P20 = Percentil 10
alumnos
alumnos
6
VARIANZA
Nos indica la distancia promedio de cualquier observación en el conjunto de datos
S2 = Varianza de la muestra
Xj = Observación i de la muestra
= Promedio de la muestra
N = Tamaño de la muestra
Edades
Desviación con respecto a la
media
"(Xi −
Desviación elevada al cuadrado
"(Xi −
X
11
18
25
32
39
46
171
)
11 − 28.5 =
18 − 28.5 =
25 − 28.5 =
32 − 28.5 =
39 − 28.5 =
46 − 28.5 =
−17.5
−10.5
−3.5
3.5
10.5
17.5
0
)2
306.25
110.25
12.25
12.25
110.25
306.25
857.5
Se calcula la media aritmética
La varianza con base en la definición es:
DESVIACION ESTANDAR
Se obtiene extrayendo la raíz cuadrada de la varianza
7
Este valor significa que los datos en promedio se alejan de la media aritmética en 11.95 años es decir la
dispersión promedio:
REGRESION Y CORRELACION
REGRESION SIMPLE
El rector del Colegio Centro Social Bachillerato nocturno establece una relación entre la edad de los alumnos
y las fallas a clases que tuvieron durante el año lectivo de 1998. Para esto recogió la muestra de 10 alumnos
tomados al azar entre todos los alumnos que terminaron el año.
En el Colegio Centro Social se obtiene
X
25
19
17
23
21
16
25
31
39
28
244
Y
5
3
1
8
4
9
2
7
6
12
57
XY
125
57
17
184
84
144
50
217
234
336
1448
X2
625
361
289
529
441
256
625
961
1521
784
6392
Y2
25
9
1
64
16
81
4
49
36
144
429
Y = 2.828 − 0.130X
El Rector del colegio desea estimar las fallas de un alumno con 27 años de edad:
Y = 2.828 − 0.130*27 = 9.93
Se estima que un alumno de 27 años de edad falte a clases 9.93 veces.
La información gráficamente quedaría:
ERROR DE ESTIMACION
8
Error de estimación es = 3.15
9
Y1=(11+18)/2=14.5
N = 70
Nj−1 " n/2 < N'j
44 " 35 < 44
10
11
Documentos relacionados
Descargar