GUIA-ejercicios con datos granel-intervalares.

Anuncio
Ejemplos solo con datos cuantitativos o numéricos:
Medidas de centralización Para datos a granel:
Considere una muestra de notas de un alumno en la asignatura de matemática:
3.5
6.7
4.6
5.3
4.8
6.2
6.4
7
4.6
Notas 4.5
Calculo de la media aritmética:
4 .5 + 3 .5 + 6 .7 + 4 .6 + 5 .3 + 4 .8 + 6 .2 + 6 .4 + 7 + 4 .6
= 5 .4
10
También se puede calcular suponiendo una media y calculando los desvíos respecto
de los datos:
Ejemplo: supongamos que la media es Xs= 50
Notas
4.5
3.5
6.7
4.6
5.3
4.8
6.2
6.4
7
4.6
Xi-Xs
-0.5
-1.5
1.7
-0.4
0.3
-0.2
1.2
1.4
2.0
-0.4
Suma de desvíos = 3.6
∑ d =5.0+ 3.6 = 5.0 + 0.36 = 5.36 = 5.4
X = Xs +
n
10
X =
Media geométrica
Para el ejemplo:
:
G= 10 4.5 x3.5 x6.7 x 4.6 x5.3 x 4.8 x6.2 x6.4 x.7 x 4.6 =5.3
Media armónica:
Para el ejemplo: H=
1
1
1
1
1
1
1
1
1 1 1
+
+
+
+
+
+
+
+ +
4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6
= 0.51
Para el ejemplo:
RMS= 4,5 2 + 3.5 2 + 6.7 2 + 4.6 2 + 5.3 2 + 4.8 2 + 6.2 2 + 6.4 2 + 7 2 + 4.6 2 = 17.3
Caso especial de la media aritmética:
La moda para datos a granel (Mo): Es el dato que más
se repite, puede haber
más de una moda o ninguna, siempre es un dato de la muestra.
Para el ejemplo:
Notas 4.5
3.5
6.7
4.6
5.3
4.8
6.2
6.4
7
4.6
Mo= 4,6
La mediana para datos a granel (Md): Corresponde al valor central de los
datos previamente ordenada (n: impar), o al promedio de los dos datos centrales (n:
par).No siempre es un dato de la muestra:
Para el ejemplo
Notas 4.5
3.5
Ordenando los datos:
Notas 3.5
4.5
Md=
6.7
4.6
5.3
4.8
6.2
6.4
7
4.6
4.6
4.6
4.8
5.3
6.2
6.4
6.7
7
6.4
7
4.6
4 .8 + 5 .3
= 5 .1
2
Medidas de dispersión para datos a granel:
El más elemental es el rango de variación:
Rg= mayor valor observado o medido- menor valor observado o medido
Para el ejemplo:
Rg= 7-3.5= 3.5
∑ xi − x
Desviación media: DM=
Para el ejemplo
Notas 4.5
3.5
6.7
Con: X = 5.4
Notas
4.5
3.5
6.7
desvíos -0.9
-1.9
1.3
desvíos
DM=
0.9
17
= 1.7
10
1.9
1.3
n
4.6
5.3
4.8
6.2
4.6
-0.8
5.3
-0.1
4.8
-0.6
6.2
0.8
6.4
1.0
7
1.6
4.6
-0.8
0.8
0.1
0.6
0.8
1.0
1.6
0.8
∑
∑
=0
=17
∑ (x − x )
2
Desviación estándar:
Para el ejemplo:
Notas
4.5
desvíos
-0.9
desvíos
desvíos
S=
2
S=
para la muestra
n −1
3.5
-1.9
6.7
1.3
4.6
-0.8
5.3
-0.1
4.8
-0.6
6.2
0.8
6.4
1.0
7
1.6
4.6
-0.8
0.9
1.9
1.3
0.8
0.1
0.6
0.8
1.0
1.6
0.8
0.81
3.61
1.69
0.64
0.01
0.36
0.64
1.0
2.56
0.64
11.96
= 1.15
10 − 1
Desviación estándar para la población: (es solo un estimativo)
∑ (x − x )
2
S=
n
Para el ejemplo:
11.96
= 1.09
S=
10
Nota: existen otras medidas de dispersión que se estudiaran con datos intercalares.
Ejercicio tipo con datos intervalalares.
∑
∑
∑
=0
=17
=11.96
clases
485.55 – 535.50
535.51 – 585.46
585.47 – 635.42
635.43 – 685.38
685.39 – 735.34
735.35 – 785.30
Xi
510.53
560.49
611.45
660.41
710.37
760.33
f
4
9
10
7
8
2
40
fr.
4/40
9/40
10/40
7/40
8/40
2/40
1
f%
10.00
22.50
25.00
17.50
20.00
5.00
100.00
Fa
4
13
23
30
38
40
Fa%
10.00
32.50
57.50
75.00
95.00
100.00
clases
485.55 – 535.50
535.51 – 585.46
585.47 – 635.42
635.43 – 685.38
685.39 – 735.34
735.35 – 785.30
Xi
510.53
560.49
611.45
660.41
710.37
760.33
f
4
9
10
7
8
2
40
fr.
4/40
9/40
10/40
7/40
8/40
2/40
1
clases
485.55 – 535.50
535.51 – 585.46
585.47 – 635.42
635.43 – 685.38
685.39 – 735.34
735.35 – 785.30
Xi
510.53
560.49
611.45
660.41
710.37
760.33
f
4
9
10
7
8
2
40
Xi*f
2042.12
5044.41
6114.50
4622.87
5682.96
1520.66
25027.52
X =
F%
10.00
22.50
25.00
17.50
20.00
5.00
100.00
Fa
4
13
23
30
38
40
Fa%
10.00
32.50
57.50
75.00
95.00
100.00
25027.52
= 625.69
40
Para el ejemplo:
Supongamos como media supuesta la marca de clase de la segunda clase, esto es:
560.49, la tabla con los cálculos correspondientes, se puede ordenar en forma
simplificada como se indica:
Xi
Desviación :Xi - Xs
f
(Xi-Xs)*f
510.53 510.53-560.49=-49.96
4
-199.84
560.49 560.49-560.49=0
9
0
611.45 611.45-560.49=50.96
10
509.60
660.41 660.41-560.49=99.92
7
699.44
710.37 710.37-560.49=149.88
8
1199.04
760.33 760.33-560.49=199.84
2
399.68
∑ =2607.92
X = 560.49 +
2607.92
= 625.69
40
Valor que coincide con el calculado anteriormente.
clases
485.55 – 535.50
535.51 – 585.46
585.47 – 635.42
635.43 – 685.38
685.39 – 735.34
735.35 – 785.30
Xi
510.53
560.49
611.45
660.41
710.37
760.33
f
4
9
10
7
8
2
40
fr.
4/40
9/40
10/40
7/40
8/40
2/40
1
F%
10.00
22.50
25.00
17.50
20.00
5.00
100.00
Fa
4
13
23
30
38
40
Fa%
10.00
32.50
57.50
75.00
95.00
100.00
Luego la abscisa que deja la mitad de la superficie total a cada lado es:
586.465+34.965=621.43
CRITERIO TABULAR O INTERVALAR:
clases
Xi
f
fr.
485.55 – 535.50
510.53 4
4/40
535.51 – 585.46
560.49 9
9/40
585.47 – 635.42
611.45 10
10/40
635.43 – 685.38
660.41 7
7/40
685.39 – 735.34
710.37 8
8/40
735.35 – 785.30
760.33 2
2/40
40
1
Md= 587.465+33.922=621.39
F%
10.00
22.50
25.00
17.50
20.00
5.00
100.00
Fa
4
13
23
30
38
40
Fa%
10.00
32.50
57.50
75.00
95.00
100.00
EN GENRAL:
clases
485.55 – 535.50
535.51 – 585.46
587.47 – 635.42
635.43 – 685.38
685.39 – 735.34
735.35 – 785.30
Xi
510.53
560.49
611.45
660.41
710.37
760.33
f
4
9
10
7
8
2
40
fr.
4/40
9/40
10/40
7/40
8/40
2/40
1
F%
10.00
22.50
25.00
17.50
20.00
5.00
100.00
Fa
4
13
23
30
38
40
Fa%
10.00
32.50
57.50
75.00
95.00
100.00
Parámetros de dispersión:
Desviación media: DM=
∑x
i
−xf
n
Para el ejemplo:
Se sabe que la media es: X =
25027.52
= 625.69
40
clases
Xi
(Xi - X )
Xi − X
485.55 – 535.50
535.51 – 585.46
587.47 – 635.42
635.43 – 685.38
685.39 – 735.34
735.35 – 785.30
510.53
560.49
611.45
660.41
710.37
760.33
-115.16
-65.20
-14.24
34.72
84.68
134.64
∑ =0
115.16
65.20
14.24
34.72
84.68
134.64
DM=
2379.60
= 59.49
40
f
Fa Xi − X
4
9
10
7
8
2
40
460.64
586.80
142.40
243.04
677.44
269.28
∑ =2379.60
∑ (x − x )
2
Desviación estándar:
clases
485.55 – 535.50
535.51 – 585.46
587.47 – 635.42
635.43 – 685.38
685.39 – 735.34
735.35 – 785.30
S=
Xi
510.53
560.49
611.45
660.41
710.37
760.33
S=
para la muestra
n −1
(Xi - X ) 2
13261.83
4251.04
202.78
1205.48
7170.70
18127.93
∑ =44219.76
(Xi - X )
-115.16
-65.20
-14.24
34.72
84.68
134.64
∑ =0
195394.30
= 70.78
40 − 1
f
∑ (x − x )
f
4
9
10
7
8
2
40
(Xi - X ) 2 f
53047.32
38259.36
2027.80
8438.36
57365.60
36255.86
∑ =195394.30
2
Desviación estándar: S =
Para el ejemplo:
para la población.
n
195394.30
= 69.89
40
Rango intercuartílico: Datos que se ubican entre el 25% y el 75%
Para el ejemplo:
El 25% de los datos: 25% de 40 = 10
De acuerdo a la tabla:
clases
Xi
f
485.55 – 535.50
510.53 4
535.51 – 585.46
560.49 9
587.47 – 635.42
611.45 10
635.43 – 685.38
660.41 7
685.39 – 735.34
710.37 8
735.35 – 785.30
760.33 2
40
fr.
4/40
9/40
10/40
7/40
8/40
2/40
1
F%
10.00
22.50
25.00
17.50
20.00
5.00
100.00
Fa
4
13
23
30
38
40
Fa%
10.00
32.50
57.50
75.00
95.00
100.00
Corresponderían a los 4 datos de la primera clase más los 6 que faltan de la segunda
clase:
Datos del primer cuartel:
6
535,505+ (585.455 − 535.505) = 535,505 + 33.3 = 568.81
9
Datos del tercer cuartel:
75% de los datos: 75% de 40 = 30
Habrá que tomar los 4 de la primera clase, los 9 de la segunda, los 10 de la tercera y
exactamente los 7 de la cuarta clase (suman 30) .En este caso se toma el límite
inmediatamente superior de la cuarta clase, esto es: 685.38.
Es decir el rango intercuartílico corresponde a todos los puntajes que se encuentran
entre 568,81 y 685,38 (este criterio permite eliminar los outlier)
Nota: el segundo intercuartílico corresponde a la mediana:
En efecto: el 50% de los dados es 50% de 40 = 20
Habrá que tomar entonces: los 4 datos de la primera clase, los 9 de la segunda y los 7
restante de los 10 de la tercera clase, esto es:
7
(635.415 − 587.465) = 587.465 + 33.565 = 621.03 (que corresponde al
10
valor calculado anteriormente)
587.465+
Nota: cualquier otro intercuartílico se calcula de la misma
manera:
Ejemplo: cual es el rango de puntaje entre el tercer decil y el sexto decil?
clases
485.55 – 535.50
535.51 – 585.46
587.47 – 635.42
635.43 – 685.38
685.39 – 735.34
735.35 – 785.30
Xi
510.53
560.49
611.45
660.41
710.37
760.33
f
4
9
10
7
8
2
40
fr.
4/40
9/40
10/40
7/40
8/40
2/40
1
F%
10.00
22.50
25.00
17.50
20.00
5.00
100.00
Fa
4
13
23
30
38
40
Fa%
10.00
32.50
57.50
75.00
95.00
100.00
Tercer decil: 30% de 40 = 12
8
535.505+ (585.455 − 535.505) =579.905
9
Sexto decil: 60% de 40 = 24
1
635.425+ (685.375 − 635.425) = 642.56
7
El rango es entonces: 579.91 y 642.56
También se puede calcular parámetros como porcentajes de
alumnos que se ubican en determinado rango de puntajes.
Ejemplo ¿Qué % de alumnos se ubica entre los 548.34 puntos y los 694.15 puntos?
Se procede como se indica
clases
Xi
485.55 – 535.50
510.53
535.51 – 585.46
560.49
587.47 – 635.42
611.45
635.43 – 685.38
660.41
685.39 – 735.34
710.37
735.35 – 785.30
760.33
f
4
9
10
7
8
2
40
fr.
4/40
9/40
10/40
7/40
8/40
2/40
1
F%
10.00
22.50
25.00
17.50
20.00
5.00
100.00
Fa
4
13
23
30
38
40
Fa%
10.00
32.50
57.50
75.00
95.00
100.00
De acuerdo a la tabla el menor puntaje: 548.34 puntos se ubica en la segunda clase, por
lo que habrá que tomar parte de los 9 alumnos, el mayor puntaje 694.15 puntos se ubica
en la quinta clase y toma parte de los 8 alumnos.
En resumen:
9
8
(585.46-548.34)+10+7+
(694.15 − 685.39) =6.69+10+7+1.40=25.09=25
49.95
49.95
alumnos .Que corresponde al 62.5% del total .Es decir el 62.5% de la muestra se ubica
en ese rango de notas.
Descargar