Ejemplos solo con datos cuantitativos o numéricos: Medidas de centralización Para datos a granel: Considere una muestra de notas de un alumno en la asignatura de matemática: 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 Notas 4.5 Calculo de la media aritmética: 4 .5 + 3 .5 + 6 .7 + 4 .6 + 5 .3 + 4 .8 + 6 .2 + 6 .4 + 7 + 4 .6 = 5 .4 10 También se puede calcular suponiendo una media y calculando los desvíos respecto de los datos: Ejemplo: supongamos que la media es Xs= 50 Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 Xi-Xs -0.5 -1.5 1.7 -0.4 0.3 -0.2 1.2 1.4 2.0 -0.4 Suma de desvíos = 3.6 ∑ d =5.0+ 3.6 = 5.0 + 0.36 = 5.36 = 5.4 X = Xs + n 10 X = Media geométrica Para el ejemplo: : G= 10 4.5 x3.5 x6.7 x 4.6 x5.3 x 4.8 x6.2 x6.4 x.7 x 4.6 =5.3 Media armónica: Para el ejemplo: H= 1 1 1 1 1 1 1 1 1 1 1 + + + + + + + + + 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 = 0.51 Para el ejemplo: RMS= 4,5 2 + 3.5 2 + 6.7 2 + 4.6 2 + 5.3 2 + 4.8 2 + 6.2 2 + 6.4 2 + 7 2 + 4.6 2 = 17.3 Caso especial de la media aritmética: La moda para datos a granel (Mo): Es el dato que más se repite, puede haber más de una moda o ninguna, siempre es un dato de la muestra. Para el ejemplo: Notas 4.5 3.5 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 Mo= 4,6 La mediana para datos a granel (Md): Corresponde al valor central de los datos previamente ordenada (n: impar), o al promedio de los dos datos centrales (n: par).No siempre es un dato de la muestra: Para el ejemplo Notas 4.5 3.5 Ordenando los datos: Notas 3.5 4.5 Md= 6.7 4.6 5.3 4.8 6.2 6.4 7 4.6 4.6 4.6 4.8 5.3 6.2 6.4 6.7 7 6.4 7 4.6 4 .8 + 5 .3 = 5 .1 2 Medidas de dispersión para datos a granel: El más elemental es el rango de variación: Rg= mayor valor observado o medido- menor valor observado o medido Para el ejemplo: Rg= 7-3.5= 3.5 ∑ xi − x Desviación media: DM= Para el ejemplo Notas 4.5 3.5 6.7 Con: X = 5.4 Notas 4.5 3.5 6.7 desvíos -0.9 -1.9 1.3 desvíos DM= 0.9 17 = 1.7 10 1.9 1.3 n 4.6 5.3 4.8 6.2 4.6 -0.8 5.3 -0.1 4.8 -0.6 6.2 0.8 6.4 1.0 7 1.6 4.6 -0.8 0.8 0.1 0.6 0.8 1.0 1.6 0.8 ∑ ∑ =0 =17 ∑ (x − x ) 2 Desviación estándar: Para el ejemplo: Notas 4.5 desvíos -0.9 desvíos desvíos S= 2 S= para la muestra n −1 3.5 -1.9 6.7 1.3 4.6 -0.8 5.3 -0.1 4.8 -0.6 6.2 0.8 6.4 1.0 7 1.6 4.6 -0.8 0.9 1.9 1.3 0.8 0.1 0.6 0.8 1.0 1.6 0.8 0.81 3.61 1.69 0.64 0.01 0.36 0.64 1.0 2.56 0.64 11.96 = 1.15 10 − 1 Desviación estándar para la población: (es solo un estimativo) ∑ (x − x ) 2 S= n Para el ejemplo: 11.96 = 1.09 S= 10 Nota: existen otras medidas de dispersión que se estudiaran con datos intercalares. Ejercicio tipo con datos intervalalares. ∑ ∑ ∑ =0 =17 =11.96 clases 485.55 – 535.50 535.51 – 585.46 585.47 – 635.42 635.43 – 685.38 685.39 – 735.34 735.35 – 785.30 Xi 510.53 560.49 611.45 660.41 710.37 760.33 f 4 9 10 7 8 2 40 fr. 4/40 9/40 10/40 7/40 8/40 2/40 1 f% 10.00 22.50 25.00 17.50 20.00 5.00 100.00 Fa 4 13 23 30 38 40 Fa% 10.00 32.50 57.50 75.00 95.00 100.00 clases 485.55 – 535.50 535.51 – 585.46 585.47 – 635.42 635.43 – 685.38 685.39 – 735.34 735.35 – 785.30 Xi 510.53 560.49 611.45 660.41 710.37 760.33 f 4 9 10 7 8 2 40 fr. 4/40 9/40 10/40 7/40 8/40 2/40 1 clases 485.55 – 535.50 535.51 – 585.46 585.47 – 635.42 635.43 – 685.38 685.39 – 735.34 735.35 – 785.30 Xi 510.53 560.49 611.45 660.41 710.37 760.33 f 4 9 10 7 8 2 40 Xi*f 2042.12 5044.41 6114.50 4622.87 5682.96 1520.66 25027.52 X = F% 10.00 22.50 25.00 17.50 20.00 5.00 100.00 Fa 4 13 23 30 38 40 Fa% 10.00 32.50 57.50 75.00 95.00 100.00 25027.52 = 625.69 40 Para el ejemplo: Supongamos como media supuesta la marca de clase de la segunda clase, esto es: 560.49, la tabla con los cálculos correspondientes, se puede ordenar en forma simplificada como se indica: Xi Desviación :Xi - Xs f (Xi-Xs)*f 510.53 510.53-560.49=-49.96 4 -199.84 560.49 560.49-560.49=0 9 0 611.45 611.45-560.49=50.96 10 509.60 660.41 660.41-560.49=99.92 7 699.44 710.37 710.37-560.49=149.88 8 1199.04 760.33 760.33-560.49=199.84 2 399.68 ∑ =2607.92 X = 560.49 + 2607.92 = 625.69 40 Valor que coincide con el calculado anteriormente. clases 485.55 – 535.50 535.51 – 585.46 585.47 – 635.42 635.43 – 685.38 685.39 – 735.34 735.35 – 785.30 Xi 510.53 560.49 611.45 660.41 710.37 760.33 f 4 9 10 7 8 2 40 fr. 4/40 9/40 10/40 7/40 8/40 2/40 1 F% 10.00 22.50 25.00 17.50 20.00 5.00 100.00 Fa 4 13 23 30 38 40 Fa% 10.00 32.50 57.50 75.00 95.00 100.00 Luego la abscisa que deja la mitad de la superficie total a cada lado es: 586.465+34.965=621.43 CRITERIO TABULAR O INTERVALAR: clases Xi f fr. 485.55 – 535.50 510.53 4 4/40 535.51 – 585.46 560.49 9 9/40 585.47 – 635.42 611.45 10 10/40 635.43 – 685.38 660.41 7 7/40 685.39 – 735.34 710.37 8 8/40 735.35 – 785.30 760.33 2 2/40 40 1 Md= 587.465+33.922=621.39 F% 10.00 22.50 25.00 17.50 20.00 5.00 100.00 Fa 4 13 23 30 38 40 Fa% 10.00 32.50 57.50 75.00 95.00 100.00 EN GENRAL: clases 485.55 – 535.50 535.51 – 585.46 587.47 – 635.42 635.43 – 685.38 685.39 – 735.34 735.35 – 785.30 Xi 510.53 560.49 611.45 660.41 710.37 760.33 f 4 9 10 7 8 2 40 fr. 4/40 9/40 10/40 7/40 8/40 2/40 1 F% 10.00 22.50 25.00 17.50 20.00 5.00 100.00 Fa 4 13 23 30 38 40 Fa% 10.00 32.50 57.50 75.00 95.00 100.00 Parámetros de dispersión: Desviación media: DM= ∑x i −xf n Para el ejemplo: Se sabe que la media es: X = 25027.52 = 625.69 40 clases Xi (Xi - X ) Xi − X 485.55 – 535.50 535.51 – 585.46 587.47 – 635.42 635.43 – 685.38 685.39 – 735.34 735.35 – 785.30 510.53 560.49 611.45 660.41 710.37 760.33 -115.16 -65.20 -14.24 34.72 84.68 134.64 ∑ =0 115.16 65.20 14.24 34.72 84.68 134.64 DM= 2379.60 = 59.49 40 f Fa Xi − X 4 9 10 7 8 2 40 460.64 586.80 142.40 243.04 677.44 269.28 ∑ =2379.60 ∑ (x − x ) 2 Desviación estándar: clases 485.55 – 535.50 535.51 – 585.46 587.47 – 635.42 635.43 – 685.38 685.39 – 735.34 735.35 – 785.30 S= Xi 510.53 560.49 611.45 660.41 710.37 760.33 S= para la muestra n −1 (Xi - X ) 2 13261.83 4251.04 202.78 1205.48 7170.70 18127.93 ∑ =44219.76 (Xi - X ) -115.16 -65.20 -14.24 34.72 84.68 134.64 ∑ =0 195394.30 = 70.78 40 − 1 f ∑ (x − x ) f 4 9 10 7 8 2 40 (Xi - X ) 2 f 53047.32 38259.36 2027.80 8438.36 57365.60 36255.86 ∑ =195394.30 2 Desviación estándar: S = Para el ejemplo: para la población. n 195394.30 = 69.89 40 Rango intercuartílico: Datos que se ubican entre el 25% y el 75% Para el ejemplo: El 25% de los datos: 25% de 40 = 10 De acuerdo a la tabla: clases Xi f 485.55 – 535.50 510.53 4 535.51 – 585.46 560.49 9 587.47 – 635.42 611.45 10 635.43 – 685.38 660.41 7 685.39 – 735.34 710.37 8 735.35 – 785.30 760.33 2 40 fr. 4/40 9/40 10/40 7/40 8/40 2/40 1 F% 10.00 22.50 25.00 17.50 20.00 5.00 100.00 Fa 4 13 23 30 38 40 Fa% 10.00 32.50 57.50 75.00 95.00 100.00 Corresponderían a los 4 datos de la primera clase más los 6 que faltan de la segunda clase: Datos del primer cuartel: 6 535,505+ (585.455 − 535.505) = 535,505 + 33.3 = 568.81 9 Datos del tercer cuartel: 75% de los datos: 75% de 40 = 30 Habrá que tomar los 4 de la primera clase, los 9 de la segunda, los 10 de la tercera y exactamente los 7 de la cuarta clase (suman 30) .En este caso se toma el límite inmediatamente superior de la cuarta clase, esto es: 685.38. Es decir el rango intercuartílico corresponde a todos los puntajes que se encuentran entre 568,81 y 685,38 (este criterio permite eliminar los outlier) Nota: el segundo intercuartílico corresponde a la mediana: En efecto: el 50% de los dados es 50% de 40 = 20 Habrá que tomar entonces: los 4 datos de la primera clase, los 9 de la segunda y los 7 restante de los 10 de la tercera clase, esto es: 7 (635.415 − 587.465) = 587.465 + 33.565 = 621.03 (que corresponde al 10 valor calculado anteriormente) 587.465+ Nota: cualquier otro intercuartílico se calcula de la misma manera: Ejemplo: cual es el rango de puntaje entre el tercer decil y el sexto decil? clases 485.55 – 535.50 535.51 – 585.46 587.47 – 635.42 635.43 – 685.38 685.39 – 735.34 735.35 – 785.30 Xi 510.53 560.49 611.45 660.41 710.37 760.33 f 4 9 10 7 8 2 40 fr. 4/40 9/40 10/40 7/40 8/40 2/40 1 F% 10.00 22.50 25.00 17.50 20.00 5.00 100.00 Fa 4 13 23 30 38 40 Fa% 10.00 32.50 57.50 75.00 95.00 100.00 Tercer decil: 30% de 40 = 12 8 535.505+ (585.455 − 535.505) =579.905 9 Sexto decil: 60% de 40 = 24 1 635.425+ (685.375 − 635.425) = 642.56 7 El rango es entonces: 579.91 y 642.56 También se puede calcular parámetros como porcentajes de alumnos que se ubican en determinado rango de puntajes. Ejemplo ¿Qué % de alumnos se ubica entre los 548.34 puntos y los 694.15 puntos? Se procede como se indica clases Xi 485.55 – 535.50 510.53 535.51 – 585.46 560.49 587.47 – 635.42 611.45 635.43 – 685.38 660.41 685.39 – 735.34 710.37 735.35 – 785.30 760.33 f 4 9 10 7 8 2 40 fr. 4/40 9/40 10/40 7/40 8/40 2/40 1 F% 10.00 22.50 25.00 17.50 20.00 5.00 100.00 Fa 4 13 23 30 38 40 Fa% 10.00 32.50 57.50 75.00 95.00 100.00 De acuerdo a la tabla el menor puntaje: 548.34 puntos se ubica en la segunda clase, por lo que habrá que tomar parte de los 9 alumnos, el mayor puntaje 694.15 puntos se ubica en la quinta clase y toma parte de los 8 alumnos. En resumen: 9 8 (585.46-548.34)+10+7+ (694.15 − 685.39) =6.69+10+7+1.40=25.09=25 49.95 49.95 alumnos .Que corresponde al 62.5% del total .Es decir el 62.5% de la muestra se ubica en ese rango de notas.