Objetivos Medidas de dispersión: Recorrido (o Amplitud) y razón de variación, Distancia (o Amplitud) y desviación intercuartílica, Desviación Varianza, media y desviación estándar, y Coeficiente de variación. 1 Recorrido o amplitud Definición: diferencia entre la marca más alta y la marca más baja. Se puede indicar proporcionando la diferencia real, tanto como presentando ambas marcas. Su ventaja es la simplicidad y facilidad de interpretación; su defecto es que la información se basa en casos atípicos y puede conducir a groseras simplificaciones en la generalización. 2 Razón de variación Definición: medida del grado en que no se concentran los casos en la categoría modal. fM R.V . = 1 − N Fórmula: Tiene el inconveniente de que resulta insensible a la distribución de frecuencias en categorías no modales. Su mayor utilidad es como medida de dispersión para variables nominales. o 3 Distancia o amplitud intercuartílica Definición: similar al recorrido, se define como la distancia entre el primero y el tercer Cuartil (50% de la distribución). Fórmula: Tiene la ventaja de no ser sensible a los valores extremos. Pero sigue siendo sólo sensible a algunos valores. RQ = Q3 − Q1 4 Desviación intercuartílica Definición: se define como la distancia entre los valores que contienen al 25 % de la distribución en torno de la Md, y se corresponde con la mitad de la Distancia Intercuartílica. Fórmula: Tiene la ventaja de ser aún menos sensible a los valores extremos. Pero su lectura se torna menos intuitiva y más compleja. Q3 − Q1 DQ = 2 5 Ejemplos Edad f F% 14 3 15 15 1 20 16 2 30 17 1 35 18 1 40 19 2 50 20 1 55 21 1 60 22 1 65 23 1 24 Cantidad de hijos f F% Q1 = 16 0 17 47,2 Q1 = 0 Q2 = 19 1 7 66,7 Q2 = 1 Q3 = 24 2 9 91,7 Q3 = 2 0,85 3 2 97,2 R.V. = RQ = 8 4 1 100,0 RQ = 2 DQ = 4 Total 36 DQ = 1 70 Cantidad de hijos f F% Q1 = 1 1 75 1 7 36,8 Q2 = 2 25 2 85 2 9 84,2 Q3 = 2 26 1 90 3 2 94,7 28 1 95 4 1 100,0 29 1 100 Total 19 Total 20 R.V. = R.V. = 0,53 0,53 RQ = 1 DQ = 0,5 6 Desviación media Definición: media aritmética de las diferencias absolutas de cada marca en relación con la media. N Fórmula: DM = ∑X i =1 i −X N Tiene la ventaja de servirse de todos los valores y de poder expresarse de manera directa y comprenderse de forma intuitiva. Pero tiene dificultades de manipulación algebraica y de interpretación teórica. 7 Varianza Definición: la media aritmética de las desviaciones cuadradas de cada marca en relación con la media. N Fórmula: V= ∑(X i − X) 2 i =1 N El orden de las tareas implicadas debe ser cuidadosamente respetado. Tiene dificultades de interpretación y lectura intuitiva. 8 Desviación estándar Definición: raíz cuadrada de la media aritmética de las desviaciones cuadradas de cada marca en relación con la media. Fórmula: N S= ∑ ( X i − X )2 i =1 N = V V =S 2 Por su forma de cálculo, se ponderan los valores extremos sobre los demás, teniendo más influencia que lo ya visto para la media. 9 Desviación estándar para datos agrupados Partiendo de la fórmula para datos no agrupados tenemos que: Fórmula: ∑ f (X S= k S= i ∑ (X N i i =1 −X i −X i =1 ) 2 N ) 2 N 10 Coeficiente de variación o variabilidad Definición: se define como la proporción de la desviación estándar en relación con la media. Fórmula: Al comparar varios grupos con medias diferentes, el coeficiente de variación permite contar con una medida de la variación relativa. S CV = X 11 Ejemplo Edad f F% f xi |xi -x| 14 15 16 17 18 19 20 21 22 23 24 25 26 28 29 Total 3 1 2 1 1 2 1 1 1 1 1 2 1 1 1 20 15 20 30 35 40 50 55 60 65 70 75 85 90 95 100 42 15 32 17 18 38 20 21 22 23 24 50 26 28 29 405 6,25 5,25 4,25 3,25 2,25 1,25 0,25 0,75 1,75 2,75 3,75 4,75 5,75 7,75 8,75 f |xi -x| (xi -x) 18,75 5,25 8,50 3,25 2,25 2,50 0,25 0,75 1,75 2,75 3,75 9,50 5,75 7,75 8,75 81,5 -6,25 -5,25 -4,25 -3,25 -2,25 -1,25 -0,25 0,75 1,75 2,75 3,75 4,75 5,75 7,75 8,75 2 f (xi -x) 117,1875 27,5625 36,125 10,5625 5,0625 3,125 0,0625 0,5625 3,0625 7,5625 14,0625 45,125 33,0625 60,0625 76,5625 439,75 x = 20,25 DM = 4,075 c/ N-1 S = 4,689 4,812 V = 21,988 23,145 CV = 0,232 0,238 12