GUÍA DE APOYO AL APRENDIZAJE N°3 Medidas de Variabilidad ó Dispersión. La media aritmética no permite por sí sola conocer totalmente la población. Las medidas de dispersión permiten calcular la variabilidad de los datos. La idea de dispersión se relaciona con la mayor o menor concentración de los datos entorno a la media aritmética. Mientras menos sea la medida de dispersión se dice que la población es: parecida, regular, homogénea, estable; respecto de la variable estudiada. Las medidas de variabilidad que estudiares son: 1º Varianza: es el promedio de los cuadrados de las diferencias entre los valores de los datos y la media. Cuando más pequeña la varianza con respecto a la media, significa que hay una menor dispersión de los datos con respecto a la media aritmética. La varianza no puede ser mayor que la media aritmética. Para calcular su valor utilizaremos la siguiente fórmula (para datos tabulados): X V (X ) = S = 2 VARIABLE DISCRETA: x 2 ⋅f N i − MC 2 ⋅ f V (X ) = S 2 = VARIABLE CONTINUA: i i x N i − X ⋅f i 2 i N MC ⋅ f i 2 i N Observación: La varianza tiene una fórmula para datos poblacional y muestral, pero nosotros utilizaremos la fórmula para datos poblacional, claro que usaremos la simbología V ( X ) = S 2 como escritura. Para que conozcan la diferencia y las distintas maneras de x escribir estas fórmulas, se las escribiré a continuación (no olvidar que las que utilizaremos serán las fórmulas anteriores, para calcular la varianza): VARIABLE DISCRETA: V (x ) = σ = (X i − X )2 = X V (x ) = S 2 = (X i − X )2 = X 2 i N 2 −NX 2 Poblacional N N −1 i 2 −NX 2 N −1 Muestral VARIABLE CONTINUA: V (x ) = σ 2 = V (x ) = S 2 = f ⋅ MC i i 2 −NX 2 −NX 2 Poblacional N f ⋅ MC i i 2 N −1 PROFESOR: RONNY GODOY GÁLVEZ Muestral 1 Ejemplo: se tiene la información respecto al número de latas de bebidas consumidas durante un mes, por un grupo de 39 familias en la siguiente tabla (en una tabla conviene formular dos nuevas columnas, para determinar la varianza): V (X ) = S = 2 x X i N 2 Xi fi X i ⋅ fi X i2 ⋅ f i 30 35 40 41 45 5 10 8 12 4 150 350 320 492 180 4.500 12.250 12.800 20.172 8.100 TOTAL N = 39 1.492 57.822 ⋅f i − X ⋅f i N 2 i = 57.822 1.492 − 39 39 2 = 19,062 Observaciones: • Saber que la varianza del ejemplo es igual a 19,062 no tiene una interpretación, sino que es un valor comparativo entre muestras. Una solución a este problema es regresar a las unidades de medición originales obteniendo la raíz cuadrada de la varianza. • Si la variable tiene un valor constante ( X i = c ), entonces su varianza es cero. Propiedades de la Varianza i) Si Y = X + A , entonces la varianza de “ Y ”, sería: V (Y ) = V ( X + A) = V ( X ) . Siendo A una constante. Ejemplo: Si el número de latas de bebidas consumidas durante un mes aumenta en 5 latas, la nueva varianza sería; Nueva Varianza: V (Y ) = V ( X ) = 19,062 ii) Si Y = A ⋅ X , entonces la varianza de “ Y ”, sería: V (Y ) = V ( A ⋅ X ) = A 2 ⋅ V ( X ) . Siendo A una constante. Ejemplo: Si el número de latas de bebidas consumidas durante un mes aumenta en un 10%, la nueva varianza sería; Reajuste = 100% + 10% = 110% = 110 = 1,1 100 Nueva Varianza: V (Y ) = V (1,1X ) = 1,12 ⋅ V ( X ) = 23,065 iii) La varianza debe ser mayor o igual a cero ( V ( X ) ≥ 0 ) PROFESOR: RONNY GODOY GÁLVEZ 2 2º Desviación Típica ó Estándar: mide la cantidad típica en la que los valores del conjunto de datos difieren de la media aritmética. La ventaja de esta medida es que sus unidades son las mismas de la variable. Podemos decir que la desviación estándar es una medida de la fluctuación (dispersión) que hay en los datos y es la medida de variabilidad de mayor uso. Para calcular su valor utilizaremos la siguiente fórmula: S = S2 x x En el ejemplo anterior sería: S = 19,062 = 4,366 x 3º Coeficiente de Variación: mide la variación con relación a la variable que se está considerando. Expresa que porcentaje es la desviación estándar de la media aritmética de la variable, lo que da una medida de la incidencia real de la variabilidad respecto de lo que se quiere medir. Otra manera para explicar este concepto es decir que el coeficiente de variación es un número abstracto y mide la dispersión de los valores de la variable respecto al promedio expresado en tanto por ciento; aquella distribución que tenga menos dispersión significa que la información es más Homogénea en torno a la media, y por lo tanto es mejor. Observación: El coeficiente de variación es una medida que se emplea fundamentalmente para; • Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de • • • unidades de medida. Por ejemplo, kilogramos y centímetros. Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más personas distintas. Comparar dos grupos de datos que tienen distinta media aritmética. Determinar si cierta media es consistente con cierta varianza. Para calcular su valor se utiliza la siguiente fórmula: S CV ( X ) = x ⋅100% X En el ejemplo anterior sería: X= 1.492 = 38,256 39 ; CV ( X ) = 4,366 ⋅ 100% = 11,41% 38,256 Interpretación: el número de latas consumidas durante un mes tiene una variación del 11,41%. PROFESOR: RONNY GODOY GÁLVEZ 3 Ejemplo: la siguiente tabla representa los sueldos (en miles de $) de 40 trabajadores de la empresa GAMA. a) Identifique la variable, población y de qué tipo es. b) Calcule e interprete el promedio de los sueldos. c) ¿Qué porcentaje de trabajadores tienen un sueldo entre $320.000 y $450.000? d) ¿Cuál es la variación de los sueldos de los trabajadores de la empresa GAMA? e) Si los sueldos se aumentan en un 5%. ¿Cuál es la nueva variación de los sueldos? SUELDOS fi Fi MCi MCi ⋅ f i MCi2 ⋅ f i 250 – 300 5 5 275 1.375 378.125 300 – 350 12 17 325 3.900 1.267.500 350 – 400 20 37 375 7.500 2.812.500 400 – 550 3 40 475 1.425 676.875 TOTAL N = 40 14.200 5.135.000 SOLUCIÓN: a) Variable = sueldos (en miles de $). Población = 40 trabajadores de la empresa GAMA. Clasificación = cuantitativa – continua. b) X = MC ⋅ f i N i X= 14.200 = 355 40 Interpretación: el sueldo promedio de los trabajadores es de $355.000 c) ¿Qué porcentaje de trabajadores ganan entre $320.000 y $450.000? $320.000 Pk ∈ [300 − 350[ , por lo que para calcular el porcentaje que está en este intervalo, utilizaremos la fórmula; PROFESOR: RONNY GODOY GÁLVEZ 4 K⋅N 100 Pk = Li + A ⋅ k ⋅ 40 −F i −1 f 320 = 300 + 50 ⋅ 100 12 i −5 0,4k − 5 (320 − 300) = 12 50 0,4k − 5 = 0,4 12 (0,4 ⋅12 + 5) = 24,5% k = 1 0,4 Pk ∈ [400 − 550[ , por lo que para calcular el porcentaje que está en este $450.000 intervalo, utilizaremos la fórmula; K⋅N Pk = Li + A ⋅ 100 k ⋅ 40 −F i −1 f 450 = 400 + 150 ⋅ 100 3 i − 37 0,4k − 37 (450 − 400) = 3 150 0,4k − 37 = 0,33 3 (0,33 ⋅ 3 + 37) = 94,975% ≈ 95% k = 2 0,4 Porcentaje Pedido = 95 − 24,5 = 70,5% Interpretación: el 70,5% de los trabajadores que tienen un sueldo entre $400.000 y $550.000. d) ¿Cuál es la variación de los sueldos de los trabajadores de la empresa GAMA? 2 S = x MC 2 ⋅ f i N i − S = 2.350 = 48,477 x MC ⋅ f i 2 i N CV ( X ) = 5.135.000 14.200 = − 40 40 2 = 2.350 48,477 ⋅100% = 13,65% 355 Interpretación: los sueldos tienen una variación del 13,65%. PROFESOR: RONNY GODOY GÁLVEZ 5 e) Si los sueldos se aumentan en un 5%. ¿Cuál es la nueva variación de los sueldos? Y = Nuevos Sueldos ; Y = 1,05 ⋅ X Por lo tanto el nuevo promedio será: Y = 1,05 ⋅ X = 1,05 ⋅ 355 = 372,75 Por lo tanto la nueva varianza será: S 2 = 1,05 2 ⋅ S 2 = 1,05 2 ⋅ 2350 = 2.590,875 y x Luego el nuevo coeficiente de variación, es: CV (Y ) = 2.590,875 ⋅100% = 13,65% 372,75 Interpretación: los sueldos tienen la misma variación del 13,65%. PROFESOR: RONNY GODOY GÁLVEZ 6