C OLEGIO TÉCNICO COMERCIAL MANUELA BELTRÁN ESTADÍSTICA – MEDIDAS DE DISPERSIÓN Lic. ELISABETH ECHAVARRIA MEDIDAS DE DISPERSIÓN Hasta el momento hemos estudiado los valores centrales de la distribución, pero también es importante conocer si los valores en general están cerca o alejados de estos valores centrales, es por lo que surge la necesidad de estudiar medidas de dispersión. RANGO: Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribución,. Lo notaremos como R. Realmente no es una medida muy significativa en la mayoría de los casos, pero indudablemente es muy fácil de calcular. R X max X min A veces el Rango es una medida “engañadora” e “inestable”, pues sólo toma en cuenta los valores extremos, dejando de lado los valores intermedios. Hasta el momento hemos estudiado varias medidas de centralización, moda, media y mediana, por lo que podemos hablar de desviación con respecto a cualquiera de ellas, sin embargo, la más utilizada es con respecto a la media. DESVIACIONES La desviación respecto a la media es la diferencia entre cada valor de la variable estadística y la media aritmética. Son diferencias que se obtienen entre lo valores de la variable y un punto fijo, por lo general la Media, o un valor arbitrario denominado “Media Supuesta” u “Origen de Trabajo” O t Se consideran 3 clases: Desviaciones respecto a la Media Desviaciones respecto a la Media Supuesta u Origen de Trabajo Desviaciones respecto a un origen de trabajo tomadas en unidades de Amplitud A. DESVIACIONES RESPECTO A LA MEDIA “Se simboliza Zi o di” Se obtienen calculando las diferencias entre cada uno de los valores que toma la variable y la media, se simboliza Zi o di Zi = Xi - B. DESVIACIONES RESPECTO A Origen de Trabajo (Ot) “Se simboliza Z`i” El procedimiento es exactamente igual que el anterior, con la diferencia que en lugar de la Media, se toma un valor cualquiera. Esta desviación se usa preferencialmente en datos agrupados C OLEGIO TÉCNICO COMERCIAL MANUELA BELTRÁN ESTADÍSTICA – MEDIDAS DE DISPERSIÓN Lic. ELISABETH ECHAVARRIA C. DESVIACIONES RESPECTO A UN ORIGEN DE TRABAJO TOMADAS EN UNIDADES DE AMPLITUD Z”i Generalmente se aplica en datos agrupados, cuando la variable es continua y la amplitud del intervalo es constante. Se calcula “dividiendo cada una de las desviaciones respecto a la media supuesta por la respectiva amplitud”. DESVIACION MEDIA La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media. La desviación media se representa por Ejemplito Nº 1. Calcular la desviación media de la distribución: 9, 3, 8, 8, 9, 8, 9, 18, observamos que n = 8, Luego la media es Hallamos la desviación respecto a la media de cada Xi y sumamos sus valores absolutos. DESVIACIÓN MEDIA PARA DATOS AGRUPADOS Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es: Es decir cada diferencia en valor absoluto se debe multiplicar por su respetiva frecuencia C OLEGIO TÉCNICO COMERCIAL MANUELA BELTRÁN ESTADÍSTICA – MEDIDAS DE DISPERSIÓN Lic. ELISABETH ECHAVARRIA Ejemplito Nº 2. Calcular la desviación media de la distribución: Xi fi xi · fi |x - x | |x - x | · fi [10, 15) 12.5 3 37.5 9.286 27.858 [15, 20) 17.5 5 87.5 4.286 21.43 [20, 25) 22.5 7 157.5 0.714 4.998 [25, 30) 27.5 4 110 5.714 22.856 [30, 35) 32.5 2 65 10.174 21.428 21 457.5 98.57 Calculamos la media VARIANZA La varianza es el cuadrado de la desviación estándar, La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. La varianza se representa por o S2. Varianza para datos agrupados Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores. C OLEGIO TÉCNICO COMERCIAL MANUELA BELTRÁN ESTADÍSTICA – MEDIDAS DE DISPERSIÓN Lic. ELISABETH ECHAVARRIA Varianza para datos agrupados Ejemplito Nº 3 Calcular la varianza de la distribución: 9, 3, 8, 8, 9, 8, 9, 18 Calcular la varianza de la distribución de la tabla: xi2 · fi xi fi xi · fi [10, 20) 15 1 15 225 [20, 30) 25 8 200 5000 [30,40) 35 10 350 12 250 [40, 50) 45 9 405 18 225 [50, 60 55 8 440 24 200 [60,70) 65 4 260 16 900 [70, 80) 75 2 150 11 250 42 1 820 88 050 PROPIEDADES DE LA VARIANZA La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. Si a todos los valores de la variable se les suma un número la varianza no varía. Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total. En nuestro caso es mejor usar la simbología S2: C OLEGIO TÉCNICO COMERCIAL MANUELA BELTRÁN ESTADÍSTICA – MEDIDAS DE DISPERSIÓN Lic. ELISABETH ECHAVARRIA OBSERVACIONES SOBRE LA VARIANZA La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas. En los casos que no se pueda hallar la media tampoco será posible hallar la varianza. La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado. DESVIACIÓN TÍPICA O ESTANDÁR La desviación típica es la raíz cuadrada de la varianza. Desviación típica para datos agrupados Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores. Desviación típica para datos agrupados EjEMPLITO nº 4 Calcular la desviación típica de la distribución: 9, 3, 8, 8, 9, 8, 9, 18 C OLEGIO TÉCNICO COMERCIAL MANUELA BELTRÁN ESTADÍSTICA – MEDIDAS DE DISPERSIÓN Lic. ELISABETH ECHAVARRIA Calcular la desviación típica de la distribución de la tabla: xi fi xi · fi xi2 · fi [10, 20) 15 1 15 225 [20, 30) 25 8 200 5000 [30,40) 35 10 350 12 250 [40, 50) 45 9 405 18 225 [50, 60) 55 8 440 24 200 [60,70) 65 4 260 16 900 [70, 80) 75 2 150 11 250 42 1 820 88 050 Propiedades de la desviación típica La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. Si a todos los valores de la variable se les suma un número la desviación típica no varía. Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede calcular la desviación típica total. Si todas las muestras tienen el mismo tamaño: Si las muestras tienen distinto tamaño: C OLEGIO TÉCNICO COMERCIAL MANUELA BELTRÁN ESTADÍSTICA – MEDIDAS DE DISPERSIÓN Lic. ELISABETH ECHAVARRIA Observaciones sobre la desviación típica La desviación típica, al igual que la media y la varianza, es un índice muy sensible a las puntuaciones extremas. En los casos que no se pueda hallar la media tampoco será posible hallar la desviación típica. Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor de la media. EJERCICIOS EN CLASE la última convocatoria realizada por una programadora de televisión se buscaba seleccionar los participantes de un nuevo reality, dentro del formulario de inscripción se preguntó a los aspirantes por el grado de escolaridad, medido en número de años, contando desde primero de primaria. Los resultados se muestran en las siguientes 11 11 4 18 10 11 6 9 12 9 19 10 10 1 14 12 5 5 0 8 8 11 18 11 9 11 9 11 11 4 10 9 6 4 16 3 10 17 11 4 1. Si la persona encargada de caracterizar la población decide construir una tabla de frecuencias usando los rangos establecidos por el sistema colombiano, completar la siguiente tabla: Con respecto a la tabla anterior, 2. ¿Cuántas personas completaron el formulario? 3. ¿Cuál es la frecuencia relativa de nivel educativo bachiller? ¿Qué significado tiene ese dato? 4. ¿Qué nivel educativo predomina? 5. ¿Qué nivel es el que menos predomina? 6. ¿Se puede afirmar que los aspirantes son en su mayoría bachilleres? Justificar. 7. Completar la tabla ESCOLARIDAD 0–5 Primaria 6 -11 Bachiller 12 – 17 Mi, Xi Marca de Clase fi hi N H C OLEGIO TÉCNICO COMERCIAL MANUELA BELTRÁN ESTADÍSTICA – MEDIDAS DE DISPERSIÓN Lic. ELISABETH ECHAVARRIA Profesional Más de 18 Especializado 10. Escribir algunas conclusiones con respecto a la tabla anterior. 11. Complete la tabla: Xi Desviación Desviación cuadrada 12. Calcule el valor de la Varianza y la Desviación estándar 13. Calcule las medidas de tendencia central con los datos anteriores.