UNIDAD 6: TRABAJEMOS CON MEDIDAS DE POSICION. Cuartiles, deciles y percentiles. 4.1 Introducción y cálculo. La mediana es un valor de posición. Divide a una serie de datos ordenados en 2 partes iguales. Es decir que la mediana supera a no más de la mitad de los datos. Al mismo tiempo es superada por no más de la mitad de los datos. Pero podemos dividir una serie de datos en más de dos partes. Si se divide en 4, se obtienen los cuartiles. Los cuartiles son 3: Q1, Q2, Q3. Cálculo de cuartiles, deciles y percentiles. La posición de un cuartil K es: K (n + 1)/4 La posición de un decil K es: K (n + 1)/10 En estos casos, n es el número de datos. La posición de un percentil K es: K (n + 1)/100 K tomará los valores correspondientes. Por ejemplo, si se busca el decil 7, entonces K = 7; si se busca el percentil 25, entonces K = 25. Una vez que se tienen las posiciones respectivas, se procede a calcular el valor que ocupa tal posición. Si se busca el cuartil 2, entonces K = 2; y tenemos K (n + 1)/4 = 2 (n + 1)/4 = (n + 1)/2. Ahora recordemos que (n + 1)/2 es la fórmula para encontrar la mediana. Queda así demostrado que el cuartil 2 equivale a la mediana. Ejemplo. Resolver los casos siguientes. 1. Para la serie 5, 10, 10, 15, 20, 30, 35, 40, 50, 52, 57, 60, 70, 70, 70, 80, 80, 85, 85, 95, 100, 120, 130, 143, 150. Calcular el cuartil 3, el decil 7 y el percentil 90. 2. Para la serie aritmética: 4, 7, 10, 13...103, 106, 109. Calcular el cuartil 1 y el decil 8. Solución. Se tienen 25 datos. El cuartil 3 ocupa la posición: K (n + 1)/4 = 3 (25 + 1)/4 = 3(26)/4 = 78/4 = 19.5 Tomemos las posicione 19 y 20. Estas son: 85 y 95. Como 19.5 es 19 y medio, significa que la posición 19.5 está en el centro de 85 y 95. La posición 19.5 es (85 + 95)/2 = 90. El cuartil 3 es 90. También puede calcularse así: 95 – 85 = 10. La posición 19.5 es 85 + 10 (0.5) = 85 + 5 = 90. El decil 7 ocupa la posición: K (n + 1)/10 = 7(25 + 1)/10 = 182/10 = 18.2 Tomemos las posicione 18 y 19. Estas son: 85 y 85. Por lo tanto el decil 7 es 85. El percentil 90 ocupa la posición: K (n + 1)/100 = 90 (25 + 1)/100 = 23.4 Tomemos las posicione 23 y 24. Estas son: 130 y 143. La resta es: 143 – 130 = 13. La posición 23.4 es: 130 + 13(0.4) = 135.2. Para la serie 4, 7, 10, 13...103, 106, 109, el término general es f(n) = 3n + 1. La posición del último término es: 109 = 3n + 1. Al despejar n resulta que: n = 36. Es decir que tenemos 36 datos. El cuartil 1 ocupa la posición: K (n + 1)/4 = 1 (36 + 1)/4 = 9.25. Para esta posición el dato es: f(n) = 3n + 1 = 3(9.25) + 1 = 28.75 El decil 8 ocupa la posición: K (n + 1)/10 = 8(36 + 1)/10 = 29.6 Para esta posición el dato es: f(n) = 3n + 1 = 3(29.6) + 1 = 89.8 Actividad 2. 1. Para cada serie calcular el cuartil 3, el decil 6 y el percentil 75. a. 3, 5, 6, 7, 8, 10, 12, 15, 15, 16, 17, 17, 18, 20, 21, 22, 23, 24, 24, 25, 25, 28, 28, 30, 32, 33, 35, 36, 36, 41, 41, 44, 45, 47, 49, 50, 60, 65, 70. ___________________ ___________________ ___________________ b. 7, 8, 10, 12, 15, 15, 16, 16, 17, 17, 18, 19, 20, 21, 22, 23, 24, 24, 25, 25, 28, 28, 30, 32, 33, 35, 36, 36, 41, 41, 44, 45, 47, 49, 50, 55, 57, 58, 60, 63, 65, 66, 68, 70, 71, 73. ___________________ ___________________ ___________________ 2. Para cada serie aritmética calcular el cuartil 2, el decil 5, el decil 8, el percentil 80 y el percentil 90. a. 7, 12, 17, 22... 212, 217. ___________________ ___________________ ___________________ ___________________ ___________________ b. –6, -2, 2, 6, 10... 190, 194. ___________________ ___________________ ___________________ ___________________ ___________________ 3. Para los primeros 100 términos de la serie f(n) = 5n – 10, calcular la mediana, el cuartil 2, el decil 5, el decil 6, el decil 8, el percentil 60, el percentil 80 y el percentil 85. ___________________ ___________________ ___________________ ___________________ ___________________ ___________________ ___________________ ___________________ La escala percentilar. La escala percentilar se calcula mediante la fórmula: P = 50(2faa n + f) Aquí, faa es la frecuencia acumulada anterior del valor en consideración. Como antes, n es el número total de datos. Ejemplo. Calcular la escala percentilar para los datos siguientes: 12, 12, 12, 14, 14, 16, 16, 17, 17, 17, 18, 18, 18, 18, 18, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 22, 22, 22, 23, 23, 23, 25, 25, 27, 30. Solución. Para esta serie de datos n = 35. Agrupemos la información en una tabla de frecuencias. Agreguemos la frecuencia acumulada y la frecuencia acumulada anterior Dato 12 14 16 17 18 20 21 22 23 25 27 30 f 3 2 2 3 5 6 4 3 3 2 1 1 fa 3 5 7 10 15 21 25 28 31 33 34 35 faa cero 3 5 7 10 15 21 25 28 31 33 34 . . Para 12, tenemos faa = cero. P = 50(2faa + f)/n = 50(2x0 + 3)/35 = 4.29 Para 14, tenemos faa = 3. P = 50(2faa + f)/n = 50(2x3 + 2)/35 = 11.43 Para 16, tenemos faa = 5. P = 50(2faa + f)/n = 50(2x5 + 2)/35 = 17.14 Para 17, tenemos faa = 7. P = 50(2faa + f)/n = 50(2x7 + 3)/35 = 24.29 Para 18, tenemos faa = 10. P = 50(2faa + f)/n = 50(2x10 + 5)/35 = 35.7 Y así se continúa. Para calcular la escala decilar se divide por 10 la escala percentilar. En la tabla siguiente se muestra la escala percentilar y la decilar. Dato 12 14 16 17 18 20 . f . fa . faa Esc. Per. Esc. Dci. 3 3 cero 4.29 0.429 2 5 3 11.43 1.143 2 7 5 17.14 1.714 3 10 7 24.29 2.429 5 15 10 35.7 3.57 6 21 15 51.43 5.143 21 22 23 25 27 30 4 25 21 65.7 6.57 3 28 25 75.7 7.57 3 31 28 84.3 8.43 2 33 31 91.43 9.143 1 34 33 95.7 9.57 1 35 34 98.57 9.857 Actividad 3. Calcular las escalas percentilar y decilar para los grupos de datos siguientes: 1. 12, 12, 12, 12, 12, 13, 13, 13, 16, 16, 16, 16, 17, 17, 17, 17, 18, 18, 18, 18, 18, 18, 19, 19, 19, 19, 19, 19, 21, 21, 21, 22, 22, 22, 22, 22, 23, 23, 23, 25, 25, 27, 27, 28, 28, 28, 29, 29, 29, 29. 2. 20, 20, 20, 20, 22, 22, 22, 22, 22, 22, 22, 25, 25, 25, 25, 25, 25, 30, 30, 30, 30, 30, 35, 35, 35, 35, 35, 35, 35, 40, 40, 40, 40, 40, 40, 42, 42, 42, 42, 45, 45, 45, 50, 50, 50, 50, 52, 52, 50, 50, 50, 52, 52, 52, 52, 54, 54, 54, 54. 5. Introducción a las medidas de dispersión. Como su nombre lo indica, las medidas de dispersión son parámetros que nos indican qué tan dispersos están los datos. Cuantos más dispersos estén, mayor será el valor de la medida. Consideremos las series siguientes. a. 10, 10, 10, 10. b. 2, 5, 6, 7, 9, 13. c. 1, 7. 8, 14, 20 En la serie a, la dispersión es cero; y la serie c es la más dispersa. De hecho, para la serie a la desviación típica, que es una medida de dispersión, es CERO. Las medidas de dispersión tienen su importancia. El caso siguiente ilustrará esta importancia. Se tienen 2 empresas. La empresa A paga un salario promedio de $265; mientras que la empresa B paga un salario promedio de $240. A juzgar por la media aritmética (el promedio), podría afirmarse que los empleados de la empresa A están mejor económicamente. Pero No es cierto que los de A están mejor que los de B. Analicemos los salarios de cada empleado por empresa. Salarios de los empleados de la empresa A. 174 180 173 190 200 183 500 220 450 175 185 550 225 290 215 235 240 255 Salarios de los empleados de la empresa B. 220 210 200 230 310 250 Podemos observar que en la empresa A hay salarios muy bajos: el más bajo es $173. En cambio en la empresa B, el salario más bajo es de $210. Definitivamente que en B se tienen los mejores salarios individuales. Lo que ocurre es que en A, los salarios son más heterogéneos; es decir, están más dispersos. En cambio en B, los salarios son más homogéneos; es decir, menos dispersos. En conclusión: la media aritmética no es el parámetro adecuado para estimar el bienestar económico de los empleados. En cambio, el grado de dispersión de los salarios sí nos aproxima de mejor manera al estado económico individual de cada empleado.