UNIDAD 6: TRABAJEMOS CON MEDIDAS DE POSICION

Anuncio
UNIDAD 6: TRABAJEMOS CON MEDIDAS DE
POSICION.
Cuartiles, deciles y percentiles.
4.1 Introducción y cálculo.
La mediana es un valor de posición. Divide a una serie de datos ordenados en 2
partes iguales. Es decir que la mediana supera a no más de la mitad de los datos. Al
mismo tiempo es superada por no más de la mitad de los datos.
Pero podemos dividir una serie de datos en más de dos partes. Si se divide en 4, se
obtienen los cuartiles. Los cuartiles son 3: Q1, Q2, Q3.
 Cálculo de cuartiles, deciles y percentiles.
La posición de un cuartil K es: K (n + 1)/4
La posición de un decil K es: K (n + 1)/10
En estos casos, n es el número de datos.
La posición de un percentil K es: K (n + 1)/100
K tomará los valores correspondientes. Por ejemplo, si se busca el decil 7, entonces K
= 7; si se busca el percentil 25, entonces K = 25.
Una vez que se tienen las posiciones respectivas, se procede a calcular el valor que
ocupa tal posición.
Si se busca el cuartil 2, entonces K = 2; y tenemos K (n + 1)/4 = 2 (n + 1)/4 = (n + 1)/2.
Ahora recordemos que (n + 1)/2 es la fórmula para encontrar la mediana. Queda así
demostrado que el cuartil 2 equivale a la mediana.
Ejemplo. Resolver los casos siguientes.
1. Para la serie 5, 10, 10, 15, 20, 30, 35, 40, 50, 52, 57, 60, 70, 70, 70, 80, 80, 85, 85,
95, 100, 120, 130, 143, 150. Calcular el cuartil 3, el decil 7 y el percentil 90.
2. Para la serie aritmética: 4, 7, 10, 13...103, 106, 109. Calcular el cuartil 1 y el decil 8.
 Solución.

Se tienen 25 datos.
El cuartil 3 ocupa la posición: K (n + 1)/4 = 3 (25 + 1)/4 = 3(26)/4 = 78/4 = 19.5
Tomemos las posicione 19 y 20. Estas son: 85 y 95. Como 19.5 es 19 y medio,
significa que la posición 19.5 está en el centro de 85 y 95.
La posición 19.5 es (85 + 95)/2 = 90. El cuartil 3 es 90.
También puede calcularse así: 95 – 85 = 10. La posición 19.5 es 85 + 10 (0.5) = 85 +
5 = 90.
El decil 7 ocupa la posición: K (n + 1)/10 = 7(25 + 1)/10 = 182/10 = 18.2
Tomemos las posicione 18 y 19. Estas son: 85 y 85. Por lo tanto el decil 7 es 85.
El percentil 90 ocupa la posición: K (n + 1)/100 = 90 (25 + 1)/100 = 23.4
Tomemos las posicione 23 y 24. Estas son: 130 y 143. La resta es: 143 – 130 = 13. La
posición 23.4 es: 130 + 13(0.4) = 135.2.
 Para la serie 4, 7, 10, 13...103, 106, 109, el término general es f(n) = 3n + 1.
La posición del último término es: 109 = 3n + 1. Al despejar n resulta que: n = 36. Es
decir que tenemos 36 datos.
El cuartil 1 ocupa la posición: K (n + 1)/4 = 1 (36 + 1)/4 = 9.25. Para esta posición el
dato es:
f(n) = 3n + 1 = 3(9.25) + 1 = 28.75
El decil 8 ocupa la posición: K (n + 1)/10 = 8(36 + 1)/10 = 29.6 Para esta posición el
dato es:
f(n) = 3n + 1 = 3(29.6) + 1 = 89.8
 Actividad 2.
1. Para cada serie calcular el cuartil 3, el decil 6 y el percentil 75.
a. 3, 5, 6, 7, 8, 10, 12, 15, 15, 16, 17, 17, 18, 20, 21, 22, 23, 24, 24, 25, 25, 28, 28, 30,
32, 33, 35, 36, 36, 41, 41, 44, 45, 47, 49, 50, 60, 65, 70.
___________________
___________________
___________________
b. 7, 8, 10, 12, 15, 15, 16, 16, 17, 17, 18, 19, 20, 21, 22, 23, 24, 24, 25, 25, 28, 28, 30,
32, 33, 35, 36, 36, 41, 41, 44, 45, 47, 49, 50, 55, 57, 58, 60, 63, 65, 66, 68, 70, 71, 73.
___________________
___________________
___________________
2. Para cada serie aritmética calcular el cuartil 2, el decil 5, el decil 8, el percentil 80 y
el percentil 90.
a. 7, 12, 17, 22... 212, 217.
___________________
___________________
___________________
___________________
___________________
b. –6, -2, 2, 6, 10... 190, 194.
___________________
___________________
___________________
___________________
___________________
3. Para los primeros 100 términos de la serie f(n) = 5n – 10, calcular la mediana, el
cuartil 2, el decil 5, el decil 6, el decil 8, el percentil 60, el percentil 80 y el percentil 85.
___________________
___________________
___________________
___________________
___________________
___________________
___________________
___________________
 La escala percentilar.
La escala percentilar se calcula mediante la fórmula: P = 50(2faa
n
+ f)
Aquí, faa es la frecuencia acumulada anterior del valor en consideración. Como antes,
n es el número total de datos.
Ejemplo. Calcular la escala percentilar para los datos siguientes: 12, 12, 12, 14,
14, 16, 16, 17, 17, 17, 18, 18, 18, 18, 18, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 22, 22,
22, 23, 23, 23, 25, 25, 27, 30.
 Solución.
Para esta serie de datos n = 35.
Agrupemos la información en una tabla de frecuencias. Agreguemos la frecuencia
acumulada y la frecuencia acumulada anterior
Dato
12
14
16
17
18
20
21
22
23
25
27
30
f
3
2
2
3
5
6
4
3
3
2
1
1
fa
3
5
7
10
15
21
25
28
31
33
34
35
faa
cero
3
5
7
10
15
21
25
28
31
33
34
.
.
Para 12, tenemos faa = cero. P = 50(2faa + f)/n = 50(2x0 + 3)/35 = 4.29
Para 14, tenemos faa = 3.
P = 50(2faa + f)/n = 50(2x3 + 2)/35 = 11.43
Para 16, tenemos faa = 5.
P = 50(2faa + f)/n = 50(2x5 + 2)/35 = 17.14
Para 17, tenemos faa = 7.
P = 50(2faa + f)/n = 50(2x7 + 3)/35 = 24.29
Para 18, tenemos faa = 10.
P = 50(2faa + f)/n = 50(2x10 + 5)/35 = 35.7
Y así se continúa.
Para calcular la escala decilar se divide por 10 la escala percentilar.
En la tabla siguiente se muestra la escala percentilar y la decilar.
Dato
12
14
16
17
18
20
.
f
.
fa
.
faa
Esc. Per. Esc. Dci.
3
3
cero
4.29
0.429
2
5
3
11.43
1.143
2
7
5
17.14
1.714
3
10
7
24.29
2.429
5
15
10
35.7
3.57
6
21
15
51.43
5.143
21
22
23
25
27
30
4
25
21
65.7
6.57
3
28
25
75.7
7.57
3
31
28
84.3
8.43
2
33
31
91.43
9.143
1
34
33
95.7
9.57
1
35
34
98.57
9.857
 Actividad 3. Calcular las escalas percentilar y decilar para los grupos de datos
siguientes:
1. 12, 12, 12, 12, 12, 13, 13, 13, 16, 16, 16, 16, 17, 17, 17, 17, 18, 18, 18, 18, 18, 18,
19, 19, 19, 19, 19, 19, 21, 21, 21, 22, 22, 22, 22, 22, 23, 23, 23, 25, 25, 27, 27, 28, 28,
28, 29, 29, 29, 29.
2. 20, 20, 20, 20, 22, 22, 22, 22, 22, 22, 22, 25, 25, 25, 25, 25, 25, 30, 30, 30, 30, 30,
35, 35, 35, 35, 35, 35, 35, 40, 40, 40, 40, 40, 40, 42, 42, 42, 42, 45, 45, 45, 50, 50, 50,
50, 52, 52, 50, 50, 50, 52, 52, 52, 52, 54, 54, 54, 54.
5. Introducción a las medidas de dispersión.
Como su nombre lo indica, las medidas de dispersión son parámetros que nos indican
qué tan dispersos están los datos. Cuantos más dispersos estén, mayor será el valor
de la medida.
Consideremos las series siguientes.
a. 10, 10, 10, 10.
b. 2, 5, 6, 7, 9, 13.
c. 1, 7. 8, 14, 20
En la serie a, la dispersión es cero; y la serie c es la más dispersa. De hecho, para la
serie a la desviación típica, que es una medida de dispersión, es CERO.
Las medidas de dispersión tienen su importancia. El caso siguiente ilustrará esta
importancia.
Se tienen 2 empresas. La empresa A paga un salario promedio de $265; mientras que
la empresa B paga un salario promedio de $240. A juzgar por la media aritmética (el
promedio), podría afirmarse que los empleados de la empresa A están mejor
económicamente. Pero No es cierto que los de A están mejor que los de B.
Analicemos los salarios de cada empleado por empresa.
Salarios de los empleados de la empresa A.
174
180
173
190
200
183
500
220
450
175
185
550
225
290
215
235
240
255
Salarios de los empleados de la empresa B.
220
210
200
230
310
250
Podemos observar que en la empresa A hay salarios muy bajos: el más bajo es $173.
En cambio en la empresa B, el salario más bajo es de $210. Definitivamente que en B
se tienen los mejores salarios individuales. Lo que ocurre es que en A, los salarios son
más heterogéneos; es decir, están más dispersos. En cambio en B, los salarios son
más homogéneos; es decir, menos dispersos.
En conclusión: la media aritmética no es el parámetro adecuado para estimar el
bienestar económico de los empleados. En cambio, el grado de dispersión de los
salarios sí nos aproxima de mejor manera al estado económico individual de cada
empleado.
Descargar