EJERCICIOS DE ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL 1. Se realiza un estudio en una ciudad sobre la capacidad hotelera y se obtienen los siguientes resultados: Plazas [L i − L i +1 ) 0 ‐ 10 10 ‐ 30 30 ‐ 60 60 ‐ 100 Número de Hoteles ni 25 50 55 20 a) Representar gráficamente esta distribución de frecuencias mediante un histograma. b) ¿Cuál es la proporción de hoteles que disponen de entre 11 y 60 plazas? c) ¿Cuántos hoteles tienen treinta o menos plazas? d) ¿cuál es la proporción de hoteles que disponen de entre 15 y 50 plazas?. ¿Qué hipótesis hace para este último cálculo? Solución: a) Intervalos [L i − L i +1 ) 0 ‐ 10 10 ‐ 30 30 ‐ 60 60 ‐ 100 Fr. Amplitud absoluta ci ni 25 50 55 20 150 Marca clase xi Fr. absoluta acumulada Ni 5 20 45 80 25 75 130 150 10 20 30 40 100 Fr. absoluta Densidad relativa n di = i Ni Fi = ci N 0,17 0,17 2,5 0,33 0,50 2,5 70% 0,37 0,87 1,83 0,13 1 0,5 1 Fr. relativa n fi = i N b) El 70% de los hoteles disponen entre 11 y 60 plazas: f2 + f3 = 0,7 (70%) , o bien % = n2 + n3 50 + 55 105 = = = 0,7 N 150 150 c) Los hoteles que tienen treinta o menos plazas: N2 = 75 1 d) Proporción de hoteles que disponen entre 15 y 50 plazas: Entre 15 y 30: 30 − 10 30 − 15 20 15 = = 6 6 x = 37,5 hoteles 50 x 50 x Entre 30 y 50: 60 − 30 50 − 30 30 20 = = 6 6 x = 36,67 hoteles 55 x 55 x El número de hoteles entre 15 y 50 plazas hay 37,5 + 36,67 = 74 ,17 hoteles 74 ,17 La proporción de hoteles con estas plazas: % hoteles = . 100 = 49,44% 150 En el cálculo realizado se supone que la distribución de hoteles es uniforme, es decir, se supone que hay el mismo número de hoteles con 31 plazas, con 32 plazas, etc. ⎡ n⎤ En cada caso, este número es la densidad ⎢di = i ⎥ de frecuencia correspondiente. ci ⎦ ⎣ 2. Se ha realizado un estudio entre 100 mujeres mayores de 15 años, observándose el número de hijos de las mismas. El resultado ha sido: Número de hijos (x i ) 0 1 2 3 4 5 6 Número de mujeres (ni ) 13 20 25 20 11 7 4 a) Calcular el número medio de hijos, la mediana y la moda. b) Calcular los cuartiles. Explicar su significado. c) ¿Cuál es el número máximo de hijos que tiene el 70% de las mujeres que menos hijos tienen? d) Calcular la desviación típica y coeficiente de variación de Pearson. e) Analizar la forma de la distribución calculando los coeficientes correspondientes. Solución: a) fi = ni Ni 0 1 2 3 4 5 6 13 20 25 20 11 7 4 100 13 33 58 78 89 96 100 70 50 25 xi ni N 0,13 0,20 0,25 0,20 0,11 0,07 0,04 1,0 Fi = Ni N 0,13 0,33 0,58 0,78 0,89 0,96 1 x i ni (x i − x ) (x i − x) 2 (x i − x ) 2 ni (xi − x) 3 ni (x i − x ) 4 ni 0 20 50 60 44 35 24 233 ‐2,33 ‐1,33 ‐0,33 0,67 1,67 2,67 3,67 5,43 1,77 0,11 0,45 2,79 7,13 13,47 70,58 35,38 2,72 8,98 30,68 49,90 53,88 252,11 ‐164,44 ‐47,05 ‐0,90 6,02 51,23 133,24 197,72 175,82 383,15 62,58 0,30 4,03 85,56 355,75 725,65 1617,01 2 7 Media aritmética: x = ∑ xi ni i=1 N = 233 = 2,33 100 Mediana: Me = 2 (pasa de la mitad 50%) Md = 2 (n3 = 25, el más grande) b) ⎡ 100 ⎤ = 25⎥ : Q 1 = 1 hijo (F2 pasa del 25%) 1º Cuartil ⎢ ⎣ 4 ⎦ ⎡ 100 ⎤ = 50⎥ : Q 2 = Me = 2 hijos (F3 pasa del 50%) 2º Cuartil ⎢ ⎣ 2 ⎦ ⎡ 100. 3 ⎤ = 75⎥ : Q 3 = 3 hijos (F4 pasa del 75%) 3º Cuartil ⎢ ⎣ 4 ⎦ c) El número máximo de hijos que tiene el 70% de las mujeres que menos hijos tienen es el decil 7 Decil 7: 3 hijos F4 pasa de 0,7) 7 d) Varianza: m2 = s 2 = ∑ [x − x ] 2 ni i=1 N Desviación típica: s = = 252,11 = 2,5211 hijos 2 100 2,5211 = 1,59 hijos Coeficiente de Variación de Pearson: C.V = S 1,59 = = 0,6824 una dispersión del 68,24% x 2,33 e) ASIMETRÍA DE LA DISTRIBUCIÓN: Coeficiente de asimetría de Fisher: 1 7 ∑ (x i − x) 3 ni 1,76 m3 N i=1 g 1 = 3 = = = 0,4378 > 0 6 Asimetría a la derecha o positiva s s3 1,59 3 Coeficiente de asimetría de Bowley: AB = Q 3 + Q 1 − 2 Me 3 + 1 − 2.2 = = 0 6 Simétrica Q 3 + Q1 3+1 APUNTAMIENTO O CURTOSIS: Coeficiente de curtosis: m g 2 = 44 − 3 = s 1 N 7 ∑ (x i − x) 4 ni i=1 s 4 = 16,17 − 3 = −0,47 < 0 6 PLATICÚRTICA 1,59 4 3 3. En la tabla se refleja la distribución del importe de las facturas (en euros) por reparación de carrocería de una muestra de 80 vehículos en un taller. Importe 0 ‐ 60 60 ‐ 80 80 ‐ 120 120 ‐ 240 Número de facturas 10 20 40 10 Se pide: a) Calcular el importe medio. ¿El valor hallado es representativo de la distribución de facturas? b) Calcular el importe mediano y el importe más frecuente. c) ¿Cuál es el importe máximo pagado por las 60 reparaciones más baratas?. d) Calcular el importe mínimo pagado por el tercio de vehículos con facturas de mayor importe. e) Grado de asimetría que representa la distribución con la mayor precisión posible. Solución: a) [L i − L i+1 ) xi ni x i .ni x2i .ni Ni 0 ‐ 60 60 ‐ 80 80 ‐ 120 120 ‐ 240 30 70 100 180 10 20 40 10 80 300 1400 4000 1800 7500 9000 98000 400000 324000 831000 10 30 40 70 80 ni N 0,13 0,25 0,50 0,13 1 fi = Ni N 0,13 0,38 0,88 1,00 Fi = ci di = 60 20 40 120 180 0,167 1 1 0,083 4 El importe medio: a1 = x = ∑ xi.ni i=1 N = 7500 = 93,75 euros 80 La representatividad queda definida por el CV (Coeficiente de Variación de Pearson): 4 a2 = ∑ x2i.ni i=1 N = 831000 = 10387,5 80 s 2 = a2 − a12 = 10387,5 − 93,752 = 1598,4375 s = 1598,4375 = 39,98 euros REPRESENTACIÓN GRÁFICA DE LA MEDIA 39,98 = 0,4264 (42,64%) 93,75 El grado de dispersión es del 42,64%. CV = 4 ni ci b) El importe mediano se encuentra en el intervalo [80 − 120) N 80 − Ni−1 − 30 40 − 30 ⎡ 80 ⎤ 2 2 c i = 80 + Mediana ⎢ = 40⎥ : Me = L i + 40 = 80 + 40 = 90 Ni − Ni−1 70 − 30 70 − 30 ⎣2 ⎦ ni F3 = 0,88 6 La Mediana pasa del 50% del número de facturas. El importe más frecuente es la moda, Md , que se encuentra en los intervalos [60 − 80 ) y [80 − 120) por ser h2 = h3 = 1 la densidad más alta. Md = L i + (d i − d i−1 ) (d i − d i−1 ) + (d i − d i+1 ) c i Moda aproximada: Md = L i + d i+1 d i−1 + d i+1 ci (1 − 0,167) 20 = 80 euros (1 − 0,167) + (1 − 1) Intervalo [60 − 80 ) : Md = 60 + Intervalo [80 − 120) : Md = 80 + (1 − 1) 40 = 80 euros (1 − 1) + (1 − 0,083) NOTA.‐ Adviértase que calculando la Moda aproximada (cuando existen intervalos de distintas amplitudes), nos encontramos ante un caso bimodal. 1 20 = 77,14 euros 0,167 + 1 Intervalo [60 − 80 ) : Md1 = 60 + Intervalo [80 − 120) : Md2 = 80 + 0,083 40 = 83,07 euros 1 + 0,083 Como los intervalos modales son contiguos podría hacerse también como un único intervalo modal de [60 − 120) . c) Importe máximo pagado por las 60 reparaciones más baratas: Haciendo 100 partes, la proporción de las 60 facturas respecto a la 80 totales: ⎧⎪ 80 ⎯ 100. 60 ⎯→ 100 = 75 Hay que calcular el tercer cuartil (o el percentil 75) 6 x= ⎨ 80 ⎪⎩ 60 ⎯ ⎯→ x 3N 3N / 4 − Ni−1 60 − 30 ⎡ 3 . N 3 . 80 ⎤ 4 40 = 110 euros [Q 3 = P75 ] c i = 80 + ⎢ 4 = 4 = 60⎥ : Q 3 = L i + N − N 70 − 30 ⎣ ⎦ i i 1 − ni d) El importe mínimo pagado por el tercio de vehículos con facturas de mayor importe: ⎧ 80 ⎯⎯ → 100 200 6 x= ≈ 67 ⎨ 3 → x ⎩ 80.2 / 3 ⎯⎯ 5 67 N 67N/100 − Ni−1 67.N 67.80 54 − 30 ⎡ ⎤ 10 = 54 : P L c 80 40 = 104 euros = + = + 67 i i ⎢ 100 ⎥ Ni − Ni−1 70 − 30 10 ⎣ ⎦ ni e) Para calcular el grado de asimetría y curtosis que presenta la distribución: xi ni xi .ni (xi − x ) (xi − x)2 . ni (xi − x)3 . ni (xi − x)4 . ni 30 70 100 180 10 20 40 10 80 300 1400 4000 1800 7500 ‐63,75 ‐23,75 6,25 86,25 40640,625 11281,25 1562,5 74390,625 127875 ‐2590839,84 ‐267929,69 9765,63 6416191,41 3567187,50 165166040,04 6363330,08 61035,16 553396508,79 724986914,06 4 a1 = x = ∑ xi.ni i=1 N = 7500 = 93,75 80 4 s 2 = ∑ (x i − x)2 . ni i=1 N = 127875 = 1598,4375 6 s = 80 4 m3 = ∑(xi − x)3. ni i=1 N 1598,4375 = 39,98 4 = 3567187,50 = 1888,70 m4 = 80 ¾ Coeficiente de asimetría de Fisher: g 1 = m3 s 3 = ∑(xi − x)4 . ni i=1 N = 724986914,06 = 9062336,43 80 1888,70 = 0,0295 ≅ 0 6 39,98 3 Asimetría positiva (pequeña asimetría hacia la derecha) ¾ Coeficiente de asimetría de Bowley: AF = Q 3 + Q 1 − 2Me 110 + 70 − 2 .90 = =0 6 Q 3 + Q1 110 + 70 Simétrica N 3N N/ 4 3N / 4 − Ni−1 − Ni−1 20 − 10 60 − 30 4 4 c i = 60 + 20 = 70 Q 3 = L i + c i = 80 + 40 = 110 Q 1 = L i + Ni − Ni−1 30 − 10 Ni − Ni−1 70 − 30 ni ni m4 9062336,43 − 3 = − 3 = 0,547 > 0 6 s4 39,98 4 distribución es LEPTOCÚRTICA (mayor apuntamiento que la distribución normal). ¾ Coeficiente de curtosis o apuntamiento: g 2 = La En consecuencia, la distribución del importe de facturas presenta una pequeña asimetría a la derecha (positiva) con un mayor apuntamiento que la distribución normal (Leptocúrtica). 6 4. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el número de empleados que hay en cada una de ellas para un estudio posterior. Las observaciones obtenidas han sido: 12 16 16 10 17 15 9 17 18 11 16 19 15 16 18 16 15 10 9 14 11 10 12 12 10 11 12 11 11 11 12 11 13 13 12 13 14 12 15 15 12 13 11 15 11 11 13 12 12 14 a) Calcular la distribución de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas. b) ¿Qué proporción de sucursales tiene más de 15 empleados? c) Diagrama de barras y diagrama acumulativo de frecuencias correspondientes. d) Agrupar en intervalos de amplitud 3 los valores de la variable, calcular su distribución de frecuencias y representar el histograma y su polígono de frecuencias acumuladas. e) Calcular la mediana y el coeficiente de asimetría de Fisher en datos agrupados en intervalos de amplitud 3. Solución: a) empleados sucursales Fr. absoluta nº empleados empleado/sucursal Fr. absoluta acumulada Fr. relativa xi ni Ni 9 10 11 12 13 14 15 16 17 18 19 2 4 10 10 5 3 6 5 2 2 1 50 2 6 16 26 31 34 40 45 47 49 50 ni N 0,04 0,08 0,20 0,20 0,10 0,06 0,12 0,1 0,04 0,04 0,02 1 fi = Fr. relativa acumulada b) Las sucursales con más de 15 empleados: n8 + n9 + n10 + n11 = 5 + 2 + 2 + 1 = 10 % sucursales con más de 15 empleados = 10 .100 = 20% 50 c) 7 Ni N 0,04 0,12 0,32 0,52 0,62 0,68 0,8 0,9 0,94 0,98 1 Fi = d) Los datos agrupados en intervalos de amplitud 3: Intervalos empleados sucursales F. absoluta nº empleados F. abs acumulada [L i − L i+1 ) xi ni Ni 8 ‐ 11 11 ‐ 14 14 ‐ 17 17 ‐ 20 9,5 12,5 15,5 18,5 6 25 14 5 50 6 31 45 50 empleado/sucursal Fr. relativa ni N 0,12 0,50 0,3 0,10 1 fi = Fr. relativa acumulada Ni N 0,12 0,62 0,90 1 Fi = amplitud ci densidad (altura) di = 3 3 3 3 12 e) Para calcular la mediana y el coeficiente de asimetría de Fisher: xi ni Ni 8 ‐ 11 11 ‐ 14 14 ‐ 17 17 ‐ 20 9,5 12,5 15,5 18,5 6 25 14 5 50 6 31 45 50 3 57 3 312,5 3 217 3 92,5 679 4 a1 = x = ∑ xi . ni i=1 N (xi − x)2 . ni x i − Me .ni xi ni ci 25 [L i − L i+1 ) 99,88 29,16 51,61 121,03 301,68 22,68 19,5 31,08 26,1 99,36 x i − x .ni (xi − x)3 .ni 24,48 27 26,88 24,6 102,96 ‐407,50 ‐31,49 99,09 595,48 255,57 4 = 679 = 13,58 s 2 = 50 ∑ (x i − x) 2 . ni i=1 N 8 = 301,68 = 6,03 6 s = 50 6,03 = 7,77 ni ci 2 8,33 4,67 1,67 N N/2 − Ni−1 25 − 6 2 3 = 13,28 Me = L i + c i = 11 + 31 − 6 Ni − Ni−1 ni ¾ El coeficiente de asimetría de Fisher: g 1 = m3 s3 4 m3 = g1 = ∑ (x i − x) 3 . ni i=1 N m3 s = 3 = 255,57 = 5,11 50 5,11 = 0,011 > 0 6 7,77 3 La distribución presenta una ligera asimetría a la derecha 5. Se ha realizado una encuesta en 30 hogares en la que se pregunta el número de individuos que conviven en el domicilio habitualmente. Las respuestas obtenidas son las siguientes: 4 6 4 2 1 3 3 3 5 3 3 2 2 1 4 8 1 3 6 5 2 3 3 4 4 7 5 2 6 3 a) Calcular la distribución de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas. b) ¿Qué proporción de hogares están compuestos por tres o menos personas? ¿Qué proporción de individuos viven en hogares de tres o menos miembros? c) Diagrama de frecuencias absolutas y diagrama de frecuencias acumuladas. d) Agrupar en intervalos de amplitud 2 los valores de la variable, calcular la distribución de frecuencias y representar con los correspondientes gráficos las frecuencias absolutas y acumuladas . Solución: a) personas hogares Fr. absoluta persona/hogar hogares Fr. absoluta acumulada xi ni xi .ni Ni 1 2 3 4 5 6 7 8 3 6 8 5 4 2 1 1 30 3 12 24 20 20 12 7 8 106 3 9 17 22 26 28 29 30 Fr. relativa ni N 0,10 0,20 0,27 0,17 0,13 0,07 0,03 0,03 1 fi = Fr. relativa acumulada Ni N 0,10 0,30 0,57 0,73 0,87 0,93 0,97 1 Fi = b) Los hogares que están compuestos por tres o menos personas: n1 + n2 + n3 = 3 + 6 + 8 = 17 % hogares con tres o menos personas = 17 .100 = 56,67% 30 9 Las personas que viven en hogares de tres o menos miembros: 3 ∑ xi .ni = x1 .n1 + x2 .n2 + x3 .n3 = 3 + 12 + 24 = 39 i=1 3 % personas que viven en hogares de tres o menos miembros: personas = ∑ xi .ni i=1 8 ∑ xi .ni = 39 = 36,8% 106 i=1 c) d) Los datos agrupados en intervalos de amplitud 2: Intervalos personas hogares F. absoluta personas F. abs acumulada [L i − L i+1 ) xi ni Ni 0 ‐ 2 2 ‐ 4 4 ‐ 6 6 ‐ 8 1 3 5 7 9 13 6 2 30 9 22 28 30 persona/hogar Fr. relativa ni N 0,30 0,43 0,20 0,07 1 fi = 10 Fr. relativa acumulada Ni N 0,30 0,73 0,93 1 Fi = amplitud ci 2 2 2 2 8 densidad (altura) di = ni ci 4,5 6,5 3 1 6. En la tabla se muestran las rentas (en miles de euros) y el número de personas que las perciben: Rentas (miles euros) [L i − L i+1 ) 3 ‐ 7 7 ‐ 13 13 ‐ 17 17 ‐ 23 23 ‐ 27 ni 12 18 24 12 12 Se quiere obtener: a) b) c) d) e) El polígono de frecuencias absolutas y el histograma. Mediana, tercer Cuartil, Moda y Media Aritmética. Coeficientes de Asimetría de Fisher. Coeficiente de Curtosis. Concentración de la renta (curva de Lorenz, Índice de Gini). Solución: a) El polígono de frecuencias absolutas y el histograma.‐ La tabla de frecuencias absolutas: xi ni Ni Amplitud ci 3 ‐ 7 7 ‐ 13 13 ‐ 17 17 ‐ 23 23 ‐ 27 5 10 15 20 25 12 18 24 12 12 12 30 Ni−1 54 Ni 66 78 4 6 4 6 4 N/2=39 Rentas [L i − L i+1 ) di = 3 3 6 2 3 ni ci di−1 di di+1 En la construcción del histograma hemos de colocar encima de cada intervalo un rectángulo cuyo área sea igual (en número) a la frecuencia absoluta de dicho intervalo, procediendo a calcular la densidad (altura) d i de cada rectángulo di = ni ci , donde c i es la longitud del intervalo b) Mediana, tercer Cuartil, Moda y Media Aritmética. N 2 Para calcular la Mediana, = 78 = 39 . La observación 39 se encuentra en el intervalo [13 ‐ 17) 2 11 N 78 − Ni−1 − 30 39 − 30 ¾ Mediana: Me = L i + 2 4 = 14 ,5 c i = 13 + 2 4 = 13 + 54 − 30 Ni − Ni−1 54 − 30 ni ¾ Tercer Cuartil: 3 . 78 = 58,5 4 La observación 58,5 se encuentra en el intervalo [17 ‐ 23) 3N / 4 3.N P − Ni−1 58,5 − 54 c i = 17 + 6 = 18,125 Q 3 = Li + 4 Ni − Ni−1 66 − 54 ni ¾ La Moda es el intervalo de máxima frecuencia. Por tanto, el intervalo modal es [13 ‐ 17). La posición exacta de la moda se calcula estableciendo una proporcionalidad entre las bases y las densidades (alturas). En nuestro caso, los intervalos tienen distinta amplitud, Md = L i + Una fórmula aproximada de la Moda cuando existen distintas amplitudes: Md = 13 + (6 − 3) 4 = 15,4 (6 − 3) + (6 − 2) Md = L i + d i+1 d i−1 + d i+1 (d i − d i−1 ) (d i − d i−1 ) + (d i − d i+1 ) ci ci Fórmula aproximada: Md = 13 + 2 4 = 14 ,6 3+2 ¾ Media Aritmética Rentas [L i − L i+1 ) 3 ‐ 7 7 ‐ 13 13 ‐ 17 17 ‐ 23 23 ‐ 27 xi ni x i .ni 5 10 15 20 25 12 18 24 12 12 60 180 360 240 300 5 5 i =1 i =1 5 x= ∑ n i = 78 ∑ xi.ni = 1140 12 ∑ x i .ni i=1 N = 1140 = 14,615 (miles de euros) 78 c) Coeficiente de Asimetría de Fisher. ⎧ A F > 0 Asimetría a la derecha o positiva m3 ⎪ El coeficiente de asimetría de Fisher: g 1 = 3 ⎨ A F = 0 Simetría s ⎪ ⎩A F < 0 Asimetría a la izquierda o negativa Sabemos que, Md = 13,428 x = 14 ,615 Rentas [L i − L i+1 ) 3 ‐ 7 7 ‐ 13 13 ‐ 17 17 ‐ 23 23 ‐ 27 xi ni x i .ni xi − x (xi − x)2 n i (xi − x)3 n i 5 10 15 20 25 12 18 24 12 12 60 180 360 240 300 ‐ 9,615 ‐ 4,615 0,385 5,385 10,385 1109,38 383,368 3,557 347,979 1294,179 ‐ 10666,676 ‐ 1769,243 1,369 1873,865 13440,046 3138,463 2879,361 5 5 i =1 i =1 ∑ n i = 78 ∑ xi.ni = 1140 ♦ Varianza, desviación típica y tercer momento respecto a la media: 5 m2 = s 2 = ∑ (x i − x)2 n i i=1 N = 3183,463 = 40,237 ⇒ s = 78 40,237 = 6,343 5 ∑ (xi − x)3 n i El tercer momento respecto a la media: m3 = i=1 El coeficiente de asimetría de Fisher: g 1 = m3 3 = s presenta una asimetría a la derecha o positiva. N = 2879,361 = 36,915 78 36,915 = 0,145 > 0 , con lo que la distribución 6,3433 d) Coeficiente de Curtosis. La curtosis de una distribución de frecuencias es el apuntamiento que presenta el polígono de m frecuencias alrededor de la media. El coeficiente de curtosis g 2 = 44 − 3 s k k m2 = s 2 = ∑ (x i − x)2 n i i=1 N y m 4 = ∑ (x i − x) 4 n i i=1 N g 2 > 0 Más apuntamiento que la normal: Leptocúrtica g 2 = 0 Igual apuntamiento que la normal: Mesocúrtica g 2 < 0 Menor apuntamiento que la normal: Platicúrtica En la distribución, conocemos: x = 14 ,615 s = 6,343 13 Rentas [L i − L i+1 ) 3 ‐ 7 7 ‐ 13 13 ‐ 17 17 ‐ 23 23 ‐ 27 xi ni x i .ni (xi − x)2 (xi − x)2 n i (xi − x)4 n i 5 10 15 20 25 12 18 24 12 12 60 180 360 240 300 92,4482 21,2982 0,1482 28,9982 107,848 1109,38 383,368 3,557 347,979 1294,179 102560,036 8165,039 0,5271 10090,747 139574,293 3138,463 260390,6421 5 5 i =1 i =1 ∑ n i = 78 ∑ xi.ni = 1140 k ∑ (xi − x)4 n i Momento de cuarto orden respecto a la media: m4 = i=1 El coeficiente de curtosis de Fisher: g 2 = N = 260390,6421 = 3338,3415 78 m4 3338,3415 −3 ⇒ − 3 = −0,9377 < 0 , con lo cual, 4 s 6,3434 la distribución presenta menor apuntamiento que la normal: Platicúrtica d) Concentración de la renta (curva de Lorenz, Índice de Gini). Realizamos la siguiente tabla: Rentas [L i − L i+1 ) xi ni Ni %pi = (N i N)100 x i .ni 3 ‐ 7 7 ‐ 13 13 ‐ 17 17 ‐ 23 23 ‐ 27 5 10 15 20 25 12 18 24 12 12 12 30 54 66 78 15,38 38,46 69,23 84,62 100 60 180 360 240 300 ∑p i = 207,69 1140 4 78 ui = xi n i acumulada 60 240 600 840 1140 % qi = % (pi − qi ) 5,26 21,05 52,63 73,68 100 4 i=1 ui 100 uk ∑ q i = 152,63 i=1 10,12 17,41 16,60 10,93 0 4 ∑(pi − qi ) = 55,06 i=1 ♦ La curva de concentración o curva de Lorenz La idea de medir el área da como resultado el llamado Índice de concentración de Gini, que se define como el área comprendida entre la diagonal y la curva de Lorenz. 14 k −1 IG = ∑ (pi − qi) k −1 ∑ qi i=1 k −1 = 1 − ki=−11 i =1 i =1 ∑ pi ∑ pi 0 ≤ IG ≤ 1 k −1 4 Índice de Gini: IG = ∑ (pi − qi ) i=1 4 ∑ pi ∑ qi 55,06 = = 0,2651 , o bien: IG = 1 − ki=−11 207,69 ∑ pi =1− 152,63 = 0,2651 207,69 i=1 i=1 Luego la renta, aunque no equidistribuida, no está muy concentrada. 7. En la tabla adjunta se expresa la distribución de rentas de determinada región (expresada en 10.000 euros). ¿Qué porcentaje de individuos percibe el 50% de la renta?. Niveles renta Número individuos 0,5 ‐ 1,5 583 1,5 ‐ 2,5 435 2,5 ‐ 3,5 194 3,5 ‐ 4,5 221 4,5 ‐ 5,5 67 Solución: ui = xi n i Nivel Renta xi Individuos ni Ni xi ni 0,5 ‐ 1,5 1,5 ‐ 2,5 1 2 583 435 583 1018 583 870 acumulada 583 1453 2,5 ‐ 3,5 3,5 ‐ 4,5 4,5 ‐ 5,5 3 4 5 194 221 67 1212 1433 1500 582 884 335 2035 2919 3254 5 ∑ni = 1500 i=1 Ni .100 N 38,87 67,87 x 80,80 95,53 100 %pi = % qi = ui .100 uk 17,92 44,65 50 62,54 89,70 100 5 ∑ xi ni = 3254 i=1 En la tabla se observa que el 67,86% de los individuos percibe el 44,65% de la renta, y el 80,8% de los individuos percibe el 62,54 % de la renta. En consecuencia, el 50% de la renta estará distribuida entre un conjunto de individuos situado entre el 67,86 y el 80,8%. Bajo la hipótesis de linealidad, se establece la relación de porcentajes: 80,80 − 67,87 x − 67,87 = ⇒ 62,54 − 44 ,65 50 − 44 ,65 12,93 x − 67,87 5,35 . 12,93 = ⇒ x = 67,87 + = 71,74 % individuos 17,89 5,35 17,89 El 50 % de la renta se reparte entre el 71,74 % de los individuos. 15 8. En la tabla adjunta refleja la distribución de salarios de una empresa Renta Individuos 500 ‐ 1000 1000 ‐ 1600 100 120 1600 ‐ 2400 90 2400 ‐ 3000 35 3000 ‐ 5000 5000 ‐ 10000 12 3 Hallar el Índice de Gini y la curva de Lorenz Solución: ui = xi n i Renta [L i − L i+1 ) xi ni Ni xi ni 500 ‐ 1000 1000 ‐ 1600 1600 ‐ 2400 2400 ‐ 3000 3000 ‐ 5000 5000 ‐ 10000 750 1300 2000 2700 4000 7500 100 120 90 35 12 3 100 220 310 345 357 360 75000 156000 180000 94500 48000 22500 acumulada 75000 231000 411000 505500 553500 576000 Ni .100 N 27,78 61,11 86,11 95,83 99,17 100 %pi = % qi = ui .100 uk 13,02 40,10 71,35 87,76 96,09 100 6 6 5 5 i=1 i=1 i=1 i =1 ∑ ni = 360 ∑ xi ni = 576000 ∑pi = 370 ∑ qi = 308,32 5 ∑ qi El índice de Gini: IG = 1 − i=51 ∑ pi =1− 308,32 = 0,167 370 i=1 La concentración es pequeña, pudiendo concluir que la distribución de salarios es equilibrada. 16 La curva de concentración o curva de Lorenz no se encuentra muy alejada de la diagonal principal, indicando que la distribución de salarios puede considerarse equilibrada. 9. Los salarios de los empleados de la cadena de producción de una empresa se distribuyen según la tabla adjunta: Salarios Nº empleados 10 ‐ 20 12000 20 ‐ 40 6000 40 ‐ 50 1000 50 ‐ 100 800 100 ‐200 200 ¿Qué porcentaje de empleados que percibe el 50% de los salarios? ¿Es equilibrada la distribución de salarios? Solución: ui = xi n i Salarios [L i − L i+1 ) xi ni Ni xi ni 10 ‐ 20 15 12000 12000 180000 acumulada 180000 20 ‐ 40 40 ‐ 50 50 ‐ 100 100 ‐ 200 30 45 75 150 6000 1000 800 200 18000 19000 19800 20000 180000 45000 60000 30000 360000 405000 465000 495000 5 ∑ni = 20000 5 4 ∑ x i ni = 495000 i=1 Ni .100 N 60 x 90 95 99 100 %pi = ∑pi = 344 i=1 i=1 % qi = ui .100 uk 36,36 50 72,73 81,82 93,94 100 4 ∑ qi = 284,85 i=1 En la tabla se observa que el 60% de los empleados percibe el 36,36% de los salarios y que el 90% de los empleados percibe el 72,73% de los salarios. Para estimar el porcentaje (x) de empleados que percibe el 50% de los salarios se necesita realizar una interpolación lineal: x − 60 90 − 60 = 50 − 36,36 72,73 − 36,36 → x − 60 90 − 60 = 13,64 36,37 17 ⇒ x = 71,25% 4 ∑ qi IG = 1 − i=41 ∑ pi =1− 284,85 = 0,17 344 i=1 La concentración es pequeña, pudiendo concluir que la distribución de salarios es equilibrada. 10. Una empresa tenía a finales del pasado año mil seiscientos cincuenta accionistas distribuidos de la siguiente forma: Número de acciones 0 ‐ 20 20 ‐ 60 60 ‐ 100 100 ‐ 500 500 ‐ 1000 Número de accionistas 1030 380 180 50 10 Se pide: a) Hallar el número medio de acciones por accionista y su desviación típica. b) ¿Cuál es el número de acciones que como máximo posee la mitad del accionariado? c) Con base estadística, comente el grado de concentración de las acciones. d) ¿Qué porcentaje del total de las acciones poseen los accionistas mayoritarios?, sabiendo que los accionistas mayoritarios son aquello que poseen más de 500 acciones. e) ¿Qué porcentaje de los accionistas minoritarios posee el 20% del total de acciones? Solución: a) Sea X = "número de acciones" [ Li − L i +1 ) 0 ‐ 20 20 ‐ 60 60 ‐ 100 100 ‐ 500 500 ‐ 1000 ci xi ni xi ni x2i ni Ni 20 40 40 400 500 10 40 80 300 750 1030 380 180 50 10 10300 15200 14400 15000 7500 103000 608000 1152000 4500000 5625000 1030 825 1410 1590 1640 1650 5 N = 1650 ∑ xi ni = 62400 i=1 18 5 ∑ x2i ni = 11988000 i =1 5 a1 = x = ∑ xi ni i=1 N = 62400 = 37,82 número medio de acciones por accionista 1650 5 a2 = ∑ x2i ni i =1 N = 11988000 = 7265,45 1650 s 2 = a2 − a12 = 7265,45 − 37,822 = 5835,09 6 s = 10570,86 = 76,39 b) El número de acciones que como máximo posee la mitad del accionariado es la Mediana 1650 N − Ni−1 −0 825. 20 20 = = 16,0194 número de acciones ci = 0 + 2 Me = L i + 2 1030 − 0 1030 Ni − Ni−1 ni c) El grado de concentración viene expresado por el Índice de Gini 0 ‐ 20 20 ‐ 60 60 ‐ 100 100 ‐ 500 500 ‐ 1000 xi 10 40 80 300 750 ni 1030 380 180 50 10 1650 Ni 1030 1410 1590 1640 1650 x i ni 62,42 85,45 96,36 99,39 100 343,64 10300 15200 14400 15000 7500 62400 %= x i .ni 5 ∑ xi .ni i =1 0,17 0,24 0,23 0,24 0,12 1 ui = xi n i acumulada 10300 25500 39900 54900 62400 % qi = ui .100 uk 16,51 40,87 63,94 87,98 100 209,3 12% [L i − L i+1 ) N % pi = i 100 N 4 ∑ qi Índice de Gini: IG = 1 − i=41 ∑ pi =1− 209,3 = 0,3909 (39, 09 %) grado de concentración 343,64 i=1 Cuanto más próximo a cero se encuentre el Índice de Gini está próximo a cero más equitativo será el reparto del número de acciones. d) Los accionistas mayoritarios (más de 500 acciones) poseen el 12% del total de las acciones: [100 − 87,98]% = 12% 19 e) El porcentaje de accionistas minoritarios que posee el 20% del total de las acciones: ui = xi n i [L i − L i +1 ) xi ni Ni x i ni 0 ‐ 20 10 1030 1030 10300 acumulada 10300 20 ‐ 60 60 ‐ 100 100 ‐ 500 500 ‐ 1000 40 80 300 750 380 180 50 10 1410 1590 1640 1650 15200 14400 15000 7500 25500 39900 54900 62400 Ni . 100 N 62,42 x 85,45 96,36 99,39 100 % pi = % qi = ui .100 uk 16,51 20 40,87 63,94 87,98 100 Basta realizar una interpolación: x − 62,42 85,45 − 62,42 x − 62,42 23,33 3,49 . 23,33 = 6 = 6 x − 62,42 = 20 − 16,51 40,87 − 16,51 3,49 24,36 24 ,36 ⇒ x = 65,762 % La curva de Lorenz presenta coherencia con el índice de Gini calculado, cuanto más próxima esté la curva a la diagonal menor será la concentración, y en consecuencia, más equitativo será el reparto del número de acciones. 11. El testamento de un hombre de negocios lega 2500 euros a su familia repartiéndose de la forma siguiente: a su cónyuge le asigna el doble que a su hijo primogénito y a éste el doble que a cada uno de sus otros dos hermanos. a) Considerando que cada heredero ha de aplicar un impuesto de sucesiones proporcional del 20%. ¿Cuáles serán los índices de Gini en los dos casos: antes de pagar los impuestos y después de haberlo Hecho? ¿Cuál de las distribuciones es más equitativa? b) Si a cada heredero se le aplicase un impuesto fijo de 125 euros, ¿cómo se vería afectado el Índice de Gini original? Solución: a) Cónyuge: 4x Primogénito: 2x Cada uno de los hijos(2): x Ordenando los datos en una tabla de menor a mayor, se tiene: 20 x = 2500 8 = 312,5 ANTES DE PAGAR IMPUESTOS xi ni Ni x i ni 312,5 625 1250 2 1 1 2 3 4 625 625 1250 2500 ui = xi n i acumulada 625 1250 2500 Ni .100 N 50 75 100 125 % qi = Ni .100 N 50 75 100 125 % qi = % pi = ui .100 uk 25 50 100 75 2 ∑ qi IG = 1 − i=21 ∑ pi =1− 75 = 0,40 125 i =1 DESPUES DEL PAGO DE LOS IMPUESTOS (20% CADA UNO): ui = xi n i x i ni xi ni Ni % pi acumulada 250 2 2 500 500 500 1 3 500 1000 1000 1 4 1000 2000 2000 = ui .100 uk 25 50 100 75 2 ∑ qi IG = 1 − i=21 ∑ pi =1− 75 = 0,40 125 i =1 Las dos distribuciones son igualmente equitativas, lo que las diferencia únicamente es un cambio de escala que ni afecta al nivel de concentración, con lo que tienen el mismo Índice de Gini. b) DESPUES DE PAGAR DE LOS IMPUESTOS (125 EUROS CADA UNO): ui = xi n i ui N x i ni xi ni Ni % pi = i .100 % qi = .100 uk N acumulada 2 2 50 187,5 375 375 18,75 1 3 75 500 500 875 43,75 1 4 100 100 1125 1125 2000 125 62,5 2000 2 ∑ qi IG = 1 − i=21 ∑pi =1− 62,5 = 0,50 125 i=1 La distribución es más concentrada, menos equitativa, el cambio de origen afecta al Índice de Gini. Quitando la misma cantidad a todos, representa una proporción mayor para los que menos reciben. 21 12. Operadores de una cadena del sector turístico por sus ventas en plazas hoteleras obtienen los siguientes incentivos mensuales en euros: Incentivos (xi) Nº operadores (ni) 100 5 200 6 500 12 1000 4 1500 3 a) Estudiar la concentración de incentivos b) La cadena turística como política comercial estudia subir a todos los operadores los incentivos: con un incremento porcentual del 10%, o bien con un aumento de 100 euros por operador. ¿Cuál de los dos estudios sería más equitativo?. c) ¿Cuál es la concentración de incentivos si el número de operadores hubiera sido el doble? Solución: a) La concentración de incentivos se analiza mediante el Índice de Gini, que no varía mediante cambios de escala (subida porcentual del 10% a los operadores) mientras que queda modificado con cambios de origen (subida lineal de 100 euros a cada operador). xi ni Ni x i ni 100 200 500 1000 1500 5 6 12 4 3 5 11 23 27 30 500 1200 6000 4000 4500 16200 ui = xi n i acumulada 500 1700 7700 11700 16200 Ni .100 N 16,67 36,67 76,67 90 100 220 % pi = % qi = ui .100 uk 3,09 10,49 47,53 72,22 100 133,33 5 ∑ qi IG = 1 − i=51 ∑ pi = 1− 133,33 = 0,394 (concentración de incentivos del 39,4%) 220 i=1 b) SUBIDA DE INCENTIVOS DEL 10% ‐ Cambio de escala en la renta x'i = 1,1. xi ni Ni x'i ni 110 220 550 1100 1650 5 6 12 4 3 5 11 23 27 30 550 1320 6600 4400 4950 17820 u'i = x'i n i acumulada 550 1870 8470 12870 17820 N % pi = i .100 N 16,67 36,67 76,67 90 100 220 % q'i u'i = ' .100 uk 3,09 10,49 47,53 72,22 100 133,33 5 ∑ q'i IG = 1 − i=51 ∑ pi = 1− 133,33 = 0,394 (concentración de incentivos del 39,4%) 220 i=1 22 Adviértase que: qi = ui ui .1,1 = = q'i uk uk .1,1 Con una subida del 10% a cada operador, la equidistribución no varía. El cambio de escala en la renta no afecta al Índice de Gini, propiedad conocida como Principio de la Renta relativa. Principio de la renta relativa.‐ El índice debe mantenerse invariante frente a las variaciones proporcionales en todas las rentas. SUBIDA LINEAL DE INCENTIVOS DE 100 EUROS ‐ Cambio de origen en la renta x'i = 100 + xi ni Ni x'i ni 200 300 600 1100 1600 5 6 12 4 3 5 11 23 27 30 1000 1800 7200 4400 4800 19200 u'i = x'i n i acumulada 1000 2800 10000 14400 19200 % pi = Ni .100 N 16,67 36,67 76,67 90 100 220 % q'i = u'i .100 uk' 5,21 14,58 52,08 75 100 146,88 5 ∑ q'i IG = 1 − i=51 ∑ pi = 1− 146,88 = 0,332 (concentración de incentivos del 33,2%) 220 i=1 Con una subida lineal de 100 euros a cada operador, la equidistribución es más equitativa. El cambio de origen en la renta afecta al Índice de Gini, propiedad conocida como Principio de Dalton. En este sentido, si la subida lineal a cada operador hubiera sido de 200 euros se obtendría una equidistribución todavía más equitativa. SUBIDA LINEAL DE INCENTIVOS DE 200 EUROS ‐ Cambio de origen en la renta x'i = 200 + xi 300 400 700 1200 1700 ni Ni x'i ni 5 6 12 4 3 30 5 11 23 27 30 1500 2400 8400 4800 5100 22200 u'i = x'i n i acumulada 1500 3900 12300 17100 22200 N % pi = i .100 N 16,67 36,67 76,67 90 100 220 % q'i u'i = ' .100 uk 6,76 17,57 55,41 77,03 100 156,76 5 ∑ q'i IG = 1 − i=51 ∑ pi =1− 156,76 = 0,287 (concentración de incentivos del 28,7%) 220 i=1 23 Con una subida lineal de 200 euros a cada operador, la equidistribución resulta más equitativa. Por el contrario, si la cadena del sector turístico hubiera decidido incentivar menos a sus operadores, con una rebaja de 50 euros a cada operador, se tendría una equidistribución menos equitativa. REBAJA LINEAL DE INCENTIVOS DE 50 EUROS ‐ Cambio de origen en la renta x'i = xi − 50 ni Ni x'i ni 50 150 450 950 1450 5 6 12 4 3 30 5 11 23 27 30 250 900 5400 3800 4350 14700 u'i = x'i n i acumulada 250 1150 6550 10350 14700 % pi = Ni .100 N 16,67 36,67 76,67 90,00 100 220 % q'i = u'i .100 uk' 1,70 7,82 44,56 70,41 100 124,49 5 ∑ q'i IG = 1 − i=51 ∑pi =1− 124,49 = 0,434 (concentración de incentivos del 43,4%) 220 i=1 Con una rebaja lineal de 50 euros a cada operador, la equidistribución resulta menos equitativa. Principio de Dalton.‐ Toda transferencia de renta de un individuo a otro más rico ha de aumentar el valor de la desigualdad, y recíprocamente toda transferencia de renta de un individuo a otro más pobre ha de reducir el índice, siempre que la ordenación relativa de los individuos se mantenga. c) La concentración de incentivos si el número de operadores hubiera sido el doble: SUBIDA LINEAL DE LA POBLACIÓN ‐ Cambio de escala en la población xi n'i = 2 ni N'i xi n'i 100 200 500 1000 1500 10 12 24 8 6 60 10 22 46 54 60 1000 2400 12000 8000 9000 32400 u'i = xi n'i acumulada 1000 3400 15400 23400 32400 %p'i = N'i .100 N 16,67 36,67 76,67 90 100 220 % q'i = u'i .100 uk' 3,09 10,49 47,53 72,22 100 133,33 5 ∑ q'i IG = 1 − i=51 ∑ p'i =1− 133,33 = 0,394 (concentración de incentivos del 39,4%) 220 i =1 El cambio de escala en la población no afecta al Índice de Gini, propiedad conocida como Principio de la población. 24 Principio de la población.‐ Si se multiplica por un mismo escalar el tamaño de todos los conjuntos de individuos con la misma renta, el valor del índice no debe variar. Es decir, el tamaño de la población no importa, lo que interesa son las proporciones de individuos de la población que perciben diferentes niveles de renta. Señalar que en todo análisis de concentración debe imperar el Principio del anonimato Principio de anonimato.‐ Si se produce una modificación en una distribución de renta consistente en que dos individuos intercambien sus rentas, el valor del índice no debe variar. 13. La tabla refleja los ingresos (millones de euros) por quintiles del turismo en España Quintiles Primero Segundo Tercero Cuarto Quinto Turismo 2010 2,1 4,9 8,9 16,8 67,3 Turismo 2011 2 6,3 11,6 20,3 59,8 Calcular los índices de Gini y la curva de Lorenz. Solución: INGRESO TURISMO 2010 INGRESO TURISMO 2011 ui ui acumulada %pi u % qi = i .100 uk 2,1 4,9 8,9 16,8 67,3 2,1 7 15,9 32,7 100 20 40 60 80 100 200 2,10 7 15,9 32,7 100 57,7 ui ui acumulada %pi 2 6,3 11,6 20,3 59,8 2 8,3 19,9 40,2 100 20 40 60 80 100 200 % qi = ui .100 uk 2 8,3 19,9 40,2 100 70,4 5 ∑ qi IG (2010) = 1 − i=51 ∑ pi =1− 57,7 = 0,7115 (concentración de ingresos en 2010 es del 71,15%) 200 =1− 70,4 = 0,648 (concentración de ingresos en 2011 es del 64,8%) 200 i=1 5 ∑ qi IG (2011) = 1 − i=51 ∑ pi i=1 La obtención de ingresos por turismo es más equitativa en 2011, si bien presentan un alto grado de desigualdad. 25 14. La Conserjería de Turismo concedió sesenta ayudas para ayuda de fachadas de los hoteles históricos de cierta Comunidad. El criterio de reparto se basó en el grado de deterioro de los mismos, resultando que el 20% de las subvenciones otorgadas fueron de 300.000 euros, el 15% de 120.000 euros, el 10% de 90.000 euros, el 5% de 60.000 euros, y el resto de 24.000 euros. Analizar el grado de concentración en el reparto de las ayudas y representarlo gráficamente. Solución: xi ni Ni x i ni 24000 60000 90000 120000 300000 10 5 10 15 20 60 10 15 25 40 60 240000 300000 900000 1800000 6000000 9240000 ui = xi n i acumulada 240000 540000 1440000 3240000 9240000 Ni .100 N 16,67 25 41,67 66,67 100 150 % pi = % qi = ui .100 uk 2,60 5,84 15,58 35,06 100 59,09 5 ∑ qi IG = 1 − i=51 ∑pi =1− 59,09 = 0,606 (la concentración de ayudas es del 60,6%) 150 i=1 26 15. En la tabla adjunta se muestran los datos relativos al número de contratos registrados en las oficinas del INEM en el mes de marzo de 2006 en las tres comunidades autónomas con mayor volumen de contratación en dicho mes. Andalucía 370153 Almería 26283 Valenciana 154962 Alicante 50776 Cataluña 246860 Barcelona 189126 Cádiz 46611 Córdoba 41987 Huelva 39194 Granada 37729 Jaén 26779 Málaga 63673 Sevilla 87897 Castellón Valencia 18123 86063 Girona 21174 Lleida 12001 Tarragona 24559 Con el coeficiente de Theil, determinar la desigualdad entre Comunidades y la desigualdad motivada entre las provincias dentro de cada Comunidad. Solución: Provincias Almería Granada Málaga Cádiz Huelva Sevilla Córdoba Jaén Barcelona Tarragona Lleida Girona Valencia Castellón Alicante Contratos xi 26283 37729 63673 46611 39194 87897 41987 26779 189126 24559 12001 21174 86063 18123 50776 ni x i . ni pi = xi k Ln pi p i . ni . Ln p i ‐3,3800 ‐3,0185 ‐2,4952 ‐2,8071 ‐2,9804 ‐2,1728 ‐2,9116 ‐3,3613 ‐1,4065 ‐3,4479 ‐4,1640 ‐3,5962 ‐2,1939 ‐3,7518 ‐2,7215 ‐0,1151 ‐0,1475 ‐0,2058 ‐0,1695 ‐0,1513 ‐0,2474 ‐0,1584 ‐0,1166 ‐0,3446 ‐0,1097 ‐0,0647 ‐0,0986 ‐0,2446 ‐0,0881 ‐0,1790 ‐2,4409 ∑ xi .ni i=1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 15 26283 37729 63673 46611 39194 87897 41987 26779 189126 24559 12001 21174 86063 18123 50776 771975 0,0340 0,0489 0,0825 0,0604 0,0508 0,1139 0,0544 0,0347 0,2450 0,0318 0,0155 0,0274 0,1115 0,0235 0,0658 1 15 H15 (pi ) = −∑ pi .ni. Ln (pi ) = 2,4409 Ln (15) = 2,708 i=1 Índice de Theil : T = Ln 15 − H15 (pi ) = 2,708 − 2,4409 = 0,2671 Índice relativo de Theil: T = T 0,2671 = = 0,0986 (desigualdad del 9,86% por provincias) Ln N 2,708 Se realiza un análisis desagregado con los datos de las tres Comunidades: 27 Andalucía Contratos ( xi .ni ) pg = ∈G i xi pi = 15 ∑ xi .ni 26283 37729 63673 46611 39194 87897 41987 26779 370153 8 ∑ xi .ni Ln pi pi .ni . Ln pi ‐2,6450 ‐2,2835 ‐1,7602 ‐2,0721 ‐2,2454 ‐1,4378 ‐2,1766 ‐2,6263 ‐0,1878 ‐0,2328 ‐0,3028 ‐0,2609 ‐0,2378 ‐0,3414 ‐0,2469 ‐0,1900 ‐2,0003 i=1 i=1 Almería Granada Málaga Cádiz Huelva Sevilla Córdoba Jaén xi 0,0340 0,0489 0,0825 0,0604 0,0508 0,1139 0,0544 0,0347 0,4796 0,0710 0,1019 0,1720 0,1259 0,1059 0,2375 0,1134 0,0723 N 8 g ⎡1 ⎤ NAnd =8 TAnd = Ln Ng + ∑ pi . Ln ⎢ ⎥ ⎯⎯ ⎯ ⎯→ TAnd = Ln NAnd + ∑ pi . Ln pi = Ln8 − 2,0003 = 0,0791 ⎣ pi ⎦ i=1 i=1 TAnd = TAnd 0,0791 = = 0,0380 (desigualdad relativa del 3,80%) Ln 8 2,0794 Cataluña Contratos ( xi .ni ) pg = ∈G i xi pi = 15 ∑ xi .ni 189126 24559 12001 21174 246860 4 ∑ xi .ni Ln pi pi .ni . Ln pi ‐0,2664 ‐2,3077 ‐3,0238 ‐2,4560 ‐0,2041 ‐0,2296 ‐0,1470 ‐0,2107 ‐0,7914 i=1 i=1 Barcelona Tarragona Lleida Girona xi 0,2450 0,0318 0,0155 0,0274 0,3198 0,7661 0,0995 0,0486 0,0858 N 4 g ⎡1 ⎤ N =4 TCat = Ln Ng + ∑ pi . Ln ⎢ ⎥ ⎯⎯ Cat ⎯⎯→ TCat = Ln NCat + ∑pi . Ln pi = Ln 4 − 0,7914 = 0,5949 ⎣ pi ⎦ i=1 i=1 TCat = TCat 0,5949 = = 0,4291 (desigualdad relativa del 42,91%) Ln 4 1,3863 Contratos Valenciana ( xi .ni ) pg = ∈G i xi pi = 15 ∑ xi .ni 86063 18123 50776 154962 ∑ xi .ni Ln pi pi .ni . Ln pi ‐0,5881 ‐2,1460 ‐1,1158 ‐0,3266 ‐0,2510 ‐0,3656 ‐0,9432 i=1 i=1 Valencia Castellón Alicante xi 3 0,1115 0,0235 0,0658 0,2007 0,5554 0,1170 0,3277 28 Ng 3 ⎡1 ⎤ NVal =3 TVal = Ln Ng + ∑ pi . Ln ⎢ ⎥ ⎯⎯ ⎯ ⎯→ TVal = Ln NVal + ∑pi . Ln pi = Ln3 − 0,9432 = 0,1554 ⎣ pi ⎦ i=1 i=1 TVal = TVal 0,1554 = = 0,1414 (desigualdad relativa del 14,14%) Ln 3 1,0987 Desigualdad INTERGRUPOS (entre grupos): Ln N + ⎡p ⎤ k 3 ⎡p ⎤ ⎡ 0,4796 ⎤ ⎡ 0,3198 ⎤ + (0,3198). Ln ⎢ + ⎥ 8 ⎦ ⎣ 4 ⎥⎦ ∑ pg . Ln ⎢ Ng ⎥ ≡ Ln N + ∑ pg . Ln ⎢ Ng ⎥ = Ln 15 + (0,4796). Ln ⎢⎣ ⎣⎢ g =1 ⎥ g⎦ g =1 ⎣⎢ ⎥ g⎦ ⎡ 0,2007 ⎤ + (0,2007). Ln ⎢ = 2,7080 − 1,3497 − 0,8079 − 0,5428 = 0,0077 ⎣ 3 ⎥⎦ Desigualdad INTRAGRUPOS (dentro de los grupos): k ∑ g =1 3 pg . Tg ≡ ∑ pg . Tg = (0,4796).(0,0791) + (0,3198).(0,5949) + (0,2007).(0,1554) = 0,2594 g =1 De este modo, el coeficiente de Theil: T = Ln N + ⎡p ⎤ ∑ pg . Ln ⎢ Ng ⎥ + g =1 ⎣⎢ g ⎥⎦ 3 En términos relativos: 3 ∑ pg . Tg = 0,0077 + 0,2594 = 0,2671 g =1 T 0,0077 0,2594 = + = 0,0288 + 0,9712 = 1 0,2671 0,2671 0,2671 De la desigualdad existente en las Comunidades autónomas, el 2,88% es consecuencia a la desigualdad entre las Comunidades, mientras que el 97,12% es motivada por la desigualdad entre las distintas provincias dentro de cada Comunidad. A la hora de tomar medidas para disminuir la desigualdad, se actuaría en esta dirección, tratando de limar las diferencias entre las distintas provincias por Comunidad, siendo Cataluña la Comunidad que mayor desigualdad presenta (42,91%). La desigualdad de contratos registrados por provincias de las tres Comunidades españolas es del 9,86%. 29 16. En la tabla adjunta se presenta información de las Comunidades Autónomas sobre su Valor Añadido Bruto (VAB) y la población para el año 2010. Estudiar la asociación entre el VAB y la Población, utilizando el coeficiente de correlación de Spearman. VAB (millones euros) Comunidades Autónomas Población yi xi Andalucía Aragón Asturias Baleares Canarias Cantabria Castilla ‐ León Castilla ‐ La Mancha Cataluña Comunidad Valenciana Extremadura Galicia Madrid Murcia Navarra País Vasco Rioja 23812,729 5991,549 5934,400 4141,366 6406,031 2587,535 11129,996 6534,323 34286,050 18049,573 3201,259 11411,347 27429,922 4229,997 2895,297 12824,227 1450,286 7881146 1453907 1369918 799465 1677039 625144 3131363 2001241 7237487 4455308 1294448 3420077 5736581 1171537 619670 2601414 310367 Solución: C. Autónomas Andalucía Aragón Asturias Baleares Canarias Cantabria Castilla ‐ León Castilla ‐ La Mancha Cataluña Comunidad Valenciana Extremadura Galicia Madrid Murcia Navarra País Vasco Rioja xi yi R(x i ) R(y i ) di = R(x i ) − R(y i ) 23812,729 7881146 15 17 ‐2 5991,549 1453907 8 8 0 5934,400 1369918 7 7 0 4141,366 799465 5 4 1 6406,031 1677039 9 9 0 2587,535 625144 2 3 ‐1 11129,996 3131363 11 12 ‐1 6534,323 2001241 10 10 0 34286,050 7237487 17 16 1 18049,573 4455308 14 14 0 3201,259 1294448 4 6 ‐2 11411,347 3420077 12 13 ‐1 27429,922 5736581 16 15 1 4229,997 1171537 6 5 1 2895,297 619670 3 2 1 12824,227 2601414 13 11 2 1450,286 310367 1 1 0 EXCEL: JERARQUIA(A1;A$1:A$17;1) ‐ JERARQUIA(B1;B$1:B$17;1) 30 d2i 4 0 0 1 0 1 1 0 1 0 4 1 1 1 1 4 0 20 17 rs = 1 − 6. ∑ d2i i=1 n . (n − 1).(n + 1) = 1− 6.20 = 0,975 − 1 ≤ rs ≤ 1 17.16.18 El coeficiente de correlación de Spearman es alto (próximo a 1), indicando una buena asociación de tipo discreto entre ambas variables (VAB, Población), es decir, las más altas puntuaciones en una de las variables correspondieron a las más altas puntuaciones en la otra y, complementariamente, las más bajas puntuaciones en una variable correspondieron a las más bajas puntuaciones de la otra. H0 : rs = 0 ⎧ Hipótesis nula : Se plantean las hipótesis ⎨ Se rechaza H0 si rs ≥ rcrítico Hipótesis alternativ a : H : r 0 ≠ a s ⎩ En las Comunidades autónomas (n = 17) , el valor calculado de rs = 0,975 , con un nivel de confianza del 95% (p‐valor=0,05), es superior al valor crítico de rcrítico = 0,412 ( rs = 0,975 > rcrítico = 0,412 ), rechazando la hipótesis nula y concluyendo que existe asociación directa entre el VAB y la densidad de la población. 31 EXCEL: FRECUENCIAS DATOS AGRUPADOS En la tabla se muestran las rentas (en miles de euros) y el número de personas que las perciben: nº empleados xi nº sucursales ni 9 2 10 4 11 10 12 10 13 5 14 3 15 6 16 5 17 2 18 2 19 1 DIAGRAMA DE ESCALERA (FRECUENCIAS ABSOLUTAS ACUMULADAS ≡ Ni): En Agregar Serie se introduce en Valores (categoría Y) la columna de la frecuencia absoluta acumulada Ni y en Rótulos del eje de categoría (X) la columna de los distintos datos xi Se abre un cuadro de diálogo con diferentes opciones: Títulos, Eje, Líneas de división, Rótulos de datos y Tabla de datos. 32 DIAGRAMA DE BARRAS (FRECUENCIAS ABSOLUTAS ≡ ni): En Agregar Serie se introduce en Valores (categoría Y) la columna de la frecuencia absoluta ni y en Rótulos del eje de categoría (X) la columna de los distintos datos xi 33 Se abre un cuadro de diálogo con diferentes opciones: Títulos, Eje, Líneas de división, Rótulos de datos y Tabla de datos. 34 EXCEL: FRECUENCIAS DATOS AGRUPADOS EN INTERVALOS POLÍGONO DE FRECUENCIAS ACUMULADAS: En Agregar Serie se introduce en Valores (categoría Y) la columna de la frecuencia absoluta acumulada Ni y en Rótulos del eje de categoría (X) la columna de los distintos datos Li+1 (límite superior del intervalo) Se abre un cuadro de diálogo con diferentes opciones: Títulos, Eje, Líneas de división, Rótulos de datos y Tabla de datos. 35 EXCEL: HISTOGRAMA En la tabla se muestran las rentas (en miles de euros) y el número de personas que las perciben: Intervalos [Li ‐ Li+1) Fr. absoluta ni 0 ‐ 6 12 6 ‐ 10 16 10 ‐ 15 15 15 ‐ 21 12 21‐ 30 9 MÉTODO 1: Seleccionar la columna densidad di Gráficos/Columnas pulsar Siguiente> Se abre un cuadro de diálogo con diferentes opciones: Títulos, Eje, Líneas de división, Rótulos de datos y Tabla de datos. 36 En el eje Y aparece la dispersión del histograma pero en el eje X no aparecen los intervalos. Para ello, en el área de trazado se hace clic con el botón derecho. Se agrega una Serie2 introduciendo en Valores (eje Y) los datos de la densidad di (J4:J8) y en Rótulos del eje de categorías (X) los intervalos. 37 MÉTODO 2: 38 39 EXCEL: CURVA DE LORENZ La tabla adjunta muestra el capital social de un banco a finales de año. Número acciones Número accionistas 0 ‐ 50 20.135 50 ‐ 100 3.456 100 ‐ 200 2.035 200 ‐ 1000 1.480 > 1000 756 Sabiendo que la marca de clase del último intervalo es 7552, se pide: a) Determinar el número medio de acciones que poseía cada accionista b) ¿Cómo se encuentra repartido el capital social entre los accionistas?. Solución.‐ a) Se forma la tabla: n Li L i +1 xi Ni x i ni Ui = ∑ x i ni 20135 23591 25626 27106 27862 503375 259200 305250 888000 5709312 7665137 503375 762575 1067825 1955825 7665137 ni 0 50 25 20135 50 100 75 3456 100 200 150 2035 200 1000 600 1480 > 1000 7552 756 27862 i=1 pi = Ni 100 N 72,267 84,671 91,975 97,287 100,000 qi = Ui 100 Un 6,567 9,949 13,931 25,516 100,000 pi − qi 65,700 74,722 78,044 71,771 0,000 290,237 5 El número medio de acciones será: x = ∑ x i ni 7665137 i=1 N = 27862 = 275,11 acciones/accionista b) El índice de concentración de Gini analiza en qué medida está repartido el capital social entre los accionistas del banco: 4 IG = ∑ (pi − qi ) 290,237 i=1 4 ∑ pi = 346,199 = 0,84 i=1 El índice de Gini es elevado, está más próximo a 1 que a 0, lo que indica que existe una fuerte concentración del capital social en unos pocos accionistas. En consecuencia, el número medio de acciones/accionista no es significativo. Excel: Para representar la curva de Lorenz resulta necesario insertar una fila donde (pi, qi) tengan un recorrido del 0 al 100% . 40 MÉTODO 1: Para representar la bisectriz del cuadrado se introduce una nueva serie, recta que pasa por los puntos (0, 0) y (100, 100). En el menú Insertar/Gráfico, se teclea XY(Dispersión), subtipo de gráfico Dispersión con puntos de datos conectados por líneas. Pinchar Siguiente>. Se introducen los datos, seleccionando la pestaña Serie, pinchar Agregar serie y rellenar el campo de Valores de X (eje de abscisas, datos pi , rango H47:H52) y Valores de Y (eje ordenadas, datos qi , rango I47:I52). Después, hay que agregar una nueva serie que sirve para dibujar la bisectriz. Para ello, se pincha nuevamente en Agregar serie, completando el campo Valores de X (con el rango C56:C57) y el campo de Valores de Y con el rango (D56:D57), señalar que como el contenido de ambos rangos es idéntico se podría eliminar uno de ellos (por ejemplo, C56:C57), hacer clic en Siguiente> 41 Aparece el cuadro de diálogo donde se puede especificar, entre otros, el Título del Gráfico, el Título de valores (X) y el título de valores (Y). La opción Líneas de división se puede dejar sin marcar nada. Pinchar Terminar NOTA.‐ Cuando aparecen series de datos para comparar (Empresa A y Empresa B) y se desea representar las curvas, hay que seguir los pasos anteriores y cuando se van a agregar las series hay que agregar tantas series como tengamos (en el ejemplo, dos series) y una más con los datos para representar la bisectriz. En caso de tener una serie representada (por ejemplo, la empresa A) y se desea añadir otra, entonces se sitúa el puntero del ratón sobre el área de gráfico (zona sobre la que se colocan los títulos) de la representación y se pulsa el botón derecho del ratón, apareciendo el menú adjunto a la derecha. Señalar que, lo mismo sucede, situando el ratón sobre la bisectriz, o curva de Lorenz. Se hace clic en Datos de origen, desplegándose la pantalla de abajo, a falta de incluir datos al ejercicio tratado. Al pinchar en la pestaña Serie se despliega la segunda ventana de abajo, donde se puede añadir otra nueva serie de datos. Excel 42 MÉTODO 2: En el menú Insertar/Gráfico se elige Líneas (con marcadores en cada valor de datos)/Serie, se pulsa Agregar y en Valores se introduce los datos de qi (eje de ordenadas, rango I47:I52) y en Rótulos del eje de categorías (X) los datos de pi (eje de abscisas, rango H47:H52) Haciendo clic en Siguiente> aparece un cuadro de diálogo donde se puede especificar: Títulos (Título del gráfico, eje de categorías X, eje de categorías Y), Eje, Líneas de división (principales y secundarias de los ejes), Leyenda, Rótulos de datos, Tabla de datos ‐ sólo hay que ir probando y se observa el efecto del gráfico ‐. Clic en Siguiente> ofrece la opción donde se desea guardar el gráfico. Haciendo clic con el botón derecho del ratón se pueden elegir distintas opciones: 43 Se coloca el ratón sobre los ejes (Eje de categorías) y se hace clic con el botón derecho para su diseño. Se pueden elegir distintas opciones: Tramas, Escala, Fuente, Número y Alineación. Análogamente con el eje Y (categoría Y) 44 Para trazar la diagonal principal: Dibujo/Autoformas/Línea Para hacer las líneas o marcadores más gruesos, cambiar de color, estilo, etc., basta situar el ratón sobre las líneas (Formato serie de datos o de autoformas) y pulsar el botón derecho. 45 Excel