EJERCICIOS ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL

Anuncio
EJERCICIOS DE ESTADÍSTICA DESCRIPTIVA UNIDIMENSIONAL
1. Se realiza un estudio en una ciudad sobre la capacidad hotelera y se obtienen los siguientes
resultados:
Plazas
[L i − L i +1 )
0 ‐ 10
10 ‐ 30
30 ‐ 60
60 ‐ 100
Número de Hoteles
ni
25
50
55
20
a) Representar gráficamente esta distribución de frecuencias mediante un histograma.
b) ¿Cuál es la proporción de hoteles que disponen de entre 11 y 60 plazas?
c) ¿Cuántos hoteles tienen treinta o menos plazas?
d) ¿cuál es la proporción de hoteles que disponen de entre 15 y 50 plazas?. ¿Qué hipótesis hace para
este último cálculo?
Solución:
a)
Intervalos
[L i − L i +1 )
0 ‐ 10
10 ‐ 30
30 ‐ 60
60 ‐ 100
Fr.
Amplitud
absoluta
ci
ni
25
50
55
20
150
Marca
clase
xi
Fr. absoluta
acumulada
Ni
5
20
45
80
25
75
130
150
10
20
30
40
100
Fr. absoluta Densidad
relativa
n
di = i
Ni
Fi =
ci
N
0,17
0,17
2,5
0,33
0,50
2,5
70%
0,37
0,87
1,83
0,13
1
0,5
1
Fr. relativa
n
fi = i
N
b) El 70% de los hoteles disponen entre 11 y 60 plazas:
f2 + f3 = 0,7 (70%) , o bien % =
n2 + n3 50 + 55 105
=
=
= 0,7
N
150
150
c) Los hoteles que tienen treinta o menos plazas: N2 = 75
1
d) Proporción de hoteles que disponen entre 15 y 50 plazas:
Entre 15 y 30: 30 − 10 30 − 15
20 15
=
=
6
6 x = 37,5 hoteles
50
x
50 x
Entre 30 y 50: 60 − 30 50 − 30
30 20
=
=
6
6 x = 36,67 hoteles
55
x
55 x
El número de hoteles entre 15 y 50 plazas hay 37,5 + 36,67 = 74 ,17 hoteles
74 ,17
La proporción de hoteles con estas plazas: % hoteles =
. 100 = 49,44%
150
En el cálculo realizado se supone que la distribución de hoteles es uniforme, es decir, se supone que
hay el mismo número de hoteles con 31 plazas, con 32 plazas, etc.
⎡
n⎤
En cada caso, este número es la densidad ⎢di = i ⎥ de frecuencia correspondiente.
ci ⎦
⎣
2. Se ha realizado un estudio entre 100 mujeres mayores de 15 años, observándose el número de
hijos de las mismas. El resultado ha sido:
Número de hijos (x i )
0
1
2
3
4
5
6
Número de mujeres (ni )
13
20
25
20
11
7
4
a) Calcular el número medio de hijos, la mediana y la moda.
b) Calcular los cuartiles. Explicar su significado.
c) ¿Cuál es el número máximo de hijos que tiene el 70% de las mujeres que menos hijos tienen?
d) Calcular la desviación típica y coeficiente de variación de Pearson.
e) Analizar la forma de la distribución calculando los coeficientes correspondientes.
Solución:
a)
fi =
ni
Ni
0
1
2
3
4
5
6
13
20
25
20
11
7
4
100
13
33
58
78
89
96
100
70 50 25
xi
ni
N
0,13
0,20
0,25
0,20
0,11
0,07
0,04
1,0
Fi =
Ni
N
0,13
0,33
0,58
0,78
0,89
0,96
1
x i ni
(x i − x )
(x i − x) 2
(x i − x ) 2 ni
(xi − x) 3 ni
(x i − x ) 4 ni
0
20
50
60
44
35
24
233
‐2,33
‐1,33
‐0,33
0,67
1,67
2,67
3,67
5,43
1,77
0,11
0,45
2,79
7,13
13,47
70,58
35,38
2,72
8,98
30,68
49,90
53,88
252,11
‐164,44
‐47,05
‐0,90
6,02
51,23
133,24
197,72
175,82
383,15
62,58
0,30
4,03
85,56
355,75
725,65
1617,01
2
7
Media aritmética: x =
∑ xi ni
i=1
N
=
233
= 2,33
100
Mediana: Me = 2 (pasa de la mitad 50%) Md = 2 (n3 = 25, el más grande)
b)
⎡ 100
⎤
= 25⎥ : Q 1 = 1 hijo (F2 pasa del 25%)
1º Cuartil ⎢
⎣ 4
⎦
⎡ 100
⎤
= 50⎥ : Q 2 = Me = 2 hijos (F3 pasa del 50%)
2º Cuartil ⎢
⎣ 2
⎦
⎡ 100. 3
⎤
= 75⎥ : Q 3 = 3 hijos (F4 pasa del 75%)
3º Cuartil ⎢
⎣ 4
⎦
c) El número máximo de hijos que tiene el 70% de las mujeres que menos hijos tienen es el decil 7
Decil 7: 3 hijos F4 pasa de 0,7)
7
d) Varianza: m2 = s 2 =
∑ [x − x ] 2 ni
i=1
N
Desviación típica: s =
=
252,11
= 2,5211 hijos 2
100
2,5211 = 1,59 hijos
Coeficiente de Variación de Pearson: C.V =
S 1,59
=
= 0,6824 una dispersión del 68,24%
x 2,33
e) ASIMETRÍA DE LA DISTRIBUCIÓN:
ƒ
Coeficiente de asimetría de Fisher:
1 7
∑ (x i − x) 3 ni 1,76
m3 N i=1
g 1 = 3 =
=
= 0,4378 > 0 6 Asimetría a la derecha o positiva
s
s3
1,59 3
ƒ
Coeficiente de asimetría de Bowley:
AB =
Q 3 + Q 1 − 2 Me 3 + 1 − 2.2
=
= 0 6 Simétrica
Q 3 + Q1
3+1
APUNTAMIENTO O CURTOSIS:
ƒ
Coeficiente de curtosis:
m
g 2 = 44 − 3 =
s
1
N
7
∑ (x i − x) 4 ni
i=1
s
4
=
16,17
− 3 = −0,47 < 0 6 PLATICÚRTICA
1,59 4
3
3. En la tabla se refleja la distribución del importe de las facturas (en euros) por reparación de
carrocería de una muestra de 80 vehículos en un taller.
Importe
0 ‐ 60
60 ‐ 80
80 ‐ 120
120 ‐ 240
Número de facturas
10
20
40
10
Se pide:
a) Calcular el importe medio. ¿El valor hallado es representativo de la distribución de facturas?
b) Calcular el importe mediano y el importe más frecuente.
c) ¿Cuál es el importe máximo pagado por las 60 reparaciones más baratas?.
d) Calcular el importe mínimo pagado por el tercio de vehículos con facturas de mayor importe.
e) Grado de asimetría que representa la distribución con la mayor precisión posible.
Solución:
a)
[L i − L i+1 )
xi
ni
x i .ni
x2i .ni
Ni
0 ‐ 60
60 ‐ 80
80 ‐ 120
120 ‐ 240
30
70
100
180
10
20
40
10
80
300
1400
4000
1800
7500
9000
98000
400000
324000
831000
10
30 40
70
80
ni
N
0,13
0,25
0,50
0,13
1
fi =
Ni
N
0,13
0,38
0,88
1,00
Fi =
ci
di =
60
20
40
120
180
0,167
1
1
0,083
4
El importe medio: a1 = x =
∑ xi.ni
i=1
N
=
7500
= 93,75 euros
80
La representatividad queda definida por el CV (Coeficiente de Variación de Pearson):
4
a2 =
∑ x2i.ni
i=1
N
=
831000
= 10387,5
80
s 2 = a2 − a12 = 10387,5 − 93,752 = 1598,4375 s =
1598,4375 = 39,98 euros
REPRESENTACIÓN GRÁFICA DE LA MEDIA
39,98
= 0,4264 (42,64%)
93,75
El grado de dispersión es del 42,64%.
CV =
4
ni
ci
b) El importe mediano se encuentra en el intervalo [80 − 120)
N
80
− Ni−1
− 30
40 − 30
⎡ 80
⎤
2
2
c i = 80 +
Mediana ⎢ = 40⎥ : Me = L i +
40 = 80 +
40 = 90
Ni − Ni−1
70 − 30
70 − 30
⎣2
⎦
ni
F3 = 0,88 6
‰
La Mediana pasa del 50% del número de facturas.
El importe más frecuente es la moda, Md , que se encuentra en los intervalos [60 − 80 ) y
[80 − 120) por ser h2 = h3 = 1 la densidad más alta.
Md = L i +
(d i − d i−1 )
(d i − d i−1 ) + (d i − d i+1 )
c i Moda aproximada: Md = L i +
d i+1
d i−1 + d i+1
ci
(1 − 0,167)
20 = 80 euros
(1 − 0,167) + (1 − 1)
ƒ
Intervalo [60 − 80 ) : Md = 60 +
ƒ
Intervalo [80 − 120) : Md = 80 +
(1 − 1)
40 = 80 euros
(1 − 1) + (1 − 0,083)
NOTA.‐ Adviértase que calculando la Moda aproximada (cuando existen intervalos de distintas
amplitudes), nos encontramos ante un caso bimodal.
1
20 = 77,14 euros
0,167 + 1
ƒ
Intervalo [60 − 80 ) : Md1 = 60 +
ƒ
Intervalo [80 − 120) : Md2 = 80 +
0,083
40 = 83,07 euros
1 + 0,083
Como los intervalos modales son contiguos podría hacerse también como un único intervalo modal de
[60 − 120) .
c) Importe máximo pagado por las 60 reparaciones más baratas: Haciendo 100 partes, la proporción
de las 60 facturas respecto a la 80 totales:
⎧⎪ 80 ⎯
100. 60
⎯→ 100
= 75 Hay que calcular el tercer cuartil (o el percentil 75)
6 x=
⎨
80
⎪⎩ 60 ⎯
⎯→ x
3N
3N / 4
− Ni−1
60 − 30
⎡ 3 . N 3 . 80
⎤
4
40 = 110 euros [Q 3 = P75 ]
c i = 80 +
⎢ 4 = 4 = 60⎥ : Q 3 = L i + N − N
70 − 30
⎣
⎦
i
i
1
−
ni
d) El importe mínimo pagado por el tercio de vehículos con facturas de mayor importe:
⎧ 80
⎯⎯
→ 100
200
6 x=
≈ 67
⎨
3
→ x
⎩ 80.2 / 3 ⎯⎯
5
67 N
67N/100
− Ni−1
67.N
67.80
54 − 30
⎡
⎤
10
=
54
:
P
L
c
80
40 = 104 euros
=
+
=
+
67
i
i
⎢ 100
⎥
Ni − Ni−1
70 − 30
10
⎣
⎦
ni
e) Para calcular el grado de asimetría y curtosis que presenta la distribución:
xi
ni
xi .ni
(xi − x )
(xi − x)2 . ni
(xi − x)3 . ni
(xi − x)4 . ni
30
70
100
180
10
20
40
10
80
300
1400
4000
1800
7500
‐63,75
‐23,75
6,25
86,25
40640,625
11281,25
1562,5
74390,625
127875
‐2590839,84
‐267929,69
9765,63
6416191,41
3567187,50
165166040,04
6363330,08
61035,16
553396508,79
724986914,06
4
a1 = x =
∑ xi.ni
i=1
N
=
7500
= 93,75
80
4
s 2 =
∑ (x i − x)2 . ni
i=1
N
=
127875
= 1598,4375 6 s =
80
4
m3 =
∑(xi − x)3. ni
i=1
N
1598,4375 = 39,98
4
=
3567187,50
= 1888,70 m4 =
80
¾ Coeficiente de asimetría de Fisher: g 1 =
m3
s
3
=
∑(xi − x)4 . ni
i=1
N
=
724986914,06
= 9062336,43
80
1888,70
= 0,0295 ≅ 0 6
39,98 3
Asimetría positiva
(pequeña asimetría hacia la derecha)
¾ Coeficiente de asimetría de Bowley: AF =
Q 3 + Q 1 − 2Me 110 + 70 − 2 .90
=
=0 6
Q 3 + Q1
110 + 70
Simétrica
N
3N
N/ 4
3N / 4
− Ni−1
− Ni−1
20 − 10
60 − 30
4
4
c i = 60 +
20 = 70 Q 3 = L i +
c i = 80 +
40 = 110
Q 1 = L i +
Ni − Ni−1
30 − 10
Ni − Ni−1
70 − 30
ni
ni
m4
9062336,43
−
3
=
− 3 = 0,547 > 0 6
s4
39,98 4
distribución es LEPTOCÚRTICA (mayor apuntamiento que la distribución normal).
¾ Coeficiente de curtosis o apuntamiento: g 2 =
La
En consecuencia, la distribución del importe de facturas presenta una pequeña asimetría a la derecha
(positiva) con un mayor apuntamiento que la distribución normal (Leptocúrtica).
6
4. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el número
de empleados que hay en cada una de ellas para un estudio posterior. Las observaciones obtenidas
han sido:
12
16
16
10
17
15
9
17
18
11
16
19
15
16
18
16
15
10
9
14
11
10
12
12
10
11
12
11
11
11
12
11
13
13
12
13
14
12
15
15
12
13
11
15
11
11
13
12
12
14
a) Calcular la distribución de frecuencias de la variable obteniendo las frecuencias absolutas, relativas
y sus correspondientes acumuladas.
b) ¿Qué proporción de sucursales tiene más de 15 empleados?
c) Diagrama de barras y diagrama acumulativo de frecuencias correspondientes.
d) Agrupar en intervalos de amplitud 3 los valores de la variable, calcular su distribución de
frecuencias y representar el histograma y su polígono de frecuencias acumuladas.
e) Calcular la mediana y el coeficiente de asimetría de Fisher en datos agrupados en intervalos de
amplitud 3.
Solución:
a)
empleados
sucursales
Fr. absoluta
nº empleados
empleado/sucursal
Fr. absoluta acumulada
Fr. relativa
xi
ni
Ni
9
10
11
12
13
14
15
16
17
18
19
2
4
10
10
5
3
6
5
2
2
1
50
2
6
16
26
31
34
40
45
47
49
50
ni
N
0,04
0,08
0,20
0,20
0,10
0,06
0,12
0,1
0,04
0,04
0,02
1
fi =
Fr. relativa acumulada
b) Las sucursales con más de 15 empleados: n8 + n9 + n10 + n11 = 5 + 2 + 2 + 1 = 10
% sucursales con más de 15 empleados =
10
.100 = 20%
50
c)
7
Ni
N
0,04
0,12
0,32
0,52
0,62
0,68
0,8
0,9
0,94
0,98
1
Fi =
d) Los datos agrupados en intervalos de amplitud 3:
Intervalos empleados
sucursales
F. absoluta
nº empleados
F. abs acumulada
[L i − L i+1 )
xi
ni
Ni
8 ‐ 11
11 ‐ 14
14 ‐ 17
17 ‐ 20
9,5
12,5
15,5
18,5
6
25
14
5
50
6
31
45
50
empleado/sucursal
Fr. relativa
ni
N
0,12
0,50
0,3
0,10
1
fi =
Fr. relativa
acumulada
Ni
N
0,12
0,62
0,90
1
Fi =
amplitud
ci
densidad
(altura)
di =
3
3
3
3
12
e) Para calcular la mediana y el coeficiente de asimetría de Fisher:
xi
ni
Ni
8 ‐ 11
11 ‐ 14
14 ‐ 17
17 ‐ 20
9,5
12,5
15,5
18,5
6
25
14
5
50
6
31
45
50
3
57
3 312,5
3 217
3 92,5
679
4
a1 = x =
∑ xi . ni
i=1
N
(xi − x)2 . ni x i − Me .ni
xi ni
ci
25
[L i − L i+1 )
99,88
29,16
51,61
121,03
301,68
22,68
19,5
31,08
26,1
99,36
x i − x .ni
(xi − x)3 .ni
24,48
27
26,88
24,6
102,96
‐407,50
‐31,49
99,09
595,48
255,57
4
=
679
= 13,58 s 2 =
50
∑ (x i − x) 2 . ni
i=1
N
8
=
301,68
= 6,03 6 s =
50
6,03 = 7,77
ni
ci
2
8,33
4,67
1,67
N
N/2
− Ni−1
25 − 6
2
3 = 13,28
Me = L i +
c i = 11 +
31 − 6
Ni − Ni−1
ni
¾ El coeficiente de asimetría de Fisher: g 1 =
m3
s3
4
m3 =
g1 =
∑ (x i − x) 3 . ni
i=1
N
m3
s
=
3
=
255,57
= 5,11
50
5,11
= 0,011 > 0 6
7,77 3
La distribución presenta una ligera asimetría a la derecha
5. Se ha realizado una encuesta en 30 hogares en la que se pregunta el número de individuos que
conviven en el domicilio habitualmente. Las respuestas obtenidas son las siguientes:
4
6
4
2
1
3
3
3
5
3
3
2
2
1
4
8
1
3
6
5
2
3
3
4
4
7
5
2
6
3
a) Calcular la distribución de frecuencias de la variable obteniendo las frecuencias absolutas, relativas
y sus correspondientes acumuladas.
b) ¿Qué proporción de hogares están compuestos por tres o menos personas? ¿Qué proporción de
individuos viven en hogares de tres o menos miembros?
c) Diagrama de frecuencias absolutas y diagrama de frecuencias acumuladas.
d) Agrupar en intervalos de amplitud 2 los valores de la variable, calcular la distribución de
frecuencias y representar con los correspondientes gráficos las frecuencias absolutas y acumuladas .
Solución:
a)
personas
hogares
Fr. absoluta
persona/hogar
hogares
Fr. absoluta acumulada
xi
ni
xi .ni
Ni
1
2
3
4
5
6
7
8
3
6
8
5
4
2
1
1
30
3
12
24
20
20
12
7
8
106
3
9
17
22
26
28
29
30
Fr. relativa
ni
N
0,10
0,20
0,27
0,17
0,13
0,07
0,03
0,03
1
fi =
Fr. relativa acumulada
Ni
N
0,10
0,30
0,57
0,73
0,87
0,93
0,97
1
Fi =
b) Los hogares que están compuestos por tres o menos personas: n1 + n2 + n3 = 3 + 6 + 8 = 17
% hogares con tres o menos personas =
17
.100 = 56,67%
30
9
Las personas que viven en hogares de
tres o menos miembros:
3
∑ xi .ni = x1 .n1 + x2 .n2 + x3 .n3 = 3 + 12 + 24 = 39
i=1
3
% personas que viven en hogares de tres o menos miembros: personas =
∑ xi .ni
i=1
8
∑ xi .ni
=
39
= 36,8%
106
i=1
c)
d) Los datos agrupados en intervalos de amplitud 2:
Intervalos
personas
hogares
F. absoluta
personas
F. abs acumulada
[L i − L i+1 )
xi
ni
Ni
0 ‐ 2
2 ‐ 4
4 ‐ 6
6 ‐ 8
1
3
5
7
9
13
6
2
30
9
22
28
30
persona/hogar
Fr. relativa
ni
N
0,30
0,43
0,20
0,07
1
fi =
10
Fr. relativa
acumulada
Ni
N
0,30
0,73
0,93
1
Fi =
amplitud
ci
2
2
2
2
8
densidad
(altura)
di =
ni
ci
4,5
6,5
3
1
6. En la tabla se muestran las rentas (en miles de euros) y el número de personas que las perciben:
Rentas (miles euros)
[L i − L i+1 )
3 ‐ 7
7 ‐ 13
13 ‐ 17
17 ‐ 23
23 ‐ 27
ni
12
18
24
12
12
Se quiere obtener:
a)
b)
c)
d)
e)
El polígono de frecuencias absolutas y el histograma.
Mediana, tercer Cuartil, Moda y Media Aritmética.
Coeficientes de Asimetría de Fisher.
Coeficiente de Curtosis.
Concentración de la renta (curva de Lorenz, Índice de Gini).
Solución:
a) El polígono de frecuencias absolutas y el histograma.‐ La tabla de frecuencias absolutas:
xi
ni
Ni
Amplitud
ci
3 ‐ 7
7 ‐ 13
13 ‐ 17
17 ‐ 23
23 ‐ 27
5
10
15
20
25
12
18
24
12
12
12
30 Ni−1
54 Ni
66
78
4
6
4
6
4
N/2=39
Rentas
[L i − L i+1 )
di =
3
3
6
2
3
ni
ci
di−1
di
di+1
En la construcción del histograma
hemos de colocar encima de cada
intervalo un rectángulo cuyo área sea
igual (en número) a la frecuencia
absoluta de dicho intervalo,
procediendo a calcular la densidad
(altura) d i de cada rectángulo
di =
ni
ci
, donde c i es la longitud del
intervalo
b) Mediana, tercer Cuartil, Moda y Media Aritmética.
N
2
Para calcular la Mediana, =
78
= 39 . La observación 39 se encuentra en el intervalo [13 ‐ 17)
2
11
N
78
− Ni−1
− 30
39 − 30
¾ Mediana: Me = L i + 2
4 = 14 ,5
c i = 13 + 2
4 = 13 +
54 − 30
Ni − Ni−1
54 − 30
ni
¾ Tercer Cuartil: 3 . 78
= 58,5
4
La observación 58,5 se encuentra en el intervalo [17 ‐ 23)
3N / 4
3.N
P
− Ni−1
58,5 − 54
c i = 17 +
6 = 18,125
Q 3 = Li + 4
Ni − Ni−1
66 − 54
ni
¾ La Moda es el intervalo de máxima frecuencia. Por tanto, el intervalo modal es [13 ‐ 17).
La posición exacta de la moda se calcula estableciendo una proporcionalidad entre las bases y las
densidades (alturas).
En nuestro caso, los intervalos tienen distinta amplitud, Md = L i +
Una fórmula aproximada de la Moda
cuando existen distintas amplitudes:
Md = 13 +
(6 − 3)
4 = 15,4
(6 − 3) + (6 − 2)
Md = L i +
d i+1
d i−1 + d i+1
(d i − d i−1 )
(d i − d i−1 ) + (d i − d i+1 )
ci
ci
Fórmula aproximada: Md = 13 +
2
4 = 14 ,6
3+2
¾ Media Aritmética
Rentas
[L i − L i+1 )
3 ‐ 7
7 ‐ 13
13 ‐ 17
17 ‐ 23
23 ‐ 27
xi
ni
x i .ni
5
10
15
20
25
12
18
24
12
12
60
180
360
240
300
5
5
i =1
i =1
5
x=
∑ n i = 78 ∑ xi.ni = 1140
12
∑ x i .ni
i=1
N
=
1140
= 14,615 (miles de euros)
78
c) Coeficiente de Asimetría de Fisher.
⎧ A F > 0 Asimetría a la derecha o positiva
m3 ⎪
El coeficiente de asimetría de Fisher: g 1 = 3 ⎨ A F = 0 Simetría
s ⎪
⎩A F < 0 Asimetría a la izquierda o negativa
Sabemos que, Md = 13,428 x = 14 ,615
Rentas
[L i − L i+1 )
3 ‐ 7
7 ‐ 13
13 ‐ 17
17 ‐ 23
23 ‐ 27
xi
ni
x i .ni
xi − x
(xi − x)2 n i
(xi − x)3 n i
5
10
15
20
25
12
18
24
12
12
60
180
360
240
300
‐ 9,615
‐ 4,615
0,385
5,385
10,385
1109,38
383,368
3,557
347,979
1294,179
‐ 10666,676
‐ 1769,243
1,369
1873,865
13440,046
3138,463
2879,361
5
5
i =1
i =1
∑ n i = 78 ∑ xi.ni = 1140
♦ Varianza, desviación típica y tercer momento respecto a la media:
5
m2 = s 2 =
∑ (x i − x)2 n i
i=1
N
=
3183,463
= 40,237 ⇒ s =
78
40,237 = 6,343
5
∑ (xi − x)3 n i
El tercer momento respecto a la media: m3 = i=1
El coeficiente de asimetría de Fisher: g 1 =
m3
3
=
s
presenta una asimetría a la derecha o positiva.
N
=
2879,361
= 36,915
78
36,915
= 0,145 > 0 , con lo que la distribución
6,3433
d) Coeficiente de Curtosis.
La curtosis de una distribución de frecuencias es el apuntamiento que presenta el polígono de
m
frecuencias alrededor de la media. El coeficiente de curtosis g 2 = 44 − 3
s
k
k
m2 = s 2 =
∑ (x i − x)2 n i
i=1
N
y m 4 =
∑ (x i − x) 4 n i
i=1
N
ƒ g 2 > 0 Más apuntamiento que la normal: Leptocúrtica
ƒ g 2 = 0 Igual apuntamiento que la normal: Mesocúrtica
ƒ g 2 < 0 Menor apuntamiento que la normal: Platicúrtica
En la distribución, conocemos: x = 14 ,615 s = 6,343
13
Rentas
[L i − L i+1 )
3 ‐ 7
7 ‐ 13
13 ‐ 17
17 ‐ 23
23 ‐ 27
xi
ni
x i .ni
(xi − x)2
(xi − x)2 n i
(xi − x)4 n i
5
10
15
20
25
12
18
24
12
12
60
180
360
240
300
92,4482
21,2982
0,1482
28,9982
107,848
1109,38
383,368
3,557
347,979
1294,179
102560,036
8165,039
0,5271
10090,747
139574,293
3138,463
260390,6421
5
5
i =1
i =1
∑ n i = 78 ∑ xi.ni = 1140
k
∑ (xi − x)4 n i
Momento de cuarto orden respecto a la media: m4 = i=1
El coeficiente de curtosis de Fisher: g 2 =
N
=
260390,6421
= 3338,3415
78
m4
3338,3415
−3 ⇒
− 3 = −0,9377 < 0 , con lo cual,
4
s
6,3434
la distribución presenta menor apuntamiento que la normal: Platicúrtica
d) Concentración de la renta (curva de Lorenz, Índice de Gini).
Realizamos la siguiente tabla:
Rentas
[L i − L i+1 )
xi
ni
Ni
%pi = (N i N)100
x i .ni
3 ‐ 7
7 ‐ 13
13 ‐ 17
17 ‐ 23
23 ‐ 27
5
10
15
20
25
12
18
24
12
12
12
30
54
66
78
15,38
38,46
69,23
84,62
100
60
180
360
240
300
∑p i = 207,69
1140
4
78
ui = xi n i
acumulada
60
240
600
840
1140
% qi =
% (pi − qi )
5,26
21,05
52,63
73,68
100
4
i=1
ui
100
uk
∑ q i = 152,63
i=1
10,12
17,41
16,60
10,93
0
4
∑(pi − qi ) = 55,06
i=1
♦ La curva de concentración o curva de Lorenz
La idea de medir el área da como resultado el llamado Índice de concentración de Gini, que se define
como el área comprendida entre la diagonal y la curva de Lorenz.
14
k −1
IG =
∑ (pi − qi)
k −1
∑ qi
i=1
k −1
= 1 − ki=−11
i =1
i =1
∑ pi
∑ pi
0 ≤ IG ≤ 1
k −1
4
Índice de Gini: IG =
∑ (pi − qi )
i=1
4
∑ pi
∑ qi
55,06
=
= 0,2651 , o bien: IG = 1 − ki=−11
207,69
∑ pi
=1−
152,63
= 0,2651
207,69
i=1
i=1
Luego la renta, aunque no equidistribuida, no está muy concentrada.
7. En la tabla adjunta se expresa la distribución de rentas de determinada región (expresada en
10.000 euros). ¿Qué porcentaje de individuos percibe el 50% de la renta?.
Niveles renta
Número individuos
0,5 ‐ 1,5
583
1,5 ‐ 2,5
435
2,5 ‐ 3,5
194
3,5 ‐ 4,5
221
4,5 ‐ 5,5
67
Solución:
ui = xi n i
Nivel
Renta
xi
Individuos
ni
Ni
xi ni
0,5 ‐ 1,5
1,5 ‐ 2,5
1
2
583
435
583
1018
583
870
acumulada
583
1453
2,5 ‐ 3,5
3,5 ‐ 4,5
4,5 ‐ 5,5
3
4
5
194
221
67
1212
1433
1500
582
884
335
2035
2919
3254
5
∑ni = 1500
i=1
Ni
.100
N
38,87
67,87
x
80,80
95,53
100
%pi =
% qi =
ui
.100
uk
17,92
44,65
50
62,54
89,70
100
5
∑ xi ni = 3254
i=1
En la tabla se observa que el 67,86% de los individuos percibe el 44,65% de la renta, y el 80,8% de los
individuos percibe el 62,54 % de la renta. En consecuencia, el 50% de la renta estará distribuida entre
un conjunto de individuos situado entre el 67,86 y el 80,8%.
Bajo la hipótesis de linealidad, se establece la relación de porcentajes:
80,80 − 67,87
x − 67,87
=
⇒
62,54 − 44 ,65
50 − 44 ,65
12,93
x − 67,87
5,35 . 12,93
=
⇒ x = 67,87 +
= 71,74 % individuos
17,89
5,35
17,89
El 50 % de la renta se reparte entre el 71,74 % de los individuos.
15
8. En la tabla adjunta refleja la distribución de salarios de una empresa
Renta
Individuos
500 ‐ 1000 1000 ‐ 1600
100
120
1600 ‐ 2400
90
2400 ‐ 3000
35
3000 ‐ 5000 5000 ‐ 10000
12
3
Hallar el Índice de Gini y la curva de Lorenz
Solución:
ui = xi n i
Renta
[L i − L i+1 )
xi
ni
Ni
xi ni
500 ‐ 1000
1000 ‐ 1600
1600 ‐ 2400
2400 ‐ 3000
3000 ‐ 5000
5000 ‐ 10000
750
1300
2000
2700
4000
7500
100
120
90
35
12
3
100
220
310
345
357
360
75000
156000
180000
94500
48000
22500
acumulada
75000
231000
411000
505500
553500
576000
Ni
.100
N
27,78
61,11
86,11
95,83
99,17
100
%pi =
% qi =
ui
.100
uk
13,02
40,10
71,35
87,76
96,09
100
6
6
5
5
i=1
i=1
i=1
i =1
∑ ni = 360 ∑ xi ni = 576000 ∑pi = 370 ∑ qi = 308,32
5
∑ qi
El índice de Gini: IG = 1 − i=51
∑ pi
=1−
308,32
= 0,167
370
i=1
La concentración es pequeña, pudiendo concluir que la distribución de salarios es equilibrada.
16
La curva de concentración o curva de Lorenz no se encuentra muy alejada de la diagonal principal,
indicando que la distribución de salarios puede considerarse equilibrada.
9. Los salarios de los empleados de la cadena de producción de una empresa se distribuyen según la
tabla adjunta:
Salarios
Nº empleados
10 ‐ 20
12000
20 ‐ 40
6000
40 ‐ 50
1000
50 ‐ 100
800
100 ‐200
200
¿Qué porcentaje de empleados que percibe el 50% de los salarios? ¿Es equilibrada la distribución de
salarios?
Solución:
ui = xi n i
Salarios
[L i − L i+1 )
xi
ni
Ni
xi ni
10 ‐ 20
15
12000
12000
180000
acumulada
180000
20 ‐ 40
40 ‐ 50
50 ‐ 100
100 ‐ 200
30
45
75
150
6000
1000
800
200
18000
19000
19800
20000
180000
45000
60000
30000
360000
405000
465000
495000
5
∑ni = 20000
5
4
∑ x i ni = 495000
i=1
Ni
.100
N
60
x
90
95
99
100
%pi =
∑pi = 344
i=1
i=1
% qi =
ui
.100
uk
36,36
50
72,73
81,82
93,94
100
4
∑ qi = 284,85
i=1
En la tabla se observa que el 60% de los empleados percibe el 36,36% de los salarios y que el 90%
de los empleados percibe el 72,73% de los salarios. Para estimar el porcentaje (x) de empleados que
percibe el 50% de los salarios se necesita realizar una interpolación lineal:
x − 60
90 − 60
=
50 − 36,36
72,73 − 36,36
→
x − 60
90 − 60
=
13,64
36,37
17
⇒
x = 71,25%
4
∑ qi
IG = 1 − i=41
∑ pi
=1−
284,85
= 0,17
344
i=1
La concentración es pequeña, pudiendo concluir que la distribución de salarios es equilibrada.
10. Una empresa tenía a finales del pasado año mil seiscientos cincuenta accionistas distribuidos de
la siguiente forma:
Número de acciones
0 ‐ 20
20 ‐ 60
60 ‐ 100
100 ‐ 500
500 ‐ 1000
Número de accionistas
1030
380
180
50
10
Se pide:
a) Hallar el número medio de acciones por accionista y su desviación típica.
b) ¿Cuál es el número de acciones que como máximo posee la mitad del accionariado?
c) Con base estadística, comente el grado de concentración de las acciones.
d) ¿Qué porcentaje del total de las acciones poseen los accionistas mayoritarios?, sabiendo que los
accionistas mayoritarios son aquello que poseen más de 500 acciones.
e) ¿Qué porcentaje de los accionistas minoritarios posee el 20% del total de acciones?
Solución:
a) Sea X = "número de acciones"
[ Li
− L i +1 )
0 ‐ 20
20 ‐ 60
60 ‐ 100
100 ‐ 500
500 ‐ 1000
ci
xi
ni
xi ni
x2i ni
Ni
20
40
40
400
500
10
40
80
300
750
1030
380
180
50
10
10300
15200
14400
15000
7500
103000
608000
1152000
4500000
5625000
1030 825
1410
1590
1640
1650
5
N = 1650
∑ xi ni = 62400
i=1
18
5
∑ x2i ni = 11988000
i =1
5
a1 = x =
∑ xi ni
i=1
N
=
62400
= 37,82 número medio de acciones por accionista
1650
5
a2 =
∑ x2i ni
i =1
N
=
11988000
= 7265,45
1650
s 2 = a2 − a12 = 7265,45 − 37,822 = 5835,09 6 s =
10570,86 = 76,39
b) El número de acciones que como máximo posee la mitad del accionariado es la Mediana
1650
N
− Ni−1
−0
825. 20
20 =
= 16,0194 número de acciones
ci = 0 + 2
Me = L i + 2
1030 − 0
1030
Ni − Ni−1
ni
c) El grado de concentración viene expresado por el Índice de Gini
0 ‐ 20
20 ‐ 60
60 ‐ 100
100 ‐ 500
500 ‐ 1000
xi
10
40
80
300
750
ni
1030
380
180
50
10
1650
Ni
1030
1410
1590
1640
1650
x i ni
62,42
85,45
96,36
99,39
100
343,64
10300
15200
14400
15000
7500
62400
%=
x i .ni
5
∑ xi .ni
i =1
0,17
0,24
0,23
0,24
0,12
1
ui = xi n i
acumulada
10300
25500
39900
54900
62400
% qi =
ui
.100
uk
16,51
40,87
63,94
87,98
100
209,3
12%
[L i − L i+1 )
N
% pi = i 100
N
4
∑ qi
Índice de Gini: IG = 1 − i=41
∑ pi
=1−
209,3
= 0,3909 (39, 09 %) grado de concentración
343,64
i=1
Cuanto más próximo a cero se encuentre el Índice de Gini está próximo a cero más equitativo será el
reparto del número de acciones.
d) Los accionistas mayoritarios (más de 500 acciones) poseen el 12% del total de las acciones:
[100 − 87,98]% = 12%
19
e) El porcentaje de accionistas minoritarios que posee el 20% del total de las acciones:
ui = xi n i
[L i − L i +1 )
xi
ni
Ni
x i ni
0 ‐ 20
10
1030
1030
10300
acumulada
10300
20 ‐ 60
60 ‐ 100
100 ‐ 500
500 ‐ 1000
40
80
300
750
380
180
50
10
1410
1590
1640
1650
15200
14400
15000
7500
25500
39900
54900
62400
Ni
. 100
N
62,42
x
85,45
96,36
99,39
100
% pi =
% qi =
ui
.100
uk
16,51
20
40,87
63,94
87,98
100
Basta realizar una interpolación:
x − 62,42 85,45 − 62,42
x − 62,42 23,33
3,49 . 23,33
=
6
=
6 x − 62,42 =
20 − 16,51 40,87 − 16,51
3,49
24,36
24 ,36
⇒ x = 65,762 %
La curva de Lorenz presenta coherencia con el índice de Gini calculado, cuanto más próxima esté la
curva a la diagonal menor será la concentración, y en consecuencia, más equitativo será el reparto
del número de acciones.
11. El testamento de un hombre de negocios lega 2500 euros a su familia repartiéndose de la forma
siguiente: a su cónyuge le asigna el doble que a su hijo primogénito y a éste el doble que a cada uno
de sus otros dos hermanos.
a) Considerando que cada heredero ha de aplicar un impuesto de sucesiones proporcional del 20%.
¿Cuáles serán los índices de Gini en los dos casos: antes de pagar los impuestos y después de haberlo
Hecho? ¿Cuál de las distribuciones es más equitativa?
b) Si a cada heredero se le aplicase un impuesto fijo de 125 euros, ¿cómo se vería afectado el Índice
de Gini original?
Solución:
a)
Cónyuge: 4x
Primogénito: 2x
Cada uno de los hijos(2): x
Ordenando los datos en una tabla de menor a mayor, se tiene:
20
x = 2500 8 = 312,5
ANTES DE PAGAR IMPUESTOS
xi
ni
Ni
x i ni
312,5
625
1250
2
1
1
2
3
4
625
625
1250
2500
ui = xi n i
acumulada
625
1250
2500
Ni
.100
N
50
75
100
125
% qi =
Ni
.100
N
50
75
100
125
% qi =
% pi =
ui
.100
uk
25
50
100
75
2
∑ qi
IG = 1 − i=21
∑ pi
=1−
75
= 0,40
125
i =1
DESPUES DEL PAGO DE LOS IMPUESTOS (20% CADA UNO):
ui = xi n i
x i ni
xi
ni
Ni
% pi
acumulada
250
2
2
500
500
500
1
3
500
1000
1000
1
4
1000
2000
2000
=
ui
.100
uk
25
50
100
75
2
∑ qi
IG = 1 − i=21
∑ pi
=1−
75
= 0,40
125
i =1
Las dos distribuciones son igualmente equitativas, lo que las diferencia únicamente es un cambio de
escala que ni afecta al nivel de concentración, con lo que tienen el mismo Índice de Gini.
b)
DESPUES DE PAGAR DE LOS IMPUESTOS (125 EUROS CADA UNO):
ui = xi n i
ui
N
x i ni
xi
ni
Ni
% pi = i .100 % qi = .100
uk
N
acumulada
2
2
50
187,5
375
375
18,75
1
3
75
500
500
875
43,75
1
4
100
100
1125
1125
2000
125
62,5
2000
2
∑ qi
IG = 1 − i=21
∑pi
=1−
62,5
= 0,50
125
i=1
La distribución es más concentrada, menos equitativa, el cambio de origen afecta al Índice de Gini.
Quitando la misma cantidad a todos, representa una proporción mayor para los que menos reciben.
21
12. Operadores de una cadena del sector turístico por sus ventas en plazas hoteleras obtienen los
siguientes incentivos mensuales en euros:
Incentivos (xi)
Nº operadores (ni)
100
5
200
6
500
12
1000
4
1500
3
a) Estudiar la concentración de incentivos
b) La cadena turística como política comercial estudia subir a todos los operadores los incentivos:
con un incremento porcentual del 10%, o bien con un aumento de 100 euros por operador.
¿Cuál de los dos estudios sería más equitativo?.
c) ¿Cuál es la concentración de incentivos si el número de operadores hubiera sido el doble?
Solución:
a) La concentración de incentivos se analiza mediante el Índice de Gini, que no varía mediante
cambios de escala (subida porcentual del 10% a los operadores) mientras que queda modificado con
cambios de origen (subida lineal de 100 euros a cada operador).
xi
ni
Ni
x i ni
100
200
500
1000
1500
5
6
12
4
3
5
11
23
27
30
500
1200
6000
4000
4500
16200
ui = xi n i
acumulada
500
1700
7700
11700
16200
Ni
.100
N
16,67
36,67
76,67
90
100
220
% pi =
% qi =
ui
.100
uk
3,09
10,49
47,53
72,22
100
133,33
5
∑ qi
IG = 1 − i=51
∑ pi
= 1−
133,33
= 0,394 (concentración de incentivos del 39,4%)
220
i=1
b)
SUBIDA DE INCENTIVOS DEL 10% ‐ Cambio de escala en la renta
x'i
= 1,1. xi
ni
Ni
x'i ni
110
220
550
1100
1650
5
6
12
4
3
5
11
23
27
30
550
1320
6600
4400
4950
17820
u'i = x'i n i
acumulada
550
1870
8470
12870
17820
N
% pi = i .100
N
16,67
36,67
76,67
90
100
220
% q'i
u'i
= ' .100
uk
3,09
10,49
47,53
72,22
100
133,33
5
∑ q'i
IG = 1 − i=51
∑ pi
= 1−
133,33
= 0,394 (concentración de incentivos del 39,4%)
220
i=1
22
Adviértase que: qi =
ui ui .1,1
=
= q'i
uk uk .1,1
Con una subida del 10% a cada operador, la equidistribución no varía.
El cambio de escala en la renta no afecta al Índice de Gini, propiedad conocida como Principio de la
Renta relativa.
Principio de la renta relativa.‐ El índice debe mantenerse invariante frente a las variaciones
proporcionales en todas las rentas.
SUBIDA LINEAL DE INCENTIVOS DE 100 EUROS ‐ Cambio de origen en la renta
x'i = 100 + xi
ni
Ni
x'i ni
200
300
600
1100
1600
5
6
12
4
3
5
11
23
27
30
1000
1800
7200
4400
4800
19200
u'i = x'i n i
acumulada
1000
2800
10000
14400
19200
% pi =
Ni
.100
N
16,67
36,67
76,67
90
100
220
% q'i =
u'i
.100
uk'
5,21
14,58
52,08
75
100
146,88
5
∑ q'i
IG = 1 − i=51
∑ pi
= 1−
146,88
= 0,332 (concentración de incentivos del 33,2%)
220
i=1
Con una subida lineal de 100 euros a cada operador, la equidistribución es más equitativa.
El cambio de origen en la renta afecta al Índice de Gini, propiedad conocida como Principio de Dalton.
ƒ
En este sentido, si la subida lineal a cada operador hubiera sido de 200 euros se obtendría una
equidistribución todavía más equitativa.
SUBIDA LINEAL DE INCENTIVOS DE 200 EUROS ‐ Cambio de origen en la renta
x'i
= 200 + xi
300
400
700
1200
1700
ni
Ni
x'i ni
5
6
12
4
3
30
5
11
23
27
30
1500
2400
8400
4800
5100
22200
u'i = x'i n i
acumulada
1500
3900
12300
17100
22200
N
% pi = i .100
N
16,67
36,67
76,67
90
100
220
% q'i
u'i
= ' .100
uk
6,76
17,57
55,41
77,03
100
156,76
5
∑ q'i
IG = 1 − i=51
∑ pi
=1−
156,76
= 0,287 (concentración de incentivos del 28,7%)
220
i=1
23
Con una subida lineal de 200 euros a cada operador, la equidistribución resulta más equitativa.
ƒ
Por el contrario, si la cadena del sector turístico hubiera decidido incentivar menos a sus
operadores, con una rebaja de 50 euros a cada operador, se tendría una equidistribución menos
equitativa.
REBAJA LINEAL DE INCENTIVOS DE 50 EUROS ‐ Cambio de origen en la renta
x'i = xi − 50
ni
Ni
x'i ni
50
150
450
950
1450
5
6
12
4
3
30
5
11
23
27
30
250
900
5400
3800
4350
14700
u'i = x'i n i
acumulada
250
1150
6550
10350
14700
% pi =
Ni
.100
N
16,67
36,67
76,67
90,00
100
220
% q'i =
u'i
.100
uk'
1,70
7,82
44,56
70,41
100
124,49
5
∑ q'i
IG = 1 − i=51
∑pi
=1−
124,49
= 0,434 (concentración de incentivos del 43,4%)
220
i=1
Con una rebaja lineal de 50 euros a cada operador, la equidistribución resulta menos equitativa.
Principio de Dalton.‐ Toda transferencia de renta de un individuo a otro más rico ha de aumentar el
valor de la desigualdad, y recíprocamente toda transferencia de renta de un individuo a otro más
pobre ha de reducir el índice, siempre que la ordenación relativa de los individuos se mantenga.
c) La concentración de incentivos si el número de operadores hubiera sido el doble:
SUBIDA LINEAL DE LA POBLACIÓN ‐ Cambio de escala en la población
xi
n'i = 2 ni
N'i
xi n'i
100
200
500
1000
1500
10
12
24
8
6
60
10
22
46
54
60
1000
2400
12000
8000
9000
32400
u'i = xi n'i
acumulada
1000
3400
15400
23400
32400
%p'i =
N'i
.100
N
16,67
36,67
76,67
90
100
220
% q'i =
u'i
.100
uk'
3,09
10,49
47,53
72,22
100
133,33
5
∑ q'i
IG = 1 − i=51
∑ p'i
=1−
133,33
= 0,394 (concentración de incentivos del 39,4%)
220
i =1
El cambio de escala en la población no afecta al Índice de Gini, propiedad conocida como Principio de
la población.
24
Principio de la población.‐ Si se multiplica por un mismo escalar el tamaño de todos los conjuntos de
individuos con la misma renta, el valor del índice no debe variar. Es decir, el tamaño de la población
no importa, lo que interesa son las proporciones de individuos de la población que perciben
diferentes niveles de renta.
Señalar que en todo análisis de concentración debe imperar el Principio del anonimato
Principio de anonimato.‐ Si se produce una modificación en una distribución de renta consistente en
que dos individuos intercambien sus rentas, el valor del índice no debe variar.
13. La tabla refleja los ingresos (millones de euros) por quintiles del turismo en España
Quintiles
Primero
Segundo
Tercero
Cuarto
Quinto
Turismo 2010
2,1
4,9
8,9
16,8
67,3
Turismo 2011
2
6,3
11,6
20,3
59,8
Calcular los índices de Gini y la curva de Lorenz.
Solución:
INGRESO TURISMO 2010
INGRESO TURISMO 2011
ui
ui acumulada
%pi
u
% qi = i .100
uk
2,1
4,9
8,9
16,8
67,3
2,1
7
15,9
32,7
100
20
40
60
80
100
200
2,10
7
15,9
32,7
100
57,7
ui
ui acumulada
%pi
2
6,3
11,6
20,3
59,8
2
8,3
19,9
40,2
100
20
40
60
80
100
200
% qi =
ui
.100
uk
2
8,3
19,9
40,2
100
70,4
5
∑ qi
IG (2010) = 1 − i=51
∑ pi
=1−
57,7
= 0,7115 (concentración de ingresos en 2010 es del 71,15%)
200
=1−
70,4
= 0,648 (concentración de ingresos en 2011 es del 64,8%)
200
i=1
5
∑ qi
IG (2011) = 1 − i=51
∑ pi
i=1
La obtención de ingresos por turismo es más equitativa en 2011, si bien presentan un alto grado de
desigualdad.
25
14. La Conserjería de Turismo concedió sesenta ayudas para ayuda de fachadas de los hoteles
históricos de cierta Comunidad. El criterio de reparto se basó en el grado de deterioro de los mismos,
resultando que el 20% de las subvenciones otorgadas fueron de 300.000 euros, el 15% de 120.000
euros, el 10% de 90.000 euros, el 5% de 60.000 euros, y el resto de 24.000 euros.
Analizar el grado de concentración en el reparto de las ayudas y representarlo gráficamente.
Solución:
xi
ni
Ni
x i ni
24000
60000
90000
120000
300000
10
5
10
15
20
60
10
15
25
40
60
240000
300000
900000
1800000
6000000
9240000
ui = xi n i
acumulada
240000
540000
1440000
3240000
9240000
Ni
.100
N
16,67
25
41,67
66,67
100
150
% pi =
% qi =
ui
.100
uk
2,60
5,84
15,58
35,06
100
59,09
5
∑ qi
IG = 1 − i=51
∑pi
=1−
59,09
= 0,606 (la concentración de ayudas es del 60,6%)
150
i=1
26
15. En la tabla adjunta se muestran los datos relativos al número de contratos registrados en las
oficinas del INEM en el mes de marzo de 2006 en las tres comunidades autónomas con mayor
volumen de contratación en dicho mes.
Andalucía
370153
Almería
26283
Valenciana
154962
Alicante
50776
Cataluña
246860
Barcelona
189126
Cádiz
46611
Córdoba
41987
Huelva
39194
Granada
37729
Jaén
26779
Málaga
63673
Sevilla
87897
Castellón Valencia
18123
86063
Girona
21174
Lleida
12001
Tarragona
24559
Con el coeficiente de Theil, determinar la desigualdad entre Comunidades y la desigualdad motivada
entre las provincias dentro de cada Comunidad.
Solución:
Provincias
Almería
Granada
Málaga
Cádiz
Huelva
Sevilla
Córdoba
Jaén
Barcelona
Tarragona
Lleida
Girona
Valencia
Castellón
Alicante
Contratos
xi
26283
37729
63673
46611
39194
87897
41987
26779
189126
24559
12001
21174
86063
18123
50776
ni
x i . ni
pi =
xi
k
Ln pi
p i . ni . Ln p i
‐3,3800
‐3,0185
‐2,4952
‐2,8071
‐2,9804
‐2,1728
‐2,9116
‐3,3613
‐1,4065
‐3,4479
‐4,1640
‐3,5962
‐2,1939
‐3,7518
‐2,7215
‐0,1151
‐0,1475
‐0,2058
‐0,1695
‐0,1513
‐0,2474
‐0,1584
‐0,1166
‐0,3446
‐0,1097
‐0,0647
‐0,0986
‐0,2446
‐0,0881
‐0,1790
‐2,4409
∑ xi .ni
i=1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
15
26283
37729
63673
46611
39194
87897
41987
26779
189126
24559
12001
21174
86063
18123
50776
771975
0,0340
0,0489
0,0825
0,0604
0,0508
0,1139
0,0544
0,0347
0,2450
0,0318
0,0155
0,0274
0,1115
0,0235
0,0658
1
15
H15 (pi ) = −∑ pi .ni. Ln (pi ) = 2,4409 Ln (15) = 2,708
i=1
Índice de Theil : T = Ln 15 − H15 (pi ) = 2,708 − 2,4409 = 0,2671
Índice relativo de Theil: T =
T
0,2671
=
= 0,0986 (desigualdad del 9,86% por provincias)
Ln N 2,708
Se realiza un análisis desagregado con los datos de las tres Comunidades:
27
Andalucía
Contratos
( xi .ni )
pg =
∈G
i
xi
pi =
15
∑ xi .ni
26283
37729
63673
46611
39194
87897
41987
26779
370153
8
∑ xi .ni
Ln pi
pi .ni . Ln pi
‐2,6450
‐2,2835
‐1,7602
‐2,0721
‐2,2454
‐1,4378
‐2,1766
‐2,6263
‐0,1878
‐0,2328
‐0,3028
‐0,2609
‐0,2378
‐0,3414
‐0,2469
‐0,1900
‐2,0003
i=1
i=1
Almería
Granada
Málaga
Cádiz
Huelva
Sevilla
Córdoba
Jaén
xi
0,0340
0,0489
0,0825
0,0604
0,0508
0,1139
0,0544
0,0347
0,4796
0,0710
0,1019
0,1720
0,1259
0,1059
0,2375
0,1134
0,0723
N
8
g
⎡1 ⎤
NAnd =8
TAnd = Ln Ng + ∑ pi . Ln ⎢ ⎥ ⎯⎯ ⎯
⎯→ TAnd = Ln NAnd + ∑ pi . Ln pi = Ln8 − 2,0003 = 0,0791
⎣ pi ⎦
i=1
i=1
TAnd =
TAnd 0,0791
=
= 0,0380 (desigualdad relativa del 3,80%)
Ln 8 2,0794
Cataluña
Contratos
( xi .ni )
pg =
∈G
i
xi
pi =
15
∑ xi .ni
189126
24559
12001
21174
246860
4
∑ xi .ni
Ln pi
pi .ni . Ln pi
‐0,2664
‐2,3077
‐3,0238
‐2,4560
‐0,2041
‐0,2296
‐0,1470
‐0,2107
‐0,7914
i=1
i=1
Barcelona
Tarragona
Lleida
Girona
xi
0,2450
0,0318
0,0155
0,0274
0,3198
0,7661
0,0995
0,0486
0,0858
N
4
g
⎡1 ⎤
N =4
TCat = Ln Ng + ∑ pi . Ln ⎢ ⎥ ⎯⎯ Cat
⎯⎯→ TCat = Ln NCat + ∑pi . Ln pi = Ln 4 − 0,7914 = 0,5949
⎣ pi ⎦
i=1
i=1
TCat =
TCat 0,5949
=
= 0,4291 (desigualdad relativa del 42,91%)
Ln 4 1,3863
Contratos
Valenciana
( xi .ni )
pg =
∈G
i
xi
pi =
15
∑ xi .ni
86063
18123
50776
154962
∑ xi .ni
Ln pi
pi .ni . Ln pi
‐0,5881
‐2,1460
‐1,1158
‐0,3266
‐0,2510
‐0,3656
‐0,9432
i=1
i=1
Valencia
Castellón
Alicante
xi
3
0,1115
0,0235
0,0658
0,2007
0,5554
0,1170
0,3277
28
Ng
3
⎡1 ⎤
NVal =3
TVal = Ln Ng + ∑ pi . Ln ⎢ ⎥ ⎯⎯ ⎯
⎯→ TVal = Ln NVal + ∑pi . Ln pi = Ln3 − 0,9432 = 0,1554
⎣ pi ⎦
i=1
i=1
TVal =
ƒ
TVal 0,1554
=
= 0,1414 (desigualdad relativa del 14,14%)
Ln 3 1,0987
Desigualdad INTERGRUPOS (entre grupos):
Ln N +
⎡p ⎤
k
3
⎡p ⎤
⎡ 0,4796 ⎤
⎡ 0,3198 ⎤
+ (0,3198). Ln ⎢
+
⎥
8 ⎦
⎣ 4 ⎥⎦
∑ pg . Ln ⎢ Ng ⎥ ≡ Ln N + ∑ pg . Ln ⎢ Ng ⎥ = Ln 15 + (0,4796). Ln ⎢⎣
⎣⎢
g =1
⎥
g⎦
g =1
⎣⎢
⎥
g⎦
⎡ 0,2007 ⎤
+ (0,2007). Ln ⎢
= 2,7080 − 1,3497 − 0,8079 − 0,5428 = 0,0077
⎣ 3 ⎥⎦
ƒ
Desigualdad INTRAGRUPOS (dentro de los grupos):
k
∑
g =1
3
pg . Tg ≡ ∑ pg . Tg = (0,4796).(0,0791) + (0,3198).(0,5949) + (0,2007).(0,1554) = 0,2594
g =1
De este modo, el coeficiente de Theil:
T = Ln N +
⎡p ⎤
∑ pg . Ln ⎢ Ng ⎥ +
g =1
⎣⎢ g ⎥⎦
3
En términos relativos: 3
∑ pg . Tg = 0,0077 + 0,2594 = 0,2671
g =1
T
0,0077 0,2594
=
+
= 0,0288 + 0,9712 = 1
0,2671 0,2671 0,2671
De la desigualdad existente en las Comunidades autónomas, el 2,88% es consecuencia a la
desigualdad entre las Comunidades, mientras que el 97,12% es motivada por la desigualdad entre las
distintas provincias dentro de cada Comunidad.
A la hora de tomar medidas para disminuir la desigualdad, se actuaría en esta dirección, tratando de
limar las diferencias entre las distintas provincias por Comunidad, siendo Cataluña la Comunidad que
mayor desigualdad presenta (42,91%). La desigualdad de contratos registrados por provincias de las
tres Comunidades españolas es del 9,86%.
29
16. En la tabla adjunta se presenta información de las Comunidades Autónomas sobre su Valor
Añadido Bruto (VAB) y la población para el año 2010. Estudiar la asociación entre el VAB y la
Población, utilizando el coeficiente de correlación de Spearman.
VAB
(millones euros)
Comunidades
Autónomas
Población
yi
xi
Andalucía
Aragón
Asturias
Baleares
Canarias
Cantabria
Castilla ‐ León
Castilla ‐ La Mancha
Cataluña
Comunidad Valenciana
Extremadura
Galicia
Madrid
Murcia
Navarra
País Vasco
Rioja
23812,729
5991,549
5934,400
4141,366
6406,031
2587,535
11129,996
6534,323
34286,050
18049,573
3201,259
11411,347
27429,922
4229,997
2895,297
12824,227
1450,286
7881146
1453907
1369918
799465
1677039
625144
3131363
2001241
7237487
4455308
1294448
3420077
5736581
1171537
619670
2601414
310367
Solución:
C. Autónomas
Andalucía
Aragón
Asturias
Baleares
Canarias
Cantabria
Castilla ‐ León
Castilla ‐ La Mancha
Cataluña
Comunidad Valenciana
Extremadura
Galicia
Madrid
Murcia
Navarra
País Vasco
Rioja
xi
yi
R(x i )
R(y i ) di = R(x i ) − R(y i )
23812,729
7881146
15
17
‐2
5991,549
1453907
8
8
0
5934,400
1369918
7
7
0
4141,366
799465
5
4
1
6406,031
1677039
9
9
0
2587,535
625144
2
3
‐1
11129,996
3131363
11
12
‐1
6534,323
2001241
10
10
0
34286,050
7237487
17
16
1
18049,573
4455308
14
14
0
3201,259
1294448
4
6
‐2
11411,347
3420077
12
13
‐1
27429,922
5736581
16
15
1
4229,997
1171537
6
5
1
2895,297
619670
3
2
1
12824,227
2601414
13
11
2
1450,286
310367
1
1
0
EXCEL: JERARQUIA(A1;A$1:A$17;1) ‐ JERARQUIA(B1;B$1:B$17;1)
30
d2i
4
0
0
1
0
1
1
0
1
0
4
1
1
1
1
4
0
20
17
rs = 1 −
6. ∑ d2i
i=1
n . (n − 1).(n + 1)
= 1−
6.20
= 0,975 − 1 ≤ rs ≤ 1
17.16.18
El coeficiente de correlación de Spearman es alto (próximo a 1), indicando una buena asociación de
tipo discreto entre ambas variables (VAB, Población), es decir, las más altas puntuaciones en una de
las variables correspondieron a las más altas puntuaciones en la otra y, complementariamente, las
más bajas puntuaciones en una variable correspondieron a las más bajas puntuaciones de la otra.
H0 : rs = 0
⎧ Hipótesis nula :
Se plantean las hipótesis ⎨
Se rechaza H0 si rs ≥ rcrítico
Hipótesis
alternativ
a
:
H
:
r
0
≠
a
s
⎩
En las Comunidades autónomas (n = 17) , el valor calculado de rs = 0,975 , con un nivel de confianza
del 95% (p‐valor=0,05), es superior al valor crítico de rcrítico = 0,412 ( rs = 0,975 > rcrítico = 0,412 ),
rechazando la hipótesis nula y concluyendo que existe asociación directa entre el VAB y la densidad
de la población.
31
EXCEL: FRECUENCIAS DATOS AGRUPADOS
En la tabla se muestran las rentas (en miles de euros) y el número de personas que las perciben:
nº empleados xi
nº sucursales ni
9
2
10
4
11
10
12
10
13
5
14
3
15
6
16
5
17
2
18
2
19
1
DIAGRAMA DE ESCALERA (FRECUENCIAS ABSOLUTAS ACUMULADAS ≡ Ni):
En Agregar Serie se introduce en Valores (categoría Y) la columna de
la frecuencia absoluta acumulada Ni y en Rótulos del eje de categoría
(X) la columna de los distintos datos xi
Se abre un cuadro de diálogo con diferentes opciones: Títulos, Eje, Líneas de división, Rótulos de
datos y Tabla de datos.
32
DIAGRAMA DE BARRAS (FRECUENCIAS ABSOLUTAS ≡ ni):
En Agregar Serie se introduce en Valores (categoría Y) la columna
de la frecuencia absoluta ni y en Rótulos del eje de categoría (X) la
columna de los distintos datos xi
33
Se abre un cuadro de diálogo con diferentes opciones: Títulos, Eje, Líneas de división, Rótulos de
datos y Tabla de datos.
34
EXCEL: FRECUENCIAS DATOS AGRUPADOS EN INTERVALOS
POLÍGONO DE FRECUENCIAS ACUMULADAS:
En Agregar Serie se introduce en Valores (categoría Y) la columna de
la frecuencia absoluta acumulada Ni y en Rótulos del eje de categoría
(X) la columna de los distintos datos Li+1 (límite superior del intervalo)
Se abre un cuadro de diálogo con diferentes opciones: Títulos, Eje, Líneas de división, Rótulos de
datos y Tabla de datos.
35
EXCEL: HISTOGRAMA
En la tabla se muestran las rentas (en miles de euros) y el número de personas que las perciben:
Intervalos [Li ‐ Li+1)
Fr. absoluta ni
0 ‐ 6
12
6 ‐ 10
16
10 ‐ 15
15
15 ‐ 21
12
21‐ 30
9
MÉTODO 1:
Seleccionar la columna
densidad di
Gráficos/Columnas pulsar
Siguiente>
Se abre un cuadro de diálogo con diferentes opciones: Títulos, Eje, Líneas de división, Rótulos de
datos y Tabla de datos.
36
En el eje Y aparece la dispersión del
histograma pero en el eje X no aparecen
los intervalos.
Para ello, en el área de trazado se hace
clic con el botón derecho.
Se agrega una Serie2 introduciendo en Valores (eje Y) los datos de la densidad di (J4:J8) y en Rótulos
del eje de categorías (X) los intervalos.
37
MÉTODO 2:
38
39
EXCEL: CURVA DE LORENZ
La tabla adjunta muestra el capital social de un banco a finales de año.
Número acciones
Número accionistas
0 ‐ 50
20.135
50 ‐ 100
3.456
100 ‐ 200
2.035
200 ‐ 1000
1.480
> 1000
756
Sabiendo que la marca de clase del último intervalo es 7552, se pide:
a) Determinar el número medio de acciones que poseía cada accionista
b) ¿Cómo se encuentra repartido el capital social entre los accionistas?.
Solución.‐
a) Se forma la tabla:
n
Li
L i +1
xi
Ni
x i ni
Ui = ∑ x i ni
20135
23591
25626
27106
27862
503375
259200
305250
888000
5709312
7665137
503375
762575
1067825
1955825
7665137
ni
0
50
25 20135
50 100
75
3456
100 200 150 2035
200 1000 600 1480
> 1000
7552 756
27862
i=1
pi =
Ni
100
N
72,267
84,671
91,975
97,287
100,000
qi =
Ui
100
Un
6,567
9,949
13,931
25,516
100,000
pi − qi
65,700
74,722
78,044
71,771
0,000
290,237
5
El número medio de acciones será: x =
∑ x i ni 7665137
i=1
N
=
27862
= 275,11 acciones/accionista
b) El índice de concentración de Gini analiza en qué medida está repartido el capital social entre los
accionistas del banco:
4
IG =
∑ (pi − qi ) 290,237
i=1
4
∑ pi
=
346,199
= 0,84
i=1
El índice de Gini es elevado, está más próximo a 1 que a 0, lo que indica que existe una fuerte
concentración del capital social en unos pocos accionistas.
En consecuencia, el número medio de acciones/accionista no es significativo.
Excel: Para representar la curva de Lorenz resulta necesario insertar una fila donde (pi, qi) tengan
un recorrido del 0 al 100% .
40
MÉTODO 1:
Para representar la bisectriz del cuadrado se introduce una nueva serie, recta que pasa por los puntos
(0, 0) y (100, 100).
En el menú Insertar/Gráfico, se teclea XY(Dispersión), subtipo de gráfico Dispersión con puntos de
datos conectados por líneas. Pinchar Siguiente>.
Se introducen los datos, seleccionando la pestaña Serie, pinchar
Agregar serie y rellenar el campo de Valores de X (eje de
abscisas, datos pi , rango H47:H52) y Valores de Y (eje
ordenadas, datos qi , rango I47:I52).
Después, hay que agregar una nueva serie que sirve para dibujar
la bisectriz. Para ello, se pincha nuevamente en Agregar serie,
completando el campo Valores de X (con el rango C56:C57) y el
campo de Valores de Y con el rango (D56:D57), señalar que
como el contenido de ambos rangos es idéntico se podría
eliminar uno de ellos (por ejemplo, C56:C57), hacer clic en
Siguiente>
41
Aparece el cuadro de diálogo donde se puede especificar, entre otros, el Título del Gráfico, el Título
de valores (X) y el título de valores (Y). La opción Líneas de división se puede dejar sin marcar nada.
Pinchar Terminar
NOTA.‐ Cuando aparecen series de datos para comparar (Empresa A y Empresa B) y se desea
representar las curvas, hay que seguir los pasos anteriores y cuando se van a agregar las series hay
que agregar tantas series como tengamos (en el ejemplo, dos series) y una más con los datos para
representar la bisectriz.
En caso de tener una serie representada (por ejemplo, la empresa A) y se desea
añadir otra, entonces se sitúa el puntero del ratón sobre el área de gráfico (zona
sobre la que se colocan los títulos) de la representación y se pulsa el botón
derecho del ratón, apareciendo el menú adjunto a la derecha.
Señalar que, lo mismo sucede, situando el ratón sobre la bisectriz, o curva de
Lorenz.
Se hace clic en Datos de origen, desplegándose la pantalla de abajo, a falta de
incluir datos al ejercicio tratado. Al pinchar en la pestaña Serie se despliega la
segunda ventana de abajo, donde se puede añadir otra nueva serie de datos.
Excel
42
MÉTODO 2:
En el menú Insertar/Gráfico se elige Líneas (con marcadores en cada valor de datos)/Serie, se pulsa
Agregar y en Valores se introduce los datos de qi (eje de ordenadas, rango I47:I52) y en Rótulos del
eje de categorías (X) los datos de pi (eje de abscisas, rango H47:H52)
Haciendo clic en Siguiente> aparece un cuadro de diálogo donde se puede especificar: Títulos (Título
del gráfico, eje de categorías X, eje de categorías Y), Eje, Líneas de división (principales y secundarias
de los ejes), Leyenda, Rótulos de datos, Tabla de datos ‐ sólo hay que ir probando y se observa el
efecto del gráfico ‐.
Clic en Siguiente>
ofrece la opción
donde se desea
guardar el gráfico.
Haciendo clic con el botón derecho del
ratón se pueden elegir distintas opciones:
43
Se coloca el ratón sobre los ejes (Eje de
categorías) y se hace clic con el botón
derecho para su diseño.
Se pueden elegir distintas opciones:
Tramas, Escala, Fuente, Número y
Alineación.
Análogamente con el eje Y (categoría Y)
44
Para trazar la diagonal principal:
Dibujo/Autoformas/Línea
Para hacer las líneas o marcadores más
gruesos, cambiar de color, estilo, etc.,
basta situar el ratón sobre las líneas
(Formato serie de datos o de
autoformas) y pulsar el botón derecho.
45
Excel
Descargar