Subido por freddy benavente

estadistica descriptiva y correlación de pearson

Anuncio
La siguiente tabla contiene los datos de la cantidad de habitantes, la tasa de desempleo y la tasa
de delitos por cada mil habitantes en las comunidades de España en el año 2015
COMUNIDAD
CANTIDAD DE HABITANTES
Baleares
1210750
Canarias
2237309
Valencia
5028650
Murcia
1504607
Andalucía
8476718
La Rioja
315926
Extremadura
1061768
Cataluña
7652069
Cantabria
582357
Asturias
1018775
Galicia
2702244
Madrid
6747425
Navarra
656487
Castilla la Mancha
2045384
País Vasco
2189310
Aragón
1330445
Castilla y León
2401230
TASA DE DESEMPLEO TASA DE DELITOS
16,5
10,0
30,3
9,0
23,0
8,6
24,8
8,4
31,0
7,9
16,4
7,3
29,6
7,1
19,1
7,0
18,2
6,8
20,2
6,8
20,0
6,6
17,7
6,6
12,6
6,4
27,0
6,2
16,0
5,8
17,0
5,8
18,5
5,5
RESULTADOS
a) Calcular todos los estadísticos de tendencia central, dispersión y posición para
las variables aleatorias cuantitativas. Hacer un gráfico para cada una y explique
brevemente sus conclusiones en base a los resultados obtenidos.

Estadísticos de tendencia central, dispersión y posición.
Estadísticos de tendencia central
CANTIDAD DE
TASA DE DESEMPLEO
HABITANTES
N
TASA DE DELITOS
17
17
17
Media
2774203,176
21,053
7,165
Mediana
2045384,000
19,100
6,800
315926,0a
12,6a
5,8a
Moda
a. Existen múltiples modos. Se muestra el valor más pequeño.
Estadísticos de dispersión
CANTIDAD DE
HABITANTES
N
Error estándar de la media
Desv. Desviación
Varianza
Coeficiente de Variación (%)
Rango
TASA DE DESEMPLEO
TASA DE DELITOS
17
17
17
624187,0912
1,3532
,3001
2573589,3072
5,5792
1,2374
6623361921914,279
31,128
1,531
92,8
26,5
17,3
8160792,0
18,4
4,5
Estadísticos de Posición
Cantidad de Habitantes
Tasa de Desempleo
Tasa de Delitos
17
17
17
25
1040271,500
16,750
6,300
50
2045384,000
19,100
6,800
75
3865447,000
25,900
8,150
N
Percentiles

Gráfico de variables aleatorias.

Conclusiones
Usando el programa estadístico IBM SPSS Statistics, se obtuvieron las
medidas de tendencia central, dispersión y posición, así como los histogramas para
las variables aleatorias estudiadas, encontrando que existe un promedio de
habitantes de 2.774.203,176 entre las comunidades de España para el año 2015, el
promedio de la tasa de desempleo se ubicó en 21,05%, mientras que la tasa de
delitos se encontró en promedio de 7,16%. De igual forma se obtuvo que el 50% de
las ciudades tenia para el año 2015 una cantidad de habitantes mayor o igual a los
2.045.384, durante este año el 50% del territorio español poseía una tasa de
desempleo igual o menor al 19,1% mientras que la tasa de delitos se encontró
menor o igual al 6,8% en el 50% de, Adicionalmente la cantidad de habitantes, y la
tasa de desempleo poseen puntuaciones con la misma frecuencia, por lo que podría
concluirse que no existe el estadístico de la moda para estas variables, a diferencia
de la tasa de delitos ya que con más frecuencia se encontraron las tasas
correspondientes al 5,8%, 6,6% y 6,8% respectivamente.
Con respecto a los resultados arrojados para los estadísticos de dispersión
se obtuvo como resultado que la desviación típica de la cantidad de habitantes con
respecto al promedio es de 2.573.589 personas, para la tasa de desempleo la
desviación se ubico en 5,57% con respecto al promedio, mientras que la tasa de
delitos presento una desviación del 1,23% respecto al promedio.
De acuerdo con los resultados obtenidos para los estadísticos de posición,
se obtuvo que el 75% de las comunidades de España para el año 2015, tenía una
cantidad de habitantes igual o menor a los 3.865.447, mientras que el 25% de las
comunidades superaban los 3.865.447 habitantes. Con relación a la tasa de
desempleo, el 75% de las comunidades tenia una tasa igual o menor al 25,9%
mientras que el resto de las comunidades superaban el 25,9% de desempleo. Por
último, la tasa de delitos para el 75% de las comunidades era igual o menor al 8,15%
mientras que el resto de las comunidades si superaba el 8,15% de delitos.
b) Determine los valores atípicos que aparecen en cada uno de las variables,
diga a qué comunidades corresponden.

Cantidad de habitantes.
Resumen de procesamiento de casos
Casos
Válido
N
Cantidad de Habitantes
Perdidos
Porcentaje
17
100,0%
N
Total
Porcentaje
0
0,0%
N
Porcentaje
17
100,0%
A través del diagrama de cajas se obtienen 3 comunidades con valores
atípicos para la cantidad de habitantes, estas comunidades son:
Comunidad
Cantidad de Habitantes
Andalucía
Cataluña
Madrid

8.476.718
7.652.069
6.747.425
Tasa de desempleo
Resumen de procesamiento de casos
Casos
Válido
N
Tasa de Desempleo
Perdidos
Porcentaje
17
100,0%
N
Total
Porcentaje
0
0,0%
N
Porcentaje
17
100,0%
A través del diagrama de cajas se puede observar que no existen valores
atípicos para la variable tasa de desempleo.

Tasa de delitos.
Resumen de procesamiento de casos
Casos
Válido
N
Tasa de Delitos
Perdidos
Porcentaje
17
100,0%
N
Total
Porcentaje
0
0,0%
N
Porcentaje
17
100,0%
A través del diagrama de cajas se puede observar que no existen valores atípicos
para la variable tasa de delitos.
c) ¿Cuál de las tres distribuciones es más dispersa?
De las tres distribuciones la más dispersa es la que tiene que ver con la
variable cantidad de habitantes, debido a que posee la mayor desviación estándar
con 2.573.589,3072.
d) Calculo de la covarianza entre las tres variables.
Comunidad
Baleares
Canarias
Valencia
Murcia
Andalucía
La Rioja
Extremadura
Cataluña
Cantabria
Asturias
Galicia
Madrid
Navarra
cantidad de habitantes
tasa de desempleo
1210750
2237309
5028650
1504607
8476718
315926
1061768
7652069
582357
1018775
2702244
6747425
656487
tasa de delitos
16,5
30,3
23,0
24,8
31,0
16,4
29,6
19,1
18,2
20,2
20,0
17,7
12,6
10,0
9,0
8,6
8,4
7,9
7,3
7,1
7,0
6,8
6,8
6,6
6,6
6,4
Castilla la
Mancha
País Vasco
Aragón
Castilla y León
medias
varianzas
-
2045384
2189310
1330445
2401230
2.774.203,18
6,62336E+12
x-medx
1.563.453,18
536.894,18
2.254.446,82
1.269.596,18
5.702.514,82
2.458.277,18
1.712.435,18
4.877.865,82
2.191.846,18
1.755.428,18
71.959,18
3.973.221,82
2.117.716,18
728.819,18
584.893,18
1.443.758,18
372.973,18
(x-mx)(y-md)
27,0
16,0
17,0
18,5
21,05
31,12764706
7,16
1,531176471
y-medy
-
z-medz
4,55
9,25
1,95
3,75
9,95
4,65
8,55
1,95
2,85
0,85
1,05
3,35
8,45
5,95
5,05
4,05
2,55
-
6,2
5,8
5,8
5,5
(x-md)(z-mz)
2,84
1,84
1,44
1,24
0,74
0,14
0,06
0,16
0,36
0,36
0,56
0,56
0,76
0,96
1,36
1,36
1,66
-
(y-md)(z-md)
7.118.310,34
4.964.692,03
4.432.849,59
985.358,72
12,91
4.389.540,58
4.757.251,56
3.235.794,26
1.568.324,69
2,79
56.723.250,39
4.193.025,61
332.590,44
7,31
0,63
0,55
11.438.219,10
14.636.284,18
110.804,63
16,97
4,63
9.526.185,02
803.413,19
0,32
6.253.208,21
799.379,19
1,04
1.497.276,97
640.214,98
0,31
75.768,78
13.321.979,06
40.635,77
2.243.701,74
0,59
17.900.930,27
4.334.330,51
1.619.430,02
703.096,15
6,46
5,74
2.955.430,82
798.207,16
6,90
5.851.466,96
1.970.305,28
5,53
952.178,58
620.890,64
4,25
63.614.858,64
4.365.545,31
34,93
21204952,88
1455181,769
11,64395617
1,89
Matriz de Covarianza
cantidad de habitantes
6,62336E+12
21204952,88
1455181,769
tasa de desempleo tasa de delitos
21204952,88
1455181,769 cantidad de habitantes
31,12764706
11,64395617 tasa de desempleo
11,64395617
1,531176471 tasa de delitos
De acuerdo con la matriz de covarianza, existe una relación directa entre la
tasa de desempleo y la tasa de delitos, de igual forma ocurre que la cantidad de
habitantes tiene incidencia directa sobre la tasa de empleo.
e) Ajustar una recta de regresión para predecir el número de delitos como función
de la cantidad de población. Hacer el diagrama de dispersión. Calcular el
Coeficiente de Correlación y el de Determinación. Interprete la fiabilidad del
modelo.

Diagrama de dispersión.

Coeficiente de correlación y coeficiente de determinación.
Correlaciones
cantidad de
tasa de delitos
Correlación de Pearson
tasa de delitos
1,000
,086
,086
1,000
.
,372
,372
.
tasa de delitos
17
17
cantidad de habitantes
17
17
cantidad de habitantes
Sig. (unilateral)
tasa de delitos
cantidad de habitantes
N
habitantes
Resumen del modelo
Estadísticos de cambio
Error
Modelo
R
,086a
1
R
estándar
Cambio en
R
cuadrado
de la
R
Cambio
cuadrado
ajustado
estimación
cuadrado
en F
,007
-,059
1,27329
,007
Sig.
,111
Cambio en
gl1
gl2
1
15
F
,744
a. Predictores: (Constante), cantidad de habitantes
Luego de ajustar la recta de regresión se obtienen los coeficientes de
correlación R= 0,086 y el coeficiente de determinación R2=0,007. Esto quiere decir
que la cantidad de habitantes influye en un 0,7% en la tasa de delitos. La correlación
es directa y positiva debido a que, a medida que aumenta la variable cantidad de
habitantes de igual forma aumenta la tasa de delitos, sin embargo tomando en
cuenta que R=0,086 El ajuste no es fiable puesto que la correlación es del tipo
positiva débil, tal como se muestra en el diagrama de dispersión existen ciudades
con menos cantidad de habitantes directamente relacionadas a mayores tasas de
delitos.
f) ¿Cuál será la tasa de delitos estimada de una ciudad con 50374 habitantes?
y de otra con 11 millones de habitantes?
Tomando en consideración la ecuación de la recta dada por la recta de
regresión lineal, queda de la siguiente forma:

Tasa de delitos estimada para una ciudad con 50374 habitantes.
Siendo y= tasa de delitos estimada.
𝑦 = 7,05 + 4,12𝐸 − 8 ∗ 𝑥
𝑦 = 7,05 + 0,0000000412 ∗ 𝑥
𝑦 = 7,05 + 0,0000000412 ∗ 50374
𝑦 = 7,05 + 0,0021
𝑦 = 7,0521
La tasa de delitos estimada para una ciudad con 50374 habitantes es del 7,05%.

Tasa de delitos estimada para una ciudad con 11.000.000 habitantes.
Siendo y= tasa de delitos estimada.
𝑦 = 7,05 + 4,12𝐸 − 8 ∗ 𝑥
𝑦 = 7,05 + 0,0000000412 ∗ 𝑥
𝑦 = 7,05 + 0,0000000412 ∗ 11000000
𝑦 = 7,05 + 0,4532
𝑦 = 7,5032
La tasa de delitos estimada para una ciudad con 11.000.000 de habitantes es del
7,50 %.
Descargar