www.siresistemas.com/clases Ing. Oscar Restrepo www

Anuncio
www.siresistemas.com/clases
Ing. Oscar Restrepo
TRABAJO DE APLICACIÓN
La siguiente base de datos se conformó por la información suministrada en la entidad
financiera BankAmerica, en el año anterior. A partir de esta consulta, se pretende
aplicar y reforzar los diferentes temas vistos en el curso nivelatorio.
SEXO
Hombre
Hombre
Mujer
Mujer
Hombre
Hombre
Hombre
Mujer
Mujer
Mujer
Mujer
Hombre
Hombre
Mujer
Hombre
Hombre
Hombre
Hombre
Hombre
Mujer
Mujer
Hombre
Mujer
Mujer
Mujer
Hombre
Hombre
Hombre
Hombre
Hombre
Hombre
Hombre
Hombre
Hombre
Hombre
Mujer
Hombre
Hombre
Hombre
Mujer
TIPO DE
CONTRATO
SALARIO ANUAL
( dólares)
Indefinido
Anual
Anual
Temporal
Anual
Indefinido
Indefinido
Temporal
Anual
Anual
Temporal
Anual
Temporal
Indefinido
Temporal
Indefinido
Indefinido
Temporal
Anual
Anual
Anual
Indefinido
Anual
Anual
Indefinido
Indefinido
Indefinido
Anual
Anual
Anual
Indefinido
Indefinido
Temporal
Indefinido
Anual
Anual
Indefinido
Indefinido
Indefinido
Temporal
www.siresistemas.com/fundacion
$57500
$40200
$21450
$21900
$45000
$32100
$36,000
$21900
$27900
$24000
$30380
$28350
$27750
$35100
$27320
$40800
$46430
$42350
$26250
$38850
$21750
$24280
$16950
$21150
$31050
$60375
$32550
$42000
$31350
$29100
$31360
$36180
$19255
$23565
$35085
$23725
$29640
$30730
$60985
$35560
EXPERIENCIA
LABORAL
(meses)
144
236
381
190
238
67
114
215
244
143
307
165
228
240
56
444
120
432
168
144
108
49
151
314
240
284
191
209
229
324
264
252
208
240
35
288
180
258
284
284
MESES
DESDE EL
CONTRATO
77
78
75
80
78
79
75
76
78
80
77
78
77
78
75
76
75
76
77
77
78
78
79
78
80
76
77
78
76
77
76
78
78
78
77
77
78
78
77
78
www.siresistemas.com/
www.siresistemas.com/clases
Ing. Oscar Restrepo
Se solicita,
1. Clasificar cada variable en categórica o cuantitativa ( Discreta o continua )
Sexo: Categórico.
Tipo de contrato: Categórico
Salario anual: Cuantitativo continuo
Experiencia laboral: Cuantitativo discreto
Meses desde el contrato: Cuantitativo discreto
2. Elaborar una distribución de frecuencias, una distribución de frecuencias relativas y
trace un Histograma para los datos que representa la variable
“Salario
Anual”.
Número de datos
Dato mayor
Dato menor
Cálculo de intevalo
Número intervalos (m)
Rango
Ancho intervalo
40
60985
16950
6,286797971
6
44035
7339,166667
Rango= Dmayor- Dmenor
Cálculo del intervalo= 1 + 3.3log(n)
El número de intervalos es la aproximación al entero más cercano
Ancho del intervalo = Rango/m
Tabla de distribución de frecuencias
No
1
2
3
4
5
6
Linf
16950
24289,167
31628,333
38967,5
46306,667
53645,833
Lsup
24289,17
31628,33
38967,5
46306,67
53645,83
60985
www.siresistemas.com/fundacion
Yi
20619,58
27958,75
35297,92
42637,08
49976,25
57315,42
fi
11
12
8
5
1
3
Fi
11
23
31
36
37
40
hi
0,275
0,3
0,2
0,125
0,025
0,075
Hi
0,275
0,575
0,775
0,9
0,925
1
www.siresistemas.com/
www.siresistemas.com/clases
Ing. Oscar Restrepo
3. Determinar los estadísticos de centro, de variación y de forma para la variable
“Salario Anual”. Realice un breve informe.
Medidas de tendencia central
Media:
Mediana: Semisuma de los datos centrales:
Moda: El dato que más se repite: 21900
Medidas de dispersión:
Varianza:
Desviación estándar:
Coeficiente de variación:
Medida de forma
Breve informe:
El salario promedio anual es de 32704.25, con una desviación de 10524.49. Esta
desviación nos muestra que los datos están muy dispersos. El coeficiente de variación
indica que el 38.18% de los datos se ajusta a la media. La asimetría nos muestra un
valor cercano a cero, quiere decir que los datos están concentrados en el centro.
4. Elaborar una distribución de frecuencias porcentual y trace un diagrama circular
porcentual para la variable “Tipo de Contrato”. Realice un breve informe.
Tabla de frecuencias
No
Indefinido Anual Temporal www.siresistemas.com/fundacion
fi 16 16 8 Fi 16 32 40 hi(%) Hi(%)
40 40 40 80 20 100 www.siresistemas.com/
www.siresistemas.com/clases
Ing. Oscar Restrepo
Breve informe:
Existen tres tipos de contratos: Indefinido, temporal y anual. En los 40 datos se tiene
igual concentración en el indefinido y anual (80%) entre los dos. El menor porcentaje de
empleados tiene contrato temporal (20%). Esto nos ayuda a pensar que existe cierta
estabilidad laboral.
5. Aplicar las técnicas de Análisis Exploratorio de Datos ( Diagrama de Tallo y Hojas
y Diagrama de Caja)para la variable “Experiencia laboral”. realice un breve
comentario sobre lo encontrado.
Diagrama de Tallo y Hojas
fi 0 1 2 3 4 35 08 08 07 32 49 14 09 14 44 56 20 15 24 67 43 44 44 51 65 68 80 90 91
228 29 36 38 40 40 40 44 52 58 64
81 84 84 84 88
Para realizar el diagrama de Tallo y Hojas se seleccionó las centenas como el tallo y las
decenas y unidades como las hojas. Existen más datos concentrados en el intervalo de 2
centenas, es decir entre 200 y 300.
Diagrama de Caja:
Luego de organizar los datos de menor a mayor se encontró que:
228,5 Mediana Cuartil 1 Cuartil 3 149,25 269 X
X
35
444
149.25
228.5
269
El 25% de la experiencia laboral es inferior a 149.5, y otro 25% es superior a 269
meses. Además el 50% de los datos centrales están entre 149.25 y 269 meses.
www.siresistemas.com/fundacion
www.siresistemas.com/
4
12
18
4
2
www.siresistemas.com/clases
Ing. Oscar Restrepo
6. Elaborar la Tabla de Contingencia que relacione las variables “Tipo de Contrato”
(en la columna) y “Sexo” del empleado (en la fila).
Contingencia Tipo Contrato
Sexo Hombre Mujer Total general Anual 8 8 16 Indefinido Temporal
14 4 2 4 16 8 Total general 26 14 40 7. Con base en la Tabla de Contingencia evaluar las siguientes probabilidades:
a. El empleado sea hombre
P=26/40=0.65
b. El empleado es contrato indefinido
P=16/40=0.4
c. El empleado es de contrato temporal o anual
P=(16+8)/40=0.6
d. El empleado sea mujer o de contrato temporal
P=(14+8-4)/40=0.45
e. Dado que el empleado es hombre, que sea de contrato indefinido
P=14/26= 0.5384
f. El empleado es de contrato indefinido, dado que es mujer
P=2/14=0.1428
g. El empleado no sea contrato anual
P= 24/40=0.60
8. Al suponer que la variable “Salario Anual” sigue una distribución aproximadamente
normal, con media aritmética = $ 31268 y una desviación estándar = $ 10568 ,
calcular la probabilidad de que un empleado tenga un salario:
a. Entre $20000 y $40000
La probabilidad es de 64.93%
b. Mayor de $ 50000
www.siresistemas.com/fundacion
www.siresistemas.com/
www.siresistemas.com/clases
Ing. Oscar Restrepo
La probabilidad es de 3.84%
c. El 90% de los empleados, ¿qué salario tienen?
El 90% de los empleados tienen un salario inferior a 44847.88
9. Siendo la variable independiente “ Experiencia laboral” y la variable dependiente
“Salario Anual”,
a. Determinar la ecuación de regresión
Los resultados son:
N=40
Reemplazando se tiene
La ecuación de regresión es:
b. Interpretar el valor de la pendiente
La pendiente significa que por cada mes de experiencia laboral el salario
aumenta en $15.80
c. Dibujar el diagrama de dispersión y trazar la línea de “mejor ajuste”
www.siresistemas.com/fundacion
www.siresistemas.com/
www.siresistemas.com/clases
Ing. Oscar Restrepo
d.
e. Estimar el salario anual de un empleado que tiene una experiencia laboral de
200 meses
f. Calcular el error estándar de estimación e interprete su valor
La dispersión de los datos respecto a la recta dada es de 10690.59. Es una dispersión
muy alta.
g. Calcular el coeficiente de determinación y el coeficiente de correlación.
interprete cada valor
Coeficiente de determinación:
La variación en la experiencia laboral explica un 1.97% de la variabilidad en el salario
anual. Este coeficiente es muy bajo indicando que los datos se ajustan en casi nada a la
recta encontrada.
Coeficiente de correlacion:
El coeficiente de determinación es muy pequeño.
h. Calcular la covarianza e interprete su valor
www.siresistemas.com/fundacion
www.siresistemas.com/
www.siresistemas.com/clases
Ing. Oscar Restrepo
La covarianza es muy alta. Existe una gran dispersión entre las dos variables.
10. Elabore la distribución de probabilidades para la variable Meses desde el contrato.
x 75
76
77
78
79
80
Suma p(x) 0,1
0,15
0,25
0,375
0,05
0,075
1
E.J.J.R
www.siresistemas.com/fundacion
www.siresistemas.com/
Descargar