Estadística y Econometría Básica Prof. Emiliano Andrés Baldassarre 16 DE AGOSTO DE 2020 FABIOLA LAURA ANDREA VERA [email protected] 3° 2020- B UNIVERSIDAD NACIONAL DE QUILMES Trabajo Práctico N° 1 • El presente trabajo constituye la primera evaluación formal de la materia. Su resolución y entrega es obligatoria. En caso de no presentar o desaprobar el TP deberán recuperar los contenidos de la unidad en el examen recuperatorio. • La resolución de las consignas y los gráficos puede realizarse a mano o en computadora. En caso de trabajar en formato papel debe escanear la resolución del trabajo y presentar el mismo en un ÚNICO ARCHIVO (Formato Word, Excel o PDF) Fecha de entrega: 16/08. • Desarrolle y justifique, en todas las consignas, los pasos y operaciones realizadas. • Para aprobar el Trabajo Práctico debe acreditar correctamente el 60% del mismo. 1.- A continuación, se presenta un ejemplo de ficha del personal que entra a trabajar en una empresa. Indique para cada una de las variables a analizar si son cualitativas (nominal u ordinal) o cuantitativas (discreta o continua) Nombre y Apellido: CUALITATIVA ORDINAL Edad (en años): CUANTITATIVA DISCRETA Estado Civil: CUALITATIVA NOMINAL Nivel de Estudios: CUALITATIVA ORDINAL Estatura: CUANTITATIVA CONTINUA Peso: CUANTITATIVA CONTINUA 2.- La siguiente tabla muestra la cantidad de clientes que entran en el horario de 14 a 15 horas en 60 locales de ventas de automóviles de cierta ciudad: 0 1 0 2 4 2 5 0 3 0 2 0 1 4 4 4 1 2 1 2 5 0 4 1 2 0 1 1 4 2 7 3 2 0 5 1 1 0 7 3 1 7 0 3 0 0 7 3 2 4 3 1 2 0 3 0 0 1 2 4 a) Determine la variable a analizar y clasifíquela. Construya una tabla de distribución de frecuencias absolutas, acumuladas, relativas y porcentajes y represente las Frecuencias Absolutas mediante un diagrama de barras. Calcule la moda, mediana y promedio de la distribución. VARIABLE CUANTITATIVA DISCRETA Cantidad De Clientes que ingresan 0 1 2 3 4 5 6 7 f Fa Fr Fr acumulada F% 15 12 11 7 8 3 0 4 60 15 27 38 45 53 56 56 60 ¼ 1/5 11/60 7/60 2/15 1/20 0 1/15 1 0,25 0,45 0,63 0,75 0,88 0,93 0,93 1 25 % 20 % 18 % 12 % 13 % 5% 0% 7% 100 % La moda es el valor, categoría o clase, que registra la frecuencia mayor en la distribución de la variable Mo= 0 La cantidad de clientes que ingresan a los locales de 14 a 15 Hs es 0 Media o promedio es el punto de equilibrio del conjunto de los datos Cantidad De Clientes que ingresan 0 1 2 3 4 5 6 7 ̅= 𝒙 𝑥̅ = ∑ 𝒙.𝒇 𝒏 130 60 f Fa x.f 15 12 11 7 8 3 0 4 60 15 27 38 45 53 56 56 60 0 12 22 21 32 15 0 28 130 𝑥̅ = 2,1667 Es la cantidad promedio de clientes que ingresan entre las 14 a 15 hs a las sucursales Me Cantidad De Clientes que ingresan 0 1 2 3 4 5 6 7 f Fa x.f 15 12 11 7 8 3 0 4 60 15 27 38 Me 45 53 56 56 60 0 12 22 21 32 15 0 28 130 Me= 2 Posición= 𝑛 60 2 2 30 F Se obtiene sumando los valores de la frecuencia absoluta y dividirlo por 2. Se busca en la frecuencia acumulada ese valor, y si no está, se utiliza el siguiente valor, que en este caso el 38. CANTIDAD DE CLIENTES QUE INGRESAN DE 14 A 15 HS FRECUENCIA ABSOLUTA 16 14 12 10 8 6 4 2 0 0 1 2 3 4 CLIENTES QUE INGRESAN 5 6 7 b) Si en el 80% o más de los locales entran como máximo 3 personas, se decidirá no atender al público en ese horario (de 14 a 15 horas) y comenzar a atender a partir de las 15 horas. En base a los datos, ¿qué decisión se tomará? Justifique. Cantidad De Clientes 0 1 2 3 4 5 6 7 f Fa Fr Fr Acum 15 12 11 7 8 3 0 4 60 15 27 38 45 53 56 56 60 ¼ 1/5 11/60 7/60 2/15 1/20 0 1/15 1 0,25 0,45 0,6333 0,75 0,83333 0,93333 0,93333 1 f% F% 25 % 20 % 18 % 12 % 13 % 5% 0 7% 100 25 % 45 % 63 % 75 % 88 % 93 % 0 100 % En el 75% de los locales entran como máximo 3 personas así que el horario de atención se mantiene igual. Si este porcentaje fuese mayor a 80, entonces deberían cambiarlo y atender a partir de las 15. 3.- Una empresa consultora ha entrevistado un grupo de 60 personas a las cuales les han preguntado la edad. Se obtuvieron los siguientes datos: 23 19 23 26 27 34 31 32 36 26 21 39 40 38 24 41 38 34 21 32 42 41 25 39 37 35 26 28 22 39 32 24 29 33 32 36 27 30 35 24 27 30 22 32 35 20 33 24 28 26 19 25 27 33 35 21 23 29 31 37 a) Agrupe los datos en intervalos de amplitud 3 y construya una tabla de distribución de frecuencias absolutas, relativas, porcentuales y acumuladas. Indique en cual intervalo se encuentra la mediana y calcule el promedio de la distribución (tomando la marca de clase de cada intervalo). Represente las frecuencias absolutas en un histograma. DATOS ORDENADOS 19 29 39 19 29 39 20 30 40 21 30 41 21 31 41 21 31 42 22 32 22 32 23 32 23 32 23 32 24 33 24 33 24 33 24 34 25 34 25 35 26 35 26 35 26 35 26 36 27 36 27 37 27 37 27 38 TABLA DE DISTRIBUCION EDAD Marca de Clase f fa fr FR acum. f% F% acum [𝟏𝟗 − 𝟐𝟐) 20,50 6 6 1/10 6/60 10 % 10% [𝟐𝟐 − 𝟐𝟓) 23,50 9 15 3/20 15/60 15 % 25% [𝟐𝟓 − 𝟐𝟖 26,50 10 25 1/6 25/60 17 % 42% [𝟐𝟖 − 𝟑𝟏) 29,50 6 31 1/10 31/60 10 % 52% [𝟑𝟏 − 𝟑𝟒) 32,50 10 41 1/6 41/60 17 % 69% [𝟑𝟒 − 𝟑𝟕 35,50 8 49 2/15 49/60 13 % 82% [𝟑𝟕 − 𝟒𝟎) 38,50 7 56 1/9 56/60 12 % 94% [𝟒𝟎 − 𝟒𝟑) 41,50 4 60 1/15 60/60 6% 100% 60 1 100 % MEDIA O PROMEDIO EDAD Marca de Clase f fa fr FR acum. f% F% acum [𝟏𝟗 − 𝟐𝟐) 20,50 6 6 123 1/10 6/60 10 % 10% [𝟐𝟐 − 𝟐𝟓) 23,50 9 15 211,50 3/20 15/60 15 % 25% [𝟐𝟓 − 𝟐𝟖 26,50 10 25 265 1/6 25/60 17 % 42% [𝟐𝟖 − 𝟑𝟏) 29,50 6 31 177 1/10 31/60 10 % 52% [𝟑𝟏 − 𝟑𝟒) 32,50 10 41 325 1/6 41/60 17 % 69% 𝒙𝒊 × 𝒇𝒊 28 38 28 39 [𝟑𝟒 − 𝟑𝟕 35,50 8 49 284 2/15 49/60 13 % 82% [𝟑𝟕 − 𝟒𝟎) 38,50 7 56 269,50 1/9 56/60 12 % 94% [𝟒𝟎 − 𝟒𝟑) 41,50 4 60 166 1/15 60/60 6% 100% 1791 1 60 100 % ∑𝑥𝑖 . 𝑓𝑖 𝑁 1821 𝑋̅ = 60 𝑋̅ = 30,35 𝑋̅ = MEDIANA EDAD Marca de Clase f Fa fr FR acum. f% F% acum [𝟏𝟗 − 𝟐𝟐) 20,50 6 6 123 1/10 6/60 10 % 10% [𝟐𝟐 − 𝟐𝟓) 23,50 9 15 211,50 3/20 15/60 15 % 25% [𝟐𝟓 − 𝟐𝟖 26,50 10 25 265 1/6 25/60 17 % 42% [𝟐𝟖 − 𝟑𝟏) 29,50 6 31 177 1/10 31/60 10 % 52% [𝟑𝟏 − 𝟑𝟒) 32,50 10 41 325 1/6 41/60 17 % 69% [𝟑𝟒 − 𝟑𝟕 35,50 8 49 284 2/15 49/60 13 % 82% [𝟑𝟕 − 𝟒𝟎) 38,50 7 56 269,50 1/9 56/60 12 % 94% [𝟒𝟎 − 𝟒𝟑) 41,50 4 60 166 1/15 60/60 6% 100% 𝒙𝒊 × 𝒇𝒊 60 𝑀𝑒 = 𝐿𝑖 + 𝑛 −𝐹𝑖−1 2 𝑓𝑖 1791 1 100 % 𝑥 𝐴𝑖 DATOS 𝐿𝑖 = 28 N=60 𝐹𝑖−1 = 25 𝑓𝑖 = 6 𝐴𝑖 = 3 𝑀𝑒 = 𝑀𝑒 = 𝑀𝑒 = 𝑀𝑒 = 𝑀𝑒 = 𝑴𝒆 = 60 − 25 28 + 2 𝑥3 6 30 − 25 28 + 𝑥3 6 5 28 + 𝑥 3 6 15 28 + 6 28 + 2,5 𝟑𝟎, 𝟓𝟎 MODA EDAD Marca de Clase f Fa fr FR acum. f% F% acum [𝟏𝟗 − 𝟐𝟐) 20,50 6 6 123 1/10 6/60 10 % 10% [𝟐𝟐 − 𝟐𝟓) 23,50 9 15 211,50 3/20 15/60 15 % 25% [𝟐𝟓 − 𝟐𝟖 26,50 10 25 265 1/6 25/60 17 % 42% [𝟐𝟖 − 𝟑𝟏) 29,50 6 31 177 1/10 31/60 10 % 52% [𝟑𝟏 − 𝟑𝟒) 32,50 10 41 325 1/6 41/60 17 % 69% [𝟑𝟒 − 𝟑𝟕 35,50 8 49 284 2/15 49/60 13 % 82% [𝟑𝟕 − 𝟒𝟎) 38,50 7 56 269,50 1/9 56/60 12 % 94% [𝟒𝟎 − 𝟒𝟑) 41,50 4 60 166 1/15 60/60 6% 100% 𝒙𝒊 × 𝒇𝒊 60 𝑀𝑜 = 𝐿𝑖 + 1791 1 100 % 𝑓𝑖 − 𝑓𝑖−1 × 𝐴𝑖 (𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 ) DATOS 𝐿𝑖 = 28 𝑓𝑖 = 6 𝑓𝑖−1 = 10 𝑓𝑖+1 = 10 𝐴𝑖 = 3 6 − 10 ×3 (6 − 10) + (6 − 10) −4 𝑀𝑜 = 28 + ×3 (−4) + (−4) −4 𝑀𝑜 = 28 + ×3 (−8) 𝑀𝑜 = 28 + 𝑀𝑜 = 28 + 0,5 × 3 𝑀𝑜 = 28 + 1,5 𝑀𝑜 = 28 + 1,5 𝑴𝒐 = 𝟐𝟗, 𝟓𝟎 histograma de edades de los encuestados 12 9 personas 10 8 10 10 8 6 6 7 6 4 4 2 0 19-22 22-25 25-28 28-31 31-34 34-37 37-40 40-43 edades b) Si esta población de 60 personas se divide en quintiles, indique la cantidad de personas que componen cada uno de ellos y la edad máxima para cada quintil. EDAD Marca de Clase f Fa fr FR acum. f% F% acum [𝟏𝟗 − 𝟐𝟐) 20,50 6 6 123 1/10 6/60 10 % 10% [𝟐𝟐 − 𝟐𝟓) 23,50 9 15 211,50 3/20 15/60 15 % 25% [𝟐𝟓 − 𝟐𝟖 26,50 10 25 265 1/6 25/60 17 % 42% [𝟐𝟖 − 𝟑𝟏) 29,50 6 31 177 1/10 31/60 10 % 52% [𝟑𝟏 − 𝟑𝟒) 32,50 10 41 325 1/6 41/60 17 % 69% [𝟑𝟒 − 𝟑𝟕 35,50 8 49 284 2/15 49/60 13 % 82% [𝟑𝟕 − 𝟒𝟎) 38,50 7 56 269,50 1/9 56/60 12 % 94% [𝟒𝟎 − 𝟒𝟑) 41,50 4 60 166 1/15 60/60 6% 100% 1791 1 𝒙𝒊 × 𝒇𝒊 60 100 % La cantidad de personas que componen cada quintil es de 12 persona que equivale a un 20% Para determinar la edad máxima de cada quintil se utiliza la siguiente formula 𝑸𝟏 = 1.60 = 𝟏𝟐 5 𝑸𝟐 = 2.60 = 𝟐𝟒 5 𝑸𝟑 = 3.60 = 𝟑𝟔 5 𝑸𝟒 = 4.60 = 𝟒𝟖 5 𝑸𝟓 = 5.60 = 𝟔𝟎 5 𝐾𝑛 −𝐹𝑖−1 5 𝑄𝑘= 𝐿𝑖 + 𝐴 ( 𝐹 𝑖− 𝐹𝑖−1 ) 12−6 6 𝑄1= 22 + 3 (9) 𝒌𝒏 𝟓 𝐾𝑛 1×60 60 5 5 5 POSICION 𝐿𝑖= 22 𝑄1= 22 + 3 (15−6) 𝑸𝒌 = 𝐹𝑖= 15 12 F 𝐹𝑖−1= 6 𝐴 (𝐿𝑠− 𝐿𝑖 ) = 3 𝑄1= 22 + 3 × 0,666666666 𝑄1= 22 + 1,999999998 𝑸𝟏= 𝟐𝟒 EN EL QUINTIL 1 SON 12 PERSONAS (20%) Y LA EDAD MAXIMA ES 24 AÑOS 𝐾𝑛 𝑄𝑘= 𝐿𝑖 + 𝐴 ( 𝐹5 −𝐹𝑖−1 𝑖− 𝐹𝑖−1 ) POSICION 𝐾𝑛 2×60 120 5 5 5 𝐿𝑖= 25 𝐹𝑖= 25 24 F 𝐹𝑖−1= 15 𝐴 (𝐿𝑠− 𝐿𝑖 ) = 3 24−15 𝑄2= 25 + 3 (25−15) 9 𝑄2= 25 + 3 (10) 𝑄2= 25 + 3 × 0,9 𝑄2= 25 + 2,7 𝑸𝟐= 𝟐𝟕, 𝟕𝟎 EN EL QUINTIL 2 SON 12 PERSONAS (20%) Y LA EDAD MAXIMA ES 27,70 AÑOS 𝐾𝑛 −𝐹𝑖−1 5 𝑄𝑘= 𝐿𝑖 + 𝐴 ( 𝐹 𝑖− 𝐹𝑖−1 ) POSICION 𝐾𝑛 3×60 180 5 5 5 𝐿𝑖= 31 𝐹𝑖= 41 36 F 𝐹𝑖−1= 31 𝐴 (𝐿𝑠− 𝐿𝑖 ) = 3 36−31 𝑄3= 31 + 3 (41−31) 5 𝑄3= 31 + 3 (10) 𝑄3= 31 + 3 × 0,5 𝑄3= 31 + 1,5 𝑸𝟑= 𝟑𝟐, 𝟓𝟎 EN EL QUINTIL 3 SON 12 PERSONAS (20%) Y LA EDAD MAXIMA ES 32,50 AÑOS 𝐾𝑛 −𝐹𝑖−1 5 𝑄𝑘= 𝐿𝑖 + 𝐴 ( 𝐹 𝑖− 𝐹𝑖−1 ) POSICION 𝐿𝑖= 34 48−41 𝑄4= 34 + 3 (49−41) 7 𝑄4= 34 + 3 (8) 𝐾𝑛 4×60 240 5 5 5 𝐹𝑖= 49 48 F 𝐹𝑖−1= 41 𝐴 (𝐿𝑠− 𝐿𝑖 ) = 3 𝑄4= 34 + 3 × 0,875 𝑄4= 34 + 2,625 𝑸𝟒= 𝟑𝟔, 𝟔𝟐𝟓 EN EL QUINTIL 4 SON 12 PERSONAS (20%) Y LA EDAD MAXIMA ES 36,625 AÑOS 𝐾𝑛 𝑄𝑘= 𝐿𝑖 + 𝐴 ( 𝐹5 −𝐹𝑖−1 𝑖− 𝐹𝑖−1 ) POSICION 𝐿𝑖= 40 𝐾𝑛 5×60 300 5 5 5 60 F 𝐹𝑖= 60 60−56 𝑄5= 40 + 3 (60−56) 4 𝑄5= 40 + 3 (4) 𝑄5= 40 + 3 × 1 𝑄5= 40 + 3 𝑸𝟓= 𝟒𝟑 EN EL QUINTIL 5 SON 12 PERSONAS (20%) Y LA EDAD MAXIMA ES 43 AÑOS 𝐹𝑖−1= 56 𝐴 (𝐿𝑠− 𝐿𝑖 ) = 3