DEPARTAMENTO DE CIENCIAS BASICAS ESTADÍSTICA I CODIGO MA0044 TALLER No. 2 1. Para la siguiente distribución de frecuencias de pesos de los paquetes en una empresa de mensajería: Peso ( en kg) [2,5 - 3) [3 - 3,5) [3,5 - 4) [4 - 4,5) a. b. c. d. e. Número de paquetes (fi) 6 23 12 9 Fi 6 29 41 50 hi 0,120 0,460 0,240 0,180 La moda de la muestra se encontrará en el intervalo 2.5 y 3 Kg La moda de la muestra se encontrará en el intervalo 3 y 3.5 kg La moda de la muestra se encontrará en el intervalo 4 y 4.5 kg La moda de la muestra se encontrará en el intervalo 3.5 y 4 Kg No es posible determinar la moda para esta distribución 2. El gerente de ventas de una compañía que produce accesorios de lujo para el hogar desea seleccionar ciudades del país para establecer salas de exhibición. En qué medida de tendencia central del ingreso familiar por ciudad estará más interesado: a. b. c. d. e. La media aritmética La moda. La mediana Desviación estándar. Cualquiera de las anteriores 3. A continuación se presenta la tabla de distribución de frecuencias del tiempo requerido para tramitar declaraciones de renta ante el ente gubernamental encargado: Tiempo (minutos) 5-8 8-11 Marca de Clase 6,5 9,5 No. de Declaraciones 10 17 1 11-14 14-17 17-20 12,5 15,5 18,5 12 6 2 El punto medio del intervalo de clase modal es igual a: a. b. c. d. e. 12.5 9.5 15.5 6.5 18.5 4. La distribución de acciones de una sociedad es: acciones Accionistas 0-50 23 50-100 72 100-150 62 150-200 48 200-250 19 250-300 8 300-350 14 350-400 7 400-500 7 a. Calcular el número medio de acciones que posee un accionista. b. Número de acciones que más frecuentemente posee un accionista. c. Número de acciones que debe poseer un accionista para que la mitad de los restantes accionistas tengan menos acciones que él. 5. Una firma de asesoría contable lleva un registro del tiempo que se requiere para auditar 50 saldos de cuenta. Tiempo de Auditoria (Minutos) 10-19.99 20-29.99 30-39.99 40-49.99 50-59.99 Marca de clase No. de Registros (fi) 14,5 24,5 34,5 44,5 54,5 3 5 10 12 20 2 Calcule la media del tiempo requerido en esta muestra de registros. 6. La varianza es una medida de: a. Tendencia central b. Posición c. Dispersión d. Ninguna de las anteriores 7. a. b. c. d. No es una característica de la varianza: Se base en las desviaciones al cuadrado de las observaciones con respecto de la media Se expresa en la misma unidad de medida que la variable de estudio Utiliza todas las observaciones en su cálculo Se obtiene de forma diferente para una población y para una muestra. 8. Una vendedora de un supermercado empieza a usar un empaquetado más pesado, lo que aumenta el peso de cada paquete en 50 gramos. ¿Cómo afecta esto la media y la desviación estandar del peso de los paquetes? a. b. c. d. No afecta la media ni la desviación estandar Afecta la media pero no la desviación estandar Afecta la media y la desviación estandar No afecta la media pero si afecta la desviación estándar 9. La temperatura diaria registrada en cierta ciudad en los últimos 11 días se muestra a continuación. Temperatura diaria registrada en grados centígrados 20 22 28 30 32 33 34 41 45 54 57 La varianza y la desviación estándar respectivamente son: a. 14,52 y 1,20 b. 12,0 y 145,2 c. 145,2 y 12,0 d. Ninguna de las anteriores 10. El gerente de una supertienda de una de las localidades de Bogotá estudia la cantidad de artículos que compran los consumidores en el horario de la tarde. A continuación aparece la cantidad comprada de una muestra de 30 consumidores. 3 15 12 5 8 4 6 6 7 11 9 8 14 9 12 5 4 10 6 18 10 6 10 11 5 10 9 13 12 13 5 a. Calcule la media y la mediana de los artículos b. Estime el rango y la desviación estándar c. Calcule la media y la desviación estándar de la distribución de frecuencia, compare los valores con los del inciso a ¿por qué son diferentes? d. Interprete los resultados 11. Los ingresos anuales de cinco vicepresidentes de una compañía en dólares son $125.000, $ 128.000, $ 122.000, $ 133.000 y $ 140.000. Considere estos valores como una población. a. b. c. d. Cuál es el rango Cuál es el ingreso promedio Cuál es la varianza y la desviación estandar También se estudiaron los ingresos anuales de personas de otra empresa similar a esta. La media fue $129.600 y la desviación estándar fue $8.612. Compare las medias y la dispersión de las dos firmas. e. Interprete los resultados Responder las preguntas 12 a la 14 de acuerdo con la siguiente información En la siguiente tabla es un conjunto de datos que contiene información para 25 de las acciones secundarias que analiza la American Asociation of Individual Investors. Las acciones secundarias son acciones ordinarias de compañías pequeñas que los analistas de Wall Street no siguen con detalle. Ventas Anuales: Ventas totales de la compañía en los últimos 12 meses, expresadas en millones de dólares. Rendimiento por Acción: Ganancias totales por acción para los últimos 12 meses, expresadas en dólares. Relación precio a Rendimiento: Precio de mercado por acción dividido entre las ganancias por acción, durante los últimos 12 meses. Empresa Ventas Anuales Rendimiento por Acción Relación precio a Rendimiento Energy South, Inc Industrial Scientific Meridian Diagnostics Merit Medical Systems 74 43.5 36.3 67.2 1.67 2.03 0.46 0.27 13.2 11.5 14.7 24.5 4 Met-Pro Corporation Nobility Homes, Inc Omega Research, Inc Point of Sale Limited Psychemedics Corp Dataram Corporation 61.9 45.8 27.6 12.3 17.6 73.1 1.01 0.87 0.11 0.28 0.13 0.86 12.4 14.7 27.3 25.4 39.4 11.0 12. El diagrama de caja y bigotes para las ventas anuales es: a b c. d. 13. El cuarltil 3 y la mediana para la variable rendimiento por acción son respectivamente a. 1.01 y 0.86 b. 0.46 y 1.01 c. 1.01 y 0.66 d. 0.27 y 1.01 14. El decil 4 y el percentil 65 para la variable Relación precio a Rendimiento son respectivamente a. 14.7 y 13.95 b. 13.95 y 24.5 c. 13.2 y 25.4 d. 25.4 y 13.95 Responder las preguntas 15 y 16 de acuerdo con la siguiente información A continuación se presentauna distribución de frecuencias de la duración de 20 llamadas telefónicas de larga distancia, en minutos. Duracion(Minutos) Frecuencia 4-7 4 8-11 5 5 12-15 16-19 20-23 24-27 7 2 1 1 15. El diagrama de caja y bigotes correspondiente a la distribución anterior es a. b. C d 16. El percentil 23 y el decil 8 son respectivamente a. 1 y 5 b. 8.36 y 15 c. 5.36 y 8 d. 8.36 y 9 17. A continuación aparece una muestra de ventas anuales, en millones de pesos, de 21 empresas farmacéuticas 8408 1374 1872 8879 2459 11413 608 14138 6452 1850 2818 1356 10498 7478 4019 4341 739 2127 3653 5794 8305 Construya el diagrama caja y biogtes para los datos anteriores Existen valores atípicos? Consulte un método que le permita establecer tal conclusión 18. En la tabla siguiente se muestra la distribución de frecuencias de tiempos de auditoria (en días, necesarios para terminar auditorías de fin de año por parte de la empresa de contabilidad Sanderson y Clifford) para una muestra de 20 clientes Timpo de Auditoría(Días) Frecuencia (Fi) 10--14 4 15--19 8 20--24 5 25---29 2 30--34 1 6 Construya el diagrama caja y biogtes para los datos anteriores Calcule percentiles 8, 46 y 79 19. De acuerdo con la siguiente distribución simétrica en forma de campana podemos interpretar que: a. b. c. d. Representa una distribución con media 80 y desviación estándar 30. Representa una distribución con media 90 y desviación estándar 20. Representa una distribución con media 100 y desviación estándar 10. Representa una distribución con media 110 y desviación estándar 5 . RESPONDA LA PREGUNTA 20 Y 21 DE ACUERDO CON LA SIGUIENTE INFORMACIÓN: El departamento de control de calidad de una empresa supervisa constantemente tres líneas de producción de hornos. El horno está diseñado para precalentarse a 240 grados Fahrenheit en cuatro minutos y después detenerse. Sin embargo, puede ser que el horno no alcance los 240 grados Fahrenheit debido a una instalación inadecuada. De igual manera la temperatura puede subir más allá de los 240 grados en el ciclo de cuatro minutos de precalentamiento. Una muestra amplia de cada una de las tres líneas de producción produjo la siguiente información: Temperatura (°F) Estadísticos Línea 1 Línea 2 Línea 3 Media aritmética 238.1 240.0 242.9 Mediana 240.0 240.0 240.0 Desviación estándar 3.0 0.4 3.9 Desviación media 1.9 0.2 2.2 20. ¿Cuál de la línea ó líneas tiene una distribución de campana? a. b. c. d. Línea 1 Línea 2 Línea 3 Línea 1 y 2 7 21. De acuerdo con la regla empírica, el 95 por ciento de las temperaturas leídas en la línea 2 están entre: a. b. c. d. 239.5 y 240.5 239.4 y 240.6 239.3 y 240.7 239.2 y 240.8 22. La distribución de una muestra de los diámetros exteriores de tubo para gas PVC, sigue aproximadamente una distribución simétrica de campana. La media aritmética de los tubos de la muestra es 14,0 pulgadas y la desviación estándar es 0,1 pulgadas. De acuerdo con esta información podemos decir que: a. Aproximadamente el 68% de los diámetros exteriores están entre 13.9 y 14.1 que se obtienen de 14.0 ± 1(0.1). b. Aproximadamente el 68% de los diámetros exteriores están entre 13.8 y 14.2 que se obtienen de 14.0 ± 2(0.1). c. Aproximadamente el 68% de los diámetros exteriores están entre 13.7 y 14.3 que se obtienen de 14.0 ± 3(0.1). d. Aproximadamente el 68% de los diámetros exteriores están entre 13.6 y 14.4 que se obtienen de 14.0 ± 4(0.1). Una muestra del gasto de alimentos de un ciudadano de la tercera edad que vive solo se aproxima a una distribución simétrica, de forma de campana. La media muestral es $150.000 y la desviación estándar es $20.000. Usando la regla empírica. a. ¿Entre qué dos cantidades está el 69 por ciento de los gastos mensuales en alimentación? b. ¿Entre qué dos cantidades están casi todos los gastos mensuales en alimentación? 23. Una de estas afirmaciones es correcta con respecto al modelo de regresión lineal, identifique cual: a. Si X y Y se relacionan en forma lineal, entonces a medida de que X cambia, Y cambia en una cantidad constante. b. Si X y Y se relacionan en forma lineal, entonces a medida que X cambia, Y cambiara en una cantidad diferente a medida que X cambia c. La variable independiente es la variable que se desea explicar o predecir d. La variable dependiente es la variable explicativa 24. El método de mínimos cuadrados ordinarios garantiza: a. Producir una recta que indique siempre una relación buena entre dos variables b. Producir una recta que se extiende por el centro del diagrama de dispersión y que se aproxima a todos los datos más que cualquier otra 8 c. Generar una recta en la cual todas las observaciones caigan exactamente sobre ella d. Generar una recta que se extienda por el diagrama de dispersión y que presente un coeficiente de correlación cercano a 1. 25. Uno de los siguientes enunciados no es correcto, identifique cual: a. En un análisis de regresión lineal, el número de consumidores en el mercado seria la variable independiente y la demanda del producto seria la variable dependiente b. Un coeficiente de correlación de 0,87 indica una fuerte relación inversamente proporcional entre 2 variables c. La pendiente en un modelo de regresión indica en cuanto se incrementa la variable dependiente cuando existe un cambio en la variable independiente d. El coeficiente de determinación revela que porcentaje del cambio de Y se explica por un cambio de X. 26. Un banco especializado en créditos para vivienda intenta analizar el mercado de finca raíz midiendo el poder explicativo que las tasas de interés tienen sobre el número de casas vendidas en la ciudad. Se compilaron los datos para un periodo de 10 meses. Mes 1 Interés Número de casas 12,3 196 2 10,5 285 3 15,6 125 4 9,5 225 5 10,5 248 6 9,3 303 7 8,7 265 8 14,2 102 9 15,2 105 10 12 114 A través del uso del Excel, realice: a. Un diagrama de dispersión para los datos b. Calcule e interprete el modelo de regresión c. Calcule e interprete el coeficiente de correlación y de determinación d. Si la tasa de interés es del 9,5%, ¿Cuántas casas se venderán de acuerdo al modelo? 9 27. Se selecciono una muestra aleatoria de 12 compañías la siguiente tabla representa las ventas y las ganancias en miles de dólares. COMPAÑIA VENTAS GANANCIAS 1 89.2 4.9 2 18.6 4.4 3 71.7 8.0 4 58.6 6.6 5 46.8 4.1 6 17.5 2.6 7 11.9 1.7 8 19.6 3.5 9 51.2 8.2 10 28.6 6.0 11 69.2 12.8 12 18.2 1.3 Sea ventas la variable independiente y ganancias la variable dependiente. a. Dibuje un diagrama de dispersión b. Determine la ecuación de regresión. c. Interprete lo que encontró en la parte b y en la parte c. d. Determine el coeficiente de correlación y el coeficiente de determinación. e. Estime las ganancias de una compañía pequeña que tiene 50.0 millones de dólares en ventas 28. En una Ecuación de Regresión Lineal la pendiente indica: a. b. c. d. El crecimiento ó decrecimiento de la variable independiente El crecimiento ó decrecimiento de la variable dependiente La relación que existe ente la variable dependiente y la independiente No indica nada 29. El método de Mínimos Cuadrados: a. b. c. d. Busca establecer el comportamiento de dos variables, individualmente consideradas Consiste en ajustar una recta a un conjunto de valores dispersos Representa gráficamente un conjunto de datos No lo conozco 30. La ecuación de regresión determinada por Y = 0,35 – 1,24X Indica que: a. Existe una relación directa entre X y Y. b. Por un incremento de una unidad para X, la variable Y se incrementa 0,35 unidades. 10 c. Si X se incrementa una unidad, Y se disminuye en 1,24 unidades. d. La pendiente de la recta de ajuste del modelo es 1,24. 31. El coeficiente de determinación R2 indica: a. El grado de relación lineal entre la variable dependiente y la variable independiente. b. La pendiente de la recta de ajuste del modelo. c. El error estándar estimado del modelo de regresión d. El porcentaje de varianza de la variable dependiente explicada por la variación de la variable independiente. 32. Dado el siguiente conjunto de datos (x , y) se puede concluir. x 3 5 8 4 y 7 11 17 9 a. b. c. d. Existe una relación lineal positiva y perfecta entre x y y. Existe relación lineal con pendiente negativa = -2 La pendiente del modelo es 1. El coeficiente de determinación del modelo es 0,85. 33. Con el siguiente conjunto de datos x 1 3 y 50 30 La ecuación de regresión obtenida es: a. b. c. d. 10 21 Y = 47,1 Y = 3,1 Y = 47,1 Y= 3,1 5 25 7 20 9 18 + 3,1 x + 47,7 x - 3.7 x - 47,7 x 34. En el ejercicio anterior el coeficiente de determinación del modelo es 0,8307 luego se puede obtener el coeficiente de correlación lineal y es: a. b. c. d. r = 0.6900 r = -0,6900 r = 0,9114 r = -0,9114 34. Una escuela de básica primaria solicita a los padres de familia adquirir textos escolares que apoyaran el proceso pedagógico de los docentes. Como es sabido por las directivas Institucionales, los ingresos de los padres de familia son muy reducidos, por tanto estudia la relación entre los ingresos mensuales de los padres y la cantidad de textos adquiridos. Los datos se presentan en el siguiente diagrama. 11 TEXTOS ADQUIRIDOS 7 cantidad de textos 6 5 4 3 2 1 0 440 450 460 470 480 490 500 510 ingresos m ensuales (m iles $) a. b. c. d. ¿Cuál es el nombre que se da a este diagrama? ¿Cuántos padres de familia se incluyeron en la muestra? ¿Cuál es la variable dependiente? ¿Cómo caracteriza la relación entre el ingreso de los padres y la cantidad de textos que han adquiridos? 35.La Empresa de Acueducto y Alcantarillado de Bogotá está lanzando programas de concientización del uso adecuado del agua. Entre otros temas desea saber si existe relación entre el número de personas que habitan cada vivienda y el consumo en m3 de agua. Para tal fin se consideraron los datos de una muestra aleatoria con la siguiente información: Nº personas por vivienda Consumo ( m ) 3 2 15 4 19 6 25 7 38 8 34 a. Decida cuál es la variable independiente (X) y cuál la dependiente (Y). b. Elabore un diagrama de dispersión de los datos. c. Halle la ecuación de la recta de regresión mínima cuadrática del consumo de agua con respecto al número de personas por vivienda. d. Determine el coeficiente de correlación (R) y concluya. e. Determine el coeficiente de determinación (R 2 ) y concluya. f. ¿Cuál es el consumo de agua esperado en una vivienda con 11 habitantes? g. Si una vivienda registra un consumo de 45 m3 de agua, ¿cuántas personas se espera que vivan allí? 12 36..Se piensa que el número de libras de vapor utilizadas por mes por una planta química, está relacionado con la temperatura ambiente promedio (grados Fahrenheit) de ese mes. En la tabla siguiente se muestra el uso de vapor de un año y la temperatura del mes correspondiente. Mes Enero Febrero Marzo Abril Mayo Junio Temperatura 21 24 32 47 50 59 Uso/1000 185,79 214,47 288,03 424,84 454,58 539,03 Mes Temperatura Julio 68 Agosto 74 Septiembre 62 Octubre 50 Noviembre 41 Diciembre 30 Uso/1000 621,55 675,06 562,03 452,93 369,96 273,98 a. Ajuste un modelo de regresión que relacione el uso del vapor Y con la temperatura promedio de cada mes (X). b. Determine el estimado de libras de vapor para una temperatura de 55 grados Fahrenheit c. ¿Cuál es el cambio esperado en el uso promedio del vapor cuando la temperatura se incrementa 2 grados Fahrenheit. d. Suponga que la temperatura mensual promedio es de 47 grados Fahrenheit. Calcule el valor ajustado de Y y el residuo correspondiente e. Calcule el coeficiente de determinación múltiple y el coeficiente de determinación ajustado f. Construya un intervalo de confianza del 95% para la cantidad de vapor utilizada en cualquier mes g. Realice las pruebas sobre el modelo y sobre los coeficientes. 13