MODELO DE REGRESIÓN SIMPLE Y MÚLTIPLE (Trabajar con calculadora, Excel 2016 y statgraphics Centurion) PROFESOR: Ing. Pedro Walter Gamarra Leiva Ejercicio 1: A partir de la distribución conjunta de las variables cuantitativas X e Y y el correspondiente diagrama de dispersión, dibuja la recta de regresión que mejor se ajuste a la nube de puntos. ¿Cuál será la ecuación de la recta de regresión dibujada?, ¿cuáles serán, por tanto, los valores de β0 y β1? Obtener los valores predichos en Y para distintos valores de X (por ejemplo, para X = 3, para X = 6, para X = 9…). Ejercicio 2: En una muestra de 10 alumnos de enseñanza secundaria se han medido dos variables: rendimiento en el curso, cuantificado como el promedio de las calificaciones de las asignaturas del curso (Y); y el promedio de horas de estudio semanal durante el curso, obtenido a partir de autoinforme de los propios estudiantes (X). Los datos obtenidos son los que se muestran a continuación: Obtener a partir de los mismos: (1) medias y desviaciones típicas de las dos variables [‘a mano’ o, mejor, con la calculadora]; (2) el coeficiente de correlación de Pearson entre ambas variables [ídem]; (3) la ecuación del modelo de regresión lineal de Y sobre X [ídem]; (4) los valores predichos por la ecuación de regresión para cada sujeto ( Yi ); (5) los errores de predicción o 2 residuales para cada sujeto (Ei); (6) la varianza de los errores (𝑆𝑦−𝑥 ); (7) la varianza de Y (𝑆𝑦2 ); (8) la varianza de las puntuaciones predichas (𝑆𝑦2 ) [‘a mano’ o, mejor, con la calculadora]; (9) 2 comprobar que es cierta la igualdad de la descomposición de la varianza (𝑆𝑦2 = 𝑆𝑦2 + 𝑆𝑦−𝑥 ); (10) el coeficiente de determinación [de dos formas: (10.1) a partir de las varianzas; (10.2) a partir del coeficiente de correlación entre X e Y]; (11) interpretar las estimaciones puntuales de los parámetros de la ecuación de regresión obtenidos (b0 y b1); (12) estimar según el modelo de regresión obtenido cuál será la puntuación media obtenida a final de curso para un estudiante que dedique 16 horas de estudio a la semana de promedio. Ejercicio 3. Un ciclista se desplaza en l nea recta con un movimiento uniforme para el cual según las leyes de la mecánica su posición x en un instante t vendrá dada por la ecuación x = x0 + vt donde x0 es la posición inicial y v la velocidad. Se han tomado los siguientes valores de su posición x en metros y el tiempo t en segundos: x (metros) t (segundos) 14 26.2 37.7 51 61.8 76 84.2 2 4 6 8 10 12 14 A partir de estos datos estimar: 1. el coeficiente de correlación 2. los valores de la posición inicial y la velocidad del ciclista por medio de una regresión lineal. 3. el espacio que recorrido por el ciclista transcurridos 9 segundos. 4. el error estándar de la estimación y la fracción de varianza explicada por el modelo. Ejercicio 4. En la siguiente tabla se recogen datos de un experimento en el que se ha analizado el tiempo de secado de un tipo de pintura dependiendo de la cantidad añadida de un compuesto que reduce el tiempo de secado. Tiempo de secado (horas) Aditivo (gramos) 12 10.5 10 9 8.5 8 7.5 7.2 7 1 2 3 4 5 6 7 8 9 Sabiendo que la relación entre la variable tiempo (T) y la cantidad de aditivo (C) se expresa mediante un modelo del tipo T = C siendo y dos constantes, responder a las siguientes cuestiones: 1. dibuje un diagrama de dispersión para veri car que es razonable suponer que la relación es de tipo potencial. 2. los valores de y. 3. el tiempo de secado de la pintura cuando se mezclan 9.5 gramos de aditivo. Ejercicio 5.‐ Se pretenden estimar los gastos en alimentación de una familia en base a la información que proporcionan las variables regresoras “ingresos mensuales” y “número de miembros de la familia”. Para ello se recoge una muestra aleatoria simple de 15 familias, cuyos resultados se facilitan en la tabla adjunta. (El gasto e ingreso se expresan en cien mil soles). Ejercicio 6.‐ Partiendo de la información: (a) Estimar el modelo de regresión (b) Obtener una medida de fiabilidad del ajuste lineal (c) ¿Qué parte de la variabilidad de Y queda explicada a través del plano de regresión? (d) Calcular los coeficientes de correlación lineal simple Ejercicio 7.‐ El gerente de una empresa estudia las posibles relaciones entre beneficios anuales, gastos en publicidad anuales y horas extraordinarias anuales de los empleados. Para ello utiliza datos, de estas tres variables, proporcionadas por algunas empresas del sector. Se desea saber: a) Matriz de varianzas–covarianzas. b) Matriz de correlación. c) ¿Qué porcentaje de la varianza de los beneficios explicaría una función lineal de los gastos en publicidad? d) ¿Qué porcentaje de la varianza de los beneficios explicaría una función lineal de las horas extraordinarias anuales de los empleados? e) Establecer una relación lineal que explique anualmente los beneficios mediante los gastos en publicidad y horas extras. f) Hallar el coeficiente de correlación múltiple. ¿Qué porcentaje de la varianza de beneficios queda, explicado por el modelo lineal obtenido en el apartado anterior? g) Si una empresa destina 900.000 euros a publicidad y sus empleados realizan 500 horas extraordinarias al año, ¿cuál sería la estimación de los beneficios de dicha empresa? h) Coeficientes de correlación parcial de beneficios con gastos en publicidad y de beneficios con horas extras de los empleados. i) Coeficiente de correlación múltiple Ejercicio 8.- Una empresa productora de alimento para aves y requiere calcular el pronóstico de demanda con el método de suavización exponencial. El pronóstico de demanda del período 1 es 2869, pero la demanda para ese periodo fue de 3200. Según cuadro adjunto. La compañía según su criterio asigna α=0,35. Calcular la predicción de ventas para los períodos 13, 14, 15. Ejercicio 9.- Calcule el pronóstico de suavización exponencial para la semana 4, considerando los datos de la siguiente tabla que representan la llegada de pacientes a una clínica en las últimas tres semanas. Tenga en cuenta que = 0.10 Ejercicio 10.- Jim White, gerente de planta de Specific Motors, está intentando planear las necesidades de efectivo, personal y materiales y suministros para cada trimestre del próximo año. Los datos de ventas trimestrales durante los últimos tres años razonablemente parecen reflejar el patrón de resultados estacional que debe esperarse en el futuro. Si Jim pudiera estimar las ventas trimestrales del siguiente año, podría determinar las necesidades de efectivo, material, personal y suministros. Ejercicio 11.- Shirley Johnson, gerente de inventarios, desea desarrollar un sistema de pronóstico a corto plazo para estimar el volumen de inventario que fluye de su almacén todas las semanas. Ella cree que la demanda de inventario por lo general ha sido estable, con algunas ligeras fluctuaciones aleatorias de una semana a la siguiente. Un analista de las oficinas centrales de la empresa sugirió que utilizara un promedio móvil de 3, 5 o 7 semanas. Antes de tomar una decisión, Shirley decidió comparar la precisión de cada una de ellas en relación con el periodo de diez semanas más reciente. Ejercicio 12.- Sean las ventas semanales de gasolina (en miles de litros) de un establecimiento la variable que se desea pronosticar; utilizando el método de Media móvil de orden 2, 3 y 4. Ejercicio 13.- Siguiendo con el mismo ejemplo de las ventas semanales de gasolina (en miles de litros); utilizando el método de Suavización exponencial simple con α=0.8, realice el pronóstico respectivo y compare los métodos. Cuál es el mejor método para el pronóstico. Ejercicio 14.- El siguiente conjunto de datos reales que representan las ventas de una determinada publicación, durante los últimos 28 meses. Realice el pronóstico con el método de MÉTODO DE SUAVIZACIÓN EXPONENCIAL DOBLE (Método de Brown), hasta el mes 12.