Universidad de San Carlos de Guatemala. Facultad de Ciencias Económicas. Escuela de Economía. Departamento de Matemática y Estadística. Curso: Econometría. Catedrático: Sergio Alejandro García Guinea. LABORATORIO 27/07/2016 Parte I. Falso y Verdadero. Si su respuesta es falsa debe establecer por qué el enunciado es falso. 1. La distribución z se utiliza para muestras menores a 30. 2. La variable endógena es la variable independiente del modelo. 3. Según la forma funcional de los modelos se dividen en uniecuacionales y multiecuacionales. 4. Según el número de ecuaciones los modelos se definen en lineales y no lineales. 5. La linealidad de los parámetros se refiere a que los betas son elevados a la tercera potencia. 6. Los valores que toma el regresor X son considerados fijos en muestreo repetido. 7. La especificación de un modelo forma parte de los supuestos de MCO. 8. Homocedasticidad se refiere a que los errores no son los mismos para todas los todas las observaciones. 9. El número de observaciones debe ser mayor que el número de parámetros a estimar. 10.Los grados de libertad es igual al tamaño de la muestra. 11.La función de la constante es lograr un mejor ajuste de la línea de regresión poblacional. 12.Si las variables X e Y están correlacionas negativamente, el parámetro la pendiente (b1) será negativo. 13.La pendiente (b1) tiene una interpretación de una derivada parcial. 14.La pendiente me indica el grado de asociación lineal entre las variables. 15.El termino error es la sumatoria entre el valor observado y el estimado. 16.R2 mide cuanto se relacionan las variables. 17.Covarianza mide en que porcentaje la variable X explica a la variable Y. 18.Si r es igual a cero, se concluye que existe relación lineal entre las variables. 19.r me indica es que porcentaje la variable x explica a la variable y. 20.Sesgo e ineficiencia son dos características indeseables en cualquier estimador o parámetro. 21.Eficiencia se refiere a que la varianza del estimador sea mínima. 22.Si el valor p es menor que el error, se rechaza la hipótesis nula. 23.Sesgo es cuando el valor del parámetro estimado, es distinto al verdadero valor poblacional. 24.El insesgamiento es una propiedad de los estimadores poblacionales. 25.Homocedasticidad existe cuando hay varianza constante. 26.Si la covarianza entre x e y es menor, significa una dependencia lineal negativa entre ambas variables. 27.MCO se puede utilizarse para estimar una función de producción Cobb Douglas (Q=ALb0Kb1). 28.Para utilizar MCO no debe de existir variabilidad en los valores de las variables independientes. 29.MCO puede utilizarse si las variables independientes no son lineales. 30.La variable independiente se conoce como el componente sistemático de la regresión. 31.La constante mide el incremento de Y ante un aumento de X. 32.A mayor varianza del error, mayor será la varianza del estimador (b1). 33.Si el valor p es menor que el nivel de error, se acepta la hipótesis alternativa. 34.El intervalo de del coeficiente de determinación es -1<r<-1. 35.El intervalo del R2 es 0<R2<1. 36.La distribución t se utiliza cuando la muestra es mayor a 30. 37.Tres es el número de parámetros que se estiman en una regresión simple. 38.El estimador es significativo cuando se acepta la hipótesis nula. 39.El estimador es MELI aquel que tiene varianza mínima y es insesgado. 40.Si x e y no tienen correlación alguna, b1 no será estadísticamente distinto de cero. 41.Sean dos modelos de regresión, el primero utiliza constante y el segundo no. Por lo tanto los errores serán mayores en el primero. 42.La varianza disminuye a medida que se incrementa la muestra. 43.Un r=-0.5 se considera un grado de asociación lineal positiva media. 44.El objetivo de MCO es maximizar los errores. 45.Desviación residual es Yi Yˆi . 46.Si la covarianza entre x e y es 0, significa una dependencia lineal entre ambas variables. 47.Estimador puntual es aquel que proporciona varios valores en la estimación. 48.Nivel de significancia es la probabilidad de cometer un error tipo I. 49.El valor p es el nivel mal alto al cual puede rechazarse una hipótesis nula. 50.Consistencia se refiere a que el parámetro se aproxima al verdadero valor poblacional a medida de que la muestra disminuye. 51.MCO es exclusivo para estimar parámetros de funciones lineales. 52.Si el valor t es menor a dos se acepta la hipótesis nula. 53.Si un estimador es eficiente su error estándar en pequeño. 54.La sumatoria de los errores es igual a cero. 55.La existencia de correlación entre los errores y la variable x es normal en MCO. 56.Econometría es la ciencia que utiliza la aplicación de métodos estadístico a los datos económicos. 57.Econometría es una ciencia social. 58.La definición funcional de econometría, la define como la ciencia que trata de cuantificar y predecir el comportamiento entre variables sociales. 59.Los tres elementos relevantes en la definición de econometría son: utilización de técnicas estadísticas-matemáticas y medición de relación económicas. 60.El análisis de regresión es lo mismo que el de correlación. Parte II. Responda a las siguientes preguntas 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. Que es un coeficiente de correlación Que es Coeficiente de determinación. Que es covarianza. Cuál es la interpretación de la constante. Cuál es la interpretación de un R2=0.90. Cuál es la interpretación de la pendiente. Cuál es la diferencia entre correlación y covarianza. Que es econometría. Cuáles son los elementos que se necesitan para realizar una prueba de hipótesis utilizando una distribución t. Describa con sus propias palabras cada uno de los supuestos de MCO. Cuáles son los supuestos de MCO que el investigador puede evitar que se provoque una violación. Que es insesgamiento. Cuál es la conclusión de una hipótesis si el valor que quiero comprobar cae dentro del IC. Que es eficiencia Que es un estimador MELI. Cuando es significativo un estimador. Dibuje una gráfica con un coeficiente de correlación igual a -1. Dibuje una gráfica con un coeficiente de correlación igual a cero. Escriba un modelo matemático y econométrico. Describa en un diagrama los pasos necesarios para poder estimar un modelo en el programa Eviews. Que determina el área de rechazo en una prueba de hipótesis utilizando la distribución t. Cuál es el componente sistémico de un modelo econométrico. Cuál es el componente aleatorio de un modelo econométrico. Elabore un diagrama con los pasos necesarios para la elaboración de un modelo econométrico. Cuáles son los tipos de información que se utilizan para la estimación de los parámetros. De qué depende el número de colas para realizar una prueba de hipótesis. Que tipos de relaciones estadísticas pueden existir entre las variables. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. Cuál es la diferencia entre regresión y correlación. Que otro método existe para calcular los parámetros de una función econométrica. Cuáles son los supuestos del teorema Gauss-Markov. Cuál es el objetivo de MCO. Cuáles son los métodos que existen para realizar pruebas de hipótesis. Plantee las hipótesis para establecer si el parámetro b1 es mayor a 1. Que forma tendría en un Diagrama de Ven con un r=0.5. Especifique el modelo econométrico del consumo. Cuál sería la expresión que debe de utilizarse para estimar un modelo en Eviews. De manera gráfica explique la función de utilizar la constante en un modelo. A que se refiere la expresión de que un parámetro sea estadísticamente significativo. Que interpretación tiene un b1 (pendiente) de 1.3 En el modelo de consumo autónomo cual es la interpretación del bo de -800 (constante) Parte III. Resuelva los siguientes problemas (puede realizarlos en Eviews, Excel o utilizando formulas vistas en clase). Problema 1: En un nuevo proceso artesanal de la fabricación de cierto artículo que está implantando, se ha considerado que era interesante ir anotando periódicamente el tiempo medio (medido en minutos) que se utiliza para realizar una pieza (variable Y) y el número de días desde que empezó dicho proceso de fabricación variable X). Con ello, se pretende analizar como los operarios van adaptándose al nuevo proceso, mejorando paulatinamente su ritmo de producción conforme van adquiriendo más experiencia en el. A partir de las cifras recogidas, que aparecen en la tabla adjunto, se decide ajustar una función exponencial que explique el tiempo de fabricación en función del número de días que se lleva trabajando con ese método. X Y 10 35 20 28 30 23 40 20 50 18 60 15 70 13 Desde el correspondiente ajuste propuesto, se pide que determine: a) ¿Qué tiempo se predeciría para la fabricación del artículo cuando se lleven 100 días? b) ¿Qué tiempo transcurriría hasta que el tiempo de fabricación que se prediga sea de 10 minutos? c) ¿Qué porcentaje de tiempo se reduce por cada día que pasa? Problema 2. “Los siguientes datos representan el Producto Nacional Bruto de USA dólares de 1972, entre los años 1960-1980 Año PNB GC AÑO PNB GC AÑO PNB GC 1960 7372 4520 1967 1.0114 6027 1974 1.2480 7636 1961 7566 4614 1968 1.0581 6344 1975 1.2339 7802 1962 8003 4820 1969 1.0876 6579 1976 1.3004 8237 1963 8325 5005 1970 1.0856 6721 1977 1.3717 8639 Se pide: a. Establecer el modelo que explique la relación entre las variables b. Diagrama de dispersión y los gastos de consumo en miles de millones de 1964 8764 5280 1971 1.1224 6968 1978 1.4369 9048 1965 9293 5575 1972 1.1859 7371 1979 1.4830 9309 1966 9848 5857 1973 1.2550 7685 1980 1.4807 9351 c. Determine la ecuación de la recta d. Determinar los coeficientes de r y r2 e. Interpretación de los resultados Problema 3. “Se llevó a cabo un estudio para determinar la relación entre el número de años de experiencia (X) y el salario mensual, en miles de pesetas, (Y) entre los informáticos de una región española. Para ello, se tomó una muestra aleatoria de 17 informáticos y se obtuvieron los siguientes datos. Exper. 13 16 30 2 8 6 Salario 261 332 361 165 264 191 Exper 31 19 20 1 4 10 Salario 364 338 365 169 198 246 Exper 27 25 7 15 13 Salario 360 365 214 310 314 Se pide: a. Establecer el modelo que explique la relación entre las variables b. Diagrama de dispersión c. Determine la ecuación de la recta d. Determinar los coeficientes de r y r2 e. Interpretación de los resultados Problema 4 En la tabla adjunta se presentan el número de páginas y el precio de doce libros técnicos: Páginas 310 300 280 310 precio 350 350 350 730 páginas 400 170 430 230 precio 800 180 700 320 páginas 420 610 420 450 Precio 250 500 540 370 Se pide: a. b. c. d. e. Establecer el modelo que explique la relación entre las variables. Diagrama de dispersión Determine la ecuación de la recta. Determinar los coeficientes de r y r2 Interpretación de los resultados Problema 5. La empresa COLBONA S.A.L. ha trabajado hasta ahora con la hipótesis de que las ventas de un periodo dependen linealmente de los gastos de publicidad efectuados en el periodo anterior. En este momento, le solicitan a usted la realización de un análisis que ponga de manifiesto si la hipótesis hasta ahora mantenida, se puede seguir sosteniendo en función de los datos que le suministras. AÑOS 1987 1988 1989 1990 1991 1992 1993 GASTOS 21 22 25 26 27 29 30 VENTAS 18 19 20 22 23 24 26 En el informe final de su análisis deberá responder las siguientes preguntas: a) Se incrementarán las ventas del periodo siguiente al aumentar los gastos de en publicidad del periodo actual? b) Es adecuado suponer que el ajuste entre estas variables es efectivamente lineal teniendo en cuenta los valores de las variables? Ajuste el modelo lineal e interprete los coeficientes del mismo. Qué porcentaje de la varianza de las ventas n o son explicadas por las variaciones de los gastos en publicidad? c) Cuál será la predicción de las ventas para 1994? Que precisión tendrá este pronóstico? d) Si para el año 1994 se piensa incrementar los gastos de publicidad en un 10% qué incremento relativo cabría esperar para las ventas de 1995 con respecto de 1994 según el modelo ajustado? Problema 6. La factura mensual de gasto telefónico de una pequeña empresa se ha incrementado notablemente en los últimos meses. Los estudios realizados por el administrador de la misma argumentas que el mayor uso de internet dentro de la misma es la principal causa del gasto en teléfono. Lo que ha hecho que se estudie la posibilidad de acogerse a alguno de los múltiples bonos o tarifas especiales que ofrecen las compañías, lo que hasta la fecha no se llevó a cabo. Las últimas cifras mensuales no hacen sino confirmar esta relación: Mes Cuantía de la factura telefónica (Q) Enero 55 Febrero 100 Marzo 118 Abril 120 Mayo 142 Problema 7 En una muestra de familias se han analizado las variables ahorro anual (Y) y renta anual (X), medidas ambas en miles de euros. Los datos obtenidos han sido los siguientes: Ahorro Y Renta X 1.9 1.8 20.5 20.8 2.0 21.2 2.1 21.7 1.9 22.1 2.0 22.3 2.2 22.2 2.3 22.6 2.7 23.1 3.0 23.5 A partir de tales datos se pide: a) Obtener el modelo lineal que explica el ahorro de las familias en función de su renta. b) Que familias aumentarían en un mayor porcentaje su ahorro si su renta se viese incrementada en un 5%, la familia que tiene la menor renta de entre todas o la que posee la mayor renta? c) Cuál será el incremento absoluto del ahorro cuando una familia aumente su renta anual en 500 unidades monetarias? Problema 8 El crecimiento de los niños desde la infancia hasta la adolescencia generalmente sigue un patrón lineal. Se calculó una recta de regresión mediante el método de mínimos cuadrados con datos de las alturas de las niñas norteamericanas de 4 a 9 años y el resultado fue: intercepto =80 y pendiente b = 6. La variable dependiente Y es la altura en cm. Y X es la edad en años. a) Interprete los valores estimados del intercepto y la pendiente b) Cuál será la altura pronosticada de una niña de 8 años. c) Cuál será la altura pronosticada de una mujer de 25 años. Comente el resultado. Problema 9 En 1991 se publicó un trabajo “Diseñando plantas en climas difíciles” en la revista Field Crops Research, los datos usados en la investigación son: Duración Rendimiento 92 1.7 92 2.3 96 1.9 100 2.0 102 1.5 102 1.7 106 1.6 106 1.8 121 1.0 143 0.3 Con X = la duración de la cosecha de los porotos de soya en días, Y = rendimiento de la cosecha en toneladas por hectárea. a) Estime la recta de regresión mediante el método de mínimos cuadrados. Interprete los estimadores en el contexto de la pregunta. b) ¿Existe una relación lineal entre la duración y el rendimiento de la cosecha? c) Verifique los supuestos d) Estime el rendimiento si la duración de la cosecha fue de 104 días. Problema 10 Los datos de la tabla adjunta son el conjunto clásico de datos del test psicológico de Strong sobre retención de memoria. Los datos se tomaban de la siguiente manera: un conjunto de individuos memorizaban una lista de objetos inconexos y pasado un tiempo la recordaban. La variable p indica el porcentaje de retención de memoria en promedio y la variable t es el tiempo transcurrido. El objetivo del estudio era explicar la variable p en función de t. t 1 5 15 30 p 0.84 0.71 0.61 0.56 t 60 120 240 480 p 0.54 0.47 0.45 0.38 Se pide: a. Establecer el modelo que explique la relación entre las variables b. Diagrama de dispersión c. Determine la ecuación de la recta. d. Determinar los coeficientes de r y r2 e. Interpretación de los resultados Problema 11 t 720 1440 2880 5760 p 0.36 0.26 0.20 0.16 De acuerdo con los datos anteriores se le pide (el símbolo de grados es equivalente a un punto): a. Determine la ecuación de la recta. b. Determinar los coeficientes de r y r2 c. Interpretación de los resultados Problema 12 Tiempo de conexión 200 500 700 800 1000 (Minutos) Con el objetivo de estudiar la relación lineal entre el precio de los automóviles y el número de unidades vendidas se procedió a recoger datos sobre tales magnitudes durante el pasado mes en una determinada región. Los resultados obtenidos fueron los siguientes Precio (miles de unidades monetarias) 7.5 9 10.5 12 14 16 18 20.5 23.5 27 Cantidad vendidas (unidades mensuales) 450 425 400 350 325 300 290 280 260 200 En función a los datos recabados para esa región y mes: a) Una empresa radicada en la región tiene previsto para el mes próximo aumentar el precio de su modelo mas vendido en 500 unidades monetarias. Si suponemos como válida la relación lineal entre las dos variables analizadas para los datos del pasado mes ¿Cómo afectaría este hecho a las ventas de dicho modelo? b) Si el modelo más caro de la tabla anterior se abaratase para el mes próximo en 3% ¿cómo variarían las ventas de dicho modelo? Problema 13 Para analizar la relación entre el número de horas semanales estudiadas y la nota obtenida en la asignatura, se han tomado datos sobre una serie de alumnos recopilando los siguientes resultados: Horas X 10 10 20 20 30 30 40 40 Nota Y 7.2 7.7 7.3 7.4 7.7 9.4 9.3 10 Se pide: a. Constrúyase un modelo de regresión que explique la calificación obtenida en función de las horas estudiadas. b. ¿Influye de forma significativa el número de horas de estudio sobre la nota obtenida? Además se sabe: Σxiyi = 1728; Σxi = 200: Σ(xi)2 = 6000; : Σyi = 66; α = 0.05; tα,0.975 = 2.4469 Problema 14 Sea el siguiente análisis de regresión en la cual la variable dependiente son las ventas y la pendiente en no. de kilómetros que recorre un vendedor de ruta. Análisis de regresión (ventas vrs. Ventas) Parámetro Coeficiente Intercepto 46.1094 Pendiente -3.35839 Error estándar 3.01969 1.16257 Estadístico t 15.2696 -2.88877 p-value 0.0000 0.0054 Indique cuál de las siguientes opciones es la única verdadera. a) La variable explicativa no resulta significativa. b) Por cada aumento de 1 km en la distancia a Guatemala las ventas de la tienda aumento en 3.35 unidades monetarias al mes. c) La estimación del beta 1 se interpreta como el incremento porcentual medio sobre las ventas por cada aumento de 1 km en la distancia a Guatemala. d) Si el vendedor recorre 0 kilómetros el venderá 46.1 unidades monetarias. e) ¿Influye de forma significativa el número de horas de estudio sobre la nota obtenida? Parte IV. Investigación 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. Consumo de energía y crecimiento del PIB (frecuencia anual). de recaudación fiscal y PIB (frecuencia trimestral). Cartera de consumo y tasa de interés (frecuencia mensual) PIB de construcción y PIB general (frecuencia trimestral). PIB de industria manufacturera y PIB general (frecuencia trimestral). Consumo e ingreso (frecuencia trimestral). PIB construcción y tasa pasiva (frecuencia trimestral, para ultima calcule un promedio trimestral) Oferta de dólares y tipo de cambio (mensual, para el último dato tome el último T.C. del mes). Gasto de gobierno e ingresos fiscales (frecuencia mensual) Crecimiento del PIB de Guatemala y el de EE.UU (frecuencia anual, tome los últimos diez datos disponibles) Crecimiento del precio del petróleo y el PIB guatemalteco (frecuencia anual). Precio del Petróleo y Oro (frecuencia mensual). Exportaciones y tipo de cambio (frecuencia mensual) PIB de industria manufacturera y PIB de electricidad (frecuencia trimestral). Cartera total de créditos y tasa pasiva (frecuencia mensual) Depósitos de ahorro y tasa activa (frecuencia mensual). Se le pide 1. Construir la base de datos 2. Establecer el modelo que explique la relación entre las variables. 3. Determine la ecuación de la recta. 4. Determinar los coeficientes de r y r2 5. Interpretación de los resultados 6. Establecer mediante pruebas de hipótesis si los parámetros estimados (b0 y b1) son distintos de cero. Notas Únicamente para el caso del PIB anual de Guatemala puede utilizar los últimos diez datos disponibles del nuevo Sistema de Cuentas Nacionales. En el caso del PIB trimestral tome en cuenta todos los datos posibles. Utilice únicamente la tabla t a pesar de que el número de la muestra sea mayor a 30. Todos los incisos corresponde a montos (excluya al inciso 1 y 10 que corresponden a tasas de crecimiento). Los siguientes sitos le pueden ser de utilidad o www.banguat.com.gt o www.sib.gob.gt o www.sat.gob.gt o www.cnee.gob.gt o www.amm.org.gt o www.secmca.org o www.federalreserve.gov o www.imf.org o www.worldbank.org o www.eclac.org o www.segeplan.gob.gt o www.mem.gob.gt