Manual de Prácticas de Estadística General 2.................................................................. 17 6. CASO 1: EXPORTACIONES DE COSTA RICA Uno de los mayores problemas de Costa Rica es la poca dinámica en el nivel de exportaciones. Producto de lo anterior, el gobierno de turno desea impulsar un proyecto para estimular la pequeña y mediana empresa (PYMES). De manera, que se desea conocer la proporción de empresas que tienen interés en exportar. 1. Aproximadamente existen en el país cerca de 1700 empresas tipo PYMES, por lo tanto se decidió estimar la proporción de empresas que exportan, por medio de una muestra (sin reemplazo), que garantice un error de muestreo máximo de 0,04 con un nivel de confianza del 92%. Tomando en cuenta que el interés por exportar ha sido un factor de máximo desacuerdo entre las empresas (opiniones demasiado heterogéneas), determine el tamaño de muestra 2. Para enriquecer el análisis conviene distribuir las PYMES según el tamaño de la siguiente manera: PYMES POBLACIÓN VARIANCIA* Pequeñas 1100 60 Medianas 600 210 * variancia del volumen de ventas Con base en los datos de la tabla anterior, distribuya una muestra de 500 2.1 Utilizando el criterio de afijación proporcional 2.2 Utilizando el criterio de afijación óptima 2.3 Compare los resultados de 2.1 y 2.2 y explique las razones de las diferencias en los resultados 3. Una oficina gubernamental realizó una investigación seleccionando dos regiones geográficas del país, luego seleccionó tres cantones en cada región seleccionada, para finalmente seleccionar cinco empresas en cada cantón. Después de consultar a las empresas seleccionada, se determinó un volumen total de ventas por ¢900 millones. 3.1 Qué tipo de muestreo se utilizó y por qué? 3.2 Determine el promedio del volumen de ventas de las empresas 3.3 Indique una desventaja para utilizar muestreo sistemático 4. Como resultado de investigar una muestra aleatoria con reemplazo de 42 empresas medianas, se concluyó que tienen un promedio de ventas de ¢120 millones anuales, con una desviación estándar de ¢40 millones. 4.1 Con base en los datos anteriores, calcule e interprete un intervalo de confianza para el promedio poblacional de las ventas. Utilice un nivel de confianza del 90% 4.2 Si la usted le advirtieran que la variable (ventas de las empresas) no se distribuye normalmente, aún así mantendría Ud el resultado obtenido en 4.1 ? Justifique su respuesta 5. Después de analizar a 40 empresas pequeñas se logró construir el siguiente intervalo de confianza P(24 < µ < 48) = 0,95, determine el error de muestreo. 6. En una muestra de 21 empresas medianas se encontró un error de muestreo de 8, con una desviación estándar de 14,5 , encuentre el nivel de confianza del intervalo con el que se podría trabajar. (Omita el uso del factor de corrección) Manual de Prácticas de Estadística General 2.................................................................. 18 CASO 2: EL ARROZ EN COSTA RICA La actividad arrocera del país se encuentra en una grave crisis. Pese a que el consumo del citado producto aumenta con el crecimiento poblacional, la producción nacional del grano ha decaído en los últimos cuatro años. Lo anterior, porque la importación del grano se ha incrementado, gracias a sus precios bajos en el mercado internacional. Producto de lo expuesto, el Instituto Nacional de Seguros únicamente (en el año 2002) aseguró el 9,5% de las fincas sembradas de arroz y se sospecha que la crisis planteada ha influenciado negativamente en el aseguramiento de las cosechas del presente año. 1. Para verificar la sospecha, asuma que se seleccionó una muestra de 120 fincas, de las cuales el 8,9 % estaban aseguradas Con base en los resultados anteriores realice una prueba de hipótesis para demostrar que el porcentaje de fincas aseguradas ha disminuido. Plantee la hipótesis correspondiente, realice la prueba pertinente con un nivel de significancia del 3% y concluya en términos del problema. 2. Según datos de la Corporación Arrocera, el rendimiento por hectárea difiere de la condición del terreno (seco ó húmedo). Por ello, asuma que se seleccionó una muestra de 15 fincas de terreno seco con un rendimiento promedio de 2,36 tm/ha con una desviación estándar de 1,2. A su vez, se seleccionó una muestra de 10 fincas de terreno húmedo que generó un promedio de 3,79 tm/ha, con una desviación estándar de 0,98. 2.1 Con un nivel de significancia del 10%, pruebe que existe diferencia entre los promedios del rendimiento tm/ha de las fincas secas vs húmedas. Concluya en términos del problema 2.2 Cuál es la probabilidad de cometer un error con la decisión tomada en 2.1? Justifique 3. También se tiene el rendimiento del arroz para cuatro zonas y al procesar los valores en excel se dieron los siguientes resultados: Zonas Chorotega (riego) Brunca (secano) Pacífico Central (secano) Huetar Norte (secano) Cuenta 5 6 5 7 Suma Promedio 2,70 2,71 0,97 0,98 Varianza 0,23 0,02 0,04 0,03 ANDEVA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Entre grupos Dentro de los grupos Total 9,014 10,278 Pruebe la hipótesis de por lo menos dos promedios del rendimiento del arroz son diferentes. Complete la tabla de ANDEVA anterior y deje constancia de los cálculos realizados, así como de los valores tabulares. Use un nivel de significancia del 5% y concluya en términos del problema lo presentado. Manual de Prácticas de Estadística General 2.................................................................. 19 4. A continuación se presentan los rendimientos (tm/ha) para 4 variedades de arroz según el mes de siembra: Variedad V1 V2 V3 V4 Enero 0,9 1,3 1,8 2,0 Julio 0,7 1,5 1,7 2,1 Diciembre 0,8 1,4 1,9 2,2 Con los datos anteriores se desea realizar una prueba de hipótesis de que al menos dos promedios de los rendimientos de los meses son diferentes (aislando el efecto de la variedad). Para ello, se utilizó el paquete de cómputo Excel generando los siguientes resultados: Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN V1 V2 V3 V4 Enero Julio Diciembre Cuenta 3 3 3 3 Suma 2,4 4,2 5,4 6,3 Promedio 0,8 1,4 1,8 2,1 Varianza 0,01 0,01 0,01 0,01 4 4 4 6 6 6,3 1,5 1,5 1,575 0,24666667 0,34666667 0,37583333 Además el paquete generó una suma de cuadrados total igual a 2,9225 Realice la prueba respectiva utilizando un nivel de significancia del 5% y concluya en términos del problema Manual de Prácticas de Estadística General 2.................................................................. 20 CASO 3: EVALUACION DEL DESEMPEÑO GANA TERRENO En un estudio realizado por la firma KPMG para el primer semestre del presente año, el 65% de las empresas encuestadas afirmaron tener sistemas de evaluación de desempeño para sus trabajadores, porcentaje que creció un 12% con respecto a los últimos seis meses del 2002. La estrategia es que conforme mejor sea el trabajo, mejor será la paga. 1. Se sospecha que la evaluación del desempeño depende del tipo de empresa. En ese sentido se presenta a continuación la distribución en la sigueinte tabla: TIPO DE EMPRESA CON EVALUACION DEL SIN EVALUACION DEL DESEMPEÑO DESEMPEÑO Financieras 13 1 Industriales 44 10 Servicios 17 11 Comercio 7 7 Con base en la información presentada en el cuadro, determine si la utilización de sistemas de evaluación del desempeño depende del tipo de empresa. Utilice un nivel de confianza del 90% y concluya en términos del problema 2. Se tiene la premisa de que conforme aumente el nivel educativo, se incrementa el nivel de desempeño. Para probar lo anterior se cuenta con los datos de seis empleados de una empresa que les valoró el nivel del desempeño, mediante un instrumento que produce puntajes entre 1 y 80, obteniéndose los siguientes resultados: Nivel educativo 2 1 4 2 3 4 Puntaje evaluación del desempeño 60 50 70 65 70 70 Donde el nivel educativo 1= sin estudios 2= primaria 3= secundaria 4=universitaria Con base en los resultados anteriores calcule el coeficiente de correlación de Spearman para comprobar si existe relación entre las variables estudiadas. 3. Una forma de motivar el empleado es por medio del salario, de manera que se presenta a continuación los aumentos para los últimos seis años: AÑO 1997 1998 1999 2000 2001 2002 AUMENTO SALARIAL (%) 22 18 15 11 14 11 ∑x=11997 ∑y=91 ∑xy=181919 ∑x2= 23988019 ∑y2=1471 3.1 Los años y los aumentos salariales se encuentran asociados linealmente? Calcule el coeficiente respectivo para justificar su respuesta 3.2 Utilizando la bondad de ajuste, considera que sería apropiado utilizar un modelo regresión? Justifique 3.3 Establezca la ecuación de regresión respectiva e interprete el coeficiente de regresión en términos del problema 3.4 Utilizando el modelo de 1.3, estime el aumento para el año 2005 4. Se sospecha que la inflación afecta los aumentos salariales, por tanto se aplicó el modelo de regresión de excel a las variables : inflación, % aumento salarial y año Manual de Prácticas de Estadística General 2.................................................................. 21 Estadísticas de la regresión Coeficiente de correlación 0,914745297 múltiple Coeficiente de determinación R^2 0,836758958 R^2 ajustado 0,727931597 Error típico 2,223190497 Observaciones 6 ANÁLISIS DE VARIANZA Grados de libertad Regresión Residuos Total Coeficientes 1828,942449 0,395739911 -0,90919282 Intercepción Inflación año 4.1 4.2 Suma de Promedio de F cuadrados los cuadrados 2 76,0056054 38,00280269 7,688865647 3 14,827728 4,942575984 5 90,8333333 Error típico 2712,13535 0,44038069 1,35427932 Estadístico t Probabilidad 0,674355153 0,54839968 0,898631379 0,435075207 -0,67134808 0,550068504 Escriba la ecuación de regresión múltiple Estime el aumento para el presente año , con una inflación de 5 CASO 4. FINANCIAMIENTO DE VIVIENDAS En el mercado costarricense se ofrecen una diversidad de opciones para financiar vivienda. Dentro de las tradicionales se encuentra el financiamiento en colones a una tasa de interés alrededor del 18,75%; también se financia viviendas en dólares a tasa del 7% y en los últimos meses se ofrece financiamiento en unidades de desarrollo a tasa de interés del 8% Con base en los datos anteriores y asumiendo una inflación y devaluación del 10%, para adquirir una casa de ¢10,5 millones en un plazo de 14 años, se pagarían las cuotas mensuales presentadas en el gráfico 1, que se presenta a continuación: Gráfico 1 CUOTA EQUIVALENTE EN COLONES A PAGAR POR UN CREDITO DE VIVIENDA DE ¢10,5 MILLONES A 14 AÑOS PLAZO mile s ¢ 500 450 400 350 300 ¢ $ 250 UD 200 150 100 50 di c 20 0 di 4 c 20 0 di 5 c 20 0 di 6 c 20 0 di 7 c 20 0 di 8 c 20 0 di 9 c 20 1 di 0 c 20 1 di 1 c 20 1 di 2 c 20 1 di 3 c 20 1 di 4 c 20 1 di 5 c 20 1 di 6 c 20 17 0 Manual de Prácticas de Estadística General 2.................................................................. 22 Es evidente que tanto el crédito en dólares como en unidades de desarrollo las cuotas son más bajas en los primeros años de cancelación, pero luego se incrementan y superan con creces a la cuota del crédito en colones. 1. Asuma que se seleccionó en forma aleatoria seis entidades del sistema bancario nacional y se encontró que los clientes deben pagar una cuota promedio de ¢177 mil (para un crédito de ¢10,5 millones). Encuentre el error de muestreo del promedio de la cuota del préstamo poblacional al 95% de confianza, si la desviación estándar de la muestra fue de ¢50 mil. Interprete el error de muestreo e indique que supuesto se debe realizar para el cálculo de dicho error 2. Una fuente de información para determinar si los costarricenses pueden pagar las cuotas de los préstamos anteriores, es la Encuesta de Hogares realizada por el INEC en julio del 2003, donde se obtuvo un ingreso por hogar promedio de ¢261.532,00 de una muestra aleatoria sin reemplazo de 13.199 hogares. Si la población de hogares asciende 1.051.606 con una desviación estándar del ingreso de ¢250.000,00 determine un intervalo de confianza para el promedio del ingreso de los hogares del país, con un nivel de confianza del 85% (interprete el resultado final) 3. Según los expertos el ingreso promedio es un estimador consistente. Favor de explicar que significa tal afirmación 4. Indique dos ventajas del muestreo estratificado 5. Bajo que condiciones el muestreo estratificado genera estimaciones más precisas, respecto al muestreo simple al azar 6. La muestra de la Encuesta de Hogares se distribuyó en las regiones de planificación del país, de la siguiente forma: Región de Muestra Población de hogares Desviación estándar Planificación de hogares del ingreso (miles ¢) Central 8.453 673.471 200 Chorotega 1.010 80.511 160 Pacífico Central 704 56.125 150 Brunca 988 78.693 160 Huetar Atlántica 1.340 106.740 120 Huetar Norte 704 56.066 170 Con base en los resultados de la tabla anterior: 6.1 Qué tipo de afijación se utilizó para distribuir la muestra entre las regiones 6.2 Distribuya la muestra original aplicando el criterio de afijación óptima 7. En la muestra de la Región Huetar Norte de la Encuesta citada, se encontraron 144 hogares con jefatura femenina (sin reemplazo). Con base en los datos suministrados, calcule el intervalo de confianza del 90% para la proporción (de hogares con jefatura femenina). Interprete el resultado 8. Asuma que desea realizar un estudio en la Región Huetar Atlántica, a efectos de profundizar sobre el ingreso familiar. De qué tamaño debe ser la muestra (sin reemplazo) en dicha región, si se desea un error de muestreo de ¢10.000,00 y un nivel de confianza del 95% Manual de Prácticas de Estadística General 2.................................................................. 23 9. Si al realizar una encuesta con los lectores de un periódico se les pide que contesten un cuestionario publicado en él, ¿será probable que las respuestas resultantes proporcionen una muestra aleatoria de la opinión de los lectores? Explique CASO 5: FERIAS DEL AGRICULTOR Con el propósito de que los agricultores del país puedan vender sus productos directamente al consumidor, se realizan en las diferentes cantones ferias todos los fines de semana. En dichas ferias los costarricenses pueden adquirir verduras y frutas principalmente. 1. Se tiene la sospecha de que la proporción de personas que compran frutas en la feria de Desamparados es superior a la proporción de personas que compran frutas en la feria de San Carlos. Para verificar tal sospecha, asuma que se seleccionó una muestra de 120 personas que visitan la feria de Desamparados, de las cuales 90 adquieren frutas, a su vez, se seleccionó una muestra de 100 personas que visitan la feria de San Carlos, de las cuales 60 adquieren frutas. Con base en los resultados anteriores, realice una prueba de hipótesis para verificar la sospecha, con un nivel de significancia del 3% y concluya en términos del problema 2. El precio promedio del apio es de ¢300 por kilo en todo el país, sin embargo, dicho precio se podría ver afectado por las lluvias de la actual época, donde la oferta se reduce y el precio tiende a subir. Para comprobar lo planteado, asuma que se tomó una muestra de 21 ferias del país y se encontró un promedio del precio de ¢322, con una desviación estándar de ¢87. a. Con un nivel de significancia del 5%, pruebe que el precio promedio del apio se incrementa en la época lluviosa. Concluya en términos del problema b. De acuerdo a la conclusión de 2.1 calcule la probabilidad de cometer el posible error asociado, asumiendo que el verdadero promedio fuese ¢327,87 3. También se tiene el precio promedio del apio para los cuatro trimestres del año y al procesar los valores en excel se dieron los siguientes resultados: Análisis de varianza de un factor RESUMEN Grupos 1 Trimestre 2 Trimestre 3 Trimestre 4 Trimestre ANÁLISIS DE VARIANZA Origen de las variaciones Entre grupos Dentro de los grupos Total Cuenta 6 6 6 6 Suma 1879 1812 2072 1863 Suma de Grados de libertad cuadrados 6494,833333 3 461,666667 20 6956,500000 23 Promedio Varianza 313,166667 14,566667 302,000000 21,200000 345,333333 23,866667 310,500000 32,700000 Promedio de los cuadrados 2164,944444 23,083333 Manual de Prácticas de Estadística General 2.................................................................. 24 Suponga que usted trabaja para el Ministerio de Agricultura y le interesa conocer si existe una diferencia significativa en del precio del apio según el trimestre de venta, a efectos de importar dicho producto para estabilizar el precio. Realice las pruebas apropiadas, con un nivel de significancia del 5% y concluya en términos del problema. (Deje constancia de los cálculos, según lo visto en clase) 4. Por su parte se consideró la época del año (trimestre) y la zona de la feria en el precio de la coliflor. Por ello a continuación se presentan los precios para los cuatro trimestres y tres zonas del país: 1 trimestre 322 316 312 950 Metropolitana Urbana Rural SUMA 2 trimestre 320 316 311 947 3 trimestre 321 317 311 949 SUMA 1285 1264 1246 3795 4 trimestre 322 315 312 949 Con los datos anteriores se desea realizar una prueba de hipótesis de que al menos dos promedios de la coliflor de los trimestres son diferentes, considerando el efecto de las zonas. Para ello, utilice la prueba correspondiente utilizando un nivel de significancia del 10% y ∑x2 = 1200365 CASO 6: LA CARPIO Los enfrentamientos entre los habitantes de la comunidad conocida como “La Carpio” y la fuerza pública motivó a la Facultad Latinoamericana de Ciencias Sociales (FLACSO) que permitió conocer varios aspectos. Un elemento preocupante es la cantidad de detenciones de jóvenes pertenecientes a pandillas. Dicha situación se aprecia en el gráfico siguiente: DETENCIONES DE JOVENES DE LAS PANDILLAS DE LA CARPIO (enero a mayo 2004) 160 140 detenciones 120 100 80 60 40 20 - 1 2 3 4 5 6 meses Donde 1=enero, 2=febrero, 3=marzo, 4=abril y 5=mayo Se=0,2893236 Σy= 430 Σy2= 43650 Σxy= 1545 Manual de Prácticas de Estadística General 2.................................................................. 25 1. Calcule el coeficiente de determinación e interprételo en términos del problema 2. Pruebe la hipótesis de que el coeficiente de correlación es mayor que 0,4. Utilice un nivel de significancia del 1% 3. Cuántas detenciones de jóvenes de las pandillas de La Carpio se esperan en julio del 2004 (utilice el criterio de los mínimos cuadrados) 4. Calcule e interprete un intervalo de confianza del 95% para la estimación efectuada en el problema 3 5. En el estudio se investigó el nivel de escolaridad por nacionalidad, a fin de estimar su dependencia. Asuma que se seleccionó una muestra de habitantes que se presentan en el siguiente cuadro: DISTRIBUCION DE UNA MUESTRA HABITANTES DE LA CARPIO SEGÚN NIVEL DE ESCOLARIDAD NIVEL DE ESCOLARIDAD TIPO DE HABITANTE Costarricense Extranjero Sin estudios 135 132 Primaria 285 169 Secundaria 173 53 Con base en la información presentada en el cuadro, pruebe que el nivel de escolaridad depende de la nacionalidad del habitante. Utilice un nivel de confianza del 99% y concluya en términos del problema 6. Finalmente en el estudio, se registró el nivel de pobreza de las familias de La Carpio. Asuma que se seleccionó la siguiente muestra de familias, de acuerdo a su nacionalidad: Costarricenses: 1, 2, 1, 2, 3, 2, 2, 2, 3 Extranjeros: 3, 2, 3, 1, 2, 3, 3, 3 Nivel de pobreza: 1= Pobreza leve 2= Pobreza extrema 3=Indigente Pruebe que el nivel de pobreza de las familias de extranjeros de La Carpio es diferente al nivel de pobreza de las familias de los costarricenses de la Carpio, con un nivel de significancia del 5% y concluye en términos del problema CASO 7: CENTROAMÉRICA Y LA UNION EUROPEA MAS ALLA DE UN TLC El arranque del proceso de negociación comercial entre la Unión Europea y Centroamérica podría ser acordado en la próxima cumbre del 12 de mayo en Viena. Sin embargo, es un tema que no deja de inquietar a Costa Rica, país que tiene los aranceles consolidados más altos para los bienes agrícolas e industriales y el menos abierto al sector servicios. Del otro lado del océano, las diferencias en el trato que da Europa a la región y a los países de Africa, el Caribe y el Pacífico hacen prever que un eventual acuerdo mantendría esa asimetría, lo que haría poco ventajoso el convenio. 1 De acuerdo a la última Encuesta de Hogares del INEC, en Costa Rica existen 231 280 personas que laboran en agricultura. Asuma que se desea conocer el porcentaje de ellas que valoran el convenio citado como una oportunidad de negocio por medio de una muestra aleatoria sin reemplazo, para lo cual se desea tener un error de muestreo máximo de 0,05 y un nivel de confianza del 95%, finalmente para mayor precisión en los resultados se requiere utilizar el máximo valor de la variancia. Determine el tamaño de muestra que responda a las condiciones dadas Manual de Prácticas de Estadística General 2.................................................................. 26 2. A julio del 2005, en Costa Rica se tenía la siguiente distribución de los trabajadores: CATEGORÍA POBLACIÓN OCUPACIONAL Patrono 132 466 Trabajador cuenta propia 334 872 Asalariados 1 268 904 No remunerados 40 661 Con base en los datos de la tabla anterior, distribuya una muestra de 500 2.1 Utilizando el criterio de afijación proporcional 2.3 Indique dos ventajas para utilizar muestreo estratificado 3. Como resultado de investigar una muestra aleatoria de 48 meses, se concluyó que Costa Rica exportó a Europa un promedio mensual de $110 millones, con una desviación estándar de ¢20 millones. 3.1 Con base en los datos anteriores, calcule e interprete un intervalo de confianza para el promedio poblacional de exportaciones de Costa Rica a Europa. Utilice un nivel de confianza del 90% e ignore el factor de corrección 3.2 Si la variable (monto de exportaciones a Europa de Costa Rica) no se distribuye normalmente, usted mantendría el resultado obtenido en 3.1? Justifique su respuesta 4.Indique con V o F si las siguientes afirmaciones son verdaderas o falsas ( ) El Teorema del Límite Central permite utilizar la distribución normal con cualquier tamaño de muestra ( ) El promedio muestral es un estimador suficiente ( ) En prueba de hipótesis α+β debe ser igual a 1 ( ) La precisión de las estimaciones hechas con muestreo de conglomerados será mayor, conforme el tamaño de los conglomerados disminuyan ( ) La probabilidad de cometer el error tipo I es igual a 1-α 5. Para la piña, en el año 2005 se exportó un promedio mensual de $150 millones a Europa y se espera que con el convenio comercial citado en el encabezado del examen, dicho promedio se incremente. Asuma que se seleccionó una muestra de 14 exportadores, donde los entrevistados estimaron un promedio de $170 millones, con una desviación estándar de $35 millones. 5.1 Con un nivel de significancia del 5%, realiza la prueba de hipótesis correspondiente para verificar que el promedio mensual de exportación de piña a Europa se incrementará gracias al convenio. 5.2 Con base en la decisión tomada en 5.1 indique el tipo de error que se puede cometer y por qué? 6. Para poder firmar el convenio citado con Europa se deben cumplir una serie de condiciones previas (reglamentación, aranceles, instrumentos jurídicos, subsidios), donde se presume que existe diferencias entre los porcentajes de optimismo de Centroamérica y la Unión Europea. Para ello, Asuma que se seleccionó una muestra de 42 funcionarios de Centroamérica que estimaron un 70% de éxito en las negociaciones, contra una muestra de 48 funcionarios de Europa que estimaron un 62% de éxito en las negociaciones. Con un 3% de significancia, pruebe la hipótesis de que existe diferencia entre los porcentajes de éxito de las negociaciones del convenio citado, entre Europa y Centroamérica. Manual de Prácticas de Estadística General 2.................................................................. 27 CASO 8: NIVEL DE FELICIDAD DE LOS PAISES La Universidad de Michigan realizó un Estudio Mundial de Valores, donde se encontró que la riqueza de un país no siempre indica el grado de felicidad de su gente, como también que los países latinoamericanos registraron una felicidad mucho mayor respecto a lo que sus ingresos sugería. Asuma que se tomaron las muestras en los siguientes problemas. 1. Se tiene la siguiente muestra de datos siete países latinoamericanos, a efectos de determinar si el grado de felicidad de los habitantes se encuentra asociado con el nivel de riqueza. Grado de felicidad: 1, 3, 3, 2, 3, 4, 3 Nivel de riqueza: 1, 3, 1, 2, 2, 2, 1 Donde: Grado de felicidad 1: Infeliz 2: Poco feliz 3: Feliz 4: Muy feliz Nivel de riqueza: 1: Bajo 2: Medio 3: Alto Calcule el coeficiente de correlación apropiado a la naturaleza de los datos anteriores y pruebe la hipótesis para comprobar si existe asociación entre las variables estudiadas (con un nivel de significancia del 10%) y concluya en términos del problema (utilice todos los decimales para los cálculos internos de las fórmulas) 2. A su vez, se consultó sobre el nivel de conservación de recursos naturales para una pequeña muestra de países desarrollados, en vías de desarrollo y subdesarrollados, a saber: Desarrollados: 2, 1, 1, 2, 3 En vías de desarrollo: 2, 2, 3, 4, 3, 1 Subdesarrollados: 2, 3, 4, 4, 4, 3, 2 Nivel de conservación de recursos naturales: 1=Bajo 2= Medio 3= Alto 4=Muy alto Pruebe que el nivel de conservación de recursos naturales es diferente para al menos dos grupo de países (desarrollados, en vías de desarrollo y subdesarrollados) (Use una confianza del 90%, la prueba respectiva y concluya en términos del problema) (utilice todos los decimales para los cálculos internos de las fórmulas) 3. A continuación se presentan los ingresos promedios de los hogares de Estados Unidos, para el periodo 1998-2003., a saber: Año 1998 1999 2000 2001 2002 2003 Ingreso Promedio por hogar 42 44 45 46 49 48 (miles $) ∑x=12003 ∑y= 274 ∑xy= 548160 ∑x2=24012019 ∑y2=12546 3.1 Los años y los ingresos promedios por hogar se encuentran asociados linealmente? Calcule el coeficiente respectivo para justificar su respuesta 3.2 Utilizando la bondad de ajuste, considera que sería apropiado utilizar un modelo regresión? Justifique 3.3 Estime el ingreso para el año 2007 3.4 Interprete el coeficiente de regresión 3.5 Determine el coeficiente de correlación entre el índice de felicidad y el ingreso promedio por hogar, eliminando el efecto del año, para lo cual el coeficiente de correlación simple entre el índice de felicidad y el ingreso promedio simple es de 0,21, como también el coeficiente de correlación simple entre el índice de felicidad y los años es de 0,45 4. Se desea probar que el ingreso promedio anual (en miles de dólares) de los costarricenses residentes en USA es diferente según el tipo de empresa donde laboran (comercial, industrial y servicios). Tomando en cuenta que el trimestre del año también influye en el ingreso, se quiso controlar este factor. Para comprobar lo comentado se procesó la información correspondiente mediante el paquete de cómputo excel resultando lo siguiente: Manual de Prácticas de Estadística General 2.................................................................. 28 Análisis de varianza de dos factores con una sola muestra por grupo RESUMEN Cuenta Suma Promedio Varianza 1 trimestre 2 trimestre 3 trimestre 4 trimestre 3 3 3 3 76 78 76 81 25,3 26,0 25,3 27,0 30,3 16,0 30,3 36,0 Comercial Industrial Servicios 4 4 4 83 103 125 20,75 25,75 31,25 0,92 0,92 1,58 ANÁLISIS DE VARIANZA Origen de las variaciones Filas Columnas Error Total Suma de cuadrados 5,58 Grados de libertad Promedio de los cuadrados F 4,67 230,92 Con base en los resultados anteriores, plantee las hipótesis pertinentes, complete la tabla anterior, realice las pruebas correspondientes utilizando un nivel de significancia del 5% y concluya en términos del problema