Casos

Anuncio
Manual de Prácticas de Estadística General 2.................................................................. 17
6. CASO 1: EXPORTACIONES DE COSTA RICA
Uno de los mayores problemas de Costa Rica es la poca dinámica en el nivel de exportaciones. Producto
de lo anterior, el gobierno de turno desea impulsar un proyecto para estimular la pequeña y mediana
empresa (PYMES). De manera, que se desea conocer la proporción de empresas que tienen interés en
exportar.
1. Aproximadamente existen en el país cerca de 1700 empresas tipo PYMES, por lo tanto se decidió
estimar la proporción de empresas que exportan, por medio de una muestra (sin reemplazo), que
garantice un error de muestreo máximo de 0,04 con un nivel de confianza del 92%. Tomando en
cuenta que el interés por exportar ha sido un factor de máximo desacuerdo entre las empresas
(opiniones demasiado heterogéneas), determine el tamaño de muestra
2. Para enriquecer el análisis conviene distribuir las PYMES según el tamaño de la siguiente manera:
PYMES
POBLACIÓN
VARIANCIA*
Pequeñas
1100
60
Medianas
600
210
* variancia del volumen de ventas
Con base en los datos de la tabla anterior, distribuya una muestra de 500
2.1 Utilizando el criterio de afijación proporcional
2.2 Utilizando el criterio de afijación óptima
2.3 Compare los resultados de 2.1 y 2.2 y explique las razones de las diferencias en los resultados
3. Una oficina gubernamental realizó una investigación seleccionando dos regiones geográficas del
país, luego seleccionó tres cantones en cada región seleccionada, para finalmente seleccionar cinco
empresas en cada cantón. Después de consultar a las empresas seleccionada, se determinó un
volumen total de ventas por ¢900 millones.
3.1 Qué tipo de muestreo se utilizó y por qué?
3.2 Determine el promedio del volumen de ventas de las empresas
3.3 Indique una desventaja para utilizar muestreo sistemático
4. Como resultado de investigar una muestra aleatoria con reemplazo de 42 empresas medianas, se
concluyó que tienen un promedio de ventas de ¢120 millones anuales, con una desviación estándar
de ¢40 millones.
4.1 Con base en los datos anteriores, calcule e interprete un intervalo de confianza para el promedio
poblacional de las ventas. Utilice un nivel de confianza del 90%
4.2 Si la usted le advirtieran que la variable (ventas de las empresas) no se distribuye normalmente, aún
así mantendría Ud el resultado obtenido en 4.1 ? Justifique su respuesta
5. Después de analizar a 40 empresas pequeñas se logró construir el siguiente intervalo de
confianza P(24 < µ < 48) = 0,95, determine el error de muestreo.
6. En una muestra de 21 empresas medianas se encontró un error de muestreo de 8, con una desviación
estándar de 14,5 , encuentre el nivel de confianza del intervalo con el que se podría trabajar. (Omita
el uso del factor de corrección)
Manual de Prácticas de Estadística General 2.................................................................. 18
CASO 2: EL ARROZ EN COSTA RICA
La actividad arrocera del país se encuentra en una grave crisis. Pese a que el consumo del citado
producto aumenta con el crecimiento poblacional, la producción nacional del grano ha decaído en los
últimos cuatro años. Lo anterior, porque la importación del grano se ha incrementado, gracias a sus
precios bajos en el mercado internacional. Producto de lo expuesto, el Instituto Nacional de Seguros
únicamente (en el año 2002) aseguró el 9,5% de las fincas sembradas de arroz y se sospecha que la crisis
planteada ha influenciado negativamente en el aseguramiento de las cosechas del presente año.
1. Para verificar la sospecha, asuma que se seleccionó una muestra de 120 fincas, de las cuales el 8,9 %
estaban aseguradas
Con base en los resultados anteriores realice una prueba de hipótesis para demostrar que el
porcentaje de fincas aseguradas ha disminuido. Plantee la hipótesis correspondiente, realice la
prueba pertinente con un nivel de significancia del 3% y concluya en términos del problema.
2. Según datos de la Corporación Arrocera, el rendimiento por hectárea difiere de la condición del
terreno (seco ó húmedo). Por ello, asuma que se seleccionó una muestra de 15 fincas de terreno seco
con un rendimiento promedio de 2,36 tm/ha con una desviación estándar de 1,2. A su vez, se
seleccionó una muestra de 10 fincas de terreno húmedo que generó un promedio de 3,79 tm/ha, con
una desviación estándar de 0,98.
2.1 Con un nivel de significancia del 10%, pruebe que existe diferencia entre los promedios del
rendimiento tm/ha de las fincas secas vs húmedas. Concluya en términos del problema
2.2 Cuál es la probabilidad de cometer un error con la decisión tomada en 2.1? Justifique
3. También se tiene el rendimiento del arroz para cuatro zonas y al procesar los valores en excel se
dieron los siguientes resultados:
Zonas
Chorotega (riego)
Brunca (secano)
Pacífico Central (secano)
Huetar Norte (secano)
Cuenta
5
6
5
7
Suma
Promedio
2,70
2,71
0,97
0,98
Varianza
0,23
0,02
0,04
0,03
ANDEVA
Origen de las variaciones
Suma de cuadrados
Grados de libertad
Promedio de los
cuadrados
F
Entre grupos
Dentro de los grupos
Total
9,014
10,278
Pruebe la hipótesis de por lo menos dos promedios del rendimiento del arroz son diferentes.
Complete la tabla de ANDEVA anterior y deje constancia de los cálculos realizados, así como de los
valores tabulares. Use un nivel de significancia del 5% y concluya en términos del problema lo
presentado.
Manual de Prácticas de Estadística General 2.................................................................. 19
4. A continuación se presentan los rendimientos (tm/ha) para 4 variedades de arroz según el mes de
siembra:
Variedad
V1
V2
V3
V4
Enero
0,9
1,3
1,8
2,0
Julio
0,7
1,5
1,7
2,1
Diciembre
0,8
1,4
1,9
2,2
Con los datos anteriores se desea realizar una prueba de hipótesis de que al menos dos promedios de los
rendimientos de los meses son diferentes (aislando el efecto de la variedad). Para ello, se utilizó el
paquete de cómputo Excel generando los siguientes resultados:
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN
V1
V2
V3
V4
Enero
Julio
Diciembre
Cuenta
3
3
3
3
Suma
2,4
4,2
5,4
6,3
Promedio
0,8
1,4
1,8
2,1
Varianza
0,01
0,01
0,01
0,01
4
4
4
6
6
6,3
1,5
1,5
1,575
0,24666667
0,34666667
0,37583333
Además el paquete generó una suma de cuadrados total igual a 2,9225
Realice la prueba respectiva utilizando un nivel de significancia del 5% y concluya en términos del
problema
Manual de Prácticas de Estadística General 2.................................................................. 20
CASO 3: EVALUACION DEL DESEMPEÑO GANA TERRENO
En un estudio realizado por la firma KPMG para el primer semestre del presente año, el 65% de las
empresas encuestadas afirmaron tener sistemas de evaluación de desempeño para sus trabajadores,
porcentaje que creció un 12% con respecto a los últimos seis meses del 2002. La estrategia es que
conforme mejor sea el trabajo, mejor será la paga.
1. Se sospecha que la evaluación del desempeño depende del tipo de empresa. En ese sentido se
presenta a continuación la distribución en la sigueinte tabla:
TIPO DE EMPRESA
CON EVALUACION DEL
SIN EVALUACION DEL
DESEMPEÑO
DESEMPEÑO
Financieras
13
1
Industriales
44
10
Servicios
17
11
Comercio
7
7
Con base en la información presentada en el cuadro, determine si la utilización de sistemas de
evaluación del desempeño depende del tipo de empresa. Utilice un nivel de confianza del 90% y
concluya en términos del problema
2. Se tiene la premisa de que conforme aumente el nivel educativo, se incrementa el nivel de
desempeño. Para probar lo anterior se cuenta con los datos de seis empleados de una empresa que les
valoró el nivel del desempeño, mediante un instrumento que produce puntajes entre 1 y 80,
obteniéndose los siguientes resultados:
Nivel educativo
2
1
4
2
3
4
Puntaje evaluación del desempeño
60
50
70
65
70
70
Donde el nivel educativo 1= sin estudios 2= primaria 3= secundaria 4=universitaria
Con base en los resultados anteriores calcule el coeficiente de correlación de Spearman para comprobar
si existe relación entre las variables estudiadas.
3. Una forma de motivar el empleado es por medio del salario, de manera que se presenta a
continuación los aumentos para los últimos seis años:
AÑO
1997
1998
1999
2000
2001
2002
AUMENTO SALARIAL (%)
22
18
15
11
14
11
∑x=11997 ∑y=91
∑xy=181919
∑x2= 23988019
∑y2=1471
3.1
Los años y los aumentos salariales se encuentran asociados linealmente? Calcule el coeficiente
respectivo para justificar su respuesta
3.2 Utilizando la bondad de ajuste, considera que sería apropiado utilizar un modelo regresión?
Justifique
3.3
Establezca la ecuación de regresión respectiva e interprete el coeficiente de regresión en términos
del problema
3.4
Utilizando el modelo de 1.3, estime el aumento para el año 2005
4. Se sospecha que la inflación afecta los aumentos salariales, por tanto se aplicó el modelo de
regresión de excel a las variables : inflación, % aumento salarial y año
Manual de Prácticas de Estadística General 2.................................................................. 21
Estadísticas de la regresión
Coeficiente de correlación
0,914745297
múltiple
Coeficiente de determinación R^2 0,836758958
R^2 ajustado
0,727931597
Error típico
2,223190497
Observaciones
6
ANÁLISIS DE VARIANZA
Grados de
libertad
Regresión
Residuos
Total
Coeficientes
1828,942449
0,395739911
-0,90919282
Intercepción
Inflación
año
4.1
4.2
Suma de Promedio de
F
cuadrados
los
cuadrados
2 76,0056054 38,00280269 7,688865647
3 14,827728 4,942575984
5 90,8333333
Error típico
2712,13535
0,44038069
1,35427932
Estadístico t Probabilidad
0,674355153 0,54839968
0,898631379 0,435075207
-0,67134808 0,550068504
Escriba la ecuación de regresión múltiple
Estime el aumento para el presente año , con una inflación de 5
CASO 4. FINANCIAMIENTO DE VIVIENDAS
En el mercado costarricense se ofrecen una diversidad de opciones para financiar vivienda. Dentro de las
tradicionales se encuentra el financiamiento en colones a una tasa de interés alrededor del 18,75%;
también se financia viviendas en dólares a tasa del 7% y en los últimos meses se ofrece financiamiento
en unidades de desarrollo a tasa de interés del 8% Con base en los datos anteriores y asumiendo una
inflación y devaluación del 10%, para adquirir una casa de ¢10,5 millones en un plazo de 14 años, se
pagarían las cuotas mensuales presentadas en el gráfico 1, que se presenta a continuación:
Gráfico 1
CUOTA EQUIVALENTE EN COLONES A PAGAR POR UN CREDITO
DE VIVIENDA DE ¢10,5 MILLONES A 14 AÑOS PLAZO
mile s ¢
500
450
400
350
300
¢
$
250
UD
200
150
100
50
di
c
20
0
di 4
c
20
0
di 5
c
20
0
di 6
c
20
0
di 7
c
20
0
di 8
c
20
0
di 9
c
20
1
di 0
c
20
1
di 1
c
20
1
di 2
c
20
1
di 3
c
20
1
di 4
c
20
1
di 5
c
20
1
di 6
c
20
17
0
Manual de Prácticas de Estadística General 2.................................................................. 22
Es evidente que tanto el crédito en dólares como en unidades de desarrollo las cuotas son más bajas
en los primeros años de cancelación, pero luego se incrementan y superan con creces a la cuota del
crédito en colones.
1. Asuma que se seleccionó en forma aleatoria seis entidades del sistema bancario nacional y se
encontró que los clientes deben pagar una cuota promedio de ¢177 mil (para un crédito de ¢10,5
millones). Encuentre el error de muestreo del promedio de la cuota del préstamo poblacional al
95% de confianza, si la desviación estándar de la muestra fue de ¢50 mil. Interprete el error de
muestreo e indique que supuesto se debe realizar para el cálculo de dicho error
2. Una fuente de información para determinar si los costarricenses pueden pagar las cuotas de los
préstamos anteriores, es la Encuesta de Hogares realizada por el INEC en julio del 2003, donde
se obtuvo un ingreso por hogar promedio de ¢261.532,00 de una muestra aleatoria sin reemplazo
de 13.199 hogares. Si la población de hogares asciende 1.051.606 con una desviación estándar
del ingreso de ¢250.000,00 determine un intervalo de confianza para el promedio del ingreso de
los hogares del país, con un nivel de confianza del 85% (interprete el resultado final)
3. Según los expertos el ingreso promedio es un estimador consistente. Favor de explicar que
significa tal afirmación
4. Indique dos ventajas del muestreo estratificado
5. Bajo que condiciones el muestreo estratificado genera estimaciones más precisas, respecto al
muestreo simple al azar
6. La muestra de la Encuesta de Hogares se distribuyó en las regiones de planificación del país, de
la siguiente forma:
Región de
Muestra
Población de hogares Desviación estándar
Planificación
de hogares
del ingreso (miles ¢)
Central
8.453
673.471
200
Chorotega
1.010
80.511
160
Pacífico Central
704
56.125
150
Brunca
988
78.693
160
Huetar Atlántica
1.340
106.740
120
Huetar Norte
704
56.066
170
Con base en los resultados de la tabla anterior:
6.1 Qué tipo de afijación se utilizó para distribuir la muestra entre las regiones
6.2 Distribuya la muestra original aplicando el criterio de afijación óptima
7. En la muestra de la Región Huetar Norte de la Encuesta citada, se encontraron 144 hogares con
jefatura femenina (sin reemplazo). Con base en los datos suministrados, calcule el intervalo de
confianza del 90% para la proporción (de hogares con jefatura femenina). Interprete el resultado
8. Asuma que desea realizar un estudio en la Región Huetar Atlántica, a efectos de profundizar
sobre el ingreso familiar. De qué tamaño debe ser la muestra (sin reemplazo) en dicha región, si
se desea un error de muestreo de ¢10.000,00 y un nivel de confianza del 95%
Manual de Prácticas de Estadística General 2.................................................................. 23
9. Si al realizar una encuesta con los lectores de un periódico se les pide que contesten un
cuestionario publicado en él, ¿será probable que las respuestas resultantes proporcionen una
muestra aleatoria de la opinión de los lectores? Explique
CASO 5: FERIAS DEL AGRICULTOR
Con el propósito de que los agricultores del país puedan vender sus productos directamente al
consumidor, se realizan en las diferentes cantones ferias todos los fines de semana. En dichas ferias los
costarricenses pueden adquirir verduras y frutas principalmente.
1. Se tiene la sospecha de que la proporción de personas que compran frutas en la feria de
Desamparados es superior a la proporción de personas que compran frutas en la feria de San
Carlos. Para verificar tal sospecha, asuma que se seleccionó una muestra de 120 personas que
visitan la feria de Desamparados, de las cuales 90 adquieren frutas, a su vez, se seleccionó una
muestra de 100 personas que visitan la feria de San Carlos, de las cuales 60 adquieren frutas. Con
base en los resultados anteriores, realice una prueba de hipótesis para verificar la sospecha, con
un nivel de significancia del 3% y concluya en términos del problema
2. El precio promedio del apio es de ¢300 por kilo en todo el país, sin embargo, dicho precio se
podría ver afectado por las lluvias de la actual época, donde la oferta se reduce y el precio tiende
a subir. Para comprobar lo planteado, asuma que se tomó una muestra de 21 ferias del país y se
encontró un promedio del precio de ¢322, con una desviación estándar de ¢87.
a. Con un nivel de significancia del 5%, pruebe que el precio promedio del apio se
incrementa en la época lluviosa. Concluya en términos del problema
b. De acuerdo a la conclusión de 2.1 calcule la probabilidad de cometer el posible error
asociado, asumiendo que el verdadero promedio fuese ¢327,87
3. También se tiene el precio promedio del apio para los cuatro trimestres del año y al procesar los
valores en excel se dieron los siguientes resultados:
Análisis de varianza de un factor
RESUMEN
Grupos
1 Trimestre
2 Trimestre
3 Trimestre
4 Trimestre
ANÁLISIS DE
VARIANZA
Origen de las variaciones
Entre grupos
Dentro de los grupos
Total
Cuenta
6
6
6
6
Suma
1879
1812
2072
1863
Suma de
Grados de libertad
cuadrados
6494,833333
3
461,666667
20
6956,500000
23
Promedio
Varianza
313,166667 14,566667
302,000000 21,200000
345,333333 23,866667
310,500000 32,700000
Promedio de los
cuadrados
2164,944444
23,083333
Manual de Prácticas de Estadística General 2.................................................................. 24
Suponga que usted trabaja para el Ministerio de Agricultura y le interesa conocer si existe una diferencia
significativa en del precio del apio según el trimestre de venta, a efectos de importar dicho producto para
estabilizar el precio. Realice las pruebas apropiadas, con un nivel de significancia del 5% y concluya en
términos del problema. (Deje constancia de los cálculos, según lo visto en clase)
4.
Por su parte se consideró la época del año (trimestre) y la zona de la feria en el precio de la coliflor.
Por ello a continuación se presentan los precios para los cuatro trimestres y tres zonas del país:
1 trimestre
322
316
312
950
Metropolitana
Urbana
Rural
SUMA
2 trimestre
320
316
311
947
3 trimestre
321
317
311
949
SUMA
1285
1264
1246
3795
4 trimestre
322
315
312
949
Con los datos anteriores se desea realizar una prueba de hipótesis de que al menos dos promedios de la
coliflor de los trimestres son diferentes, considerando el efecto de las zonas. Para ello, utilice la prueba
correspondiente utilizando un nivel de significancia del 10% y ∑x2 = 1200365
CASO 6: LA CARPIO
Los enfrentamientos entre los habitantes de la comunidad conocida como “La Carpio” y la fuerza pública
motivó a la Facultad Latinoamericana de Ciencias Sociales (FLACSO) que permitió conocer varios
aspectos.
Un elemento preocupante es la cantidad de detenciones de jóvenes pertenecientes a pandillas. Dicha
situación se aprecia en el gráfico siguiente:
DETENCIONES DE JOVENES DE LAS PANDILLAS DE LA
CARPIO
(enero a mayo 2004)
160
140
detenciones
120
100
80
60
40
20
-
1
2
3
4
5
6
meses
Donde 1=enero, 2=febrero, 3=marzo, 4=abril y 5=mayo
Se=0,2893236
Σy= 430
Σy2= 43650
Σxy= 1545
Manual de Prácticas de Estadística General 2.................................................................. 25
1. Calcule el coeficiente de determinación e interprételo en términos del problema
2. Pruebe la hipótesis de que el coeficiente de correlación es mayor que 0,4. Utilice un nivel de
significancia del 1%
3. Cuántas detenciones de jóvenes de las pandillas de La Carpio se esperan en julio del 2004 (utilice el
criterio de los mínimos cuadrados)
4. Calcule e interprete un intervalo de confianza del 95% para la estimación efectuada en el problema 3
5. En el estudio se investigó el nivel de escolaridad por nacionalidad, a fin de estimar su dependencia.
Asuma que se seleccionó una muestra de habitantes que se presentan en el siguiente cuadro:
DISTRIBUCION DE UNA MUESTRA HABITANTES DE LA CARPIO SEGÚN
NIVEL DE ESCOLARIDAD
NIVEL DE ESCOLARIDAD
TIPO DE
HABITANTE
Costarricense
Extranjero
Sin estudios
135
132
Primaria
285
169
Secundaria
173
53
Con base en la información presentada en el cuadro, pruebe que el nivel de escolaridad depende de la
nacionalidad del habitante. Utilice un nivel de confianza del 99% y concluya en términos del problema
6. Finalmente en el estudio, se registró el nivel de pobreza de las familias de La Carpio. Asuma que se
seleccionó la siguiente muestra de familias, de acuerdo a su nacionalidad:
Costarricenses: 1, 2, 1, 2, 3, 2, 2, 2, 3
Extranjeros: 3, 2, 3, 1, 2, 3, 3, 3
Nivel de pobreza: 1= Pobreza leve 2= Pobreza extrema 3=Indigente
Pruebe que el nivel de pobreza de las familias de extranjeros de La Carpio es diferente al nivel de pobreza
de las familias de los costarricenses de la Carpio, con un nivel de significancia del 5% y concluye en
términos del problema
CASO 7: CENTROAMÉRICA Y LA UNION EUROPEA MAS ALLA DE UN TLC
El arranque del proceso de negociación comercial entre la Unión Europea y Centroamérica podría ser
acordado en la próxima cumbre del 12 de mayo en Viena. Sin embargo, es un tema que no deja de inquietar
a Costa Rica, país que tiene los aranceles consolidados más altos para los bienes agrícolas e industriales y el
menos abierto al sector servicios. Del otro lado del océano, las diferencias en el trato que da Europa a la
región y a los países de Africa, el Caribe y el Pacífico hacen prever que un eventual acuerdo mantendría esa
asimetría, lo que haría poco ventajoso el convenio.
1
De acuerdo a la última Encuesta de Hogares del INEC, en Costa Rica existen 231 280 personas que
laboran en agricultura. Asuma que se desea conocer el porcentaje de ellas que valoran el convenio
citado como una oportunidad de negocio por medio de una muestra aleatoria sin reemplazo, para lo
cual se desea tener un error de muestreo máximo de 0,05 y un nivel de confianza del 95%,
finalmente para mayor precisión en los resultados se requiere utilizar el máximo valor de la
variancia. Determine el tamaño de muestra que responda a las condiciones dadas
Manual de Prácticas de Estadística General 2.................................................................. 26
2. A julio del 2005, en Costa Rica se tenía la siguiente distribución de los trabajadores:
CATEGORÍA
POBLACIÓN
OCUPACIONAL
Patrono
132 466
Trabajador cuenta propia
334 872
Asalariados
1 268 904
No remunerados
40 661
Con base en los datos de la tabla anterior, distribuya una muestra de 500
2.1 Utilizando el criterio de afijación proporcional
2.3 Indique dos ventajas para utilizar muestreo estratificado
3. Como resultado de investigar una muestra aleatoria de 48 meses, se concluyó que Costa Rica exportó a
Europa un promedio mensual de $110 millones, con una desviación estándar de ¢20 millones.
3.1 Con base en los datos anteriores, calcule e interprete un intervalo de confianza para el promedio
poblacional de exportaciones de Costa Rica a Europa. Utilice un nivel de confianza del 90% e ignore el
factor de corrección
3.2 Si la variable (monto de exportaciones a Europa de Costa Rica) no se distribuye normalmente, usted
mantendría el resultado obtenido en 3.1? Justifique su respuesta
4.Indique con V o F si las siguientes afirmaciones son verdaderas o falsas
( ) El Teorema del Límite Central permite utilizar la distribución normal con cualquier tamaño de muestra
( ) El promedio muestral es un estimador suficiente
( ) En prueba de hipótesis α+β debe ser igual a 1
( ) La precisión de las estimaciones hechas con muestreo de conglomerados será mayor, conforme el
tamaño de los conglomerados disminuyan
( ) La probabilidad de cometer el error tipo I es igual a 1-α
5. Para la piña, en el año 2005 se exportó un promedio mensual de $150 millones a Europa y se espera que
con el convenio comercial citado en el encabezado del examen, dicho promedio se incremente. Asuma
que se seleccionó una muestra de 14 exportadores, donde los entrevistados estimaron un promedio de
$170 millones, con una desviación estándar de $35 millones.
5.1 Con un nivel de significancia del 5%, realiza la prueba de hipótesis correspondiente para verificar que el
promedio mensual de exportación de piña a Europa se incrementará gracias al convenio.
5.2 Con base en la decisión tomada en 5.1 indique el tipo de error que se puede cometer y por qué?
6. Para poder firmar el convenio citado con Europa se deben cumplir una serie de condiciones previas
(reglamentación, aranceles, instrumentos jurídicos, subsidios), donde se presume que existe diferencias
entre los porcentajes de optimismo de Centroamérica y la Unión Europea. Para ello, Asuma que se
seleccionó una muestra de 42 funcionarios de Centroamérica que estimaron un 70% de éxito en las
negociaciones, contra una muestra de 48 funcionarios de Europa que estimaron un 62% de éxito en las
negociaciones.
Con un 3% de significancia, pruebe la hipótesis de que existe diferencia entre los porcentajes de éxito de las
negociaciones del convenio citado, entre Europa y Centroamérica.
Manual de Prácticas de Estadística General 2.................................................................. 27
CASO 8: NIVEL DE FELICIDAD DE LOS PAISES
La Universidad de Michigan realizó un Estudio Mundial de Valores, donde se encontró que la riqueza de un
país no siempre indica el grado de felicidad de su gente, como también que los países latinoamericanos
registraron una felicidad mucho mayor respecto a lo que sus ingresos sugería. Asuma que se tomaron las
muestras en los siguientes problemas.
1. Se tiene la siguiente muestra de datos siete países latinoamericanos, a efectos de determinar si el grado de
felicidad de los habitantes se encuentra asociado con el nivel de riqueza.
Grado de felicidad: 1, 3, 3, 2, 3, 4, 3
Nivel de riqueza:
1, 3, 1, 2, 2, 2, 1
Donde:
Grado de felicidad 1: Infeliz 2: Poco feliz 3: Feliz 4: Muy feliz
Nivel de riqueza: 1: Bajo 2: Medio 3: Alto
Calcule el coeficiente de correlación apropiado a la naturaleza de los datos anteriores y pruebe la hipótesis
para comprobar si existe asociación entre las variables estudiadas (con un nivel de significancia del 10%) y
concluya en términos del problema (utilice todos los decimales para los cálculos internos de las fórmulas)
2. A su vez, se consultó sobre el nivel de conservación de recursos naturales para una pequeña muestra de
países desarrollados, en vías de desarrollo y subdesarrollados, a saber:
Desarrollados: 2, 1, 1, 2, 3
En vías de desarrollo: 2, 2, 3, 4, 3, 1
Subdesarrollados: 2, 3, 4, 4, 4, 3, 2
Nivel de conservación de recursos naturales: 1=Bajo 2= Medio 3= Alto 4=Muy alto
Pruebe que el nivel de conservación de recursos naturales es diferente para al menos dos grupo de países
(desarrollados, en vías de desarrollo y subdesarrollados) (Use una confianza del 90%, la prueba respectiva
y concluya en términos del problema) (utilice todos los decimales para los cálculos internos de las fórmulas)
3. A continuación se presentan los ingresos promedios de los hogares de Estados Unidos, para el periodo
1998-2003., a saber:
Año
1998
1999
2000
2001
2002
2003
Ingreso Promedio por hogar
42
44
45
46
49
48
(miles $)
∑x=12003 ∑y= 274 ∑xy= 548160 ∑x2=24012019
∑y2=12546
3.1 Los años y los ingresos promedios por hogar se encuentran asociados linealmente? Calcule el
coeficiente respectivo para justificar su respuesta
3.2 Utilizando la bondad de ajuste, considera que sería apropiado utilizar un modelo regresión? Justifique
3.3 Estime el ingreso para el año 2007
3.4 Interprete el coeficiente de regresión
3.5 Determine el coeficiente de correlación entre el índice de felicidad y el ingreso promedio por hogar,
eliminando el efecto del año, para lo cual el coeficiente de correlación simple entre el índice de felicidad
y el ingreso promedio simple es de 0,21, como también el coeficiente de correlación simple entre el
índice de felicidad y los años es de 0,45
4. Se desea probar que el ingreso promedio anual (en miles de dólares) de los costarricenses residentes en
USA es diferente según el tipo de empresa donde laboran (comercial, industrial y servicios). Tomando en
cuenta que el trimestre del año también influye en el ingreso, se quiso controlar este factor. Para comprobar
lo comentado se procesó la información correspondiente mediante el paquete de cómputo excel resultando
lo siguiente:
Manual de Prácticas de Estadística General 2.................................................................. 28
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN
Cuenta
Suma
Promedio
Varianza
1 trimestre
2 trimestre
3 trimestre
4 trimestre
3
3
3
3
76
78
76
81
25,3
26,0
25,3
27,0
30,3
16,0
30,3
36,0
Comercial
Industrial
Servicios
4
4
4
83
103
125
20,75
25,75
31,25
0,92
0,92
1,58
ANÁLISIS DE VARIANZA
Origen de las
variaciones
Filas
Columnas
Error
Total
Suma de
cuadrados
5,58
Grados de
libertad
Promedio de
los cuadrados
F
4,67
230,92
Con base en los resultados anteriores, plantee las hipótesis pertinentes, complete la tabla anterior, realice las
pruebas correspondientes utilizando un nivel de significancia del 5% y concluya en términos del problema
Descargar