III Ciclo ESATADISTICA GENERAL CUADERNO DE TRABAJO Ing. José Saldarriaga M. Eco. Juan Morón A. Estadística General para Exportadores ASOCIACIÒN DE EXPORTADORES DEL PERU www.adexperu.org.pe CENTROS ACADEMICOS DE ADEX www.adexperu.edu.pe GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL MÓDULO PROFESIONAL MÉTODOS CUANTITATIVOS Y TECNOLOGÍAS DE LA INFORMACIÓN APLICADOS A LOS NEGOCIOS INTERNACIONALES ASIGNATURA ESTADÍSTICA GENERAL MATERIAL DE TRABAJO PARA EL ESTUDIANTE Elaborado por: Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. 2 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL ÍNDICE ÍNDICE............................................................................................................................................... 3 INTRODUCCIÓN ................................................................................................................................ 4 DEFINICIONES Y CONCEPTOS FUNDAMENTALES ............................................................................. 5 DESCRIPCIÓN DE DATOS ................................................................................................................ 12 REPRESENTACIÓN DE DATOS – GRÁFICAS ..................................................................................... 24 MEDIDAS DE TENDENCIA CENTRAL................................................................................................ 26 MEDIDAS DE DISPERSIÓN............................................................................................................... 38 TÉCNICAS DE MUESTREO ............................................................................................................... 48 NÚMEROS ÍNDICES ......................................................................................................................... 48 ANÁLISIS DE REGRESIÓN Y CORRELACIÓN LÍNEAL ......................................................................... 57 ANÁLISIS DE SERIES DE TIEMPO ..................................................................................................... 67 GLOSARIO DE VARIABLES Y FÓRMULAS ..................................................................................... 79 REFERENCIAS BIBLOGRÁFICAS ....................................................................................................... 82 3 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL INTRODUCCIÓN Este material ha sido desarrollado pensando en el proceso de aprendizaje que requieren realizar los alumnos que se enfrentan a la carrera de Comercio Exterior. Pero también, pensando en una inserción más competitiva en el mundo laboral que más adelante deberán afrontar. Este Cuadernillo de Trabajo consta de un conjunto de problemas y ejercicios (186) que han sido preparados para ir midiendo el nivel de aprendizaje de los alumnos. Pero en éste no debemos olvidar la parte conceptual. Por ello, se han considerado preguntas que apuntan a consolidar el conocimiento teórico básico. Por último, queremos hacer hincapié en recordar que la Estadística debe servirnos, fundamentalmente, como una herramienta para la toma de decisiones. Ella no se limita a realizar procesos de cálculos operativos. Estos son inevitables, pero deben ser vistos como insumos en un proceso mucho más importante. Reducir los niveles de incertidumbre que rodean el mundo empresarial cuando deben tomarse decisiones. Aquí radica la verdadera importancia de la Estadística. 4 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL DEFINICIONES Y CONCEPTOS FUNDAMENTALES ----------------------------------------------------------------------------------------------------------------------------- Nivel de Dificultad I Ejemplo 1 : Explique por qué el siguiente enunciado hace referencia a un ejemplo de lo que trata la Estadística Descriptiva : “Según el Ministerio de Trabajo, el salario promedio tuvo un aumento, en términos reales, de 25 % en los últimos dos años. Sin embargo, en el último trimestre tuvo una disminución de 2,85 %. Antes de los ajustes, el salario era de S/500.00 pero alcanzó un nivel de S/ 728 al cerrar el último año” . Solución : Este un caso de estadística descriptiva, por cuanto toda la información se está refiriendo a los datos con los que se han desarrollado esas observaciones. Es decir, se ha descrito. No se ha hecho ninguna inferencia a partir de una muestra. Decir o mencionar un valor porcentual de un conjunto de datos no es hacer una inferencia, mucho menos es un muestreo. Ejemplo 2: Una empresa educativa cuenta con un total de 3750 empleados de los cuales 660 son profesores. Los directivos saben que el 25% de los profesores usan herramientas tecnológicas en poca escala. Uno de sus objetivos es mejorar la calidad de la enseñanza, por lo que se ha tomado una muestra aleatoria de 145 profesores y se ha tomado en cuenta, entre otras, las siguientes características: · · · · Marca de computadora personal que utiliza. Tiempo que usa la computadora personal por semana. Número de personas de la casa que usan la computadora personal. Programa principal usado. Al procesar la información muestral se obtuvo un promedio de 18 horas de uso semanal de la computadora personal y, además, se pudo conocer que sólo un 8,7% usan como programa principal un procesador de texto. a) Identifique claramente la población y muestra. b) Identifique las variables del estudio, su tipo y escala de medición. c) Identifique los estadísticos mencionados en el problema. Solución: a. La Población son los 660 profesores y su muestra los 145 profesores encuestados b. La variable en estudio es “Tiempo de uso de computadora” 5 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL c. Los Estadísticos son “Tiempo promedio de uso de computadora” ( 18 horas). Esto es lo que en promedio emplean de tiempo los profesores frente a una computadora. En segundo lugar, “Promedio de profesores que usan un Programa de procesador de texto” Ejercicios y Problemas Propuestos 1. Cuál de las siguiente alternativas podría ser una razón para estudiar la Estadística: a. Nos permite obtener datos numéricos b. Nos permite obtener variables c. Nos permite tomar decisiones más racionales d. Nos permite obtener una muestra e. Nos permite obtener una población 2. Explique la diferencia entre la Estadística Descriptiva y la Estadística Inferencial a. La cantidad de datos b. El tamaño de la Muestra c. El tamaño de la Población d. La Muestra como tal e. La Población como tal 3. El Número de estrellas que tenemos en el firmamento, debe ser considerado como un ejemplo de . . a. Población Finita. Explique su respuesta b. Población Infinita. Explique su respuesta 4. Indica que variables son cualitativas y cuales cuantitativas: a. Comida Favorita. b. Profesión que te gusta. c. Número de goles marcados por tu equipo favorito en la última temporada. d. Número de alumnos de tu Instituto. e. El color de los ojos de tus compañeros de clase. f. Coeficiente intelectual de tus compañeros de clase. 5. De las siguientes variables indica cuáles son discretas y cuáles continuas. a. b. c. d. e. f. Número de acciones vendidas cada día en la Bolsa. Temperaturas registradas cada hora en un observatorio. Período de duración de un automóvil. El diámetro de las ruedas de varios coches. Número de hijos de 50 familias. Censo anual de los españoles. 6. Clasificar las siguientes variables en cualitativas ( Nominal u Ordinal) y cuantitativas (Discretas o Continuas). a. La nacionalidad de una persona. b. Número de litros de agua contenidos en un depósito. c. Número de libro en un estante de librería. d. Suma de puntos tenidos en el lanzamiento de un par de dados. e. La profesión de una persona. f. El área de las distintas baldosas de un edificio. 6 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 7. Clasifique las siguientes variables en: cualitativa nominal (CN), cualitativa ordinal (CO), cuantitativa discreta (CD) ó cuantitativa continua (CC): - Tipo de Vivienda - Mortalidad Infantil - Número de pasaporte - Total de hogares - Peso - Talla - Lugar de nacimiento - Analfabetismo ( ( ( ( ( ( ( ( ) ) ) ) ) ) ) ) - Asistencia escolar - Año de nacimiento - Disposición de DNI - Relación de parentesco - Combustible para cocinar - Gasto S/ l en alimentos - Gasto en compra de pan - Raza ( ( ( ( ( ( ( ( ) ) ) ) ) ) ) ) 8. De la siguiente relación indique cuál es un “Parámetro”: a. b. c. d. El promedio de ahorro de las familias peruanas es de S/ 250 mensuales El promedio ponderado de notas de los alumnos de Adex es de 14.5 El promedio de jubilación de los trabajadores de la pesca es de 68 años Las importaciones maquinaria para minería de nuestro país alcanzaron los 10 mil millones de dólares en el 2010 e. Las Exportaciones tradicionales de nuestro país alcanzaron los 15 mil millones de dólares en 2011 9. De la siguiente relación indique cuál es un “Estadístico”: a. Los estudiantes de 3° y 4° de Lima tienen una tralla promedio de 120 cm b. Los estudiantes del Perú tienen una talla promedio de 145 cm c. Los empleados de los bancos que tienen sus oficinas en Lima tienen un promedio de 15 minutos de retraso d. Los profesionales de la administración pasan en promedio entre 3 ó 4 años sin empleo antes de ingresar a una empresa como adecuadamente empleados 10. De los siguientes caso cuál o cuáles corresponden a una medición ( Escala ) Nominal a. b. c. d. e. Clasificación según el género sexual Clasificación por colores Clasificación por estado civil Clasificación por talla Clasificación por rendimiento académico Nivel de Dificultad II Ejercicios y Problemas Propuestos 11. Una empresa está por enviar al mercado un nuevo producto comestible, elaborado en base a kiwicha, Quinua y Maíz amarillo gigante del Cuzco. Este producto se puso a disposición de un grupo de personas a quienes, posteriormente se les aplicó una encuesta. Como resultado de ésta, se determinó que el 73% estarían dispuestos a comprar el producto; el 15 % que lo pensaría y, por último, el 12 % restante no lo compraría definitivamente. a. Se trata de un ejemplo de Estadística Descriptiva ? Explique su respuesta 7 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL b. Se trata de un caso de Estadística Inferencial ? Explique su respuesta 12. Una empresa educativa cuenta con un total de 3750 empleados de los cuales 660 son profesores. Los directivos saben que el 25% de los profesores usan herramientas tecnológicas en poca escala. Uno de sus objetivos es mejorar la calidad de la enseñanza, por lo que se ha tomado una muestra aleatoria de 145 profesores y se ha tomado en cuenta, entre otras, las siguientes características: · · · · Marca de computadora personal que utiliza. Tiempo que usa la computadora personal por semana. Número de personas de la casa que usan la computad ora personal. Programa principal usado. Al procesar la información muestral se obtuvo un promedio de 18 horas de uso semanal de la computadora personal, 8,7% usan como programa principal un procesador de texto. a) Identifique claramente la población y muestra. b) Identifique las variables del estudio, su tipo y escala de medición. c) Identifique los estadísticos mencionados en el problema. 13. Identifique cada una de las variables siguientes de acuerdo a la clasificación por su naturaleza y por su escala o nivel de medición. · · · · · · · · · · · · · Número de niños nacidos en diferentes horas del día. Edad de los reclusos. Grado de instrucción de los drogadictos. Número de menores abandonados en los hospitales. Candidatos a la Alcaldía de Lima, según votos obtenidos. Categoría docente (Principal, Asociado, Auxiliar) Número de hogares según servicio de alcantarillado. Lugar de nacimiento de las personas. Grado de desnutrición. Estado marital de las personas. Sueldos de las enfermeras. Clasificación de la población económicamente activa. Raciones por tipo de dieta. 14. En el Perú las madres trabajadoras al término del período post natal tienen derecho a una hora diaria por lactancia materna hasta que su hijo tenga un año de edad. Una empresa de supermercados quiere estimar el número de horas al mes que sus trabajadoras toman para esta actividad. La empresa tiene 1800 empleados, de los cuales el 80% son mujeres. De las trabajadoras el 90% tienen entre 18 y 49 años. Se considera que una mujer está en edad fértil si está en dicho rango de edad. Si para el estudio se va a entrevistar a una muestra aleatoria de mujeres igual al 20% de la población, defina la población y la muestra. 8 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL a. b. c. d. e. La población son 1440 mujeres y su muestra son 288 mujeres L La población son 1800 mujeres y su muestra son 238mujeres La población son 1620 mujeres y su muestra son 388 mujeres La población son 2440 mujeres y su muestra son 188 mujeres La población son 3680 mujeres y su muestra son 298 mujeres 15. Sabemos que las mediciones en muchos campos de la actividad humana son importantes, sin embargo, cuando hacemos estadística esa importancia se multiplica. Ponga un ejemplo de cada tipo de Escala de tal forma que, a su vez nos permitan diferenciar cada una de las variables con las que trabaja la Estadística. 16. Cuando se mide la Temperatura ( Máxima y Mínima) ambiental estamos considerando una Escala de medición estadística conocida como : a. b. c. d. Ordinal Nominal De Razón De Intervalo 17. La tabla adjunta muestra la distribución de frecuencias de los turistas que visitaron la Costa del Sol en 2008 según nacionalidad. ¿Cuál de las siguientes afirmaciones es correcta? Nacionalidad Española Extranjera Turistas que visitaron la Costa del Sol (Miles) 3.269 5.022 a) La población son las nacionalidades y la variable es el número de turistas que visitaron la Costa del Sol. b) La población son los turistas extranjeros que visitaron la Costa del Sol en 2001 y la variable es la nacionalidad. c) La población son los turistas que visitaron la Costa del Sol en 2001 y la variable es la nacionalidad. 18. En la tabla se muestran los gastos en turismo internacional de los cinco países del mundo con mayor gasto en este ámbito, correspondientes a 2008.¿Cuál es la variable y de qué tipo es? País USA Alemania Reino Unid Japón Francia a. b. Gasto en Turismo Internacional (miles de millones de dólares) 65,0 47,6 36,6 31,5 17,2 La variable es el país y es cuantitativa. La variable es el país y es cualitativa. 9 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL c. La variable es el gasto y es cuantitativa. 19. En los próximos meses se hará un estudio en el área metropolitana de San José con el objetivo de determinar la relación entre el nivel de escolaridad y el problema de la drogadicción. Suponiendo que Ud. es el investigador, complete lo siguiente: a. La población de estudio. b. La unidad estadística elemental. c. El método de recolección de la información. 20. De los 12889 estudiantes registrados en la Universidad San Carlos asistieron al centro de Salud de la misma en 1999 únicamente 3800, de las cuales 39% eran mujeres. La administración del departamento de Salud desea hacer una investigación sobre los hábitos sexuales y el conocimiento que tengan sobre la prevención de enfermedades contagiosas, en especial el SIDA. Interesa también desagregar esta información según edad, escolaridad, carrera que sigue, nivel socioeconómico, edad de la primera relación sexual, uso o no de preservativos. La investigación se realizará aleatoriamente en 100 estudiantes mujeres, en noviembre próximo. a. ¿Cuál es la unidad de estadística? b. ¿Cuál es el tamaño de la población a investigar? c. Cite tres características pertinentes al estudio, diga de qué tipo son y dé un ejemplo de observación. Nivel de Dificultad III 21. Señale y explique cuál es la alternativa que se refiere a una Escala de medición Nominal : a. b. c. d. e. Son Ordenados Mutuamente Excluyentes y exhaustivos, pero además no deben tener un orden Deben tener un orden lógico Deben estar clasificados por intervalos Deben ser por cociente 22. Los datos que aparecen a continuación hacen referencia a una Escala de medición determinada. Explique a cuál, en particular, se están refiriendo los datos en cuestión: Nombre de la Familia Márquez Estagnaro Romualdo Watson Ingresos de Padres 40,000 45,000 30,000 37,500 Ingresos de Hijos 20,000 15,000 60,000 50,000 10 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 23. Explique por qué la Muestra seleccionada de una Población debe ser absolutamente representativa. Qué implicancias tendría si no lo fuera. 24. El Gerente General de la empresa Telma SAC, que produce ropa de Invierno, sostiene que la estación de Verano se extenderá más de lo debido. Por lo tanto, ordena al departamento de producción duplicar la cantidad de prendas propias de esta estación. a. Sustente qué podría estar mal en la toma de decisión del Gerente General b. Qué haría usted si fuera el Gerente General de la empresa en mención c. Cuál es la diferencia entre lo planteado en la alternativa “a” y en la alternativa “b” 25. El Gerente General necesita tener “datos” para la toma de decisiones. Sin embargo, para la ésta sea un proceso eficiente, aquéllos deben ser relevantes. Según la proposición, el Gerente está usando, en estricto sentido . . . a. b. c. d. e. Datos Información Información procesada Conclusiones personales Opiniones personales. 11 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL DESCRIPCIÓN DE DATOS -------------------------------------------------------------------------------------------------------------------------------- Nivel de Dificultad I Ejemplo 1: El número promedio de hijos de 15 hogares de un asentamiento humano son: 5 4 6 3 2 1 4 4 3 1 4 2 3 2 7 a. Las frecuencias absolutas y relativas b. Las frecuencias Acumuladas c. Una interpretación por cada una de las frecuencias Solución : Tal como se puede leer, todas las alternativas están referidas a las frecuencias que normalmente están presentes en una Tabla se Distribución de Frecuencias (TDF). Por lo tanto, debemos construir una TDF. Para esto debemos seguir los siguientes pasos: - Básicamente una tabla con 5 columnas - El número de filas estará determinado por el número de “clases” - En la Primera columna, definir la variable con el número de “clases” necesarias o que se haya encontrado en el cuadro de datos. En este caso, hemos encontrado hogares que tienen desde 1 hijo hasta aquellos que tiene 7. Ver primera columna de la TDF - Una vez definidas las “clases” procedemos a tabular. Esto no es otra cosa que determinar el número de elementos que contiene cada una de las “clases” que hayamos definido en la primera columna. Todos esto por cada “clase” conforman la primera columna de frecuencias, denominada “Frecuencia Absoluta” = fi - No olvidar que la Σ fi = n (número de datos) - La segunda frecuencia es la “Frecuencia Relativa” = hi . Cada valor de hi se obtiene al dividir la frecuencia correspondiente(fi) entre número de datos (n) : hi = fi / n . Por ejemplo, h2 = f2 / n. - La Σ hi = 1,00 ó un valor muy cercano a la unidad - La tercera frecuencia es resultado de la primera frecuencia, por ello se la conoce como la “Frecuencia Absoluta Acumulada” = Fi . No es más que el resultado de la suma de las frecuencias absolutas parciales. De tal modo que el último dato de Fi debe coincidir con el total de datos. 12 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL - Por último, la “Frecuencia Relativa Acumulada” = Hi . No es más que resultado de la suma de las frecuencias relativas parciales. En consecuencia, el último dato de Hi debe ser 1,00 ó el valor que haya resultado de sumar hi. Veamos la TDF: Hijos por Hogares 1 2 3 4 5 6 7 Total fi 2 3 3 4 1 1 1 15 hi 2/15 = 0.13 3/15 = 0.20 3/15 = 0.20 4/15 = 0.27 1/15 = 0.07 1/15 = 0.07 1/15 = 0.07 1.01 Fi 2 2+3=5 5+3=8 8 + 4 = 12 13 14 15 --- Hi 0.13 0.13 + 0.20=0.33 0.33 + 0.20=0.53 0.53 + 0.27=0.80 0.87 0.94 1.01 ---- Interpretaciones : - La frecuencia f2 : 3, significa que 3 hogares tienen 3 hijos La frecuencia h4 : 0,27 ó 27 % de los hogares tienen 4 hijos La frecuencia F3 : 8; 8 hogares tienen no menos de 1 ni más de 3 hijos La frecuencia H5 : 0,87 ó 87% de los hogares tienen entre 1 y 5 hijos Ejemplo 2: A continuación se presentan los datos de tiempo (Minutos) de demora en atención a los clientes de una oficina bancaria. Construir una TDF 20 5 10 30 8 20 15 10 12 10 15 30 20 15 35 25 20 15 15 10 Solución. - Reconocer cuál es el tipo de variable. En este caso es Cuantitativa continua Determinar el número de intervalos. Para ello, aplicamos Regla de Sturges: m = 1 + 3,32 log n , donde “n” es el número de datos. Aplicando Sturges, tenemos : m = 1+3,32 log20 = 1+3,32(1,30) m = 1+ 4.32 = 5.32 ≈ 6. Esto quiere decir que la TDF tendrá 6 intervalos Necesitamos conocer el R = Valos Máximo – Valor mínimo de los datos R = 35 – 5 = 30 Ahora la amplitud : C = R / K: C = 30 / 6 = 5 Con estos datos pasamos a construir los intervalos: El límite inferior del primer intervalo es el mínimo valor encontrado en los datos. En este caso es : 5 [ 5 - [ 13 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL - Para hallar el límite máximo del primer intervalos, a “ 5 ” le suma la amplitud ( C ) encontrada en el procedimiento anterior. Por lo tanto, tendríamos : → 5 + 5 = 10 - Entonces Primer intervalos de su TDF es : [ 5 - 10 [ - Para el segundo intervalo se repite el procedimiento. Considerando que el límite inferior del segundo intervalos es el límite máximo del primer o anterior intervalo. Así sucesivamente : [ 10 - 15 [ Construcción de la TDF : Tiempo de Demora [ 5 - 10 [ [ 10 - 15 [ [ 15 - 20 [ [ 20 - 25 [ [ 25 - 30 [ [ 30 - 35 ] Fi 2 5 5 4 1 3 Hi 0.10 0.25 0.25 0.20 0.05 0.15 Fi 2 7 12 16 17 20 Hi 0.10 0.35 0.60 0.80 0.85 1.00 - Cuando se trabaja con una variable cuantitativa continua, la diferencia respecto del resto de TDF está en la primera columna. Lo demás es prácticamente igual que cuando se trabaja una variable cualitativa, por ejemplo. - Como se trata de una variable cuantitativa continua, entonces los límites inferior y superior de todos los intervalos deben ser cerrados. Por lo tanto, el resto es considerado abierto. Preguntas : - Cuál es el número de personas que tienen un tiempo de demora que no es mayor 28 ni menor de 18 minutos 18 ‘ 5 10 15 28’ 20 25 0 30 35 Tal como se puede observar : 14 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Tenemos : (2/5) f3 + f4 + (3/5) f5 = (2/5)5 + 4 + (3/5) 1 = 6.6 ≈ 7 Por lo tanto, hay 7 personas que se demoran entre 18 y 23 minutos en ser atendidos. Ejercicios y Problemas Propuestos 1. A continuación se presentan los datos de una encuesta sobre preferencias en el consumo de gaseosas. Los respuestas se presentan en la siguiente Tabla de Distribución de Frecuencias (TDF): Marca de Gaseosas Marca X Marca Y Marca W Marca Z Marca S Fi 30 15 50 10 20 125 hi 0.24 0.12 0.40 0.08 0.16 1.00 Interpretar : b. Frecuencia absoluta sub 3 (f3 ) c. Frecuencia absoluta sub 5 (f5 ) d. Frecuencia Relativa sub 2 (h2 ) e. Frecuencia Relativa sub 4 (h4 ) 2. En la siguiente tabla de frecuencias se han organizado los datos de una encuesta respecto de la marca de cigarrillos que más preferencias tienen en el mercado de los jóvenes entre los 20 y 25 años : Marca Cigarrillos Marca A Marca B Marca C Marca D Marca E Fi 30 10 45 55 25 165 Hi 0.18 0.06 0.27 0.33 0.15 0.99 Fi 30 40 85 140 165 Hi 0.18 0.24 0.51 0.84 0.99 Interpretar: a. Frecuencia absoluta acumulada sub 2 (F2 ) b. Frecuencia absoluta acumulada sub 4 (F4 ) c. Frecuencia relativa acumulada sub 3 (H3 ) d. Frecuencia relativa acumulada sub 5 (H5 ) 3. A continuación se presentan los datos de una encuesta respecto de los países europeos más visitados en los últimos 10 años. 15 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Francia Alemania Suiza Italia España España Alemania Inglaterra España Italia Italia Suiza Francia Francia Italia Inglaterra Italia Francia Alemania Italia Francia Alemania Inglaterra Italia Francia Inglaterra Suiza Francia Suiza Inglaterra A partir de los datos : a. Construir una TDF para una variable cualitativa, considerando las 4 frecuencias b. Interpretar f2 c. Interpretar F4 d. Interpretar h1 e. Interpretar H3 4. Hacia fines del 2011 se realizó la 5ta selección anual de países con mayores destinos y atractivos turísticos del mundo. A continuación los lugares con mayor flujo de turistas internos como externos Pirámides Machu Picchu CI Pirámides Amazonas Machu Picchu Machu Picchu Machu Picchu Amazonas Petra GCC Machu Picchu Pirámides Amazonas GCC Machu Picchu Amazonas CI Machu Picchu Petra GCC Machu Picchu Machu Picchu Pirámides CI Amazonas GCC Pirámides Amazonas Petra CI = Cataratas de Iguazú; GCC= Gran Cañón del Colorado Con esta información : a. Definir la Variable b. Construir la TDF, considerando todas las frecuencias c. Interpretar f5 d. Interpretar h2 e. Interpretar F3 f. Interpretar H4 5. El número promedio de hijos de 15 hogares de un asentamiento humano son: 5 4 6 3 2 1 4 4 3 1 4 2 3 2 7 Con esta información obtener : a. Las frecuencias absolutas y relativas b. Las frecuencias Acumuladas c. Una interpretación por cada una de las frecuencias 6. A continuación se presenta la información respecto de las adquisiciones de libros y/o revistas realizadas en la última edición de la Feria internacional del Libro llevada a cabo a fines del 2011. 5 6 2 3 10 9 1 3 10 4 4 6 9 6 4 4 2 3 2 1 8 1 5 5 1 7 1 1 3 4 16 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Con esta información, construir : a. Una TDF a partir de la naturaleza de la variable correspondiente, considerando las 4 frecuencias. b. Interpretar f1 c. Interpretar h2 d. Interpretar F3 e. Interpretar H2 7. Una muestra de 50 alumnos fueron encuestados respecto del número de hermanos. A continuación las respuestas : 1 2 3 3 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 2 2 3 4 6 2 2 3 4 6 2 3 3 5 6 Construir: a. Una TDF en función de la Variable correspondiente b. Interprete f2 c. Interprete h1 d. Interprete F3 e. Interprete H4 8. A continuación se presenta la cantidad de minutos que toma viajar desde el hogar hasta el trabajo para un grupo de ejecutivos con automóvil. A partir de los siguientes datos : 28 23 35 25 29 42 48 36 38 37 31 33 41 26 28 19 21 40 32 32 45 26 25 20 16 31 23 43 a. Construir una TDF aplicando el Método de Sturges, considere en su solución cada uno de los pasos necesarios : hallar número de intervalos ( K), hallar el rango o recorrido ( R ) y la amplitud ( C ) b. Definir el número de intervalos necesarios en este caso c. Defina el límite inferior del primer intervalo d. Defina el límite superior del último intervalo e. Interprete un caso de cada una de las frecuencias 9. De acuerdo de una estudio de mercado se ha determinado que las habitaciones, una muestra de 40 hoteles, tienen los siguientes precios ( US $ por noche): 60 180 250 210 85 220 70 240 350 90 310 500 1200 280 295 200 180 490 340 410 450 590 280 400 175 650 500 200 490 70 720 140 350 520 60 450 680 190 75 350 90 350 800 120 350 en 100 570 560 750 430 17 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Con esta información: a. Definir la variable correspondiente b. Construir una TDF aplicando Sturges: hallar número de intervalos (K), hallar el rango o recorrido ( R ) y la amplitud ( C ) c. Definir el número de intervalos necesarios para este caso d. El límite superior del último intervalo coincide con el máximo valor de la tabla de datos ? e. Interprete un caso de cada una de las frecuencias 10. En la siguiente tabla se muestran los resultados de una muestra de hogares respecto de sus gastos quincenales sólo en comestibles. Los datos están en dólares : 271 205 309 475 280 363 279 246 290 240 159 266 278 170 435 100 199 90 190 120 227 177 80 320 330 337 162 335 430 295 232 120 294 250 303 150 570 279 192 200 342 319 181 240 120 Se pide : a. Construir una TDF b. Límite superior del tercer intervalo c. Límite inferior del último intervalo d. Qué diferencia las “clases” de este ejercicio de las que tiene una variable Cuantitativa Discreta??? e. Interpretar los casos que usted estime conveniente de cada una de las Frecuencias Nivel de Dificultad II 11. Los alumnos del último curso de Bachillerato de un instituto han elegido una carrera según aparecen en la siguiente tabla: Carrera Medicina Alumnos 250 Derecho 176 Ciencias 127 Letras 314 Ingeniería Otras 103 30 a. Construir la tabla de distribución de frecuencias adecuada para la variable carrera elegida por los alumnos. b. Realizar los gráficos pertinentes que permitan describir la información. 12. Cierta empresa exportadora muestreó sus registros de embarque durante cierto día. A continuación se presentan los tiempos, en días de demora, desde la recepción de la orden hasta la entrega: 4 11 12 20 8 5 14 19 11 10 6 15 7 24 13 7 13 29 11 6 18 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Construya una distribución de frecuencias para los datos anteriores. Use intervalos de 6 días. a. A partir del cuadro de distribución anterior, ¿qué afirmación puede hacer sobre la eficacia del procesamiento de pedidos? b. Si esta empresa quiere asegurarse de que la mitad de sus entregas se realicen en 10 o menos días, ¿puede usted determinar mediante la distribución de frecuencias si la compañía ha alcanzado esta meta? 13. Los datos que a continuación se presentan muestran las exportaciones de harina de pescado (en toneladas) de cierta empresa en los últimos 60 meses: 807 660 881 1056 766 832 811 753 872 1076 787 863 620 1050 869 958 923 852 650 918 841 970 792 788 817 857 847 776 803 980 732 867 833 828 933 889 747 675 829 831 947 1030 823 880 827 781 717 897 844 907 878 890 822 811 1088 1082 817 753 755 891 a. Con los datos anteriores construya una distribución de frecuencias usando 6 intervalos de igual amplitud. b. ¿Durante cuántos meses las exportaciones fueron menores a 854 toneladas? c. El Gerente de Ventas recibe un bono siempre que las exportaciones sean iguales o superen las 776 toneladas como mínimo el 75% de las veces. ¿Recibirá el bono? d. ¿Cuál fue el intervalo de exportaciones que se dio con más frecuencia? 14. Los datos que a continuación se presentan muestran las edades de 50 miembros de un programa de servicio social de ESSALUD: 81 66 43 39 92 53 88 54 87 72 67 67 76 76 82 60 65 70 97 80 80 52 97 86 70 64 72 68 45 65 56 74 82 60 50 54 65 75 43 58 91 73 79 65 70 61 69 60 76 56 a. Con los datos anteriores construya una distribución de frecuencias usando 13 intervalos iguales. b. Las políticas estatales de los programas de servicio social exigen que no menos del 40% de los participantes del programa tengan 69 o más años. ¿Se ajusta el programa a esta política? c. ¿Cuántos participantes tienen menos de 84 años de edad? d. ¿Qué porcentaje de los participantes tienen 59 o más años pero menos de 94 años? 15. Las ganancias diarias de los establecimientos de un centro comercial se presentan en una tabla de frecuencias con 6 intervalos de clase, se sabe que la mínima ganancia es de US$ 6 y la máxima es US$ 42. Además: 19 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL f4 = 304; a. b. c. d. e. h3 = 0.25; F2 = 120; H2 = 0.15; H5 = 0.93; f2 = 2f1 Reconstruir todas las distribuciones de frecuencias. Hallar la ganancia más frecuente ¿Cuántos establecimientos tienen ganancias diarias de 24 o más dólares? ¿Qué porcentaje de tiendas tienen ganancias diarias menores a US$ 30? ¿Qué porcentaje de tiendas tienen ganancias diarias mayores o iguales a US$ 18 pero menores de US$ 36? 16. Los datos que a continuación se presentan muestran las exportaciones anuales (en cientos de miles de dólares) de 30 empresas del sector agroindustrial: 60 38 46 30 35 29 38 40 38 60 10 80 45 45 40 20 60 28 35 49 15 20 49 82 40 30 72 54 55 105 a. Construir una distribución de frecuencias con 6 clases. b. Cuál es el intervalo de exportaciones que presenta el mayor número de empresas. c. ¿Qué porcentaje de empresas exportan 74 o más cientos de miles de US$ pero menos de 90 cientos de miles de US$? d. ¿Cuántas empresas exportan menos de 58 cientos de miles de US$? e. ¿Qué porcentaje de empresas exportan 26 o más cientos de miles de US$ 17. Una empresa que exporta manzanas realizó un muestreo para determinar la calidad de su producto en el mercado internacional. A continuación se muestran las manzanas encontradas en cada una de las 50 cajas que contienen 48 manzanas cada una. 3 2 0 2 0 a. b. c. 4 3 3 3 0 1 0 2 1 2 2 1 1 1 3 1 0 2 2 1 2 3 2 1 2 2 3 3 3 4 5 2 0 4 5 2 0 2 1 1 1 2 3 2 2 Organizar una TDF Determine cuántas manzanas en mal estado por caja se encontró Interprete F3, H3 y f4 18. En una clínica de la capital se muestreó el tiempo (Minutos) de espera de los pacientes antes de ser atendidos con el propósito de mejorar el servicio. 35 20 45 15 25 18 10 20 40 30 50 15 30 35 40 30 35 25 45 15 50 15 20 38 45 20 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL a. b. c. d. En función de los datos, determinar la TDF correspondiente Cuál es el tiempo máximo de espera del 10 % de los pacientes que menos tiempo esperó Cuál es el tiempo mínimo de espera del 5 % de los pacientes que más tiempo esperó Cuál es el porcentaje que personas que como mínimo podía esperar 35 minutos ? 19. En el siguiente cuadro se muestran los resultados (Puntos) de la licitación en la que participaron un conjunto de empresas con el propósito de convertirse en las proveedoras del servicio que vende una empresa de servicios 35 20 45 15 25 a. b. c. 18 10 20 40 30 50 15 30 35 40 30 35 25 45 15 50 15 20 38 45 70 40 85 90 50 25 60 55 70 15 75 65 85 30 50 25 40 70 65 55 70 40 50 90 35 Cuántas empresas obtuvieron una calificación que no sobrepasaron los 60 puntos Cuántas empresas obtuvieron una calificación no menor de 25 puntos Si se estableció que las empresas que no alcanzaran los 30 puntos no podrían volverse a presentase a las futuras licitaciones. Podría establecer cuántas empresas no podrán volverse a presentar en Licitación alguna 20. Una supervisora de mantenimiento de aeronaves debe revisar una nueva entrega de pernos por parte de su nuevo proveedor. Una parte de la entrega llamó poderosamente su atención. Por lo tanto, envió 25 pernos a un laboratorio de pruebas para determinar la fuerza necesaria para romperlos. A continuación presentamos los resultados en miles de gr de fuerza: 147.8 119.9 142.0 125.0 151.1 a. b. c. 137.4 133.3 130.8 128.9 125.7 125.2 142.3 129.8 142.2 126.3 141.1 138.7 141.2 118.6 140.9 145.7 125.7 134.9 133.0 138.2 Qué parte de los pernos soportó al menos 120,000 gr de fuerza? Que parte de los pernos soportó no más de 150,000 gr de fuerza? Si la supervisora sabe que estos pernos, cuando se utilicen en un avión, se verán sometidos a fuerzas de hasta 140,000 gr de fuerza, qué parte de la muestra se romperá estando en uso 21 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Nivel de Dificultad III 21. Para conocer en qué estado (calidad) se recibe un cargamento de manzanas, se seleccionaron al azar 20 cajas de un total de 200 cajas que transportó el camión. Entre los datos registrados se tienen los correspondientes al número de manzanas en mal estado por caja: 8 cajas contenían cero manzanas malas, 5 cajas con una manzana mala, 4 cajas con dos manzanas malas, 2 cajas con tres malas y 1 caja con 4 manzanas malas. Con ésta información se le pide elaborar la tabla de frecuencias que resuma la información proporcionada y finalmente haga la representación grafica apropiada, ¿qué puede decir del grafico? 22. La siguiente tabla corresponde a la distribución de frecuencias de los salarios del último mes de los empleados de la empresa Jipam. Intervalos [450 [ [ [ [ - [ [ [ [ ] Xi Fi 750 10 hi Fi 8 0.3 33 Hi 12 TOTALES a. Complete la tabla. b. Determinar cuántos empleados perciben un salario no menor de S/510 c. Determinar cuál es el salario mínimo del 20 % de los trabajadores que menos salarios perciben. d. Determinar cuál es el salario máximo del 15 % de los que más salario ganan. e. Determinar cuál es el porcentaje de empleados que percibe un salario inferior o igual a S/720 pero no menor de S/490 23. Se clasificó la inversión de un grupo de compañías mineras en una tabla de frecuencias. Se sabe que la máxima inversión es de 56 millones de dólares, que la amplitud es de 8 millones y que las frecuencias absolutas correspondientes a los intervalos son: 4, 8, 16, 10, 6, 5, 1. Con esta información calcular: a. b. c. d. ¿Cuántas compañías tienen inversiones menores a 24 millones de dólares? ¿Qué porcentaje invierte 16 o más millones de US$ pero menos de 48? ¿Qué porcentaje invierte menos de 40 millones de US$? Si el gobierno decide otorgar beneficios tributarios a aquellas compañías cuyas inversiones asciendan a 32 millones de US$ o más, ¿cuántas empresas se beneficiarían? 24. La siguiente distribución muestra el peso en gramos de 50 paquetes de un determinado producto de exportación: 22 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Peso en grs. Hi 14 – 18 0.17 10 - 14 K/2 18 – 22 2k 22 – 26 K 26 – 30 0.13 a. ¿Cuántos paquetes hay entre 14 gr. y 22 gr.? b. ¿Qué porcentaje de paquetes tienen pesos menores a 26 grs.? 25. Completar la tabla adjunta referida a las edades de 32 estudiantes de los CEADEX: Edades Xi 16 18 20 22 24 26 Fi hi % 12.5 Fi Hi % 16 75 2 4 Totales Responder: a. ¿Cuántos estudiantes tienen edades mayores o iguales a 19 años? b. ¿Qué porcentaje tiene edades menores a 23 años? c. ¿Qué porcentaje tiene edades mayores o iguales a 17 años pero menores a 25 años? d. ¿Cuál es el intervalo de edades más frecuente? 23 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL REPRESENTACIÓN DE DATOS – GRÁFICAS 1. Con los siguientes datos se solicita que se elabore un gráfico de barras verticales. Además, debe especificar en base al gráfico obtenido, cuál es la situación de las ventas de la empresa en la segunda mitad del año VENTAS Miles de S/ Julio 40 Agosto 20 MESES Setiembre Octubre 25 35 Noviembre 40 Diciembre 70 2. De acuerdo al Gráfico : Determinar : a. Cuál de los departamentos ha contribuido con mayores ingresos para la empresa b. Aproximadamente, la diferencia de ventas entre inicio de año y la finalización del semestre por departamento y en forma global c. Cuál de los departamentos debería ser sometido a un proceso de análisis para establecer las probables causas de se estancamiento d. En conclusión, cuál ha sido el performance de la tienda en el primer semestre 3. A partir de la siguiente gráfica : 24 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL a. b. c. d. Defina el tipo de variable que se está analizando Especifique exactamente cuál es la variable en estudio Explique cómo es que se llega a realizar la distribución de las proporciones de la gráfica circular Que diferencias cualitativas encuentra entre una gráfica de barras y una circular 4. Qué diferencias encuentra entre una Gráfica de Barras y un Histograma. Y explique si una “variable cuantitativa discreta” puede ser representada a través del Histograma. 5. De los gráficos que usted conoce, seleccione el más adecuado para representar esta información en un sólo gráfico. Explique por qué el gráfico seleccionado es el más adecuado. Nivel de Colesterol 80 - 120 120 - 160 160 - 200 200 - 240 240 - 280 280 - 320 320 - 360 360 - 400 N° Hombres 25 a 34 años 13 150 442 299 115 34 9 5 N° Hombres 55 a 64 años 5 48 265 458 281 128 35 7 25 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL MEDIDAS DE TENDENCIA CENTRAL Nivel de Dificultad I Ejemplo 1: Una empresa de automóviles tiene 10 vendedores empleados. Los mismos que obtuvieron las siguientes ventas ( Número de autos) en las fiestas de Navidad: 15 10 23 10 4 8 19 28 18 19 a. Obtener el número de autos vendidos por cada vendedor Solución : - Tal como podemos apreciar, los datos son no agrupados dado que cada uno de éstos no tienen una frecuencia. En consecuencia, debemos utilizar : ∑ Xi X = ----------------- , donde i = 1, 2, … n n - Esto quiere decir que sumaremos ( ∑ ) todos los datos, desde X1 = 15, X2 = 23, . . . hasta X10 = 19. Tal como se puede ver a continuación : ∑ Xi 15 + 23 + . . . + 19 154 X = ------------- = --------------------------------- = ------------- 10 n X - = 10 15,4 ≈ 16 autos Por lo tanto, cada vendedor ha vendido en promedio 16 autos. Ningún vendedor puede haber vendido 15,4 autos en la medida que se trata de una variable cuantitativa discreta. Ejemplo 2 : Las últimas cien ventas facturadas por un establecimiento se habían agrupado en cuatro intervalos de clase, recordamos tan sólo la siguiente información: El primer intervalo tiene seis semanas como extremo superior, una frecuencia relativa de 0,2 y una amplitud de cuatro semanas. 26 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL La marca de clase del segundo y cuarto intervalo son ocho y 16 semanas respectivamente. Hasta el segundo intervalo se acumulan sesenta ventas. El tercer intervalo presenta una frecuencia de treinta ventas Con esta información construya la distribución de frecuencias y calcula la media, mediana, moda Solución : - Primero procedemos a insertar una tabla con las divisiones correspondientes para construir las frecuencias: X’i [ [ [ [ a - 6 [ 6 [ [ ] fi 20 40 30 10 100 8 16 ---- hi 0.20 0.40 0.30 0.10 1.00 Fi 20 60 90 100 Hi - A continuación insertamos la información que nos han dado. Por ejemplo, el extremo superior del primer intervalo que es “ 6 ”. Sólo debemos tener 4 intervalos. No más. En consecuencia, no necesitamos aplicar Sturges para conocer el número de intervalos - Por otro lado, el primer intervalo tiene una frecuencia relativa de 0.20. La segunda marca de clase es 8 y la marca de clase del último intervalo es 16 - Además, hasta el segundo intervalo se acumula ( Fi ) = 60 ventas y el tercer intervalo presenta una f i = 30 ventas - La suma de fi : - Como - Por lo tanto, - En consecuencia, como ∑ f i = n = 100 ventas h1 = f1 / n 0.20 = f1 / 100 f1 = 0.20 x 100 = 20 F1 = f1 = 20 F2 = F1 + f2 60 = 20 + f2 f2 = 60 – 20 = 40 - Por lo tanto, - Como - Por diferencia, hallamos f 4 = 100 – ( 20 + 40 + 30 ) - ∑ f i = f1 + f 2 + f 3 + f 4 = 100 f 4 = 10 27 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL - Habiendo obtenido todos los datos de todas las frecuencias absolutas, entonces procedemos a obtener todas las frecuencias relativas : - Ya sabemos que : - Terminamos de acumular Fi, tal como se hizo para F2 - El proceso de acumulación de frecuencia relativa acumulada Hi es similar al caso de la Fi - Hallando los intervalos. Tal como podemos intervalo los límites son : hi = fi / n ver en la tabla en el primer [ a - 6 [ - Pero también sabemos que para determinar el límite superior del intervalo, al límite inferior le sumamos el valor de la amplitud (A), tal como veremos a continuación: [ a - (a + A) [ - Para el siguiente intervalo tenderíamos que al valor (a + A) le debemos sumar de nuevo la amplitud “ A “ : [ (a + A) - { (a + A) + A } [ - Pero como en el primer intervalo el límite superior tiene un valor específico ( 6 ), entonces donde tenemos (a + A) reemplazamos por ese valor específico, de tal forma que tendríamos lo siguiente : [ 6 - { (6)+A } [ - Por otro lado, este intervalo tiene una “marca de clase” X’2 = 8, tal como podemos ver en la tabla. Además, toda marca de clase se halla son la semi-suma de los límites de cada intervalo. En este caso como necesitamos conocer la amplitud “A” para hallar todos los intervalos, entonces podemos igualar lo siguiente: ( 6 + (6 + A) ) / 2 = 8 - Como sabemos el denominador “ 2 “ pasará al otro lado multiplicando : 6 + 6 + A = 8x2 A = 16 - 12 28 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL - Entonces, el valor de la amplitud es A = 4 ventas - Por lo tanto, nuestro primer intervalo se inicia con : a = 2 [ 2 - 6 [ - El segundo intervalo será : [ 6 - (6+ 4)[ [ 6 - 10 [ - Finalmente, los 4 intervalos serán : [ 2 [ 6 [ 10 [ 14 - - 6 10 14 18 [ [ [ ] La tabla completa es tal como aparece a continuación : Número Ventas [ 2 - 6 [ [ 6 - 10 [ [ 10 - 14 [ [ 14 - 18 ] X’i 4 8 12 16 ---- fi 20 40 30 10 100 hi 0.20 0.40 0.30 0.10 1.00 Fi 20 60 90 100 Hi 0.20 0.60 0.90 1.00 Ejercicios y Problemas Propuestos 1. Obtenga la media aritmética de los siguientes valores : 6 3 5 7 6 2. Calcule la media aritmética de los siguientes valores muestrales : 1.3 7.0 3.6 4.1 5.0 3. Determine el salario medio por hora pagado a los carpinteros que obtuvieron los siguientes ingresos (US $) 15.40 22.76 20.10 30.67 18.75 18.00 4. Una empresa de automóviles tiene 10 vendedores empleados. Los mismos que obtuvieron las siguientes ventas en la fiestas de Navidad: 5. 29 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 15 10 23 10 4 8 19 28 18 19 b. Obtener el número de autos vendidos por cada vendedor 6. A continuación se presentan el número de cambios de aceite realizados en una estación de PRIMAX : 41 15 39 54 31 15 33 a. Obtener el valor de la mediana de los cambios de aceite efectuados b. Obtener el valor Modal de los cambios de aceite efectuados 7. Los siguientes datos representan variaciones porcentuales de los ingresos netos del año 2009 al 2010 de 12 empresas de construcción con sede en Lima: 5 7 1 8 -10 2 -6 5 5 -1 12 11 a. Obtener la media de las variaciones porcentuales b. Obtener el valor de la mediana de los cambios de aceite efectuados c. Obtener el valor Modal de los cambios de aceite efectuados 8. A continuación se presentan varios indicadores de crecimiento económico en nuestro país para este año 2012 que se ha iniciado: Indicadore Económico Var % Inflación 4.5 Exportaciones 4.7 Importaciones 2.3 Ingreso real disponible 2.9 Consumo 2.7 Indicador Económico PBI real Inversión Inversión Extranjera Productividad Total Productividad Fabricas Var % 2.9 3.6 2.1 1.4 5.2 a. Determinar la Mediana de variación porcentual b. Determinar la Moda de la variación porcentual 9. Una empresa del sector manufacturero registra los siguientes sueldos: Cargo Gerente General Gerente de Área Supervisor Profesional Administrativo Sueldo 15 000 12 000 7 000 4 500 2 500 PEA 1 3 6 14 8 a. Con esta información, calcula el sueldo promedio ponderado. 30 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 10. El Bufete jurídico Mendoza & Rodriguez se especializa en derecho corporativo. Cobra $100 por hora por la investigación de un caso; $ 75 por hora por una asesoría y $200 por hora por la redacción de un informe. La semana pasada uno de los socios dedicó 10 horas para asesorar a un cliente; 10 horas a la investigación del caso y 20 horas a la redacción del informe final. Cuál fue el promedio ponderado de los servicios legales por hora? 11. La Clínica San Gabriel emplea 200 personas en su cuerpo de enfermeras. De ese persona, 50 son ayudantes de enfermería, 50 son enfermeras prácticas y 100 son enfermeras generales. Las primeras reciben un pago de $8 por hora; las segundas reciben un pago de $10 por hora y las últimas reciben un pago de $14 por hora. Cuál es el pago medio ponderado por hora? Nivel de Dificultad II 12. A continuación se presentan los niveles de producción de bicicletas de los últimos meses del 2009 de las principales empresas del país. : Xi 47 48 49 50 51 52 80 Fi 5 3 2 8 3 4 1 Calcular: a. Mediana b. Moda c. Media Cada resultado deberá ir acompañado de sus respectivas unidades e interpretaciones 13. Consultados 350 matrimonios sobre la edad de la esposa, se confecciona la siguiente tabla: Edad esposa 15-20 20-25 25-30 30-35 35-40 40-50 50-70 Nº Matrimonios 23 28 76 54 60 42 67 31 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Calcular a. Media, b. Mediana c. Moda Cada resultado debe ir acompañado de sus unidades e interpretaciones 14. El gasto de servicio Telefónico Fijo mensual en 100 hogares, de una determinada ciudad, es el siguiente: Gasto en Soles 0 - 50 50 - 100 100 - 150 150 - 200 200 - 250 250 - 300 a. Calcular media, b. Mediana c. Moda. Cada resultado interpretaciones N° de Hogares 15 10 52 17 1 5 deberá ir acompañado de sus respectivas unidades e 15. El siguiente cuadro contiene una muestra de empresas exportadoras localizadas en Lima con su facturación total del año pasado y el número de empleados. Empresa Export A&1 Export B&2 Export C&3 Export D&4 Export E&5 Export F&6 Export G&7 Export H&8 Export I&9 Export J&10 Export K&11 Facturación (Millones Empleados US$) 12.4 29 5 31 3.5 10 2.1 3 1.5 8 1.2 15 1 4 1 5 0.4 1 0.3 3 0.2 4 a. Calcular la media, mediana y moda de la facturación. b. Calcular la media, mediana y moda para el número de empleados. c. ¿Qué medida de tendencia central debe usar si quiere tener una medida de tendencia central representativa para la facturación? 32 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 16. Una fábrica tiene dos departamentos: Uno de Producción y otro de Ventas. La información adjunta muestra los sueldos mensuales percibidos en cada uno de ellos : DPTO. DE PRODUCCIÓN Sueldos Mens US $ 100 – 150 150 – 200 200 – 250 250 – 300 300 – 350 350 – 400 400 – 450 N° Trabajadores 15 25 30 20 5 5 0 DPTO. DE VENTAS Sueldos Mens US $ 200 – 600 600 – 800 800 – 1000 1000 – 1200 1200 – 1400 1400 – 1600 1600 - 2000 N° Trabajadores 0 5 5 15 20 5 10 a. ¿En qué dpto. los trabajadores están mejor pagados? Sustente con cálculos su respuesta. b. Calcule el sueldo mediano en el dpto. de producción y el sueldo modal en el dpto. de ventas. c. Si se le pidiera en cada departamento usar un indicador representativo. Cuál usaría ¿? 17. Un encargado de compras ha obtenido muestras de lámparas incandescentes de dos proveedores. Mediante un sencillo proceso de control de calidad ha probado ambas muestras con respecto a la duración de su vida útil, obteniendo los siguientes resultados: Vida útil ( Horas ) 100 - 900 900 - 1100 1100 - 1300 1300 - 1500 Empresa A 10 16 26 8 Empresa B 3 42 12 3 Determinar: a. ¿Cuál de las empresas proveen mejores lámparas? b. Calcular la mediana para la empresa A y B. Qué significa la diferencias de medianas ? Realice la lectura correspondiente c. Calcular la moda para la empresa A y B d. Cuál es la diferencia entre el valor mínimo de duración del 10 % de las lámparas que más duran de la empresa A y el valor mínimo de duración del 10 % de las lámparas que más duran de la empresa B. 18. Se clasificó la inversión de un grupo de compañías mineras en una tabla de frecuencias. Se sabe que la máxima inversión es de 56 millones de dólares, que la amplitud es de 8 millones y que las frecuencias absolutas correspondientes a los intervalos son: 1, 6, 21, 9, 8, 3, 2. Con esta información calcular la inversión promedio, la mediana de las inversiones y la inversión modal. Interprete los resultados. 33 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 19. Un empresario desea repartir unas bonificaciones (US $) entre sus empleados en base a la categoría y productividad de los mismos. Dicha distribución quedó de la siguiente forma: Bonificaciones [ 10 - 15 [ [ 15 - 20 [ [ 20 - 25 [ [ 25 - 30 [ [ 30 - 35 [ [ 30 - 35 [ [ 35 - 40 ] N° Empleados 3 8 15 20 10 15 10 Determine: a. Bonificación media por trabajador b. Bonificación más frecuente c. La Bonificación que separa la mitad de ellas del resto 20. Las últimas cien ventas facturadas por un establecimiento se habían agrupado en cuatro intervalos de clase, recordamos tan sólo la siguiente información: El primer intervalo tiene seis semanas como extremo superior, una frecuencia relativa de 0,2 y una amplitud de cuatro semanas. La marca de clase del segundo y cuarto intervalo son ocho y 16 semanas respectivamente. Hasta el segundo intervalo se acumulan sesenta ventas. El tercer intervalo presenta una frecuencia de treinta ventas Con esta información construya la distribución de frecuencias y calcula la media, mediana, moda 21. La distribución del importe de las facturas por reparación de carrocería de una muestra de 80 vehículos en un taller, viene dada por la tabla siguiente: Importe ($) 40 - 60 60 - 80 80 - 100 100 - 120 Nº vehículos 10 20 40 10 Se pide: a. Calcular el importe medio. ¿El valor hallado es representativo de la 34 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL distribución de facturas? b. Calcular el importe mediano y el importe más frecuente. Nivel de Dificultad III 22. En la zona industrial ubicada en la parte sur de una ciudad existen 3 grandes plantas de ensamblaje de artefactos eléctricos que llamaremos A, B y C. La primera emplea a 54 personas y su salario medio es de 1080 soles. En la segunda trabajan 84 empleados y su ingreso medio es de 860 soles. Finalmente, la paga media de los 153 trabajadores de C es de 815 soles. ¿Cuál es el salario medio de los empleados en la industria ensambladora de artefactos de dicha ciudad? 23. La tabla que se presenta a continuación corresponde a los sueldos que perciben los empleados de dos empresas del mismo sector Sueldo $ [ 400 - 500 [ [ 500 - 600 [ [ 600 - 700 [ [ 700 - 800 [ [ 800 - 900 ] Empresa A Empresa B N° N° de Empleados de Empleados 20 20 25 10 10 15 18 25 12 20 Calcule: a. El Sueldo promedio de los empleados de la empresa A que ganan menos de $700 b. El Sueldo promedio de los empleados de la empresa B que ganan por lo menos $700 c. El sueldo que podrían percibir los empleados en cada empresa d. El sueldo máximo que percibe el 13,5 % de los empleados que menos ganan en la empresa A e. El sueldo máximo que percibe el 13,5 % de los empleados que menos ganan en la empresa B f. El sueldo mínimo que percibe el 21,5 % de los empleados que más ganan en la empresa A g. El sueldo mínimo que percibe el 21,5 % de los empleados que más ganan en la empresa B 24. Uno de los principales factores que repercuten en el costo cuando se adquiere una casa es el de los pagos mensuales del préstamo. Existen muchos sitios en internet donde los futuros compradores pueden consultar las tasas de interés y sus pagos mensuales. Interbank analiza la posibilidad de ofrecer préstamos para la adquisición de casas a través de Internet. Antes de tomar una decisión, selecciona 35 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL una muestra de préstamos recientes con sus pagos mensuales correspondientes. La información se organiza en la siguiente distribución de frecuencias: Pago Mensual de Préstamos US $ Propietarios [ 100 - 500 [ [ 500 - 900 [ [ 900 - 1300 [ [ 1300 - 1700 [ [ 1700 - 2100 [ [ 2100 - 2500 [ [ 2500 - 2900 ] 15 10 5 25 5 4 1 65 Determinar : a. El Pago medio mensual b. La Mediana de los pagos mensuales de la hipoteca. Interpretar resultado c. En cuál de los resultados ( Media o Mediana) debería confiar para tomar la decisión de un préstamo d. Cuál es el monto máximo de hipoteca que pagaría el 5% de los propietarios que menos pagan e. Cuál es l monto mínimo de hipoteca que pagaría el 12 % de los propietarios que más pagan 25. Los costos de Estiba (E) y Desestiba (D) en algunos de los puertos latinoamericanos aparecen en la siguiente tabla de información : PUERTOS Costo E&D (US$) Cartagena Quito Callao Valaparaiso Mejillones Buenos Aires Sao Paulo 230 240 480 200 220 250 70 Determinar : a. Cuál es el puerto más eficiente en nuestra región. Sustente su respuesta, tanto conceptual como en los cálculos correspondientes b. Se podría sustentar algún costo frecuente en el conjunto de puertos de la región ? 36 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 26. Se toma una muestra de llegada de aviones a un aeropuerto para estudiar el problema de retrasos de los vuelos. El tiempo de retrasos se ha tomado en minutos. Minutos de Retraso 15-25 25-35 35-45 45-55 55-65 65-75 N° vuelos 28 22 15 12 13 10 Determinar: 1. La media aritmética y la mediana 2. Qué porcentaje vuelos tiene menos de 35 minutos de retraso 3. Qué porcentajes de vuelos tiene por lo menos 20 minutos de retraso 4. Como máximo cuántos minutos de retraso tienen los vuelos que constituyen e 15 % de todos los vuelos que menos se retrasan ? 5. Cómo mínimo cuántos minutos de retraso tienen los vuelos que constituyen el 20 % de todos los vuelos que más se retrasan? 37 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL MEDIDAS DE DISPERSIÓN Nivel de Dificultad I Ejemplo : A continuación se presentan los tiempos en minutos de un grupo de estudiantes que han participado en una competencia : Tiempos Minutos [ 0 - 10 [ [ 10 - 20 [ [ 20 - 30 [ [ 30 - 40 [ [ 40 - 50 [ [ 50 - 60 ] a. b. c. Estudiantes 12 18 24 26 14 6 Calcular la Media Aritmética Calcular la Varianza Calcular la Desviación Estándar Solución : a. Dado que es una variable cuantitativa continua debemos aplicar la ecuación de media aritmética correspondiente: Σ X’i fi X = ----------------, donde X’i es la marca de clase n - Como sabemos la marca de clase es la semi-suma de los límites de cada intervalo, entonces demos tener una columna donde tengamos los datos de cada marca de clase y una columna donde estén el producto de éstas con cada “ fi “ [ [ [ [ [ [ - Minutos 0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 [ [ [ [ [ ] Estudiantes 12 18 24 26 14 6 X’i X’i . fi 5 15 25 35 45 55 60 270 600 910 630 330 Al hacer la sumatoria de la columna Σ X’i fi = 2800. Por lo tanto : Σ X’i fi 2800 X = ---------------- = ------------ 38 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL n - 100 La media aritmética : X = 28 minutos b. Para poder obtener la varianza teniendo intervalos debemos trabajar con la siguiente ecuación : σ 2 (x) = Σ ( Xi’ – X )2 . f i / n - De acuerdo a la ecuación planteada, por cada nivel de intervalo, debemos restar de la “marca de clase” la media aritmética. El resultado de esa diferencia debe ser elevada al cuadrado. Este resultado, a su vez, debe ser multiplicada por cada “ fi “. La sumatoria ( Σ) de esto datos parciales, finalmente, se deben dividir entre el número datos. Ver la cuarta columna de la siguiente tabla : Minutos Estudiantes : fi [ 0 - 10 [ [ 10 - 20 [ [ [ [ [ - 20 30 40 50 - 30 40 50 60 12 18 [ [ [ ] 24 26 14 6 X’i 5 15 25 35 45 55 ( Xi’ – X )2 . f i ( 5 – 28 ) 2. 12 ( 15 – 28 ) 2.18 ( 25 – 28 ) 2.24 ( 35 – 28 ) 2.26 ( 45 – 28 ) 2.14 ( 55 – 28 ) 2.6 Al realizar la sumatoria de la cuarta columna obtenemos un total de 21028. Este total debe ser dividido entre el total de datos que en este caso es n = 100. Por lo tanto la Varianza es : Σ ( Xi’ – X )2 . f i = 21028 / 100 σ 2 (x) = 210.28 Minutos 2 c. Para obtener la desviación Estándar, como ya sabemos sacamos la raíz cuadrada al resultado de la varianza. Tal como veremos a continuación σ (x) = √ 210.28 Minutos 2 σ (x) = 14.50 minutos - Lo cual significa que en promedio, los estudiantes hacen un tiempo de diferencia respecto de su media aritmética o de su valor central, 14.50 minutos. 39 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Ejercicios y Problemas Propuestos 1. Un censo realizado en CEADEX arrojó que las edades de los alumnos de 6to. ciclo eran las siguientes: 18 30 25 20 27 42 26 21 23 32 d. e. f. Calcular Varianza, Desviación Estándar Coeficiente de variación Interprete todas las respuestas sin olvidar las medidas o unidades correspondientes 2. De acuerdo a una encuesta, el ingreso promedio mensual de 10 familias de una determinada zona de Lima Metropolitana fueron: 4500 3600 2900 1800 1000 5200 6000 900 3600 5700 a. Calcular Varianza b. Desviación Estándar c. Coeficiente de Variación Interprete todas las respuestas sin olvidar las medidas o unidades correspondientes 3. Según el reporte anual de una empresa, se obtuvieron los siguientes dividendos primarios por cada acción (Título de valor) negociado en Bolsa en los 5 años previos tal como aparece en la siguiente tabla 2.68 1.03 2.26 4.30 3.58 a. Calcular la media aritmética de los dividendos b. La varianza correspondiente c. El coeficiente de variación Interprete todas las respuestas, sin olvidar las unidades correspondientes 4. A continuación se presentan los niveles de exportación ( US $ ) de los últimos 10 meses. Los datos se encuentran en cientos de millones : 350 400 a. b. c. d. e. 550 850 900 950 450 380 750 680 Calcular la media aritmética de las exportaciones Calcular la varianza Calcular la desviación estándar Calcular el coeficiente de variación Calcular el coeficiente de asimetría 40 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 5. En una muestra de 100 familias se han determinado los siguientes gastos mensuales en medicina : Gasto en Soles [ 0 - 100 [ [ 100 - 200 [ [ 200 - 300 [ [ 300 - 400 [ [ 400 - 500 [ [ 500 - 600 ] a. b. c. d. e. N° de Hogares 12 18 24 26 14 6 Calcular la Media Aritmética Calcular la Varianza Calcular la Desviación Estándar Calcular el coeficiente de variación Calcular el coeficiente de asimetría Interprete todos los resultados 6. A continuación se presentan los tiempos en minutos de un grupo de estudiantes que han participado en una competencia : Tiempos Minutos [ 0 - 10 [ [ 10 - 20 [ [ 20 - 30 [ [ 30 - 40 [ [ 40 - 50 [ [ 50 - 60 ] Estudiantes 12 18 24 26 14 6 a. Calcular la Media Aritmética b. Calcular la Varianza c. Calcular la Desviación Estándar d. Calcular el coeficiente de variación e. Calcular el coeficiente de asimetría Interprete todos los resultados 7. En una pequeña empresa de 100 empleados los salarios se distribuyen según se indica en la siguiente tabla: Salario Mensual ( S/ ) [ 280 - 320 [ [ 320 - 360 [ [ 360 - 400 [ [ 400 - 440 [ [ 440 - 480 [ a. Empleados 12 18 24 26 14 Calcular la Media Aritmética 41 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL b. c. d. e. Calcular la Varianza Calcular la Desviación Estándar Calcular el coeficiente de variación Calcular el coeficiente de asimetría Interprete todos los resultados 8. En el siguiente ejercicio especifique los niveles de homogeneidad : 110 450 20 Varianza ΣXi N° de Datos 80 300 30 64 200 25 144 600 40 256 625 25 144 300 35 115 420 60 400 75 15 125 250 35 9. El Chef en jefe de uno de los restaurantes más importantes de Lima ha recibido dos docenas de paltas de su proveedor, pero todavía no los acepta. Sabe por la factura que el peso por unidad es 101.04 gr. Pero, dada las exigencias de sus comensales, ella quiere que sus paltas tengan un peso uniforme. Aceptará las paltas si su peso por unidad es 101.04 gr. Y la desviación estándar es menor que 20 gr. Los pesos de las paltas se presentan a continuación : 70 80 95 98 130 95 85 82 80 100 108 95 105 85 112 102 140 115 128 105 75 125 125 90 a. Cuál es la decisión de la Chef b. Argumente la razón por la que la Chef defiende su posición 10. En un laboratorio determinado, el técnico Roberto realiza un promedio de 50 análisis diarios con una desviación estándar de 10.En tanto que el técnico Alberto efectúa un promedio de 180 análisis diarios con una desviación 25. Cuál de los dos técnicos muestra mayor homogeneidad. Nivel de Dificultad II 11. Según el estudio del Banco Mundial respecto a la ingesta calórica en la ciudad de Huamanga (Ayacucho - Perú), el consumo de calorías diarias en una muestra de personas se han resumido en la siguiente tabla : Calorías Consumidas [ 0 - 500 [ [ 500 - 1000 [ [ 1000 - 1500 [ [ 1500 - 2000 [ [ 2000 - 2500 ] N° de Personas 6 10 18 42 28 a. Calcular la Desviación Estándar b. Supongamos que el consumo de una personal normal es de 2000 calorías diarias, ¿Existiría desnutrición? ¿En qué porcentaje? c. Se podría decir que la media aritmética en este caso sería representativa de 42 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL la ingesta calórica de esta zona del Perú d. Existe un consumo homogéneo de calorías en Ayacucho ¿? e. Existe una ingesta calórica asimétrica en esta muestra de la población ? 12. Según una investigación de mercado tanto en las empresas dedicadas a la Exportación como a la Importación, éstas presentan los siguientes niveles de remuneraciones mensuales entre sus empleados : Empresas de Exportación Sueldos US $ N° Trabajadores [ 100 – 250 [ 15 [ 250 – 400 [ 25 [ 400 – 550 [ 30 [ 550 – 700 [ 20 [ 700 – 850 [ 10 [ 850 – 1000 [ 12 [ 1000 – 1150 ] 5 Empresas de Importación Sueldos US $ N° Trabajadores [ 200 – 600 [ 10 [ 600 – 800 [ 8 [ 800 – 1000 [ 12 [ 1000 – 1200 [ 20 [ 1200 – 1400 [ 15 [ 1400 – 1600 [ 5 [ 1600 - 2000 ] 3 a. Calcular en qué tipo de empresa los empleados están mejor pagados b. En qué tipo de empresa los sueldos son más homogéneos. Explique ese resultado. c. A qué se debe que los trabajadores de las empresas de importación tienen mayores niveles de asimetría. Demuestre si esto es cierto. 13. Los gastos semanales en transporte urbano (nuevos soles) que efectúan los habitantes de Arequipa y Piura han sido estudiados mediante las muestras siguientes : 22.0 24.0 Gastos Semanales en Movilidad en la ciudad de Arequipa 22.0 22.1 23.2 23.2 25.5 27.5 24.5 24.5 23.5 23.5 28.5 29.5 28.5 24.5 16.5 22.0 Gastos Semanales en Movilidad en la ciudad de Piura 17.5 17.5 23.5 20.5 20.5 21.5 22.0 23.5 23.5 26.5 25.5 19.0 21.5 18.5 a. Realice un análisis comparativo respecto de la media y mediana de los pasajes en ambas ciudades b. Determine en cuál de las ciudades los pasajes son más homogéneos. Explique su respuesta. c. Cuáles son los niveles de asimetría que presentan ambas ciudades. Explique por qué se presentan los sesgos correspondientes 14. Una empresa cuenta con cuatro departamentos: A, B, C y D. Según la información, las respectivas remuneraciones se encuentran condensadas en la siguiente tabla: 43 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL ITEMS A 800 100 200 Media Salarial Desviación Estándar Número de Empleados B 743 112 160 C 600 94 190 D 770 86 150 a. Calcule le remuneración promedio de un trabajador de la empresa b. En cuál de los departamentos la remuneración es menos homogénea c. Ordene en forma ascendente los niveles de homogeneidad de los salarios de la empresa d. Determine el número exacto de trabajadores de la empresa e. Ordene los departamentos de le empresa de acuerdo a los niveles de dispersión que presenten f. Realice cada una de las interpretaciones de los indicadores estadísticos obtenidos 15. Un encargado de compras ha obtenido muestras de lámparas incandescentes de dos proveedores. Mediante un sencillo proceso de control de calidad ha probado ambas muestras con respecto a la duración de su vida útil, obteniendo los siguientes resultados: Vida útil ( Horas ) [ 100 – 900 [ [ 900 – 1100 [ [ 1100 – 1300 [ [ 1300 – 1500 ] Empresa A 10 16 26 8 Empresa B 3 42 12 3 Determinar: a. ¿Cuál de las empresas debería ser elegida para ser proveedor de las lámparas? Explique su respuesta, cuantitativa como conceptualmente b. ¿En cuál de las empresas la duración de la vida útil de las lámparas es más homogénea? c. Cuál es el tiempo mínimo de duración del 10 % de las lámparas que más tiempo duran en cada una de las empresas d. Cuál es el tiempo máximo de duración del 10 % de las lámparas que menos tiempo duran en cada una de las empresas 16. En la siguiente tabla se muestran las productos agrícolas en millones de dólares: Año 1995 1996 Exportaciones 18.97 33.46 a. b. c. exportaciones anuales de 1997 1998 1999 2000 2001 2002 82.03 28.89 20.20 44.82 56.07 177.11 Determine si las cifras de exportaciones nos están mostrando algún sesgo en la distribución de datos ¿Cuál es el valor más representativo para estos niveles de exportación ? Sustente cuál es el nivel de dispersión que contienen las cifras de exportación y señale cuál es la razón más importante para esos niveles de dispersión 44 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL d. ¿En qué año se espera que el monto exportado en el año 2002 se duplique? 17. A continuación se presentan las ventas de 5 semanas ( Miles de S/) de dos de los principales productos (A y B) de una empresa textil. Ventas del Bien "A" [ [ [ [ [ Miles S/ 10 - 20 [ 20 - 30 [ 30 - 40 [ 40 - 50 [ 50 - 60 ] Fi 3 9 26 10 7 Ventas del Bien "B" Miles S/ [ 2 - 4 [ [ 4 - 6 [ [ 6 - 8 [ [ 8 - 10 [ [ 10 - 12 [ Fi 6 15 22 8 4 a. Calcule la varianza y la desviación estándar b. Qué producto tuvo un nivel de ventas más homogéneo y qué implica que sea más homogéneo c. Señale cuál de los productos presenta una mayor asimetría. Explique por qué presenta esa mayor asimetría. 18. El Departamento de control de calidad de la empresa Nova SA que se encarga de ensamblar hornos para uso doméstico ha realizado la siguiente información. Cada horno está diseñado para recalentar hasta una temperatura de 240 °C durante cuatro minutos, y después apagarse. Sin embargo, puede suceder que el horno no alcance los 240 °C en el tiempo asignado, debido a una instalación inadecuada y por otras razones. De manera semejante, la temperatura podría sobrepasar los 240 °C durante el ciclo de precalentamiento de cuatro minutos. Una muestra grande de cada una de las tres líneas de producción indicó la siguiente información: Medidas Estadística Media Artimética Mediana Moda Desviación Estándar Temperatura °C Línea 1 Línea 2 Línea 3 238.1 240 242.9 240 240 240 241.5 240 239.1 3 0.4 3.9 a. Qué línea presenta mayor nivel de variación en la temperatura? Cómo se sabe esto??? b. Qué líneas tienen sesgos positivos en la distribución de las temperaturas de los hornos?? Demuestre. c. Determine las Varianzas correspondientes 19. El departamento de investigaciones de la oficina de Defensa del Consumidor ha decidido probar la durabilidad de tres tipos de focos ante la constante demanda de los usuarios. Los datos aparecen en la tabla siguiente : Tipos de Foco Foco 1 Foco 2 Foco 3 Promedio Vida 1470 horas 1400 horas 1350 horas Varianza 156 81 Desv Estándar 6 horas 45 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL a. b. Ordene los focos de acuerdo a sus niveles de homogeneidad Señale cuál de los focos es el mejor 20. En una prueba de rendimiento y consumo de gasolina se probaron 13 vehículos durante 300 Km en condiciones de tránsito en ciudad (A) y en el campo (B). De este proceso se obtuvieron los siguientes resultados en Km por galón. A 16.2 16.7 15.9 14.4 13.2 15.3 16.8 16.0 20.1 15.3 15.2 15.3 16.2 B 19.4 20.6 18.3 18.6 19.2 17.4 17.2 18.6 19.0 21.1 18.5 19.4 18.7 Cómo podría determinar en qué lugar el rendimiento fue mayor. Entendiendo por mayor rendimiento el mayor recorrido por kilómetro. Nivel de Dificultad III 21. Los datos siguientes representan el porcentaje de la meta lograda por 3 vendedores en los últimos 5 años: Nombre Jorge Juan Pilar Año 1 Año 2 Año 3 Año 4 Año 5 88 76 104 68 88 88 89 90 118 92 86 88 103 79 123 Si en esta empresa el desempeño de los vendedores se evalúa según la constancia con que un vendedor cumple con las metas establecidas : a. ¿Cuál de los 3 vendedores sería el mejor evaluado? Por qué ?Sustente su respuesta numérica como conceptualmente b. Defina cuál es el vendedor que presenta el CV menos heterogéneo 22. En una empresa los sueldos de los empleados están organizados en una tabla de frecuencias. El sueldo menor es $200 y el mayor $1200. El 15 % de los sueldos son menores de $400; el 45% de lo sueldos son menores que $600; el 60% son menores que $800 y el 75% de los sueldos son menores que $1000. Se sabe que hay 1000 empleados. a. b. c. d. e. Construir la TDF Determine la Varianza Determine al desviación estándar El Coeficiente de variación Determine si hay congruencia entre los niveles de dispersión encontrados y el nivel de heterogeneidad encontrado f. Según el gerente de recursos humanos de la empresa, en ella los sueldos extremadamente homogéneos. Demuestra esta apreciación 46 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 23. Una empresa que produce conservas de pescado necesita expandir su planta de producción. Para ello, recurre al sistema financiero. Una de las informaciones que le pide el Banco es el Volumen de Producción. La información se presenta a continuación: Meses de Producción Enero Febrero Marzo Abril Mayo Junio Julio Agosto Set Octubre a. b. Número de Latas de conservas (Unidades) 10,000 5,000 4,000 9,000 36,000 10,000 8,000 2,000 7,000 8,500 Cuál es el principal problema que podría encontrar el banco al analizar la información Cuál debería ser el dato representativo con el que el banco debería trabajar y por Qué ? 24. El Sr. Carlos García desea adquirir un condominio en Asia ( al Sur de Lima). Su agente de bienes raíces le ha indicado que el precio promedio es de US $ 110,000. a. b. Condominios PRECIOS us $ Tipo A 60,000 Tipo B 65,000 Tipo C 70,000 Tipo D 80,000 Penthouse 275,000 El Sr. García podrá adquirir su propiedad ? Sustente su respuesta Cuál es el concepto de las MTC que está presente en este caso? 47 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL TÉCNICAS DE MUESTREO 1. Qué tan grande debe seleccionarse una muestra para tener un nivel de confianza de 95% con un margen de error de 10? Suponga que la desviación estándar es 40. 2. En un conjunto de datos se estima que el rango es 36. a. ¿Cuál es el valor planeado para la desviación estándar poblacional? b. ¿De qué tamaño debería ser la muestra para que el margen de error en un nivel de confianza de 95% sea 3? c. ¿De qué tamaño debería ser la muestra para que el margen de error en un nivel de confianza de 95% sea 2? 3. El costo promedio de la gasolina sin plomo en Grater Cincinnati es $2.41 (The Cincinnati Enquirer, 3 de febrero de 2006). En una época de cambios en los precios, un perodico muestrea las gasolineras y presenta informe sobre los precios de la gasolina. Suponga que en los precios del galón de la gasolina sin plomo la desviación estándar es $0.15: dé el tamaño de muestra de n que debe usar este periódico para tener 95% de confianza con cada uno de los márgenes de erros siguientes: a. Un margen de erros de $0.07 b. Un margen de erros de $0.05 c. Un margen de erros de $0.03 4. Se quiere estimar la edad promedio de 2,500 (N) estudiantes del último año en una universidad. ¿Cuál debe ser el tamaño de la muestra (n) si queremos estimar dicha variable con un error no mayor a 2 años y con un nivel de confianza de 95% ? Supongamos que S² = 30. 5. Se quiere estimar el ingreso promedio de 15000 (N) hogares de una ciudad. ¿Cuál debe ser el tamaño de la muestra (n) si queremos estimar dicha variable con un error no mayor a 5 soles y con un nivel de confianza de 95% ? Supongamos que S = 50 6. Los salarios anules iniciales de estudiantes que acaban de terminar una carrera en administración se espera que estén entre $30000 y $45000. Suponga que quiere dar un nivel de confianza de 95% para estimar la media poblacional de los salarios iniciales. ¿Cuál es el valor planeado de la desviación estándar poblacional? ¿Cuán grande deberá será la muestra si quiere que el margen de erros sea: a. b. c. d. $500? $200? $100? ¿Recomendaría usted tratar de tener $100 como margen de error? NÚMEROS ÍNDICES 48 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Nivel de Dificultad I Ejemplo 1: Las exportaciones en toneladas de cierto producto en los últimos 4 años se muestran en la siguiente tabla: Años Toneladas 2000 40 2001 36 2002 41 2003 94 a. Calcular los índices de cantidad para cada año, tomando como base el año 2000. b. Calcular los índices de cantidad para cada año, tomando como base el año 2002 Solución : a. Para calcular los índices de cantidad ( Iq ) debemos dividir el dato de un período cualquiera con el dato del año base. : - Para esta alternativa nos dicen que el año base es el año 2000, en consecuencia el índice de ese año es 100. Para determinar el resto de los índices se dividen los datos de los diferentes períodos entre el dato del mismo año base : Iq 2001 = ( Qt / Q0 )x 100 , donde - t : dato del 2001 ; 0 : dato año base Por lo tanto, vamos a tener un índice para el 2001 Iq 2001 = ( 36 / 40 ) x 100 = 90,0 - Este procedimiento se repite para el resto de períodos. Como consecuencia, tendremos los índices que se ven en la siguiente tabla. Los cambios de índice se van a producir cuando se produce un cambios de año base, que es lo que se pide en la alternativa “b” b. Para calcular los índices de cantidad ( Iq ) considerando el año 2002 como año base, debemos dividir todos los datos entre el dato del año base. Siguiendo el mismo procedimiento del caso anterior. Ver los índices para ambas alternativas en la siguiente tabla : Años Iq Año base 2000 Iq Año base 2002 2000 100 97.56 2001 90.0 87.80 2002 102.5 100 2003 235.0 229.27 - De acuerdo a los resultados, cuando el años base fue el 2000, sus índices muestran lo siguiente. Para 2001, el índice nos indica que hubo una disminución de 10 % en el nivel de producción respecto del año base. Para el 2002, por el contrario la producción se incrementó en 2,5% y, finalmente, para el 2003, la producción tuvo un incremento de 135 % respecto del año base. - Cuando se cambia la base( año 2002 ), los resultados cambian nítidamente. Según el nuevo año base, el año 2000 se produjo 2.44% menos de lo que se obtuvo en términos de producción en el año base. 49 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Ejemplo 2: Los índices de producción de un bien de 1989 a 1993 fueron respectivamente 1.00, 1.15, 1.20, 1.24 y 1.30. Si en 1992 se produjeron 12.5 toneladas de dicho bien; calcular la producción de los demás años. Solución : - Vamos a insertar los datos dados en una tabla para poder visualizar los índices con la producción : Años 1989 1990 1991 1992 1993 Indices 1.00 1.15 1.20 1.24 1.30 Producción 12.5 - Por la naturaleza de los índices se puede deducir que el año base es 1989. Por ello, el índice de ese años es 1.00 ó 100 - Por otro lado, sabemos que para obtener un índice de cantidad, en este caso de 1992 se aplica la siguiente expresión : Iq 1992 = ( Q1992 / Q0 ) - Reemplazando los datos de 1992, tendríamos : 1.24 = 12.5 / Q0 - Si queremos conocer la producción del año base (Qo), entonces en la expresión anterior ( Qo) pasa a multiplicar a 1.24 pero este dato pasa a dividir el nivel de producción : 1.24 x Qo = 12.5 Qo = 12.5 / 1.24 - Por lo tanto, el nivel de producción del años Base es : Qo = 10.08. Ahora, como ya conocemos la producción del año Base, sólo deben multiplicarse los índices restantes con la producción del año Base. Para 1990 la producción será : Q1990 = Iq1990 x Qo = 1.15 x 10.08 Q1990 = 11.59 Años Indices Producción 1989 1.00 10.08 1990 1.15 11.59 1991 1.20 12.09 1992 1.24 12.5 1993 1.30 13.10 Ejercicios y Problemas Propuestos 50 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 1. Qué representa un número índice? En qué reside su utilidad? 2. El Índice de Precios al Consumidor (IPC) es uno de los índices más importantes de una economía. Explique qué es lo que nos muestra este indicador. 3. A continuación se pueden ver los datos de ventas de determinados productos para los años 2007 al 2010. Años 2007 2008 2009 2010 a. b. c. Ventas S/. 4'678,432 4'648,698 4'732,867 4'874,348 Explique cuál es el inconveniente de analizar la tendencia de las ventas utilizando los datos tal como aparecen en el cuadro. Determinar los índices correspondientes , considerando el 2007 como año base. Determinar los índices correspondientes, considerando el 2009 como año base. 4. Los precios de un determinado bien en los cuatro años 1999-2003 son, respectivamente, 11, 14, 20, 23 y 25 euros. Calcular los números índices simples de dicho precio tomando 1999 como período base y Calcular el incremento anual de precios del citado bien. 5. Las exportaciones en toneladas de cierto producto en los últimos 4 años se muestran en la siguiente tabla: Años Toneladas 2000 40 2001 36 2002 41 2003 94 c. Calcular los índices de cantidad para cada año, tomando como base el año 2000. d. Calcular los índices de cantidad para cada año, tomando como base el año 2002 6. Los precios de zinc al por menor (centavos de dólar por libra) en el mercado internacional durante 1990 – 2006 se han consignado en la siguiente tabla: Año 1999 2000 2001 2002 2003 2004 2005 Precio promedio del Zinc al por menor 31 37.3 37.4 44.6 38.5 41.4 48.6 a. Hallar los índices de precios para 2004 y 2005, teniendo como base al año 1999 b. Hallar los índices de precios de los años dados, teniendo como base al año 2001 7. A continuación se presenta la producción de trigo en Toneladas Métricas (TM) en el mercado norteamericano : 51 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL a. b. c. Año 1999 2000 2001 2002 2003 2004 2006 2008 2010 Producción de Trigo ( TM ) 2046 1776 2133 2380 2785 2765 2420 2595 2425 Hallar los índices de cantidad para los años dados, considerando el año base a 2002 Hallas los índices de cantidad para los años 2004 y 2008, considerando 1999 año base Hallar los índices de cantidad para los años dados , considerando 2008 como año base 8. Dada la información que aparece en la siguiente tabla : Años IPC a. b. c. d. e. 2001 67.9 2002 100 2003 105.4 2004 107.1 2005 123.8 2006 112.5 Cuál ha sido la variación de precios del año 2004 respecto del 2003 Cuál ha sido la variación de precios del año 2005 respecto del 2004 Cuál ha sido la variación de precios del año 2006 respecto del 2005 Cuál ha sido la variación de precios del año 2003 respecto del 2002 Cuál ha sido la variación de precios del año 2001 respecto del 2002 9. En la tabla siguiente se muestran los precios (Al finalizar el año) de determinadas “Acciones” que se han comercializado en la Bolsa de Lima en los últimos años. Años 2006 2007 2008 2009 2010 2011 a. b. Precios US $ 10.45 25.67 5.79 12.50 16.87 18.90 Determine los índices correspondientes tomando como base el año 2006 Determine los índices correspondientes tomando como base el años 2010 10. Dados los siguientes datos (Precios en Soles y Cantidades en Kg): Años 2000 2001 2002 2003 Precios “P” 20 18 25 30 Cantidades “Q” 50 70 30 28 a. Determinar los índices de valor, considerando que el año base es el 2000 b. Determinar los índices de valor, considerando que el año base es 2002 Nivel de Dificultad II En enero de 1990 una fábrica gastó en salarios de 50 obreros la suma de US$ 6,000 y en diciembre del mismo año con 75 obreros gastó US$ 9,900. Tomando como base el mes de enero, calcular: a. El índice de cantidad de empleados para diciembre. b. El índice del costo por obrero (índice de precio) 52 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL c. El índice de gastos de salarios (índice de valor) Los índices de producción de un bien de 1989 a 1993 fueron respectivamente 1.00, 1.15, 1.20, 1.24 y 1.30. Si en 1992 se produjeron 12.5 toneladas de dicho bien; calcular la producción de los demás años. En el año 2000 el precio del café aumentó en un 60% por encima del de 1995, mientras que la producción disminuyó en un 40%. a) b) En qué porcentaje varió el índice de valor del café entre esos dos años. Si se espera que la producción en el año 2005 aumente en un 50% respecto de 1997, ¿en qué porcentaje deberán incrementarse los precios, respecto a este último año, para que el ingreso total aumente en un 20%?. A continuación se presentan los ingresos anuales por ventas ( Soles S/) de un grupo de empresas. Con esta información se debe obtener: Empresas Topy Top Wong Metro KR Taca Ventas 5'678,843 7'897,534 8'345,768 7'768,932 6'345,785 a. Los índices de ventas de las empresas, tomando como año base las ventas de la tienda Wong. b. Los índices de ventas de las empresas, tomando como año base las ventas de la tienda KR c. Establecer las diferencias porcentuales de los dos casos anteriores Calcular los índices que correspondan, según naturaleza de datos obtenidos, tomando en cuenta que los datos del año base son los del 2000. Obtener los índices parciales como el índice total. Determinar si en general existe una tendencia creciente o no de los precios. Articulos Pan Blanco (Unid) Huevos (Docena) Leche (Tarro) Leche (Caja) Leche(Bolsa) Manzanas (Kg) Fresas (Kg) Carne pollo(Kg) TOTAL Precios 2000 Precios 2005 0.1 0.15 2.8 4 1.8 2.2 2 2.4 1.8 2.3 1.8 2.5 1.5 2.5 3.5 5.5 15.3 21.55 53 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Asuma que el PNB ( PBI – PNFe) para el año 2004 fue de 6,800 millones de soles y que el IPC fue de 125 (base de 1995). Calcular el PNB en soles constantes de 1995. Explique por qué se ha producido esa diferencia de soles. A continuación presentamos la información respecto del salario promedio mensual de un conjunto de trabajadores y el respectivo IPC: Año 2000 2001 2002 2003 2004 2005 2006 2007 a. b. c. Salarios US $ 350 500 650 800 1100 1300 1900 2500 IPC 89 100 110 115 128 145 175 205 Calcular el salario en unidades monetarias del 2001 para todos los años del período considerado Calcular los salarios de toda la serie en unidades monetarias del 2006 Determine si la variación porcentual real de cada año respecto del año base dado es, en promedio, mayor a la variación porcentual nominal. Una magnitud económica aumenta entre el año 0 y 1 en un 45%; entre el año 1 y 2, un 35 % y ha disminuido entre el 2 y 3 año un 30 %. Obtener la serie de Índices teniendo como base = 100. A continuación se presenta la información respecto de datos de Exportaciones e Importaciones en millones de dólares corrientes, así como los respectivos índices: ITEM Exportaciones Corrientes IVUX 2000 2001 2002 2003 2004 2005 2006 2007 2012 100 1935 81.1 1977 2090 2421 78.7 84.3 94.4 2750 2997 3259 96.4 101.5 92.9 2670 100 2769 85.6 2806 3035 3677 85.6 88.6 95.7 4239 5037 6131 105.5 113.5 128.8 Exportaciones Constantes Importaciones Corrientes IVUM Importaciones Constantes IVUX Indice de valor Unitario de las Exportaciones IVUM Indice de valor Unitario de las Importaciones a. b. c. d. e. Obtener los datos de exportaciones en dólares constantes Obtener los datos de importaciones en dólares constantes Establecer el promedio de variación porcentual de valores reales de las exportaciones Establecer el promedio de la variación porcentual de valores reales de las importaciones Establecer si el promedio de las variaciones porcentuales reales es mayor, menor o igual que el promedio de las variaciones porcentuales nominales tanto en las exportaciones como en las importaciones 54 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL En la siguiente tabla se dan los precios de un conjunto de productos Productos Pan blanco, por kg Huevos, Por Kg Tarro de leche Manzanas por Kg Jugo de naranja Lt Café 350 gr. Precio 2005 2.8 3.5 2.1 4.5 4.8 5 Precio 2010 4.5 4.8 2.6 5.6 5.5 7 Indice a. Desarrollar índices para el 2001 en cada uno de los productos, considerando los precios del 2005 como base b. Obtener el promedio de variación porcentual de los productos Nivel de Dificultad III 21. La siguiente tabla muestra los salarios por hora (en dólares) durante 4 años para tres tipos de empleos en una pequeña compañía: Años 2000 2001 2002 2003 Manual 11.8 11.9 12.3 12.5 Oficinista 9.1 9.2 9.6 9.7 Supervisor 17.9 18.8 19 19.3 Tomando el año 2000 como año base y considerando que en dicho año hubo 72 empleados manuales, 23 oficinistas y 10 supervisores, determinar: a. Los índices no ponderados de los salarios para cada año. b. El índice de Laspeyres de los salarios para cada año. 22. Cierta empresa exportadora dispone de la siguiente información histórica de las exportaciones de dos de sus principales productos: Precio Anual TM Anual 2001 2002 2003 2004 2001 2002 2003 2004 Promedio Produc Promedio Exp A 6.5 7.25 7.5 8.1 A 26 27 31 28 B 3.5 3.85 4.3 4.35 B 71 80 89 90 a. Calcular el índice de precios de cada año por el método de Laspeyres (2001 = 100) b. Calcular el índice de precios de cada año por el método de Paasche (2002 = 100) c. Calcular los índices de precios simples del producto A considerando el años 2001 como año base d. Calcular los índices de cantidad simple del producto B, considerando el año 2001 como año base 23. Cierto exportador recopiló la siguiente información sobre las ventas de 3 55 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL variedades de frutas: Variedad A B C Precio Anual $ 2002 2003 2004 31 34 35 38 39 40 45 49 53 Cajas Vendidas 2002 2003 2004 32 65 86 45 68 73 462 325 386 a. Calcular el índice de precios de cada año por el método de Laspeyres (2002 = 100) b.Calcular el índice de precios de cada año por el método de Paasche (2003= 100) 24. En la siguiente tabla se muestra las ventas de una empresa efectuadas entre los años 1995 y 2001. Explique si estas ventas han significado, en términos reales un verdadero crecimiento de la empresa en estos años Años 1994 1995 1996 1997 1998 1999 2000 2001 Ventas S/ 350,000 390,000 480,000 680,000 970,000 1'500,000 2'600,000 3'900,000 IPC 90 100 110 150 190 205 250 650 a. Gráficamente determine la diferencia entre el comportamiento nominal y el real b. Determine la diferencia porcentual nominal y la diferencia porcentual de los valores deflactados c. Podría señalar hasta qué año efectivamente la empresa estuvo creciendo en términos reales y por qué 25. Si su salario aumentó en términos absolutos de S/1500 (año 2005) a S/ 2000 (año 2006) y si el índice de precios al consumidor del INEI para el 2005 fue de 107.1, calcular : a. El porcentaje de aumento nominal de su salario b. El valor real en soles de su salario de acuerdo al índice de precios al consumidor c. El porcentaje de aumento real de su salario de acuerdo al índice de precios al consumidor 56 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL ANÁLISIS DE REGRESIÓN Y CORRELACIÓN LÍNEAL Nivel de Dificultad I Ejemplo 1: Para la ecuación de estimación: Y = 5 – 2X, ¿cuáles de los siguientes enunciados son verdaderos? a. Cuando X = 0, entonces Y es 5 b. La pendiente es positiva c. La línea representa una relación inversa d. Pendiente es 5 e. Cuando X aumenta, entonces Y varía en dos unidades Solución : Dada la ecuación Y = 5 – 2X, si X = 0 entonces Y = 5 – 2 (0). Por lo tanto, En esta ecuación Y = 5. (V). Dada la ecuación, la pendiente es negativa por cuanto la variable independiente está precedida del signo negativo (F) La ecuación tiene una pendiente negativa lo cual implica una relación inversa.(V) El valor de la pendiente es 2, no 5(F) Esto sólo lo puede determinar el Coeficiente de Determinación. (F) a. b. c. d. e. Ejemplo 2: Según el análisis del gerente de ventas de una empresa de autos, el principal factor que afecta el número de autos vendidos es la fuerza de ventas (Número de vendedores). De la información procesada se obtiene la siguiente información: r = 0.95, además se obtiene un MRLS : Y = 52 + 7X a. b. c. d. e. Identifique la variable dependiente y la independiente El Gerente tiene razón al afirmar que la fuerza de ventas es el principal factor que afecta el número de autos vendidos? Explique Qué porcentaje de la variación total de la variable dependientes se debe a la variable independiente La relación de ventas y fuerza de ventas es directa o inversa? Explique Haga una proyección del número de autos vendidos, considerando una fuerza de ventas que usted estime conveniente. Solución : a. Para determinar cuáles son las variables dependiente e independiente, debemos ver claramente la ecuación que nos dan : Y = 52 + 7X. Además nos dicen que la fuerza de ventas es el factor que afecta el número de autos vendidos, entonces Y: representa el número de autos vendidos y X: la fuerza de ventas. Por tanto, Y = variable dependiente y X = fuerza de ventas. 57 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL b. Cómo podríamos determinar si el Gerente tiene o no razón cuando hace su afirmación? Una forma de resolver esta interrogante es planteando el rol del Coeficiente de Correlación “ r “ : Cuando “r” está más cerca de 1 se dice que el nivel de relación de dependencia entre la variable independiente y la variable dependiente es muy alta o muy fuerte. Entonces como en este caso el valor de r = 0.95 está más cerca de 1, podríamos decir que efectivamente el Gerente tienen razón al afirmar que su “fuerza de ventas” ( X ) es el principal factor del número de autos vendidos ( Y ) c. El Coeficiente de Determinación ( r 2 ) es el factor clave. Pues él muestra el impacto que tiene una variable independiente sobre la dependiente. Veamos: r 2 = ( 0.95 ) 2 = 0.9025 - Por lo tanto, la variable dependiente varía o cambia en 90.25 % ante los cambios que experimenta la variable independiente. d. La relación que existe entre los autos vendidos y la fuerza de ventas es directa. Dónde o cómo lo podemos determinar este afirmación? la respuesta la encontramos en el coeficiente de correlación. Dado que al ser positivo : r > 0. Entonces podemos concluir que, efectivamente, ésta es una relación directa. e. Si queremos obtener una proyección de autos vendidos entonces debemos reemplazar en X la fuerza de venta ( Número de vendedores). Por ejemplo, si tuviéramos una fuerza de venta compuesta por 20 vendedores, tendríamos la siguiente proyección de autos vendidos de : Y = 52 + 7( 20 ) = 192 Ejercicios y Problemas Propuestos 1. Supóngase que conocemos la altura de un estudiante pero no su peso. Aplicamos el análisis de regresión para obtener una estimación de su peso basándonos en su talla. Por tanto podemos suponer que: a. El peso es la variable independiente b. La altura es la variable dependiente c. La relación entre peso y altura es inversa d. El coeficiente de correlación nos muestra una alta relación de dependencia e. El coeficiente de determinación no existe 2. Se seleccionaron al azar los siguientes observadores de la muestra X Y 4 4 5 6 3 5 6 7 10 7 58 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL a. b. c. Obtenga el Coeficiente de correlación Obtenga el Coeficiente de determinación Determine la Modelo de Regresión Lineal Simple (MRLS) 3. Se seleccionaron los siguientes datos al azar : 5 13 X Y 3 15 6 7 3 12 4 13 4 11 6 9 8 5 a. Obtener del Coeficiente de Correlación b. Obtener del Coeficiente de Determinación c. Determine el MRLS 4. Para la ecuación de estimación: Y = 5 – 2X, ¿cuáles de los siguientes enunciados son verdaderos? a. b. c. d. e. Cuando X = 0, entonces Y es 5 La pendiente es positiva La línea representa una relación inversa Pendiente es 5 Cuando X aumenta, entonces Y varía en dos unidades 5. En la siguiente tabla se consideran las alturas en pulgadas de padres( Variable independiente: X) e hijos (Variable dependiente: Y) X Y a. b. c. 65 63 67 64 68 62 70 68 68 67 69 71 68 66 68 65 69 66 68 65 71 67 68 70 Construir el Diagrama de Dispersión Hallar el coeficiente de correlación Hallar el coeficiente de determinación 6. El Gerente de una empresa está tratando de analizar la relación entre las ventas obtenidas y los gastos de publicidad. A continuación se presentan las ventas (millones de dólares) de los últimos 4 meses: a. b. c. Meses Publicidad Ventas Enero Febrero Marzo Abril 4 2 6 8 14 6 16 20 Determine la Ecuación de Regresión Cuál es el tipo de relación entre las variables Calcule el valor de las ventas cuando la publicidad fue sea de 13 millones de dólares 59 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 7. Un Coeficiente de Correlación cercano a cero implica que . . . a. La Variable dependiente se acerca a la unidad b. La variable dependiente tienen una relación de dependencia con la variable independiente c. La variable independiente tienen una relación de dependencia con la variable dependiente d. La variable independiente no tiene demasiada incidencia en la variable dependiente e. No dependen una de otra. 8. Si el Coeficiente de Determinación es 0.96, esto quiere decir que : a. Las variables en cuestión no están relacionadas b. Las variables tienen una alta relación de dependencia c. La variable dependiente experimenta un cambio del 98 % con cada cambio de la variable independiente d. Sólo hay un 2 % de incidencia de la variable dependiente sobre la independiente 9. Se realizó un estudio empresarial en una compañía que fabrica zapatillas y se determinó que las ventas por unidades (pares) está en función de la publicidad en miles de dólares. El reporte de la información contenía las siguientes conclusiones principales. El Modelo de Regresión Lineal Simple (MRLS) está determinado por la siguiente ecuación : Y = 100 + 2X, donde Y = Ventas y X = Publicidad y donde el valor de r = 0.78 Determinar : a. Interpretar “ r “ y “ r2 ” b. Para un gasto en publicidad de $ 20,000, estimar las ventas 10. A continuación se presentan los datos respecto del número de entrevistas con un grupo de clientes y las ventas que se realizaron como resultado de esas entrevistas. Número de Entrevistas (X) 14 12 20 16 46 23 48 50 55 50 Ventas Us $ (Y) 24 14 28 30 80 30 90 85 120 110 a. Determine el MRLS b. Evalúe las ventas estimadas si hay 40 entrevistas con diferentes clientes. 60 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Nivel de Dificultad II 11. Una empresa exportadora de tecnología (software) quiere encontrar la relación entre su nivel de ventas y la inversión en investigación y desarrollo (I & D), teniendo en cuenta que para los últimos seis años, se cuenta con la siguiente información: Ventas Mill.$ 22 33 45 50 65 67 Inversión I & D Mills $ 105 120 125 130 140 154 Determinar: a. La Ecuación de Estimación Lineal b. Cuál será el volumen de ventas si la Inversión es de 200 millones de $ c. Qué tan confiable es la Ecuación de Estimación 12 Dadas las proposiciones: I. II. III. Un valor del coeficiente de determinación cercano a 1 indica una buena correlación entre x e y Se = 0 en una ecuación de estimación, debe estimar perfectamente la variable dependiente en los puntos observados. Si la variable dependiente aumenta en una ecuación de estimación y también lo hace la variable independiente, el coeficiente de correlación se encontrará en el intervalo de 0 a –1. Son verdaderas: a. Todas b. I y II c. Sólo I d. Sólo II e. Ninguna 13. Los siguientes datos representan los gastos realizados en publicidad (en miles de soles) y el nivel de ventas (en cientos de unidades) de una empresa comercializadora de bebidas revitalizantes. Gastos de Propaganda Nivel de Ventas 1 3 3 6 4 2 6 5 5 9 a. Calcule el coeficiente de correlación entre estas dos variables. Interprete b. Halle la línea de regresión que permita estimar el nivel de ventas en base al gasto en propaganda. c. Estimar el nivel de ventas que se espera obtener si se realiza un gasto de 3500 soles propaganda. 61 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL d. Halle el coeficiente de determinación. ¿De acuerdo al valor obtenido que se puede decir del modelo planeado? 14. En el departamento de producción de una empresa electrónica se desea examinar la relación entre el número de trabajadores que arman un subcomponente y la cantidad de subcomponentes producidos en una hora. A continuación se presenta la cantidad de trabajadores y su producción correspondiente: Trabajadores 2 4 1 5 3 a. b. c. Producción Subcomponentes Unidades 15 25 10 40 30 Trace el Diagrama de Dispersión En base al Diagrama determine el tipo de relación que podría haber entre la variable dependiente y la variable independiente. Explique su respuesta. Calcule el coeficiente de correlación. Interprete su resultado 15. El dueño de una agencia de ventas de autos desea estudiar la relación entre la antigüedad de un auto y su precio de venta. A continuación se obtiene una muestra aleatoria de 12 autos vendidos : a. b. c. d. Antigüedad (Años) Precio Miles $ 9 7 11 12 8 7 8 11 10 12 6 6 8.1 6 3.6 4 5 10 7.6 8 8 6 8.6 8 Determinar la variable independiente y la dependiente Trace el diagrama de dispersión Determine el coeficiente de correlación. Sustente su respuesta Calcule el coeficiente de determinación. Qué explica este resultado 16. La teoría económica sostiene que la función demanda de un producto se estima mediante la regresión lineal de la cantidad vendida (Unidades) y el precio(dólares). Una empresa textil está tratando de determinar un modelo lineal para la demanda, de tal modo que le permita estimar la demanda de una nueva marca de polos. Para este propósito se ha obtenido la siguiente información. 62 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 20 17 16 14 13 10 8 7 Precio (X) Damanda (Y) 1250 1560 1830 1900 2120 2380 2500 2760 a. b. c. d. e. f. g. h. Defina el tipo de relación entre las variables Qué variable está en función de qué variable Calcule e interprete el coeficiente de correlación Calcule e interprete el coeficiente de determinación Determine la ecuación de regresión(MRLS) Cómo interpreta el valor de la pendiente del MRLS Estime la demanda de polos cuando el precio es de US$25.00 Estime la demanda de polos cuando el precio es de US $ 15.00 17. Le Empresa EDELNOR está analizando la relación entre el consumo de energía (miles de KWH) y el número de habitaciones en las residencias privadas. A continuación se presenta los siguientes datos encontrados en una muestra: Número de Habitaciones 12 9 14 6 10 8 10 10 5 7 Consumwo KW/H 9 7 10 5 8 6 8 10 4 7 c. d. e. f. g. Obtener el diagrama de dispersión Obtener el valor de “r” e interpretar Obtener el Coeficiente de Determinación e interpretar Desarrollar el MRLS Realizar una proyección para el consumo de energía si se duplicara el número de habitaciones considerando el máximo número de habitaciones h. Hacer una proyección del consumo de energía para 1 habitación. i. Establecer si el modelo obtenido es confiable 18. El Concejo de la Municipalidad de Lima está considerando aumentar el número de agentes de policía, en un esfuerzo por reducir la cantidad de delitos. Antes de tomar una decisión final, el organismo pide al jefe de Policía que realice una encuesta entre otras ciudades de tamaño similar, a fin de determinar la relación entre el número de policías y la cantidad de delitos reportados. Se recopiló la siguiente información : 63 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Distritos Breña Independencia Lima Callao La victoria San Lurigancho Magdalena del Mar Comas a. b. c. d. e. f. g. Policías 15 17 25 27 17 12 11 22 N° de Delitos 17 13 5 7 7 21 19 6 Si se desea evaluar los delitos en base a la cantidad de agentes, Cuál es la variable dependiente y cuál es la independiente ? Trace un Diagrama de Dispersión Determine “ r “, interprete Determine Coeficiente de Determinación, interprete Interprete estas medidas estadística : Le sorprende que la relación sea inversa Elabore el modelo de RLS Proyecte la Cantidad de Delitos si el número de policías fuese el doble del que mostraba uno de los distritos que más policías haya tenido 19. La Gerencia de una agencia de autos desea estudiar la relación entre la antigüedad de un automóvil y su precio de venta. A continuación aparece la lista de una muestra aleatoria de 12 autos usados vendidos en el establecimiento en el último año. Auto 1 2 3 4 5 6 7 8 9 10 11 12 a. b. c. d. e. f. g. Antigüedad ( Años ) 9 7 11 12 8 7 8 11 10 12 6 6 Precio de Venta ( Mls US $ ) 8.1 6.0 3.6 4.0 5.0 10.0 7.6 8.0 8.0 6.0 8.6 8.0 Si se desea calcular el precio de venta con base en la antigüedad del vehículo, cuál es la variable dependiente y cuál es la variable independiente ¿ Trace un Diagrama de Dispersión Determine “ r “ e interprete el resultado Obtener el Coeficiente de Determinación e interprete Interprete estas medidas estadísticas : Le sorprende que la relación sea inversa ? Elabore el MRLS Proyecte las ventas que se podrían alcanzar considerando un valor de variable independiente que usted estime educado 64 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 20. Si un índice de Determinación es 0.6580, entonces podríamos decir que las variables : a. b. c. d. e. Las variables están intensamente correlacionadas Las variables no están intensamente correlacionadas Las variables definen un modelo de relación directa entre las variables Las variables definen un modelo de relación inversa entre las variables La pendiente del modelo es positiva Cualesquiera que sea su respuesta debe demostrarla Nivel de Dificultad III 21. El Gerente de ventas de una fábrica automóviles está se encuentra estudiando las ventas. El cree que el principal factor que afecta el número de autos vendidos es la fuerza de ventas (número de vendedores). De la información procesada se obtiene : r = 0.95 e Y = 14X + 104. En base a esta información, determinar : a. b. c. d. e. La variable dependiente y la independiente El gerente tiene razón al afirmar que la fuerza de ventas es el principal factor que afecta el número de autos vendidos ? Demuestre Qué porcentaje de la variación total del número de autos vendidos se debe a la fuerza de ventas ? La relación ventas y fuerza de ventas es directa o inversa ? Explique Estime el número de autos vendidos cuando la fuerza de ventas es de 500 vendedores 22. Dado los siguientes gráficos : Y Y (a) (b) X a. b. c. X Los dos gráficos representan patrones diferentes. Señale en cual de los gráficos la variación de la variable independiente tiene un mayor impacto en el comportamiento de la variable dependiente. Demuestre por qué ocurre ese comportamiento Señale en cuál de los gráficos habría un mayor error estándar. Y por qué ? Si en el gráfico (a) aceptamos que el “ Se “ es mayor que en (b), entonces querría decir que la ecuación estimada es más consistente en (b) ? Sustente su respuesta 65 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 23. El gerente de una compañía está preocupado por el comportamiento de las ventas de un modelo de computadora y cree que el precio es el factor que lo determina. Se recopiló información y se obtuvo la siguiente MRLS : Y = 50000 – 2X. Modelo en el que “Y” representa a las computadoras vendidas y la variable “X” representa el precio en dólares. Por otro lado, se encontró que r = - 0.2. Con esta información deberá responder a las siguientes preguntas: a. b. c. d. El gerente tiene razón al afirmar que el precio es el factor que determina las ventas de las computadoras?? Explique su respuesta. Qué porcentaje de la variación total corresponde a la ecuación de regresión ¿La relación entre las variables es directa o inversa? Haga una proyección de ventas cuando el precio es de US$ 3,000 24. Según el análisis del gerente de ventas de una empresa de autos, el principal factor que afecta el número de autos vendidos es la fuerza de ventas (Número de vendedores). De la información procesada se obtiene la siguiente información: r = 0.95, además se obtiene un MRLS : Y = 52 + 7X a. Identifique la variable dependiente y la independiente b. El Gerente tiene razón al afirmar que la fuerza de ventas es el principal factor que afecta el número de autos vendidos? Explique c. Qué porcentaje de la variación total de la variable dependientes se debe a la variable independiente d. La relación de ventas y fuerza de ventas es directa o inversa? Explique e. Haga una proyección del número de autos vendidos, considerando una fuerza de ventas que usted estime conveniente. 25. ¿Son importantes para ganar un buen sueldo las calificaciones en los estudio superiores? Un estudiante del tercer ciclo de los CEADEX ha seleccionado una muestra aleatoria de los sueldos (Miles de $) iniciales y de los promedios de calificaciones de algunos amigos recién graduados. Los datos son los siguientes: Sueldo Inical (us$) Promedio Calificación (sobre 5) 31 4 25 25 19 22 28 16 22 3 3.5 2 3 3.5 2.5 2.5 a. Desarrolle la ecuación de estimación lineal (MRLS) b. Para un estudiante con una calificación promedio de 4.5, ¿a cuánto ascendería su sueldo inicial?. c. Determine el error estándar de la estimación. d. Calcular el coeficiente de determinación. ¿Es confiable la ecuación de estimación? e. Construya un intervalo aproximado de predicción para el sueldo inicial que le correspondería a un estudiante con una calificación promedio de 4.5 puntos. 66 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL ANÁLISIS DE SERIES DE TIEMPO Nivel de dificultad I Ejemplo 1: En la siguiente tabla tenemos información sobre niveles de ventas realizados en una serie temporal que va de 2000 al 2005. Los datos están en millones de dólares: Años 2000 2001 2002 2003 2004 2005 Períodos Ventas US $ 7 10 9 11 13 19 a. Obtener el Modelo de predicción b. Realizar una proyección de ventas para el 2010 Solución: a. En este tipo de ejercicios se debe aplicar la Ecuación de Tendencia Lineal : Y = a + bt de predicciones. Donde se asume que los años (períodos) son códigos correlativos que empiezan en 1 para el primer período o año y a partir de éste los códigos aumentan correlativamente. Tal como veremos a continuación : Años 2000 2001 2002 2003 2004 2005 - Períodos 1 2 3 4 5 6 Ventas US $ 7 10 9 11 13 19 Planteado esto debemos aplicar las siguientes ecuaciones para hallar los valores de “a” y “b” : nΣtY - ΣYΣt b = -------------------------n Σ t2 - ( Σ t ) 2 a = ΣY / n - b ( Σ t / n ) - Es conveniente por una cuestión de orden introducir columnas en la tabla original en donde podamos desarrollar las incógnitas que aparecen en cada una de las ecuaciones. Tal como aparecen a continuación : 67 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Años 2000 2001 2002 2003 2004 2005 - Períodos “t” 1 2 3 4 5 6 Ventas US $ (Y) 7 10 9 11 13 19 t.Y t2 7 20 27 44 65 114 1 2 9 16 25 36 Σt= 21 ΣY= 69 ΣtY= 277 Σ t2 89 Reemplazando estos resultados en las ecuaciones planteadas, vamos a tener los siguientes resultados : (6) (277) - (69) (21) 1662 - 1449 b = --------------------------------- = -------------------- = 2.29 (6) (89) - (21)2 534 - 441 a = (69) / 6 - (2.29) (21 / 6) = 3.49 - Por lo tanto, el modelo queda determinado de la siguiente manera: Y = 3.49 + 2.29 t - Respecto a la interpretación : podemos decir que la pendiente (2.29) nos está indicando que las ventas aumentan a razón de 2.29 millones de dólares anualmente. En cambio, el valor 3.49 no está indicando el valor de las ventas cuando t = 0. Esto corresponde a las ventas del año base. - Para realizar la proyección para el 2010, se incrementan los códigos de acuerdo al año de estimación. En este caso, el código aumenta hasta 11 dado que hay 5 años hasta el 2010. Por lo tanto, la proyección correspondiente será : Y = 3.49 + 2.29 ( 11) = 28.68 - De acuerdo a este resultado, para el año 2010, las ventas llegarán a 28.68 millones de dólares. Ejercicios y Problemas Propuestos 1. Señale la razón por la que se debe aplicar a una serie temporal el Método del Promedio Móvil. Y cuál es la ventaja respecto de la gráfica inicial. ------------------------------------------------------------------------------------------------------- 68 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------2. En función del siguiente gráfico, determine a qué tipo de serie temporal corresponde y explique por qué. SERIE TEMPORAL 3. El director de personal de una compañía farmacéutica apuntó trimestralmente los siguientes índices de ausentismo de su personal durante un periodo de cuatro años: Años 2006 2007 2008 2009 Trim I 5.6 5.7 5.3 5.4 Trim II 6.8 6.7 6.6 6.9 Trim III 6.3 6.4 6.1 6.2 Trim IV 5.2 5.4 5.1 5.3 a. Construya un promedio móvil centrado de cuatro trimestres. b. ¿Qué puede concluir sobre el ausentismo en la parte a)? 4. El número total de quiebras bancarias para los años 1997 y 2001 se da a continuación. Determine la ecuación necesaria para estimar las quiebras para el 2008, 2012 y 2017 Años 1997 1998 1999 2001 2002 2003 2004 2005 Código 1 2 3 4 5 6 7 8 Número de Quiebras 79 120 138 184 200 210 234 225 69 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 5. Los gastos personales por uso de teléfono e internet ( Millones de dólares) en USA, entre los años 1996 y 2003 se dan a continuación. Determine la ecuación que le permite estimar los gastos para los años 2005, 2008 y 2011 Años 1997 1998 1999 2001 2002 2003 2004 2005 Código 1 2 3 4 5 6 7 8 Gastos Millones de $ 37.9 39.8 40.4 42.7 44.1 47.1 49.2 50.5 6. A continuación se presentan los datos de la cantidad ( TM ) de basura que ha recogido la Municipalidad de Lima entre los años 1998 y 2005 : Años 1998 1999 2000 2001 2002 2003 2004 2005 Código 1 2 3 4 5 6 7 8 Basura TM 2.5 4.5 3.8 5.6 6.8 9 10 15 a. Estime la cantidad de basura que recogería la Municipalidad, si se mantienen la tendencia, para el año 2015 7. En el siguiente cuadro se muestran los ingresos (Millones de dólares) por ventas de maquinaria utilizada en la actividad minera entre los años 2001 y 2006 Años 2001 2002 2003 2004 2005 2006 2007 2008 Ingresos (Mills $) 17.5 19 21 22.7 24.5 26.8 30.5 33.8 70 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL a. Estimar los ingresos por venta de maquinaria para el 2020 b. Comparar los resultados aplicando Promedios Móviles con los resultados de la estimación a través del MRLS c. Mostrar cómo se han comportado los índices de ingresos 8. A continuación se presentan los datos de ventas en millones de dólares para un período que va de 1980 a 2005. Años 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 Ventas 2 4 5 3 8 2 4 6 7 15 Años 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 Ventas 3 5 1 7 6 9 10 3 5 7 Años 2000 2001 2002 2003 2004 2005 Ventas 6 8 9 4 6 9 a. Graficar b. Aplicar un promedio móvil de 3 períodos c. Aplicar un promedio móvil de 5 períodos d. Determinar cuál ha sido la verdadera tendencia de las ventas efectuadas en todo el período considerado. 9. Los datos que han sido graficados nos muestran claramente una tendencia : a. b. c. d. Lineal Cíclica Secular Estacional 71 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL e. Irregular Cualesquiera sea su respuesta sustente por qué 10. De acuerdo al gráfico, cuál es la ventaja de haber aplicado un Pronóstico de Promedio móvil primero con tres períodos y luego con 5 períodos Incidencia de malaria por 100 000 habitantes. Antioquia 1982-1993 Medias móviles 3000 Proporción 2500 2000 Real 1500 Pronóstico M=3 Pronóstico M=5 1000 500 0 1982 1984 1986 1988 1990 1992 Años Nivel de Dificultad II 11. Ud. es el gerente de ventas de una cía. exportadora de cierto producto agroindustrial. Ha logrado reunir los siguientes datos referentes a las ventas del producto (expresadas en números de contenedores) durante los últimos 5 años: Años Contenedores 1998 1999 2000 2001 2002 32 46 50 66 68 a. Desarrolle la ecuación lineal de estimación que mejor describa estos datos. b. Estime el número de contenedores que se espera sean exportados en el 2003 c. ¿Considera usted que la ecuación desarrollada es un buen estimador?, ¿por qué? 12. Una empresa agroindustrial ha logrado colocar en el mercado internacional producto, expresado en toneladas métrica durante los 10 meses indicados: Jul Ago Set Oct Nov Dic Enr Meses 5 8 8 10 13 15 Toneladas 5 su Feb Mar Abr 18 20 22 a. Desarrolle la ecuación de estimación lineal que mejor describa estos datos. b. Estime el número de toneladas que se espera sean exportados en los meses de noviembre y diciembre. c. Calcular el error estándar de la estimación d. ¿Es confiable la ecuación de estimación?, ¿Por qué? 13. Un equipo de entusiastas egresados de los CEADEX han formado una pequeña empresa que fabrica y exporta jugo de naranja en botella personal (300 ml.). Desde que la fundaron, el número de botellas personales que han vendido está representado por la siguiente serie de tiempo 72 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Años Unid Vend 2000 42 2001 50 2002 61 2003 75 2004 92 2005 111 a. Desarrolle la ecuación de estimación lineal b. Estime las ventas para el 2008 y 2009 c. Determine el error estándar de la estimación d. ¿Qué tan confiable es la ecuación de estimación? 14. En las gráficas que aparecen a continuación se ha aplicado un método de “suavización” de la curva original. a. b. c. d. Explique cuál es el propósito de la suavización de la curva original La curva suavizada define claramente la tendencia de la variable analizada en la gráfica ? Explique por qué?? Coincide el valor de la estimación para 1992 con la tendencia encontrada en la altenativa “b” Según los resultados, el método de promedios móviles tiene el mismo propósito que el método de estimación lineal? 15. En el siguiente cuadro podemos ver el consumo (Y) mensual de energía eléctrica desde 2009 a 2010. Con estos datos : t 1 2 3 4 5 6 7 8 9 10 11 12 Y 84,6 89,9 81,9 95,4 91,2 89,8 89,7 97,9 103,4 107,6 120,4 109,6 t 13 14 15 16 17 18 19 20 21 22 23 24 Y 110,3 118,1 116,5 134,2 134,7 144,8 144,4 159,2 168,2 175,2 174,5 173,7 73 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Determinar : a. Cuál es la tendencia que genera una media móvil de 3 períodos b. Será suficiente una media móvil, tal como la consignada en la alternativa anterior, para determinar fehacientemente la tendencia del consumo de energía para los próximos años. Explique c. El consumo de energía para el mes 30 y establecer si habría coincidencia con la tendencia generada por el promedio móvil 16. Cierta persona sin mayor conocimiento en estadística plantea, según el gráfico que aparece a continuación, que para los meses venideros la temperatura será creciente de acuerdo a la tendencia. a. La opinión de la persona es correcta. Demuestre b. No es correcta la opinión de la persona. Demuestre c. Usted que ha estudiado estadística qué podría decir respecto de la observación inicial d. Qué indicadores usaría para demostrar la diferencia entre usted, que posee conocimientos y alguien que empíricamente da una opinión? 17. A continuación se presentan los datos de ventas (miles de dólares) por Estaciones climáticas durante un período de 6 años : Año 2000 2001 2002 2003 2004 2005 Invierno 6.7 6.5 6.9 7 7.1 8 Primavera 4.6 4.6 5 5.5 5.7 6.2 Verano 10 9.8 10.4 10.8 11.1 11.4 Otoño 12.7 13.6 14.1 15 14.5 14.9 a. Analizar los datos y determinar si existe algún tipo de tendencia : cíclica, estacional o aleatoria b. Utilice el promedio móvil para determinar si hay claramente una tendencia definida respecto del comportamiento de las ventas 74 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL c. Graficar los datos originales como la o las curvas suavizadas que usted estime conveniente d. Determinar cuál ha sido el promedio de ventas en todo el período 18. En el siguiente cuadro se muestran las cotizaciones (Unidades de $) de Pepsico SA al cierre de cada año considerado : Años 2000 2001 2002 2003 2004 2005 Precio de Acciones 12,91 16,82 20,61 20,30 18,32 27,75 Años 2006 2007 2008 2009 2010 2011 Precio de Acciones 29,06 36,02 40,61 35,02 49,56 20,06 a. Según algunos analistas, estiman que para el 2012 las acciones de Pepsico no subirán. Demuestre si esto es correcto b. Según otro grupo de analistas de la Bolsa de Valores, estiman que Pepsico recuperará las cotizaciones de fines del 2010. Es correcta esta apreciación. Demuestre su respuesta c. Determine el precio promedio de las acciones d. Determine la distancia entre los datos y el valor de su tendencia central 19. El propietario de un centro recreacional desea pronosticar el número de visitantes el año entrante. A continuación se presentan los datos de visitantes en forma trimestral desde el 2005 al 2010 Años 2005 2006 2007 a. b. c. d. e. Trimestres I II III IV I II III IV I II III IV Visitantes 90 66 32 98 110 86 52 118 144 124 86 158 Años 2008 2009 2010 Trimestres I II III IV I II III IV I II III IV Visitantes 166 144 104 178 192 176 132 202 206 158 224 250 Grafique Cuántos visitantes se esperan en cada trimestre del 2012 Determine la ecuación de tendencia y proyecte el número de visitantes para el 2013 Si le dieran a escoger que dato de tendencia central escogería para este caso? Podría determinar un índice de visitantes, si se considera que los visitantes del 2005 son considerados como el año base 75 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 20. La Escuela de Negocios de la Pontifica Universidad Católica del Perú ha registrado las siguientes inscripciones trimestrales en su Programa MBA, desde 2003 Año 2006 2007 2008 2009 2010 2011 Invierno 2033 2174 2370 2625 2803 2950 Trimestre Primavera Verano 2871 774 2069 840 2254 927 2478 1136 2668 1150 2318 1200 Otoño 2318 2413 2705 3001 3200 3250 a. Se podría afirmar decir que existe una patrón de comportamiento tendencial en el número de inscritos en el Programa mencionado b. Cuál será el número de inscritos en cada uno de los trimestres del año 2013 c. Se podría afirmar que el indicador más representativo del número de inscritos es su mediana. Explique su respuesta afirmativa o negativa Nivel de Dificultad III 21. Dado el siguiente gráfico de una serie temporal (Exportaciones millones US $), determinar . . a. b. c. “X” en Cuál es el principal problema que se encuentra en esta serie temporal Sugiera cuál es el proceso a seguir para analizar y llegar a una conclusión respecto de la información sobre el comportamiento de las exportaciones Cuál es la principal diferencia entre la información inicial y la que resulta de aplicar un promedio móvil de tres períodos. Los datos de las exportaciones ( US $ )aparecen en la siguiente tabla: 76 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Meses Export 1 2 3 4 5 10 3 18 5 28 Meses Export 6 7 8 9 10 10 40 2 60 9 Meses 11 12 13 14 15 Export Meses Export 35 100 5 60 150 16 17 18 19 20 90 48 200 80 350 22. A continuación se presenta la información sobre la producción ( Millones US $) de una empresa minera desde al año 1983 hasta 2001. La misma que deberá ser sometida al siguiente análisis . . . Año Producción Año Producción Año Producción Año Producción 1983 1988 1993 1998 8 5 10 20 1984 1989 1994 1999 5 12 25 28 1985 1990 1995 2000 9 18 30 35 1986 1991 1996 2001 14 15 35 40 1987 1992 1997 2002 45 7 13 25 a. b. c. Aplicar una media móvil de 3 años y determinar su tendencia Aplicar una media móvil de 5 años y determinar su tendencia Explicar por qué una media móvil de más tiempo puede generar mejor información respeto de una media de menor tiempo 23. La administración de un albergue de verano tiene los siguientes datos acerca de la ocupación trimestral de sus clientes de los últimos años (2006 – 2010): Año 2006 2007 2008 2009 2010 Trim I 1861 1921 1834 1837 2073 Trim II 2203 2343 2154 2025 2414 Trim III 2415 2514 2098 2304 2339 Trim IV 1908 1986 1799 1965 1967 a. Establecer cuál es el patrón de demanda de habitaciones para el Trim II del 2013 b. Establecer cuál es el patrón de demanda de habitaciones para el Trim IV del 2015 c. Establecer cuál es el patrón de demanda de habitaciones para el Trim III del 2018 d. Establecer cuál es el patrón de demanda de habitaciones para el Trim II del 2021 e. Graficar los datos originales, los datos que resultan de aplicar un Promedio Móvil de tres períodos y las demandas que hayan resultado de las estimaciones correspondientes. 77 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL 24. Cada año se realiza en Europa uno de los torneos más importantes de golf femenino. A continuación se presentan la bolsa total y el premio que se lleva la deportista que llega al primer lugar. Los datos corresponden a los últimos 15 años : Años 1995 1996 1997 1998 1999 2000 2001 2002 Bolsa 230,000 280,000 280,000 335,000 400,000 500,000 550,000 560,000 Premio 35,000 40,000 40,000 50,000 62,000 70,000 77,000 83,000 Años 2003 2004 2005 2006 2007 2008 2009 2010 Bolsa 610,000 660,000 710,000 760,000 810,000 860,000 1,100,000 1,100,000 Premio 90,000 98,000 110,000 120,000 120,000 150,000 150,000 160,000 a. Graficar el diagrama de dispersión de la Variable Bolsa y Premio b. Establecer el nivel e correlación que haya entre las dos variables analizadas c. Establecer cuál es porcentaje de incidencia de la variable dependiente sobre la independiente. Sustente d. Si se aplicar una estimación lineal cuál sería la proyección de la variable dependiente para el 2015 e. Si se aplicar un promedio móvil habría coincencia entre la estimación lineal y el promedio móvil ? 78 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL GLOSARIO DE VARIABLES Y FÓRMULAS I. VARIABLES N= Población. n= Muestra X= Variable en estudio R= Rango de los datos muestrales m= Número de intervalos de clase en una tabla de frecuencias A= Amplitud o longitud del intervalo de clase Frecuencia absoluta Frecuencia absoluta acumulada Frecuencia relativa Frecuencia relativa acumulada Límites de los Intervalos de clase Marca de clase = Media aritmética Mediana Moda Precio Cantidad 79 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL II. FÓRMULAS Sturges Rango de datos Amplitud de clase Media Aritmética Mediana para datos agrupados Moda para datos tabulados Varianza para datos agrupados Desviación estándar 80 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL Ecuación de la recta de regresión Coeficientes de regresión ; ; Coeficiente de correlación Números índices. Índice de Laspeyres Índice de Paasche 81 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A. GUÍA DE EJERCICIOS PARA EL ESTUDIANTE ESTADÍSTICA GENERAL REFERENCIAS BIBLOGRÁFICAS ANDERSON, David R. 2008 Estadística para administración y economía / Dennis J. Sweeney; Thomas A. Williams. -- 10a. ed. -- México, D.F. : Cengage Learning. 1056 p. JOHNSON, Robert. 2008 Estadística elemental : lo esencial / Patricia Kuby. -- 10a. ed. -México, D.F. : Cengage Learning. 725 p. RITCHEY, Ferris J. 2008 Estadística para las ciencias sociales / Ferris J. Ritchey. -- 2a. ed. -México, D.F. : McGraw-Hill. 665 p. WEIERS, Ronald M. 2006 Introducción a la estadística para negocios / Ronald M. Weiers; J. Brian Gray; Lawrence H. Peters. -- 5a. ed. -- México, D.F. : Thomson. 983 p. LEVIN, Richard I. 2004 Estadística para administración y economía / Richard I. Levin; David S. Rubin. -- 7a. ed. -- México, D.F. : Pearson Educación. 826 p. ANDERSON, David R. 2004 Estadística para administración y economía / David R. Anderson; Dennis J. Sweeney; Thomas A. Williams. -- 8a. ed. -- México, D.F. : Thomson. 884 p. MARTÍN PLIEGO, F. Javier. 2002 Introducción a la estadística económica y empresarial: Teoría y práctica / F. Javier Martín Pliego. -- 2a. ed. -- Madrid : Thomson / AC. 601 p. KAZMIER, Leonard J. 1991 Estadística aplicada a administración y economía / Leonard J. Kazmier. -- 2a. ed. -- México, D.F. : McGraw-Hill. 430 p. 82 Material elaborado por Ing. José Carlos Saldarriaga Moreno Eco. Juan Morón A.