EJERCICIOS PROPUESTOS CAPÍTULO 4: ESTADÍSTICA DESCRIPTIVA. 1. a. b. c. d. e. f. g. h. i. j. Determine qué tipo son las siguientes variables. Si son variables cualitativas indique si es nominal u ordinal; si son cuantitativas si son discretas o continuas. Nivel de instrucción (básico, medio, técnico, universitario). Número de piezas en la vivienda. Sexo (1=Hombre, 2=Mujer). Temperatura (en grados Celsius). Estado Civil (soltero, casado, anulado, viudo). El número en tarjetas de crédito. El tiempo que tardó en llegar a la Universidad hoy. El número de personas en una muestra de 50 que prefieren una marca determinada de cerveza. La cantidad de gas que se usa al mes para calentar un hospital. El número de diarios que vende “El Centro” cada mes. 2. En el certificado de nacimiento el nivel educacional de la madre se codifica con un número. 1 = Nivel Superior, 2 = Medio, 3 = Básico, 4 = Ninguno. ¿Qué tipo de variable es? 3. Una alumna del curso de Estadística de Agronomía del segundo semestre de 1999 nos dio información sobre el origen de 450 especies de maleza en Chile. De estas 270 provienen de Europa, 70 de Sudamérica, 28 de Chile, 25 de Norteamérica, y 57 de otros lugares. Presente esta información usando una tabla de distribución de frecuencias y una gráfica adecuada. 4. En una Universidad que ofrece un programa de postgrado especializado en manejo de desechos peligrosos. Para planificar futuros cambios, se hizo una encuesta para determinar los antecedentes y objetivos de los 223 estudiantes que actualmente están inscritos en el programa (Fuente: Journal of Professional Issues in Engineering, abril de 1990). La gráfica circular muestra un desglose de las licenciaturas que cursaron los 223 estudiantes. Interprete la gráfica. Biología 15% Otros 28% Química 13% Geología 7% Ingeniería Química 23% Ingeniería Civil 14% Transforme este gráfico en un gráfico de barras donde se muestren las frecuencias absolutas. CAPÍTULO CUATRO PÁGINA 1 DE 11 EJERCICIOS PROPUESTOS 5. a. b. i. ii. iii. iv. v. vi. c. 6. Se hace un estudio para evaluar una nueva marca de marcapasos. El estudio se hizo en 20 pacientes que recibieron el nuevo marcapasos. Se registra el tiempo, en meses, al primer problema eléctrico del marcapasos. 22 14 6 21 24 12 18 16 28 18 16 24 26 28 13 16 23 20 3 22 Haga un gráfico de tallo y hoja a estos datos. ¿Cuál de las siguientes descripciones se ajusta a la distribución del tiempo? Seleccione todas las posibles: Simétrica. Unimodal. Bimodal. Sesgada a la derecha. Sesgada a la izquierda. Uniforme. ¿A qué proporción de sujetos le falla el marcapasos antes de 5 meses? El siguiente diagrama de tallo y hoja representa el tiempo, en segundos, que necesitan 30 personas para embalar una caja de frutas. 0|3334 0|66677788999 1|0012234 1|55689 2|1 2|5 3|0 Nota: 1 | 5 representa 150 segundos a. b. c. Describa la forma de la distribución. ¿Es aproximadamente simétrica ó sesgada? Si es sesgada, ¿Qué tipo de sesgo? Construya un diagrama de caja para describir estos datos. ¿Cuánto se demora el 25% más rápido para embalar? 7. Los diagramas de talla y hoja a continuación muestran el tiempo de duración (en horas) de dos tipos de ampolletas A y B: Ampolleta A Ampolleta B 71 72 5 6 3 1 0 73 1 9 9 8 7 6 2 74 6 9 7 3 0 75 2 76 0 2 2 5 7 77 1 1 3 4 6 8 1 78 Nota: 72 | 5 representan 725 horas. a. b. c. d. ¿Cuánto duró la ampolleta que duró más? ¿Cuál ampolleta dura típicamente más la A ó B? Explique. Dé alguna razón para preferir A. Dé alguna razón para preferir B. CAPÍTULO CUATRO PÁGINA 2 DE 11 EJERCICIOS PROPUESTOS 8. La siguiente tabla muestra el promedio de años de escolaridad en personas de 15 años y más, por sexo para Chile. Fuente: INE Censo 2002. Construya un gráfico de tallo y hoja comparativo, apropiado para describir estos datos. Región Hombres Mujeres I de Tarapacá 10,7 10,2 II de Antofagasta 10,9 10,3 III de Atacama 9,8 9,4 IV de Coquimbo 9,3 9,2 V de Valparaíso 10,2 9,9 XIII Metropolitana de Santiago 10,6 10,1 VI del Libertador 8,8 8,8 VII del Maule 8,2 8,5 VIII del Bío-Bío 9,3 9,1 IX de la Araucanía 8,6 8,5 X de los Lagos 8,6 8,3 XI de Aisén 8,9 8,6 XII de Magallanes 10,2 9,8 Total Chile 9,8 9,5 9. La siguiente tabla muestra las tasas de suicidios para hombres y mujeres en 15 países por 100000 personas. Suponga que estos datos provienen de una muestra aleatoria de países. Construya un gráfico de tallo y hoja comparativo, apropiado para describir estos datos. País Hombres Mujeres Australia 16 6 Austria 40 15 Canadá 22 7 Dinamarca 39 21 Francia 25 10 Irlanda 6 4 Israel 8 4 Japón 22 13 Holanda 12 8 Noruega 19 7 Polonia 22 4 Suecia 28 11 Suiza 37 15 Reino Unido 11 7 Estado Unidos 19 6 10. ¿Qué forma tiene las distribuciones descritas por las siguientes medidas de tendencia central?: Media = 46, Mediana = 42, Moda = 39. Media = 3,1, Mediana = 3,1, Moda = 3,1. Media = 105, Mediana = 110, Moda = 115. a. b. c. 11. a. Determine si las siguientes aseveraciones son verdaderas ó falsas. Una aseveración verdadera tiene que ser siempre verdadera. El rango entre cuartiles es la mitad del rango. CAPÍTULO CUATRO PÁGINA 3 DE 11 EJERCICIOS PROPUESTOS b. c. d. e. 12. a. b. c. 13. a. b. c. 14. a. b. c. 15. El promedio está siempre entre el primer y tercer cuartil. La mediana está siempre entre el primer y tercer cuartil. La desviación estándar de una distribución simétrica es siempre igual al rango entre cuartiles. El promedio de una distribución simétrica es siempre igual a la mediana. Un Profesor le entrega las notas en el primer control y les dice que el promedio fue de 5,7. Si usted obtuvo un 6,2: ¿Puede su nota ser la máxima? ¿Puede ser que el 50% de los estudiantes tuvieron mejor nota que usted? Si además el Profesor da la desviación estándar, ¿Con cuál se sentiría mejor: con una desviación estándar de 0,6 ó con una de 1,1? Explique. Un estudio encontró que los estudiantes hombres de una Universidad pesaban en promedio 66 kilos con una desviación estándar de 9 kilos. Las mujeres pesaban en promedio 55 kilos, con una desviación estándar de 9 kilos. Puede decir si el estudiante de más peso es ¿Un hombre ó una mujer? Explique. Encuentre el promedio y la desviación estándar en libras (1 kg = 2,2 libras). Si juntamos los hombres y las mujeres, la desviación estándar será: ¿Menor que, mayor que ó igual a 9? Se estudia el resultado de un test de aptitud y las medidas de resumen se presentan en la tabla: Mínimo Cuartil 1 Mediana Cuartil 3 Máximo 340 460 580 780 950 Dibuje un diagrama de caja simple. Suponga que Usted obtuvo 770 puntos en el test, ¿Qué puede decir acerca del porcentaje de los alumnos que obtuvieron menos puntos que Usted? Si el 25% con mayor puntaje se sacó un siete, ¿Cuál fue el puntaje mínimo para sacarse un siete? Se conduce un estudio de los efectos de fumar sobre los patrones de sueño. La medición que se observa es el tiempo, en minutos, que toma quedar dormido. Los datos se grafican en el siguiente diagrama de cajas: 80 70 60 50 40 Minutos 30 20 10 N= 12 Fumadores 14 No fumadores Grupo CAPÍTULO CUATRO PÁGINA 4 DE 11 EJERCICIOS PROPUESTOS a. b. c. d. En base al gráfico, comente qué clase de impacto parece tener el fumar sobre el tiempo que se requiere para quedar dormido (use medidas de tendencia central y de dispersión). ¿Aproximadamente cuánto se demoró en quedar dormido al que más le costo quedarse dormido? ¿Aproximadamente qué porcentaje de los fumadores se demoró menos de media hora en quedarse dormidos? Comente si los datos que se presentan parecen ser simétricos. Justifique su respuesta. 16. La Corporación Nacional de Consumidores y Usuarios de Chile (www.odecu.cl) hizo un estudio que mide el contenido de sodio (en miligramos) en 63 tipos de galletas dulces en venta en el comercio. a. b. c. ¿Cuál es el valor aproximado de la mediana? ¿Qué medidas de dispersión puede calcular del gráfico de caja? Calcúlelas. ¿Aproximadamente cuántos productos contenían más de 250 miligramos de sodio? Justifique. ¿Se puede decir que la distribución del contenido de sodio es simétrica? Justifique. d. 17. Encuentre el promedio, mediana y moda de estos dos conjuntos de datos: Datos I 2 3 4 6 6 6 7 7 -9 9 Datos II 6 8 4 8 9 6 42 ¿Para cuál de los dos conjuntos de datos I ó II el promedio es una mala medida de tendencia central? ¿Por qué? CAPÍTULO CUATRO PÁGINA 5 DE 11 EJERCICIOS PROPUESTOS 18. Se tienen datos de la cantidad mensual de lluvia caída en 3 estaciones de una ciudad para los 12 meses de 1999. a. ¿Cuál de las 3 estaciones tiene el mayor rango de lluvia caída en los 12 meses? Justifique. En general, ¿Qué medidas de dispersión puede calcular en un gráfico de caja? ¿Cuál es el valor aproximado de las medidas de dispersión en la estación 2? ¿Aproximadamente cuántos meses llovió menos de 8 mm en la estación 1. Justifique. En vista de que la caja de la estación 1 es simétrica, ¿Podemos decir que la distribución de los valores de lluvia caída en la estación 1 será simétrica? Justifique su respuesta. Estos son los datos de la lluvia caída en la estación 4: 3 5 9 9 9 10 11 11 11 11 12 15 Calcule las medidas de tendencia central y de dispersión a estos datos. En el gráfico dibuje la caja correspondiente a la estación 4. b.i. b.ii. c. d. e. e.i. e.ii. 19. a. b. c. Entre el 14% y 20% de los menores de 19 años, a nivel nacional, sufre algún tipo de trastorno emocional, cuyas causas son múltiples. En la región del Maule, se consideró una muestra de 20 de estos jóvenes que padecen de este tipo de trastornos, resumiéndose la información recopilada en la siguiente tabla: Causas del trastorno emocional Frecuencia absoluta % Deficiencia en habilidades sociales 4 20 Hechos negativos 5 25 Alteraciones endocrinas 3 15 Herencia familiar 8 40 Según el contexto del planteamiento, ¿Qué representa la frecuencia absoluta? Determine e interprete alguna medida de resumen de estos datos. Construya un gráfico adecuado para resumir la información anterior. CAPÍTULO CUATRO PÁGINA 6 DE 11 EJERCICIOS PROPUESTOS 20. Una Nutricionista quiere estudiar el efecto de la edad en la masa muscular de las mujeres (en mg por ml). Suponga que el gráfico de caja muestra las medidas de la masa muscular en la población de mujeres, dividida en cuatro grupos de edad. a. b. ¿Cuáles son la variable respuesta y la variable explicatoria en este estudio? ¿Cómo están medidas las variables respuesta y la explicatoria? ¿Cualitativa (nominal u ordinal) ó Cuantitativa (discreta ó continua)? Basado en el gráfico, ¿Cuál de los siguientes esquemas de muestreo parece como el mejor diseño muestral para esta población? Muestreo aleatorio simple ó muestreo aleatorio estratificado. Explique su respuesta. ¿Qué porcentaje de mujeres en el grupo de mayor edad tiene masa muscular menor que 80 mg por ml? ¿Qué tipo de distribución tiene el grupo de 40-49 años de edad? ¿Simétrica ó sesgada (Positiva ó Negativa)? Fundamente su respuesta. c. d. e. 21. a. b. c. 22. Se ha recopilado la siguiente información proporcionada por un Odontólogo, que describe la cantidad de piezas dentales que fueron extraídas en los últimos 20 meses: 19 23 32 19 32 17 25 18 27 30 22 47 23 35 23 27 29 28 25 20 Calcule todas las medidas de tendencia central. Calcule todas las medidas de dispersión. Dibuje un diagrama de tallo y hoja. Dos Profesores (A y B) están interesados en estudiar los hábitos de sueño de los estudiantes en sus clases. Ambos profesores registran el tiempo (en minutos) que demoran en quedarse dormidos sus alumnos desde que empieza la clase. El gráfico siguiente muestra los tiempos que demoran en quedarse dormidos los alumnos del profesor A. CAPÍTULO CUATRO PÁGINA 7 DE 11 EJERCICIOS PROPUESTOS 22 21 20 19 18 17 16 15 Tiempo en minutos 14 13 12 11 10 9 8 N= 19 Profesor A a. b. c. 23. a. b. c. 24. ¿Cuál es el valor aproximado de las medidas de dispersión del tiempo del Profesor A? ¿Qué porcentaje de alumnos se queda dormido antes de los 14 minutos con el Profesor A? Justifique. Los datos del Profesor B son los siguientes: 10,5 11,3 11,9 12,0 12,3 12,3 12,5 12,7 13,4 13,7 13,8 14,2 14,8 15,1 15,3 16,7 16,8 18,8 20,8 Construya un diagrama de caja (junto al diagrama de caja del profesor A) correspondiente a los tiempos en que se quedan dormidos los alumnos en la clase del Profesor B y compare ambos grupos respecto de la variable en estudio. En Toconey, un pueblo ubicado junto a la rivera norte del Río Maule, un alumno de Odontología de la Universidad de Talca, atiende gratuitamente a los pobladores, insistiendo en ellos que deben tener un buen hábito de higiene bucal. Para controlar lo anterior, el día 21 de Septiembre del 2006, consultó a sus pacientes por la cantidad de cepillados que se habían realizado el día anterior, recopilándose la siguiente información: 3 3 0 2 4 5 3 2 1 1 0 1 2 3 4 3 2 0 1 2 3 4 5 0 2 2 1 3 3 3 Resuma la información anterior en una tabla de distribución de frecuencias. Grafique la información recopilada. Calcule e interprete todas las medidas de tendencia central. Grado de Depresión de las personas. Un Psicólogo elaboró una prueba llamada “Lápiz y Papel” que tiene como finalidad medir el grado de depresión de las personas. Para comparar los resultados de esa prueba con las calificaciones asignadas por expertos, varios individuos “con perturbaciones emocionales” fueron sometidos a ella. Los mismos individuos fueron calificados por dos Psiquiatras A y B, de manera independiente, según el grado de depresión observado por cada uno de ellos en el transcurso de entrevistas detalladas con esos individuos. Los puntajes más altos corresponden a un grado mayor de depresión. CAPÍTULO CUATRO PÁGINA 8 DE 11 EJERCICIOS PROPUESTOS Diagrama de caja de los resultados de la prueba “Lápiz y Papel” del Psiquiatra A. a. b. c. d. e. 25. a. b. c. ¿Cuál es el valor aproximado de las medidas de dispersión del grado de depresión determinada por el Psiquiatra A? ¿Qué medida de dispersión usaría para describir mejor la variabilidad de los datos del Psiquiatra A? Justifique. ¿Qué porcentaje de los individuos tienen un grado de depresión mayor a 8 puntos según el Psiquiatra A? Calcule las medidas de tendencia central y de dispersión del grado de depresión de los individuos calificados por el Psiquiatra B. Use los siguiente datos: Resultados Psiquiatra B 7 28 3 4 8 18 1 1 9 35 9 6 10 15 2 2 11 42 6 10 12 22 5 3 Dibuje un diagrama de tallo y hoja para los resultados del Psiquiatra B. Comente el resultado acerca de la distribución. Un Tecnólogo Médico resume la información recopilada durante el mes de Enero del año 2008, de los exámenes que miden el nivel de triglicéridos de las personas atendidas en el consultorio de la zona norte de la ciudad de Curicó: Niveles de triglicéridos Frecuencia Absoluta Normal 90 Límite Alto 270 Alto 140 Muy Alto 100 Según el planteamiento, ¿Qué representa la frecuencia absoluta? ¿Cuál es el nivel de triglicérido que se observa con mayor frecuencia? Determine la Mediana e interprete su resultado. CAPÍTULO CUATRO PÁGINA 9 DE 11 EJERCICIOS PROPUESTOS 26. a. b. c. d. e. 27. a. b. c. Los estudiantes de Psicología siempre manifiestan que tienen mayor dificultad en los cursos que involucre el tratamiento de cálculos matemáticos, es por ello que se realizó una medición de la memoria en estudiantes de primer año de la carrera. La experiencia consistió en exponer 10 palabras y 10 números ante los estudiantes durante 10 segundos. Después de cuatro días de clases, se pidió a los alumnos que recordaran las palabras y números que se habían mostrados previamente, registrándose los siguientes resultados: Cantidad de palabras Número de Cantidad de números Número de que recuerda alumnos que recuerda alumnos 0 2 0 4 1 5 1 8 2 2 8 15 3 12 3 24 4 15 4 26 5 5 22 23 6 25 6 14 7 27 7 10 8 21 8 9 9 17 9 4 10 11 10 1 En término medio, ¿Qué cantidad de palabras y números recuerdan los estudiantes? ¿Cuál es la cantidad de palabras y de números que recuerdan con mayor frecuencia? Determine la mediana de ambos casos. Interprete sus resultados. ¿En cuál de los dos grupos se recopiló una información más homogénea? Determine en qué grupo existe una menor desviación cuartil. La Dependencia no es sinónimo de vejez. La Dependencia se define como “la necesidad de ayuda o asistencia para las actividades de la vida cotidiana”, o también, de manera más concreta, como “un estado en el que se encuentran las personas que por razones ligadas a la falta o pérdida de autonomía física, psíquica o intelectual, tienen necesidad de asistencia a fin de realizar los actos corrientes de la vida diaria y, de modo particular, los referentes al cuidado personal”. En un estudio en el Hospicio de Talca se recoge una muestra, donde se constata que existen personas con diferentes tipos de dependencia, como se describe a continuación: Económica Física Social Social Económica Económica Mental Mental Física Económica Mental Social Mental Económica Social Física Física Económica Mental Social Mental Económica Mental Mental Física Física Social Física Económica Mental Resuma la información anterior en una tabla de distribución de frecuencias. Construya un gráfico adecuado para resumir la información anterior. Calcule e interprete alguna medida de resumen de estos datos. CAPÍTULO CUATRO PÁGINA 10 DE 11 EJERCICIOS PROPUESTOS 28. Se realiza un estudio de un geriátrico de Santiago durante el mes de Mayo del 2006. El objetivo es determinar el tipo de pacientes a los que se atiende observándose su diagnóstico: Retraso Mental Retraso Mental Enfermo Mental Físicamente Enfermo Enfermo Mental a. b. 29. a. b. c. 30. a. b. Enfermo Mental Retraso Mental Físicamente Enfermo Retraso Mental Retraso Mental Físicamente Enfermo Enfermo Mental Retraso Mental Físicamente Enfermo Enfermo Mental Físicamente Enfermo Retraso Mental Enfermo Mental Retraso Mental Retraso Mental Retraso Mental Enfermo Mental Retraso Mental Retraso Mental Físicamente Enfermo Construya la tabla de distribución de frecuencias adecuada para la información recopilada. Determine todos los parámetros posibles de obtener. Interprete sus resultados. Se recopilan datos de las menciones obtenidas por Tecnólogos Médicos titulados en la Universidad de Talca entre los años 2001 y 2005: Bioanálisis Clínico, Morfofisiopatología, Imagenología, Oftalmología, Oftalmología, Bioanálisis Clínico, Morfofisiopatología, Bioanálisis Clínico, Oftalmología, Imagenología, Oftalmología, Imagenología, Oftalmología, Morfofisiopatología, Bioanálisis Clínico, Bioanálisis Clínico, Oftalmología, Morfofisiopatología, Imagenología, Bioanálisis Clínico, Oftalmología, Oftalmología, Morfofisiopatología, Oftalmología, Imagenología, Bioanálisis Clínico, Bioanálisis Clínico, Morfofisiopatología, Bioanálisis Clínico, Imagenología, Imagenología, Oftalmología, Oftalmología, Oftalmología, Imagenología. Represente la información anterior en una tabla de distribución de frecuencias. Represente gráficamente la información anterior. Calcule e interprete los parámetros de la información recopilada. En un estudio sobre la amnesia postraumática tras una lesión craneal, se estudia la variable del tiempo de hospitalización en días. En la figura se muestra el diagrama de tallo y hojas para los datos. Stem-and-Leaf Display for Amnesia: unit = 1.0 1|2 represents 12.0 0|8 1|2 2|7 3|0256 4|00001257 5|02 6|1 7| 8|9 9| 10|8 Calcule las medidas de tendencia central y de dispersión más adecuadas para estos datos, indicando a qué tipo de medida pertenece. Dibuje un diagrama de caja. Comente el resultado acerca de la distribución. Muestre sus cálculos. CAPÍTULO CUATRO PÁGINA 11 DE 11