Programa AHORA Estadística 555 Facilitadora: Sylvia Y. Cosme Montalvo Taller Dos – Medidas de Tendencia Central y Dispersión Objetivos esenciales Al finalizar el taller cada estudiante podrá: 1. Definir los términos medidas de tendencia central, medidas de dispersión o variabilidad con el apoyo de literatura obtenida de las referencias sugeridas. 2. Calcular e interpretar medidas de tendencia central y de dispersión para datos agrupados y no agrupados dadas situaciones prácticas o ejercicios de aplicación con calculadora o mediante el uso del programado Excel. 3. Seleccionar y decidir en qué circunstancias es preferible utilizar la Media Aritmética, la Moda o la Mediana considerando la base de datos bajo estudio. 4. Describir la forma de una distribución: sesgo positivo, sesgo negativo, simetría considerando la base de datos bajo estudio. I. Medidas de tendencia central para datos agrupados (se usan cuando n 30 ) n 1. Media = X fm i i 1 en donde n = tamaño de la muestra, m = marca de clase y, f = n frecuencia de representada por la marca de clase. 2. Moda = Mo = Li d1 c en donde Li es el límite inferior de la clase modal, d1 es la d1 d 2 diferencia entre la frecuencia de la clase modal y la frecuencia de la clase que antecede, d2 es la diferencia de frecuencia de la clase modal y la subsiguiente, y c es la contante sobre el ancho del intervalo 3. Mediana = Me = n Fi 1 Li 2 c fi en donde Li es el límite inferior de la clase mediana, n/2 es la mitad de la cantidad de datos calculada para propósitos de poder ubicar la clase mediana, Fi-1 es la frecuencia acumulada anterior a la clase mediana, fi es la frecuencia absoluta de la clase mediana y c es la contante sobre el ancho del intervalo II. Pasos a seguir al agrupar datos: 1. Calcular # de intervalos, utilizando estimador de Sturges k = 1 + 3.322log 10(n) o n mayor menor 2. Determinar longitud de los intervalos. l k 3. Construir tabla de distribución de frecuencias. La tabla de distribución de frecuencias debe incluir las siguientes columnas Clase Intervalo m Marca de Clase F=frecuencia F=frecuencia absoluta acumulada f/n = frecuencia F/n = frecuencia absoluta relativa acumulada relativa III. Otras medidas de posición 1. Q1 = cuartila 1. Hasta donde acumula el 25% de los datos en la distribución. n Fi 1 4 Q1 Li c fi 2. Q3 = cuartila 3. Hasta donde acumula el 75% de los datos en la distribución. 3n Fi 1 Q3 Li 4 c fi IV. Medidas de variación mayormente utilizadas 1. Rango = X mayor – X menor 2 n 2. Varianza de la muestra= s 2 (x i 1 i x) n 1 2 n 3. Desviación estándar de la muestra = s s 4. Coeficiente de variación = CV= *100 x 5. Rango Intercuartil = Q3 – Q1 (x i 1 i x) n 1 Ejercicio para explicar medidas de tendencia central y dispersión para datos agrupados Según el portal del Instituto de Estadísticas de PR, http://www.estadisticas.gobierno.pr/iepr/Estadisticas/Basesdedatos/Economia.aspx, el índice histórico de precios al consumidor de alimentos y bebidas los pasados 36 meses se presenta a continuación (diciembre 2006 = 100) 115.529 118.548 119.565 120.870 121.399 122.668 116.150 118.783 119.882 121.316 121.443 116.996 119.096 119.939 121.037 121.560 117.221 119.637 120.032 120.914 122.636 117.230 119.410 120.180 121.321 122.953 117.355 119.555 120.406 121.368 123.015 117.741 119.696 120.285 121.665 122.827 1. Desarrolle una tabla de distribución de frecuencias 2. Obtenga las medidas de tendencia central, de posición y de dispersión 3. A base de los cálculos obtenidos, ¿qué puede decir del índice de precios de los alimentos de los pasados 36 meses? Ejercicios colaborativos para entregar en el taller 2 Instrucciones generales: Conteste el ejercicio a continuación. Pueden utilizar Excel y hacer entrega digital, si lo prefieren. No obstante, deben detallar los pasos tal y como presentado por la facilitadora en la clase. Es decir, aún con el apoyo del programado, el proceso debe reflejarse en la hoja de trabajo. Cada trabajo debe integrar el nombre, numero de estudiante, CRN, fecha de todos los participantes del grupo y será enviado a Blackboard. ES NECESARIO presentar el ejercicio escrito en el documento a entregar. Puede copiar y pegar en el programado el mismo. La hoja de presentación debe ser en formato APA. La matriz valorativa para el ejercicio colaborativo, se facilitará en Blackboard. El ejercicio tiene un valor de 25 puntos. Los siguientes datos presentan el gasto de compra de alimentos en una base semanal para una muestra de entrevistados que acudieron a un supermercado en el Área Metropolitana $105 $188 $271 $319 a) b) $110 $190 $278 $335 $126 $191 $279 $335 $128 $199 $279 $339 $143 $207 $279 $342 $146 $227 $294 $363 $152 $231 $295 $427 $157 $231 $297 $418 $159 $231 $303 $434 $162 $240 $309 $454 $170 $177 $181 $246 $250 $266 $319 $319 $319 $498 Determine las medidas de tendencia central, de posición y de variación. A base de los cálculos obtenidos, ¿qué puede decir del gasto en compra semanal? Ejercicios individuales para entregar en el Taller 3 Instrucciones generales: Conteste todos los ejercicios a continuación. Puede utilizar Excel y hacer entrega digital, si lo prefiere. No obstante, debe detallar los pasos tal y como presentado por la facilitadora en la clase. Es decir, aún con el apoyo del programado, el proceso debe reflejarse en la hoja de trabajo. También, puede trabajar los ejercicios de forma colaborativa pero debe entregarlo individualmente con su nombre, numero de estudiante, CRN, fecha. ES NECESARIO presentar el ejercicio escrito en el documento a entregar. La hoja de presentación debe ser en formato APA. La matriz valorativa para el ejercicio individual, se facilitará en Blackboard. Cada ejercicio tiene un valor de 20 puntos. 1. Las edades de los 50 integrantes de un programa de servicio social del gobierno son: 83 65 44 38 91 51 87 55 88 71 66 68 78 76 83 61 64 69 99 80 82 51 98 84 68 65 70 67 47 65 54 75 82 60 51 56 66 77 42 56 92 74 79 66 73 60 68 62 74 55 Use estos datos para construir una tabla de distribuciones de frecuencia, un histograma y polígono de frecuencias. La política del estado para los programas de servicio social requiere que alrededor de 50% de los participantes tengan más de 50 años. a) ¿Cumple el programa con la política? b) ¿La distribución de frecuencias ayuda a responder la pregunta anterior adecuadamente? c) Suponga que el director de servicios sociales desea saber la proporción de participantes en el programa que tienen entre 45 y 50 años de edad. ¿Es posible estimar dicho estimado por medio de la tabla desarrollada? ¿Cómo? d) Calcule las medidas de tendencia central: moda, media y mediana. e) Calcule las medidas de variación: rango, desviación estándar. f) ¿Qué puede argumentar sobre el programa de servicio social del gobierno? 2. Con el propósito de hacer una evaluación de desempeño y un ajuste de cuotas, Juan Rivera estuvo inspeccionando las ventas de autos de sus 40 vendedores. En un período de un mes, tuvieron las siguientes ventas de autos: 7 8 5 10 9 10 5 12 8 6 10 11 6 5 10 11 10 5 9 13 8 12 8 8 10 15 7 6 8 8 5 6 9 7 14 8 7 5 5 14 a) Calcule las medidas de tendencia central: moda, media y mediana y las medidas de posición cuartil 1 y cuartil 3. b) Calcule las medidas de variación: rango, desviación estándar, rango intercuartil. c) Si las ventas menores de 7 autos se consideran desempeño inaceptable, ¿Qué puede concluir del desempeño de esta muestra de 40 vendedores? 3. La compañía Casual Life Insurance estudia la compra de una nueva flota de autos. El director del Departamento de Finanzas, Miguel Mercado, obtuvo una muestra de 40 empleados para determinar el número de millas que cada uno maneja en un año. Los resultados del estudio son los siguientes: 3,600 5,700 8,300 9,300 10,300 11,300 12,900 14,900 4,200 6,700 8,400 9,500 10,500 11,300 13,100 16,300 4,700 7,300 8,700 9,500 10,700 11,800 13,500 17,200 4,900 7,700 8,700 9,700 10,800 12,100 13,800 18,500 5,300 8,100 8,900 10,000 11,000 12,700 14,600 20,300 a) Calcule las medidas de tendencia central: moda, media y mediana y las medidas de posición cuartil 1 y cuartil 3. b) Calcule las medidas de variación: rango, desviación estándar, rango intercuartil. d) ¿Qué puede concluir del desempeño de esta muestra de 40 empleados en relación con el millaje reflejado? ¿Qué recomendaciones o sugerencias podría ofrecerle a Miguel Mercado?