I.E SEMILLA DE LA ESPERANZA Resolución de aprobación No. 1796 de septiembre 4 de 2002 Código DANE 276520005248 NIT. 815004247-7 Código: GAC-DC-O220 Versión: 01 Fecha: mayo-2020 GUIA No. 1 ÁSIGNATURA: ESTADÍSTICA GRADO: Decimo Nombre del estudiante: Docente: Período: Primero Inicia: 15/03/2021 Finaliza: 24/04/2021 Objetivos de Aprendizaje: ● Identificar las medidas de tendencia central para datos agrupados. ● Hacer uso de las medidas de tendencia central para obtener información representativa de la muestra poblacional. ● Encontrar las medidas de tendencia central en un conjunto de datos cuantitativos. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS INTRODUCCIÓN La estadística es la ciencia de la recolección y el análisis de datos. Tiene muchas aplicaciones en varios campos, relacionados con el desarrollo de la sociedad. Teniendo en cuenta el área específica, los diferentes conceptos estadísticos tienen una aplicación en la cual cada interpretación se elabora según las características de la población o la muestra y claro, las variables que se desean estudiar. El uso de las medidas de tendencia central se ha generalizado a tal punto que hoy en día es necesario en los grupos de futbol profesional conocer el rendimiento de sus jugadores y de los demás equipos rivales para generar estrategias ganadoras. Esto por medio del análisis de los datos cuantitativos recopilados desde medios físicos y virtuales. Así mismo, el uso del análisis de datos agrupados y cuantitativos permite tener elementos de peso para la toma de decisiones en momentos cruciales de la vida y en algunos casos, decisiones trascendentales como el proceso de paz con los grupos armados ilegales. PAGE \* I.E SEMILLA DE LA ESPERANZA Resolución de aprobación No. 1796 de septiembre 4 de 2002 Código DANE 276520005248 NIT. 815004247-7 Código: GAC-DC-O220 Versión: 01 Fecha: mayo-2020 ¿QUÉ SABES? VARIABLE ESTADÍSTICA Es una característica de una población que se puede medir para hacer un análisis de la misma. Permite clasificar a los individuos de una población. Estas pueden ser de dos tipos, como se muestra a continuación: Para caracterizar una variable cuantitativa se utilizan las medidas de tendencia central, las tablas de frecuencias y las representaciones gráficas. Para representar los resultados de un estudio, se debe tener en cuenta si la variable es discreta o es continua. Los datos cuantitativos se pueden trabajar como datos sueltos (datos no agrupados) si no son demasiados o cuando no son tan distintos; de lo contrario, lo mejor es agruparlos en tablas de frecuencias con intervalos. PAGE \* I.E SEMILLA DE LA ESPERANZA Resolución de aprobación No. 1796 de septiembre 4 de 2002 Código DANE 276520005248 NIT. 815004247-7 Código: GAC-DC-O220 Versión: 01 Fecha: mayo-2020 RECUERDA Las distribuciones de frecuencias son tablas que resumen los datos originales en frecuencias. Los tipos de frecuencia pueden ser: - Frecuencia Absoluta (fa o fi).- Es el número de veces que se repite el valor de cada variable. La suma de frecuencias absolutas es siempre al total de datos observados (n o N). - Frecuencia Relativa (fr o hi).- Indica la proporción con que se repite un valor. Es el cociente (división) entre la frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas es aproximadamente 1. 𝑓𝑎 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑓𝑟 = = 𝑛 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 - Frecuencia Acumulada (Fa o Fi).- Indica el número de valores que son menores o iguales que el valor dado. Es la suma de la frecuencia absoluta primera con la segunda, este valor con la tercera, y así sucesivamente. PAGE \* I.E SEMILLA DE LA ESPERANZA Resolución de aprobación No. 1796 de septiembre 4 de 2002 Código DANE 276520005248 NIT. 815004247-7 Código: GAC-DC-O220 Versión: 01 Fecha: mayo-2020 - Frecuencia Porcentual o Porcentaje (f%).- Llamada también frecuencia relativa porcentual. Se obtiene multiplicando la frecuencia relativa por 100. La suma de las frecuencias porcentuales es siempre 100%. Se calcula así: % = 𝑓𝑟 × 100 - Frecuencia Relativa Acumulada (Fra o Hi).- Es la suma de la frecuencia relativa primera con la segunda, este valor con la tercera, y así sucesivamente. Otro concepto importante que debes tener claro es: Marca de clase (Xi o Mi): también conocida como punto medio, es el valor medio o promedio de cada intervalo. es el valor que representa a todo el intervalo para el cálculo de algunos parámetros como la media aritmética o la desviación típica. Se halla de la siguiente manera: 𝑋𝑖 = 𝐿𝑖 + 𝐿𝑠 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 + 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 2 2 PAGE \* I.E SEMILLA DE LA ESPERANZA Resolución de aprobación No. 1796 de septiembre 4 de 2002 Código DANE 276520005248 NIT. 815004247-7 Código: GAC-DC-O220 Versión: 01 Fecha: mayo-2020 ¡OBSERVO, LEO Y APRENDO! El uso de las medidas de tendencia central se ha generalizado a tal punto que hoy en día es necesario en los grupos de futbol profesional conocer el rendimiento de sus jugadores y de los demás equipos rivales para generar estrategias ganadoras. Esto por medio del análisis de los datos cuantitativos recopilados desde medios físicos y virtuales. Así mismo, el uso del análisis de datos agrupados y cuantitativos permite tener elementos de peso para la toma de decisiones en momentos cruciales de la vida y en algunos casos, decisiones trascendentales como el proceso de paz con los grupos armados ilegales. Las medidas de tendencia central o de centralización son los parámetros que indican el valor hacia el que tienden a ubicarse los datos de un conjunto o distribución. Permiten analizar los datos en torno a un valor central. Las medidas de tendencia central son: ❑ Media aritmética (𝑥) ❑ Moda y clase modal (Mo; 𝑥̂) ❑ Mediana y clase mediana (Me; 𝑥̃) 1. MEDIA ARITMETICA (𝑥) Denominada promedio o simplemente media, es la medida de localización central más importante. Se calcula dependiendo si los datos están agrupados o no PAGE \* I.E SEMILLA DE LA ESPERANZA Resolución de aprobación No. 1796 de septiembre 4 de 2002 Código DANE 276520005248 NIT. 815004247-7 Código: GAC-DC-O220 Versión: 01 Fecha: mayo-2020 Datos Agrupados La media para datos agrupados en clases se calcula sumando todos los productos de cada marca de clase (𝑥𝑖 ) y su correspondiente frecuencia (𝑓𝑖 ) y dividiendo ese resultado entre el número total de datos (𝑁) ∑ 𝑥𝑖 𝑓𝑖 𝑥= 𝑁 Ejemplo: En un puesto de control de una autopista, se registraron las velocidades de algunos vehículos que transitaron durante cierto día de la semana. ¿Cuál fue la velocidad promedio? S// En la tabla de frecuencias dada podemos construir una columna adicional para representar el producto de la marca de clase (𝑥𝑖 ) por la frecuencia (𝑓𝑖 ) 𝑥= ∑ 𝑥𝑖 𝑓𝑖 𝑁 = 10 075 = 118,5 𝑘𝑚/ℎ 85 PAGE \* I.E SEMILLA DE LA ESPERANZA Código: GAC-DC-O220 Versión: 01 Fecha: mayo-2020 Resolución de aprobación No. 1796 de septiembre 4 de 2002 Código DANE 276520005248 NIT. 815004247-7 La velocidad promedio a la que transitaron ese día los 5 vehículos que se registraron fue de 118,5 km/h. 2. MEDIANA Y CLASE MEDIANA La mediana (𝑀𝑒, 𝑥̃) de una variable estadística es una medida que divide la muestra en dos partes porcentualmente iguales, es decir, el número de valores menores que ella es igual al número de valores mayores. La mediana depende del orden de los datos y no de su valor. Datos Agrupados Para calcular la mediana en datos agrupados por clases es necesario primero ubicar en la columna 𝑁 de frecuencia absoluta acumulada (𝐹𝑖 ) de la tabla de distribución la posición 2 . Ese intervalo se conoce como intervalo de la mediana y corresponde a la CLASE MEDIANA 𝑁 Si el valor 2 no aparece o coincide con alguno de la tabla se toma el valor que lo supera por primera vez. La mediana de un conjunto de datos agrupados se calcula así: 𝑁 ( 2 − 𝐹𝑖−1 ) 𝑀𝑒 = 𝐿𝑖 + ∙𝐴 𝑓𝑖 Donde; 𝐿𝑖 : limite inferior del intervalo que contiene a 𝑁 2 𝐹𝑖−1 : frecuencia acumulada anterior a la clase mediana 𝑓𝑖 : frecuencia absoluta del intervalo de la mediana 𝐴: amplitud del intervalo Ejemplo: El tiempo, en segundos, que tardan en conectarse los usuarios de una determinada página web, a lo largo de un día, viene dado por la tabla. Calcule la mediana y la clase mediana Tiempo en segundos [0, 30) [30, 60) [60, 90) [90, 120) [120, 150) [150, 180) Número de usuarios 3 7 10 9 8 3 PAGE \* I.E SEMILLA DE LA ESPERANZA Resolución de aprobación No. 1796 de septiembre 4 de 2002 Código DANE 276520005248 NIT. 815004247-7 Código: GAC-DC-O220 Versión: 01 Fecha: mayo-2020 S// 1. Construimos la tabla de distribución frecuencias para datos agrupados. Con la columna de frecuencia absoluta acumulada. 2. Calculamos la posición 𝑁 2 y la ubicamos en la columna 𝐹𝑖 𝑁 40 = = 20 2 2 La clase mediana seria el intervalo [60, 90) 3. Nos concentramos en el intervalo de la mediana para identificar los valores de la fórmula de la mediana PAGE \* I.E SEMILLA DE LA ESPERANZA Resolución de aprobación No. 1796 de septiembre 4 de 2002 Código DANE 276520005248 NIT. 815004247-7 Código: GAC-DC-O220 Versión: 01 Fecha: mayo-2020 𝑁 ( 2 − 𝐹𝑖−1 ) 𝑀𝑒 = 𝐿𝑖 + ∙𝐴 𝑓𝑖 Donde; a partir del intervalo mediana 𝐿𝑖 = 60 𝐹𝑖−1 = 10 𝑓𝑖 = 10 𝐴 = 30 𝑀𝑒 = 90 𝑠 La mediana indica que el 50% de los usuarios tarda menos de 90 s en conectarse a la página web. 3. MODA Y CLASE MODAL La moda (𝑀𝑜, 𝑥̂) de una variable estadística es el valor de la variable que tiene mayor frecuencia absoluta. En las tablas de frecuencias con datos agrupados por clases se habla de intervalo modal y representa la clase modal. Una distribución puede tener una moda (unimodal), dos modas (bimodal), tres modas (trimodal), etc. Si todos los valores se repiten el mismo número de veces, se considera que la distribución no tiene moda. Datos Agrupados Para estimar la moda en datos agrupados se siguen los siguientes pasos: ❖ Encontrar el intervalo en el cual se encuentra la moda, que es el intervalo con mayor frecuencia absoluta (𝑓𝑖 ). ❖ Usar la siguiente fórmula para estimar el valor de la moda 𝑓𝑖 − 𝑓𝑖−1 𝑀𝑜 = 𝐿𝑖 + ∙𝐴 (𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 ) Donde; 𝐿𝑖 : limite inferior de la clase modal 𝑓𝑖−1: frecuencia absoluta anterior a la clase modal 𝑓𝑖+1: frecuencia absoluta posterior a la clase modal 𝐴: amplitud del intervalo PAGE \* I.E SEMILLA DE LA ESPERANZA Resolución de aprobación No. 1796 de septiembre 4 de 2002 Código DANE 276520005248 NIT. 815004247-7 Código: GAC-DC-O220 Versión: 01 Fecha: mayo-2020 Ejemplo: El tiempo, en segundos, que tardan en conectarse los usuarios de una determinada página web, a lo largo de un día, viene dado por la tabla. 1. Se identifica el intervalo con la más alta frecuencia absoluta La clase modal seria [60, 90) 2. Se identifican los siguientes valores en la clase modal 𝐿𝑖 = 60 𝑓𝑖 = 10 𝑓𝑖−1 = 7 𝑓𝑖+1 = 9 𝐴 = 30 3. Se reemplaza en la formula y se estima el valor de la moda 10 − 7 3 3 × 30 90 𝑀𝑜 = 60 + ∙ 30 = 60 + × 30 = 60 + = 60 + = 60 + 22,5 = 82,5 (10 − 7) + (10 − 9) 3+1 4 4 𝑀𝑜 = 82, 5 𝑠 El tiempo más frecuente que se tardan en conectarse los usuarios a la página web es 82,5 s PAGE \* I.E SEMILLA DE LA ESPERANZA Resolución de aprobación No. 1796 de septiembre 4 de 2002 Código DANE 276520005248 NIT. 815004247-7 Código: GAC-DC-O220 Versión: 01 Fecha: mayo-2020 ACTIVIDADES DE APLICACIÓN Y DEMOSTRACIÓN 1. 2. 3. Calcular la media, mediana y moda en la siguiente tabla de datos: PAGE \* I.E SEMILLA DE LA ESPERANZA Resolución de aprobación No. 1796 de septiembre 4 de 2002 Código DANE 276520005248 NIT. 815004247-7 Código: GAC-DC-O220 Versión: 01 Fecha: mayo-2020 EVALÚO MI PROCESO a. ¿Aprendiste el tema? ____________________________________________________________________ b. ¿Comprendiste las explicaciones y conceptos? ____________________________________________________________________ c. ¿Las actividades fueron fáciles de resolver? ____________________________________________________________________ d. ¿Qué se puede mejorar para la siguiente guía? ____________________________________________________________________ PAGE \*