Universidad Abierta y a Distancia de México Ingeniería en Biotecnología Estadística Básica Grupo: BI-BEBA-1902-B2-001 Unidad 3. Actividad 2 Medidas de dispersión Varianza y desviación estándar Alumno: José Luis Jiménez Molina Fecha: 06 de noviembre de 2019 1 Actividad 2 Instrucciones: 1. Retoma los datos de la actividad anterior. 2. Halla las medidas de dispersión: varianza y desviación estándar, e interprétalas Las medidas de dispersión miden el grado de separación o alejamiento de una variable estadística alrededor de una medida de posición o tendencia central. Este grado de separación nos muestra lo representativa que es la medida de posición con respecto al conjunto total de datos. Las medidas de dispersión más comunes son: el recorrido, la varianza y la desviación estándar. La varianza mide la dispersión de los valores de la variable con respecto a la media aritmética. Siempre es mayor o igual que cero y menor que infinito. Para obtener su valor, calculamos la sumatoria de los cuadrados de las desviaciones y el resultado lo dividimos entre el valor poblacional (N) o el valor muestral (n−1) según sea el caso. Las fórmulas de la varianza para datos no agrupados son: Para una muestra: Para una población: Desviación típica o estándar. Muestra que tan alejados están los datos de la media aritmética. Se representa como S cuando se calcula para una muestra o cuando se calcula para toda la población. Es la raíz cuadrada de la varianza. Entre más dispersa se encuentra la distribución de datos, más grande es su desviación estándar. Las fórmulas de la desviación típica o estándar para datos no agrupados son: 2 En una población En una muestra Donde: s = Desviación estándar en una muestra. σ= Es la desviación estándar en una población xi = Es un valor de un conjunto de datos. n = Es el número de datos de la muestra. N = Es el número de datos de la población. µ = Es la media del conjunto de datos de la población. 𝑥 = Es la media del conjunto de datos de la muestra Significa suma de Cálculo de la varianza del ejemplo de la actividad anterior. Para el ejemplo anterior, usamos la fórmula Paso 1: calcular la media. _ x = 4 + 5 + 5 + 6 + 6 + 7 + 7 + 7 + 7 + 7 + 8 + 8 + 8 + 8 + 9 + 9 + 10 + 10 + 10 + 11 20 = 7.6 3 Paso 2: calcular el cuadrado de la distancia a la media para cada dato. Datos Media: 4 5 5 6 6 7 7 7 7 7 8 8 8 8 9 9 10 10 10 11 7.6 Media - 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 Resultado = = = = = = = = = = = = = = = = = = = = -3.6 -2.6 -2.6 -1.6 -1.6 -0.6 -0.6 -0.6 -0.6 -0.6 0.4 0.4 0.4 0.4 1.4 1.4 2.4 2.4 2.4 3.4 Elevar al cuadrado ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( - 3.6 )² = - 2.6 )² = - 2.6 )² = - 1.6 )² = - 1.6 )² = - 0.6 )² = - 0.6 )² = - 0.6 )² = - 0.6 )² = - 0.6 )² = 0.4 )² = 0.4 )² = 0.4 )² = 0.4 )² = 1.4 )² = 1.4 )² = 2.4 )² = 2.4 )² = 2.4 )² = 3.4 )² = Suma: Resultado 12.960 6.760 6.760 2.560 2.560 0.360 0.360 0.360 0.360 0.360 0.160 0.160 0.160 0.160 1.960 1.960 5.760 5.760 5.760 11.560 66.800 Paso 3: sumar los valores que resultaron del paso 2. Resultado: 66.8 Paso 4: dividir entre el número de datos - 1. 66.8 / (20 - 1) = 3.52 Varianza, S² = 3.52 4 Cálculo de la desviación estándar del ejemplo de la actividad anterior. Realice lo siguiente: Paso 1: calcule la media. _ x = 4 + 5 + 5 + 6 + 6 + 7 + 7 + 7 + 7 + 7 + 8 + 8 + 8 + 8 + 9 + 9 + 10 + 10 + 10 + 11 20 = 7.6 Paso 2: calcule el cuadrado de la distancia a la media para cada dato. Datos Media: 4 5 5 6 6 7 7 7 7 7 8 8 8 8 9 9 10 10 10 11 7.6 Media - 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 7.6 Resultado = = = = = = = = = = = = = = = = = = = = -3.6 -2.6 -2.6 -1.6 -1.6 -0.6 -0.6 -0.6 -0.6 -0.6 0.4 0.4 0.4 0.4 1.4 1.4 2.4 2.4 2.4 3.4 Elevar al cuadrado ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( - 3.6 )² = - 2.6 )² = - 2.6 )² = - 1.6 )² = - 1.6 )² = - 0.6 )² = - 0.6 )² = - 0.6 )² = - 0.6 )² = - 0.6 )² = 0.4 )² = 0.4 )² = 0.4 )² = 0.4 )² = 1.4 )² = 1.4 )² = 2.4 )² = 2.4 )² = 2.4 )² = 3.4 )² = Suma: Resultado 12.960 6.760 6.760 2.560 2.560 0.360 0.360 0.360 0.360 0.360 0.160 0.160 0.160 0.160 1.960 1.960 5.760 5.760 5.760 11.560 66.800 Paso 3: sume los valores que resultaron del paso 2. Resultado: 66.8 Paso 4: divida entre el número de datos - 1. 5 66.8 / (20 - 1) = 3.52 Paso 5: sacar la raíz cuadrada. √3.52 = 1.876 Desviación estándar, s: 1.876 3. Describe los resultados obtenidos Se obtuvieron los valores de varianza y desviación estándar, el valor de la varianza es de 3.52 y el valor de la desviación estándar es de 1.876. Aunque la varianza mide la dispersión matemática de los datos con respecto a la media y es teóricamente correcto, es difícil utilizarlo en el mundo real debido a que los valores están elevados al cuadrado. La desviación estándar, al ser la raíz cuadrada de la varianza, se encuentra en las mismas unidades que los datos, por esta razón, es más fácil trabajar con ella, ya que la medida de la dispersión tiene las mismas unidades que la muestra original. 6