Práctica 3. Media, mediana y moda. La presente práctica, te permitirá estudiar las medidas de tendencia central mencionadas, a partir de los siguientes datos que corresponden a la estatura de estudiantes, iniciaremos la práctica. Recopilación de datos: consiste en escribir los datos de la muestra que nos interesa conocer sin importar el orden. 1. Recopilación de datos Datos no ordenados 1.70 1.56 1.70 1.66 1.90 1.69 1.80 1.69 1.70 1.80 1.66 1.80 1.55 1.78 1.59 1.68 1.64 1.70 1.75 1.67 1.60 1.74 1.75 1.65 1.70 1.65 1.64 1.64 1.60 1.48 1.52 1.75 1.60 1.58 1.70 1.75 1.56 1.60 1.64 1.70 1.64 1.65 1.55 1.63 1.60 1.63 1.58 1.57 1.68 1.56 Ordenamiento de datos: consiste en ordenar los datos en forma ascendente o descendente, para facilitar el conteo de los datos que corresponden a cada uno de los intervalos. 1.74 2. Ordenar datos Datos ordenados 1.48 1.59 1.64 1.68 1.52 1.60 1.64 1.69 1.55 1.60 1.64 1.69 1.55 1.60 1.65 1.70 1.56 1.60 1.65 1.70 1.56 1.60 1.65 1.70 1.56 1.63 1.66 1.70 1.57 1.63 1.66 1.70 1.58 1.64 1.67 1.70 1.58 1.64 1.68 1.70 1.74 1.74 1.75 1.75 1.75 1.75 1.78 1.80 1.80 1.80 1.90 3. Determinar el número de clases Determinación del número de clases. El número de clases (NC) en que se agrupa el número de datos, se determina con la raíz cuadrada del número total de datos cuando este sea hasta de 200. Para muestras con más de 200 datos, se obtiene con la raíz cúbica del número de datos. Nota: el NC siempre se redondea a enteros. Considerando los datos de cualquiera de las tablas que se muestran en la parte superior, encontramos que el total de datos es 51, a continuación se calcula la NC: N = 51 NC = N NC = 51 = 7.14 NC = 7 NC 1 2 3 4 5 6 7 4. Calcular el tamaño de clase Cálculo del tamaño de clase. Para determinar el tamaño de clase (C) s necesario conocer el rango (R) de la muestra, que se obtiene con la diferencia entre el dato mayor y el menor. Determinando el Rango de la muestra Dato mayor = 1.90 Dato menor = 1.48 R = dato mayor – dato menor R = 1.90 − 1.48 R = 0.42 m Determinando el tamaño de la clase R NC 0.42 C= 7 C= C = 0.06 m CLASE A B C D E F G 5. Elaborar los intervalos Elaboración de los intervalos. El tamaño de clase indica el número de datos que conforman a cada intervalo, considerando los valores extremos llamados límites. En cada intervalo aparece un límite inferior y uno superior. Si en la elaboración de los intervalos se observa que algunos de los datos quedan fuera del número de clases, entonces se debe agregar una clase al final, esto no alterara el resultado. NC = 7 (datos de la clase: A, B…G) C = 0.06 CLASE INTERVALO A B C D E F G H 1.48 – 1.53 1.54 – 1.59 1.60 – 1.65 1.66 – 1.71 1.72 – 1.77 1.78 – 1.83 1.84 – 1.89 1.90 – 1.95 ¿Cómo se obtiene el intervalo? 1.48 + 0.06 = 1.53 1.53 + 0.06 = 1.59 1.59 + 0.06 = 1.65 1.65 + 0.06 = 1.71 1.71 + 0.06 = 1.77 1.77 + 0.06 = 1.83 1.83 + 0.06 = 1.89 1.89 + 0.06 = 1.95 El número de clase (NC) era 7, desde la A hasta la G, pero se tuvo que agregar la clase H para que no quedara fuera el dato 1.90 m. 6. Obtener frecuencias: Obtención de frecuencias. La frecuencia de cada clase, se obtiene contando en la tabla de datos ordenados los que correspondan al intervalo de dicha clase. Nota: Para elaborar la distribución de frecuencias se deja un renglón vacío antes de la primera clase y otro después de la última. 1.48 1.52 1.55 1.55 1.56 1.56 1.56 1.57 1.58 1.58 1.59 1.60 1.60 1.60 1.60 1.60 1.63 1.63 1.64 1.64 Datos ordenados 1.64 1.68 1.64 1.69 1.64 1.69 1.65 1.70 1.65 1.70 1.65 1.70 1.66 1.70 1.66 1.70 1.67 1.70 1.68 1.70 1.74 1.74 1.75 1.75 1.75 1.75 1.78 1.80 1.80 1.80 7. Obtener límite real inferior y límite real superior Límite Real Inferior L.R.I . = L.S .C. A. + L.I .C. 2 L.R.I. = Límite Real Inferior L.S.C.A. = Límite Superior de la Clase Anterior L.I.C. = Límite Inferior de la Clase CLASE INTERVALO FRECUENCIA A B C D E F G H 1.48 – 1.53 1.54 – 1.59 1.60 – 1.65 1.66 – 1.71 1.72 – 1.77 1.78 – 1.83 1.84 – 1.89 1.90 – 1.95 2 9 15 14 6 4 0 1 Total 51 1.90 Límite Real Superior L.R.S . = L.S .C. + L.I .C.S . 2 L.R.S. = Límite Real Superior L.S.C. = Límite Superior de la Clase L.I.C.S. = Límite Inferior de la Clase Siguiente CLASE INTERVALO FRECUENCIA 1.42 – 1.47 1.48 – 1.53 1.54 – 1.59 1.60 – 1.65 1.66 – 1.71 1.72 – 1.77 1.78 – 1.83 1.84 – 1.89 1.90 – 1.95 1.96 – 2.01 Total A B C D E F G H L.R.I . = 2 9 15 14 6 4 0 1 L.S .C. A. + L.I .C. 2 L.R.I (1.47+1.48)/2 (1.53+1.54)/2 (1.59+1.60)/2 (1.65+1.66)/2 (1.71+1.72)/2 (1.77+1.78)/2 (1.83+1.84)/2 (1.89+1.90)/2 (1.95 + 1.96)/2 L.R.S . = A B C D E F G H 1.475 1.535 1.595 1.655 1.715 1.775 1.835 1.895 1.955 51 Marca de clase (X). Es el punto medio del intervalo de clase INTERVALO L.R.S. (1.42+1.53)/2 (1.48+1.59)/2 (1.54+1.65)/2 (1.60+1.71)/2 (1.66+1.77)/2 (1.72+1.83)/2 (1.78+1.89)/2 (1.84+1.95)/2 (1.90+2.01)/2 1.475 1.535 1.595 1.655 1.715 1.775 1.835 1.895 1.955 8. Obtener la marca de clase CLASE L.S .C . + L.I .C.S . 2 FRECUENCIA L.R.I 2 9 15 14 6 4 0 1 1.475 1.535 1.595 1.655 1.715 1.775 1.835 1.895 1.955 1.42 – 1.47 1.48 – 1.53 1.54 – 1.59 1.60 – 1.65 1.66 – 1.71 1.72 – 1.77 1.78 – 1.83 1.84 – 1.89 1.90 – 1.95 1.96 – 2.01 Total X= L.R.S. X= 1.475 1.535 1.595 1.655 1.715 1.775 1.835 1.895 1.955 Límiteinf erior + Límitesup erior 2 Límiteinf erior + Límitesup erior X 2 (0+1.475) 1.475+1.535 1.535+1.595 1.595+1.655 1.655+1.715 1.715+1.775 1.775+1.835 1.835+1.895 1.895+1.955 1.955+0 1.475 1.505 1.565 1.625 1.685 1.745 1.805 1.865 1.925 1.955 51 9. Obtener la media aritmética Muestras pequeñas Muestras grandes Datos ordenados: 5, 5, 6, 6, 7, 8, 8, 8, 9, 9 De a cuerdo a los datos ordenados de la tabla que estamos utilizando como ejemplo, calculamos la x x= x= X 1 + X 2 + X 3 + ... + X n N clase 5+5+6+6+7+8+8+8+9+9 10 x = 7.1 frecuencia F A B C D E F G H 2 9 15 14 6 4 0 1 Total 51 marca declase X 1.475 1.505 1.565 1.625 1.685 1.745 1.805 1.865 1.925 1.955 FX 3.01 14.09 24.38 23.59 10.47 7.22 0 1.93 Total 84.69 x= ∑ (F • X ) x= N 84.69 51 x = 1.66m 10. Obtener la mediana Muestras pequeñas Cuando los datos son pares, se obtiene el promedio de los elementos centrales: Muestras grandes Para obtener la mediana, requerimos de los siguiente datos: Clase Mediana. El calculo de esta nos permitirá obtener el limite real inferior, la sumatoria de la frecuencia 1 y la frecuencia de la mediana ( Li , ∑ F y f med , se Datos ordenados: 5, 5, 6, 6, 7, 8, 8, 8, 9, 9 CM = CM = 26 1 X + X2 ~ x= 1 2 7+8 ~ x= 2 N 51 = = 25.5 2 2 obtendrán de las tablas anteriores) A partir de la CM obtenemos lo siguiente: En la tabla del punto 8, se calculo el L.R.I., deberás sumar las frecuencias de esa tabla hasta obtener 26 que es la clase mediana, como se muestra ~ x = 7 .5 CLASE FRECUENCIA L.R.I A B C D E F G H 2 9 15 14 6 4 0 1 1.475 1.535 1.595 1.655 1.715 1.775 1.835 1.895 1.955 2+ 9 = 11 Si los datos son impares, el elemento central de los datos es la mediana: 15 5, 5, 6, 6, 7, 8, 8, 8, 9, 9, 10 2+9+15 = 26 El L.R.I. es la clase que contiene a la mediana (CM=26) 51 ~ x =8 CM = 26 Li = 1.595 m N = 51 estudiantes ∑F 1 = 11 estudiantes f med = 15 estudiantes C = 0.06 m (se calculo en el paso 5) ⎛N ⎞ ⎜ − ∑ F1 ⎟ ~ ⎟C x = Li + ⎜ 2 ⎜ ⎟ f med ⎜ ⎟ ⎝ ⎠ ⎛ 51 ⎞ ⎜ − 11 ⎟ ~ ⎟0.06 x = 1.595 + ⎜ 2 ⎜ 15 ⎟ ⎜ ⎟ ⎝ ⎠ ~ x = 1.65m 11. Obtención de la Moda Muestras pequeñas Es el dato con mayor frecuencia. Datos ordenados: 5, 5, 6, 6, 7, 8, 8, 8, 9, 9 xˆ = 8 Muestras grandes CLASE FRECUENCIA L.R.I A B C D E F G H 2 9 15 14 6 4 0 1 1.475 1.535 1.595 1.655 1.715 1.775 1.835 1.895 1.955 ∆ 1 = F modal – F anterior = 15–9 = 6 ∆ 2 = F modal – F siguiente = 15–14 = 1 51 Li = 1.595 m ∆1 = 6 ∆2 = 1 C = 0.06 m ⎛ ∆1 ⎞ ⎟⎟C xˆ = Linf + ⎜⎜ ⎝ ∆1 + ∆ 2 ⎠ ⎛ 6 ⎞ xˆ = 1.595 + ⎜ ⎟0.06 ⎝ 6 + 1⎠ xˆ = 1.65m