TEMA 2: ESTADÍSTICA DESCRIPTIVA: ORGANIZACIÓN Y PRESENTACIÓN DE DATOS DISTRIBUCIONES DE FRECUENCIA: TABLAS Y GRAFICOS Una distribución de frecuencias es una tabla de resumen en la que los datos se disponen en agrupamientos o categorías convenientemente establecidas de clases ordenadas numéricamente. Construcción de la tabla de distribución de frecuencias • Selección del número de clases (K) Criterio para definir el número: Fórmula ◊ K = "N ◊ K = 1 + 3.322 Log N Entre 5 y 20 intervalos • Obtención de los intervalos de clase Rango: (R) = (X max − X min) Iv = [X min; X max] Ancho intervalo (): R / K ◊ Igual para todos los Ii ◊ Diferente • Establecimiento de los límites de clase • Cifras significativas: El mismo número que poseen las observaciones (Redondear si es necesario) Una cifra significativa más que las que poseen las observaciones • Valor del límite inferior del primer Inter. y lim. superior del último LI1 = X min LSk = X max. [LI1 " xi " LSk] LI1 " X min LSk " X max. [LI1 " xi " LSk] [LIi " xi < LSi) • Clases abiertas para el primer y último intervalo Menos de LI1 Más de LSk−1 Marca de clase (mi o mc) 1 La marca de clase (mi) es el punto medio entre los limites de cada clase y es representativa de los datos de esa clase. mi = (LIi + LSi)/2 Frecuencias La frecuencia es el Nº de observaciones presentes en cada intervalo. fi = número de observaciones pertenecientes a un intervalo. fir = fir / n fir% = fir * 100 Fi = Número de observaciones menores que LSi Fir = Fi / n Fir% = Fir * 100 PRESENTACIÓN DE DATOS EN TABLAS Indicaremos los pasos a seguir en forma detallada para la organización y presentación de datos en una tabla de frecuencias tomando como base un ejemplo. Ejemplo: los datos que se brindan a continuación corresponden a 110 mediciones de altura (cm) de plantas de un cultivar de Soja en un determinado estado fenológico del ciclo 56.5 57.0 58.5 59.0 60.5 61.2 61.5 62.0 62.1 62.5 63.1 63.2 63.4 63.5 63.8 64.0 64.1 64.6 64.7 64.9 65.3 65.3 65.6 65.7 66.1 66.2 66.2 66.4 66.5 66.6 66.9 67.0 67.1 67.1 67.5 67.7 67.8 67.9 68.0 68.1 68.1 68.1 68.1 68.2 68.4 68.6 68.8 69.0 69.0 69.2 69.3 69.4 69.4 69.5 69.5 69.5 69.9 70.0 70.1 70.1 70.4 70.5 70.5 70.6 70.6 71.0 71.5 71.7 72.2 72.2 72.3 72.4 72.5 72.5 72.6 73.0 73.0 73.2 73.4 73.5 73.5 73.5 73.5 73.7 73.7 74.1 74.5 74.7 75.0 75.0 75.3 75.4 75.8 76.2 76.3 77.7 77.9 78.1 78.2 78.3 78.5 79.4 79.5 80.4 80.7 81.2 82.6 82.8 83.5 84.3 X = Altura de plantas de un cultivar de soja (cm.) Clasificación: V. Cuantitativa Continua. 1.− K = "n = "110 " 11 2.− R = (X max − X min) = (84.3 − 56.5) = 27.8 cm. () = R / K = 27.8 / 11 = 2.53 " 3 Tabla de frecuencias Marca Intervalos 56.5 − 59.5 Recuento //// Clase 58 fi fir Fir% Fi Fir Fir% 4 0.0367 3.67 4 0.0364 3.64 2 59.5 − 62.5 62.5 − 65.5 65.5 − 68.5 68.5 − 71.5 71.5 − 74.5 74.5 − 77.5 77.5 − 80.5 80.5 − 83.5 83.5 − 86.5 //// //// //// /// //// //// //// //// /// //// //// //// //// / //// //// //// //// //// //// //// //// //// // 61 64 67 70 73 76 79 82 85 5 13 23 21 20 9 9 4 2 0.0455 0.1182 0.2091 0.1910 0.1818 0.0818 0.0818 0.0367 0.0182 4.55 11.82 20.91 19.10 18.18 8.18 8.18 3.67 1.82 9 22 45 66 86 95 104 108 110 0.0818 0.2000 0.4091 0.6000 0.7818 0.8636 0.9455 0.9818 1 8.18 20.00 40.91 60.00 78.18 86.36 94.55 98.18 100 Fi = fi = n Fir = fir = 1 Fir% = fir% = 100 3 Organización de datos numéricos Discretos Los siguientes datos corresponden al número de plantas de la especie Setaria leiantha, por tramo de transecta. 21001011413221 120314 X = Número de plantas por transecta Clasificación: V. Cuantitativa Discreta. Tabla de frecuencias Nº de plantas 0 1 2 3 4 fi 4 8 4 2 2 fir 0.20 0.40 0.20 0.10 0.10 fir% 20 40 20 10 10 Fi 4 12 16 18 20 Fir 0.20 0.60 0.80 0.90 1 Fir% 20 60 80 90 100 4