Representaciones gráficas Otra forma de resumir y presentar datos y la mejor manera de visualizar la información que a ofrecen lo constituyen los gráficos. Existen distintos tipos de gráficos, pero aquí nos limitaremos al estudio de los más usuales variables de tipo cualitativo se recomienda utilizar los gráficos de barra, gráfico circular pictogramas. Gráfico circular o de pastel Se utiliza para representar datos categóricos. Es un gráfico que representa una sola característica y se utiliza cuando interesa resaltar los datos en porcentaje. Se caracterizan porque la totalidad del círculo representa el 100% de los datos y se divide en diferentes porciones, en la que cada una de estas representará un dato particular. No se recomienda cuando el número de partes es grande o hay partes muy pequeñas. Veamos cómo podemos proceder para hacer un gráfico circular. 1. Primero se dibuja un círculo de radio arbitrario, pero adecuado. 2. Se totaliza los datos que se van a representar. 3. Se divide el primer dato entre el total y el cociente se multiplica por 360 para determinar el número de grados que ocupará en el gráfico circular. 4. Se repite el paso 3 para cada uno de los otros datos. 5. Luego se utiliza un transportador y se marca, en el círculo, cada uno de los sectores. 6. Pintar cada sector con un color diferente y ponerle una etiqueta con la categoría correspondiente. 7. Finalmente se coloca, un título y una leyenda a la gráfica. Ejemplo 9 Una tienda de mascotas consulta a 40 personas de un suburbio de la localidad sobre sus preferencias. Su opinión fue la siguiente: gatos, 8; peces, 6; perros, 10; serpientes, 3; conejos, 9 y. aves, 4. Así, 8+6+ 10 +3+9+4 = 40. Se divide cada dato entre 40. 190,20 =0,15 0,25 0,08 +0,22 +0,10. 184 Elementos de Estadística Descriptiva Escaneado con CamScanner Luego, cada cociente se multiplica por 360 y se obtiene: 0,20x 360 = 72° 0,15x360 = 54° 0,25x360 = 90° 0.08x360 = 29° 0,22x360= 79° 0,10x360 = 36o. Esto indica que el sector para la categoría "gatos" tendrá un ángulo de 72°, el ángulo para el sector de la categoría “peces" es de 54°, para la categoria “perros" es de 90°, para "serpientes” es de 29°, para la categoría “conejos" es de 79o y para la categoría “aves" es de 36o. MASCOTAS PREFERIDAS EN UN SUBURBIO DE LA LOCALIDAD aves 10% gatos 20% conejos 22% peces 15% serpientes 8% perros 25% Fuente: Tienda de mascotas Gráfico 1 En el gráficol podemos apreciar efectivamente que el perro es la mascota preferida entre las personas consultadas pues el 25% de ellas así lo indicaron y las serpientes son las mascotas de menor interes pues solamente el 8% de estas personas mostró interés en tenerlas como mascotas. Ejemplo 10 Se realizó una consulta, entre las personas que asisten a un Centro de Salud para conocer el grado de aceptación que tienen sobre el servicio que reciben allí. Se solicitó a estas personas que califiquen el grado de aceptación como: insatisfecho (I), indiferente (In), satisfecho (S) y totalmente satisfecho (TS). La información se registra en el gráfico N° 2. Utilice esta información y conteste las siguientes preguntas. Si 150 personas dijeron que estaban totalmente satisfechas con el servicio recibido en el Centro de Salud: 785 Elementos de Estadística Descriptiva Escaneado con CamScanner a. cuántas personas fueron entrevistadas? b. ¿Cuántas de las personas entrevistadas estaban insatisfechas con la atención en el Center Salud? NIVEL DE ACEPTACIÓN DEL SERVICIO QUE RECIBEN EN UN CENTRO DE SALUD 10% 36% Totalmente Satisfecho 28% Satisfeccho Insatisfecho 26% Indiferente Fuente: Departamento de Estadística del Centro de Salud Gráfico 2 Gráfico de barras Está formado por un par de ejes perpendiculares, donde las diferentes categorías de las observaciones se presentan en el eje horizontal. En este tipo de gráfico, la altura de las hamna representa la frecuencia o frecuencia relativa de las observaciones que caen en una categoría Todas las barras deben estar separadas, con igual espacio entre una y otra y tener el mismo ancho; no deben ser muy cortas y anchas ni muy largas y angostas. Las barras pueden ser arregladas de manera vertical u horizontal. En general, las barras verticales son usadas para presentar datos clasificados cronológica o cuantitativamente mientras que las barras horizontales se prefieren para presentar datos clasificados geográfica o cualitativamente. Ejemplo 11 Considere los datos de la Tabla 4 y represéntelos en un gráfico de barras. 186 Elementos de Estadística Descriptiva Escaneado con CamScanner Tabla 4. SUPERFICIE SEMBRADA DI? MAIZ, ARNOZ, FRIJOLES Y CARE UN LA PROVINCIA DE COCLE: AÑOS 2005-2006 Superficie (hectareas) 2005 2006 43 55 Tipo de grang care maíz arroz frijolos 150 125 350 325 230 218 wstruimos el gráfico de barras con la información anterior donde se hace una comparacion 9% in superficies sembradas de café, maiz, arroz y frijoles durante los años 2005 y 2009, 9 " le este es un gráfico de barras con datos ordenados cronológicamente, SUPERFICIE DE LA PROVINCIA DE COCLÉ SEMBRADA DE MAÍZ, ARROZ,FRIJOLES Y CAFÉ: AÑOS 2005-2006 Superficie (hectáreas) Ano 2005 Año 2006 café arroz frijoles maíz Granos Fuente: Departamento de Estadística, Granos S. A, Gráfico 3 Pictograma Es un gráfico en el que se utilizan dibujos para representar la información, y el número de estos dibujos dentro de la gráfica queda determinado por la frecuencia correspondiente. Se procura que el tamaño de los dibujos sea uniforme, indicándose el valor que representan, En realidad son diagramas de barras en los que las barras se sustituyen con dibujos alusivos a la variable de interés, 187 Elementos de Estadistica Descriptiva Escaneado con CamScanner Ejemplo 12 La información de la tabla adjunta corresponde al número de quintales de maíz cosechados en la provincia de Chiriquí en los años 2000 al 2003. Año 2000 2001 2002 T 2003 Cantidad cosechada ada | 303 424 262 200 275 900 | 367 200 (en quintales) Esta información se representa en el siguiente pictograma. COSECHA DE MAIZ EN LA PROVINCIA DE CHIRIQUÍ:AÑOS 2000-2003 400000 350000 2 w Cosecha (quintales) 300000 250000 200000 150000 100000 50000 2000 2001 2002 2003 Año Fuente: Panamá en Cifras 2005. Contraloría General de la República de Panamá Clave: Cada saquito representa 111 000 quintales Gráfico 4 Ahora veremos los tipos de gráficos más apropiados para variables de tipo cuantitativo. En estos casos se recomienda el uso, entre otros, de histogramas y polígonos y para variables cronológicas se recomiendan los gráficos lineales. Histograma Este tipo de gráfico, se utiliza para representar distribuciones de frecuencias de datos agrupados. Se coloca en el eje vertical las frecuencias o las frecuencias relativas de las observaciones y en el eje horizontal los límites exactos de las distintas clases. 188 Elementos de Estadística Descriptira Escaneado con CamScanner Para construir un cero. Una vez sa sí, una por cada i esté en la marc nstruir un histograma primero se trazan los ei se trazan los ejes de modo que el eje vertical con a vez se trazan los ejes, se levantan barras verticales sobre el eje ho ir cada intervalo, cuya base sea igual a la correspondiente amplitud de la marca de clase. Si todas las clases tienen igual amplitud, se acostum ne coincida con la correspondiente frecuencia de la clase. modo que el eje vertical comience en sobre el eje horizontal, unidas entre ente amplitud de la clase y su centro acostumbra que la altura de las barras coinc La marca de clase es el punto medio de um intervalo o clase. La denotaremos P... e obtiene dividiendo entre dos la suma de los límites inferior y superior inferior y superior de la clase o Esta se obtiene intervalo. Si en una distril la altura de la b frecuencia de la c agrupados dond una distribución de frecuencias alguna de las clases tiene una amplitud diferente ra de la barra que representa a esta clase variará, de modo que su área sea prope ria de la clase. Nosotros supondrenios distribuciones de frecuencia dos donde todas las clases tienen igual amplitud. a amplitud diferente a las demás, ea sea proporcional a la frecuencia para datos Ejemplo 13 Supongamos la dish centímetros, de 2 ngamos la distribución de frecuencias del ejemplo 8, donde se considera la Carne de 28 estudiantes de un colegio secundario de la localidad y cons ejemplo 8, donde se considera la estatura, en de la localidad y construimos el siguiente histogrania . ESTATURA DE ESTUDIANTES DE UN COLEGIO SECUNDARIO DE LA LOCALIDAD Frecuencia 147 - 152 153 - 158 159 - 164 165 - 170 171 - 176 177 - 182 Estatura (cm) Fuente: Registros estadísticos del colegio Gráfico 5 Elementos de Estadística Descriptiva 189 Escaneado con CamScanner En esta gráfica se observa, por ejemplo, que 9 del total de estudiantes tienen estaturas entres cm y 158 cm y solamente 1 tiene una estatura entre 177 cm y 182 cm. Cuatro de los 28 estudiantes tienen estaturas inferiores a 153 cm. Es importante observar que algunas personas acostumbran colocar en el eje horizontal las marca de clase de cada intervalo en lugar de colocar los límites de los respectivos intervalos tal y com se presenta aquí. Gráfico de línea Este tipo de gráfico generalmente representa variables observadas durante un periodo. Lo común en ellos es que se coloque la variable tiempo en el eje horizontal y los valores de la variable sa coloquen en el eje vertical. Es una de las gráficas más utilizadas, pero también es la que más puede llevar a conclusiones erróneas si no se utiliza una escala adecuada al construir el gráfico. Ejemplo 14 Suponga la información registrada en la siguiente tabla para construir un gráfico de línea. Tabla 5. SACRIFICIO DE GANADO PORCINO EN LA REPÚBLICA DE PANAMÁ: AÑOS 2000-2004 Sacrificio de ganado porcino (en cabezas) 2000 2001 2002 2003 2004 | 305 169 | 307 938 | 306 820 | 310 477 | 311 000 Fuente: Datos ficticios SACRIFICIO DE GANADO PORCINO EN LA REPÚBLICA DE PANAMÁ: AÑOS 2000-2004 312000 311000 310000 309000 308000 307000 306000 305000 304000 1999 2000 2001 200 2 2003 200 4 200 5 Gráfico 6 190 Elementos de Estadística Descriptiva Escaneado con CamScanner polígonos de frecuencia Un polígono de free los puntos medios valor de la varia o de frecuencias es un gráfico de línea que se traza uniendo, m nedios o marcas de clase de cada intervalo. La frecuencia o frecu a variable de interes se representa con un punto en el plano cartesia fico se acostumbra prolongar el polígono, sobre el de los intervalos inmediatamente anterior y posterior a los intervalos a Al trazar el gráfico se acosti medios de los frecuencia, raza uniendo, mediante líneas rectas, La frecuencia o frecuencia relativa de cada punto en el plano cartesiano. "gono, sobre el eje horizontal, hasta los puntos los intervalos de la distribución de Ejemplo 15 mos la marca de clase de cada intervalo del ejemplo 8. y procedemos Calculamos la m polígono de frecuencia 08, y procedemos a construir un Estatura (centímetros) 147-152 153-158 159-164 165-170 Marca de clase 149,5 155,5 161,5 167,5 173,5 179,5 171-176 177-182 Total ESTATURA DE ESTUDIANTES DE UN COLEGIO SECUNDARIO DE LA LOCALIDAD Frecuencia 143,5 149,5 173,5 179,5 185,5 155,5 161,5 167,5 Estatura (cm) Fuente: Registros estadísticos del colegio Gráfico 7 Elementos de Estadística Descriptiva 191 Escaneado con CamScanner Observe que el gráfico se prolongó a las marcas de clase 143,5 y 185,5 (correspondientes a la clases 141-146 y 183-188) para que el polígono cierre sobre el eje horizontal. El polígono de frecuencias puede obtenerse también, uniendo, con líneas rectas, los puntos medias de la parte superior de las barras del histograma como se muestra en el siguiente gráfico, ESTATURA DE ESTUDIANTES DE UN COLEGIO SECUNDARIO DE LA LOCALIDAD Frecuencia 143,5 149,5 155,5 161,5 179,5 185,5 167,5 173,5 Estatura (cm) Fuente: Registros estadísticos del colegio Gráfico 8 Evaluación del Aprendizaje 1. Construya un gráfico de pastel con la información sobre la utilización de la cosecha de caña de azúcar en la República de Panamá en el año 2000. Utilización de la cosecha Cosecha (toneladas cortas) Venta a ingenios y alambiques 1 423 972 Para la molienda (jugo, miel, panela) 111 109 Para alimento de animales 30 572 Para semilla 17021 Total 1 582 674 192 Elementos de Estadística Descriptiva Escaneado con CamScanner i de Los siguientes datos Tejeuchtune el número de vnicummolones realizadas, seguir Vacuna, en las instalaciones de salud de la República de Panamá en los al República de Panamá en los años 2003 y 2004. Tipo do vacuna Vacunaciones 2003 2004 Autuberculosa 65 741 66835 Anti-dlerin,tetono, cosferina, pontapulente 209 724 1258 442 Antipoliomiellus 379 165 1 385 625 Althetetano del recién oncido 364 182 427 343 Anti-rempionosa 62 353 61 997 Anti-liebre amarilla 23 543 42 453 Construya un grutico de barras que represcuto esta información. 3. Los datos que presentamos a continuación representa al número de defunciones por el Virus de la Inmunodeficiencia Humana (VIII) en la ciudad de Panamá en el año 2004. 55-64 65-74 | 75-84 Edad (on años) Número de defuncioncs 15-24 | 25-34 3 2 9 35-44 45-54 45 22 15 8 . 2 Represente esta información en un histograma. Trace también un polígono de frecuencias. Medidas de Tendencia Central Las medidas de tendencia central son medidas numéricas de resumen que permiten describir una serie de datos mediante un único valor. Como en un conjunto de datos ordenados, generalmente se identifica una clara tendencia de estos a situarse alrededor de un valor central del conjunto se considera que este valor es representativo del conjunto de datos y se le conoce como promedio o medida de tendencia central. En este apartado estudiaremos las medidas de tendencia central más usuales: la media aritmética, la mediana y la moda. Elementos de Estadística Descriptiva 193 Escaneado con CamScanner