ORGANIZACIÓN Y DISTRIBUCIÓN DE FRECUENCIAS UNIVERSIDAD MARIANO GALVEZ DE GUATEMALA Estadística I Ingenieria en Sistemas de Información ORGANIZACIÓN DE DATOS el dato la materia prima de la estadística, el primer paso es la recolección de datos, para lo cual se emplean diferentes técnicas, como la entrevista personal, el cuestionario, la observación, la toma de muestras, entre otras. El segundo paso es la organización y ordenamiento de los datos, lo que se hace a través de tablas, las cuales pueden ser por medio de una distribución de frecuencias simples o una distribución de frecuencias con intervalos, en ambos casos agrupando todos aquellos que corresponden a una mismo dato nominal o variable y expresando en una columna el número de veces que aparece esa variable. Siendo DISTRIBUCIÓN DE FRECUENCIAS Distribuciones o Tabla de Frecuencias • Es un formato que se usa para organizar y resumir datos. Clasificación. Cronológica o histórica. El número de casos de malaria en Guatemala por año. AÑO 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 CASOS 45,000 39,000 31,000 22,000 31,500 7,500 18,500 30,000 31,000 25,500 Cualitativa Referida a algún atributo o cualidad de los elementos que se va a analizar. Ejemplo: mujeres que laboran maquiladora según su estado civil. Estado Civil Solteras No. de mujeres 54 Casadas Divorciadas Viudas 63 32 12 en una GEOGRAFICA Esta toma en cuenta a los países, Departamentos, municipios, otros. Ejemplo: Tasa de Analfabetismo de la población de 15 años y mas ambos sexos PAIS 1995 2000 2005 2012 Costa Rica 5.2 4.4 3.8 2.4 El Salvador 24.1 21.3 18.9 11.7 Guatemala 35.1 31.5 28.2 16.15 Honduras 28.3 25 22 16 Nicaragua 35.4 33.5 31.9 30 Panamá 9.4 8.1 7 5.5 Fuente: UNESCO. Cuantitativa Esta toma como base de agrupación una variable numérica dividida en intervalos de amplitud constante o variable. Ejemplo: Los salarios semanales de 80 empleados de un supermercado. Salarios 1,200 – 1,249 1,250 – 1,299 1,300 – 1,349 1,350 – 1,399 1,400 – 1,499 1,450 – 1,499 No. de Empleados 8 16 26 22 5 3 Presentación de información en cuadros TABLAS DE FRECUENCIA Distribución de Frecuencias • La tabla de frecuencias tiene como objeto presentar en forma ordenada los valores o datos que toman las diferentes características obtenidas en una investigación. Los datos se clasifican y ordenan de acuerdo a las características cualitativas o cuantitativas, indicando el número de veces (frecuencia) que se repite el atributo o variable. Esta puede ser simple o por intervalos Frecuencias • Es el número de datos o elementos de la muestra, que caen en un mismo intervalo de clase. Es decir, que sus valores quedan totalmente comprendidos dentro de los linderos de ese mismo intervalo. Tipos de Frecuencias • Absoluta: La frecuencia absoluta de una variable estadística es el número de veces que aparece en la muestra dicho valor de la variable, la representaremos por ni • Relativa: que es el cociente entre la frecuencia absoluta y el tamaño de la muestra. La denotaremos por fi fi = ni/N Donde N = Tamaño de la muestra • Frecuencia Absoluta Acumulada : Es la suma de los distintos valores de la frecuencia absoluta tomando como referencia un individuo dado. La última frecuencia absoluta acumulada es igual al número de casos. Se denota por Ni • Frecuencia Relativa Acumulada : Es el resultado de dividir cada frecuencia absoluta acumulada por el número total de datos. Se denota por Fi Interpretación Tabla de Frecuencias Peso (kg) FREC. ABSOLUTA FREC. ABSOLUTA ACUMULADA 1.2 1.4 1.6 3.6 5.2 6.2 6.6 6.8 7.2 TOTAL 1 2 3 8 14 18 19 22 13 100 1 3 6 14 28 46 65 87 100 FREC. RELATIVA % 1 2 3 8 14 18 19 22 13 FREC. RELATIVA ACUMULADA % 1 3 6 14 28 46 65 87 100 Interpretación Tabla de Frecuencias Tiempo de espera en minutos de 36 personas para adquirir un dispositivo móvil Tablas de Frecuencia Datos Cuantitativos 1. Distribución de frecuencias simples Ejemplo: organizar en una distribución de frecuencias simples, los punteos obtenidos en un examen de estadística por 30 alumnos Listamos todos los números en forma ascendente de menor a mayor. Distribución de frecuencias simples Punteos obtenidos en un examen de Estadística por treinta alumnos Punteos 45 48 50 53 55 57 58 60 65 68 72 75 76 78 79 80 82 88 f 1 1 1 2 1 2 3 4 1 1 1 1 2 2 1 2 3 1 ∑ f = 30 Distribución de frecuencias acumuladas Ejemplo: En la distribución de los punteos obtenidos en un examen de Estadística por treinta alumnos, tendremos la siguiente distribución de frecuencias acumuladas. Punteos 45 48 50 53 55 57 58 60 65 68 72 75 76 78 79 80 82 88 f 1 1 1 2 1 2 3 4 1 1 1 1 2 2 1 2 3 1 ∑ f = 30 fa 1 2 3 5 6 8 11 15 16 17 18 19 21 23 24 26 29 30 Distribución de frecuencias de valores agrupados en intervalos de amplitud constante Son utilizados cuando los datos estadísticos de que se disponen son numerosos (mayor de 30 datos) Ejemplo: Con los resultados obtenidos de un examen de estadística de 45 alumnos del nivel medio; haremos una distribución de frecuencias de valores agrupados en intervalos de amplitud constante. Distribución de frecuencias de valores agrupados en intervalos de amplitud variable Algunas veces los datos que se obtienen de una variable cuantitativa no se pueden clasificar en grupos que posean igual intervalo, por lo que debemos aplicar la AGRUPACIÓN CON INTERVALO VARIABLE, la cual como su nombre lo indica, es la clasificación de la información en grupos con distintos intervalos o amplitud. Para hacer los grupos seguimos los pasos de la distribución de frecuencias de valores agrupados en intervalos de amplitud constante, pero eliminando los intervalos en donde no se encuentren valores, por lo que algunos grupos tendran diferente amplitud Distribución de frecuencias de valores agrupados en intervalos de amplitud variable Ejemplo: Con los precios de 25 artículos vendidos este día por una aceitera, hacer una distribución de frecuencias. Datos: 17.00 14.00 16.00 17.50 31.00 16.00 18.00 31.00 32.50 8.25 19.00 18.00 4.10 4.60 17.00 34.00 7.00 10.00 17.50 32.50 31.00 33.00 34.00 32.10 32.45 Distribución de frecuencias de valores agrupados en intervalos de amplitud variable Procedimiento: 1º. Obtenemos la amplitud = 34 – 4.10/6 = 4.98 2º. Hacemos la distribución con una amplitud de 5 intervalo conteo f 1– 5 // 2 6 – 10 /// 3 11 – 15 / 1 16 – 20 ///// //// 9 21 – 25 - 0 26 – 30 - 0 31 – 35 ///// ///// 10 Distribución de frecuencias de valores agrupados en intervalos de amplitud variable 3º. Eliminaremos los grupos con cero frecuencia, porque en una agrupación no es conveniente a que aparezcan grupos sin algún dato intervalo f 1– 5 2 6 – 10 3 11 – 15 1 16 – 25 9 26 – 35 10 ∑ f = 25 REPRESENTACION GRÁFICA Es la manera de expresar los datos estadísticos. Esta es importante porque nos permite asimilar las principales características de las series estadísticas. Por lo que el fin de una gráfica será el de mostrar por medio de puntos, segmentos, curvas, superficies, volúmenes, etc. las variaciones que acusan los fenómenos que pueden medirse o contarse. En general las gráficas ponen de relieve las variaciones de la serie estadística, favorecer las consultas y permitir las comparaciones. UTILIDAD DE LAS GRAFICAS Síntesis: se puede percibir de una ojeada por principales características de una serie de números. Destacan características: hacen resaltar los hechos esenciales, demarcan las tendencias, muestran los hechos accidentales, establecen las órdenes de importancia, precisan los máximos y los mínimos. Control: permiten ver a simple vista las anomalías que pueden tener las informaciones. Comparación: las graficas permiten hacer confrontaciones de dos o más series. Hay que tener en cuenta que las gráficas no sustituyen a los cuadros, ya que ambos deben complementarse en una publicación. las desventajas de las gráficas podemos mencionar: •Pérdida de detalle de la información •Pueden tener errores involuntarios de construcción Entre REGLAS DE CONSTRUCCION 1. Título general 2. Elementos de referencia con expresión de la variable representada sobre cada uno. 3. Fuente de procedencia de los datos representados El eje que representará la frecuencia debe empezar de cero. 4. La parte más alta de la gráfica debe ser aproximadamente tres cuartos de su ancho total. 5.Todas las barras deben tener el mismo ancho. DIAGRAMA DE BARRAS SIMPLES • Son representaciones gráficas que están formadas por barras horizontales o verticales del mismo ancho (rectángulo de igual base) y cuya longitud guarda proporción con la magnitud de la variable presentada. • Para construir el diagrama, la anchura de las barras no tienen significación y pueden elegirse el tamaño que se desee, de acuerdo con el número de datos a presentar, teniendo cuidado de que las barras no se solapen. DIAGRAMA DE BARRAS SIMPLES Densidad Densidad 296 128 109 119 74 70 57 29 38 38 300 250 200 150 100 Densidad 50 0 PAISES Densidad PAISES Países El salvador China Francia Guatemala Costa Rica Egipto Honduras USA Panamá Nicaragua HABITANTES 350 Nicaragua Panamá USA Honduras Egipto Costa Rica Guatemala Francia China El salvador Densidad 0 50 100 150 200 HABITANTES 250 300 350 DIAGRAMA DE BARRAS COMPUESTAS 100 90 80 70 60 50 40 30 20 10 0 % Mujeres % Hombres Camotán MUNICIPIOS MUNICIPIOS PORCENTAJES Población de los municipios de Quezaltepeque, San Jacinto, Olopa, Jocotan y Camotán, pero además, clasificada por sexo; las categorías, hombres y mujeres, son los componentes de cada una de las barras. Olopa % Hombres San Jacinto % Mujeres Quezaltepeque 0 20 40 60 80 PORCENTAJES 100 120 DIAGRAMA DE BARRAS COMPARATIVAS Compara cada una de las categorías de la característica principal, los componentes de otra característica secundaria; no permite hacer comparaciones entre los totales de la característica principal. Gráfico: presenta la población de 12 años, para el período del 2010 al 2015, clasificada por región de residencia. 70 60 POBLACION 50 40 % HOMBRES 30 % MUJERES 20 10 0 QUEZALTEPEQUE SAN JACINTO OLOLA MUNICIPIOS JOCOTAN CAMOTAN HISTOGRAMA Es una forma de representación gráfica de las frecuencias de clase. Consiste en representar las frecuencias por medio de las áreas de los rectángulos (barras). Estos son diferentes a los diagramas de barras, porque en un diagrama de barras las alturas de éstas miden el tamaño de la variable y normalmente se dibujan separadas. En un histograma las frecuencias quedan representadas por el área de los rectángulos, no por sus alturas y las barras se dibujan sin dejar espacios entre ellas. En su elaboración los intervalos de clase están marcados sobre el eje horizontal, utilizando para el efecto los límites reales y las frecuencias en el eje vertical. Se construye por medio de rectángulos unidos cuyos anchos son los de los intervalos de clase que ellos representan y cuyas alturas equivalen a las frecuencias. Con la tabla de punteos obtenidos por 50 alumnos en un examen de estadística, haremos el histograma INTERVALO LIMITES REALES f 10 – 24 1 25 – 39 2 40 – 54 6 55 – 69 10 70 – 84 18 85 – 99 13 Con la tabla de punteos obtenidos por 50 alumnos en un examen de estadística, haremos el histograma Formas de los histogramas Formas de los histogramas POLIGONO DE FRECUENCIAS Se utiliza, al igual que el histograma, para representar distribuciones de frecuencias de variables cuantitativas continuas, pero como no se utilizan barras en su confección sino segmentos de recta, de ahí el nombre de polígono. Habitualmente se usa cuando se quiere mostrar en el mismo gráfico más de una distribución o una clasificación cruzada de una variable cuantitativa continua con una cualitativa o cuantitativa discreta, ya que por la forma de construcción del histograma sólo se puede representar una distribución. POLIGONO DE FRECUENCIA SIMPLE Para su construcción se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediante segmentos. Ejemplo Las temperaturas en un día de invierno en la ciudad de Guatemala han sufrido las siguientes Variaciones: Poligono de Frecuencia Datos Agrupados Polígono de frecuencias Velocidad en Km/h de 35 automóviles 16 14 velocidad f 60 – 69 5 70 – 79 6 80 – 89 14 90 – 99 8 100 – 109 1 6 110 – 119 1 4 12 Vehículos 10 8 Ряд1 2 0 59,5 69,5 79,5 89,5 99,5 Velocidad 109,5 119,5 129,5 Polígonos de frecuencia para datos agrupados Es un gráfico de líneas trazado sobre las marcas de clase. Ejemplo El peso en libras de 65 personas adultas viene dado por la siguiente tabla: Ejemplo: con la tabla de frecuencias de las velocidades en Km/h de varios automóviles, haremos el polígono de frecuencia acumulada 40 Velocidad f fa 35 60 – 69 5 5 30 70 – 79 6 11 25 80 – 89 14 25 20 90 – 99 8 33 100 – 109 1 34 110 – 119 1 35 Ряд1 15 10 5 0 69,5 79,5 89,5 99,5 109,5 119,5 DIAGRAMA DE SECTORES Esta gráfica se utiliza para representar variables cualitativas y sirve para hacer notar las diferencias de las proporciones o porcentajes en que está dada la distribución. La comparación es efectiva, siempre que los segmentos sean suficientemente grandes para permitir comparaciones. Líneas Telefónicas 23,61% 41,11% Zacapa 35,28% Chiquimula Jutiapa EXAMEN CORTO #1 Materiales y Equipo a utilizar: 1. Hoja de laboratorio 2. Lápiz o Lapicero 3. Calculadora 4. Computadora