Estadística Laboral - RRLL Unidad 2 Distribuciones Univariadas: Tablas y Gráficos Estadística Laboral - RRLL Conceptos a tener en cuenta VARIABLE: propiedad, atributo o característica de una unidad de análisis, susceptible de adoptar diferentes valores o categorías Los valores o categorías que adopta una variable constituyen un SISTEMA DE CATEGORIAS. MUTUAMENTE EXCLUYENTES y el sistema debe ser EXHAUSTIVO para la población en estudio MATRIZ DE DATOS: contiene en sus filas a cada una de las unidades, en sus columnas a las variables que caracterizan a esas unidades DATO: valor que toma una variable en una unidad de análisis Matriz de Datos Ingresos del Número de miembros que hogar trabajan Hogar 1 $2000 2 Hogar 2 $70000 4 Hogar 3 $ 4500 0 …. Uso de Tablas y Gráficos Los usamos para facilitar la lectura de la matriz de datos, para eso, la reducimos. En la clase de hoy, trabajaremos con UNA sola VARIABLE. Más adelante aprenderemos a trabajar con dos variables al mismo tiempo. Existen métodos de análisis multivariados (múltiples variables) pero no los veremos en el curso Distribuciones Univariadas Elegimos la VARIABLE a estudiar. Realizamos la distribución de frecuencias, que en nuestro caso será una DISTRIBUCION UNIVARIADA DE FRECUENCIAS La presentamos en una TABLA Podemos establecer además un recorrido o rango de la variable Precisiones conceptuales DISTRIBUCION DE FRECUENCIAS: es una forma de organizar y resumir un conjunto de datos agrupados en categorías, en las cuales se muestra el número de observaciones que contiene cada categoría DISTRIBUCION FRECUENCIAS: UNIVARIADA sirve para información de una sola variable resumir DE la Precisiones conceptuales TABLA es una presentación ordenada de los distintos valores de una variable en base a los datos originales. Una forma de presentar la distribución univariada de frecuencias RECORRIDO o RANGO de la variable es la distancia entre el valor más alto y el más bajo Datos Cuando el tamaño de la población o muestra y el recorrido de la variable son pequeños, no hay que hacer nada especial, simplemente anotarlas de manera ordenada en filas o columnas. Cuando el tamaño de la población y/o muestra es grande, usamos tablas Tablas tipo II: Tablas de distribución de frecuencias simples Cuando el tamaño de la población y/o muestra es grande y el recorrido de la variable es pequeño, hay valores de la variable que se repiten Tablas tipo II: Tablas de distribución de frecuencias simples Número de integrantes del hogar 2 1 2 2 1 2 4 2 1 1 2 3 2 1 1 1 3 4 2 2 2 2 1 2 1 1 1 3 2 2 3 2 3 1 2 4 2 1 4 1 1 3 4 3 2 2 2 1 3 3 Guía de Clase Pág.4 Tablas tipo II: Tablas de distribución de frecuencias simples Distribución de frecuencias simples de integrantes del hogar Integrantes del hogar Número de hogares 1 2 3 4 Total 16 20 9 5 50 Tablas tipo II: Tablas de distribución de frecuencias simples FRECUENCIA SIMPLE ABSOLUTA veces que se repite el mismo valor (categoría) de la variable. Variables como SEXO o ESTADO CIVIL que normalmente toman pocos valores lo usual es resumirlas en tablas de frecuencias simples Tablas tipo II: Tablas de distribución de frecuencias simples Integrantes del hogar Categorías o valores de la variable 1 2 3 4 Total Número de hogares 16 20 9 5 50 Retomando este ejemplo, identifique Frecuencia/s Simple/s Absoluta/s Frecuencias Simples Absolutas para cada valor de la variable Ayuda: veces que se repite el mismo valor (categoría) de la variable Tablas tipo III: tablas de frecuencias con datos agrupados en clases Cuando el tamaño de la población y/o muestra y el recorrido de la variable son grandes, será necesario agrupar en intervalos los valores de la variable. Tablas tipo III: tablas de frecuencias con datos agrupados en clases Ejemplo en Guía de Clases. Pág. 5 Tomamos un grupo de 30 alumnos les preguntamos el dinero que en ese momento llevan encima, nos encontramos con los siguientes datos: 450 115 250 300 17 0 5 18 200 675 50 37 78 159 230 500 120 100 18 125 31 42 56 110 25 268 60 15 20 985 Tablas tipo III: tablas de frecuencias con datos agrupados en clases ¿Cuál es el recorrido de la variable? la variable tiene un recorrido muy grande recorrido: 985-0= 985 Tablas tipo III: tablas de frecuencias con datos agrupados en clases si queremos hacer una tabla con estos datos tendremos que tomar clases que agrupen los valores. A estas clases le debemos definir un «recorrido». Para decidir el recorrido de las clases, necesitaremos decidir …. ¿cuántas clases queremos?. se suele trabajar con no más de 10 o 12 clases Tablas tipo III: tablas de frecuencias con datos agrupados en clases Modalidades de construcción de Clases limites superior e inferior “reales” de la distribución de datos 0 – 99; el segundo 100 a 199; el tercero 200 a 299, y así sucesivamente.. toman los denominados límites “teóricos” 0 a 100; el segundo de 100 a 200, el tercero, de 200 a 300 y, así sucesivamente si bien la primer clase se define como (0 a 100) no incluye el 100; esta cifra esta incluida en la segunda clase Veremos ejemplos… Tablas tipo III: tablas de frecuencias con datos agrupados en clases ¿cuántas clases queremos?. Tomaremos 10 clases. Veremos cómo construimos la tabla definiendo qué límites superior e inferior tomamos Li= límite inferior Ls: Límite Superior Tablas tipo III: tablas de frecuencias con datos agrupados en clases Ejemplo de tabla construida en base a límites reales: Dividimos el recorrido entre 10 (985/10)= 98,5. Por mayor comodidad tomamos 99 Primer clase: Límite inferior de la primer clase (L i = 0). Primer valor de la variable ordenada Límite superior de la primer clase (L s =99) Tablas tipo III: tablas de frecuencias con datos agrupados en clases Clases 0 Exhaustivo y mutuamente excluyente Frecuencia simple absoluta (fi) - 99 15 100 - 199 6 200 - 299 4 300 - 399 1 400 - 499 1 500 - 599 1 600 - 699 1 700 - 799 0 800 - 899 0 900 - 999 1 fi= frecuencias absolutas simples Veces que se repite el mismo valor (categoría) de la variable Tablas tipo III: tablas de frecuencias con datos agrupados en clases Ejemplo de tabla construida en base a límites teóricos: Primer clase: Límite inferior de la primer clase (L i = 0). Primer valor de la variable ordenada Límite superior de la primer clase (L s =100). Tablas tipo III: tablas de frecuencias con datos agrupados en clases LIMITES TEÓRICOS Se toman sumando al límite superior y restando al límite inferior “0,5” unidades. ( Li – 0,5) (Ls + 0,5). Esto significa que el primer intervalo tiene un recorrido de -0,5 a 99,5; el segundo de 99,5 a 199,5. Es decir, el límite inferior es 0.5 unidades menor que el límite inferior, y el límite superior es 0.5 unidades mayor que el límite superior indicado. Pero NO se toman decimales, sino cifras redondeadas Tablas tipo III: tablas de frecuencias con datos agrupados en clases Primer clase: Límite inferior de la primer clase (L i = 0). Primer valor de la variable ordenada Límite superior de la primer clase (L s =100). Tablas tipo III: tablas de frecuencias con datos agrupados en clases Hasta 99 Incluye 100 ¿Si un alumno tiene 100 pesos, en qué clase lo voy a incluir? [ Li-1 , Li ) fi [ 0 – 100 ) 15 [ 100 - 200) 6 [ 200 - 300) 4 [ 300 – 400) 1 [ 400 - 500) 1 [ 500 - 600) 1 [ 600 - 700) 1 [ 700 - 800) 0 [ 800 - 900) 0 [ 900 - 1000) 1 Tablas tipo III: tablas de frecuencias con datos agrupados en clases AMPLITUD DE CLASE Diferencia entre dos límites sucesivos inferiores teóricos de las clases 100-0= 100 200-100= 100 Tablas tipo III: tablas de frecuencias con datos agrupados en clases Agrupar la información en intervalos permite «resumir» la información contenida en una matriz de datos pero también implica una «pérdida de información» . Tomar pocas clases implica que la "pérdida de información" sea mayor. Para solucionar este problema es decir, que no dispongamos de los valores originales para reconstruir la verdadera distribución de los datos – se suele asumir el supuesto que todos los valores de la clase «tienden» a coincidir con el «valor medio» de la misma, también llamada MARCA DE CLASE (Xc) Es un valor medio que se calcula sumando los límites inferior y superior TEORICOS y dividiendo el resultado entre dos. MARCA DE CLASE (Xc) Se calcula sumando los límites inferior y superior TEORICOS y dividiendo el resultado entre dos. Tablas tipo III: tablas de frecuencias con datos agrupados en clases CLASES [ Li-1 , Li ) MARCA DE CLASE Xc FRECUENCIA ABSOLUTA fi AMPLITUD Ai [ 0 – 100 ) 50 15 100 [ 100 - 200) 150 6 100 [ 200 - 300) 250 4 100 [ 300 – 400) 350 1 100 [ 400 - 500) 450 1 100 [ 500 - 600) 550 1 100 [ 600 - 700) 650 1 100 [ 700 - 800) 750 0 100 [ 800 - 900) 850 0 100 [ 900 - 1000) 950 1 100 30 Tipos de frecuencia Absolutas – Relativas relativas porcentuales simples / acumuladas Tipos de frecuencia Se llama frecuencia absoluta (simple) (fi) de un valor de la variable al número de veces que se presenta dicho valor. La representaremos por fi. En el ejemplo anterior el valor «tener en el bolsillo entre 900 y 1000 pesos» obtuvo en la medición una frecuencia absoluta de 1. La suma de todas las frecuencias absolutas es igual al total de la población. Frecuencia absoluta (fi) CLASES [ Li-1 , Li ) MARCA DE CLASE Xc FRECUENCIA ABSOLUTA fi AMPLITUD Ai [ 0 – 100 ) 50 15 100 [ 100 - 200) 150 6 100 [ 200 - 300) 250 4 100 [ 300 – 400) 350 1 100 [ 400 - 500) 450 1 100 [ 500 - 600) 550 1 100 [ 600 - 700) 650 1 100 [ 700 - 800) 750 0 100 [ 800 - 900) 850 0 100 [ 900 - 1000) 950 1 100 30 Frecuencia relativa simple (fr) Se llama frecuencia relativa (simple) (fr) de un valor a la frecuencia absoluta dividida por el número total de individuos que conforman la población o muestra (N). Es por tanto, una proporción. La representaremos por fr . En el ejemplo anterior la frecuencia relativa de esta clase o intervalo [ 900 - 1000) es 1/30 = 0,033. La suma de todas las frecuencias relativas es igual a la unidad (1). Frecuencia relativa simple [ Li-1 , Li ) [ 0 – 100 ) fi fr 15 0,50 [ 100 - 200) 6 0,20 [ 200 - 300) 4 0,13 [ 300 – 400) 1 0,03 [ 400 - 500) 1 0,03 [ 500 - 600) 1 0,03 [ 600 - 700) 1 0,03 [ 700 - 800) 0 0,00 dividido el número total de individuos que conforman la población o muestra= 30 [ 800 - 900) 0 0,00 1/30= 0,033 [ 900 - 1000) 1 0,03 30 1,00 N Valor de la frecuencia absoluta= 1 Frecuencia absoluta acumulada Se llama frecuencia absoluta acumulada (Fi) al número de veces que se presenta un valor y todos los anteriores a él. En el caso del ejemplo anterior el intervalo [ 0 – 100 ) acumula 15 casos; el intervalo [ 100 - 200) acumula 21 casos (6 que corresponden a este intervalo + 15 casos que se le agregan por corresponder al intervalo anterior. Las frecuencias absolutas acumuladas llegan a acumular N en el último valor o clase considerada. Frecuencia absoluta acumulada [ Li-1 , Li ) fi fr Fi 15 0,5 0 15 15 + 6 [ 100 - 200) 6 0,2 0 21 = 21 [ 200 - 300) 4 0,1 3 25 [ 0 – 100 ) 21 + 4 = 25 [ 300 – 400) 1 0,0 3 26 [ 400 - 500) 1 0,0 3 27 [ 500 - 600) 1 0,0 3 28 [ 600 - 700) 1 0,0 3 29 Frecuencia relativa acumulada (Fr) Se llama frecuencia relativa acumulada (Fr) a la frecuencia absoluta acumulada dividida por el número total de observaciones. La representaremos por FR Las frecuencias relativas acumuladas llegan a acumular 1 en el último valor o clase considerada Frecuencia relativa acumulada (Fr) [ Li-1 , Li ) [ 0 – 100 ) fi Fr Fi Fr 15 0,50 15 0,5 15/30= 0,5 [ 100 - 200) 6 0,20 21 0,70 21/30= 0,7 [ 200 - 300) 4 0,13 25 0,83 25/30= 0,83 [ 300 – 400) 1 0,03 26 0,87 [ 400 - 500) 1 0,03 27 0,90 [ 500 - 600) 1 0,03 28 0,93 [ 600 - 700) 1 0,03 29 0,97 [ 700 - 800) 0 0,00 29 0,97 [ 800 - 900) 0 0,00 29 0,97 [ 900 - 1000) 1 0,03 30 30 1,00 1,00 30/30=1 N Frecuencia porcentual (%) Se llama frecuencia porcentual (%) al tanto por ciento de las veces que se ha obtenido un determinado resultado. Se obtiene multiplicando por 100 la frecuencia relativa y se representa por n%. Se puede calcular la frecuencia porcentual tanto para frecuencias simples como para frecuencias acumuladas. (% acumulado) Frecuencia porcentual (%) [ Li-1 , Li ) [ 0 – 100 ) fi fr % Fi Fr 15 0,50 50 15 0,5 [ 100 200) 6 0,20 20 21 0,70 [ 200 300) 4 [ 300 – 400) 1 [ 400 500) 1 0,03 3 27 0,90 [ 500 600) 1 0,03 3 28 0,93 [ 600 700) 1 0,03 3 29 0,97 [ 700 800) 0 0,00 0 29 0,97 0,5 x 100= 50 fr 0,13 13 25 % 0,83 0,20 x 100= 20 0,03 3 26 0,87 0,13 x 100= 13 Frecuencia porcentual (%) acumulados [ Li-1 , Li ) fi [ 0 – 100 ) 15 0,50 50 15 0,5 50 [ 100 - 200) 6 0,20 20 21 0,70 70 [ 200 - 300) 4 0,13 13 25 0,83 83 [ 300 – 400) 1 0,03 3 26 0,87 87 [ 400 - 500) 1 0,03 3 27 0,90 90 [ 500 - 600) 1 0,03 3 28 0,93 93 [ 600 - 700) 1 0,03 3 29 0,97 97 [ 700 - 800) 0 0,00 0 29 0,97 97 [ 800 - 900) 0 0,00 0 29 0,97 97 [ 900 - 1000) 1 0,03 3 30 1,00 100 30 fr % Fi 1,00 100 Fr % acumulado Fr 0,5 x 100= 50 0,70 x 100= 70 Una tabla de distribución de frecuencias es una forma de presentar los datos sobre una característica de la población en estudio; por tanto debe contener la información necesaria para que el lector pueda analizarla. Esto implica que debe tener explícitamente: Título, en el cual se describe qué variable se está presentando, qué tipo de tabla es (frecuencia simple, acumulada, porcentual, etc.) y cuál es la población que se está caracterizando (Por ejemplo: “Trabajadores ocupados de Montevideo, año 2007”; “Personal administrativo de la empresa XXX, año 2006”) Fuente de donde proviene la información: cuál es el origen de la matriz de datos que se está resumiendo. (Por ejemplo: “Encuesta Continua de Hogares, INE”; “Encuesta a la empresa XXX, realizada por el autor del informe”) Las columnas deben estar encabezadas por el tipo de frecuencia que contienen. Ejemplo I Variable Escolaridad con valores 0, 1, 2 ó 3 en una base de datos que contiene 200 datos Xi fi 0 = bachillerato, 50 1 = licenciatura sin título; 160 2 = licenciatura con 100 título 3 = postgrado 90 400 Ejemplo I Considere el ejemplo de la variable Escolaridad con valores 0, 1, 2 ó 3 en una base de datos que contiene 200 datos 0 = bachillerato, 1 = licenciatura sin título 2 = licenciatura con título 3 = postgrado Ejemplo II Xi fi 0 = viudo, 10 1 = casado 150 2 =soltero 250 3 = divorciado 90 Variable Estado Civil con valores 0, 1, 2 ó 3 en una base de datos que contiene 200 datos 0 = viudo 1 = casado 2 = soltero 500 3 = divorciado Ejemplo I y II Trabajo en grupos: ¿Cuál es la información relevante? ¿por qué? ¿Corresponde acumular? ¿Por qué? Ejemplo I - Solución Xi fi fr f% Fi Fr F% 0 = bachillerato, 50 0,13 13 50 0,13 13 1 = licenciatura sin título; 160 0,4 40 210 0,53 53 2 = licenciatura con título 100 0,25 25 310 0,78 78 3 = postgrado 90 0,22 22 400 1,00 100 400 1 100 Ejemplo II - Solución Xi fi fr f% 0 = viudo, 10 0,02 2 1 = casado 150 0,3 30 2 =soltero 250 0,5 50 3 = divorciado 90 0,18 18 500 1 100 Ejemplo III Salario por hora Número de obreros (variable) (frecuencias) de 4 a 8 pesos 3 de 8 a 12 pesos 12 de 12 a 16 pesos 40 de 16 a 32 pesos 47 de 32 a 36 pesos 32 de 36 a 40 pesos 13 de 40 a 44 pesos 9 de 44 a 48 pesos 4 Total 160 Calcule las distribuciones de frecuencias que corresponda. ¿Podemos calcular la marca de clase?: -¿Qué información nos aporta? - ¿Por qué la podemos calcular? - Calcule la marca de clase si corresponde Ejemplo III - Solución Salario por hora fi fr [0 a 20 pesos ) 10 0,05 5 10 0,05 5 10 [20 a 40 pesos ) 20 0, 10 10 30 0,15 15 30 [40 a 60 pesos ) 40 0,20 20 70 0,35 35 50 [60 a 80 pesos ) 50 0,25 25 120 0,60 60 70 [80 a 100 pesos ) 35 0,18 18 155 0,78 78 90 [100 a 120 pesos ) 30 0,15 15 185 0,93 93 110 [120 a 140 pesos ) 10 0,05 5 195 0,98 98 130 140 a 160 pesos ) 5 0,02 2 200 1 100 150 200 1 100 (variable) Total f% Fi Fr F% Xc Ejemplo I En esta variable la información que es relevante es la que se refiere a: 1. Los valores distintos que se presentan en la matriz de datos originales (columna 1) 2. El orden de estos valores 3. La frecuencia con que cada uno de esos valores se presenta en la matriz de datos originales . 4. Los distintos valores acumulados a medida que crece el valor de la variable. En esta variable tiene sentido la idea de «acumular» pues los valores guardan un «orden» que da un criterio de acumulación. Así, el resumen eficiente para este tipo de variables es una tabla de frecuencias simple que brinde información tanto a partir de las frecuencias absolutas, relativas y porcentuales, simples como acumuladas. Seleccionamos una tabla de frecuencias simple porque la población es grande (200) y su recorrido pequeño (no es necesario agrupar los valores en clases) Ejemplo II En esta variable la información que es relevante es la que se refiere a: 1. Los valores distintos que se presentan en la matriz de datos originales (columna 1) 2. La frecuencia con que cada uno de esos valores se presenta en la matriz de datos originales . No interesa: el orden en que se presentan los datos y, por tanto, tampoco los distintos valores acumulados a medida que crece el valor de la variable Así, el resumen eficiente para este tipo de variables es una tabla de frecuencias que brinde información a partir de las frecuencias absolutas, relativas y porcentuales simples. No calculamos frecuencias acumuladas porque no tiene sentido juntar valores ya que entre ellos no existe un criterio de orden o jerarquía que permita agruparlos. Ejercicios del Módulo II EJERCICIO Nº 1 Propone representaciones tabulares (lo más completas posibles) y gráficas (puede ser de más de un tipo) para los siguientes casos: Distribución de frecuencias de la variable Departamento de residencia de una población compuesta por 10 personas, en Uruguay, 2007. Distribución de frecuencias de la Edad de las personas desempleadas en la ciudad de Montevideo en 2007. Toma en cuenta que la situación de empleo se le pregunta sólo a las personas de 14 años y más. Esa misma población se ha desagregado según el sexo. ¿Qué representación gráfica propondrías para visualizar la estructura por edad y sexo de los desempleados? Distribución del Número de accidentes laborales en el último año que han tenido 50 empresas del ramo de la construcción en el país. Se conoce para cada empresa el número de accidentes. Ejercicios del Módulo II EJERCICIO Nº 2 Reconstruye las Tablas de distribuciones de frecuencias simples absolutas, relativas y porcentuales y, cuando sea pertinente también las acumuladas correspondientes a partir de la información proporcionada por las siguientes gráficas, provenientes de un estudio a una población compuesta por 200 personas: Estado civil de la población en estudio (%) 5 10 25 Soltera/o En pareja Divorciada/o Viuda/o 60 Fuente: Datos ficticios Ejercicios del Módulo II EJERCICIO Nº 2 Reconstruye las Tablas de distribuciones de frecuencias simples absolutas, relativas y porcentuales y, cuando sea pertinente también las acumuladas correspondientes a partir de la información proporcionada por las siguientes gráficas, provenientes de un estudio a una población compuesta por 200 personas: Nivel educativo de la población en estudio (Frecuencias simples absolutas) 120 100 100 Sin instrucción 70 80 Primaria 60 Secundaria 40 20 20 Terciaria 10 0 Fuente: Datos ficticios Distribuciones Univariadas Resumen Variables de Tipo II: Estadísticas que constan de muchas observaciones, pero la variable toma pocos valores distintos. Variables de Tipo III: Estadísticas que constan de muchas observaciones y la variable toma muchos valores distintos. Salario por hora Personas Activas Número de Familias (variable) Número de obreros (variable) (frecuencias) 1 16 2 20 (frecuencias) de 4 a 8 pesos 3 de 8 a 12 pesos 12 de 12 a 16 pesos 40 de 16 a 32 pesos 47 de 32 a 36 pesos 32 3 9 4 5 de 36 a 40 pesos 13 Total 50 de 40 a 44 pesos 9 de 44 a 48 pesos 4 Total 160 Distribuciones Univariadas Usamos: Tablas tipo II: Tablas de distribución de frecuencias simples. Cuando el tamaño de la población y/o muestra es grande y el recorrido de la variable es pequeño, hay valores de la variable que se repiten Tablas tipo III: tablas de frecuencias con datos agrupados en clases Cuando el tamaño de la población y/o muestra y el recorrido de la variable son grandes, será necesario agrupar en intervalos los valores de la variable. Distribuciones Univariadas RECORRIDO o RANGO de la variable es la distancia entre el valor más alto y el más bajo Las clases tienen una LIMITE INFERIOR, un LIMITE SUPERIOR, y una AMPLITUD AMPLITUD DE CLASE: Diferencia entre dos límites sucesivos inferiores teóricos de las clases MARCA DE CLASE (Xc). Es un valor medio que se calcula sumando los límites inferior y superior TEORICOS y dividiendo el resultado entre dos. Distribuciones Univariadas Nomenclatura Li- – Ls Intervalo de clase (con límite inferior de clase y límite superior de clase. Se trata de límites teóricos y no reales. Ai Amplitud del intervalo: diferencia entre Li y Ls TEORICOS Xc Marca de clase: Punto medio del intervalo de clase. Es el punto más representativo de los valores incluidos en el intervalo. Se obtiene promediando los dos límites teóricos del intervalo (Li +Ls)/2 Repaso Niveles de medición de las variables Nominales Ordinales (crit.jerarquización, ordenación) De Intervalo (orden,distancia) De razón (orden, distancia, proporción) GRÁFICOS Una forma de presentación… Los gráficos son considerados el método de presentación de la información más simple para el lector porque puede captar el panorama general o la tendencia de los datos de una sola mirada Ventajas Es mucho más fácil de comprender que una tabla o un texto. La sencillez de líneas, una atractiva manera de presentación, hacen de los gráficos una de las herramientas más poderosas para transmitir ideas en forma rápida y simple al lector. Desventaja Su desventaja más notoria es la pérdida de precisión y exactitud, si se lo compara con una tabla. Distribución de la variable tipo de ocupación Tipo de Ocupación % Asalariado privado 57 Asalariado público 16 Miembro de cooperativa de producción 1 Patrón 5 Cuenta propia sin local o inversión 7 Cuenta propia con local o inversión 12 Miembro del hogar no remunerado 3 Asalariado privado 100 Asalariado público Total Miembro de cooperativa de producción Patrón Cuenta propia sin local o inversión Cuenta propia con local o inversión Miembro del hogar no remunerado TIPOS DE GRÁFICOS Gráficos para variables cualitativas • Diagramas de barras: Representamos en el eje de ordenadas las categorías y en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Para comparar usar frecuencias relativas! Diagramas de barras (ej. Estado Civil) Diagramas de barras (ej. Estado Civil) Compara dos poblaciones Diagramas de sectores (o de torta) 41% 46% 59% Hasta 35 años Más de 35 años Masculino 54% Femenino Se divide un círculo en tantas porciones como categorías existan, de modo que a cada categoría le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa Pictogramas Expresan con dibujos alusivos al tema de estudio las frecuencias de las categorías de la variable. Estos gráficos se hacen representando a diferentes escalas un mismo dibujo. Las áreas son proporcionales a las frecuencias. Se usa en medios de comunicación por su facilidad Gráficos para variables cuantitativas Distinción entre Variables Discretas y variables Continuas •Una variable discreta es la variable tal que entre 2 cualesquiera valores observables (potencialmente), hay por lo menos un valor no observable (potencialmente). •Una variable continua tiene la propiedad de que entre 2 cualesquiera valores observables (potencialmente), hay otro valor observable (potencialmente). Distinción entre Variables Discretas y variables Continuas - Una variable discreta es sencillamente una variable para la que se dan de modo inherente separaciones entre valores observables sucesivos. Dicho con más rigor, se define una variable discreta como la variable tal que entre 2 cualesquiera valores observables (potencialmente), hay por lo menos un valor no observable (potencialmente). Por ejemplo, un recuento del número de familias que habitan en una vivienda es una variable discreta. Mientras que cuentas de 3 y 4 son potencialmente observables, no lo es una de 3,5. - Una variable continua tiene la propiedad de que entre 2 cualesquiera valores observables (potencialmente), hay otro valor observable (potencialmente). Una variable continua toma valores a lo largo de un continuo, esto es, en todo un intervalo de valores. Longitudes y pesos son ejemplos de variables continuas. La estatura de una persona, pude ser 1,70 mts. ó 1,75 mts., pero en potencia al menos podría tomar cualquier valor intermedio como 1,73 mts. por ejemplo. - Un atributo esencial de una variable continua es que, a diferencia de lo que ocurre con una variable discreta, nunca se la puede medir exactamente. Con una variable continua debe haber inevitablemente un error de meda. - Un importante principio sobre variables continuas es que siempre se registran en forma discreta, quedando la magnitud de la distancia entre valores registrables adyacentes determinada por la precisión de la medición. Variables discretas: Cuando representamos una variable discreta, usamos el diagrama de barras si pretendemos hacer una gráfica diferencial. Las barras deben ser estrechas para representar el que los valores que toma la variable son discretos. El diagrama acumulado (o integral) tiene, por la naturaleza de la variable, forma de escalera. Variables discretas: xi fi fr Fi Fr 0 1 1/8 1 1/8 1 3 3/8 4 4/8 2 3 3/8 7 7/8 3 1 1/8 8 8/8 n=8 1 Variables continuas: • Histograma: Se construye a partir de la tabla estadística, representando sobre cada intervalo un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos. Variables continuas: •Polígono de Frecuencias Se construye Polígono de Frecuencias e Histograma Li-1 - Li Xc fi Fi 0 -- 2 1 2 2 2 -- 4 3 1 3 4 -- 6 5 4 7 6 -- 8 7 3 10 8 - 10 9 2 12 ………. . 12 Polígono de Frecuencias Acumulado Se obtiene como la poligonal definida en abscisas a partir de los extremos de los intervalos en los que se ha organizado la tabla de la variable, y en ordenadas por alturas que son proporcionales a las frecuencias acumuladas Supuesto Xc – frecuenci a cero Nota: El histograma representa las frecuencias de los intervalos mediante áreas y no mediante alturas. Sin embargo nos es mucho más fácil hacer representaciones gráficas teniendo en cuenta estas últimas. Si todos los intervalos tienen la misma amplitud no es necesario diferenciar entre los conceptos de área y altura, Tipo especial de Histograma: Pirámide de población Resumen Tabla: Principales diagramas según el tipo de variable Tipo de variable Variable Cualitativa Diagrama Barras, sectores, pictogramas Variable Cuantitativa Variable Discreta Diferencial (barras) Acumulativo (en escalera) Variable Continua Diferencial (histograma, polígono de frecuencias, pirámides de población) Acumulativo (Ojiva o polígono de frecuencias acumuladas)