Descargar

Anuncio
Estadística Laboral - RRLL
Unidad 2
Distribuciones Univariadas:
Tablas y Gráficos
Estadística Laboral - RRLL
Conceptos a tener en cuenta
 VARIABLE: propiedad, atributo o característica de una
unidad de análisis, susceptible de adoptar diferentes
valores o categorías
 Los valores o categorías que adopta una variable
constituyen un SISTEMA DE CATEGORIAS.
MUTUAMENTE EXCLUYENTES y el sistema debe ser
EXHAUSTIVO para la población en estudio
 MATRIZ DE DATOS: contiene en sus filas a cada una
de las unidades, en sus columnas a las variables que
caracterizan a esas unidades
 DATO: valor que toma una variable en una unidad de
análisis
Matriz de Datos
Ingresos del Número de miembros que
hogar
trabajan
Hogar 1
$2000
2
Hogar 2
$70000
4
Hogar 3
$ 4500
0
….
Uso de Tablas y Gráficos
 Los usamos para facilitar la lectura de la
matriz de datos, para eso, la reducimos.
 En la clase de hoy, trabajaremos con UNA sola
VARIABLE.
 Más adelante aprenderemos a trabajar con
dos variables al mismo tiempo.
 Existen métodos de análisis multivariados
(múltiples variables) pero no los veremos en el
curso
Distribuciones Univariadas
 Elegimos la VARIABLE a estudiar.
 Realizamos
la
distribución
de
frecuencias, que en nuestro caso será
una DISTRIBUCION UNIVARIADA DE
FRECUENCIAS
 La presentamos en una TABLA
 Podemos
establecer
además
un
recorrido o rango de la variable
Precisiones conceptuales
 DISTRIBUCION DE FRECUENCIAS:
es
una forma de organizar y resumir un conjunto de
datos agrupados en categorías, en las cuales se
muestra el número de observaciones que contiene
cada categoría
 DISTRIBUCION
FRECUENCIAS:
UNIVARIADA
sirve
para
información de una sola variable
resumir
DE
la
Precisiones conceptuales
 TABLA es una presentación ordenada
de los distintos valores de una variable
en base a los datos originales. Una
forma de presentar la distribución
univariada de frecuencias
 RECORRIDO o RANGO de la variable
es la distancia entre el valor más alto y el
más bajo
Datos
 Cuando el tamaño de la población o
muestra y el recorrido de la variable son
pequeños, no hay que hacer nada
especial, simplemente anotarlas de
manera ordenada en filas o columnas.
 Cuando el tamaño de la población y/o
muestra es grande, usamos tablas
Tablas tipo II: Tablas de
distribución de frecuencias simples
 Cuando el tamaño de la
población y/o muestra es grande
y el recorrido de la variable es
pequeño, hay valores de la
variable que se repiten
Tablas tipo II: Tablas de
distribución de frecuencias simples
Número de integrantes del hogar
2
1
2
2
1
2
4
2
1
1
2
3
2
1
1
1
3
4
2
2
2
2
1
2
1
1
1
3
2
2
3
2
3
1
2
4
2
1
4
1
1
3
4
3
2
2
2
1
3
3
Guía de Clase Pág.4
Tablas tipo II: Tablas de
distribución de frecuencias simples
Distribución de frecuencias simples de
integrantes del hogar
Integrantes
del hogar
Número de
hogares
1
2
3
4
Total
16
20
9
5
50
Tablas tipo II: Tablas de
distribución de frecuencias simples
 FRECUENCIA SIMPLE ABSOLUTA
veces que se repite el mismo valor
(categoría) de la variable.
 Variables como SEXO o ESTADO CIVIL
que normalmente toman pocos valores lo
usual es resumirlas en tablas de
frecuencias simples
Tablas tipo II: Tablas de
distribución de frecuencias simples
Integrantes
del hogar
Categorías
o valores
de la
variable
1
2
3
4
Total
Número
de
hogares
16
20
9
5
50
Retomando este
ejemplo, identifique
Frecuencia/s Simple/s
Absoluta/s
Frecuencias
Simples
Absolutas
para cada
valor de la
variable
Ayuda: veces que se
repite el mismo valor
(categoría) de la
variable
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
Cuando el tamaño de la población y/o
muestra y el recorrido de la variable
son grandes,
será necesario agrupar en
intervalos los valores de la
variable.
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
 Ejemplo en Guía de Clases. Pág. 5
Tomamos un grupo de 30 alumnos les preguntamos el dinero que en ese
momento llevan encima, nos encontramos con los siguientes datos:
450
115
250
300
17
0
5
18
200
675
50
37
78
159
230
500
120
100
18
125
31
42
56
110
25
268
60
15
20
985
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
¿Cuál es el recorrido de la variable?
 la variable tiene un recorrido muy
grande
 recorrido: 985-0= 985
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
 si queremos hacer una tabla con estos datos
tendremos que tomar clases que agrupen los
valores.
 A estas clases le debemos definir un
«recorrido». Para decidir el recorrido de las
clases, necesitaremos decidir ….
 ¿cuántas clases queremos?.
 se suele trabajar con no más de 10 o 12 clases
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases




Modalidades de construcción de Clases
limites superior e inferior “reales” de la distribución de
datos 0 – 99; el segundo 100 a 199; el tercero 200 a
299, y así sucesivamente..
toman los denominados límites “teóricos” 0 a 100; el
segundo de 100 a 200, el tercero, de 200 a 300 y, así
sucesivamente
si bien la primer clase se define como (0 a 100) no
incluye el 100; esta cifra esta incluida en la segunda
clase
Veremos ejemplos…
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
 ¿cuántas clases queremos?.
 Tomaremos 10 clases.
 Veremos cómo construimos la tabla
definiendo qué límites superior e inferior
tomamos
Li= límite inferior
Ls: Límite Superior
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
 Ejemplo de tabla construida en base a
límites reales:
 Dividimos el recorrido entre 10 (985/10)= 98,5.
Por mayor comodidad tomamos 99
Primer clase:
 Límite inferior de la primer clase (L i = 0).
Primer valor de la variable ordenada
 Límite superior de la primer clase (L s =99)
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
Clases
0
Exhaustivo
y
mutuamente
excluyente
Frecuencia simple
absoluta (fi)
- 99
15
100 - 199
6
200 - 299
4
300 - 399
1
400 - 499
1
500 - 599
1
600 - 699
1
700 - 799
0
800 - 899
0
900 - 999
1
fi=
frecuencias
absolutas
simples
Veces que se
repite el
mismo valor
(categoría)
de la variable
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
Ejemplo de tabla construida en base a
límites teóricos:
Primer clase:
 Límite inferior de la primer clase (L i = 0).
Primer valor de la variable ordenada
 Límite superior de la primer clase (L s
=100).
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
LIMITES TEÓRICOS
 Se toman sumando al límite superior y restando al
límite inferior “0,5” unidades.
( Li – 0,5) (Ls + 0,5). Esto significa que el primer
intervalo tiene un recorrido de -0,5 a 99,5; el segundo
de 99,5 a 199,5.
 Es decir, el límite inferior es 0.5 unidades menor que el
límite inferior, y el límite superior es 0.5 unidades
mayor que el límite superior indicado.
 Pero NO se toman decimales, sino cifras
redondeadas
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
Primer clase:
 Límite inferior de la primer clase (L i = 0).
Primer valor de la variable ordenada
 Límite superior de la primer clase (L s
=100).
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
Hasta 99
Incluye 100
¿Si un alumno
tiene 100 pesos,
en qué clase lo
voy a incluir?
[ Li-1 , Li )
fi
[ 0 – 100 )
15
[ 100 - 200)
6
[ 200 - 300)
4
[ 300 – 400)
1
[ 400 - 500)
1
[ 500 - 600)
1
[ 600 - 700)
1
[ 700 - 800)
0
[ 800 - 900)
0
[ 900 - 1000)
1
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
AMPLITUD DE CLASE
Diferencia entre dos límites sucesivos
inferiores teóricos de las clases
100-0= 100
200-100= 100
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
Agrupar la información en intervalos permite «resumir»
la información contenida en una matriz de datos pero
también implica una «pérdida de información» . Tomar
pocas clases implica que la "pérdida de información" sea
mayor.
Para solucionar este problema es decir, que no dispongamos
de los valores originales para reconstruir la verdadera
distribución de los datos – se suele asumir el supuesto que
todos los valores de la clase «tienden» a coincidir con
el «valor medio» de la misma, también llamada
MARCA DE CLASE (Xc)
Es un valor medio que se calcula sumando
los límites inferior y superior TEORICOS y
dividiendo el resultado entre dos.
MARCA DE CLASE (Xc)
 Se calcula sumando los límites
inferior y superior TEORICOS y
dividiendo el resultado entre dos.
Tablas tipo III: tablas de frecuencias
con datos agrupados en clases
CLASES
[ Li-1 , Li )
MARCA DE CLASE
Xc
FRECUENCIA
ABSOLUTA
fi
AMPLITUD
Ai
[ 0 – 100 )
50
15
100
[ 100 - 200)
150
6
100
[ 200 - 300)
250
4
100
[ 300 – 400)
350
1
100
[ 400 - 500)
450
1
100
[ 500 - 600)
550
1
100
[ 600 - 700)
650
1
100
[ 700 - 800)
750
0
100
[ 800 - 900)
850
0
100
[ 900 - 1000)
950
1
100
30
Tipos de frecuencia
 Absolutas – Relativas relativas porcentuales
 simples / acumuladas
Tipos de frecuencia
 Se llama frecuencia absoluta (simple) (fi) de
un valor de la variable al número de veces
que se presenta dicho valor. La
representaremos por fi. En el ejemplo anterior
el valor «tener en el bolsillo entre 900 y 1000
pesos» obtuvo en la medición una frecuencia
absoluta de 1. La suma de todas las
frecuencias absolutas es igual al total de la
población.
Frecuencia absoluta (fi)
CLASES
[ Li-1 , Li )
MARCA DE
CLASE
Xc
FRECUENCIA
ABSOLUTA
fi
AMPLITUD
Ai
[ 0 – 100 )
50
15
100
[ 100 - 200)
150
6
100
[ 200 - 300)
250
4
100
[ 300 – 400)
350
1
100
[ 400 - 500)
450
1
100
[ 500 - 600)
550
1
100
[ 600 - 700)
650
1
100
[ 700 - 800)
750
0
100
[ 800 - 900)
850
0
100
[ 900 - 1000) 950
1
100
30
Frecuencia relativa simple
(fr)
 Se llama frecuencia relativa (simple) (fr) de
un valor a la frecuencia absoluta dividida
por el número total de individuos que
conforman la población o muestra (N). Es por
tanto, una proporción. La representaremos por
fr . En el ejemplo anterior la frecuencia relativa
de esta clase o intervalo [ 900 - 1000) es 1/30
= 0,033. La suma de todas las frecuencias
relativas es igual a la unidad (1).
Frecuencia relativa simple
[ Li-1 , Li )
[ 0 – 100 )
fi
fr
15
0,50
[ 100 - 200)
6
0,20
[ 200 - 300)
4
0,13
[ 300 – 400)
1
0,03
[ 400 - 500)
1
0,03
[ 500 - 600)
1
0,03
[ 600 - 700)
1
0,03
[ 700 - 800)
0
0,00
dividido el número
total de individuos
que conforman la
población o
muestra= 30
[ 800 - 900)
0
0,00
1/30= 0,033
[ 900 - 1000)
1
0,03
30
1,00
N
Valor de la
frecuencia absoluta=
1
Frecuencia absoluta
acumulada
 Se llama frecuencia absoluta acumulada (Fi)
al número de veces que se presenta un valor y
todos los anteriores a él.
 En el caso del ejemplo anterior el intervalo [ 0 – 100 ) acumula
15 casos; el intervalo [ 100 - 200) acumula 21 casos (6 que
corresponden a este intervalo + 15 casos que se le agregan por
corresponder al intervalo anterior.
 Las frecuencias absolutas acumuladas
llegan a acumular N en el último valor o
clase considerada.
Frecuencia absoluta acumulada
[ Li-1 , Li )
fi
fr
Fi
15
0,5
0
15
15 + 6
[ 100 - 200)
6
0,2
0
21
= 21
[ 200 - 300)
4
0,1
3
25
[ 0 – 100 )
21 + 4
= 25
[ 300 – 400)
1
0,0
3
26
[ 400 - 500)
1
0,0
3
27
[ 500 - 600)
1
0,0
3
28
[ 600 - 700)
1
0,0
3
29
Frecuencia relativa
acumulada (Fr)
 Se llama frecuencia relativa acumulada (Fr)
a la frecuencia absoluta acumulada
dividida por el número total de
observaciones. La representaremos por
FR Las frecuencias relativas acumuladas
llegan a acumular 1 en el último valor o clase
considerada
Frecuencia relativa
acumulada (Fr)
[ Li-1 , Li )
[ 0 – 100 )
fi
Fr
Fi
Fr
15
0,50
15
0,5
15/30= 0,5
[ 100 - 200)
6
0,20
21
0,70
21/30= 0,7
[ 200 - 300)
4
0,13
25
0,83
25/30= 0,83
[ 300 – 400)
1
0,03
26
0,87
[ 400 - 500)
1
0,03
27
0,90
[ 500 - 600)
1
0,03
28
0,93
[ 600 - 700)
1
0,03
29
0,97
[ 700 - 800)
0
0,00
29
0,97
[ 800 - 900)
0
0,00
29
0,97
[ 900 - 1000)
1
0,03
30
30
1,00
1,00
30/30=1
N
Frecuencia porcentual (%)
 Se llama frecuencia porcentual (%) al tanto
por ciento de las veces que se ha obtenido un
determinado resultado. Se obtiene
multiplicando por 100 la frecuencia
relativa y se representa por n%.
 Se puede calcular la frecuencia porcentual
tanto para frecuencias simples como para
frecuencias acumuladas. (% acumulado)
Frecuencia porcentual (%)
[ Li-1 , Li )
[ 0 – 100 )
fi
fr
%
Fi
Fr
15
0,50
50
15
0,5
[ 100 200)
6
0,20
20
21
0,70
[ 200 300)
4
[ 300 –
400)
1
[ 400 500)
1
0,03
3
27
0,90
[ 500 600)
1
0,03
3
28
0,93
[ 600 700)
1
0,03
3
29
0,97
[ 700 800)
0
0,00
0
29
0,97
0,5 x 100= 50
fr
0,13
13
25
%
0,83
0,20 x 100= 20
0,03
3
26
0,87
0,13 x 100= 13
Frecuencia porcentual (%)
acumulados
[ Li-1 , Li )
fi
[ 0 – 100 )
15
0,50
50
15
0,5
50
[ 100 - 200)
6
0,20
20
21
0,70
70
[ 200 - 300)
4
0,13
13
25
0,83
83
[ 300 – 400)
1
0,03
3
26
0,87
87
[ 400 - 500)
1
0,03
3
27
0,90
90
[ 500 - 600)
1
0,03
3
28
0,93
93
[ 600 - 700)
1
0,03
3
29
0,97
97
[ 700 - 800)
0
0,00
0
29
0,97
97
[ 800 - 900)
0
0,00
0
29
0,97
97
[ 900 - 1000)
1
0,03
3
30
1,00
100
30
fr
% Fi
1,00 100
Fr
%
acumulado
Fr
0,5 x 100= 50
0,70 x 100= 70
Una tabla de distribución de frecuencias es una forma de presentar los datos sobre una
característica de la población en estudio; por tanto debe contener la información necesaria
para que el lector pueda analizarla.
Esto implica que debe tener explícitamente:
Título, en el cual se describe qué variable se está presentando, qué tipo de tabla es
(frecuencia simple, acumulada, porcentual, etc.) y cuál es la población que se está
caracterizando (Por ejemplo: “Trabajadores ocupados de Montevideo, año 2007”;
“Personal administrativo de la empresa XXX, año 2006”)
Fuente de donde proviene la información: cuál es el origen de la matriz de datos
que se está resumiendo. (Por ejemplo: “Encuesta Continua de Hogares, INE”;
“Encuesta a la empresa XXX, realizada por el autor del informe”)
Las columnas deben estar encabezadas por el tipo de frecuencia que contienen.
Ejemplo I
Variable Escolaridad con valores 0, 1, 2 ó 3 en una base de datos
que contiene 200 datos
Xi
fi
0 = bachillerato,
50
1 = licenciatura sin
título;
160
2 = licenciatura con 100
título
3 = postgrado
90
400
Ejemplo I
 Considere el ejemplo de la variable
Escolaridad con valores 0, 1, 2 ó 3 en
una base de datos que contiene 200
datos
 0 = bachillerato,
 1 = licenciatura sin título
 2 = licenciatura con título
 3 = postgrado
Ejemplo II
Xi
fi
0 = viudo,
10
1 = casado
150
2 =soltero
250
3 = divorciado
90
Variable Estado Civil
con valores 0, 1, 2 ó
3 en una base de
datos que contiene
200 datos
0 = viudo
1 = casado
2 = soltero
500
3 = divorciado
Ejemplo I y II
Trabajo en grupos:
 ¿Cuál es la información relevante?
 ¿por qué?
 ¿Corresponde acumular? ¿Por qué?
Ejemplo I - Solución
Xi
fi
fr
f%
Fi
Fr
F%
0 = bachillerato,
50
0,13
13
50
0,13
13
1 = licenciatura sin
título;
160
0,4
40
210
0,53
53
2 = licenciatura con
título
100
0,25
25
310
0,78
78
3 = postgrado
90
0,22
22
400
1,00
100
400
1
100
Ejemplo II - Solución
Xi
fi
fr
f%
0 = viudo,
10
0,02
2
1 = casado
150
0,3
30
2 =soltero
250
0,5
50
3 = divorciado
90
0,18
18
500
1
100
Ejemplo III
Salario por
hora
Número
de obreros
(variable)
(frecuencias)
de 4 a 8 pesos
3
de 8 a 12 pesos
12
de 12 a 16 pesos
40
de 16 a 32 pesos
47
de 32 a 36 pesos
32
de 36 a 40 pesos
13
de 40 a 44 pesos
9
de 44 a 48 pesos
4
Total
160
Calcule las distribuciones
de frecuencias que
corresponda.
¿Podemos calcular la
marca de clase?:
-¿Qué información nos
aporta?
- ¿Por qué la podemos
calcular?
- Calcule la marca de
clase si corresponde
Ejemplo III - Solución
Salario por hora
fi
fr
[0 a 20 pesos )
10
0,05
5
10
0,05
5
10
[20 a 40 pesos )
20
0, 10
10
30
0,15
15
30
[40 a 60 pesos )
40
0,20
20
70
0,35
35
50
[60 a 80 pesos )
50
0,25
25
120
0,60
60
70
[80 a 100 pesos )
35
0,18
18
155
0,78
78
90
[100 a 120 pesos )
30
0,15
15
185
0,93
93
110
[120 a 140 pesos )
10
0,05
5
195
0,98
98
130
140 a 160 pesos )
5
0,02
2
200
1
100
150
200
1
100
(variable)
Total
f%
Fi
Fr
F%
Xc
Ejemplo I
En esta variable la información que es relevante es la que se refiere a:
1. Los valores distintos que se presentan en la matriz de datos originales
(columna 1)
2. El orden de estos valores
3. La frecuencia con que cada uno de esos valores se presenta en la
matriz de datos originales .
4. Los distintos valores acumulados a medida que crece el valor de la
variable. En esta variable tiene sentido la idea de «acumular» pues los
valores guardan un «orden» que da un criterio de acumulación.
 Así, el resumen eficiente para este tipo de variables es una tabla de
frecuencias simple que brinde información tanto a partir de las
frecuencias absolutas, relativas y porcentuales, simples como
acumuladas. Seleccionamos una tabla de frecuencias simple
porque la población es grande (200) y su recorrido
pequeño (no es necesario agrupar los valores en
clases)
Ejemplo II



En esta variable la información que es relevante es la que se refiere
a:
1. Los valores distintos que se presentan en la matriz de datos
originales (columna 1)
2. La frecuencia con que cada uno de esos valores se presenta en la
matriz de datos originales .
No interesa:


el orden en que se presentan los datos y, por tanto, tampoco los
distintos valores acumulados a medida que crece el valor de la
variable
Así, el resumen eficiente para este tipo de variables es una tabla de
frecuencias que brinde información a partir de las frecuencias
absolutas, relativas y porcentuales simples. No calculamos
frecuencias acumuladas porque no tiene sentido juntar valores ya
que entre ellos no existe un criterio de orden o jerarquía
que permita agruparlos.
Ejercicios del Módulo II
EJERCICIO Nº 1
Propone representaciones tabulares (lo más completas posibles) y gráficas
(puede ser de más de un tipo) para los siguientes casos:

Distribución de frecuencias de la variable Departamento de residencia de
una población compuesta por 10 personas, en Uruguay, 2007.

Distribución de frecuencias de la Edad de las personas desempleadas en
la ciudad de Montevideo en 2007. Toma en cuenta que la situación de
empleo se le pregunta sólo a las personas de 14 años y más.

Esa misma población se ha desagregado según el sexo. ¿Qué
representación gráfica propondrías para visualizar la estructura por edad
y sexo de los desempleados?

Distribución del Número de accidentes laborales en el último año que
han tenido 50 empresas del ramo de la construcción en el país. Se
conoce para cada empresa el número de accidentes.
Ejercicios del Módulo II
EJERCICIO Nº 2
Reconstruye las Tablas de distribuciones de frecuencias
simples absolutas, relativas y porcentuales y, cuando sea
pertinente también las acumuladas correspondientes a partir
de la información proporcionada por las siguientes gráficas,
provenientes de un estudio a una población compuesta por
200 personas:
Estado civil de la población en estudio (%)
5
10
25
Soltera/o
En pareja
Divorciada/o
Viuda/o
60
Fuente: Datos ficticios
Ejercicios del Módulo II
EJERCICIO Nº 2
Reconstruye las Tablas de distribuciones de frecuencias simples absolutas,
relativas y porcentuales y, cuando sea pertinente también las
acumuladas correspondientes a partir de la información proporcionada
por las siguientes gráficas, provenientes de un estudio a una población
compuesta por 200 personas:
Nivel educativo de la población en estudio
(Frecuencias simples absolutas)
120
100
100
Sin instrucción
70
80
Primaria
60
Secundaria
40
20
20
Terciaria
10
0
Fuente: Datos ficticios
Distribuciones Univariadas
 Resumen
Variables de Tipo II:
Estadísticas que constan de muchas
observaciones, pero la variable toma
pocos valores distintos.
Variables de Tipo III:
Estadísticas que constan de muchas
observaciones y la variable toma
muchos valores distintos.
Salario por hora
Personas Activas
Número de Familias
(variable)
Número de obreros
(variable)
(frecuencias)
1
16
2
20
(frecuencias)
de 4 a 8 pesos
3
de 8 a 12 pesos
12
de 12 a 16 pesos
40
de 16 a 32 pesos
47
de 32 a 36 pesos
32
3
9
4
5
de 36 a 40 pesos
13
Total
50
de 40 a 44 pesos
9
de 44 a 48 pesos
4
Total
160
Distribuciones Univariadas
Usamos:
Tablas tipo II: Tablas de distribución de frecuencias
simples.
Cuando el tamaño de la población y/o muestra es grande y
el recorrido de la variable es pequeño, hay valores de la
variable que se repiten
Tablas tipo III: tablas de frecuencias con datos
agrupados en clases
Cuando el tamaño de la población y/o muestra y el
recorrido de la variable son grandes, será necesario
agrupar en intervalos los valores de la variable.
Distribuciones Univariadas
 RECORRIDO o RANGO de la variable es la
distancia entre el valor más alto y el más bajo
 Las clases tienen una LIMITE INFERIOR, un
LIMITE SUPERIOR, y una AMPLITUD
 AMPLITUD DE CLASE: Diferencia entre dos
límites sucesivos inferiores teóricos de las
clases
 MARCA DE CLASE (Xc). Es un valor medio
que se calcula sumando los límites inferior y
superior TEORICOS y dividiendo el resultado
entre dos.
Distribuciones Univariadas
Nomenclatura
Li- – Ls
Intervalo de clase (con límite inferior de clase y límite
superior de clase. Se trata de límites teóricos y no
reales.
Ai
Amplitud del intervalo: diferencia entre Li y Ls TEORICOS
Xc
Marca de clase: Punto medio del intervalo de clase. Es el
punto más representativo de los valores incluidos en el
intervalo. Se obtiene promediando los dos límites
teóricos del intervalo (Li +Ls)/2
Repaso
Niveles de medición de las variables
 Nominales
 Ordinales (crit.jerarquización, ordenación)
 De Intervalo (orden,distancia)
 De razón (orden, distancia, proporción)
GRÁFICOS
Una forma de presentación…
 Los gráficos son considerados el
método de presentación de la
información más simple para el lector
porque puede captar el panorama
general o la tendencia de los datos
de una sola mirada
Ventajas
 Es mucho más fácil de comprender que
una tabla o un texto.
 La sencillez de líneas, una atractiva
manera de presentación, hacen de los
gráficos una de las herramientas más
poderosas para transmitir ideas en forma
rápida y simple al lector.
Desventaja
Su desventaja más notoria es la pérdida de
precisión y exactitud, si se lo compara con
una tabla.
Distribución de la variable tipo de ocupación
Tipo de Ocupación
%
Asalariado privado
57
Asalariado público
16
Miembro de cooperativa de
producción
1
Patrón
5
Cuenta propia sin local o inversión
7
Cuenta propia con local o inversión
12
Miembro del hogar no remunerado
3
Asalariado privado
100
Asalariado público
Total
Miembro de cooperativa de producción
Patrón
Cuenta propia sin local o inversión
Cuenta propia con local o inversión
Miembro del hogar no remunerado
TIPOS DE GRÁFICOS
Gráficos para variables cualitativas
•
Diagramas de barras:
Representamos en el eje de ordenadas las
categorías y en abscisas las frecuencias
absolutas o bien, las frecuencias relativas.
Para comparar usar frecuencias relativas!
Diagramas de barras (ej. Estado Civil)
Diagramas de barras (ej. Estado Civil)
Compara dos poblaciones
Diagramas de sectores (o de torta)
41%
46%
59%
Hasta 35 años
Más de 35 años
Masculino
54%
Femenino
Se divide un círculo en tantas porciones como
categorías existan, de modo que a cada
categoría le corresponde un arco de círculo
proporcional a su frecuencia absoluta o relativa
Pictogramas
Expresan con dibujos
alusivos al tema de
estudio las frecuencias de
las categorías de la
variable. Estos gráficos se
hacen representando a
diferentes
escalas
un
mismo dibujo.
Las
áreas
son
proporcionales
a las
frecuencias. Se usa en
medios de comunicación
por su facilidad
Gráficos para variables cuantitativas
Distinción entre Variables Discretas y
variables Continuas
•Una variable discreta es la variable tal que
entre 2 cualesquiera valores observables
(potencialmente), hay por lo menos un valor
no observable (potencialmente).
•Una variable continua tiene la propiedad de
que
entre
2
cualesquiera
valores
observables (potencialmente), hay otro valor
observable (potencialmente).
Distinción entre Variables Discretas y
variables Continuas
- Una variable discreta es sencillamente una variable para la que se dan de
modo inherente separaciones entre valores observables sucesivos. Dicho con
más rigor, se define una variable discreta como la variable tal que entre 2
cualesquiera valores observables (potencialmente), hay por lo menos un valor
no observable (potencialmente). Por ejemplo, un recuento del número de
familias que habitan en una vivienda es una variable discreta. Mientras que
cuentas de 3 y 4 son potencialmente observables, no lo es una de 3,5.
- Una variable continua tiene la propiedad de que entre 2 cualesquiera valores
observables (potencialmente), hay otro valor observable (potencialmente). Una
variable continua toma valores a lo largo de un continuo, esto es, en todo un
intervalo de valores. Longitudes y pesos son ejemplos de variables continuas.
La estatura de una persona, pude ser 1,70 mts. ó 1,75 mts., pero en potencia al
menos podría tomar cualquier valor intermedio como 1,73 mts. por ejemplo.
- Un atributo esencial de una variable continua es que, a diferencia de lo que
ocurre con una variable discreta, nunca se la puede medir exactamente. Con
una variable continua debe haber inevitablemente un error de meda.
- Un importante principio sobre variables continuas es que siempre se registran
en forma discreta, quedando la magnitud de la distancia entre valores
registrables adyacentes determinada por la precisión de la medición.
Variables discretas:
Cuando representamos una variable discreta,
usamos el diagrama de barras si
pretendemos hacer una gráfica diferencial. Las
barras deben ser estrechas para representar el
que los valores que toma la variable son
discretos. El diagrama acumulado (o integral)
tiene, por la naturaleza de la variable, forma de
escalera.
Variables
discretas:
xi
fi
fr
Fi
Fr
0
1
1/8
1
1/8
1
3
3/8
4
4/8
2
3
3/8
7
7/8
3
1
1/8
8
8/8
n=8
1
Variables continuas:
•
Histograma: Se construye a partir de la
tabla estadística, representando sobre
cada intervalo un rectángulo que tiene a
este segmento como base. El criterio
para calcular la altura de cada
rectángulo es el de mantener la
proporcionalidad entre las frecuencias
absolutas (o relativas) de cada intervalo
y el área de los mismos.
Variables continuas:
•Polígono de
Frecuencias
Se
construye
Polígono de Frecuencias e Histograma
Li-1 - Li
Xc
fi
Fi
0 -- 2
1
2
2
2 -- 4
3
1
3
4 -- 6
5
4
7
6 -- 8
7
3
10
8 - 10
9
2
12
……….
.
12
Polígono de Frecuencias
Acumulado
Se obtiene como la poligonal
definida en abscisas a partir
de los extremos de los
intervalos en los que se ha
organizado la tabla de la
variable, y en ordenadas por
alturas que son proporcionales
a las frecuencias acumuladas
Supuesto
Xc –
frecuenci
a cero
Nota:
El histograma representa las frecuencias de los intervalos
mediante áreas y no mediante alturas. Sin embargo nos es
mucho más fácil hacer representaciones gráficas teniendo en
cuenta estas últimas. Si todos los intervalos tienen la misma
amplitud no es necesario diferenciar entre los conceptos de
área y altura,
Tipo especial de Histograma: Pirámide de población
Resumen
Tabla: Principales diagramas según el tipo de variable
Tipo de variable
Variable Cualitativa
Diagrama
Barras, sectores, pictogramas
Variable Cuantitativa
Variable Discreta
Diferencial (barras)
Acumulativo (en escalera)
Variable Continua
Diferencial (histograma, polígono de
frecuencias, pirámides de
población)
Acumulativo (Ojiva o polígono de
frecuencias acumuladas)
Descargar