Subido por Kevin Cortéz

Agrupación de Datos y Distribución

Anuncio
ORGANIZACIÓN Y
DISTRIBUCIÓN DE FRECUENCIAS
UNIVERSIDAD MARIANO GALVEZ DE GUATEMALA
Estadística I
Ingenieria en Sistemas de Información
ORGANIZACIÓN DE DATOS
el dato la materia prima de la estadística, el
primer paso es la recolección de datos, para lo cual se
emplean diferentes técnicas, como la entrevista personal,
el cuestionario, la observación, la toma de muestras,
entre otras.
El segundo paso es la organización y ordenamiento de
los datos, lo que se hace a través de tablas, las cuales
pueden ser por medio de una distribución de frecuencias
simples o una distribución de frecuencias con intervalos,
en ambos casos agrupando todos aquellos que
corresponden a una mismo dato nominal o variable y
expresando en una columna el número de veces que
aparece esa variable.
Siendo
DISTRIBUCIÓN DE
FRECUENCIAS
Distribuciones o Tabla de Frecuencias
• Es un formato que se usa para organizar y
resumir datos.
 Clasificación.
Cronológica o histórica.
El número de casos de malaria en Guatemala por año.
AÑO
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
CASOS
45,000
39,000
31,000
22,000
31,500
7,500
18,500
30,000
31,000
25,500
Cualitativa
Referida a algún atributo o cualidad de los
elementos que se va a analizar.
Ejemplo: mujeres que laboran
maquiladora según su estado civil.
Estado Civil
Solteras
No. de mujeres
54
Casadas
Divorciadas
Viudas
63
32
12
en
una
GEOGRAFICA
Esta toma en cuenta a los países, Departamentos,
municipios, otros.
Ejemplo:
Tasa de Analfabetismo de la población de 15 años y mas
ambos sexos
PAIS
1995
2000
2005
2012
Costa Rica
5.2
4.4
3.8
2.4
El Salvador
24.1
21.3
18.9
11.7
Guatemala
35.1
31.5
28.2
16.15
Honduras
28.3
25
22
16
Nicaragua
35.4
33.5
31.9
30
Panamá
9.4
8.1
7
5.5
Fuente: UNESCO.
Cuantitativa
Esta toma como base de agrupación una variable
numérica dividida en intervalos de amplitud
constante o variable.
Ejemplo: Los salarios semanales de 80 empleados
de un supermercado.
Salarios
1,200 – 1,249
1,250 – 1,299
1,300 – 1,349
1,350 – 1,399
1,400 – 1,499
1,450 – 1,499
No. de
Empleados
8
16
26
22
5
3
Presentación de información en cuadros
TABLAS DE
FRECUENCIA
Distribución de Frecuencias
• La tabla de frecuencias tiene como objeto
presentar en forma ordenada los valores o datos
que toman las diferentes características
obtenidas en una investigación. Los datos se
clasifican y ordenan de acuerdo a las
características cualitativas o cuantitativas,
indicando el número de veces (frecuencia) que
se repite el atributo o variable. Esta puede ser
simple o por intervalos
Frecuencias
• Es el número de datos o elementos de la muestra,
que caen en un mismo intervalo de clase. Es
decir, que sus valores quedan totalmente
comprendidos dentro de los linderos de ese
mismo intervalo.
Tipos de Frecuencias
• Absoluta: La frecuencia absoluta de una variable
estadística es el número de veces que aparece en la
muestra dicho valor de la variable, la representaremos por ni
• Relativa: que es el cociente entre la frecuencia absoluta y el
tamaño de la muestra. La denotaremos por fi
fi = ni/N
Donde N = Tamaño de la muestra
• Frecuencia Absoluta Acumulada :
Es la suma de los
distintos valores de la frecuencia absoluta tomando como
referencia un individuo dado. La última frecuencia absoluta
acumulada es igual al número de casos. Se denota por Ni
• Frecuencia Relativa Acumulada : Es el resultado de dividir
cada frecuencia absoluta acumulada por el número total
de datos. Se denota por Fi
Interpretación Tabla de Frecuencias
Peso (kg)
FREC.
ABSOLUTA
FREC. ABSOLUTA
ACUMULADA
1.2
1.4
1.6
3.6
5.2
6.2
6.6
6.8
7.2
TOTAL
1
2
3
8
14
18
19
22
13
100
1
3
6
14
28
46
65
87
100
FREC.
RELATIVA
%
1
2
3
8
14
18
19
22
13
FREC. RELATIVA
ACUMULADA
%
1
3
6
14
28
46
65
87
100
Interpretación Tabla de Frecuencias
Tiempo de espera en minutos de 36 personas para adquirir un dispositivo móvil
Tablas de Frecuencia
Datos Cuantitativos
1. Distribución de frecuencias simples
Ejemplo: organizar en una distribución de
frecuencias simples, los punteos obtenidos en un
examen de estadística por 30 alumnos
Listamos todos los números en forma ascendente de
menor a mayor.
Distribución de frecuencias simples
Punteos obtenidos en un examen
de Estadística por treinta
alumnos
Punteos
45
48
50
53
55
57
58
60
65
68
72
75
76
78
79
80
82
88
f
1
1
1
2
1
2
3
4
1
1
1
1
2
2
1
2
3
1
∑ f = 30
Distribución de frecuencias acumuladas
Ejemplo:
En la distribución de los punteos obtenidos en un examen de Estadística por treinta
alumnos, tendremos la siguiente distribución de frecuencias acumuladas.
Punteos
45
48
50
53
55
57
58
60
65
68
72
75
76
78
79
80
82
88
f
1
1
1
2
1
2
3
4
1
1
1
1
2
2
1
2
3
1
∑ f = 30
fa
1
2
3
5
6
8
11
15
16
17
18
19
21
23
24
26
29
30
Distribución de frecuencias de valores agrupados en
intervalos de amplitud constante
Son utilizados cuando los datos estadísticos de que se disponen
son numerosos (mayor de 30 datos)
Ejemplo:
Con los resultados obtenidos de un examen de estadística de 45
alumnos del nivel medio; haremos una distribución de frecuencias
de valores agrupados en intervalos de amplitud constante.
Distribución de frecuencias de valores agrupados
en intervalos de amplitud variable
Algunas veces los datos que se obtienen de una
variable cuantitativa no se pueden clasificar en
grupos que posean igual intervalo, por lo que
debemos aplicar la AGRUPACIÓN CON INTERVALO
VARIABLE, la cual como su nombre lo indica, es la
clasificación de la información en grupos con
distintos intervalos o amplitud.
Para hacer los grupos seguimos los pasos de la
distribución de frecuencias de valores agrupados
en intervalos de amplitud constante, pero
eliminando los intervalos en donde no se
encuentren valores, por lo que algunos grupos
tendran diferente amplitud
Distribución de frecuencias de valores agrupados
en intervalos de amplitud variable
Ejemplo: Con los precios de 25 artículos vendidos
este día por una aceitera, hacer una distribución de
frecuencias.
Datos:
17.00 14.00 16.00 17.50 31.00 16.00 18.00 31.00
32.50 8.25 19.00 18.00 4.10 4.60 17.00 34.00
7.00 10.00 17.50 32.50 31.00 33.00 34.00 32.10
32.45
Distribución de frecuencias de valores agrupados
en intervalos de amplitud variable
Procedimiento:
1º. Obtenemos la amplitud = 34 – 4.10/6 = 4.98
2º. Hacemos la distribución con una amplitud de 5
intervalo
conteo
f
1– 5
//
2
6 – 10
///
3
11 – 15
/
1
16 – 20
///// ////
9
21 – 25
-
0
26 – 30
-
0
31 – 35
///// /////
10
Distribución de frecuencias de valores agrupados
en intervalos de amplitud variable
3º. Eliminaremos los grupos con cero
frecuencia, porque en una agrupación no es
conveniente a que aparezcan grupos sin
algún dato
intervalo
f
1– 5
2
6 – 10
3
11 – 15
1
16 – 25
9
26 – 35
10
∑ f = 25
REPRESENTACION GRÁFICA



Es la manera de expresar los datos estadísticos. Esta es
importante porque nos permite asimilar las principales
características de las series estadísticas. Por lo que el
fin de una gráfica será el de mostrar por medio de
puntos, segmentos, curvas, superficies, volúmenes,
etc.
las variaciones que acusan los fenómenos que pueden
medirse o contarse.
En general las gráficas ponen de relieve las variaciones
de la serie estadística, favorecer las consultas y
permitir las comparaciones.
UTILIDAD DE LAS GRAFICAS
Síntesis:
se puede percibir de una ojeada por principales características
de una serie de números.
Destacan características: hacen resaltar los hechos esenciales,
demarcan las tendencias, muestran los hechos accidentales, establecen
las órdenes de importancia, precisan los máximos y los mínimos.
Control: permiten ver a simple vista las anomalías que pueden tener las
informaciones.
Comparación: las graficas permiten hacer confrontaciones de dos o
más series.
Hay que tener en cuenta que las gráficas no sustituyen a los cuadros,
ya que ambos deben complementarse en una publicación.
las desventajas de las gráficas podemos mencionar:
•Pérdida de detalle de la información
•Pueden tener errores involuntarios de construcción
Entre
REGLAS DE CONSTRUCCION
1. Título general
2. Elementos de referencia
con expresión de la variable
representada sobre cada uno.
3. Fuente de procedencia de
los datos representados
El eje que representará la
frecuencia debe empezar de
cero.
4. La parte más alta de la
gráfica debe ser
aproximadamente tres
cuartos de su ancho total.
5.Todas las barras deben
tener el mismo ancho.
DIAGRAMA DE BARRAS SIMPLES
• Son representaciones gráficas que están formadas
por barras horizontales o verticales del mismo
ancho (rectángulo de igual base) y cuya longitud
guarda proporción con la magnitud de la variable
presentada.
• Para construir el diagrama, la anchura de las barras
no tienen significación y pueden elegirse el tamaño
que se desee, de acuerdo con el número de datos
a presentar, teniendo cuidado de que las barras no
se solapen.
DIAGRAMA DE BARRAS SIMPLES
Densidad
Densidad
296
128
109
119
74
70
57
29
38
38
300
250
200
150
100
Densidad
50
0
PAISES
Densidad
PAISES
Países
El salvador
China
Francia
Guatemala
Costa Rica
Egipto
Honduras
USA
Panamá
Nicaragua
HABITANTES
350
Nicaragua
Panamá
USA
Honduras
Egipto
Costa Rica
Guatemala
Francia
China
El salvador
Densidad
0
50
100
150
200
HABITANTES
250
300
350
DIAGRAMA
DE BARRAS COMPUESTAS
100
90
80
70
60
50
40
30
20
10
0
% Mujeres
% Hombres
Camotán
MUNICIPIOS
MUNICIPIOS
PORCENTAJES
Población de los municipios de Quezaltepeque, San Jacinto, Olopa,
Jocotan y Camotán, pero además, clasificada por sexo; las categorías,
hombres y mujeres, son los componentes de cada una de las barras.
Olopa
% Hombres
San Jacinto
% Mujeres
Quezaltepeque
0
20
40
60
80
PORCENTAJES
100
120
DIAGRAMA DE BARRAS COMPARATIVAS
Compara cada una de las categorías de la característica principal, los
componentes de otra característica secundaria; no permite hacer
comparaciones entre los totales de la característica principal.
Gráfico: presenta la población de 12 años, para el período del 2010 al
2015, clasificada por región de residencia.
70
60
POBLACION
50
40
% HOMBRES
30
% MUJERES
20
10
0
QUEZALTEPEQUE
SAN JACINTO
OLOLA
MUNICIPIOS
JOCOTAN
CAMOTAN
HISTOGRAMA
Es una forma de representación gráfica de las frecuencias de
clase.
Consiste en representar las frecuencias por medio de las áreas
de los rectángulos (barras). Estos son diferentes a los diagramas
de barras, porque en un diagrama de barras las alturas de éstas
miden el tamaño de la variable y normalmente se dibujan
separadas. En un histograma las frecuencias quedan
representadas por el área de los rectángulos, no por sus alturas
y las barras se dibujan sin dejar espacios entre ellas.
En su elaboración los intervalos de clase están marcados sobre
el eje horizontal, utilizando para el efecto los límites reales y las
frecuencias en el eje vertical. Se construye por medio de
rectángulos unidos cuyos anchos son los de los intervalos de
clase que ellos representan y cuyas alturas equivalen a las
frecuencias.
Con la tabla de punteos obtenidos por 50 alumnos en un
examen de estadística, haremos el histograma
INTERVALO
LIMITES REALES
f
10 – 24
1
25 – 39
2
40 – 54
6
55 – 69
10
70 – 84
18
85 – 99
13
Con la tabla de punteos obtenidos por 50 alumnos en un
examen de estadística, haremos el histograma
Formas de
los histogramas
Formas de
los histogramas
POLIGONO DE FRECUENCIAS

Se utiliza, al igual que el histograma, para
representar distribuciones de frecuencias de
variables cuantitativas continuas, pero como no
se utilizan barras en su confección sino
segmentos de recta, de ahí el nombre de
polígono. Habitualmente se usa cuando se
quiere mostrar en el mismo gráfico más de una
distribución o una clasificación cruzada de una
variable cuantitativa continua con una
cualitativa o cuantitativa discreta, ya que por la
forma de construcción del histograma sólo se
puede representar una distribución.
POLIGONO DE FRECUENCIA SIMPLE
Para su construcción se puede realizar trazando los puntos que
representan las frecuencias y uniéndolos mediante segmentos.
Ejemplo
Las temperaturas en un día de invierno en la ciudad de Guatemala han sufrido
las siguientes Variaciones:
Poligono de Frecuencia Datos Agrupados
Polígono de frecuencias Velocidad en Km/h de 35 automóviles
16
14
velocidad
f
60 – 69
5
70 – 79
6
80 – 89
14
90 – 99
8
100 – 109
1
6
110 – 119
1
4
12
Vehículos
10
8
Ряд1
2
0
59,5
69,5
79,5
89,5
99,5
Velocidad
109,5
119,5
129,5
Polígonos de frecuencia para datos agrupados
Es un gráfico de líneas trazado sobre las marcas de clase.
Ejemplo
El peso en libras de 65 personas adultas viene dado por la siguiente tabla:
Ejemplo: con la tabla de frecuencias de las velocidades en Km/h
de varios automóviles, haremos el polígono de frecuencia
acumulada
40
Velocidad
f
fa
35
60 – 69
5
5
30
70 – 79
6
11
25
80 – 89
14
25
20
90 – 99
8
33
100 – 109
1
34
110 – 119
1
35
Ряд1
15
10
5
0
69,5
79,5
89,5
99,5
109,5
119,5
DIAGRAMA DE SECTORES


Esta gráfica se utiliza para representar variables
cualitativas y sirve para hacer notar las diferencias de
las proporciones o porcentajes en que está dada la
distribución.
La comparación es efectiva, siempre que los
segmentos sean suficientemente grandes para
permitir comparaciones.
Líneas Telefónicas
23,61%
41,11%
Zacapa
35,28%
Chiquimula
Jutiapa
EXAMEN CORTO #1
Materiales y Equipo a utilizar:
1. Hoja de laboratorio
2. Lápiz o Lapicero
3. Calculadora
4. Computadora
Descargar