Objetivos Atributos cualitativos y cuantitativos

Anuncio
Objetivos
⇒ Las observaciones recogidas en una muestra contienen la información que ha sido adquirida pero el significado
de esta información puede ser difícil de determinar simplemente por inspección.
⇒ En los temas 3 y 4 mostramos modos de resumir los datos, que se complementan mutuamente.
Atributos cualitativos y cuantitativos
⇒ La descripción gráfica adecuada depende del tipo de variable:
⇒ Variable cualitativa: sin carácter numérico intrínseco.
⇒ Variable cuantitativa: con carácter numérico intrínseco.
⇒ Cualitativo discreto: puede tener a lo sumo una cantidad numerable de valores distintos.
⇒ Cualitativo continuo: toma valores en intervalos de la recta real.
⇒ Hay unos datos que son por naturaleza discretos y no pueden ser continuos de ningún modo:
⇒ Número de hermanos, número de dedos, número de clientes…
⇒ Sin embargo, hay otros datos de tipo discreto que pueden tratarse como continuos:
⇒ Número de huevos de pescado encontrados…
⇒ Suele tratarse de datos en los que las diferencias entre datos vecinos son tan pequeñas que realmente no nos
importan.
⇒ La distinción entre variables continuos y discretas no es rígida en ocasiones. Después de todo, las variables
físicas siempre se redondean.
⇒ Ejercicio:
⇒ Sexo  discreto
⇒ Número de muelas extraídas a una persona  discreto
⇒ Peso  continuo
⇒ Grupo sanguíneo  discreto
⇒ Número de glóbulos rojos  discreto, pero se puede tratar como continuo
⇒ Temperatura  continuo
⇒ Edad  continuo, pero se trata como discreto
⇒ Ejemplo: Datos de una encuesta sobre atención hospitalaria:
⇒ ¿Está satisfecho con los servicios prestados en el hospital?
a) Marcar en la escala (continuo)
0
1
2
3
4
Nada
b)
5
Completamente
Cruz en el cuestionario (discreto)
0
1
2
Nada
Poco
Regular
3
4
5
Bastante
Mucho
Completamente
Descripción gráfica de la muestra completo: diagrama de puntos
⇒ Se traza un eje (horizontal) en el que se representa los valores de la variable.
⇒ Se dibuja un punto por cada dato sobre el correspondiente valor.
⇒ Sólo para variables discretas.
Tablas de frecuencias sin agrupar
⇒ Variables cualitativas o cuantitativas discretas.
⇒ Sean:
⇒ vi = valores posibles de la variable.
⇒ ni = frecuencia absoluta (número de datos con valor vi)
⇒ fi = frecuencia relativa (porcentaje o proporción de datos vi)
⇒ N = tamaño muestral (número de individuos de la muestra)
⇒ Si la variable tiene un orden intrínseco:
⇒ Ni = frecuencia absoluta acumulada (número de datos con valor no superior a vi)
⇒ Fi = frecuencia relativa acumulada (porcentaje o proporción de datos con valor no superior a vi).
⇒ La tabla de valores sin agrupar es:
vi
v1
v2
…
vn
ni
n3
n2
…
nn
Ni
N1
N2
…
Nn
fi
f1
f2
…
fn
Fi
F1
F2
…
Fn
Diagrama de sectores
⇒ Se dibuja un círculo y en él se traza, para cada valor de la variable vi, un sector circular de área proporcional a
ni.
Diagrama de barras
⇒ Se representa un eje horizontal y todos los valores de la variable v1, v2,… vn
⇒ Sobre cada vi se dibuja una barra perpendicular al eje de longitud proporcional a ni.
⇒ Ejemplo: Datos sobre la encuesta sobre “atención hospitalaria”
⇒ Valores posibles: 0, 1, 2, 3, 4, 5
⇒ Muestra: 0, 1, 5, 4, 3, 3, 0, 3, 2, 1
⇒ Diagrama de puntos
0
1
2
3
4
5
⇒ Tabla de frecuencias (sin agrupar)
vi
0
1
2
3
4
5
ni
2
2
1
3
1
1
fi
0,20
0,20
0,10
0,30
0,10
0,10
Ni
2
4
5
8
9
10
Fi
0,2
0,4
0,5
0,8
0,9
1,0
⇒ Diagrama de sectores
4
10%
3
30%
5
10%
0
20%
1
20%
2
10%
⇒ Diagrama de barras
3
2,5
2
1,5
1
0,5
0
0
1
2
3
4
5
Tablas de frecuencias agrupadas
⇒ Variables cuantitativas continuas o discretas con muchos valores diferentes)
1) Ordenamos los datos de menor a mayor y determinamos el mínimo y el máximo, (todos los datos están
entre estos valores)
2) Dividimos el intervalo [mínimo, máximo] en m (un número “sensato”) subintervalos disjuntos: I1, I2… In el
número de intervalos m se elige razonable:
m ≈ √n
3) Se define:
⇒ ni: número de datos en Ii
⇒ fi: proporción de datos en Ii
⇒ Ni: número de datos en intervalos no posteriores a Ii
⇒ Fi: proporción de datos en intervalos no posteriores a Ii.
⇒ La tabla de frecuencias agrupadas en intervalos es una tabla de la forma:
Ii
I1
I2
…
In
ni
n3
n2
…
nn
Ni
N1
N2
…
Nn
fi
f1
f2
…
fn
Fi
F1
F2
…
Fn
Histograma
⇒ Gráfica que puede dibujarse a partir de la tabla de frecuencias agrupadas.
⇒ Se representan en un eje horizontal los intervalos elegidos: I1, I2… In
⇒ Se dibuja, sobre cada intervalo, un rectángulo de área proporcional a la frecuencia correspondiente al intervalo.
Polígono de frecuencias acumuladas
⇒ Cada intervalo Ii = [ai, bi] dibujamos el punto (bi, Fi) y unimos todos los puntos mediante una poligonal. “bi” es el
extremo superior del intervalo.
⇒ xo = valor de una observación  altura de xo indica el número de observaciones (o el porcentaje si es Fi) que
toman valores ≤ xo.
Percentil de orden p
⇒ Es el valor de la variable (continua) para el que el polígono de frecuencias acumuladas proporciona un valor p.
⇒ El 100.p porcentaje de los datos que toman valores no superiores al del percentil de orden p.
⇒ Si el percentil de orden p = 20 es xo = 17  el 20% de los datos de la muestra toman valores menores o
iguales a x0 = 17.
⇒ Ejemplo:
⇒ Variable = estaturas de los hombres
69
60
69
72
72
71
76
71
72
72
72
73
69
70
72
75
72
73
71
68
71
70
75
71
67
70
72
72
70
72
74
67
72
67
70
69
72
69
70
74
70
74
74
Tabla de frecuencias agrupadas
Ii
[60, 62[
[62, 64[
[64, 66[
[66, 68[
[68, 70[
[70, 72[
[72, 74[
[74, 76[
ni
1
0
0
3
6
12
13
7
Ni
0,024
0
0
0,071
0,143
0,286
0,310
0,166
fi
1
1
1
4
10
22
35
42
Fi
0,024
0,024
0,024
0,095
0,238
0,524
0,833
1
14
12
10
8
6
4
2
0
[60, 62[ [62, 64[ [64, 66[ [66, 68[ [68, 70[ [70, 72[ [72, 74[ [74, 76[
Descargar