medidas de posición - Escuela de Estadística

Anuncio
UNIVERSIDAD DE COSTA RICA
ESCUELA DE ESTADÍSTICA
Prof. Olman Ramírez Moreira
MEDIDAS DE
POSICIÓN
FUENTE:
Gómez, Elementos de Estadística Descriptiva
Levin & Rubin. Estadística para Administradores
1
XS-0111
OBJETIVO
Utilizar la estadística para describir una
colección de datos
Emplear la media, la mediana, la moda y
los cuantilos para describir cómo se
“amontonan” los datos
Calcular las medidas de posición a partir de
conjuntos de datos, en datos agrupados y
empleando programas de cómputo
2
XS-0111
UTILIDAD
Necesidad de disponer medidas que resuman o
condensen los datos
Propósito:
resumir en un solo número la posición o localización
de la distribución
caracterizar y representar un conjunto de datos
Valores típicos son los situados en la parte central
de la distribución. También conocidos como medidas
de tendencia central o promedios
Medidas de posición más utilizadas:
3
Media aritmética o promedio
Mediana
Moda
Cuantilos
XS-0111
DATOS NO AGRUPADOS Y
AGRUPADOS
Los cálculos de las estadísticas pueden resultar sencillos si el
conjunto de datos es pequeño
Un conjunto de datos ya de cierto tamaño hace que los cálculos
resulten lentos y con probabilidades de errores al operar con
ellos
Los datos se agrupan en una distribución de frecuencias: tabla
que indica la cantidad de datos en cada una de las clases
definidas.
Cada dato cae dentro de solo una de esas clases
No conocemos el valor individual de cada dato
Calculamos una estimación de la medida de posición (ante la sencillez se
sacrifica la precisión
Se requiere de una manera distinta de calcular las medidas de
posición:
Distribuciones de frecuencias (si los datos están agrupados
XS-0111
4
Programas
de computación
DATOS SIN AGRUPAR
Visitas diarias hechas al sitio WEB de Estudios sobre
Diversidad Cultural en el primer cuatrimestre del 2007
22
22
23
24
25
26
26
26
27
27
27
28
28
28
29
5
30
30
30
30
30
30
30
31
31
31
31
31
32
32
33
33
33
33
34
34
34
34
35
35
35
35
35
35
35
35
35
35
35
35
36
36
36
37
37
37
37
38
38
38
38
XS-0111
38
38
38
38
38
38
39
39
39
40
40
40
40
40
40
40
41
41
42
42
42
42
43
43
43
44
44
45
45
45
45
45
45
46
46
47
47
47
47
47
48
48
48
49
49
49
50
50
52
52
52
52
53
53
54
55
61
62
64
72
DATOS AGRUPADOS
Visitas diarias hechas al sitio WEB de Estudios sobre
Diversidad Cultural en el primer cuatrimestre del 2007
Visitas (clases)
20 - 29
30 - 39
40 - 49
50 - 59
60 - 69
70 - 79
TOTAL
6
FRECUENCIA
Absoluta
Relativa
15
12,5
54
45,0
37
30,8
10
8,3
3
2,5
1
0,8
120
XS-0111
SIGNOS CONVENCIONALES
n
Tamaño de una muestra de la población de estudio
N
Número de elementos de la población de estudio
µ
Media de la población
x
Media de la muestra
n
∑X
X=
Cálculo de la media en una muestra
i
i =1
n
Cálculo de la media para la población
N
∑X
µ =
i
i =1
N
7
XS-0111
X
MEDIA ARITMÉTICA
Representación: X
Es el resultado de la suma de los valores del conjunto de análisis
entre el número de datos
Es sensible a todos los valores de una distribución, en especial a
los valores extremos altos y bajos
n
Forma de cálculo:
∑X
X =
i
i =1
n
Xi = X1, X2, . . ., Xn corresponden a los valores de la variable
En datos agrupados:
Calcular el punto medio de cada clase
k
Aplicar la fórmula:
X f
∑
X=
i
i
i =1
n
fi : frecuencia (número de datos) de cada clase
Xi : punto medio de la cada clase
8
XS-0111
Visitas diarias hechas al sitio WEB de Estudios sobre Diversidad Cultural en el primer
cuatrimestre del 2007
Visitas (clases)
20 - 29
30 - 39
40 - 49
50 - 59
60 - 69
70 - 79
TOTAL
9
Punto
medio
25
35
45
55
65
75
FRECUENCIA
Absoluta Relativa
15
12,5
54
45,0
37
30,8
10
8,3
3
2,5
1
0,8
120
FRECUENCIA ACUMULADA
Absoluta
15
69
106
116
119
120
Relativa
12,5
57,5
88,3
96,7
99,2
100,0
Xi * fi
375
1890
1665
550
195
75
4750
XS-0111
VENTAJAS Y DESVENTAJAS DE
LA MEDIA
VENTAJAS
Es un concepto familiar para mucha gente y es intuitivamente claro
Útil para varios procedimientos como la comparación de varios
conjuntos de datos
DESVENTAJAS
Puede verse afectada por la presencia de valores extremos que no
son representativos del conjunto de datos. En estos casos podría
resultar más representativo calcular la media sin tomar en cuenta el
valor extremo:
Es tedioso calcular la media si utilizamos todos los datos y el
conjunto de datos es grande
No se puede calcular si el conjunto de datos tiene clases extremas
abiertas (la inferior o la superior)
SUGERENCIA
Revisar los datos una vez registrados representándolos gráficamente 10
y decidir si la media tendráXS-0111
significado
MODA
Representación: Mo
Valor más común, más típico, que ocurre más frecuente-mente
en un conjunto de datos
No se ve afectada por la presencia de valores extremos bajos o
altos
Puede no existir o no estar definida. Esto es, puede no ser
única reducida utilidad y dificultad en interpretación
Puede también aplicarse a datos cualitativos
Cálculo en datos agrupados:
Identificar la clase modal (la clase con mayor frecuencia)
Aplicar la fórmula:
 d1
M o = Lmo + 
 d1 + d 2
11

 I mo

d1 = f Mo − f aMo
XS-0111
d 2 = f Mo − f pMo
MEDIANA
Representación: Me
Valor central de una serie de datos ordenados
Valor tal que no más de la mitad de las observaciones son menores que él y
no más de la mitad son mayores
Pasos para calcularla en datos sin agrupar
Ordenar los datos de acuerdo a su magnitud
Determinar el valor central de la serie, esto es, el término ubicado en la posición (n+1)/2
Si el número de datos es par, la Me corresponde al promedio de los valores centrales
Pasos para calcularla en datos agrupados:
Identificar la clase en que está la mediana (acumula el 50% de los datos)
Aplicar la fórmula respectiva
VENTAJA:
VENTAJA no se afecta tan intensamente como la media
SUGERENCIA:
SUGERENCIA La Me es mucho mejor que la media aritmética para eliminar
el efecto de elementos extremos
12
XS-0111
USO MEDIDAS POSICIÓN
La selección de cual medida utilizar depende de los propósitos perseguidos
La más utilizada en la media aritmética
Las medidas no compiten entre sí, sino que se complementan para proporcionar
una mejor descripción del conjunto de datos
Considerar la influencia de valores extremos al seleccionar medida
Distribución simétrica:
Mo, Me y X coinciden, tienen el mismo valor
Cualquiera es igualmente adecuada para caracterizar el grupo de datos
Distribución asimétrica (positiva o negativa):
Caracterizada por un alejamiento de la Me y en especial de la con respecto a la Mo
Resulta preferible utilizar la Mo y en especial la Me en estos casos
Mo < Me < X asimetría positiva
Mo > Me > X asimetría negativa
13
XS-0111
CUANTILOS
Dividen el conjunto ordenado de datos en fracciones específicas
Abarcan un conjunto de medidas: cuartiles, quintiles, deciles, percentiles, mediana
Cuartiles: dividen el conjunto de datos en cuartas partes
Q1valor tal que una cuarta parte de las observaciones son menores que él y ¾ partes mayores
Q2 = Me
Q3 supera a ¾ de las observaciones y solo es superado por una cuarta parte de ellas
Deciles dividen el conjunto de datos en décimas partes
Me = P50
Q3 = P75
D6 = P60
Percentiles dividen el conjunto de datos en centésimas partes
Deciles, cuartiles, quintiles constituyen casos particulares de percentiles:
Procedimiento de cálculo:
Ordenar los datos según magnitud
Identificar el percentil correspondiente al cuantilo buscado
Calcular el rango percentil, esto es, aplicar la fórmula siguiente para localizar la posición
correspondiente
m
Rango Pm =
x (n + 1)
100
de datos
14Ubicar el percentil buscado en el conjuntoXS-0111
CÁLCULO MEDIDAS DE POSICIÓN
Moda:
35
Mediana:
38
Promedio 38.96
Cuartil 1
33
Cuartil 3
45
Rango intercuartil
12
Quintil 3
40
Percentil 40
35
15
XS-0111
120
∑X
i =1
i
= : 4675
INTERPRETACIONES
Moda: El número de visitas más común al sitio WEB Estudios sobre diversidad en el
primer cuatrimestre del 2007 fue de 35 visitas diarias.
Mediana: En la mitad de los días del primer cuatrimestre del 2007 se recibieron 38
visitas o menos al sitio WEB Estudios sobre diversidad y la otra mitad de los días el
número de visitas diarias fue de 38 o más.
Promedio: El sitio WEB Estudios sobre diversidad recibió 38.96 visitas diarias en
promedio durante el primer cuatrimestre del 2007
Cuarti 1: En la cuarta parte (25%) de los días del primer cuatrimestre del 2007 se
recibieron 33 visitas o menos al sitio WEB Estudios sobre Diversidad, y en los
restantes tres cuartas partes (75%) de los días las visitas al sitio fueron 33 o más
diarias.
Cuarti 3: En las tres cuartas partes (75%) de los días del primer cuatrimestre del 2007
se recibieron 45 visitas o menos al sitio WEB Estudios sobre Diversidad, y en la
restante cuarta parte (25%) de los días las visitas al sitio fueron 45 o más diarias.
Quintil 3: En las tres quintas partes (60%) de los días del primer cuatrimestre del 2007
se recibieron 40 visitas o menos al sitio WEB Estudios sobre Diversidad, y en la
restante cuarta parte (25%) de los días las visitas al sitio fueron 45 o más diarias.
16
XS-0111
Descargar