Media, mediana, moda y otras medidas de tendencia central

Anuncio
Media, mediana, moda
y otras medidas
de tendencia central
CAPÍTULO 3
N O T A C I O N DE I N D I C E S
Denotemos por X (léase "X sub/') cualquiera de los N valores X X , X ,..., X que tom;
una variable X. La letra j en X que puede valer 1,2, 3,..., N se llama subíndice. Es claro qut
es posible emplear cualquier otra letra en vez de j; por ejemplo, i, k, p, q o s.
}
lt
2
3
N
p
N O T A C I Ó N DE S U M A T O R I A
El símbolo X^=i Xj denota la suma de todos los X¡ desde j = 1 hasta j = N; por definición.
N
J2x = x +x + x + --. + x
J
]
2
i
N
7=1
Cuando no ocasione confusión, se denotará esa suma simplemente con £ X Y,X¡ o X , X.
El símbolo X es la letra griega sigma mayúscula, que significa suma.
N
EJEMPLO
1
TX¡Y = X Y +X Y +X Y
EJEMPLO
2
YaX = aX +aX + ---+aX = a(X +X + ---+X ) = a'LX
Í
1
1
2
2
3
3
+ • • • + XY
N
N
N
N
j
i
1
N
i
2
N
J
donde a es una constante. Más simple: ^aX = a ^X.
EJEMPLO
3
Si a, b y c son constantes, entonces Z(aX + ¿ y - c Z ) = a XX + b X Y - C X Z (véase el problema 3.3 i
PROMEDIOS O MEDIDAS DE TENDENCIA CENTRAL
Un promedio es un valor típico o representativo de una conjunto de datos. Como tales valores suelen situarse hacia el centro del conjunto de datos ordenados por magnitud, los promedios se conocen como medidas de tendencia central.
La media
aritmética
ponderada
59
•
Se definen varios tipos, siendo los más comunes la media aritmética, la mediana, la
moda, la media geométrica y la media armónica. Cada una tiene ventajas y desventajas,
según los datos y el objetivo perseguido.
LA M E D I A A R I T M É T I C A
La media aritmética, o simplemente media, de un conjunto de N números X . A
se denota por X (léase "X barra") y se define por
N
__x +x
l
i
N =
N
EJEMPLO 4
(/)
U
+ x + -.. + x
2
N
N
La media aritmética de los números 8, 3, 5, 12 y 10 es
-
8 + 3 + 5 + 12+ 10
x=
38
„.
= y = 7-6
Si los números X X ,...,X
o c u r r e n / ¡ , / , . . . , / K veces, respectivamente (es decir, con
frecuencias/,, f ,.. .,f ), la media aritmética es
lt
2
x
=
2
K
2
K
Em
AXl+f X
2
+ ---+f X
2
/i
K
•./:
•••••
K
=
U
JK
YJX_
=
A .
=
Zfx
E/
(2)
N
j=¡
donde N - X / e s la frecuencia total (es decir, el número total de casos).
EJEMPLO 5
Si 5, 8, 6 y 2 ocurren con frecuencias 3, 2, 4 y 1, en ese orden, su media aritmética es
_ (3)(5) + (2)(8) + (4)(6) + (1)(2)
3 + 2 + 4+1
15 + 16 + 24 + 2
10
=
LA M E D I A A R I T M E T I C A P O N D E R A D A
A veces se asocia a los números X X ,...,X
ciertos/actores de peso (o pesos) w„w ,... ,w ,
dependiendo de la influencia asignada a cada número. En tal caso,
U
2
K
2
- _ W\X\ + w X +
2
2
W\ + w
2
hw X
K
k
_ Y,wX
+ • • • + w
53
K
K
( 3 )
w
se llama media aritmética ponderada con pesos f\,f-¿,...,f .
Obsérvese la similitud con la
ecuación (2), que puede considerarse una media aritmética ponderada con pesos /,,/;.. .,fiK
EJEMPLO 6
Si el examen final de un curso cuenta tres veces más que una evaluación parcial y un estudiante obtiene una calificación de 85 en el examen final, y 70 y 90 en los dos parciales, la calificadas
media es
x
=
(l)(70) + (l)(90) + (3)(85)
415
r+T+1
~^~
8 3
c
60
CAPITULO
3
Media, mediana,
moda
y otras
medidas
de tendencia
central
P R O P I E D A D E S D E LA M E D I A A R I T M E T I C A
1.
EJEMPLO 7
La suma algebraica de las desviaciones de un conjunto de números con respecto a su
media aritmética es cero.
Las desviaciones de los números 8, 3, 5, 12 y 10 en relación con su media aritmética 7.6 son 8 - 7.6,
3 - 7.6,5 - 7.6,12 - 7.6 y 10 - 7.6, o sea, 0.4, -4.6, -2.6,4.4 y 2.4, con suma algebraica 0.4 - 4.6 - 2.6
+ 4.4 + 2.4 = 0.
2.
La suma de los cuadrados de las desviaciones de un conjunto de números X¡ con respecto de un cierto número a es mínima si y sólo si a =X (véase el problema 4.27).
3.
S i / , números tienen media m , , / números tiene media m ,...,f números
m , entonces la media de todos los números es
2
2
K
tienen media
K
X
=
/ i
m
' +/2™2 + • • • +ÍKm
(4)
K
A+Í2 + --- +A
es decir, una media aritmética ponderada de todas las medias (véase el problema 3.12).
4.
Si A es una media aritmética supuesta o conjeturada (que puede ser cualquier número)
y si dj = X¡- A son las desviaciones de X¡ respecto de A, las ecuaciones (/) y (2) se
convierten, respectivamente, en
E4
X =A
X =A +
= A+
E fA
M
K
E¿
A+
(5)
N
(6)
N
7=1
donde N = XjLi f¡ ~ X / Observe que las fórmulas (5) y (6) se resumen en la ecuación
X = A + d (véase el problema 3.18).
C Á L C U L O DE LA M E D I A A R I T M É T I C A
PARA D A T O S A G R U P A D O S
Cuando los datos se presentan en una distribución de frecuencias, todos los valores que caen
dentro de un intervalo de clase dado se consideran iguales a la marca de clase, o punto medio
del intervalo. Las fórmulas (2) y (6) son válidas para tales datos agrupados y se interpretan
Xj como la marca de clase,/ como su correspondiente frecuencia de clase, A como cualquier
marca de clase conjeturada o supuesta y d , = X¡ -A como las desviaciones de X respecto de A.
Los cálculos con las fórmulas (2) y (ó) se llaman métodos largos y métodos cortos,
respectivamente (véanse los problemas 3.15 y 3.20).
Si todos los intervalos de clase son del mismo tamaño c, las desviaciones d¡ = X¡-A
pueden expresarse como cu,, donde u¡ serían números enteros positivos, negativos o cero, es
decir, 0, ± 1 , +2, ± 3 , . . . , y la fórmula (6) se convierte en
t
]
La moda
•
61
que es equivalente a la ecuación X = A + cü (véase el problema 3.21). Esto se conoce como
método de codificación para calcular la media. Es un método corto y debe usarse siempre
para datos agrupados con intervalos de clase de tamaños iguales (véanse los problemas 3.22
y 3.23). Véase que en el método de codificación los valores de la variable X se transforman
en los valores de la variable u de acuerdo con X = A + cu.
LA M E D I A N A
La mediana de un conjunto de números ordenados en magnitud es el valor central o la
media de los dos valores centrales.
El conjunto de números 3, 4, 4, 5, 6, 8, 8, 8 y 10 tiene mediana 6.
El conjunto de números 5, 5, 7, 9, 11, 12, 15 y 18 tiene mediana |(9 + 11)= 10.
Para datos agrupados, la mediana, obtenida por interpolación, está dada por
(1.
2
Mediana = L +
\c
X
(8)
fren
V
donde:
L¡ = frontera inferior de la clase de la mediana (es decir, la clase que contiene a
la mediana)
N = número de datos (es decir, la frecuencia total)
(X/)i = suma de las frecuencias de las clases inferiores a la clase de la mediana
/meda
ina = frecuencia de la clase de la mediana
c - tamaño del intervalo de clase de la mediana
Geométricamente, la mediana es el valor de X (abscisa), que corresponde a la recta
vertical que divide un histograma en dos partes de área igual. Ese valor de X suele denotarse
por X.
LA M O D A
La moda de una conjunto de números es el valor que ocurre con mayor frecuencia; es decir,
el valor más frecuente. La moda puede no existir e incluso no ser única.
El conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12 y 18 tiene moda 9.
El conjunto 3, 5, 8, 10, 12, 15 y 16 carece de moda.
El conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7 y 9 cuenta con dos modas, 4 y 7, y se le conoce como bimodai.
La distribución con una sola moda se llama unimodal.
En el caso de datos agrupados donde se haya construido una curva de frecuencia-, r e ajustar los datos, la moda será(n) el(los) valor(es) de X correspondiente(s) al(os) máximo» s i
de la curva. Ese valor de X se denota por X.
La moda llega a obtenerse de una distribución de frecuencias o de un hh: _
partir de la fórmula:
CAPÍTULO
3
•
Media,
mediana,
moda
y otras medidas
de tendencia
central
donde
L¡ = frontera inferior de la clase modal (clase que contiene a la moda)
A i = diferencia de la frecuencia modal con la frecuencia de la clase inferior inmediata.
A = diferencia de la frecuencia modal con la frecuencia de la clase superior inmediata.
c = tamaño del intervalo de la clase modal.
2
RELACION EMPIRICA ENTRE MEDIA,
MEDIANA Y MODA
Para curvas de frecuencia unimodales, que sean moderamente sesgadas o asimétricas, se
tiene la siguiente relación empírica:
Media - moda = 3(media - mediana)
(10)
Las figuras 3-1 y 3-2 indican las posiciones relativas de la media, la mediana y la moda
para curvas de frecuencia sesgadas a la derecha y a la izquierda, respectivamente. Para
curvas simétricas, los valores de la media, la mediana y la moda coinciden.
F I G U R A 3-1
FIGURA 3-2
LA M E D I A G E O M E T R I C A G
La media geométrica G de un conjunto de /V números positivos X¡, X , X ,..., X es la raíz Nésima del producto de esos números:
2
G — \/ X\X X
2
EJEMPLO 1 3
3
' ' ' X^¡
3
N
(11)
La media geométrica de los números 2, 4 y 8 es G = V(2)(4)(8) = ^ 6 4 = 4.
Puede calcular G por medio de logaritmos (véase el problema 3.35) o con una calculadora. Para la media geométrica de datos agrupados, véanse los problemas 3.36 y 3.91.
LA M E D I A A R M O N I C A H
La media armónica H de un conjunto de números X,, X , X ,,
media aritmética de los recíprocos de los números:
2
H
1
3
X es el recíproco de la
N
N
(12)
X
Cuartiles,
deciles
y
percentiles
En la práctica puede ser más fácil recordar que
1
H
EJEMPLO
14
1
NT
'
N^XV
AI ¿—'
La media armónica de los números 2, 4 y 8 es
" = r T ^ T T = 7 = 3-43
2
~<~
4
~*~
8
8
(Para la media armónica de datos agrupados, véanse los problemas 3.99 y 3.100.)
R E L A C I Ó N ENTRE L A S M E D I A S A R I T M É T I C A ,
GEOMÉTRICA Y ARMÓNICA
La media geométrica de un conjunto de números positivos X , X ,..., X es menor o igual a
su media aritmética, pero es mayor o igual a su media armónica. Es decir,
{
2
N
H<G<X
(14)
Los signos de igualdad se incluyen sólo si todos los números X X ,..., X son idénticos.
u
EJEMPLO
15
2
N
El conjunto 2, 4, 8 tiene media aritmética de 4.67, media geométrica de 4 y media armónica de 3.43.
LA M E D I A C U A D R A T I C A (MC)
La media cuadrática (MC) de un conjunto de números X¡, X ..., X algunas veces se simbo2>
N
liza por \ÍW y se define como
N
Este tipo de promedio se utiliza con frecuencia en aplicaciones físicas.
EJEMPLO
16
La MCdel conjunto 1,3,4,5y7es
l 2
+
3 2 +
4
:
+
5 2 +
7 2
= v/20 = 4.47
CUARTILES, DECILES Y PERCENTILES
Si un conjunto de datos se ordena de acuerdo con su magnitud, el valor central (o la media
aritmética de los dos valores centrales) que divide al conjunto en dos partes iguales es la
mediana. Extendiendo esta idea, es posible considerar los valores que dividen al conjunto
en cuatro partes iguales. Estos valores, denotados por Q¡, Q y Q , se denomir..
primero, segundo y tercer cuartiles, respectivamente, donde Q es igual a la mediana.
De forma similar, los valores que dividen los datos en 10 partes iguales son Oaaados
deciles, los cuales se denotan por D,, D ,..., D , mientras que los valores que divide» a tos
datos en 100 partes iguales se conocen como percentiles y se indican con P
2
2
2
9
3
64
CAPÍTULO
3
•
Media,
mediana,
moda
y otras
medidas
de tendencia
central
quinto decil y el 50o. percentil coinciden con la mediana. Los percentiles 25o. y 75o. corresponden al primero y tercer cuartiles, respectivamente.
De manera conjunta, cuartiles, deciles y percentiles, lo mismo que otros valores obtenidos por medio de subdivisiones iguales de los datos, son denominados cuantiles. Para el
cálculo de éstos, a partir de datos agrupados, véanse los problemas 3.44 al 3.46.
Descargar