material de estudio: medidas de tendencia central

Anuncio
Notas de clase: Rénember Niño C.
CAPÍTULO IV
MEDIDAS DE TENDENCIA CENTRAL Y DE POSICION
4.1 MEDIDAS DE TENDENCIA CENTRAL
Hemos analizado como a partir de tablas y gráficos puede presentarse la información
que es objeto de estudio.
Las medidas de tendencia central son valores representativos de un conjunto de
datos que tienden a estar localizados en aquella parte de la distribución donde los
datos tienden a aglomerarse.
Las medidas de tendencia central más usadas son la media, la mediana y la moda.
4.1.1 MEDIA ARETMÉTICA
La media aritmética o promedio o simplemente media es la medida de tendencia
central más importante y la más usada.
La media aritmética se define como la suma de todos los datos dividida entre el
número total de datos.
Si la media aritmética se calcula a partir de todos los datos de una población, se tiene
la media aritmética poblacional el cual es un parámetro.
Si se calcula a partir de los datos de una muestra, se tiene la media muestral
Si
por:
son los datos de una población, la media poblacional
̅.
está dada
∑
Si
̅
son los datos de una muestra, la media muestral ̅ está dada por:
∑
1
Notas de clase: Rénember Niño C.
Ej. Los ingresos diarios en miles de pesos de 4 personas son: 10, 12, 18 y 20, su
ingreso promedio es:
̅
Lo que indica que en promedio las cuatro personas ganan diariamente $15.000.oo
Si los datos se presentan en una tabla de frecuencias, entonces la media se calcula
mediante la expresión:
̅
∑
donde los fi representan la frecuencia absoluta de cada dato
xi.
Ejemplo:
Los siguientes datos representan el peso de 10 personas. Calcule el peso promedio
de esas personas.
Peso(Xi)
Nímero de personas (fi)
45
2
50
3
55
4
60
1
TOTAL
n=10
2
Notas de clase: Rénember Niño C.
La media se calcula como:
̅
∑
52 es el peso promedio de las 10 personas.
Se los datos presentan una importancia o peso (Wi) dentro del grupo, entonces la
media se calculará por la expresión:
̅
∑
∑
Un caso común son las notas de estudiantes universitarios. Los créditos académicos
constituyen un peso o importancia dentro de cada materia.
Calcula el promedio de los datos dados a continuación:
MATERIA
Nota(Xi)
Nímero de Crédiots (wi)
Matemáticas
4.5
2
Investigación
5.0
3
Estadística
3.0
4
Sociología
1.0
1
TOTAL
n=10
La nota promedio se calcula como:
3
Notas de clase: Rénember Niño C.
̅
∑
∑
4.1.1.1 PROPIEDADES DE LA MEDIA ARITMÉTICA
1. La suma de las desviaciones de cada dato con respecto a la media es igual a cero.
Esto es:
∑(
̅)
Tomemos el ejemplo de las notas de cuatro estudiantes universitarios: 3.0, 5.0, 3.0,
4.0
Para estos datos tenemos que: ̅
Las desviaciones de los datos y su suma se muestran a continuación:
3.0-3.5= - 0.5
4.0-3.5= 0.5
2.0-3.5 = -1.5
5.0-3.5 = 1.5
Observamos que:
∑(
̅)
(
)
4
Notas de clase: Rénember Niño C.
2. La media de una muestra a cuyos datos se suma o resta una constante es igual a
la media de los datos originales , más o memos el valor de la constante.
Ejemplo:
Los siguientes datos representan la altura en cm. Que alcanzaron unas matas de maíz
que se sometieron a un tratamiento químico:
1.82
1.75
1.47
1.71
1.27
1.34
1.73
1.83
1.63
1.94
1.76
1.82
1.82
1.74
Para estos datos la media es:
̅
Suponga ud. Que las mediciones estuvieron mal hechas y que debemos restar 15 cm.
A cada dato. ¡Cuál es entonces la verdadera media?
̅
es entonces la verdadera media.
3. Cuando disponemos de una muestra de tamaño n, dividida en varios subgrupos,
podemos hallar la media general si disponemos de la media y del tamaño de cada
subgrupo mediante la expresión:
̅
(
̅
̅
̅
̅ )
Ejemplo:
Consideremos cuatro submuestras del peso en libras de 15 peces así:
Sub Muestra 1
1.5
1.7
1.8
1.9
2.0
2.2
Sub Muestra 2
1.7
1.8
1.9
Sub Muestra 3
1.8
1.9
2.0
2.3
Sub Muestra 4
1.6
2.0
Si calculamos la media para el total de observaciones encontramos que:
5
Notas de clase: Rénember Niño C.
̅
Por otro lado, si calculamos la media para cada sub muestra, obtenemos
̅̅̅
, es la media para la sub muestra 1
̅̅̅
, es la media para la sub muestra 2
̅̅̅
, es la media para la sub muestra 3
̅̅̅
, es la media para la sub muestra 4
Con estos datos podemos calcular la media para el total de observaciones, mediante la
expresión:
̅
(
̅
̅
̅
̅ )
( (
)
(
)
(
)
(
))
Valor que coincide con el obtenido si sumamos todos los datos y dividimos por el total de datos,
que es 15.
4.1..2 MEDIANA
Esta medida de tendencia central es poco utilizada, pero en estudios estadísticos
avanzados, es de bastante importancia.
La mediana es el valor que divide a una muestra ordenada, en dos partes iguales, de
tal forma que “la mitad de los valores son menores que el valor de la mediana y la
otra mitad son mayores que el valor de la mediana “La simbolizamos por (Me).
6
Notas de clase: Rénember Niño C.
4.1.1.2 CÁLCULO DE LA MEDIANA PARA DATOS NO AGRUPADOS
a). NÚMERO IMPAR DE OBSERVACIONES:
Supongamos que el peso en libras de 7 cachamas, tomadas al azar de un estanque
arrojó los siguientes datos:
2.1, 3.2,
2.4,
3.0,
2.8,
2.9,
2.7
Ordenando los datos tenemos:
2.1
2.4
2.7
2.8
2.9
3.0
3.2
Mediana
El valor central es 2.8, el cual es la mediana.
Luego, Me =2.8 lo que significa que el 50% o menos de las cachamas tiene menos de
2.8 libras y que el otro 50% ó menos tiene más de 2.8 libras.
Este mismo resultado lo hubiéramos obtenido si aplicamos la relación:
(n+1)/2=(7+1)/2=4, donde 4 es la posición que ocupa el valor 2.8 una vez se ha
ordenado la muestra.
b). NÚMERO PAR DE OBSERVACIONES:
Cuando el número de observaciones es par, la mediana es igual al promedio de los
dos valores centrales, es decir, el valor resultante de la suma de las dos
observaciones centrales dividida por dos.
Ejemplo:
Supongamos que el número de días que llovió en San Bernardo en cada uno de
los meses fueron los siguientes:
7
Notas de clase: Rénember Niño C.
3 5 1 0 1 4 7 3 1 1 0 4
Ordenando tenemos:
0 0 1 1 1 13 3 4 4 5 7
Como n= 12 es par, entonces:
Me = (1+3)/2=2
Lo cual significa que en San Bernardo en la mitad de los meses llovió menos de
dos días y en la otra mitad llovió más de dos días.
III.2.2 MEDIANA PARA DATOS AGRUPADOS
Si los datos han sido agrupados en intervalos, no es posible obtener la mediana por
el procedimiento estudiado, puesto que la identidad de los datos se perdió al quedar
agrupados y no podemos determinar que dato o que datos ocupan posiciones
centrales. En este caso hallamos un valor que divide en partes iguales, siguiendo los
siguientes pasos:
Paso 1.
Buscamos la clase donde se encuentra la mediana. Para esto buscamos en la columna
de las frecuencias absolutas acumuladas el intervalo donde se encuentra el valor:
Paso 2.
Una vez seleccionado el intervalo donde se encuentra la mediana, procedemos a
calcular este valor mediante la expresión:
(
)
Donde:
8
Notas de clase: Rénember Niño C.
= Límite inferior del intervalo mediano
C= Amplitud o ancho de cada intervalo de clase
n= número de datos
= Frecuencia absoluta acumulada hasta el intervalo anterior al intervalo
mediano.
= Frecuencia absoluta del intervalo mediano.
Para calcular la mediana en este caso, tengamos en cuenta la siguiente tabla:
Tabla3.1
Peso en Kg. de una muestra de peces.
Peso (Kg)
Marca de Clase
1.5-1.7
1.7-1.9
1.9-2.1
2.1-2.3
1.6
1.8
2.0
2.2
Frecuencia
Absoluta
2
8
3
2
15
Frecuencia
Absoluta
Acumulada
2
10
13
15
Intervalo mediano
PROCEDIMIENTO:
a). Hallamos la mitad de las observaciones:
b). Localizamos el resultado n/2 anterior en la columna de las frecuencias absolutas
acumuladas. Este valor se encuentra en el segundo intervalo, ya que en primer
intervalo la columna de las frecuencias absolutas acumuladas llega hasta 2 y es de
suponerse que los valores del 3 al 10 se encuentran en el segundo intervalo.
9
Notas de clase: Rénember Niño C.
c). El segundo intervalo es llamado intervalo mediano, puesto que en el debe
encontrarse el valor de la mediana, el cual debe estar comprendido entre 1.7 y 1.9.
Luego tenemos que:
Li = 1.7
C= 0.2, el cual se obtiene de 1.9 – 1.7 =0.2 que es el ancho de clase.
N=15 es el número total de datos
Fme-1 = Es la frecuencia absoluta acumulada hasta el intervalo anterior al mediano.
Fme-1 = 8 es la frecuencia absoluta del intervalo mediano.
Luego:
(
)
Me=1.7 + 0.2 * (15/2 – 2)/8
Me= 1.8375
Luego: Me = 1.8375
Se considera que la mitad de los peces tiene menos de 1.8375 y que la otra mitad
tiene más de 1.8375 Kg.
III.3 MODA
Llamaremos moda al dato que más se repite en una muestra, es decir a aquel de
mayor frecuencia absoluta.
Ejemplo III.3.1
El número de hijos de 5 familias son:
2 1 0 3 2
En este caso la moda es 2, significa que el número de hijos más frecuente es 2.
10
Notas de clase: Rénember Niño C.
Ejemplo III.3.2
Los siguientes datos representan el peso en Kgs. De ocho alumnos de décimo grado:
56 54 57 57 54 55 53 58
Observamos que hay dos valores que más se repiten, ellos son, 54 y 57, es decir hay
dos modas. Cuando una distribución de frecuencias tiene dos modas, se dice que es
Bimodal, si tiene tres modas se denomina Trimodal, etc.
En general cuando una distribución de frecuencias tiene más de tres modas, se
denomina Multimodal.
Cuando los datos están agrupados en grupos o intervalos de clase, tomaremos como
moda la marca de clase del intervalo que tenga mayor frecuencia absoluta.
Ejemplo:
La moda para los datos de la tabla II.2.1 es 1.8, que es la marca de clase del intervalo
con mayor frecuencia absoluta.
EJERCICIOS DE LA UNIDAD III
1. Calcula el peso promedio de los integrantes de tu grupo de trabajo.
2. Calcula la nota promedio obtenida en el semestre anterior, de uno de los integrantes
de tu grupo de trabajo. Explica cómo lo hiciste.
3. Cuatro grupos de estudiantes consistentes de 15, 20, 10 y 18 alumnos dieron pesos
promedios de 162, 148, 153 y 140 libras respectivamente. Hallar el peso promedio
de todos esos estudiantes.
4. Para un mismo conjunto de datos un estudiante encontró X =28.5, sin agrupar los
datos y otro encontró ̅
, agrupando los datos. Cual media es más exacta, por
qué?
5. Un tecnólogo encontró que la media para un grupo de datos es ̅
. Después
se dio cuenta que los datos estaban equivocados y que los pesos se excedieron en 2
Kg, Cuál es entonces la verdadera media?
11
Notas de clase: Rénember Niño C.
6. Halla la media, mediana y moda para las tablas de los incisos a y b del ejercicio 8 de
la unidad de la unidad II. Interpreta estas medidas.
7. La duración en horas, de 1000 bombillas se indica en la siguiente tabla.
Duración (Horas)
400-450
450-500
500-550
550-600
600-650
650-700
700-750
750-800
Frecuencia
30
100
175
225
180
125
100
65
a. Calcular la duración promedio de una bombilla e interpretar
b. Determinar la moda e interpretar
c. Determinar el valor de la mediana e interpretar.
12
Descargar