Medidas de tendencia Central

Anuncio
Medidas de tendencia Central
7.1 Media
7.1.1 Media para un conjunto de datos no agrupados
Este parámetro lo usamos con tanta cotidianidad que nos será muy familiar, aunque
también aprenderemos algunas propiedades y mostraremos un teorema sumamente
importante.
Si tenemos el siguiente conjunto de datos y deseamos encontrar un valor que represente
a todo el conjunto, seguramente lo primero que vendrá a nuestra mente es sumar todos
13
los valores y dividirlos entre el número total de datos.
Ejemplo: Número de alumnados en la clase de Educación Física.
10, 9, 8, 10, 9, 9, 10, 9, 10, 9
Este valor, promedio aritmético, es conocido como la media y es una de las medidas de
tendencia central ya que representa un valor con respeto a toda la información.
Ejemplo para el cálculo de la media.
Sean los siguientes valores las calificaciones de la asignatura de Educación Física de
estudiantes de primer año:
10
8
6
8
6
6
6 7.5 7 7.5 8 9.5 10 10
9 10 7.5 6 9.5 10 6.5 8
9 10 7 8 9.5 5 8 7.5
Sumando los valores de las 30 calificaciones y dividiéndolas entre los 30 datos
obtendremos:
Por lo que la media de las calificaciones obtenidas por el grupo considerado es igual a 8.
Para datos agrupados la expresión de la media cambia ligeramente, como se muestra a
continuación.
7.1.2 Media para un conjunto de datos agrupados.
La media para datos agrupados es la siguiente:
Donde es el total de datos, m es el número total de clase y es la frecuencia de datos. La
definición es claramente entendida como una extensión de la definición que dimos para
datos no agrupados, ya que es lógico suponer que datos que se repiten con una
frecuencia pueden simplificar la suma por supuesto que los índices de la segunda suma
con respecto a la primera corren con respecto a menor número, es decir, con respecto al
número de agrupamientos m.
Ejemplo:
Goles anotados por el Querétaro durante la temporada. Sean los siguientes datos 1, 1, 2,
2, 4, 4, 5, 2, 3, 2, 3, 4, 1, 2, 1. La media para dichos datos es aproximadamente igual a
2.4666
Para la obtención de la media cuando las frecuencias están sujetas a la elección de clase
bajo los métodos mostrados, se realiza de igual manera, la única diferencia existe en
determinar el valor como el punto medio de cada estatura, veamos el siguiente ejemplo:
Tabla de frecuencias reportadas por un equipo de baloncesto con respecto a la estatura
de los jugadores.
7.2 Moda
13
7.2.1 Moda para datos agrupados
La moda es la medida que se relaciona con la frecuencia con la que se representa el
dato o los datos con mayor incidencia, por lo que se considera la posibilidad de que
exista más de un moda para un conjunto de datos. La notación más frecuente es la
siguiente: Moda y esta medida se puede aparecer tanto para datos cualitativos como
cuantitativos. Se dice que cuando un conjunto de datos tiene una moda la muestra es
unimodal, cuando tiene dos modas bimodal, cuando la muestra contiene mas de un
dato repetido se dice que es multimodal y un último caso es cuando ningún dato tiene
una frecuencia, en dicho caso se dice que la muestra es amodal.
Ejemplos:
1.- Determinar la moda del siguiente conjunto de datos:
a) 1,2,3,3,4,5,6,7,7,3,1,9,3
2.- La moda de este conjunto de datos es igual a 3 y se considera unimodal:
b) 1,2,3,4,4,5,2,1,3,4,2,-3,4,6,3,3
3.- Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la mas alta
frecuencia, por lo que la muestra es binomial.
c) 1,2,3,4,5,6,7,8,9
4.- La muestra no contiene ningún dato repetido por lo que se considera que la muestra
es a modal.
Gráficamente eso se puede reflejar mediante el análisis de un histograma de
frecuencias.
7.2.2 Moda para datos agrupados
Para determinar la moda para datos agrupados en clases de igual tamaño su cálculo se puede
realizar de la siguiente forma:
Donde: Aunque la expresión se ve un poco diferente en realidad se trata de una misma ecuación.
Ejemplo:
Tabla de frecuencias reportadas por un equipo de baloncesto con respecto a la estatura de los
jugadores.
7.3 Mediana
13
7.3.1 Mediana para datos no agrupados
La mediana de un conjunto finito es aquel valor que divide al conjunto en dos partes iguales, de
forma que el número de valores mayor o igual a la mediana es igual al número de valores menores
o igual a estos. Su aplicación se ve limitada ya que solo considérale orden jerárquico de los datos y
no alguna propiedad propia de los datos, como es en el caso de la media.
A continuación se muestran los criterios para construir la mediana. Se puede construir los
siguientes criterios:
 Lo primero que se requiere es ordenar los datos en de forma ascendente o descendente,
cualquiera de los dos criterios conduce al mismo resultado.
Sean ordenados los datos en orden ascendente.
 Si el número de valores es impar, la mediana es el valor medio, el cual corresponde al dato.
 Cuando el número de valores en el conjunto es par, no existe un solo valor Medio, si no que
existen dos valores medios, en tal caso, la mediana es el promedio de los valores, es decir, la
mediana es numéricamente igual.
Podemos describir algunas propiedades para la mediana:
1.- Es única.
2.- Es simple.
3.- Los valores extremos no tienen efectos importantes sobre la mediana, lo que si ocurre con la
13
media.
Ejemplo:
Dados los siguiente datos: 1,2,3,4,0,1,4,3,1,1,1,1,2,1,3 para la obtención de la mediana se deberán
de ordenar. Tomemos el criterio de orden ascendente con lo que tendremos:
0,1,1,1,1,1,1,1,2,2,3,3,3,4,4
Por otro lado el número de datos es igual a 15 datos, siendo el número de datos impar se elige el
dato que se encuentra a la mitad, una vez ordenados los datos, en este caso es 1.
7.3.2 La mediana para datos agrupados.
La extensión para el cálculo de la mediana en el caso de datos agrupados es realizada a
continuación:
Donde:
Md = Mediana.
Li = Limite inferior o frontera o inferior de donde se encuentra la mediana, la forma de calcularlo es
a través de encontrar la posición. En ocasiones en el intervalo donde se encuentra la mediana de
conoce como intervalo mediano.
n= Número de observaciones o frecuencia total.
F acum. = frecuencia acumulada anterior al intervalo mediano
F mediana = Frecuencia del intervalo mediano.
A= Amplitud del intervalo en el que se encuentra la mediana.
Geométricamente la mediana se encuentra en el valor X que divide al histograma en dos partes de
13
áreas iguales.
FORMULARIO
Medidas de tendencia central
Para datos no Agrupados
Para datos Agrupados
Donde: es la medida muestral.
x es cada uno de los datos (no agrupados) o la marca de clase (agrupados)
f es la frecuencia absoluta de cada Clase
n es el número de datos (tamaño de la muestra)
Para datos agrupados.
Donde: es la mediana de la muestra.
n es el número total de los elementos de la distribución
F es la suma de todas las frecuencias de clase anteriores a la clase mediana
fm es la frecuencia de la clase mediana (que contiene el dato intermedio)
w es el ancho de intervalo de clase.
Lm es el limite inferior del intervalo de clase mediano.
Para datos agrupados
Donde:
es la moda de la muestra
Lmo es el limite inferior de la clase modal.
d1 es la frecuencia de la clase modal menos la frecuencia de la anterior
d2 es la frecuencia de la clase modal menos la frecuencia de la clase siguiente
2
w es el ancho del intervalo de la clase modal
17
MEDIDAS DE DISPERSIÓN
Existe otro tipo de medidas que indican la tendencia de los datos a dispersarse respecto al
valor central.
Algunas de las medidas de dispersión más usuales son:
a) Rango, amplitud o recorrido (R)
b) Desviación estándar (S , muestral; s , poblacional ).
c) Varianza (S² , s² )
d) Desviación media (DM).
e) Coeficiente de Variación (C. V.)
7.4 Rango
Es la diferencia entre el dato mayor y el dato menor.
R= X máx. - Xmín.
7.5 Desviación estándar.
La desviación estándar o desviación tipo se define como la raíz cuadrada de los cuadrados
17
de las desviaciones de los valores de la variable respecto a su media.
7.6 Varianza.
Es el cuadrado de la desviación estándar.
EJEMPLO:
Hallar la desviación estándar y la varianza de la siguiente serie de datos.
10, 18, 15, 12, 3,6,5,7
SOLUCION:
EJEMPLO:
Hallar la desviación estándar y la varianza para la siguiente distribución de frecuencias.
2
S = 43.4
7.7 Desviación media.
Se conoce también como promedio de desviación. Para una serie de N valores se Puede
calcular a través de la siguiente expresión:
= Valor absoluto de las desviaciones de los x valores, respecto de la media.
Y para datos agrupados se tiene:
EJEMPLO:
Hallar la desviación media de: 4,6,12,16,22.
EJEMPLO:
Hallar la desviación media en la siguiente distribución de frecuencias.17
SOLUCION:
7.8 Coeficiente de Variación.
Es la relación que existe entre la S y la X, expresada en términos de porcentaje y se expresa:
EJEMPLO:
Hallar el coeficiente de variación de una serie de datos cuya S= 2 y
X = 16.
SOLUCION:
FORMULARIO
Medidas de dispersión
Rango = valor de la observación más alta – valor de la observación más pequeña
Rango = valor del límite inferior de la 1er clase – valor del límite superior de la última
clase.
Para datos no agrupados.
Para datos agrupados.
Donde:
s2 es la varianza de la muestra
x es cada uno de los datos (no agrupados) o la marca de clase
(agrupados)
es la media muestral
f es la frecuencia absoluta de cada clase
n es el número total de datos (tamaño de la muestra)
Para datos no agrupados.
Para datos agrupados.
Donde:
s es la desviación estándar de la muestra
x es cada uno de los datos (no agrupados) o la marca de clase (agrupados)
es la media muestral
f es la frecuencia absoluta de cada clase
n es el número total de datos (tamaño de la muestra)
Donde:
c.v. es el coeficiente de variación de la muestra
s es la desviación estándar de la muestra
es la media muestral
Descargar