TEMA 3 3.1. Las medidas de posición robustas También llamadas de localización o de posición central. Entre ellas figuran: las medias, la mediana, la moda y los cuartiles. Estas medidas cumplen dos requisitos como son el estar comprendidas entre los valores extremos de la variable y el no coincidir siempre ambas, aplicándose según el caso. Junto a las medidas de dispersión reciben el nombre de estadísticos. Se dice que una medida es robusta cuando la inclusión de valores atípicos en su cálculo no supone un cambio fuerte en su valor. Son robustas: la mediana, la moda y los cuartiles. Los procedimientos estadísticos robustos permiten efectuar inferencias válidas cuando hay desviaciones a la normalidad y son, al mismo tiempo, altamente eficientes bajo datos normales. 3.2. La mediana. El principal defectos de la media es venir afectada por los valores extremos de la variable. En estos casos será más conveniente la utilización de la mediana. La mediana es la puntuación o la medida de posición que si ordenamos las variables de menor a mayor deja tantos elementos con valores menores que ella como superiores a ella. Es decir, será el valor de la variable en que si N es el total, la frecuencia acumulada de dicho valor es N/2. Su cálculo: En variables discretas sin agrupar: Nj-1 < N/2 < Nj xj-1 < Md < xj Md = Web Estadístico de Navarra [email protected] x j -1 + x j 2 1 Tema 3 Estadística descriptiva http://www.pwpamplona.com/opo Web Estadístico de Navarra [email protected] 2 Tema 3 Estadística descriptiva http://www.pwpamplona.com/opo En las distribuciones de frecuencias agrupadas por intervalos. Vemos que ME=Li-1+m. Determinamos m en base a la hipótesis fijada (todos los valores comprendidos dentro del intervalo mediano se encuentran distribuidos uniformemente), que nos permite escribir: AC BC = , ya que AC BC ABC = AB C Pero AC = m AC = ci BC = N - N i -1 2 Por tanto: BC = N i - N i-1 = ni Web Estadístico de Navarra [email protected] 3 Tema 3 Estadística descriptiva http://www.pwpamplona.com/opo N n j 2 N j -1 = a t Md = x j -1 + t N - N j -1 Md = x j -1 + 2 a Nj Ventajas: 1.- Viene poco afectada por los valores extremos de la variable. 2.- Fácil de calcular. 3.- Fácil de interpretar. 4.- La suma de las desviaciones absolutas respecto de un punto se hace mínima cuando esta es la mediana. Inconvenientes: 1.- No es adaptable a cálculos posteriores. Ejemplo: Sea la serie xi = {1,2,5,7,9,10,13,14}; la mediana sería Me = 7 +9 =8 2 Si la serie estadística presentase diferentes frecuencias, el método de cálculo más cómodo y práctico sería: xi ni Ni 1 2 5 7 10 13 3 4 9 10 7 2 3 7 16 26 33 35 35 Web Estadístico de Navarra [email protected] 4 Tema 3 Estadística descriptiva http://www.pwpamplona.com/opo donde N 35 = = 17,5 2 2 con lo que la mediana será Me = 7 Ejemplo: Sea la siguiente distribución de salarios Clase 1 2 3 4 5 Salario anual Nº de obreros Nº de obreros acumul. 100 150 200 180 41 100 250 450 630 671 20000 a 25000 25000 a 30000 30000 a 35000 35000 a 40000 40000 a 45000 671 N 671 = = 335,5 2 2 Indica que el salario medio está comprendido en la clase tercera. La amplitud del intervalo es ci = 5000. Me = 30000 + 335,5 - 250 5000 200 Me = 30000 + 0,4275 5000 => Me = 32137,5 Web Estadístico de Navarra [email protected] 5 Tema 3 Estadística descriptiva http://www.pwpamplona.com/opo