Tema 2:

Anuncio
Tema 2:
Parámetros estadísticos.
1. PARÁMETROS ESTADÍSTICOS:
En estadística, un parámetro es un número que resume la cantidad de datos que pueden
derivarse del estudio de una variable estadística.
1.1 MEDIDAS DE CENTRALIZACIÓN:
*MODA: La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Puede hallarse para variables cuantitativas y para variables cualitativas
Ejemplo: halla la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5, ---> Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la
máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, --->9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las
dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8--->Mo = 4
*MEDIANA:
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de
menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables cuantitativas.
Cálculo de la mediana
1 Ordenamos los datos de menor a mayor.
2 Si la serie tiene un número impar de medidas la mediana es la puntuación central de la
misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos
puntuaciones centrales.
7, 8, 9, 10, 11, 12Me= 9.5
*MEDIAS:
-Media aritmética:
Media aritmética
La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el
número total de datos.
es el símbolo de la media aritmética.
Ejemplo
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
-Media geométrica:
En estadística, la media geométrica de una cantidad arbitraria de números (por
decir n números) es la raíz n-ésima del producto de todos los números, es recomendada para
datos de progresión geométrica, para promediar razones, interés compuesto y números
índices.
Por ejemplo, la media geométrica de 2 y 18 es
-Media ponderada:
La media ponderada es una medida de tendencia central, se construye asignándole a cada
clase un peso, y obteniendo un promedio para los pesos.
donde
Ejemplo:
En una materia dada se asignan pesos de importancia, de la siguiente forma: Unida I (20% del
curso), Unidad II (25% del curso), Unidad III (20% del curso), Unidad IV (15% de la
calificación), Unidad V (20% de la calificación ). Si las calificaciones de un alumno son 8 en la
primera unidad, 5 en la segunda, 8 en la tercera unidad, 10 en la cuarta unidad y 8 en la última
unidad. Es decir, se tienen la siguiente tabla:
Unidad
Ponderacion (Wi)
Datos (Wi)
I
20% = 0.2
8
II
25% = 0.35
5
III
20% = 0.2
8
IV
15% = 0.15
10
V
20% = 0.10
8
1.2. MEDIDAS DE POSICIÓN:
*CUARTILES:
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados
en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
Q2 coincide con la mediana.
Cálculo de los cuarteles
1 Ordenamos los datos de menor a mayor.
2 Buscamos el lugar que ocupa cada cuartil mediante la expresión
.
Número impar de datos
2, 5, 3, 6, 7, 4, 9
Número par de datos
2, 5, 3, 4, 6, 7, 1, 9
*DECILES:
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
D5 coincide con la mediana.
Cálculo de los deciles
En primer lugar buscamos la clase donde se encuentra
las frecuencias acumuladas.
, en la tabla de
Li es el límite inferior de la clase donde se encuentra el decil.
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase el decil..
ai es la amplitud de la clase.
*CENTILES:
Los centiles o percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales.
Dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
P50 coincide con la mediana.
Cálculo de los percentiles:
En primer lugar buscamos la clase donde se encuentra
de las frecuencias acumuladas.
, en la tabla
Li es el límite inferior de la clase donde se encuentra el percentil.
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase del percentil.
ai es la amplitud de la clase.
1.3 MEDIDAS DE DISPERSIÓN:
*RANGO:
Se denomina rango o recorrido de una función al conjunto de los valores reales que toma la
variable y o f(x).
Para calcular el rango de una función tenemos que hallar el dominio de su función inversa.
R=
− {2}
*RANGO INTERCUARTÍLICO:
El rango intercuartílico es una medida de variabilidad adecuada cuando la medida de posición
central empleada ha sido la mediana. Se define como la diferencia entre el tercer cuartil (Q3) y
el primer cuartil (Q1), es decir: RQ = Q3 - Q1. A la mitad del rango intercuartil se le conoce
como desviación cuartil (DQ): DQ = RQ/2= (Q3 - Q1)/2.
*DESVIACIÓN MEDIA:
Desviación media
La desviación media es la media aritmética de los valores absolutos de las desviaciones
respecto a la media.
La desviación media se representa por
Ejemplo
Calcular la desviación media de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
*VARIANZA:
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de
una distribución estadística.
La varianza se representa por
.
*DESVIACIÓN TÍPICA:
La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.
La desviación típica se representa por σ.
1.4 MEDIDAS DE FORMA:
*COEFICIENTE DE APUNTAMIENTO:
Hemos de tomar una referencia para ver si la distribución de los datos es apuntada o no.
Esa referencia será la distribución normal, distinguiremos tres casos que la distribución sea
más picuda que la normal, igual a ella o más aplastada.
Si la distribución se llama Leptocúrtica, las frecuencias son más apuntadas que la normal.
Si la distribución se llama Mesocúrtica, la distribución tiene el mismo apuntamiento que la normal.
Si se denomina Platicúrtica , es menos apuntada que la normal.
*CURTOSIS:
En ocasiones se emplea esta otra definición del coeficiente de curtosis:
donde al final se ha sustraido 3 (que es la curtosis de la Normal) con objeto de generar un
coeficiente que valga 0 para la Normal y tome a ésta como referencia de apuntamiento:
Tomando, pues, la distribución normal como referencia, una distribución puede ser:
más apuntada y con colas más anchas que la normal –leptocúrtica.
menos apuntada y con colas menos anchas que la normal- platicúrtica.
la distribución normal es mesocúrtica.
En la distribución normal se verifica que
respecto a la media y
la desviación típica.
, donde
es el momento de orden 4
Así tendremos que:
Si la distribución es leptocúrtica
Si la distribución es platicúrtica
Si la distribución es mesocúrtica
y
y
y
Otra forma de medir la curtosis se obtiene examinando la fórmula de la curtosis de la suma de
variables aleatorias. Si Y es la suma de n variables aleatorias estadísticamente independientes,
todas con igual distribución X, entonces
, complicándose la
fórmula si la curtosis se hubiese definido como
.
2. INTERPRETACIÓN DE LA MEDIA Y DE LA DESVIACIÓN TÍPICA.
2.1. DESIGUALDAD DE TCHEBICHEFF
En probabilidad, la desigualdad de Chebyshov (también escrito como "Tchebycheff") es un
resultado que ofrece una cota inferior a la probabilidad de que el valor de una variable aleatoria con
varianza finita esté a una cierta distancia de su esperanza matemática.
Formulación
Sea
que
una variable aleatoria no negativa y una función
. Entonces
creciente tal
se da la desigualdad siguiente:
Casos particulares de la desigualdad
Algunas formulaciones menos generales que se desprenden de la primera son las siguientes:
Sea
variable aleatoria con momento de orden
siendo
Sea
y
.
con momento centrado de orden
siendo
finito, entonces
,
finito, entonces
,
y
Sea
real
.
variable aleatoria de media
,
Sólo en caso de que
y varianza finita
, entonces, para todo
número
la desigualdad proporciona una cota no trivial.
2.2. Transformaciones (suma y producto) en un conjunto de datos
estadísticos.
La transformación persigue la consecución de una distribución aproximada a la normal. Tipos:
-Lineales: suma, resta, división, multiplicación---> cambian los valores brutos (datos obtenidos)
de la variable sin alterar nada más.
-No lineales monotónicas: cambian los valores originales y también sus distancias pero no el
orden.
3. COEFICIENTE DE VARIACIÓN:
Es en realidad una Medida de Dispersión relativa, pero de gran importancia, y de gran versatilidad,
ya que su interpretación está basada en porcentajes, y nos da la relación existente entre la medida
de posición o centraje y su precisión. Se suele expresar en “tanto” por ciento.
Mide la variabilidad relativa a la media. Expresa la proporción de variabilidad de una característica
por cada unidad de la Media.
Se calcula:
Donde
es la
desviación típica. Se puede dar en tanto por ciento calculando:
ALICIA SOLER OLIVA Y AMALIO LUCEÑO BORRERO, 2º BACH.
Descargar