unidad i. estadística descriptiva

Anuncio
Métodos Estadísticos
1.2.Medidas de tendencia central y de dispersión de datos agrupados
UNIDAD I. ESTADÍSTICA DESCRIPTIVA
Objetivo de la unidad: El alumno describirá el comportamiento de los
datos empleando diagramas de tallo, histogramas, polígonos y las
medidas de tendencia central, de dispersión para el análisis estadístico
de un proceso.
1.2. MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE
DISPERSIÓN DE DATOS AGRUPADOS
A continuación se describen los objetivos del presente tema:
Saber: Describir el método de cálculo la media, mediana, moda,
varianza, desviación estándar y coeficiente de variación de datos
agrupados.
Hacer: Calcular la media, mediana, moda, varianza, desviación
estándar y coeficiente de variación de datos agrupados.
Medidas de tendencia central a analizar
En este tema veremos las siguientes medidas de tendencia central:
media o promedio, mediana y moda. A continuación las describimos:
La media
En datos agrupados se multiplica la cantidad de veces que se repiten
los datos en la marca de clase.
Media de la muestra:
∑
x=
n
i =1
xi f i
n
∑
Media de la población: µ =
N
i =1
;
Por ejemplo se tienen los siguientes datos para el tiempo de vida de
cierta marca de focos.
Intervalo en horas
Inferior
Superior
[ 1200
1300 )
[ 1300
1400 )
[ 1400
1500 )
[ 1500
1600 ]
Marca de clase
Frecuencia
5
15
20
5
Determine la vida media de los focos dados los datos anteriores, en
este ejercicio se requiere la participación de los alumnos.
Mediana
La mediana para datos agrupados se calcula de la siguiente forma:
n

 2 − F(Me) 
Me = Li + I 

 f(Me) 


Donde:
Li= Límite inferior de la clase mediana (la clase que contiene a la
mediana)
n = Tamaño total de la muestra (frecuencia total)
F(Me) = Frecuencia acumulada de la clase inmediatamente anterior a
la mediana.
f(Me) = Frecuencia absoluta de la clase de la mediana
I = Ancho del intervalo
xi f i
N
Basado en: Manual de estadistica / Handbook of Statistics Escrito por Emil Hernández Arroyo. Obtenido por google books
Elaboró: MC. Marcel Ruiz Martínez
1
Métodos Estadísticos
1.2.Medidas de tendencia central y de dispersión de datos agrupados
Ejemplo: Calcule la mediana de las puntuaciones de un examen de
admisión, dados en la siguiente tabla.
Intervalo en horas
Inferior
Superior
[ 150
190 )
[ 190
230 )
[ 230
270 )
[ 270
310 )
[ 310
350 ]
Frecuencia
relativa
10
30
30
20
10
Frecuencia
Absoluta
10
40
70
90
100
Entonces:
n 100
=
= 50
2
2
La posición 50 queda en el intervalo 3 de la frecuencia absoluta [230270), por lo tanto la ecuación queda:
 50 − 40 
Me = 230 + 40 
 = 243.3
 30 
Esto significa que el 50% de los estudiantes obtuvo un puntaje mayor
que 243.3 y el otro 50% un puntaje menor.
Moda.
Ejemplo: Calcule la moda de las puntuaciones de un examen de
admisión, dados en la siguiente tabla.
Intervalo en horas
Inferior
Superior
[ 150
190 )
[ 190
230 )
[ 230
270 )
[ 270
310 )
[ 310
350 ]
Frecuencia
relativa
10
20
30
25
15
La moda es el punto de mayor concentración, puede ser la mejor
medida de tendencia central cuando la distribución es muy asimétrica,
es decir existan pocos valores muy altos o muy bajos que obliguen a
otra medida como la media a tomar valores fuera del centro de los
datos.
En este caso la sustitución para detectar la moda del conjunto de datos
anteriores es:
 10 
Mo = 230 + 40 
= 256.6
10 + 5 
En la siguiente figura se muestra la relación empírica entre las medidas
de tendencia central vistas: media mediana moda.
De una distribución o frecuencia la moda se puede calcular de la
siguiente forma:
 D1 
Mo = Li + I 

 D1 + D 2 
Li = Límite inferior de la clase modal (la clase que contiene la moda)
I = Ancho del intervalo de la clase modal
D1= Diferencia entre la frecuencia modal y la premodal
D2= Diferencia entre la frecuencia modal y la postmodal
Basado en: Manual de estadistica / Handbook of Statistics Escrito por Emil Hernández Arroyo. Obtenido por google books
Elaboró: MC. Marcel Ruiz Martínez
2
Métodos Estadísticos
Medidas de dispersión o variación
1.2.Medidas de tendencia central y de dispersión de datos agrupados
x=
∑x f
n
En este tema estudiaremos las siguientes medidas de dispersión:
varianza, desviación estándar, rango, coeficiente de variación.
Varianza
Para el cálculo de la varianza de datos agrupados se utiliza la siguiente
fórmula:
∑ (x i − x )f i
σ2 =
n
Ejemplo: Para la siguiente distribución de frecuencias determine la
varianza:
Intervalo de clase Frecuencia
Inferior Superior
fi
[ 20
40 )
10
[ 40
60 )
30
[ 60
80 )
20
[ 80
100 )
20
[ 100
120 )
20
Solución: Se calcula la marca de clase, así como los siguientes
elementos intermedios.
Intervalo de clase Frecuencia Marca de
clase
Inferior Superior
(x i − x )2 f i
xi
fi* xi
fi
[ 20
40 )
10
30
300
17,640
[ 40
60 )
30
50
1,500
14,520
[ 60
80 )
20
70
1,400
80
[ 80
100 )
20
90
1,800
6,480
[ 100
120 )
20
110
2,200
28,800
Σ
7,200
67,600
=
i i
∑ (x
σ2 =
7200
= 72
100
− x )f i
i
n
=
67,600
= 676
100
Desviación estándar.
La desviación estándar se define como la raíz cuadrada de la varianza,
por lo cual la ecuación para su cálculo se define como:
σ = σ2
Por sustitución también puede definirse como:
∑ (x
σ=
i
− x )f i
n
Coeficiente de variación.
Al igual que en el caso del tema anterior la ecuación del coeficiente de
variación para datos agrupados es la misma:
σ
(100% )
µ
CV =
La importancia de la desviación, estándar, de la varianza, el rango
y el coeficiente de variación se debe a que nos ofrece una visión de
la dispersión de los datos, lo cual sirve para poner en contexto la
exactitud de las medidas de tendencia central.
Basado en: Manual de estadistica / Handbook of Statistics Escrito por Emil Hernández Arroyo. Obtenido por google books
Elaboró: MC. Marcel Ruiz Martínez
3
Métodos Estadísticos
1.2.Medidas de tendencia central y de dispersión de datos agrupados
EJEMPLO: Medidas de dispersión y tendencia central. Para los
siguientes datos de puntuaciones en un examen de admisión determine
las medidas de tendencia central y dispersión vistas en clase:
Intervalo en horas
Inferior
Superior
[ 150
190 )
[ 190
230 )
[ 230
270 )
[ 270
310 )
[ 310
350 ]
Frecuencia
relativa
10
20
30
25
15
Calcule las siguientes medidas de tendencia central y de dispersión
vistas.
1. Media
2. Mediana
3. Moda
4. Desviación estándar
5. Varianza
6. Coeficiente de variación.
Archivo en EXCEL.
Puede usar la siguiente liga para descargar el archivo de
EXCEL que le servirá de apoyo para resolver el ejercicio
anterior.
http://marcelrzmut.comxa.com/MetodosEstadisticos/12TallerBasicoCalculoMedidasDatAgrup.xls
Práctica 1.2. Medidas de tendencia central y de dispersión de datos
agrupados. Se realiza un muestreo de la contaminación de cromo
hexavalente en el agua de una laguna, a continuación se muestran las
concentraciones en partes por millón de dicho contaminante.
Intervalo en ppm
Frecuencia
relativa
Inferior
Superior
[ 15
19 )
5
[ 19
23 )
10
[ 23
27 )
15
[ 27
31 )
12
[ 31
35 ]
16
Calcule las siguientes medidas de tendencia central y de dispersión
vistas para datos agrupados.
1. Media
2. Mediana
3. Moda
4. Rango
5. Desviación estándar
6. Varianza
CONDICIÓN IMPORTANTE: No usar el mismo archivo de Excel que
se ofreció como taller, hacer uno original por sí mismo.
Entrega tus resultados en forma de PRÁCTICA DE EJERCICIOS,
siguiendo las rúbricas indicadas en la dirección:
http://marcelrzm.comxa.com/Rubricas/Rubricas.htm
Enviar el documento final por correo electrónico a las siguientes
direcciones:
[email protected];
[email protected]; [email protected] y
[email protected]
Colocar en ASUNTO: “Práctica 1.2. Medidas de tendencia central y de
dispersión de datos agrupados”.
Basado en: Manual de estadistica / Handbook of Statistics Escrito por Emil Hernández Arroyo. Obtenido por google books
Elaboró: MC. Marcel Ruiz Martínez
4
Descargar