Histograma

Anuncio
COLEGIO CALASANCIO. MADRID.
ESTADÍSTICA UNIDIMENSIONAL.
4º E.S.O.
Repasa de cursos anteriores:



Estadística. Población. Muestra. Carácter estadístico: cualitativo (modalidad) y cuantitativo (variable
estadística), que puede ser (discreta y continua]
Frecuencias: absolutas fi, relativas hi, absolutas acumuladas Fi y relativas acumuladas Hi.
Gráficos: polígono de frecuencias, de barras, de sectores, histogramas(distribuciones continuas),
pictogramas, diagrama de caja y bigotes,…
Clases. Cuando la variable estadística es continua o cuando existe un elevado número de datos distintos,
estos se agrupan en intervalos de amplitud constante (clases), cuyo valor central se denomina marca de
clase, trabajándose con estas en vez de con los datos individuales.
Parámetros.

De tendencia central: a) media x 
 x ·f
i
i
N
b)mediana Me: el dato que divide a la distribución en dos partes con el mismo nº de datos. En caso de
nº par, la media de los dos centrales. Si los datos están agrupados en frecuencias, el dato cuya
frecuencia absoluta acumulada supera a la mitad del nº de datos.
Si los datos están agrupados en clases, la marca de la clase cuya Fi supera a la mitad del nº de datos.
Podemos calcular la mediana con más precisión: repartimos la amplitud de la clase entre los datos que
hay en ella y multiplicamos por los datos que hay en la clase mediana hasta llegar a la mediana (N/2-F
de la clase anterior). El resultado se lo sumamos al extremo inferior de la clase mediana.
c) moda Mo: dato de mayor frecuencia. Si los datos están agrupados, la marca de la clase de mayor Fi.

De dispersión: rango o recorrido R=ma-me, desviación media Dm 
x
 x · fi
i
, varianza, que es
N
 xi  x  · fi , aunque

2
la media de los cuadrados de las desviaciones V  S  
2
utilizar, por comodidad, V  S  
2
2
 xi

2
N
· fi
2
N
2
 x (media de los cuadrados menos el cuadrado
de la media), desviación típica   S  V y coeficiente de variación cv 

se suele


x


En distribuciones normales en x   , x   está el 68% de los datos. En x  2 , x  2 el 95% y



en x  3 , x  3 el 99%.
De posición: cuartiles Qi, deciles di y percentiles pi. De forma análoga a la mediana, los cuartiles son
tres valores Q1, Q2 y Q3 que dividen a la distribución ordenada en 4 partes. Los deciles, que son 9, la
dividen en 10 partes. Rango intercuartíco es Q3-Q1 Los centiles, que son 99, la dividen en 100. Todos
ellos se obtienen de forma similar a la mediana.
1. Tabla y polígono de frecuencias de la distribución: 0, 2, 1, 0, 0, 1, 0, 3, 2, 1
xi
0
1
2
3
fi
4
3
2
1
10
Fi
4
7
9
10
hi
4/10=0,4
3/10=0,3
2/10=0,2
1/10=0,1
10/10=1
Hi
4/10=0,4
7/10=0,7
9/10=0,9
10/10=1
6
4
2
0
0
1
2
3
2. Parámetros de centralización y dispersión de la distribución: 1, 0, 0, 1, 3, 2, 0, 0, 0, 3
1
COLEGIO CALASANCIO. MADRID.
Centralización: x 
 x ·f
i
ESTADÍSTICA UNIDIMENSIONAL.
i
N

4º E.S.O.
10
 1 Me=1 (7 es la 1ª Fi que supera a la mitad de N)
10
Mo=0
x
Dm 
Dispersión: Re=3-0=3
 xi
2
· fi
i
 x · fi
N
10
 1
10
24 2
 1  1,4
N
10
1,183
S    V  1,4  1,183 cv 
 1,183
1
S2 V 
2
x 
xi
fi
Fi
xi·fi
xi  x · fi
0
1
2
3
5 5
2 7
1 8
2 10
10
0
2
2
6
10
5
0
1
4
10
xi2·fi
0
2
4
18
24
3. Parámetros de centralización, dispersión y posición (los cuartiles), de la distribución: 1,2; 2,3; 5,7;
8,0; 4,9; 7,5; 6,4; 8,7; 9,1; 4,3; 3,2; 4,8; 5,2; 6,9; 0,6; 4,8; 7,4; 8,3; 9,2; 6,0
Clase
Marca Xi
[0-1)
[1-2)
[2-3)
[3-4)
[4-5)
[5-6)
[6-7)
[7-8)
[8-9)
[9-10]
0,5
1,5
2,5
3,5
4,5
5,5
6,5
7,5
8,5
9,5
fi
1
1
1
1
4
2
3
2
3
2
20
Fi
Xi·fi
xi  x · fi
1 0,5
2 1,5
3 2,5
4 3,5
8
18
10 11
13 19,5
15 15
18 25,5
20 19
116
5.3
4.3
3.3
2.3
5.2
0.6
2.1
3.4
8.1
7.4
42
x
2
 x ·f
 20

 5 Fi  5  4,5 

 4

Cálculo exacto de la mediana:

i
N
xi ·fi
116
 5,8
20
Me=6,5 (marca de la
clase cuya F supera a la mitad del nº de datos)
0,25
2,25
6,25
12,25
81
60,5
126,75
112,5
216,75
180,5
799
Mo= 4,5
Re=9,5-0,5=9
Dm 
x
i
 x · fi
N
 xi · fi
2
SV 
N
2

x 
42
 2,1
20
799
 5,8 2  6,31
20
  V  6,31  2,512
cv 
Q1=4,5
i
2,512
 0,433
5,8
Q2=Me=6,5
Q3=8,5
1
Me  6  (10  10)  6
3
4. Los sueldos de una empresa y el nº de empleados que los ganan, son los que que figuran en las dos
columnas de la izquierda. Calcula el sueldo medio, el mediano y la desviación típica
Sueldo (euros)
[1000-1250)
[1250-1500)
[1500-1750)
[1750-2000)
[2000-2250]
Xi
1125
1375
1625
2750
2125
fi
90
130
150
140
20
530
Fi
90
220
370
510
530
Xi·fi
101250
178750
243750
385000
42500
951250
Xi2·fi
113906250
245781250
396093750
105875000
90312500
1904843750
951250
530
 1794,8 euros
 265
530
2
Sueldo mediano= 1500  250 265  220  1500  75  1575 euros
150
Sueldo medio:

X 
1904843750
 1794,82  610,5 euros
530
2
COLEGIO CALASANCIO. MADRID.
ESTADÍSTICA UNIDIMENSIONAL.
4º E.S.O.
5. Calcula a partir de la correspondiente tabla los parámetros de centralización, dispersión y posición (cuartiles y el centil 40)
CLASE
[0-1)
[1-2)
[2-3)
[3-4)
[4-5)
[5-6)
[6-7)
[7-8)
[8-9)
[9-10]
8,4
8,8
10
0,9
4,3
6,7
2,5
MARCA
0,5
1,5
2,5
3,5
4,5
5,5
6,5
7,5
8,5
9,5
7,3
1,7
3,6
5,2
6
5,4
8,4
1,4
0,9
0,8
0,6
2,6
0,1
5,7
7
8,6
9,4
0,7
3,2
7,1
6,5
fi
FI
xi·fi
5,00
18,00
7,50
21,00
9,00
38,50
39,00
37,50
76,50
28,50
xi2·fi
2,50
27,00
18,75
73,50
40,50
211,75
253,50
281,25
650,25
270,75
280,50
1829,75
10
12
3
6
2
7
6
5
9
3
10
22
25
31
33
40
46
51
60
63
63
MEDIA
MEDIANA
MODA
DESV. MEDIA
VARIANZA
DESV. TÍPICA
COEF. VAR
4,45
4,5
1,5
2,747
9,220
3,036
0,682
Cálculo exacto de la mediana: 4 
1
(31,5  31)  4,25
2
Q1  1,5 Q2  4,5 Q3  6,5 P40  3,5
6,6
7,6
5,5
6,3
3
1
1,5
Frecuencia
DATOS:
9,3
1,2
5,8
0,4
5,9
3,5
1,8
14
12
10
8
6
4
2
0
0,1
3,7
0,9
3,8
6,8
8
7,3
2
1,7
1,6
1,4
0,4
1,4
1,4
8,5
8,4
4,1
1,6
8,7
8,9
5,7
|xi-xm|·fi (xi-xm)2·fi
39,524
156,213
35,429
104,599
5,857
11,435
5,714
5,442
0,095
0,005
7,333
7,683
12,286
25,156
15,238
46,440
36,429
147,449
15,143
76,435
173,048
580,857
Histograma
Notas
3
COLEGIO CALASANCIO. MADRID.
ESTADÍSTICA UNIDIMENSIONAL.
4º E.S.O.
6.
DATOS:
4,4
7,2
9,8
1,2
6,2
7,7
8,4
CLASE
[0-1)
[1-2)
[2-3)
[3-4)
[4-5)
[5-6)
[6-7)
[7-8)
[8-9)
[9-10]
4,9
9,4
2,5
8,8
7,6
3,9
9,9
MARCA
4,3
9,6
9,7
2,1
2
0,1
0
fi
4,3
3,6
6,6
4,6
9,6
8,1
9,5
FI
3,1
7,3
6,2
5,1
0,1
0,1
3,6
xi·fi
7,6
9,4
0,9
5,2
8,1
4,2
4,9
2
Xi ·fi
9,5
2,8
1,6
4,6
0
1,7
2
|xi-xm|·fi
9,8
2,9
3
2,2
9,8
8
5,1
2,7
7
1,3
8,1
0,6
0,3
2,8
2
(xi-xm) ·fi
MEDIA
MEDIANA
MODA
DESV. MEDIA
VARIANZA
DESV. TÍPICA
COEF. VAR
Cálculo exacto de la mediana:
Histograma:
4
COLEGIO CALASANCIO. MADRID.
ESTADÍSTICA UNIDIMENSIONAL.
4º E.S.O.
7. Los datos muestran la distribución de salarios en un país. Calcula el sueldo medio, el mediano, los
cuartiles, los percentiles 30 y 80 y representa el diagrama de caja y bigotes. Explica qué se deduce de
este. Obtén el rango intercuartílico. Indica los valores atípicos.
€
[650-950)
[950-1250)
[1250-1550)
[1550-1850)
[1850-2150)
[2150-2450)
[2450-2750)
[2750-3050)
[3050-3350)
[3350-3650)
[3650-3950)
[3950-4250)
xi
800
1100
1400
1700
2000
2300
2600
2900
3200
3500
3800
4100
__
fi
11
14
16
14
13
10
9
6
4
3
2
1
X =1919
Me=1593 €
Q1=1290 €
Q2=1593 €
Q3=2450 €
P30=1410 €
P80=2583 €
La caja está desplazada a la izquierda. La mitad de la población gana entre 1290 y 2450 euros. Una cuarta
parte gana menos de 1290 euros, y solo la la otra cuarta parte gana más de 2450 euros. En el tramo entre
1290 y 1593 euros es donde más se concentran los salarios. Es mucho menor el bigote izquierdo que el
derecho, es decir están más concentrados los sueldos bajos.
La distinta longitud de los bigotes y de las dos partes de la caja indica que la distribución es asimétrica.
Rango intercuartílico: Ri=Q3-Q1=2450-1290= 1160 €
Los valores atípicos serían los menores de Q1-1,5(Q3-Q1)=1290-1,5(2450-1290)=130 € y los mayores de
Q3+1,5(Q3-Q1)=2450+1,5(2450-1290)=3610 €
8. Calcula media, mediana, moda, cuartiles, rango intercuartílico, percentil 70, varianza, desviación típica y
coeficiente de variación de los siguientes datos.
63
66
81
62
[50-55)
[55-60)
[60-65)
[65-70)
[70-75)
[75-80)
[80-85)
[85-90]
87
50
79
51
64
61
82
71
62
90
51
80
56
87
52
89
50
84
64
66
82
56
50
67
Xi
fi
Fi
Xi·fi
Xi2·fi
52,5
7
7 368 19293,75
57,5
5 12 288 16531,25
62,5
6 18 375 23437,50
67,5
4 22 270 18225,00
72,5
1 23 72,5 5256,25
77,5
1 24 77,5 6006,25
82,5
7 31 578 47643,75
87,5
9 40 788 68906,25
40
2815 205300,00
85
59
85
56
82
81
66
51
88
89
90
59
Media=
Mediana=
Moda=
Menor=
Q1=
Q2=
Q3=
Rango interc=
Mayor=
P70=
V=
CV=
70,4
67,5
87,5
50
58
67,5
84,3
26,3
90
10
5
0
52,557,562,567,572,577,582,587,5
82,9
180
0,19
5
Descargar