COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O. Repasa de cursos anteriores: Estadística. Población. Muestra. Carácter estadístico: cualitativo (modalidad) y cuantitativo (variable estadística), que puede ser (discreta y continua] Frecuencias: absolutas fi, relativas hi, absolutas acumuladas Fi y relativas acumuladas Hi. Gráficos: polígono de frecuencias, de barras, de sectores, histogramas(distribuciones continuas), pictogramas, diagrama de caja y bigotes,… Clases. Cuando la variable estadística es continua o cuando existe un elevado número de datos distintos, estos se agrupan en intervalos de amplitud constante (clases), cuyo valor central se denomina marca de clase, trabajándose con estas en vez de con los datos individuales. Parámetros. De tendencia central: a) media x x ·f i i N b)mediana Me: el dato que divide a la distribución en dos partes con el mismo nº de datos. En caso de nº par, la media de los dos centrales. Si los datos están agrupados en frecuencias, el dato cuya frecuencia absoluta acumulada supera a la mitad del nº de datos. Si los datos están agrupados en clases, la marca de la clase cuya Fi supera a la mitad del nº de datos. Podemos calcular la mediana con más precisión: repartimos la amplitud de la clase entre los datos que hay en ella y multiplicamos por los datos que hay en la clase mediana hasta llegar a la mediana (N/2-F de la clase anterior). El resultado se lo sumamos al extremo inferior de la clase mediana. c) moda Mo: dato de mayor frecuencia. Si los datos están agrupados, la marca de la clase de mayor Fi. De dispersión: rango o recorrido R=ma-me, desviación media Dm x x · fi i , varianza, que es N xi x · fi , aunque 2 la media de los cuadrados de las desviaciones V S 2 utilizar, por comodidad, V S 2 2 xi 2 N · fi 2 N 2 x (media de los cuadrados menos el cuadrado de la media), desviación típica S V y coeficiente de variación cv se suele x En distribuciones normales en x , x está el 68% de los datos. En x 2 , x 2 el 95% y en x 3 , x 3 el 99%. De posición: cuartiles Qi, deciles di y percentiles pi. De forma análoga a la mediana, los cuartiles son tres valores Q1, Q2 y Q3 que dividen a la distribución ordenada en 4 partes. Los deciles, que son 9, la dividen en 10 partes. Rango intercuartíco es Q3-Q1 Los centiles, que son 99, la dividen en 100. Todos ellos se obtienen de forma similar a la mediana. 1. Tabla y polígono de frecuencias de la distribución: 0, 2, 1, 0, 0, 1, 0, 3, 2, 1 xi 0 1 2 3 fi 4 3 2 1 10 Fi 4 7 9 10 hi 4/10=0,4 3/10=0,3 2/10=0,2 1/10=0,1 10/10=1 Hi 4/10=0,4 7/10=0,7 9/10=0,9 10/10=1 6 4 2 0 0 1 2 3 2. Parámetros de centralización y dispersión de la distribución: 1, 0, 0, 1, 3, 2, 0, 0, 0, 3 1 COLEGIO CALASANCIO. MADRID. Centralización: x x ·f i ESTADÍSTICA UNIDIMENSIONAL. i N 4º E.S.O. 10 1 Me=1 (7 es la 1ª Fi que supera a la mitad de N) 10 Mo=0 x Dm Dispersión: Re=3-0=3 xi 2 · fi i x · fi N 10 1 10 24 2 1 1,4 N 10 1,183 S V 1,4 1,183 cv 1,183 1 S2 V 2 x xi fi Fi xi·fi xi x · fi 0 1 2 3 5 5 2 7 1 8 2 10 10 0 2 2 6 10 5 0 1 4 10 xi2·fi 0 2 4 18 24 3. Parámetros de centralización, dispersión y posición (los cuartiles), de la distribución: 1,2; 2,3; 5,7; 8,0; 4,9; 7,5; 6,4; 8,7; 9,1; 4,3; 3,2; 4,8; 5,2; 6,9; 0,6; 4,8; 7,4; 8,3; 9,2; 6,0 Clase Marca Xi [0-1) [1-2) [2-3) [3-4) [4-5) [5-6) [6-7) [7-8) [8-9) [9-10] 0,5 1,5 2,5 3,5 4,5 5,5 6,5 7,5 8,5 9,5 fi 1 1 1 1 4 2 3 2 3 2 20 Fi Xi·fi xi x · fi 1 0,5 2 1,5 3 2,5 4 3,5 8 18 10 11 13 19,5 15 15 18 25,5 20 19 116 5.3 4.3 3.3 2.3 5.2 0.6 2.1 3.4 8.1 7.4 42 x 2 x ·f 20 5 Fi 5 4,5 4 Cálculo exacto de la mediana: i N xi ·fi 116 5,8 20 Me=6,5 (marca de la clase cuya F supera a la mitad del nº de datos) 0,25 2,25 6,25 12,25 81 60,5 126,75 112,5 216,75 180,5 799 Mo= 4,5 Re=9,5-0,5=9 Dm x i x · fi N xi · fi 2 SV N 2 x 42 2,1 20 799 5,8 2 6,31 20 V 6,31 2,512 cv Q1=4,5 i 2,512 0,433 5,8 Q2=Me=6,5 Q3=8,5 1 Me 6 (10 10) 6 3 4. Los sueldos de una empresa y el nº de empleados que los ganan, son los que que figuran en las dos columnas de la izquierda. Calcula el sueldo medio, el mediano y la desviación típica Sueldo (euros) [1000-1250) [1250-1500) [1500-1750) [1750-2000) [2000-2250] Xi 1125 1375 1625 2750 2125 fi 90 130 150 140 20 530 Fi 90 220 370 510 530 Xi·fi 101250 178750 243750 385000 42500 951250 Xi2·fi 113906250 245781250 396093750 105875000 90312500 1904843750 951250 530 1794,8 euros 265 530 2 Sueldo mediano= 1500 250 265 220 1500 75 1575 euros 150 Sueldo medio: X 1904843750 1794,82 610,5 euros 530 2 COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O. 5. Calcula a partir de la correspondiente tabla los parámetros de centralización, dispersión y posición (cuartiles y el centil 40) CLASE [0-1) [1-2) [2-3) [3-4) [4-5) [5-6) [6-7) [7-8) [8-9) [9-10] 8,4 8,8 10 0,9 4,3 6,7 2,5 MARCA 0,5 1,5 2,5 3,5 4,5 5,5 6,5 7,5 8,5 9,5 7,3 1,7 3,6 5,2 6 5,4 8,4 1,4 0,9 0,8 0,6 2,6 0,1 5,7 7 8,6 9,4 0,7 3,2 7,1 6,5 fi FI xi·fi 5,00 18,00 7,50 21,00 9,00 38,50 39,00 37,50 76,50 28,50 xi2·fi 2,50 27,00 18,75 73,50 40,50 211,75 253,50 281,25 650,25 270,75 280,50 1829,75 10 12 3 6 2 7 6 5 9 3 10 22 25 31 33 40 46 51 60 63 63 MEDIA MEDIANA MODA DESV. MEDIA VARIANZA DESV. TÍPICA COEF. VAR 4,45 4,5 1,5 2,747 9,220 3,036 0,682 Cálculo exacto de la mediana: 4 1 (31,5 31) 4,25 2 Q1 1,5 Q2 4,5 Q3 6,5 P40 3,5 6,6 7,6 5,5 6,3 3 1 1,5 Frecuencia DATOS: 9,3 1,2 5,8 0,4 5,9 3,5 1,8 14 12 10 8 6 4 2 0 0,1 3,7 0,9 3,8 6,8 8 7,3 2 1,7 1,6 1,4 0,4 1,4 1,4 8,5 8,4 4,1 1,6 8,7 8,9 5,7 |xi-xm|·fi (xi-xm)2·fi 39,524 156,213 35,429 104,599 5,857 11,435 5,714 5,442 0,095 0,005 7,333 7,683 12,286 25,156 15,238 46,440 36,429 147,449 15,143 76,435 173,048 580,857 Histograma Notas 3 COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O. 6. DATOS: 4,4 7,2 9,8 1,2 6,2 7,7 8,4 CLASE [0-1) [1-2) [2-3) [3-4) [4-5) [5-6) [6-7) [7-8) [8-9) [9-10] 4,9 9,4 2,5 8,8 7,6 3,9 9,9 MARCA 4,3 9,6 9,7 2,1 2 0,1 0 fi 4,3 3,6 6,6 4,6 9,6 8,1 9,5 FI 3,1 7,3 6,2 5,1 0,1 0,1 3,6 xi·fi 7,6 9,4 0,9 5,2 8,1 4,2 4,9 2 Xi ·fi 9,5 2,8 1,6 4,6 0 1,7 2 |xi-xm|·fi 9,8 2,9 3 2,2 9,8 8 5,1 2,7 7 1,3 8,1 0,6 0,3 2,8 2 (xi-xm) ·fi MEDIA MEDIANA MODA DESV. MEDIA VARIANZA DESV. TÍPICA COEF. VAR Cálculo exacto de la mediana: Histograma: 4 COLEGIO CALASANCIO. MADRID. ESTADÍSTICA UNIDIMENSIONAL. 4º E.S.O. 7. Los datos muestran la distribución de salarios en un país. Calcula el sueldo medio, el mediano, los cuartiles, los percentiles 30 y 80 y representa el diagrama de caja y bigotes. Explica qué se deduce de este. Obtén el rango intercuartílico. Indica los valores atípicos. € [650-950) [950-1250) [1250-1550) [1550-1850) [1850-2150) [2150-2450) [2450-2750) [2750-3050) [3050-3350) [3350-3650) [3650-3950) [3950-4250) xi 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 3800 4100 __ fi 11 14 16 14 13 10 9 6 4 3 2 1 X =1919 Me=1593 € Q1=1290 € Q2=1593 € Q3=2450 € P30=1410 € P80=2583 € La caja está desplazada a la izquierda. La mitad de la población gana entre 1290 y 2450 euros. Una cuarta parte gana menos de 1290 euros, y solo la la otra cuarta parte gana más de 2450 euros. En el tramo entre 1290 y 1593 euros es donde más se concentran los salarios. Es mucho menor el bigote izquierdo que el derecho, es decir están más concentrados los sueldos bajos. La distinta longitud de los bigotes y de las dos partes de la caja indica que la distribución es asimétrica. Rango intercuartílico: Ri=Q3-Q1=2450-1290= 1160 € Los valores atípicos serían los menores de Q1-1,5(Q3-Q1)=1290-1,5(2450-1290)=130 € y los mayores de Q3+1,5(Q3-Q1)=2450+1,5(2450-1290)=3610 € 8. Calcula media, mediana, moda, cuartiles, rango intercuartílico, percentil 70, varianza, desviación típica y coeficiente de variación de los siguientes datos. 63 66 81 62 [50-55) [55-60) [60-65) [65-70) [70-75) [75-80) [80-85) [85-90] 87 50 79 51 64 61 82 71 62 90 51 80 56 87 52 89 50 84 64 66 82 56 50 67 Xi fi Fi Xi·fi Xi2·fi 52,5 7 7 368 19293,75 57,5 5 12 288 16531,25 62,5 6 18 375 23437,50 67,5 4 22 270 18225,00 72,5 1 23 72,5 5256,25 77,5 1 24 77,5 6006,25 82,5 7 31 578 47643,75 87,5 9 40 788 68906,25 40 2815 205300,00 85 59 85 56 82 81 66 51 88 89 90 59 Media= Mediana= Moda= Menor= Q1= Q2= Q3= Rango interc= Mayor= P70= V= CV= 70,4 67,5 87,5 50 58 67,5 84,3 26,3 90 10 5 0 52,557,562,567,572,577,582,587,5 82,9 180 0,19 5