INTRODUCCION • El presente trabajo de Estadística Descriptiva reúne un estudio descriptivo a la recopilación, organización y representación de los datos estadísticos en la que se tomó como muestra la población estudiantil del Colegio Centro Social Bachillerato Nocturno, para clasificarlo según sus edades. • Luego se introducen algunos procedimientos tales como las medidas matemáticas y no matemáticas de tendencia central, las medidas de dispersión absoluta y relativa con el fin de sintetizar la información. • Finalmente se hace un breve estudio sobre la regresión y correlación, los cuales nos ayudan a hacer predicciones en eventos futuros con base en los datos actuales. OBJETIVOS • Describir estadísticamente la información recopilada para esta investigación. • Conocer de que forma se puede medir las tendencias matemáticas y no matemáticas. • Saber como se mide el grado de variabilidad de los datos. • Ver como se pueden medir los cambios que sufren en el tiempo algunas variaciones como precios, cantidades y valores. METODOLGIA El presente trabajo se realiza bajo el ámbito de un estudio estadístico acerca de las edades de los estudiantes del Colegio Centro Social Bachillerato Nocturno, tomándose una muestra de 70 alumnos entre hombre y mujeres, con el fin de determinar cuales son los promedios oscilantes de edades en que se encuentra la población estudiantil de dicho plantel educativo. JUSTIFICACION Este estudio se realizó con el fin de adquirir un mayor conocimiento y precisión los datos estadísticos. DE LA POBLACION ESTUDIANTIL DEL COLEGIO CENTRO SOCIAL BACHILLERATO NOCTURNO, SE TOMO UNA MUESTRA DE 70 ALUMNOS Y SE DESEA CLASIFICAR SEGÚN SUS EDADES ASÍ: Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 Y10 20 21 18 17 19 15 14 12 15 16 11 30 47 42 39 32 19 14 11 18 39 31 33 35 17 19 40 41 13 44 36 32 24 21 19 17 11 19 16 14 39 49 44 38 17 53 13 18 14 15 30 21 18 14 42 34 26 21 19 12 13 26 29 35 48 17 16 12 21 23 CLASIFICAR LOS DATOS EN SEIS INTERVALOS (M) 1 VARIABLE: LA VARIABLE ES CONTINUA RECORRIDO : R = Dm − dm R = 53−11 R = 42 AMPLITUD = R/M A= 42/6 = 7 A=7 La amplitud indica la distancia que debe tener cada grupo. para formar los de clase, se parte del dato menor 11 y se le suma la amplitud 7. MARCA DE CLASE J 1 2 3 4 5 6 Y' j−1 − Y 11 − 18 18 − 25 25 − 32 32 − 39 39 − 46 46 − 53 Numero de estudiantes ////////////////////////////// ////////////// //////// ///////// ////// /// total 30 14 8 9 6 3 DISTRIBUCION DE FRECUENCIAS ORDEN INTERVALO MARCA FRECUENCIA FRECUENCIA ACUMULADAS DE LA DE CLASE DE CLASE ABSOLUTA RELATIVA CLASE ABSOLUTAS RELATIVAS j Y'j−1 − Y'j Yj nj hj ! Nj ! Nj ! Hj ! Hj 1 2 3 4 5 6 TOTAL 11 − 18 18 − 25 25 − 32 32 − 39 39 − 46 46 − 53 14.5 21.5 28.5 35.5 42.5 49.5 30 14 8 9 6 3 70 0.43 0.20 0.11 0.13 0.09 0.04 30 44 52 61 67 70 70 40 26 18 9 3 0.43 0.63 0.74 0.87 0.96 1.00 1.00 0.57 0.37 0.26 0.13 0.04 2 En el histograma está representado gráficamente una distribución de frecuencias con intervalos de amplitud. Este polígono de frecuencias esta representado en una curva la tendencia de la información objeto de este estudio, señalando la concentración de la información. La ojiva nos muestra la forma como crece y decrece la información a través de los intervalos. Para realizar la gráfica se tuvo en cuenta las frecuencias acumuladas (absoluta y relativa) en forma ascendente y descendente. MEDIDAS MATEMATICAS MEDIA ARITMETICA Yj * nj Yj 14.5 21.5 28.5 35.5 42.5 49.5 nj 30 14 8 9 6 3 70 Total del clase 435.00 301.00 228.00 319.50 255.00 148.50 1,687.00 MEDIA GEOMETRICA La media geométrica G(X) de un conjunto de n valores es la raíz enésima del producto de las observaciones. 3 MEDIDAS NO MATEMATICAS MEDIANA Y'j−1 − Y'j nj ! Nj 11 − 18 18 − 25 25 − 32 32 − 39 39 − 46 46 − 53 30 14 8 9 6 3 30 44 52 61 67 70 La mediana es = 20.5 PERCENTILES J Y'j−1 − Y'j 1 2 3 4 5 6 11 − 18 18 − 25 25 − 32 32 − 39 39 − 46 46 − 53 nj ! Nj 30 14 8 9 6 3 70 30 44 52 61 67 70 r = partes tomadas n = Tamaño de la muestra (total de observaciones) , corresponden al 68% de alumnos alumnos 4 Esta cantidad indica que el 68% de los 70 alumnos tienen una edad máxima de 28.15 años y el 32% restante supera esta edad. MODA Moda es el valor de la variable que se repite con más frecuencia. Notación: Md(X) Donde: Md = Moda Y'j−1 = Limite de la clase modal Cj = Amplitud de clase nj−1 = Frecuencia anterior a la más lata frecuencia nj = Frecuencia más alta nj+1 = Frecuencia posterior a la más alta frecuencia Y'j−1 − Y'j nj 11 − 18 18 − 25 25 − 32 32 − 39 39 − 46 46 − 53 30 14 8 9 6 3 alumnos MEDIDAS DE DISPERSION MEDIDAS DE DISPERSION ABSOLUTA La dispersión se puede medir en términos de distancia (diferencial) entre los valores de un conjunto de datos y se considera una medida de referencia de ese mismo conjunto. • EL RANGO O RECORRIDO Es la diferencia entre el dato mayor y el dato menor de los valores observados en la variable de estudio. R = Rango 5 D = Valor de la observación mayor d = Valor de la observación menor El rango no analiza sino los datos extremos y no la variación de todo el conjunto de datos R=D−d R = 53 − 11 R = 42 Este valor indica la distancia que existe entre la edad mayor y la edad menor. B) EL RANGO MODIFICADO Y'j−1 − Y'j 11 − 18 18 − 25 25 − 32 32 − 39 39 − 46 46 − 53 Nj ! Nj 30 14 8 9 6 3 70 30 44 52 61 67 70 R50 R40 0% P11 P20 P25 P55 P60 P65 70% R60 70% R = Rango P60 = Percentil 60 P20 = Percentil 10 alumnos alumnos 6 VARIANZA Nos indica la distancia promedio de cualquier observación en el conjunto de datos S2 = Varianza de la muestra Xj = Observación i de la muestra = Promedio de la muestra N = Tamaño de la muestra Edades Desviación con respecto a la media "(Xi − Desviación elevada al cuadrado "(Xi − X 11 18 25 32 39 46 171 ) 11 − 28.5 = 18 − 28.5 = 25 − 28.5 = 32 − 28.5 = 39 − 28.5 = 46 − 28.5 = −17.5 −10.5 −3.5 3.5 10.5 17.5 0 )2 306.25 110.25 12.25 12.25 110.25 306.25 857.5 Se calcula la media aritmética La varianza con base en la definición es: DESVIACION ESTANDAR Se obtiene extrayendo la raíz cuadrada de la varianza 7 Este valor significa que los datos en promedio se alejan de la media aritmética en 11.95 años es decir la dispersión promedio: REGRESION Y CORRELACION REGRESION SIMPLE El rector del Colegio Centro Social Bachillerato nocturno establece una relación entre la edad de los alumnos y las fallas a clases que tuvieron durante el año lectivo de 1998. Para esto recogió la muestra de 10 alumnos tomados al azar entre todos los alumnos que terminaron el año. En el Colegio Centro Social se obtiene X 25 19 17 23 21 16 25 31 39 28 244 Y 5 3 1 8 4 9 2 7 6 12 57 XY 125 57 17 184 84 144 50 217 234 336 1448 X2 625 361 289 529 441 256 625 961 1521 784 6392 Y2 25 9 1 64 16 81 4 49 36 144 429 Y = 2.828 − 0.130X El Rector del colegio desea estimar las fallas de un alumno con 27 años de edad: Y = 2.828 − 0.130*27 = 9.93 Se estima que un alumno de 27 años de edad falte a clases 9.93 veces. La información gráficamente quedaría: ERROR DE ESTIMACION 8 Error de estimación es = 3.15 9 Y1=(11+18)/2=14.5 N = 70 Nj−1 " n/2 < N'j 44 " 35 < 44 10 11