UNIVERSIDAD “JOSE CARLOS MARIATEGUI” TEMA V ESTADIGRAFOS DE DISPERSION Y DISTRIBUCION NORMAL ESTANDAR 1. Estadígrafos de dispersión. Rango, desviación media, varianza y desviación estándar, coeficiente de variación. 2. Distribución normal estándar. OBJETIVOS DE UNIDAD ¾ GENERALES. Proporcionar elementos que permitan apreciar y evaluar la forma en que se dispersan los valores originales con respecto a la media y la evaluación de valores con el auxilio de la curva normal ¾ ESPECÍFICOS. Al concluir la unidad, el estudiante estará capacitado para calcular, identificar e interpretar los estadígrafos de dispersión. Con el auxilio de la curva normal, el estudiante podrá determinar el rango percentil de cualquier va1or de una distribución de frecuencia normal. 58 EDUCA INTERACTIVA UNIVERSIDAD “JOSE CARLOS MARIATEGUI” LECCIÓN Nº 11 ESTADIGRAFOS DE DISPERSION 1. MEDIDAS DE DISPERSIÓN La dispersión se refiere a la variabilidad o amplitud en los datos. Las medidas más importantes de dispersión son: (1) la desviación media (2) la varianza, y (3) la desviación estándar. Las usaremos para poblaciones y muestras, así como para datos agrupados y no agrupados. a) La Desviación Media (DM) ¾ Para Datos No Agrupados DM = DM = ∑ X −µ N ∑X−X n para poblaciones para muestras Donde las barras verticales indican el valor absoluto, o los valores que omiten el signo, con los otros símbolos que tienen el mismo significado. ¾ Para Datos Agrupados DM = ∑f DM = ∑f X −µ N X −X n para poblaciones para muestras Donde f se refiere a la frecuencia de cada clase y X a las marcas de clase. 59 EDUCA INTERACTIVA UNIVERSIDAD “JOSE CARLOS MARIATEGUI” b) Varianza La varianza de población σ 2 (la letra griega sigma al cuadrado) ¾ Para Datos No Agrupados σ 2 ∑ (X − µ ) = 2 ∑ (X − X ) = 2 N y s 2 n −1 ¾ Para Datos Agrupados σ 2 ∑ f (X − µ ) = 2 ∑ f (X − X ) = 2 N s y 2 n −1 c) Desviación Estándar La desviación de la población σ y la desviación estándar de la muestras s son las raíces cuadradas positivas de sus varianzas respectivas. ¾ Para Datos No Agrupados σ= ∑ (X − µ ) 2 ∑ (X − X ) 2 y N s= n −1 ¾ Para Datos Agrupados σ = ∑ f (X − µ ) 2 N ∑ f (X − X ) 2 y s = n −1 La desviación estándar es la medida de dispersión (absoluta) más utilizada. Otras medidas (además de la varianza y la desviación media) son el rango. 2. EL COEFICIENTE DE VARIACIÓN (CV) Mide la dispersión relativa: CV = σ µ para poblaciones y CV = s X para muestras Ejemplo 1: La desviación media, varianza, desviación estándar, y el coeficiente de variación para los datos no agrupados dados en la tabla 1 se pueden encontrar por medio de los cálculos correspondientes: Tabla (1) ( µ = 7) 60 EDUCA INTERACTIVA UNIVERSIDAD “JOSE CARLOS MARIATEGUI” DM = ∑ X − u = 12 = 1.2 N 10 ∑( X − µ ) = 2 σ 2 σ 2 N ∑( X − µ) = 22 10 2 N CV = = Puntos cuadrados 22 = 2.2 ≅ 1.48 puntos 10 σ ≅ 0.21ó21% µ Cálculos sobre los datos Notas: Tabla (1) µ Nota = Puntos X −µ 7 7 7 7 7 7 7 7 7 7 6 7 6 8 5 7 6 9 10 6 X −µ ( X − µ )2 -1 0 -1 1 -2 0 -1 2 3 1 0 1 1 2 0 1 2 3 1 0 1 1 4 0 1 4 9 1 ∑ (X − µ) = 0 1 ∑ X − µ = 12 1 ∑ (X − µ) 2 = 22 Ejemplo 2. La desviación media, la varianza, la desviación estándar, y el coeficiente de Variación para la distribución de frecuencia de los pesos (datos agrupados) dados en la tabla (2) ( X = 20.08). DM = ∑ fX − X n s 2 = 6.36 = 0.318 20 ∑ f (X − X ) = n −1 onzas 2 = 2.9520 ≅ 0.1554 19 onzas cuadradas 61 EDUCA INTERACTIVA UNIVERSIDAD “JOSE CARLOS MARIATEGUI” s= CV = ∑ f (X − X ) n −1 2 = 2.9520 = 0.1554 ≅ 0.3942 19 onzas s 0.3942oz ≅ ≅ 0.0196, o 1.96% 20.08oz X Nótese que en la formula para s2 y s, se usan n-1 en vez de n en el denominador. σ , De las formulas σ , s2, y s presentadas en esta sección, se pueden derivar otras para simplificar los cálculos en un grupo grande de datos. 2 Tabla (2) Cálculos sobre los datos. Peso onz. 19.20-19.40 19.50-19.70 19.80-20.00 20.10-20.30 20.40-20.60 20.70-20.90 62 Marca de clase x 19.30 19.60 19.90 20.20 20.50 20.80 Frecuencia Media X - X F x X- X 1 2 8 4 3 0.78 0.48 0.18 0.12 0.42 0.72 ∑ 2 f = n = 20 20.08 20.08 20.08 20.08 20.08 20.08 -0.78 -0.48 -0.18 0.12 0.42 0.72 ∑ fX − X 0.78 0.96 1.44 0.48 1.26 ∑ f ( X − X )2 (X - X )2 1.44 fX − X = 6.36 0.6084 0.2304 0.0324 0.0144 0.1764 0.5184 0.6084 0.4608 0.2592 0.0576 0.5292 ∑ 1.0368 f ( X − X ) 2 = 2.9520 EDUCA INTERACTIVA UNIVERSIDAD “JOSE CARLOS MARIATEGUI” LECCIÓN Nº 12 DISTRIBUCION NORMAL ESTANDAR 1. DISTRIBUCION NORMAL La distribución normal es muy importante por lo siguiente: ¾ Es la distribución a la que se aproximan la mayoría de los fenómenos: físicos, químicos, biológicos. ¾ Se ha tomado como base en la inferencia estadística paramétrica ¾ Otras distribuciones bajo ciertas circunstancias se pueden aproximar a la normal ¾ Es la base para definir otras distribuciones de importancia tales como la Chi cuadrada, t de Student y F de Fisher. 2. CARACTERISTICAS DE LA DISTRIBUCION NORMAL Forma ¾ Es una campana simétrica con respecto a su centro. ¾ La curva tiene un solo pico; por tanto, es unimodal. ¾ La media de una población distribuida normalmente cae en el centro de su curva normal. ¾ Debido a la simetría de la distribución normal de probabilidad, la mediana y la moda de la distribución se encuentran también en el centro; en consecuencia, para una curva normal, la media, la mediana y la moda tienen el mismo valor. ¾ Los dos extremos de la distribución normal de probabilidad se extienden indefinidamente y nunca tocan el eje horizontal Parámetros Está caracterizada por dos parámetros a).- Parámetro de localización: La media 63 EDUCA INTERACTIVA UNIVERSIDAD “JOSE CARLOS MARIATEGUI” b).- Parámetro de forma: La varianza DISTRIBUCION NORMAL ESTANDAR. Z= x−µ σ Su fórmula es: Ejemplo: La altura media que alcanza el maíz es de 2.75 m con una desviación estándar de 0.63m. 1. ¿Cuál es la probabilidad o proporción de carrizos con una altura mayor a 3.50m? P( x > 350 . ) = 0.500 − 0.3830 = 0117 . 2. Si seleccionamos unos carrizos al azar, cuál es la probabilidad que midan entre 2 y 3 m. P( x = 2 y 3) = 0.3830 + 01517 . = 0.5347 2 − 2.75 − 0.75 = = −11904 . 0.63 0.63 3 − 2.75 0.25 = = 0.3968 Z= 0.63 0.63 Z= 3. Cúal es la probabilidad o proporción de carrizos de maíz con altura mayor de 1.75m? P( x > 175 . ) = 0.500 + 0.4429 = 0.9429 3. AREAS BAJO LA CURVA NORMAL No importa cuáles sean los valores de la µ y σ para una distribución de probabilidad normal, el área total bajo la curva es 1.00, de manera que podemos pensar en áreas bajo la curva como si fueran probabilidades. Matemáticamente es verdad que: 2 ¾ Aproximadamente 68% de todos los valores de una población normalmente distribuida se encuentra dentro de ±1 desviación estándar de la media. ¾ Aproximadamente 95.5 % de todos los valores de una población normalmente distribuida se encuentra dentro de ± 2 desviación estándar de la media. 64 EDUCA INTERACTIVA UNIVERSIDAD “JOSE CARLOS MARIATEGUI” ¾ Aproximadamente 99.7 % de todos los valores de una población normalmente distribuida se encuentra dentro de ± 3 desviación estándar de la media. USO DE LA TABLA DE DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR Observe en esta tabla la localización de la columna identificada con z. El valor de z está derivado de la formula: X = valor de la variable aleatoria que nos preocupa µ = media de la distribución de la variable aleatoria σ = desviación estándar de la distribución Z = número de desviaciones estándar que hay desde x a la media de la distribución Utilizamos Z en lugar del ‘número de desviaciones estándar’ porque las variables aleatorias normalmente distribuidas tienen muchas unidades diferentes de medición: dólares, pulgadas, partes por millón, kilogramos, segundos. Como vamos a utilizar una tabla, la tabla I, hablamos en términos de unidades estándar (que en realidad significa desviaciones estándar), y denotamos a éstas con el símbolo z. µ = 50 X 125 -25 0 25 50 75 100 -----------------------------------------3 -2 -1 0 1 2 3 Z= σ = 25 x−µ σ La tabla representa las probabilidades o áreas bajo la curva normal calculadas desde la µ x hasta los valores particulares de interés X. Usando la ecuación de Z, esto corresponde a las probabilidades o áreas bajo la curva normal estandarizada desde la media ( µ z = 0) hasta los valores transformados de interés Z. Sólo se enumeran entradas positivas de Z en la tabla, puesto que para una distribución simétrica de este tipo con una media de cero, el área que va desde la media hasta +Z (es decir, Z desviaciones estándar por encima de la media) debe ser idéntica al área que va desde la media hasta –Z (es decir, Z desviaciones estándar por debajo de la media). También podemos encontrar la tabla que indica el área bajo la curva normal estándar que corresponde a P(Z < z) para valores de z que van de –3.49 a 3.49. 65 EDUCA INTERACTIVA UNIVERSIDAD “JOSE CARLOS MARIATEGUI” Al usar la tabla observamos que todos los valores Z deben registrarse con hasta dos lugares decimales. Por tanto, nuestro valor de interés particular Z se registra como +.2. para leer el área de probabilidad bajo la curva desde la media hasta Z = +.20, podemos recorrer hacia abajo la columna Z de la tabla hasta que ubiquemos el valor de interés Z. Así pues, nos detenemos en la fila Z = .2. A continuación, leemos esta fila hasta que intersecamos la columna que contiene el lugar de centésimas del valor Z. Por lo tanto, en la tabla, la probabilidad tabulada para Z = 0.20 corresponde a la intersección de la fila Z = .2 con la columna Z = .00 como se muestra. Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 0.0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.03586 0.1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.07535 0.2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409 66 EDUCA INTERACTIVA UNIVERSIDAD “JOSE CARLOS MARIATEGUI” LA TABLA DE DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR DISTRIBUCIÓN DE PROBABILIDAD NORMAL ESTÁNDAR Áreas bajo la distribución de probabilidad Normal Estándar entre la media y valores positivos de Z µ = 0 y σ²=1 Z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.0 .00 0.00000 0.03983 0.07926 0.11791 0.15542 0.19146 0.22575 0.25804 0.28814 0.31594 0.34134 0.36433 0.38493 0.40320 0.41924 0.43319 0.44520 0.45543 0.46407 0.47128 0.47725 0.48214 0.48610 0.48928 0.49180 0.49379 0.49534 0.49653 0.49744 0.49813 0.49865 0.49903 0.49931 0.49952 0.49966 0.49977 0.49984 0.49989 0.49993 0.49995 0.49997 .01 0.00399 0.04380 0.08317 0.12172 0.15910 0.19497 0.22907 0.26115 0.29103 0.31859 0.34375 0.36650 0.38686 0.40490 0.42073 0.43448 0.44630 0.45637 0.46485 0.47193 0.47778 0.48257 0.48645 0.48956 0.49202 0.49396 0.49547 0.49664 0.49752 0.49819 0.49869 0.49906 0.49934 0.49953 0.49968 0.49978 0.49985 0.49990 0.49993 0.49995 0.49997 .02 0.00798 0.04776 0.08706 0.12552 0.16276 0.19847 0.23237 0.26424 0.29389 0.32121 0.34614 0.36864 0.38877 0.40658 0.42220 0.43574 0.44738 0.45728 0.46562 0.47257 0.47831 0.48300 0.48679 0.48983 0.49224 0.49413 0.49560 0.49674 0.49760 0.49825 0.49874 0.49910 0.49936 0.49955 0.49969 0.49978 0.49985 0.49990 0.49993 0.49996 0.49997 .03 0.01197 0.05172 0.09095 0.12930 0.16640 0.20194 0.23565 0.26730 0.29673 0.32381 0.34849 0.37076 0.39065 0.40824 0.42364 0.43699 0.44845 0.45818 0.46638 0.47320 0.47882 0.48341 0.48713 0.49010 0.49245 0.49430 0.49573 0.49683 0.49767 0.49831 0.49878 0.49913 0.49938 0.49957 0.49970 0.49979 0.49986 0.49990 0.49994 0.49996 0.49997 .04 0.01595 0.05567 0.09483 0.13307 0.17003 0.20540 0.23891 0.27035 0.29955 0.32639 0.35083 0.37286 0.39251 0.40988 0.42507 0.43822 0.44950 0.45907 0.46712 0.47381 0.47932 0.48382 0.48745 0.49036 0.49266 0.49446 0.49585 0.49693 0.49774 0.49836 0.49882 0.49916 0.49940 0.49958 0.49971 0.49980 0.49986 0.49991 0.49994 0.49996 0.49997 .05 0.01994 0.05962 0.09871 0.13683 0.17364 0.20884 0.24215 0.27337 0.30234 0.32894 0.35314 0.37493 0.39435 0.41149 0.42647 0.43943 0.45053 0.45994 0.46784 0.47441 0.47982 0.48422 0.48778 0.49061 0.49286 0.49461 0.49598 0.49702 0.49781 0.49841 0.49886 0.49918 0.49942 0.49960 0.49972 0.49981 0.49987 0.49991 0.49994 0.49996 0.49997 .06 0.02392 0.06356 0.10257 0.14058 0.17724 0.21226 0.24537 0.27637 0.30511 0.33147 0.35543 0.37698 0.39617 0.41308 0.42785 0.44062 0.45154 0.46080 0.46856 0.47500 0.48030 0.48461 0.48809 0.49086 0.49305 0.49477 0.49609 0.49711 0.49788 0.49846 0.49889 0.49921 0.49944 0.49961 0.49973 0.49981 0.49987 0.49992 0.49994 0.49996 0.49998 .07 0.02790 0.06749 0.10642 0.14431 0.18082 0.21566 0.24857 0.27935 0.30785 0.33398 0.35769 0.37900 0.39796 0.41466 0.42922 0.44179 0.45254 0.46164 0.46926 0.47558 0.48077 0.48500 0.48840 0.49111 0.49324 0.49492 0.49621 0.49720 0.49795 0.49851 0.49893 0.49924 0.49946 0.49962 0.49974 0.49982 0.49988 0.49992 0.49995 0.49996 0.49998 .08 0.03188 0.07142 0.11026 0.14803 0.18439 0.21904 0.25175 0.28230 0.31057 0.33646 0.35993 0.38100 0.39973 0.41621 0.43056 0.44295 0.45352 0.46246 0.46995 0.47615 0.48124 0.48537 0.48870 0.49134 0.49343 0.49506 0.49632 0.49728 0.49801 0.49856 0.49896 0.49926 0.49948 0.49964 0.49975 0.49983 0.49988 0.49992 0.49995 0.49997 0.49998 .09 0.03586 0.07535 0.11409 0.15173 0.18793 0.22240 0.25490 0.28524 0.31327 0.33891 0.36214 0.38298 0.40147 0.41774 0.43189 0.44408 0.45449 0.46327 0.47062 0.47670 0.48169 0.48574 0.48899 0.49158 0.49361 0.49520 0.49643 0.49736 0.49807 0.49861 0.49900 0.49929 0.49950 0.49965 0.49976 0.49983 0.49989 0.49992 0.49995 0.49997 0.49998 67 EDUCA INTERACTIVA UNIVERSIDAD “JOSE CARLOS MARIATEGUI” PRUEBA AUTOEVALUATIVA V UNIDAD 1. El estudio de los estadígrafos de dispersión es importante: a. Porque nos define con más claridad la estadística y sus métodos. b. Porque nos permite tener una información auxiliar para definir el verdadero comportamiento de los valores que toma la variable. c. Porque nos permite concentrar en un concepto los dispersos temas estadísticos. d. Porque la dispersión se profundiza a medida que avanza el curso. e. Ninguna de las anteriores. 2. Hallar la desviación media de la información proporcionada en la pregunta (6) de la autoevaluación de la segunda unidad. a) 6,36 d) 11,8 b) 9,8 c) 12 e) Ninguna de las anteriores 3. Se tiene la siguiente información sobre el número de docentes por C.E: 12, 14, 16, 18, 20. Calcular la desviación media (DM) y la varianza (S2). a) DM = 3 S2 = 10 b) DM = 3.5 S2 = 9 c) DM = 2,4 S2 = 8 d) DM = 5 S2 = 2 e) Ninguna de las anteriores 4. Calcular la varianza (S2) y la desviación estándar (S) para los daros proporcionados en la pregunta (6) de la autoevaIuación de la segunda unidad. Ten preseme el numero de datos. a) S2 = 66,98 S = 8,18 d) S2 = 36 S=6 b) S2 = 6,7 S = 2,59 a) S2 = 32,82 S = 5,73 e) Ninguna de las anteriores 5. Calcular la varianza (S2) y la desviación estándar (S) para la información proporcionada en la pregunta (6) de la autoevaIuación de la tercera unidad. Fíjate bien en el número de observaciones. a) S2 = 46,17 S = 6,79 d) S2 = 25 S=5 68 b) S2 = 64,71 S = 8,04 c) S2 = 71,64 S = 8,46 e) Ninguna de las anteriores EDUCA INTERACTIVA UNIVERSIDAD “JOSE CARLOS MARIATEGUI” 6. Hallar el coeficiente de variación para la distribución planteada en la pregunta (6) de la autoevaluacion de la tercera unidad: a) CV = 25% d) CV = 22,49% b) CV = 49,15% c) CV = 49% e) Ninguna de las anteriores 7. En una muestra de 100 alumnos, se observa con mucha preocupación que el calificativo promedio es de 44.3 puntos con una desviación estándar de 16.94. El alumno Vásquez ha obtenido un calificativo de 60. Con ayuda de la curva normal, hallar su rango percentil y además indicar cuántos alumnos están por debajo de él. a) 32% 32 b) 60% 60 c) 82.38% 82 d) 52% 22 e) Ninguna de las anteriores 8. Con los datos de la pregunta anterior evaluar el calificativo del alumno Olivares quien ha obtenido la nota de 30, indicar además, debajo de cuántos alumnos está ubicado el referido alumno. a) 20,05% 80 b) 30% 70 c) 30% 50 d) 35% 70 e) Ninguna de las anteriores 9. Con la información de la pregunta 7 Y 8 de la presente evaluación, hallar qué tanto por ciento de alumnos están comprendidos entre el calificativo de Vásquez y el de Olivares y a cuántos alumnos equivale este %. a) 50% 25 b) 63,33% 62 c) 70% 70 d) 55% 55 e) Ninguna de las anteriores 10. El coeficiente de variación se define como: a. El indicador que mide la variación de las variables. b. La forma en que varía una muestra de otra. c. El indicador que mide el grado de dispersión de los valores respecto a la media. d. a y b. e. Ninguna de las anteriores. 69 EDUCA INTERACTIVA