Lidia Diblasi CATÍTULO V DISTRIBUCIONES CONTINUAS: Distribución NORMAL En nuestra vida utilizamos muchas veces la palabra normal para decir por ejemplo que es “normal que los jóvenes ingresen a la universidad cuando tienen entre 18 y 19 años” o que es “normal que en Mendoza tengamos en verano temperaturas de alrededor de 30º” o que es “normal que una persona que mide 1,65 m tenga un peso de entre 55 y 60 kg”, etc por supuesto que no todo es tan simétrico y tenemos alumnos en la universidad que ingresan con edades mucho mayores a los 18 años, o que en verano la temperatura pueda llegar a 42 grados, o que una persona de 1,65 m pese 48 kg, etc Pero si es cierto que hay ciertas “medidas” que son normales por ser siempre las más comunes respecto al grupo de estudio. En Estadística podemos demostrar que la probabilidad de los casos extremos son bajas. Lo más común es encontrar la mayor cantidad de casos concentrada alrededor de los valores medios o las medidas de tendencia central. En estos casos estamos en presencia de una distribución que llamamos Normal. Es una curva teórica, suave, perfectamente simétrica que concentra la mayoría de los datos en el centro y que es unimodal. En el ejemplo siguiente podemos apreciar un modelo de distribución Normal que representa la edad de los niños que asisten a un comedor comunitario. 7 6 5 4 3 2 Des v. típ. = 2.45 1 Media = 6.0 N = 36.00 0 .0 12 .0 11 0 3. -1 0 2. -1 0 1. -1 0 0. -1 .0 -9 .0 -8 .0 -7 .0 -6 .0 -5 .0 -4 .0 -3 .0 -2 .0 10 0 9. 0 8. 0 7. 0 6. 0 5. 0 4. 0 3. 0 2. 0 1. Edad de niños aist entes a un comedor comunitario 131 Lidia Diblasi Veamos cómo trabaja Cuando estudiamos las variables discretas aprendimos a determinar la probabilidad de que la variable aleatoria discreta “X” asuma un valor particular. Cuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo Xa y Xb, o la probabilidad de que “X” sea mayor que Xb o menor que Xa. Si recordamos el ejemplo de la edad de las mujeres al casarse, que vimos en el capítulo III, podríamos averiguar la probabilidad del intervalo entre 25 y 29 años de edad, donde Xa = 25 y Xb = 29. Hemos visto que las distribuciones de frecuencia y las distribuciones de frecuencias relativas de variables continuas se construyen definiendo unos intervalos de clase y determinando la frecuencia o frecuencia relativa con que las observaciones quedan incluidas dentro de los intervalos de clase. Esto se puede representar gráficamente por medio de histogramas o polígonos de frecuencia. El área que queda comprendida bajo el histograma o el polígono de frecuencia entre dos valores cualquiera por ejemplo: Xa y Xb de una variable aleatoria “X” es igual a la frecuencia relativa de la ocurrencia de los valores de “X” entre Xa y Xb, en nuestro ejemplo entre 25 y 29 años. Sabemos que si los datos que disponemos son una muestra extraída de una población, podemos interpretar estas frecuencias relativas como estimaciones de las probabilidades verdaderas correspondientes. Podemos interpretar la frecuencia relativa de que ocurran valores muestrales de “X” entre Xa y Xb (inclusive), como una estimación de la P(Xa ≤ X ≤ Xb), es decir, de la probabilidad de que “X” tome valores entre Xa (25) y Xb (29) (inclusive). Intervalo 15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 40 - 44 45 - 49 50 - 54 xi 17 22 27 32 37 42 47 52 fi 8 9 11 8 6 4 2 2 132 fr 0.16 0.18 0.22 0.16 0.12 0.08 0.04 0.04 Lidia Diblasi Siguiendo el ejemplo podríamos decir, siguiendo las frecuencias relativas que la probabilidad del intervalo entre 25 y 29 años es del 0,22 o del 22%. Supongamos que tenemos una muestra de una variable aleatoria continua “X”, hacemos el histograma correspondiente con frecuencias relativas. El área sombreada se puede interpretar como la estimación de la probabilidad de que “X” asuma valores entre Xa y Xb. Si tenemos una muestra grande de valores de X y hacemos los intervalos muy pequeños podemos obtener otro tipo de representación. 133 Lidia Diblasi A medida que crece el número de observaciones y disminuyen las amplitudes de los intervalos de clase, el histograma se asemeja cada vez más a una curva suave. El área comprendida bajo la curva y por encima del eje horizontal y entre las perpendiculares que se levantan sobre los dos puntos a y b, es igual a la probabilidad de que la variable aleatoria asuma los valores comprendidos entre los dos puntos. Lo que se está haciendo es determinar la probabilidad comprendida en un intervalo. La razón es que para una variable continua p(X = x) = 0. O sea que la probabilidad de que “X” asuma un valor específico es igual a cero. Lo que quiero decir es que no podemos calcular el valor de un punto, sino el de un área o intervalo, por pequeño que sea. Podemos ver en una curva que represente una distribución de probabilidades continuas que el área que queda encima de un punto es igual a cero. Para calcular el área entre dos puntos ej. a y b, en una distribución de probabilidades continuas necesitamos usar el cálculo integral. En el proceso de integración, el cálculo integral utiliza una técnica matemática que es el límite de una sumación. Así cuando uno emplea el cálculo integral para hallar el área bajo una curva suave, en realidad está agregando áreas de rectángulos infinitesimalmente pequeños (celdas). Nosotros no vamos a usar el cálculo integral en ninguna distribución de probabilidad continua, ya que las áreas bajo las curvas que tienen interés ya han sido determinadas y tabuladas. Distribución Normal: Es una de las más importantes que se conocen. Su fórmula fue publicada por primera vez por Abrahan Demoivre en 1733. Otros que figuran en su historia son Pierre Simón, el Marqués de La Place (1749 – 1827) y Carl Gauss (1777 – 134 Lidia Diblasi 1855), en cuyo honor se denomina a veces distribución de Gauss o campana de Gauss. La fórmula es: -1/2 ( x - µ ) 2 σ 1 f(x) = e σ Donde: 2π µ . media de la distribución σ: la desviación típica de la distribución π: la constante 3,14159... e: la constante 2,71828... Algunas características de la distribución normal: 1- es una distribución con forma de campana, perfectamente simétrica basada en un número infinito de casos, por lo que sólo puede ser tratada de forma aproximada, cuando trabajamos con datos reales. 2- al ser una distribución simétrica respecto de su media, el 50% del área está a la derecha de la media y el 50 % a la izquierda. 3- la media (µ ó x ), la mediana (Me) y la moda (Mo) son iguales. 4- la distancia horizontal que hay desde el punto de inflexión de la curva (el punto donde la curva deja de ser cóncava hacia abajo y empieza a ser cóncava hacia arriba) hasta una perpendicular levantada sobre la media es igual a la desviación típica. 135 Lidia Diblasi 5- el área comprendida bajo la curva y por encima del eje horizontal es igual a 1, como suma de frecuencias relativas o como distribución de probabilidad. 6- la distribución normal es realmente una “familia” de distribuciones puesto que existe una distribución diferente para cada valor de µ y σ. El valor de µ sitúa a la distribución en el eje horizontal. Y el valor de σ nos dice que cuanto más grande sea la desviación típica, más plana y extendida es la gráfica de la distribución. Ejemplo: tres distribuciones normales con distinta µ e igual σ. Pensemos por ejemplo que tenemos el promedio de edad de tres grupos de estudiantes de distinto niveles educativos: el primer grupo representan las edades de alumnos de 7º año de la escuela primaria y su media es de 11,96 años; el segundo grupo representa a alumnos de 5º año del nivel medio, su media es de 18,5 años y por último el tercer grupo representa a alumnos universitarios que 136 Lidia Diblasi llevan cinco años desde que comenzaron la carrera universitaria, su promedio de edad es de 24,8 años. Todos los grupos son muy homogéneos en su conformación y tienen una desviación típica aproximada de 1,5 años Ejemplo: tres distribuciones normales con igual µ y distinta σ. También podemos pensar en grupos que coinciden en la edad promedio pero que son muy heterogéneos en su conformación y tienen desviaciones típicas muy distintas que hacen que su representación adquiera diversa forma por su variabilidad. 7- la curva de la distribución normal se extiende desde - ∞ a + ∞ sin cortar nunca el eje de las x o el eje horizontal. 8- si levantamos perpendiculares a una distancia de una desviación típica de la media en cada uno de los dos lados, el área comprendida entre estas dos perpendiculares, la curva y el eje horizontal es igual aproximadamente a 0,6826 o 137 Lidia Diblasi sea el 68,26 % del área total. De la misma forma podemos encerrar el 95 %, levantando perpendiculares a dos desvíos de la media y para ambos lados. Podemos encerrar aproximadamente el 99,7 % del área total, levantando perpendiculares a una distancia de tres desviaciones estándar desde la media en cada uno de los dos lados. Dicho de otro modo, si nos apartamos uno, dos o tres desvío de la media hacia ambos lados vamos a obtener el 68, el 95 y el 99 % de los casos de la distribución, aún en distribuciones levemente asimétricas. La distribución normal estandarizada: 138 Lidia Diblasi Dijimos que hay una distribución normal diferente para cada valor diferente de media y desvío poblacional: µ y σ. De ahí que es muy importante una distribución normal que se llama distribución normal estandarizada que tiene media µ = 0 y σ = 1 (varianza), y todas sus áreas se encuentran tabuladas. En esta tabla podemos encontrar cualquier valor entre 0 y zi, o sea cualquier valor entre la media y un valor determinado de la variable aleatoria Z que está normalmente distribuida con media 0 y varianza 1.(Ver tabla Distribución Normal en Anexos Tablas) Aplicaciones de la distribución normal: Como ya dijimos, es muy poco probable que en la realidad encontremos variables aleatorias que se distribuyen normalmente con exactitud, porque la distribución normal es un ideal matemático. Pero sí muchas variables aleatorias continuas pueden caracterizarse mediante una distribución normal. Cuando en una investigación la variable de interés está normalmente distribuida por lo menos de manera aproximada, utilizamos en su análisis el conocimiento que tenemos de la distribución normal. Con la distribución normal estandarizada, podemos responder preguntas de probabilidad en relación a una variable aleatoria “X” que está normalmente distribuida por lo menos de manera aproximada. Por ejemplo podríamos desear saber la probabilidad de que alguna variable aleatoria “X” distribuida normalmente en forma aproximada, con media µ y desviación típica σ asuma valores comprendidos entre Xa y Xb. Para obtener dichas probabilidades transformamos la variable “X” con media µ y varianza σ en la variable normal estándar “Z” con media 0 y varianza 1, por medio de la fórmula: Xi - Z= µ σ 139 Lidia Diblasi Mediante esta fórmula cualquier valor xi de la variable aleatoria “X” se transforma en un valor z de la variable normal estandarizada “Z”. Una vez que hallamos hecho estas transformaciones podemos utilizar la tabla para hallar las probabilidades de interés. Los valores de la variable Z representan unidades de desvíos respecto a la media. Veamos un ejemplo: Supongamos que queremos encontrar el área bajo la curva de la normal o la probabilidad entre dos valores de una variable X: definida como “cantidad de horas de estudios mensuales” xa y xb, donde: Xa = 105 horas de estudio Xb = 115 horas de estudio La media de esta variable aleatoria “X” es µ = 100 y σ = 10, entonces, si pasamos estos valores de X a Z mediante la fórmula tenemos: 140 Lidia Diblasi Xa Za = Xb Zb = 105 − 100 = 0,5 10 115 − 100 = 1,5 10 115 − 100 105 − 100 P (105 ≤ x ≤ 115) = P ≤Z≤ 10 10 P ( 0,5 ≤ Z ≤ 1,5 ) 141 Lidia Diblasi Si buscamos en la tabla de la distribución Normal los valores de probabilidad acumulada correspondiente al valor de Z = 0,5 y el de Z = 1,5, obtenemos los siguientes resultados: Z = 0,5 0,1915 F(x1) área entre 0 y 0,5 Z = 1,5 0,4332 F(x2) área entre 0 y 1,5 = F(x2) – F(x1) = 0,4332 – 0,1915 P (105 ≤ x ≤ 115) = 0,2417 Podemos decir entonces que la probabilidad de encontrar alumnos universitarios que estudien entre 105 y 115 es de 0,2417 o del 24 %. O más simple que el 24 % de los estudiantes consultados estudian 105 y 115 horas mensuales, lo que representa entre 3,5 y 3,8 horas diarias. Cómo usamos la tabla de Probabilidades Normales. Veamos algunos ejemplos Vamos a trabajar con los resultados de una encuesta realizada a los alumnos ingresantes a primer año de la facultad de Ciencias Políticas y Sociales de la UNCuyo para determinar el perfil del ingresante. A la pregunta “cuántas horas de estudio semanal considerás que deberías dedicarle al estudio en la universidad independiente de las horas de clase” la respuesta generó una distribución aproximadamente normal con media 22 horas y un desvío de 6,5 hs. Caso 1 Queremos calcular la probabilidad de encontrar alumnos que estudien entre 15,5 hs y 28,5 hs. 28.5 − 22 15,5 − 22 P (15,5 ≤ x ≤ 28,5) = P ≤Z ≤ 6 .5 6 .5 142 Lidia Diblasi P ( −1 ≤ Z ≤ 1) El área de la variable X:”horas de estudio” entre 15,5 y 28,5 se corresponde con el área de la variable Z entre -1 y 1. Lo que nos está indicando que el área que estamos buscando se encuentra a un desvío en más y en menos de la media. Vamos a buscar en la tabla de las probabilidades de la distribución Normal a qué probabilidad corresponde el área entre -1 y 1. En la tabla aparecen en la primera columna el entero y el primer decimal de los valores de Z y en la primera fila el segundo decimal. Los valores que nos proporciona la tabla son probabilidades acumuladas, desde el valor 0 hasta el 0,50, o la mitad de la distribución para valores positivos de Z. Si observamos en tabla el valor 1,00 corresponde al valor 0,3413 y como la distribución normal es perfectamente simétrica, el área entre 0 y 1 es igual al área entre 0 y -1, por lo tanto esta área también vale 0,3413. 15,5 22 28,5 X -1 0 1 Z 0,34,13 + 0,3413 Por lo tanto todo el área entre -1 y 1 es igual a la suma de ambas: 143 Lidia Diblasi (-1 ≤ Z ≤ 1) = 0,3413 + 0,3413 = 0,6826 Por lo que podemos concluir que la probabilidad de encontrar alumnos de este grupo que estudien entre 15,5 y 28,5 horas semanales es de 0,6826 o del 68,26% O bien podríamos decir que el 68% estudian entre 2 y 4 horas diarias aproximadamente. Caso II Siguiendo el mismo ejemplo queremos calcular la probabilidad de aquellos alumnos que estudian más de 30 hs semanales. 30 − 22 P (X ≥ 30) = P Z ≥ 6,5 El área que encontramos en la tabla corresponde al valor de z de o a 1,23 = 0,3907 pero la probabilidad que nosotros buscamos es el de los valores mayores o iguales a 1,23, por lo tanto como sabemos que la mitad de la distribución, de 0 a infinito, es igual a 0,50 a éste valor debemos restarle 0,3907, para obtener la probabilidad buscada: 22 30 X 0 1,23 Z 0,3907 0,50 144 Lidia Diblasi P (Z ≥ 1,23) = 0,50 – 0,3907 = 0,1093 Por lo que podemos concluir que la probabilidad de encontrar alumnos que estudien 30 o más horas semanales es de 0,1093 o del 10,93% o del 11% aproximadamente. Caso III Siguiendo el mismo ejemplo supongamos que queremos calcular la probabilidad de aquellos alumnos que estudian menos de 30 hs semanales. 30 − 22 P (X ≤ 30) = P Z ≤ 6,5 a- Como sabemos por el caso II que los alumnos que estudian 30 o más horas es de 0,1093 y también sabemos por las propiedades de la distribución normal que toda el área debajo de la curva vale 1, podemos calcular el área propuesta haciendo: 1- F(x ≥ 30) = 1 – 0,1093 = 0,8907 Por lo que podemos concluir que la probabilidad de encontrar alumnos que estudien hasta 30 horas semanales es del 89 %. b- en el caso que no hubiéramos calculado la probabilidad de los que estudian más de treinta horas, podemos calcular la probabilidad de la siguiente forma: 30 − 22 P (X ≤ 30) = P Z ≤ 6,5 Z = 1,23 → 0,3907 145 Lidia Diblasi 22 30 X 0 1,23 Z Sabemos que el área entre 0 y 1,23 es igual a 0,3907. A ésta área debemos agregarle o sumarle todos aquellos que estudian menos de Z = 0, el área de - ∞ a 0 que sabemos que vale 0,50, ya que es la mitad de la distribución, por lo que el área total que buscamos es igual a: 0,50 + 0,3907 = 0,8907 Por lo que llegamos a la misma conclusión: los alumnos que estudian menos de 30 hs semanales representan el 89% de la distribución. Si la muestra de alumnos consultados fuera de n = 200, podríamos calcular cuántos son los que estudian menos de 30 horas semanales: 200 * 0,89 = 178 De un total de 200 alumnos los que estudian hasta 30 horas semanales son 178. Caso IV Supongamos que ahora queremos averiguar cual es la probabilidad de seleccionar alumnos que estudien entre 25 y 30 horas semanales: 146 Lidia Diblasi 30 − 22 25 − 22 P (25 ≤ x ≤ 30) = P ≤Z≤ 6 .5 6 .5 P ( 0,46 ≤ Z ≤ 1,23 ) ↓ 0,1772 ↓ 0,3907 ↓ El área entre 0 y 0,46 = 0,1772 Y el área entre 0 y 1,23 = 0,3907 22 0 25 0,46 30 1,23 X Z 0,1772 0,3907 Si sólo queremos saber la probabilidad o el área entre 0,46 y 1,23 y como la tabla nos da las probabilidades acumuladas a partir de la media en Z = 0, el área entre 0 y 0,46 está contenida en el área entre 0 y 1,23, por lo que debemos hacer la siguiente operación: 0,3907 – 0,1772 = 0,2135 Podemos concluir entonces que los alumnos que estudian entre 25 y 30 hs semanales representan el 21,35 % 147 Lidia Diblasi Caso V Siguiendo el mismo ejemplo supongamos que queremos calcular la probabilidad de aquellos alumnos que estudian más de 20 hs. semanales. 20 − 22 P (X ≥ 20) = P Z ≥ 6,5 Z ≥ -0,31 → 0,1217 la probabilidad del área entre 0 y -0,31 es de 0, 1217 a la cual debemos sumarle la probabilidad de los que estudian entre la media e infinito: 0 a ∞ que igual a 0,50, por lo que el resultado sería: 20 22 X -0,31 0 Z 0,1217 0,50 0,1217 + 0,50 = 0,6215 Podemos decir que los alumnos que estudian 20 o más horas semanales tienen una probabilidad de ser seleccionados de 0,6215 o de algo más del 62%. 148 Lidia Diblasi Caso VI a- Supongamos que queremos saber ahora a cuántos desvíos de la media está el 80% de la distribución, o dicho de otra forma cuánto valen Z1 y Z2. Si distribuimos el 80% a ambos lados de la media nos quedan dos áreas de 40% de los casos, una de los menores que la media y otra de los mayores. Ahora vamos a cambiar la forma de buscar en la tabla de la distribución normal. En vez de buscar los valores de probabilidad, conocido un valor de Z, en la primera columna y en la primera fila, como hemos hecho en los casos anteriores; dado que lo que conocemos es el valor de la probabilidad y que lo que queremos conocer es el valor de Z, buscamos en el interior de la tabla el valor que más se aproxime a 0,40, una vez localizado, recorremos el camino inverso; observamos en la primera columna y en la primera fila a qué valor de Z corresponde: El área del 40% menor y mayor que la media corresponde al valor de Z = ± 1,28 -1,28 0 0,40 1,28 Z 0,40 Podríamos decir entonces que el área del 80% se encuentra a ± 1,28 desvíos de la media 149 Lidia Diblasi b- supongamos que queremos averiguar a cuántos desvíos de la media se encuentra el área del 95%. Realizamos el mismo procedimiento, repartimos equitativamente 0,95 en dos lo cual nos da 0,475; buscamos este valor en el interior de la tabla: -1,96 0 0,475 1,96 Z 0,475 El área del 95% se encuentra entre los valores de Z = ± 1,96, o bien a 1,96 desvíos de la media. Caso VII Otra forma de usar la tabla de la distribución normal es para resolver problemas como el siguiente: a- Cuántas horas por semana estudia el 5% de los que menos estudian? Usando la misma fórmula que hemos utilizado para estandarizar la variable x a Z podemos resolver este ejercicio. La incógnita ahora es un valor de la variable y no una probabilidad: Z= xi − x σ 150 Lidia Diblasi Conocemos el valor de la media x = 22, el valor del desvío σ = 6,5 y podemos, con lo que hemos visto en los casos anteriores, conocer el valor de Z para el área 0,05 o del 5%, entonces despejamos Xi que es nuestra incógnita y nos queda: xi = Z * σ + x xi = -1,65 * 6,5 + 22 xi = -10,725 + 22 xi = 11,275 hs Podemos concluir que el 5% que menos estudia, estudia 11 horas semanales o menos. b- si nos hubieran preguntado por el 5% que más estudia, cuántas horas lo hace, hacemos exactamente el mismo procedimiento, lo único que va a cambiar es el signo correspondiente al valor de Z. xi = Z * σ + x xi = 1,65 * 6,5 + 22 xi = 10,725 + 22 xi = 32,725 hs. Podemos decir que el 5% que más estudia, estudia 33 hs o más Aproximación normal de la binomial La distribución normal proporciona una buena aproximación de la distribución binomial cuando “n” es grande y “p” no está demasiado cerca de 0 ó 1. Para utilizar la aproximación normal hacemos µ = n.p ; σ = √ n.p.q y convertimos los valores de la variable original en valores z, para hallar las probabilidades que nos interesan. Cuando el tamaño de la muestra que se va a analizar no es uno de los valores de “n” que figuran en las tablas binomiales disponibles, la aproximación normal a la binomial proporciona una alternativa conveniente, mientras más cerca esté P (probabilidad de éxito), de 0,5.. Como la distribución normal es una distribución de probabilidades para variables continuas y la binomial es una distribución de probabilidades para 151 Lidia Diblasi variables discretas, podemos obtener mejores resultados si hacemos un ajuste en que se tenga en cuenta este hecho cuando utilicemos la aproximación. Este ajuste, denominado corrección de continuidad, se puede comprender mejor observando un histograma construido con datos binomiales y con una curva suave superpuesta. Ejemplo: Vamos a calcular: para n= 20 y p = 0,3 a- P(x = 8) usando probabilidades binomiales b- P (7,5 ≤ X ≤ 8,5) usando aproximación normal (b) P (7,5 ≤ X ≤ 8,5) usando probabilidades normales 152 Lidia Diblasi Cuando utilizamos la aproximación normal de la binomial debemos tener en cuenta el hecho de que para la binomial P(X=x) es el área del rectángulo centrada en X. Cuando convertimos valores de “x” en valores de “Z” la corrección de continuidad consiste en sumar 0,5 a y/o restar 0,5 de x según sea conveniente. Ejemplo: P(Xa ≤ X ≤ Xb) P ( 7,5 ≤ X ≤ 8,5) Recordemos que en la binomial, la E(X) = x = n.p y la D(X) = σ = n. p.q , entonces: Z= X − n. p n. p.q Za = 7.5 − 20.0.3 1 .5 = = 0,73 2.05 20.0.3.0.7 Zb = 2 .5 8.5 − 20.0.3 = 2.05 20.0.3.0.7 = 1,22 Buscamos entonces en la tabla de la distribución normal las áreas de Z = 0,73 y Z = 1,22 y obtenemos la probabilidad de esa área, haciendo F(x2) – F(x1) entonces tenemos: 0,8888 – 0,7673 = 0,1215. Podemos concluir que como variable discreta, utilizando la distribución binomial, la probabilidad de X=8 es 0,1144 o el 11,44%. Si utilizamos la distribución normal, con la corrección por continuidad, para el cálculo del área entre 7,5 a 8,5, la probabilidad es de 0,1215 o del 12,15%. 153 Lidia Diblasi Ejercicios propuestos: I- Distribución Normal En todos los casos grafique e interprete los resultados 1-Suponiendo que el tiempo que tardan los asistentes a un Centro de Salud en ser atendidos sigue una distribución normal, con media de 15 minutos y desvío típico de 5 min. ¿cuál es la probabilidad de: a- que una persona sea atendida habiendo esperado entre 20 y 25 minutos b- que sea atendida habiendo esperado más de 10 minutos. c - cuánto tiempo esperó el 10 % de los que menos esperaron 2- Un trabajador social ha realizado un seguimiento sobre la edad de las personas internadas en hospitales públicos, encontrando que es una variable normalmente distribuida con una media de 48 años y una desviación de 4 años. Si se toma una persona al azar de esta población. ¿Cuál es la probabilidad de que tenga: a) Más de 45 años P ( X > 45 ) b) Entre 49 y 51 años P (49 < X < 51 ) c) 40 años o menos P ( X < 40) 3- El consumo mensual de alimentos perecederos por familia de cuatro miembros, es de 30 kg semanales, con un desvío típico de 5 kg. Se supone que éste consumo sigue una distribución normal. ¿Cuál es la probabilidad de que al seleccionar una familia al azar consuma: a) entre 25 y 35 kg mensuales? b) menos de 25 kg y más de 35 kg? c) más de 23 kg? 4-El peso de las personas por grupos de edad sigue una distribución Normal. Se toma una muestra de mujeres mayores de 55 años y se obtiene un peso promedio de 60 kg, con un desvío tipo de 6 kg. Si se selecciona al azar una mujer de éste grupo, cuál es la probabilidad de: 154 Lidia Diblasi a) que pese entre 50 y 60 kg, b) que pese más de 56 kg, c) Calcule cuánto pesa el 5% que más pesa.. 5- Explique qué es la distribución Normal, dibújela y diga cuáles son sus principales propiedades y diga qué significan. 6- El puntaje promedio de los parciales de los estudiantes de 3º año de una cátedra de Estadística Aplicada es de 7,8 puntos con un desvío de 1.5 puntos. Si los puntajes de distribuyen normalmente, calcule la probabilidad de escoger al azar: a) alumnos que tengan un promedio superior a 8 puntos b) entre 6 y 7 puntos. c) menos de 5,5 puntos d) diga qué puntaje obtuvo el 3 % de los que menos puntos sacó. e) ¿a cuántos desvíos de la media se encuentra el 85% de la distribución de los puntos ? . 7- La estatura de las personas, al igual que el peso, por grupos de edad sigue una distribución Normal. Se tomó una muestra de 120 jóvenes universitarios de ambos sexos y se obtuvo una estatura promedio de 170 cm con un desvío típico de 15cm, calcular: a) cuál es la probabilidad de encontrar jóvenes que tengan una estatura entre 175 y 180 cm? b) y entre 160 y 165 cm? c) cuántos jóvenes hay en cada uno de los segmentos anteriores? d) cuántos jóvenes se encuentran a dos desvíos de la media? 8- Dada una distribución Normal estandarizada, diga: a) a cuántas unidades de desvíos se encuentra el 60 % central de la distribución? b) a cuántas el 90 %? c) a cuántas el 95%? d) a cuántas el 99%? 155 Lidia Diblasi II- Resolver por Binomial y Normal Interprete y grafique los resultados 1-Se sabe que el 40% de las familias de una población no tiene cobertura médica. Se toma una muestra de 30 familias al azar en una comunidad muy heterogénea, cuál es la probabilidad de que entre 10 y 12 no tengan cobertura médica. Resuelva: a) Binomial b) Normal 2- Según un estudio realizado por una consultora la probabildad de encontrar gente que no tiene claro qué debe votar en las próximas elecciones es del 0,70. Calcular la probabilidad de que al seleccionar una muestra de 30 personas que estén en condiciones de votar, encontremos a 20 o más en estas condiciones. Resuelva, utilizando las tablas correspondientes, de ser posible, por: a) Binomial b) Normal 3- Se toma una muestra de mujeres jefas de hogar para analizar si trabajan fuera del hogar, en relación de dependencia. En la muestra el 58 % se encontraba en esas condiciones. Cuál es la probabilidad que al seleccionar al azar una muestra de 20 mujeres al menos 15 trabajen fuera del hogar en relación de dependencia. Resuelva, usando las tablas, de ser posible, por: a) Binomial b) Normal 4- Suponiendo que en un Centro de Salud son atendidos diariamente 15 niños de cada veinte personas atendidas ¿cuál es la probabilidad de que de una muestra de 30 personas sean atendidos exactamente 20 niños. Resuelva, de ser posible, por: a) Binomial b) Normal. 156 Lidia Diblasi Bibliografía consultada: Blanch, Nidia y Joekes, Silvia: “Estadística Aplicada a la Investigación” Nódulo 7 Curso de posgrado; Fac. de Ciencias económicas, Universidad Nacional de Córdoba, 1994 Canavos, George, C. “Probabilidad y Estadística. Aplicaciones y Métodos” McGraw Hill, México, 1990 Chao, Linconln, “Estadística para las Ciencias Administrativas”, Ed. Mc Graw Hill, 1978. DANIEL, Wayne, “Estadística con aplicaciones a las Ciencias Sociales y a la Educación”, Ed. Nc Graw Hill, 1981. GARCÏA FERRANDO, Manuel, “Introducción a la Estadística en Sociología”, Alianza Editorial, 1992. Hopkins, kenneth; Hopkins, B.R.; Glass, Gene: “Estadística básica para las Ciencias Sociales y del Comportamiento” Prentice-Hall Hispanoamérica, S.A., México, 1997 LEVIN, Jack, “Fundamentos de Estadística en la Investigación Social”, Ed. Harla, 1977. KREYSZIG, Erwin, “Introducción a la Estadística matemática”. Ed Limusa – Wiley, S:A:, México, 1973. SPIEGEL, Murray, “Teoría y Problemas de Estadística”, Serie de compendios Shawn, Ed. Mc Graw Hill. Spiegel, Murray, " Estadística", Serie de Compendios Shawn, Mc Graw Hill Interamericana de México S.A.,1994 157