Capítulo V Distribuciones Continuas personalizado

Anuncio
Lidia Diblasi
CATÍTULO V
DISTRIBUCIONES CONTINUAS: Distribución NORMAL
En nuestra vida utilizamos muchas veces la palabra normal para decir por
ejemplo que es “normal que los jóvenes ingresen a la universidad cuando tienen
entre 18 y 19 años” o que es “normal que en Mendoza tengamos en verano
temperaturas de alrededor de 30º” o que es “normal que una persona que mide
1,65 m tenga un peso de entre 55 y 60 kg”, etc por supuesto que no todo es tan
simétrico y tenemos alumnos en la universidad que ingresan con edades mucho
mayores a los 18 años, o que en verano la temperatura pueda llegar a 42 grados,
o que una persona de 1,65 m pese 48 kg, etc
Pero si es cierto que hay ciertas “medidas” que son normales por ser
siempre las más comunes respecto al grupo de estudio. En Estadística podemos
demostrar que la probabilidad de los casos extremos son bajas. Lo más común es
encontrar la mayor cantidad de casos concentrada alrededor de los valores
medios o las medidas de tendencia central.
En estos casos estamos en presencia de una distribución que llamamos
Normal. Es una curva teórica, suave, perfectamente simétrica que concentra la
mayoría de los datos en el centro y que es unimodal.
En el ejemplo siguiente podemos apreciar un modelo de distribución Normal
que representa la edad de los niños que asisten a un comedor comunitario.
7
6
5
4
3
2
Des v. típ. = 2.45
1
Media = 6.0
N = 36.00
0
.0
12
.0
11
0
3.
-1
0
2.
-1
0
1.
-1
0
0.
-1
.0
-9
.0
-8
.0
-7
.0
-6
.0
-5
.0
-4
.0
-3
.0
-2
.0
10
0
9.
0
8.
0
7.
0
6.
0
5.
0
4.
0
3.
0
2.
0
1.
Edad de niños aist entes a un comedor comunitario
131
Lidia Diblasi
Veamos cómo trabaja
Cuando estudiamos las variables discretas aprendimos a determinar la
probabilidad de que la variable aleatoria discreta “X” asuma un valor particular.
Cuando estudiamos una variable continua deseamos saber la probabilidad de que
“X” asuma valores dentro de un intervalo Xa y Xb, o la probabilidad de que “X” sea
mayor que Xb o menor que Xa.
Si recordamos el ejemplo de la edad de las mujeres al casarse, que vimos
en el capítulo III, podríamos averiguar la probabilidad del intervalo entre 25 y 29
años de edad, donde Xa = 25 y Xb = 29.
Hemos visto que las distribuciones de frecuencia y las distribuciones de
frecuencias relativas de variables continuas se construyen definiendo unos
intervalos de clase y determinando la frecuencia o frecuencia relativa con que las
observaciones quedan incluidas dentro de los intervalos de clase. Esto se puede
representar gráficamente por medio de histogramas o polígonos de frecuencia. El
área que queda comprendida bajo el histograma o el polígono de frecuencia entre
dos valores cualquiera por ejemplo: Xa y Xb de una variable aleatoria “X” es igual
a la frecuencia relativa de la ocurrencia de los valores de “X” entre Xa y Xb, en
nuestro ejemplo entre 25 y 29 años.
Sabemos que si los datos que disponemos son una muestra extraída de
una población, podemos interpretar estas frecuencias relativas como estimaciones
de las probabilidades verdaderas correspondientes. Podemos interpretar la
frecuencia relativa de que ocurran valores muestrales de “X” entre Xa y Xb
(inclusive), como una estimación de la P(Xa ≤ X ≤ Xb), es decir, de la probabilidad
de que “X” tome valores entre Xa (25) y Xb (29) (inclusive).
Intervalo
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
xi
17
22
27
32
37
42
47
52
fi
8
9
11
8
6
4
2
2
132
fr
0.16
0.18
0.22
0.16
0.12
0.08
0.04
0.04
Lidia Diblasi
Siguiendo el ejemplo podríamos decir, siguiendo las frecuencias relativas
que la probabilidad del intervalo entre 25 y 29 años es del 0,22 o del 22%.
Supongamos que tenemos una muestra de una variable aleatoria continua
“X”, hacemos el histograma correspondiente con frecuencias relativas. El área
sombreada se puede interpretar como la estimación de la probabilidad de que “X”
asuma valores entre Xa y Xb.
Si tenemos una muestra grande de valores de X y hacemos los intervalos
muy pequeños podemos obtener otro tipo de representación.
133
Lidia Diblasi
A medida que crece el número de observaciones y disminuyen las
amplitudes de los intervalos de clase, el histograma se asemeja cada vez más a
una curva suave. El área comprendida bajo la curva y por encima del eje
horizontal y entre las perpendiculares que se levantan sobre los dos puntos a y b,
es igual a la probabilidad de que la variable aleatoria asuma los valores
comprendidos entre los dos puntos.
Lo que se está haciendo es determinar la probabilidad comprendida en un
intervalo. La razón es que para una variable continua p(X = x) = 0. O sea que la
probabilidad de que “X” asuma un valor específico es igual a cero. Lo que quiero
decir es que no podemos calcular el valor de un punto, sino el de un área o
intervalo, por pequeño que sea. Podemos ver en una curva que represente una
distribución de probabilidades continuas que el área que queda encima de un
punto es igual a cero.
Para calcular el área entre dos puntos ej. a y b, en una distribución de
probabilidades continuas necesitamos usar el cálculo integral. En el proceso de
integración, el cálculo integral utiliza una técnica matemática que es el límite de
una sumación. Así cuando uno emplea el cálculo integral para hallar el área bajo
una
curva
suave,
en
realidad
está
agregando
áreas
de
rectángulos
infinitesimalmente pequeños (celdas).
Nosotros no vamos a usar el cálculo integral en ninguna distribución de
probabilidad continua, ya que las áreas bajo las curvas que tienen interés ya han
sido determinadas y tabuladas.
Distribución Normal:
Es una de las más importantes que se conocen. Su fórmula fue publicada
por primera vez por Abrahan Demoivre en 1733. Otros que figuran en su historia
son Pierre Simón, el Marqués de La Place (1749 – 1827) y Carl Gauss (1777 –
134
Lidia Diblasi
1855), en cuyo honor se denomina a veces distribución de Gauss o campana de
Gauss.
La fórmula es:
-1/2 ( x - µ ) 2
σ
1
f(x) =
e
σ
Donde:
2π
µ . media de la distribución
σ: la desviación típica de la distribución
π: la constante 3,14159...
e: la constante 2,71828...
Algunas características de la distribución normal:
1- es una distribución con forma de campana, perfectamente simétrica basada
en un número infinito de casos, por lo que sólo puede ser tratada de forma
aproximada, cuando trabajamos con datos reales.
2- al ser una distribución simétrica respecto de su media, el 50% del área está
a la derecha de la media y el 50 % a la izquierda.
3- la media (µ ó x ), la mediana (Me) y la moda (Mo) son iguales.
4- la distancia horizontal que hay desde el punto de inflexión de la curva (el
punto donde la curva deja de ser cóncava hacia abajo y empieza a ser
cóncava hacia arriba) hasta una perpendicular levantada sobre la media es
igual a la desviación típica.
135
Lidia Diblasi
5- el área comprendida bajo la curva y por encima del eje horizontal es igual a
1, como suma de frecuencias relativas o como distribución de probabilidad.
6- la distribución normal es realmente una “familia” de distribuciones puesto
que existe una distribución diferente para cada valor de µ y σ. El valor de
µ sitúa a la distribución en el eje horizontal. Y el valor de σ nos dice que
cuanto más grande sea la desviación típica, más plana y extendida es la
gráfica de la distribución.
Ejemplo: tres distribuciones normales con distinta µ e igual σ.
Pensemos por ejemplo que tenemos el promedio de edad de tres grupos de
estudiantes de distinto niveles educativos: el primer grupo representan las edades
de alumnos de 7º año de la escuela primaria y su media es de 11,96 años; el
segundo grupo representa a alumnos de 5º año del nivel medio, su media es de
18,5 años y por último el tercer grupo representa a alumnos universitarios que
136
Lidia Diblasi
llevan cinco años desde que comenzaron la carrera universitaria, su promedio de
edad es de 24,8 años. Todos los grupos son muy homogéneos en su
conformación y tienen una desviación típica aproximada de 1,5 años
Ejemplo: tres distribuciones normales con igual µ y distinta σ.
También podemos pensar en grupos que coinciden en la edad promedio
pero que son muy heterogéneos en su conformación y tienen desviaciones típicas
muy distintas que hacen que su representación adquiera diversa forma por su
variabilidad.
7- la curva de la distribución normal se extiende desde - ∞ a + ∞ sin cortar
nunca el eje de las x o el eje horizontal.
8- si levantamos perpendiculares a una distancia de una desviación típica de la
media en cada uno de los dos lados, el área comprendida entre estas dos
perpendiculares, la curva y el eje horizontal es igual aproximadamente a 0,6826 o
137
Lidia Diblasi
sea el 68,26 % del área total. De la misma forma podemos encerrar el 95 %,
levantando perpendiculares a dos desvíos de la media y para ambos lados.
Podemos encerrar aproximadamente el 99,7 % del área total, levantando
perpendiculares a una distancia de tres desviaciones estándar desde la media en
cada uno de los dos lados. Dicho de otro modo, si nos apartamos uno, dos o tres
desvío de la media hacia ambos lados vamos a obtener el 68, el 95 y el 99 % de
los casos de la distribución, aún en distribuciones levemente asimétricas.
La distribución normal estandarizada:
138
Lidia Diblasi
Dijimos que hay una distribución normal diferente para cada valor diferente
de media y desvío poblacional: µ y σ. De ahí que es muy importante una
distribución normal que se llama distribución normal estandarizada que tiene
media µ = 0 y σ = 1 (varianza), y todas sus áreas se encuentran tabuladas.
En esta tabla podemos encontrar cualquier valor entre 0 y zi, o sea
cualquier valor entre la media y un valor determinado de la variable aleatoria Z que
está normalmente distribuida con media 0 y varianza 1.(Ver tabla Distribución
Normal en Anexos Tablas)
Aplicaciones de la distribución normal:
Como ya dijimos, es muy poco probable que en la realidad encontremos
variables aleatorias que se distribuyen normalmente con exactitud, porque la
distribución normal es un ideal matemático. Pero sí muchas variables aleatorias
continuas pueden caracterizarse mediante una distribución normal.
Cuando en una investigación la variable de interés está normalmente
distribuida por lo menos de manera aproximada, utilizamos en su análisis el
conocimiento que tenemos de la distribución normal. Con la distribución normal
estandarizada, podemos responder preguntas de probabilidad en relación a una
variable aleatoria “X” que está normalmente distribuida por lo menos de manera
aproximada. Por ejemplo podríamos desear saber la probabilidad de que alguna
variable aleatoria “X” distribuida normalmente en forma aproximada, con media µ
y desviación típica σ asuma valores comprendidos entre Xa y Xb. Para obtener
dichas probabilidades transformamos la variable “X” con media µ y varianza σ en
la variable normal estándar “Z” con media 0 y varianza 1, por medio de la fórmula:
Xi -
Z=
µ
σ
139
Lidia Diblasi
Mediante esta fórmula cualquier valor xi de la variable aleatoria “X” se
transforma en un valor z de la variable normal estandarizada “Z”. Una vez que
hallamos hecho estas transformaciones podemos utilizar la tabla para hallar las
probabilidades de interés.
Los valores de la variable Z representan unidades de desvíos respecto a la
media.
Veamos un ejemplo:
Supongamos que queremos encontrar el área bajo la curva de la normal o
la probabilidad entre dos valores de una variable X: definida como “cantidad de
horas de estudios mensuales” xa y xb, donde:
Xa = 105 horas de estudio
Xb = 115 horas de estudio
La media de esta variable aleatoria “X” es µ = 100 y σ = 10, entonces, si pasamos
estos valores de X a Z mediante la fórmula tenemos:
140
Lidia Diblasi
Xa
Za =
Xb
Zb =
105 − 100
= 0,5
10
115 − 100
= 1,5
10
115 − 100 
 105 − 100
P (105 ≤ x ≤ 115) = P 
≤Z≤

10
 10

P ( 0,5 ≤ Z ≤ 1,5 )
141
Lidia Diblasi
Si buscamos en la tabla de la distribución Normal los valores de
probabilidad acumulada correspondiente al valor de Z = 0,5 y el de Z = 1,5,
obtenemos los siguientes resultados:
Z = 0,5
0,1915
F(x1) área entre 0 y 0,5
Z = 1,5
0,4332
F(x2) área entre 0 y 1,5
= F(x2) – F(x1)
= 0,4332 – 0,1915
P (105 ≤ x ≤ 115) = 0,2417
Podemos decir entonces que la probabilidad de encontrar alumnos universitarios
que estudien entre 105 y 115 es de 0,2417 o del 24 %. O más simple que el 24 %
de los estudiantes consultados estudian
105 y 115 horas mensuales, lo que
representa entre 3,5 y 3,8 horas diarias.
Cómo usamos la tabla de Probabilidades Normales.
Veamos algunos ejemplos
Vamos a trabajar con los resultados de una encuesta realizada a los
alumnos ingresantes a primer año de la facultad de Ciencias Políticas y Sociales
de la UNCuyo para determinar el perfil del ingresante. A la pregunta “cuántas
horas de estudio semanal considerás que deberías dedicarle al estudio en la
universidad independiente de las horas de clase” la respuesta generó una
distribución aproximadamente normal con media 22 horas y un desvío de 6,5 hs.
Caso 1
Queremos calcular la probabilidad de encontrar alumnos que estudien entre 15,5
hs y 28,5 hs.
28.5 − 22 
 15,5 − 22
P (15,5 ≤ x ≤ 28,5) = P 
≤Z ≤

6 .5 
 6 .5
142
Lidia Diblasi
P ( −1 ≤ Z ≤ 1)
El área de la variable X:”horas de estudio” entre 15,5 y 28,5 se corresponde con el
área de la variable Z entre -1 y 1. Lo que nos está indicando que el área que
estamos buscando se encuentra a un desvío en más y en menos de la media.
Vamos a buscar en la tabla de las probabilidades de la distribución Normal a qué
probabilidad corresponde el área entre -1 y 1.
En la tabla aparecen en la primera columna el entero y el primer decimal
de los valores de Z y en la primera fila el segundo decimal. Los valores que nos
proporciona la tabla son probabilidades acumuladas, desde el valor 0 hasta el
0,50, o la mitad de la distribución para valores positivos de Z.
Si observamos en tabla el valor 1,00 corresponde al valor 0,3413 y como la
distribución normal es perfectamente simétrica, el área entre 0 y 1 es igual al área
entre 0 y -1, por lo tanto esta área también vale 0,3413.
15,5
22
28,5
X
-1
0
1
Z
0,34,13 + 0,3413
Por lo tanto todo el área entre -1 y 1 es igual a la suma de ambas:
143
Lidia Diblasi
(-1 ≤ Z ≤ 1) = 0,3413 + 0,3413
= 0,6826
Por lo que podemos concluir que la probabilidad de encontrar alumnos de este
grupo que estudien entre 15,5 y 28,5 horas semanales es de 0,6826 o del 68,26%
O bien podríamos decir que el 68% estudian entre 2 y 4 horas diarias
aproximadamente.
Caso II
Siguiendo el mismo ejemplo queremos calcular la probabilidad de aquellos
alumnos que estudian más de 30 hs semanales.
30 − 22 

P (X ≥ 30) = P  Z ≥

6,5 

El área que encontramos en la tabla corresponde al valor de z de o a 1,23 =
0,3907 pero la probabilidad que nosotros buscamos es el de los valores mayores
o iguales a 1,23, por lo tanto como sabemos que la mitad de la distribución, de 0 a
infinito, es igual a 0,50 a éste valor debemos restarle 0,3907, para obtener la
probabilidad buscada:
22
30
X
0
1,23
Z
0,3907
0,50
144
Lidia Diblasi
P (Z ≥ 1,23) = 0,50 – 0,3907
= 0,1093
Por lo que podemos concluir que la probabilidad de encontrar alumnos que
estudien 30 o más horas semanales es de 0,1093 o del 10,93% o del 11%
aproximadamente.
Caso III
Siguiendo el mismo ejemplo supongamos que queremos calcular la probabilidad
de aquellos alumnos que estudian menos de 30 hs semanales.
30 − 22 

P (X ≤ 30) = P  Z ≤

6,5 

a- Como sabemos por el caso II que los alumnos que estudian 30 o más horas es
de 0,1093 y también sabemos por las propiedades de la distribución normal que
toda el área debajo de la curva vale 1, podemos calcular el área propuesta
haciendo:
1- F(x ≥ 30) = 1 – 0,1093
= 0,8907
Por lo que podemos concluir que la probabilidad de encontrar alumnos que
estudien hasta 30 horas semanales es del 89 %.
b- en el caso que no hubiéramos calculado la probabilidad de los que estudian
más de treinta horas, podemos calcular la probabilidad de la siguiente forma:
30 − 22 

P (X ≤ 30) = P  Z ≤

6,5 

Z = 1,23 → 0,3907
145
Lidia Diblasi
22
30
X
0
1,23
Z
Sabemos que el área entre 0 y 1,23 es igual a 0,3907. A ésta área debemos
agregarle o sumarle todos aquellos que estudian menos de Z = 0, el área de
- ∞ a 0 que sabemos que vale 0,50, ya que es la mitad de la distribución, por lo
que el área total que buscamos es igual a:
0,50 + 0,3907 = 0,8907
Por lo que llegamos a la misma conclusión: los alumnos que estudian menos de
30 hs semanales representan el 89% de la distribución.
Si la muestra de alumnos consultados fuera de n = 200, podríamos calcular
cuántos son los que estudian menos de 30 horas semanales:
200 * 0,89 = 178
De un total de 200 alumnos los que estudian hasta 30 horas semanales son 178.
Caso IV
Supongamos que ahora queremos averiguar cual es la probabilidad de seleccionar
alumnos que estudien entre 25 y 30 horas semanales:
146
Lidia Diblasi
30 − 22 
 25 − 22
P (25 ≤ x ≤ 30) = P 
≤Z≤

6 .5 
 6 .5
P ( 0,46 ≤ Z ≤ 1,23 )
↓
0,1772
↓
0,3907
↓
El área entre 0 y 0,46 = 0,1772
Y el área entre 0 y 1,23 = 0,3907
22
0
25
0,46
30
1,23
X
Z
0,1772
0,3907
Si sólo queremos saber la probabilidad o el área entre 0,46 y 1,23 y como la tabla
nos da las probabilidades acumuladas a partir de la media en Z = 0, el área entre
0 y 0,46 está contenida en el área entre 0 y 1,23, por lo que debemos hacer la
siguiente operación:
0,3907 – 0,1772 = 0,2135
Podemos concluir entonces que los alumnos que estudian entre 25 y 30 hs
semanales representan el 21,35 %
147
Lidia Diblasi
Caso V
Siguiendo el mismo ejemplo supongamos que queremos calcular la probabilidad
de aquellos alumnos que estudian más de 20 hs. semanales.
20 − 22 

P (X ≥ 20) = P  Z ≥

6,5 

Z ≥ -0,31 → 0,1217 la probabilidad del área entre 0 y -0,31 es de 0, 1217 a la cual
debemos sumarle la probabilidad de los que estudian entre la media e infinito:
0 a ∞ que igual a 0,50, por lo que el resultado sería:
20
22
X
-0,31
0
Z
0,1217
0,50
0,1217 + 0,50 = 0,6215
Podemos decir que los alumnos que estudian 20 o más horas semanales tienen
una probabilidad de ser seleccionados de 0,6215 o de algo más del 62%.
148
Lidia Diblasi
Caso VI
a- Supongamos que queremos saber ahora a cuántos desvíos de la media está el
80% de la distribución, o dicho de otra forma cuánto valen Z1 y Z2. Si distribuimos
el 80% a ambos lados de la media nos quedan dos áreas de 40% de los casos,
una de los menores que la media y otra de los mayores.
Ahora vamos a cambiar la forma de buscar en la tabla de la distribución normal.
En vez de buscar los valores de probabilidad, conocido un valor de Z, en la
primera columna y en la primera fila, como hemos hecho en los casos anteriores;
dado que lo que conocemos es el valor de la probabilidad y que lo que queremos
conocer es el valor de Z, buscamos en el interior de la tabla el valor que más se
aproxime a 0,40, una vez localizado, recorremos el camino inverso; observamos
en la primera columna y en la primera fila a qué valor de Z corresponde:
El área del 40% menor y mayor que la media corresponde al valor de Z = ± 1,28
-1,28
0
0,40
1,28
Z
0,40
Podríamos decir entonces que el área del 80% se encuentra a ± 1,28 desvíos de
la media
149
Lidia Diblasi
b- supongamos que queremos averiguar a cuántos desvíos de la media se
encuentra el área del 95%. Realizamos el mismo procedimiento, repartimos
equitativamente 0,95 en dos lo cual nos da 0,475; buscamos este valor en el
interior de la tabla:
-1,96
0
0,475
1,96
Z
0,475
El área del 95% se encuentra entre los valores de Z = ± 1,96, o bien a 1,96
desvíos de la media.
Caso VII
Otra forma de usar la tabla de la distribución normal es para resolver problemas
como el siguiente:
a- Cuántas horas por semana estudia el 5% de los que menos estudian?
Usando la misma fórmula que hemos utilizado para estandarizar la variable x a Z
podemos resolver este ejercicio. La incógnita ahora es un valor de la variable y no
una probabilidad:
Z=
xi − x
σ
150
Lidia Diblasi
Conocemos el valor de la media x = 22, el valor del desvío σ = 6,5 y podemos,
con lo que hemos visto en los casos anteriores, conocer el valor de Z para el área
0,05 o del 5%, entonces despejamos Xi que es nuestra incógnita y nos queda:
xi = Z * σ + x
xi = -1,65 * 6,5 + 22
xi = -10,725 + 22
xi = 11,275 hs
Podemos concluir que el 5% que menos estudia, estudia 11 horas semanales o
menos.
b- si nos hubieran preguntado por el 5% que más estudia, cuántas horas lo hace,
hacemos exactamente el mismo procedimiento, lo único que va a cambiar es el
signo correspondiente al valor de Z.
xi = Z * σ + x
xi = 1,65 * 6,5 + 22
xi = 10,725 + 22
xi = 32,725 hs.
Podemos decir que el 5% que más estudia, estudia 33 hs o más
Aproximación normal de la binomial
La distribución normal proporciona una buena aproximación de la
distribución binomial cuando “n” es grande y “p” no está demasiado cerca de 0 ó 1.
Para utilizar la aproximación normal hacemos µ = n.p ; σ = √ n.p.q
y
convertimos los valores de la variable original en valores z, para hallar las
probabilidades que nos interesan. Cuando el tamaño de la muestra que se va a
analizar no es uno de los valores de “n” que figuran en las tablas binomiales
disponibles, la aproximación normal a la binomial proporciona una alternativa
conveniente, mientras más cerca esté P (probabilidad de éxito), de 0,5..
Como la distribución normal es una distribución de probabilidades para
variables
continuas y la binomial es una distribución de probabilidades para
151
Lidia Diblasi
variables discretas, podemos obtener mejores resultados si hacemos un ajuste en
que se tenga en cuenta este hecho cuando utilicemos la aproximación. Este
ajuste, denominado corrección de continuidad, se puede comprender mejor
observando un histograma construido con datos binomiales y con una curva suave
superpuesta.
Ejemplo:
Vamos a calcular:
para n= 20 y p = 0,3
a- P(x = 8) usando probabilidades binomiales
b- P (7,5 ≤ X ≤ 8,5) usando aproximación normal
(b) P (7,5 ≤ X ≤ 8,5) usando probabilidades normales
152
Lidia Diblasi
Cuando utilizamos la aproximación normal de la binomial debemos tener en
cuenta el hecho de que para la binomial P(X=x) es el área del rectángulo centrada
en X.
Cuando convertimos valores de “x” en valores de “Z” la corrección de
continuidad consiste en sumar 0,5 a y/o restar 0,5 de x según sea conveniente.
Ejemplo:
P(Xa ≤ X ≤ Xb)
P ( 7,5 ≤ X ≤ 8,5)
Recordemos que en la binomial, la E(X) = x = n.p y la D(X) = σ =
n. p.q ,
entonces:
Z=
X − n. p
n. p.q
Za =
7.5 − 20.0.3
1 .5
=
= 0,73
2.05
20.0.3.0.7
Zb =
2 .5
8.5 − 20.0.3
=
2.05
20.0.3.0.7
= 1,22
Buscamos entonces en la tabla de la distribución normal las áreas de Z = 0,73 y Z
= 1,22 y obtenemos la probabilidad de esa área, haciendo F(x2) – F(x1) entonces
tenemos: 0,8888 – 0,7673 = 0,1215.
Podemos concluir que como variable discreta, utilizando la distribución
binomial, la probabilidad de X=8 es 0,1144 o el 11,44%. Si utilizamos la
distribución normal, con la corrección por continuidad, para el cálculo del área
entre 7,5 a 8,5, la probabilidad es de 0,1215 o del 12,15%.
153
Lidia Diblasi
Ejercicios propuestos:
I- Distribución Normal
En todos los casos grafique e interprete los resultados
1-Suponiendo que el tiempo que tardan los asistentes a un Centro de Salud en ser
atendidos sigue una distribución normal, con media de 15 minutos y desvío típico de 5
min. ¿cuál es la probabilidad de:
a- que una persona sea atendida habiendo esperado entre 20 y 25 minutos
b- que sea atendida habiendo esperado más de 10 minutos.
c - cuánto tiempo esperó el 10 % de los que menos esperaron
2- Un trabajador social ha realizado un seguimiento sobre la edad de las personas
internadas en hospitales públicos, encontrando que es una variable normalmente
distribuida con una media de 48 años y una desviación de 4 años. Si se toma una persona
al azar de esta población. ¿Cuál es la probabilidad de que tenga:
a) Más de 45 años
P ( X > 45 )
b) Entre 49 y 51 años
P (49 < X < 51 )
c) 40 años o menos
P ( X < 40)
3- El consumo mensual de alimentos perecederos por familia de cuatro miembros, es de
30 kg semanales, con un desvío típico de 5 kg. Se supone que éste consumo sigue una
distribución normal. ¿Cuál es la probabilidad de que al seleccionar una familia al azar
consuma:
a) entre 25 y 35 kg mensuales?
b) menos de 25 kg y más de 35 kg?
c) más de 23 kg?
4-El peso de las personas por grupos de edad sigue una distribución Normal. Se toma
una muestra de mujeres mayores de 55 años y se obtiene un peso promedio de 60 kg,
con un desvío tipo de 6 kg. Si se selecciona al azar una mujer de éste grupo, cuál es la
probabilidad de:
154
Lidia Diblasi
a) que pese entre 50 y 60 kg,
b) que pese más de 56 kg,
c) Calcule cuánto pesa el 5% que más pesa..
5- Explique qué es la distribución Normal, dibújela y diga cuáles son sus principales
propiedades y diga qué significan.
6- El puntaje promedio de los parciales de los estudiantes de 3º año de una cátedra de
Estadística Aplicada es de 7,8 puntos con un desvío de 1.5 puntos. Si los puntajes de
distribuyen normalmente, calcule la probabilidad de escoger al azar:
a) alumnos que tengan un promedio superior a 8 puntos
b) entre 6 y 7 puntos.
c) menos de 5,5 puntos
d) diga qué puntaje obtuvo el 3 % de los que menos puntos sacó.
e) ¿a cuántos desvíos de la media se encuentra el 85% de la distribución de los puntos ?
.
7- La estatura de las personas, al igual que el peso, por grupos de edad sigue una
distribución Normal. Se tomó una muestra de 120 jóvenes universitarios de ambos sexos
y se obtuvo una estatura promedio de 170 cm con un desvío típico de 15cm, calcular:
a) cuál es la probabilidad de encontrar jóvenes que tengan una estatura entre 175 y 180
cm?
b) y entre 160 y 165 cm?
c) cuántos jóvenes hay en cada uno de los segmentos anteriores?
d) cuántos jóvenes se encuentran a dos desvíos de la media?
8- Dada una distribución Normal estandarizada, diga:
a) a cuántas unidades de desvíos se encuentra el 60 % central de la distribución?
b) a cuántas el 90 %?
c) a cuántas el 95%?
d) a cuántas el 99%?
155
Lidia Diblasi
II- Resolver por Binomial y Normal
Interprete y grafique los resultados
1-Se sabe que el 40% de las familias de una población no tiene cobertura médica. Se
toma una muestra de 30 familias al azar en una comunidad muy heterogénea, cuál es la
probabilidad de que entre 10 y 12 no tengan cobertura médica. Resuelva:
a) Binomial
b) Normal
2- Según un estudio realizado por una consultora la probabildad de encontrar gente que
no tiene claro qué debe votar en las próximas elecciones es del 0,70. Calcular la
probabilidad de que al seleccionar una muestra de 30 personas que estén en condiciones
de votar, encontremos a 20 o más en estas condiciones. Resuelva, utilizando las tablas
correspondientes, de ser posible, por:
a) Binomial
b) Normal
3- Se toma una muestra de mujeres jefas de hogar para analizar si trabajan fuera del
hogar, en relación de dependencia. En la muestra el 58 % se encontraba en esas
condiciones. Cuál es la probabilidad que al seleccionar al azar una muestra de 20 mujeres
al menos 15 trabajen fuera del hogar en relación de dependencia. Resuelva, usando las
tablas, de ser posible, por:
a) Binomial
b) Normal
4- Suponiendo que en un Centro de Salud son atendidos diariamente 15 niños de cada
veinte personas atendidas
¿cuál es la probabilidad de que de una muestra de 30
personas sean atendidos exactamente 20 niños. Resuelva, de ser posible, por:
a) Binomial
b) Normal.
156
Lidia Diblasi
Bibliografía consultada:
Blanch, Nidia y Joekes, Silvia: “Estadística Aplicada a la Investigación” Nódulo 7
Curso de posgrado; Fac. de Ciencias económicas, Universidad Nacional de
Córdoba, 1994
Canavos, George, C. “Probabilidad y Estadística. Aplicaciones y Métodos”
McGraw Hill, México, 1990
Chao, Linconln, “Estadística para las Ciencias Administrativas”, Ed. Mc Graw Hill,
1978.
DANIEL, Wayne, “Estadística con aplicaciones a las Ciencias Sociales y a la
Educación”, Ed. Nc Graw Hill, 1981.
GARCÏA FERRANDO, Manuel, “Introducción a la Estadística en Sociología”,
Alianza Editorial, 1992.
Hopkins, kenneth; Hopkins, B.R.; Glass, Gene: “Estadística básica para las
Ciencias Sociales y del Comportamiento” Prentice-Hall Hispanoamérica, S.A.,
México, 1997
LEVIN, Jack, “Fundamentos de Estadística en la Investigación Social”, Ed. Harla,
1977.
KREYSZIG, Erwin, “Introducción a la Estadística matemática”. Ed Limusa – Wiley,
S:A:, México, 1973.
SPIEGEL, Murray, “Teoría y Problemas de Estadística”, Serie de compendios
Shawn, Ed. Mc Graw Hill.
Spiegel, Murray, " Estadística", Serie de Compendios Shawn, Mc Graw Hill
Interamericana de México S.A.,1994
157
Descargar