Tema III Distribuciones discretas y continuas

Anuncio
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Tema III
Distribuciones discretas y continuas
En este tema analizaremos dos importantes temas de la inferencia estadística: las distribuciones discretas y las
distribuciones continuas. Las distribuciones discretas son aquellas en las que la variable aleatoria puede pude tomar un
número determinado de valores. Por ejemplo, el número de trabajadores en cada uno de los departamentos de un centro
comercial o el número de automóviles ensamblados por día en la planta Ford de Hermosillo.
Las distribuciones continuas son aquellas que la variable aleatoria puede tomar un número infinito de posibles valores.
Por ejemplo, el peso promedio de las bolsas de 1 kg de café mexicano para exportación puede tomar una infinidad de
valores en un intervalo (0.995kg, 0.996kg., 09965kg., 0.998 kg., 0.9985 kg, …, 1.001 kg, 1.005 kg, 1.010 kg., etc.).
Como se mencionó en el tema II, una tabla, gráfico o expresión matemática que dé las probabilidades con que una
variable aleatoria toma diferentes valores, se llama distribución de la variable aleatoria. La inferencia estadística se
relaciona con las conclusiones que se pueden sacar acerca de una población de observaciones basándose en una muestra
de observaciones. Entonces intervienen las probabilidades en el proceso de la selección de la muestra; en este caso se
desea saber algo sobre una distribución con base en una muestra aleatoria de esa distribución. De tal manera vemos que
trabajamos con muestras aleatorias de una población que es más grande que la muestra obtenida; tal muestra aleatoria
aislada no es más que una de muchas muestras diferentes que se habrían podido obtener mediante el proceso de
selección. Este concepto es realmente importante en estadística.
3.1. Distribuciones discretas.
Muchas cuestiones de probabilidad, de gran importancia para los gerentes, comprenden resultados aleatorios numéricos.
Por ejemplo, el número de pasajeros que no hacen uso de una reservación en una línea aérea es de suma importancia al
fijar las políticas de la empresa en lo relativo a este aspecto. El número de pasajeros que no se presentan es aleatorio,
varía de un vuelo a otro, como de un día a otro en el mismo vuelo. El número de pasajeros que no toman el vuelo es una
variable numérica, y hablar del número promedio de pasajeros que no se presentaron tiene un sentido muy claro. El
concepto de variable aleatoria es la idea central para entender los resultados numéricos aleatorios.
Variables aleatorias discretas.
Para definir el concepto de variable aleatoria discreta, nos basaremos en el siguiente problema: Suponga que se lanzan
dos dados sobre una mesa y nuestro objetivo es obtener la probabilidad de que la suma de los puntos en los dados sea 11
o 7. Si suponemos que todos los resultados observados al tirar los dados son equiprobables (tienen la misma posibilidad
de salir) entonces el espacio de muestra del experimento, con 36 resultados posibles es
Universidad de Sonora
73
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
TABLA 3.1 ESPACIO DE MUESTRA DEL LANZAMIENTO DE DOS DADOS.
Dado
D
a
d
o
1
1
2
3
4
5
6
1
(1, 1)
(2, 1)
(3, 1)
(4, 1)
(5, 1)
(6, 1)
2
(1, 2)
(2, 2)
(3, 2)
(4, 2)
(5, 2)
(6, 2)
2
3
(1, 3)
(2, 3)
(3, 3)
(4, 3)
(5, 3)
(6, 3)
4
(1, 4)
(2, 4)
(3, 4)
(4, 4)
(5, 4)
(6, 4)
5
(1, 5)
(2,5)
(3, 5)
(4, 5)
(5,5)
(6, 5)
6
(1, 6)
(2, 6)
(3, 6)
(4, 6)
(5, 6)
(6, 6)
Como nuestro interés es la suma de los puntos observados, si obtenemos el resultado (4 ,3) le asignamos el valor 7, el
cual corresponde a la suma de 4 y 3. Podemos calcular la probabilidad de que la suma sea igual a 7 contando todos los
resultados donde la suma es 7 y dividiendo este valor entre el número de casos posibles (36). El evento de que la suma
es 7 contiene 6 resultados  (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)  por lo tanto, la probabilidad de obtener la suma de
6
7 es 36
 16 . Podemos repetir el proceso para cada uno de los resultados y obtener la tabla siguiente:
TABLA 3.2. DISTRIBUCIÓN DE PROBABILIDAD DE LA SUMA OBSERVADA EN EL LANZAMIENTO DE DOS DADOS.
Resultado
Probabilidad
2
3
4
5
6
7
8
9
10 11 12
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
Hemos encontrado la distribución de probabilidad de los valores posibles de la suma al lazar dos dados si D1 representa
el resultado observado en el dado 1 y D2 el resultado que se obtiene en el dado 2, podemos expresar el valor que nos
interesa así: X = D1 + D2. Antes de lanzar los dados, no se sabe qué valores se observarán para D1 y D2, por lo tanto
tampoco se sabe el valor para X.
El valor que X tomará puede variar de tirada en tirada sujeto a la distribución especificada en la tabla 3.2. Así X es una
variable, que asume un número finito de valores sujeto a una distribución de probabilidad. Este es un ejemplo de una
variable aleatoria discreta. Otros ejemplos son las variables D1 y D2. En general, si S es un espacio de muestra con una
medida de probabilidad P, se define una variable aleatoria como una función que asigna un número real a cada uno de
los elementos de S. Es decir, X es una función cuyo dominio es el espacio de muestra S y su rango es el conjunto de los
números reales , en la notación usual X : S   .
Así, por ejemplo X = 7 se interpretará como el evento de que se observó el resultado 7 al tirar los dos dados, esto es el
evento  (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)  ocurrió. Por lo tanto, vemos que P(X = 7) = P( (1, 6), (2, 5), (3,
6
 16 . Nótese que no obstante de que X es una función, usualmente no se escribe el
4), (4, 3), (5, 2), (6, 1) ) = 36
argumento de la función, es decir, si s es un elemento del espacio de muestra S, en lugar de escribir X(s), sólo
escribimos X. Es común denotar las variables aleatorias por letras mayúsculas y los valores que puede tomar por letras
minúsculas.
En este caso, la variable X puede asumir un valor de entre un conjunto finito de valores posibles. Cualquier variable que
pueda tomar un número finito de valores decimos que es una variable aleatoria discreta. También son variables
aleatorias discretas aquellas que pueden asumir un número muy grande o infinito de valores que potencialmente podrían
ser contados, tal como el número de latas de atún producidas por la empresa Guaymex, el número de clientes que han
comprado en las tiendas Mazon desde su apertura, el número de estrellas en el firmamento, el número de hojas en los
árboles, el número de granos de arena en Bahía de Kino etc.
Universidad de Sonora
74
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Ejercicio 3.1. Dé 6 ejemplos de variables aleatorias discretas. Indique cuáles pueden tomar un número finito de valores
distintos y cuáles un número infinito de valores.
Ejercicio 3.2. Dé 3 ejemplos de variables aleatorias que no sean discretas.
En la tabla 3.2 observamos que a cada valor posible de X, le asignamos un número correspondiente a su probabilidad.
De esta forma podemos definir otra función: f ( x )  P( X  x ), para cada número x en el campo de valores de la
variable X. Esta función se llama función de probabilidad o distribución de probabilidad de la variable X. Para el
ejemplo que estamos tratando de la suma en el lanzamiento de dos dados, los valores de esta función están dados en la
tabla 3.3, la cual podemos rescribir utilizando los conceptos estudiados.
TABLA 3.3. DISTRIBUCIÓN DE PROBABILIDAD DE LA SUMA OBSERVADA EN EL LANZAMIENTO DE DOS DADOS.
x
f ( x)
2
3
4
5
6
7
8
9
10 11 12
1
36
2
36
3
36
4
36
5
36
6
36
5
36
4
36
3
36
2
36
1
36
Ejercicio 3.3. Examine la tabla 3.3 y usa la definición de f ( x ) para deducir algunas propiedades de esta función.
Podemos observar que f ( x ) nunca adquiere un valor menor que cero. Esto se debe a que f ( x ) representa una
probabilidad, la cual nunca puede ser negativa. De igual manera f ( x ) nunca puede ser mayor que 1. Si sumamos
todos los valores que puede tomar f ( x ) obtenemos 1, debido a que estamos sumando las probabilidades de que la
variable aleatoria tome uno de los valores establecidos. Por definición, la función de probabilidad tiene las siguientes
características:
1.
f ( x )  0 para todo valor x en el dominio.
2.
 f ( x )  1 donde la sumatoria se extiende sobre todos los valores x en el dominio de f.
x
Ejercicio 3.4. Verifica que la función f ( x ) 
x
es una función de probabilidad para x = 1, 2, 3, 4, 5. Indique su
15
dominio y su campo de valores.
Ejercicio 3.5. Considera el lanzamiento de 4 monedas al aire. Defina la variable aleatoria Y como el número de sellos
observados. Construya la función de probabilidad de Y.
Ejercicio 3.6. Considera el lanzamiento de dos dados al aire. Defina la variable aleatoria X como la diferencia de los
puntos observados en los dados. Construya la función de probabilidad de X.
Los valores de la función de probabilidad, para el caso “sumar los resultados al lanzar dos dados”, se pueden representar
en una gráfica como lo muestra la Figura3.1.
Universidad de Sonora
75
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
0.18
0.16
P( X = x)
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
2
3 4
5
6
7
8 9 10 11 12
Valor observado de la variable x
Figura 3.1. Histograma de probabilidad de x.
La probabilidad de observar un valor particular de la variable aleatoria, por ejemplo X = 4 está dado por la altura de la
3
barra sobre el 4, es decir P( X  4 )  36
 121  0.083 . De manera similar, en lugar de asociar la altura de la barra
con la probabilidad, podemos ver que el área de la barra sobre el 4 es
barra es de
3
36
3
36
1 
3
36
 121  0.083 , ya que la altura de la
 121  0.083 y su ancho es 1. Utilizar el área de las barras para representar la probabilidad es muy útil
para extender la noción de probabilidad a otras variables.
Ejercicio 3.7. Encuentre las siguientes probabilidades: P( X = 11 ), P( X < 5 ), P( X  6 ), P( X  4.5) y P(X = 7.3)
para el ejemplo anterior.
Podemos usar el histograma de probabilidad para calcular probabilidades tal como P( X  5 ). Vemos que P(X  5 ).=
P(X = 2 ó X = 3 ó X = 4 ó X =5) = P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5), ya que los eventos donde X = 2, X = 3, X =
1
4 y X = 5 son disjuntos o ajenos, se tiene que P(X  5 ).= 36
 362  363  364  10
36 , que se obtiene sumando las áreas de
las barras que están sobre el 5 y a su izquierda. Se debe ser muy cuidadoso con las desigualdades ya que P(X  5 ).=
10
5
6
1
36  18 , mientras que P( X < 5 ) = 36  6 .
Si extendemos la idea de probabilidades acumulativas, podemos definir otra función partiendo de la distribución de
probabilidad. Si X es una variable aleatoria discreta, definimos la función de distribución de X o función acumulativa
de X de la manera siguiente:
F(x) = P(X  x ) =
 f ( t ) para    x 
tx
Ejercicio 3.8. Calcule la función de distribución acumulativa de la suma de los puntos de dos dados.
Ejercicio 3.9. Use las propiedades de la función de probabilidad para encontrar algunas propiedades de la función de
distribución acumulativa.
La tabla 3.4 presenta la función de distribución acumulativa del resultado observado al tirar dos dados.
Universidad de Sonora
76
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
TABLA 3.4. FUNCIÓN DE DISTRIBUCIÓN ACUMULATIVA DEL TOTAL OBSERVADO AL TIRAR DOS DADOS.
x
F( x )
2
3
4
5
6
7
8
9
10 11 12
1
36
3
36
6
36
10
36
15
36
21
36
26
36
30
36
33
36
De esa tabla podemos deducir algunas propiedades. Por ejemplo, observamos que
que se evalúa la función es mayor, el valor de la función también será mayor.
35
36
36
36
F(4)  F(5), es decir si el valor en
Ejercicio 3.10. ¿Esta propiedad es siempre cierta? Examine que sucede con x = 5, x = 6 y con x  5.7 .
A pesar de que el valor de la función de la distribución acumulativa para x = 5.7 no está incluida entre los valores en la
tabla, podemos utilizar la definición para obtenerlo F(x) = P(X  x ), así F(5.7) = P(X  5.7 ). Cuando escribimos esta
última probabilidad nos preguntamos ¿cuál es la probabilidad de observar que el total de puntos de dos dados es menor
o igual que 5.7? Por la naturaleza del experimento, vemos que no es posible observar valores distintos a 2, 3, 4, 5, 6, 7,
8, 9, 10, 11, 12, por esta razón los resultados que pueden observarse y que son menores o iguales a 5.7 son 2, 3, 4, 5,
5
se tiene que, F(5.7) = P(X  5.7) = F(5) = 10
.
36  18
Esto demuestra que la propiedad que habíamos visto antes, en la que establecimos que si a y b son dos números reales
con a  b entonces F(a)  F(b) no siempre es cierta. La que si es cierta es que si tenemos dos números reales a y b, tal
que a  b entonces F(a)  F(b). Por la definición de probabilidad y por esta propiedad, vemos que el valor más grande
que puede tener F(x) es 1 y el valor más pequeño de esta función es 0. Hagamos un resumen de las propiedades
encontradas.
1.
2.
3.
4.
F(-) = 0
F() = 1
Si a y b son números reales a  b, entonces F(a)  F(b). Esto significa, en el lenguaje matemático, que F es una
función no decreciente.
F(x) es una función continua por la derecha: si a es un número real, entonces lim F ( x )  F ( a ) .
x a
Figura 3.2. Gráfica de la función de distribución acumulativa del total de puntos al tirar dos dados.
Universidad de Sonora
77
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
La gráfica de F(x) parece una escalera tal y como se muestra en la Figura3.2. Podemos observar la razón por la cual esta
gráfica debe ser de esta manera si examinamos los valores de la función de distribución en un intervalo tal como [6, 7].
Vemos que F(6) = 15
si escogemos un número x mayor que 6, pero menor que 7, tenemos que F(x) = 15
. Sin embargo,
36
36
al evaluar la función en x = 7 vemos que F(7) =
21
36
 127 , por esta razón la gráfica muestra un salto en ese punto.
También podemos notar que el tamaño del salto en x = 6 nos dice la probabilidad de X = 7. Para valores de x entre 6 y 7
21
(sin incluir el 7) tenemos que F(x) = 15
, como habíamos visto y luego F(7) = 36
, así el tamaño del salto en X = 6 es
36
21
36
 15
36 
 16 . Este último valor es la probabilidad de que el total de puntos en dos dados, X sea igual a 7, es decir,
P(X = 7) =
6
36
1
.
6
Visto de otra manera, P(X = 7) = P(X  7)  P(X  7). Esto es igual a P(X  7)  P(X  6) =
21
36
 15
36 
6
36
 16 . En
general, el tamaño del salto de la función de distribución en un valor particular, nos da la probabilidad de que la variable
aleatoria sea igual a ese valor.
Ejercicio 3.11. Utilice la función de distribución para encontrar P(X = 9.8)
Valor esperado de variables aleatorias discretas.
Sea X
f ( x ), entonces el valor esperado de X es
una variable aleatoria con función de probabilidad
E( X )   x  f ( x ). Ilustremos esta fórmula mediante dos ejemplos.
x
Ejemplo 3.12. Si X es el número de puntos obtenidos al lanzar un dado de seis caras, obtenemos el valor esperado de
la variable aleatoria
Y  X2.
La función de probabilidad de X es
Y  X 2 es entonces f ( y ) 
1
6
si
f ( x) 
1
6
si
x  1, 2, 3, 4, 5, 6. La función de probabilidad de
y  1, 4, 9, 16, 25, 36, así
E( Y )  Px  1  4 Px  2  9 Px  3  16 Px  4  25Px  5  36 Px  6.
E( Y )  1  1  1  4  1  9  1  16  1  25  1  36
6
6
6
6
6
6
2
2
 1  P( X  1)  2  P( X  2 )  3  P( X  3 ) 
2
2
2
 4  P( X  4 )  5  P( X  5 )  6  P( X  6 ) 

x
2
 P( X  x ).
x
Ejemplo 3.11.2
Si
X
es
una variable aleatoria que tiene función de probabilidad
x   2, - 1, 0, 1, 2, 3  y Y  X 2 . La función de probabilidad de Y es f ( y ) 
2
6
si y  1, 4 y
f ( x) 
f ( y) 
y  0, 9. Entonces E( Y )  2  1  2  4  1  0  1  9. Esta ecuación la podemos rescribir como:
6
6
6
6
Universidad de Sonora
78
1
6
Departamento de Matemáticas
si
1
6
si
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
E( Y )  2  1  2  4  1  0  1  9.
6
6
6
6
 1  P( Y  1)  4  P( Y  4 )  0  P( Y  0 )  9  P( Y  1)
2
2
2
2
 1  P( X  1 ó X  1)  2  P( X  2 ó X  2 )  0  P( X  0 )  3  P( X  3 ).
2
2
2
 1  P( X  1 )  ( 1)  P( X  1 )  2 P( X  2 )  (-2 )
2
P( X  2 ) 
2
2
+ 0  P( X  0 )  3  P( X  3 ).

x
2
 P( X  x ).
x
A través de estos ejemplos, e visualiza que no es necesario calcular la función de probabilidad de Y , sólo se tiene que
usar la función de probabilidad de X y los valores obtenidos al aplicar la función Y  g( X )  X . Esto es cierto
aún en el caso en que la función no es uno a uno. Esto conduce al teorema siguiente cuya prueba se omite.
2
Nota. Todas las demostraciones de los teoremas se omitirán, por no estar dentro de los intereses de este texto.
Teorema 3.1. Si X es una v. a. discreta y f ( x ) es su función de linealidad, Y  g( X ) es una función a
valores reales, es decir, Y
es
E( Y )  E( g ( x ))   g ( x )  f ( x ).
una
variable
aleatoria,
entonces
su
valor
esperado
es
x
En particular se puede utilizar este teorema en el caso especial en que la función g ( X ) es lineal, es decir
Y  g( X )  aX  b, donde a, b  . Así se obtiene
E( Y )  E( aX  b )   ( ax  b ) P( X  x )   ax  P( X  x )   b  P( X  x ) 
x
x
x
 a  xP( X  x )   b P( X  x )  aE( X )  b.
x
x
Este resultado nos lleva al siguiente teorema.
Teorema 3.2. Si a y b son constantes reales y g( X )  aX  b es una función a valores reales, entonces
E( aX  b )  aE( X )  b.
Corolario 3.1. Si a es una constante real, entonces E( aX )  aE( X ).
Corolario 3.2. Si b es una constante real, entonces E( b )  b.
Teorema 3.3. Si
c1 , c2 , , cn son constantes reales, y g1 ( X ), g 2 ( X ), , g n ( X ), son funciones
reales de X, entonces
n
 n

E  ci g i ( X )   ci E( g i ( X ))
 i 1
  i 1

Universidad de Sonora
79
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Existen casos especiales de la función g ( X ) las cuales requieren más atención. En nuestro caso, nos interesa el
g( X )  X r para r = 0, 1, 2, 3,... . La expresión E( X r ) se conoce como el
r
r
errésimo momento de X alrededor del origen de la variable aleatoria X. Se tiene que E( X )   x f ( x ).
comportamiento de E( g( X )) cuando
x
El primer momento E( X ) se conoce como la media (poblacional) de la variable aleatoria X y se indica usualmente por
la letra griega  (se lee mu ),   E( X ). Otros momentos nos permiten describir la forma de la distribución de X. El
errésimo momento de X alrededor de la media es


E ( X   ) r   ( x   ) r f ( x ), para r = 0, 1, 2, ...
x
El segundo momento alrededor de la media es de gran interés en estadística y se conoce como la varianza (poblacional)
de la variable X. La varianza se denota a menudo mediante la letra griega  (sigma minúscula) elevada al cuadrado:
 2  EX  E( X )) 2   E( X   ) 2 .
Su raíz cuadrada positiva,

, se conoce como la desviación estándar
(poblacional) de X.
Frecuentemente es más fácil calcular la varianza a partir del primer y segundo momento alrededor del origen.
Teorema 3.4. Var ( X )  
2
 
 E( X 2 )  E( X )  E X 2   2 .
2
Teorema 3.5. Si X es una variable aleatoria con varianza
 2 , entonces
Var ( aX  b )  a 2 Var ( X )  a 2 2 .
La varianza es un valor muy útil para estudiar la distribución de una variable aleatoria. En particular, nos ofrece
información sobre la probabilidad de observar valores extremos de X. Esta relación se establece en el siguiente teorema.
Teorema 3.6. (Teorema de Chebyshev). Si X es una variable aleatoria con varianza
entonces para cualquier constante positiva k, se tiene que
P X    k   1 
2
y media
,
1
.
k2
3.1.1. Distribuciones discretas más comunes.
En el estudio de las variables aleatorias, por lo general nos interesan las probabilidades de que puedan tomar diversos
valores posibles, es decir, sus distribuciones de probabilidad, en esta sección se mencionan las más importantes.
Universidad de Sonora
80
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Distribución uniforme discreta.
La variable aleatoria X tiene una distribución uniforme discreta si su función de probabilidad está dada por
1
f ( x k )  f x   para x  x1 , x 2 ,  , x k , ( xi  x j , si i  j ). Donde,
k
k
  E ( X )   xi 
i 1
1
y 
2
k
k
  ( xi   ) 
i 1
2
1
k
Las aplicaciones de las variables aleatorias distribuidas uniformemente se encuentran en el desarrollo de las loterías y
otras formas de juegos de azar; en la generación de números aleatorios para experimentos de ingeniería o de simulación
y en la evaluación de “probabilidades previas” de una persona en relación con el resultado de algún evento futuro para
la toma de decisiones.
Ejemplo 3.10. La probabilidad de que en el lanzamiento de un dado legal aparezca un 5 es
1
6
y , es la misma que la
probabilidad de obtener un 3, o un 7, o un 2, etc.
Ejercicio 3.12. El número de productos empaquetados por un trabajador en una hora oscilan entre 10 a 18 unidades y se
piensa que están distribuidos uniformemente. ¿Cuál es la probabilidad de que se empaqueten entre 12 y 15 productos en
una hora determinada?
Distribución Bernoulli
A esta distribución también se le conoce como binomial punto. Si una variable aleatoria discreta X sólo tiene dos
valores posibles, como sucede por ejemplo en experimentos en los que sólo existen dos resultados posibles, fracaso o
éxito, se le asigna 0 a fracaso y 1 a éxito; si le llamamos p a la probabilidad de éxito, la probabilidad de fracaso es 1- p,
que generalmente se le llama q, por lo que la densidad de X es:
f ( x)  q,
x0
 p, x  1
= 0 de otro modo.
Esta función se puede resumir de la manera siguiente:
f ( x)  p x (1 - p)1 - x para
x  0, 1
Cualquier variable aleatoria discreta X, cuya densidad se ajuste a esta patrón, se dirá que se distribuye Bernoulli, con
parámetro p, denotándose esto por:
X ~ Ber(p)
Universidad de Sonora
81
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Ejemplo 3.11.. La probabilidad de que un presunto cliente elegido aleatoriamente realice una compra es 0.20. Por lo
tanto, la probabilidad de que el cliente elegido no realice la compra será de 1 – 0.20 = 0.80.
Distribución Binomial.
La distribución binomial es una distribución de probabilidad discreta, aplicable cada vez que suponga que un proceso de
muestreo conforma un proceso de Bernoulli. Un proceso de Bernoulli es un proceso de muestreo en el cual:
i)
ii)
iii)
Hay dos resultados posibles mutuamente excluyentes en cada ensayo u observación. Estos resultados
obtenidos se denominan éxito y fracaso.
La serie de ensayos u observaciones constituyen evento independientes.
La probabilidad de éxito, designada por p, permanece constante de ensayo a ensayo. Es decir, el proceso es
estacionario
En una distribución Binomial, se realizan n repeticiones independientes de un experimento de Bernoulli. La variable X
representa el número de éxitos obtenidos en las n repeticiones. Nos preguntamos sobre la probabilidad de obtener x
éxitos en las n repeticiones, así, la función de probabilidad es:
x
nx
P( X  x )  f ( x k )  C nx p ( 1  p )
, x  1, 2,  , n.
  np y   np( 1  p ).
2
Ejemplo 3.12. Suponga que un lote de 300 fusibles eléctricos contiene 5% defectuosos. Determine la probabilidad de
que se pueda encontrar al menos un fusible defectuoso en una muestra de cinco fusibles.
Solución. Es pertinente suponer que X, número de fusibles defectuosos observados, tenga aproximadamente una
distribución binomial debido a que el lote es grande. Así
 5
P(al menos uno defectuoso) = 1  p(0)  1    q 5
 0
 1  0.955  1  0.774  0.226
obsérvese que existe una probabilidad bastante grande de obtener al menos uno defectuoso, aunque la muestra sea
relativamente pequeña.
Ejercicio 3.13. Muchos jefes se dan cuenta de que algunas personas que contrataron no son lo que pretenden ser.
Detectar personas que solicitan un trabajo y que falsifican la información en su solicitud ha generado un nuevo negocio:
agencias investigadoras de antecedentes. Una revista nacional, notificó sobre este problema mencionando que una
agencia, en un periodo de dos meses, encontró que el 35% de los antecedentes examinados habían sido alterados.
Supóngase que usted ha contratado la semana pasada a cinco nuevos empleados y que la probabilidad de que un
empleado haya falsificado la información en su solicitud de trabajo es 0.35. ¿Cuál es la probabilidad de que al menos
una de las cinco solicitudes haya sido falsificada?
Universidad de Sonora
82
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Distribución Geométrica.
Se efectúan tantas repeticiones independientes de un experimento de Bernoulli como sean necesarias para obtener el
primer éxito. Si la probabilidad de éxito es p, la de fracaso es 1 - p, entonces la función de probabilidad de X, el número
de repeticiones hasta observar el primer éxito es:
P( X  x )  f ( x p )  p( 1  p ) x1 ,
Su valor esperado es E ( X ) 
x  1, 2, 3, 
1
1 p
y su varianza es igual a  2  V (Y )  2 .
p
p
Una variable aleatoria geométrica no tiene memoria, es decir:
P( X  n  m X  n )  P( X  m ) :
Utilizando la definición de probabilidad condicional obtenemos:
P( X  n  m X  n )  P( X  n  m, X  n / P( X  n )  P( X  n  m / P  n ).
Ahora obtenemos el denominador:
n
P( X  n )  1  P( X  n )  1   p( 1  p ) x 1 
x 1
n 1
 1  (1  p ) n 
 1  p  ( 1  p ) x 1  p 1 

x 0
p


 (1  p ) n
Así tenemos que
P( X  n  m, X  n / P( X  n ) 
P( X  n  m ) p( 1  p ) n m1


P( X  n )
(1  p ) n
 p( 1  p ) m1  P( X  m ).
Ejemplo 3.13. Suponga que la probabilidad de que un motor falle durante cualquier periodo de una hora es p  0.02 .
a) Encuentre la probabilidad de que dicho motor funcione bien durante 2 horas.
b) Halle la media y la desviación estándar de Y.
Solución. a) Sea X el número de intervalos de una hora hasta la primera falla, entonces
Universidad de Sonora
83
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
P(de funcionar bien por dos horas) = P X  3 

 px 
y 3

Como
 px  1,
y 1

P(de funcionar bien por dos horas) = 1 
 px 
y 3
= 1  p  qp  1  0.02  0.980.02  0.9604
b) Se tiene que la media = E ( X ) 
1
1 p
y su varianza es igual a  2  V ( X )  2 . Así que
p
p
1
 50 , esto significa que se tendrá que esperar muchas horas hasta que ocurra la primera falla. Por oto
0.02
1  0.02
lado,  2  V ( X ) 
 2,450 , entonces la desviación estándar de Y es   2,450  49.497 .
0.022
E( X ) 
Ejercicio 3.14. Se supone que el 30% de los aspirantes para cierto trabajo industrial tiene un entrenamiento avanzado de
programación computacional. Los aspirantes son entrevistados, uno tras otro, y son seleccionados al azar del conjunto de
aspirantes.
a)
b)
Determine la probabilidad de que se encuentre el primer aspirante con un entrenamiento avanzado en
programación en la quinta entrevista.
¿Cuál es el número esperado de aspirantes que hay que entrevistar para encontrar el primer aspirante
con un entrenamiento avanzado en programación?
Distribución Binomial Negativa.
En esta distribución se hacen tantas repeticiones independientes de un experimento de Bernoulli como sean necesarias
para obtener k éxitos. Si la probabilidad de éxito es p, la de fracaso es 1 - p y la función de probabilidad de Y, el número
de repeticiones necesarias hasta observar k éxitos es:
P( X  x)  f ( x p, k ) 
La media de X es   E ( X ) 
Universidad de Sonora
C
x 1
k 1
p k (1  p) x k ,
x  k , k  1, k  2, 
k
k 1  p 
y la varianza es  2  V (Y ) 
.
p
p2
84
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Ejemplo 3.14. Un estudio geológico indica que un pozo exploratorio, perforado en una región particular, debería manar
petróleo con una probabilidad de 0.20.
a)
b)
Encuentre la probabilidad de que el tercer encuentro de petróleo ocurra en el quinto pozo que se
perfora.
Halle la media y la desviación estándar.
Solución. a) Sea Y el número de la prueba en la cual ocurre el tercer descubrimiento de petróleo, suponiendo
perforaciones independientes con una probabilidad de 0.2 de encontrar petróleo en cualquier paso. Entonces es
razonable suponer que Y tiene una distribución binomial negativa con p  0.2 . Así
 4
PY  5  p5   0.23 0.82  0.0307
 2
k
k
3
k 1  p 
 15
y la varianza es  2  V (Y ) 
, se tiene que   
2
p 0.2
p
p
. Esto indica que se espera perforar 15 pozos antes de que emane petróleo de alguno de ellos y
31  0.2
2 
 12 por lo que   12  3.464 .
0.2
b) Como la media de Y es   E (Y ) 
Ejercicio 3.15. Se aplican análisis a los obreros de una empresa que fabrica material aislante, a fin de detectar la
existencia de asbesto en sus pulmones. La fábrica tiene que mandar tres obreros, con indicaciones positivas de asbesto, a
un centro médico para realizar más pruebas. Si el 40% de los trabajadores tienen indicaciones positivas de asbesto en los
pulmones,
Encuentre la probabilidad de que se tengan que examinar a diez operarios para encontrar “tres”
positivos.
b) Si cada prueba cuesta 200 pesos, obtenga el valor esperado y la varianza del costo total de la
realización de las pruebas necesarias para localizar tres empleados “positivos”.
a)
Distribución hipergeométrica.
En esta distribución se tiene una población finita de N elementos de los cuales k son de un tipo (digamos éxitos) y N - k
son fracasos. Seleccionamos n elementos sin reemplazo de la población de N. Nos interesa la probabilidad de obtener x
éxitos entre los n elementos seleccionados. La función de probabilidad de Y, el número de éxitos obtenidos entre los n
elementos seleccionados está dada por:
P( X  x)  f x
k
N k
x
n x
C C
n, N , k ) 
C
N
, para x  0, 1, 2,  , n; x  k , n  x  N  k.
n
La media de X, o valor esperado es: E ( X ) 
Universidad de Sonora
nk
y la varianza de X es
N
85
2 
nk ( N  k )( N  n )
.
N 2 ( N  1)
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Ejemplo 3.15. Un problema importante que enfrentan los jefes de personal y otras personas encargadas de la selección
de los mejores de un conjunto finito de elementos se describe mediante la situación siguiente. Se seleccionan 10
personas para un trabajo de un grupo de 20 ingenieros con doctorado.
a)
¿Cuál es la probabilidad de que el grupo de los 10 ingenieros seleccionados incluya a los cinco
mejores del grupo de 20?
b) Encuentre la media y la varianza para el grupo de los 20 ingenieros.
Solución. a) Para este ejemplo N  20, n  10 y k  5 , es decir, hay solamente cinco en el conjunto de los 5 mejores
ingenieros y nosotros buscamos la probabilidad de que X  5 , siendo X el número de los mejores entre los 10
seleccionados. Entonces
 5  15 
   
 5   5   15   10 10   21 
P5 


  0.162
5 10   20   1,292 
 20 

 
 10 
b) Dado que la media de Y es E ( X ) 
E (Y ) 
105  2.5
20
nk ( N  k )( N  n)
nk
y la varianza  2 
, entonces
N
N 2 ( N  1)
esto significa que en el grupo seleccionado de 10 ingenieros, se espera que 2 o 3 de ellos sean de
los mejores. Como  2 
105(20  5)( 20  10)  7,500  0.9868,
20 2 (20  1)
7,600
entonces   0.9868  0.9934
Ejercicio 3.16. Un producto industrial particular se embarca en lotes de 50. La prueba para determinar si el artículo es
defectuoso es costosa y por lo tanto el productor selecciona una muestra de su producción en lugar de usar un plan de
inspección al 100%. Un proyecto de muestreo elaborado para minimizar el número de artículos defectuosos surtidos a
los consumidores exige un muestreo de 10 artículos de cada lote y el rechazo del lote si se encuentra más de dos
artículos defectuosos. (En el caso de ser rechazados el lote, se prueba cada artículo de éste). Si un lote contiene 6
artículos defectuosos, ¿Cuál es la probabilidad de que sea rechazado? ¿Cuál es el número esperado de defectuosos en la
muestra de tamaño 10? ¿Cuál es la varianza del número de defectuosos en la muestra de tamaño 10?
Distribución de Poisson.
En esta distribución se observan eventos a través del tiempo o espacio con las siguientes propiedades; la probabilidad de
observar un evento en una unidad de tiempo o espacio t es t para algún   0 . La probabilidad de observar dos
o más eventos simultáneamente es muy pequeña. A los procesos que ocurren en un espectro continuo de tiempo y
espacio se le denomina proceso de Poisson; es similar al proceso de Bernoulli visto en la sección 3.2.3 excepto que los
eventos suceden en un espectro continuo en vez de ocurrir en ensayos u observaciones fijas. Un ejemplo de tal proceso
es la llegada de personas a la cola de una ventanilla bancaria. Tal como en el proceso de Bernoulli, se supone que los
eventos son independientes y que el proceso es estacionario.
Sea X la variable aleatoria que nos dice el número de eventos observados en un intervalo de tiempo o de espacio de
longitud t, entonces su función de probabilidad viene dada por:
Universidad de Sonora
86
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
f ( x , t) 
( t ) x e   t
, x = 0, 1, 2, ...
x!
La media de X es E(X)   t y su varianza es 
2
 0
 t.
En el caso particular cuando el periodo de tiempo y espacio es t  1 (digamos 1 mes, una semana, un metro, un
kilómetro, etc) se tiene que
f (x ) 
( ) x e  
,
x!
 0
x = 0, 1, 2, ...
La media de X es E(X)   y su varianza es  2   .
Ejemplo 3.16. El promedio mensual de accidentes en una fábrica resulta ser igual a 3. Durante el mes pasado hubo 6
accidentes. ¿Consideraría este número demasiado alto (muy poco probable si  es todavía 3) e indicador de un aumento
en la media  ?
Solución. El número de accidentes X tendría posiblemente una distribución de probabilidad de Poisson con   3 . La
probabilidad de que X sea de 6 es

P( X  6) 

x 6
Así,
3x e3  1  P( X  6)  1 
x!
5

x 0
3x e3
x!
P( X  6)  1  0.0498  0.1498  0.1494  0.2240  0.2240  0.1680  0.1008
 1  0.916  0.084
Además, se tiene que     3 ,  2    3 y   3  1.73 .
Una regla empírica indica que hay que esperar que Y tome valores en el intervalo   2 con una alta probabilidad.
Obsérvese que   2  3  21.73  6.46 . El número de accidentes observado X = 6, no se encuentra a más de 2
de  , pero está cerca de la frontera. Por lo tanto, el resultado observado no es muy improbable, pero puede tener la
suficiente improbabilidad para justificar una investigación.
Ejercicio 3.17. En un almacén particular, los clientes llegan al mostrador de caja de acuerdo a una distribución de
Poisson con un promedio de 7 por hora. En una hora determinada, ¿Cuál es la probabilidad de que:
a) no lleguen más de tres clientes?
b) Lleguen al menos dos clientes?
c) Lleguen exactamente 5 clientes?
Universidad de Sonora
87
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
3.2. Distribuciones continuas
Surgen espacios de muestra continuos siempre que se manejan cantidades que se miden en escala continua (por ejemplo
cuando medimos la velocidad de fabricación de un producto, el peso neto de un paquete de comida, la pureza de un
producto, la cantidad de alcohol que contiene una bebida o el tiempo de duración de un artículo eléctrico). En casos
como éstos existen continuidades de posibilidades y en la práctica lo que realmente interesa son probabilidades
asociadas con intervalos o regiones, no números o puntos individuales de un espacio de muestra. Por ejemplo podríamos
desear conocer la probabilidad de que un tipo dado de maquinaria empaque entre 500 y 600 productos por hora (no
exactamente 550.5) o que un paquete de comida congelada pese más de 750 gramos (no exactamente 800.6 gramos)
En esta sección conoceremos las distribuciones de probabilidad de las variables continuas más comunes así como sus
funciones de densidad las cuales son modelos teóricos para la distribución de frecuencias de una población de
mediciones.
Variables aleatorias continuas.
El tipo de variable aleatoria que toma cualquier valor en un intervalo se llama variable continua, por ejemplo, el tiempo
de producción de un producto en un proceso de ensamblaje y el tiempo de duración de una lavadora. El intervalo sobre
el cual se definen estas dos variables es la parte positiva de la línea de los números reales. Esto no significa que al
observar suficientes lavadoras, se observaría en algún momento cada número real positivo como al menos un resultado.
No obstante, lo importante es que no puede descartarse algún número real como un posible resultado de una observación
de la durabilidad de una lavadora.
Forma de las distribuciones continuas.
La distribución de probabilidad de una variable aleatoria discreta siempre se puede obtener asignando una probabilidad
positiva a cada uno de los posibles valores que puede tomar la variable. Naturalmente se tiene que estar seguro de que la
suma de las probabilidades asignadas sea siempre igual a 1. Desafortunadamente, la distribución de probabilidad de una
variable aleatoria continua no puede establecerse de la misma manera. Es matemáticamente imposible asignar
probabilidades diferentes de cero a todos los puntos de un intervalo real y al mismo tiempo satisfacer el requisito de que
la suma de probabilidades de los distintos valores posibles tiene que ser 1. Por lo que se debe desarrollar un método
diferente para describir la distribución de probabilidad para una variable aleatoria continua.
Para obtener una definición formal de una variable aleatoria continua debemos definir primero una función de
distribución (o función de distribución acumulativa).
Definición 3.1. Sea Y cualquier variable aleatoria. La función de distribución de Y, denotada por F(y) está dada por F(y)
= P(Y  y), para   y   .
La naturaleza de una función de distribución asociada a una variable aleatoria se utiliza para determinar si la variable
aleatoria es continua o discreta. Las funciones de distribución de variables aleatorias discretas siempre son funciones
escalonadas, puesto que la función de distribución acumulativa solamente se incrementa en un conjunto numerable de
puntos.
Universidad de Sonora
88
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Como la función de distribución asociada a cualquier variable aleatoria se define tal que F ( y )  P( Y  y ), es claro
que en la práctica P( Y   )  F (  ) tiene que ser cero. Si se consideran dos valores y1  y 2 , entonces
P( Y  y1 )  P( Y  y 2 ) . Es decir, F ( y1 )  F ( y 2 ) ; esto significa que la función F(y) es una función monótona, no
decreciente. Además, es claro que P( Y   )  F (  )  1 . Estas tres características definen las propiedades de
cualquier función de distribución.
Definición 3.2. Sea Y una variable aleatoria con una función de distribución F(y). Se dice que Y es continua si F(y) es
continua, para   y   .
Definición 3.3. Sea F(y) la función de distribución de una variable continua Y. Entonces f ( y ) , dado por
f ( y) 
dF ( y )
 F ( y )
dy
siempre y cuando exista la derivada, se denomina la función de densidad de probabilidad para la variable aleatoria Y.
De las definiciones 3.2 y 3.3 se deduce que F(y) se puede escribir como
F( y ) 

y

f ( t )dt
en donde f ( y ) es la función de densidad de probabilidad y t se utiliza como la variable para la integración. La
representación gráfica de esta relación entre la función de distribución y la función de densidad está dada en la figura
3.3.
Como la función F(y) para cualquier variable aleatoria tiene ciertas propiedades , también las funciones de densidad
tendrán algunas propiedades correspondientes. Como F(y) es una función no decreciente, la derivada f ( y ) nunca es
negativa. Además, se sabe que F ( )  1 y por esto, que



f (t )dt  1 .
f ( y)
F( y0 )
y0
y
Figura 3.3.
Universidad de Sonora
89
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Valor esperado de variables aleatorias continuas.
En esta sección veremos cómo se calculan las medias, las varianzas y desviaciones estándar de las variables aleatorias
continuas y de esta manera la obtención las medidas numéricas descriptivas de sus funciones de densidad.
Definición 3.4. El valor esperado de una variable aleatoria continua es
E( Y ) 



yf ( y )dy
siempre que exista la integral.
La varianza y la desviación estándar podemos encontrarla mediante la relación
 2  V ( Y )  E( Y 2 )  E( Y )2
3.2.1. Distribuciones continuas más comunes.
Varias distribuciones de probabilidad continua específicas son aplicables a una gran variedad de variables continuas
bajo circunstancias designadas. Por lo tanto se han preparado tablas de probabilidad para algunas de estas distribuciones
continuas para que el estadístico no se vea involucrado en la integración de áreas bajo curvas de probabilidad. Las
distribuciones de probabilidad continua específicas descritas en esta sección son las distribuciones de probabilidad más
comunes.
Distribución uniforme.
Sea y una variable aleatoria continua cuya densidad sea una constante dentro de un intervalo (a, b) (no importa si es
abierto o cerrado), entonces su función densidad será:
f ( y) 
1
,
ba
a yb
= 0 de otra manera
Así, cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye uniforme,
con parámetros a y b , denotándose esto:
Y ~ U ( a, b ) .
La media y la varianza vienen dadas por las fórmulas
Media 
Universidad de Sonora
ab
2
y Varianza 
90
a  b 2
12
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Ejercicio 3.18. Investigue cómo son las gráficas de las distribuciones de probabilidad uniformes de una variable
aleatoria continua
Ejemplo 3.17: el precio medio del kilo de aguacate durante el próximo año se estima que puede oscilar entre 10 y 15
pesos . Podría ser, por tanto, de 11 pesos., o de 12.5 pesos., o de 12.56 pesos., o de 12.95 pesos, etc. Hay infinitas
posibilidades, todas ellas con la misma probabilidad.
Solución. Su función de densidad, nos permite conocer la probabilidad que tiene cada punto del intervalo, en el ejemplo,
b : es el extremo superior del intervalo, 15 pesos; a :es el extremo inferior del intervalo, 10 pesos.
Por lo tanto, la función de distribución es:
f ( y) 
1
 0.20
15  10
Es decir, que el valor final esté entre 10 pesos. y 11 pesos. tiene un 20% de probabilidad, que esté entre 11 y 12, otro
20%, etc.
El valor medio de esta distribución se calcula:
E( y ) 
ab
2
En el ejemplo:
E( y ) 
15  10
 12.5
2
Por lo tanto, el precio medio esperado del aguacate para el próximo año es de 12.5 pesos.
Ejercicio 3.19. El volumen de precipitaciones estimado para el próximo año en la ciudad de Hermosillo va a oscilar
entre 40 y 50 litros por metro cuadrado. Calcular la función de distribución y la precipitación media esperada:
Distribución normal.
Sea y una variable aleatoria continua con densidad:
f ( y) 
  ( y   ) ,
1
exp 
2 
1
2 2
2
y  .
Así, cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye normal, con
parámetros  y  2 , denotándose esto: Y ~ N(  ,  2 ). La distribución normal es muy importante en la investigación,
por eso conviene mencionar sus características:
Universidad de Sonora
91
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
1.
2.
3.
4.
5.
6.
7.
Tiene forma de campana
Es simétrica con respecto a la media 
La media, la moda y la mediana coinciden
La p(  -  < y <  +  ) = 0.6826
La p(  - 2  < y <  + 2  ) = 0.9544
La p(  - 3  < y <  + 3  ) = 0.9974
Fue desarrollada por Carl F.Gauss
Distribución normal estándar.
Sea y una variable aleatoria continua tal que Y ~ N(  ,  2 ) y sea Z=
(X -  )
, entonces:

Z ~ N(0 , 1)
De lo anterior deducimos que Z es un caso particular de la Distribución Normal.
Nota: Cualquier variable que siga la distribución normal se puede transformar a una Z; dada esta cualidad, esto ha traído
como resultado que se pueden efectuar comparaciones entre variables normales, aunque tengan distintos parámetros. La
Tabla I trae la integral a la derecha para cualquier valor de Z positivo (los negativos se evitan, por la simetría, ya que la
media de la distribución es cero).
Ejemplo 3.19. Sea Z una variable aleatoria normal con media 0 y desviación estándar 1. Determinar
a)
P( Z  2 ).
b)
c)
P( 2  Z  2 ).
P( 0  Z  1.73 ).
Solución.
a)
Se procede hacia abajo en la primera columna (z) en la Tabla I, y se lee el área frente al valor z = 2.0. Esta área,
denotada por el símbolo A(z), es A(z = 2.0) = 0.0228. Entonces P( Z  2 )  0.0228
b) En la parte a) se determinó que A1 = A(Z =2.0) = 0.0228. Como la función de densidad es simétrica con
respecto a la media,   0, tenemos que A2 = A1 = 0.0228 y se tiene entonces que
P( 2  Z  2 )  1  A1  A2  1  20.0228  0.9544
c)
Obsérvese que P( 0  Z  1.73 )  0.5  A1.73 en donde A(1.73) se obtiene al proceder hacia abajo en la
columna z de la Tabla I hasta la hilera "1.7" y después se va a la parte superior de la tabla hasta la columna
marcada "0.03", en donde se lee A(1.73) = 0.0418. Entonces
P(0  Z  1.73)  0.5  0.0418  0.4582
Universidad de Sonora
92
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Ejemplo 3.20. Los resultados de un examen de admisión en un colegio de bachilleres de la localidad tiene una
distribución normal con media 75 y desviación estándar 10. ¿Qué fracción de resultados queda entre 80 y 90?
Solución. z representa la distancia de la media de una distribución normal expresada en unidades de la desviación
estándar. Así,
z
(y -  )

Entonces la fracción buscada de la población está dada por el área entre
(80 - 75 )
 0.5
10
z
y
z
(90 - 75 )
 1.5
10
Se tiene que A  A0.5  A1.5  0.3085  0.0668  0.2417
Ejercicio 3.21.1. Utilice la Tabla I para encontrar las probabilidades siguientes para una variable aleatoria normal
estándar Z.
a)
b)
c)
d)
e)
P0  Z  1.2
P0.9  Z  0
P0.3  Z  1.56
P0.2  Z  0.2
P1.56  Z  0.2
Ejercicio 3.21.2. Se observó durante un largo periodo que la cantidad semanal gastada en el mantenimiento y en las
reparaciones en cierta fabrica tiene aproximadamente una distribución normal con una media de 4 mil pesos y una
desviación estándar de 200 pesos. Si el presupuesto para la próxima semana es de 4 mil 500 pesos,
a) ¿Cuál es la probabilidad de que los costos reales sean mayores que la cantidad presupuestada?
b) ¿De cuánto tendría que ser el presupuesto para reparaciones semanales y mantenimiento, para que la
cantidad presupuestada solamente se rebasara con una probabilidad de 0.1?
Distribución lognormal.
Sea Y una variable aleatoria continua, se dice que la variable tiene una distribución log-normal si X  lnY  tiene una
distribución normal. (el símbolo ln indica logaritmo natural.). En este caso Y no debe ser negativo. La ecuación de la
función de densidad lognormal es


f ( y)    


Universidad de Sonora
1
 

e

(ln  y   ) 2
2 2
,
y0
y 2
0 en cualquier otro
punto
93
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Así, cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye logaritmo
normal o simplemente lognormal, con parámetros  y  , denotándose: Y ~ LN (  ,  ) .
Ya que ln(Y ) es una función monótona de y,
PY  y   PlnY   ln y   PX  ln y 
En donde X tiene una distribución normal con media  y varianza  2
La distribución lognormal se usa con frecuencia en las ciencias biológicas y físicas como modelo de magnitudes, de
volumen de peso, de diversas cantidades, tales como partículas de carbón molido, cultivos, colonias de bacterias y
animales individuales.
Ejercicio 3.22. Si Y tiene distribución log-normal con   4 y  2
a) PY  4
y
 1,
, encuentre,
b) PY  8
Distribución gamma.
Sea y una variable aleatoria continua con densidad:

  1  y
1
f ( y)  
y e
 
 (  )  
0  y  ,  ,   0
= 0 en cualquier otro punto.
en donde   


0
y  1e  y dy . La cantidad   se conoce como la función gamma. La integración directa da que
1  1 . La integración por partes indica      1   1 para cualquier   1 y que n  n  1! , para un
número entero n. Si  no es un número entero, es imposible encontrar la antiderivada del integrando de la expresión

d
c
 1   1  y
y e dy

 
 ( )  
0cd 
y por lo tanto es imposible encontrar las áreas bajo la función de densidad tipo gamma mediante la integración directa.
Para estos casos, se hace una aproximación mediante las sumas de probabilidades de Poisson .
Cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye gamma, con
parámetros  y  , denotándose esto: y ~ G (  ,  ). La media y la varianza vienen dadas por las fórmulas:
Media   y Varianza   2
Universidad de Sonora
94
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
La función de densidad Gamma para el caso especial   1 se denomina función de densidad exponencial y en muchas
ocasiones es útil en los modelos de duración de componentes eléctricos.
Ejercicio 3.23. Investigue cómo son las graficas de las Distribuciones Gamma para distintos valores de

y
.
Ejemplo 3.21. Los ingresos anuales de los jefes de familia en cierta sección de la ciudad de Hermosillo tienen
aproximadamente una distribución gamma con   1 000 y   5 . Determine la media y la varianza de estos ingresos.
¿Esperaría encontrar muchos ingresos superiores a $ 8,000 en esta área de la ciudad?
Solución. La media de los ingresos es   1,0005  $5,000, mientras que la varianza es  2  1,00052 =
$25,000. De la varianza se obtiene la desviación estándar igual a $158.11 por lo que la respuesta a la pregunta es no, es
decir, la probabilidad de encontrar ingresos superiores a 8 mil pesos en esta sección de Hermosillo es prácticamente
nula.
Ejercicio.3.24. El tiempo semanal Y (en horas) durante el que cierta máquina industrial no funciona, tiene
aproximadamente una distribución gamma con   3 y   2 . La pérdida, en pesos para la operación industrial debido
a esta baja, está dada por L  300Y  20Y 2 . Calcule el valor esperado y la varianza de L.
Distribución Beta.
Sea X una variable aleatoria continua con densidad
       1
 1
f ( y)  
 y 1  y 










0  y 1
= 0 en cualquier otro punto..
Cualquier variable aleatoria continua y, cuya densidad se ajusta a este patrón, se dirá que se distribuye beta, con
parámetros  y  , denotándose esto:
y ~ B (,  )
NOTA: Si y ~ B(1, 1) se puede demostrar que y ~ U (0,1). La media y la varianza para esta distribución vienen dadas por
las fórmulas
  E( Y ) 


y
 2  V(Y ) 

        1
2
.
Ejercicio 3.25. Investigue cómo son las graficas de las Distribuciones Beta.
Universidad de Sonora
95
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Ejemplo 3.22. Un distribuidor mayorista de gasolina dispone de tanques de almacenaje que contienen una cantidad fija
de gasolina y que llenan cada lunes. La proporción de esta reserva que se vende durante la semana es de sumo interés
para el distribuidor. Mediante observaciones durante muchas semanas se encontró que se podría representar el modelo
de esta proporción mediante una distribución beta con   4 y   2 . Encontrar la probabilidad de que el mayorista
venda al menos 90% de su reserva durante una semana dada.
Solución. Sea Y la proporción vendida durante la semana, entonces
 4  2  3
f ( y)  
 y 1  y 
 4 2 
0  y 1
= 0 en cualquier otro punto.
Y así,
P( Y  0.9 ) 
1

f ( y )dy 
0.9


4

y5 1 
y 1

20 y 3  y 4 dy  20

  20(.004 )  .08
0.9
0
.
9
0
.
9
4
5




1

Este resultado indica que no es muy probable que como mínimo se venda el 90% de la reserva en una semana dada.
Ejercicio 3.26. Durante un turno de 8 horas, la proporción, Y, del tiempo que una máquina de estampado en lámina
metálica no está funcionando por mantenimiento o reparación, tiene una distribución beta con   1 y   2 . Es decir,
2(1  y ),
f ( y)  
 0,
0  y  1,
en cualquier otro punto.
El costo (en miles de pesos) por tiempo de inactividad, debido a producción perdida y costos de mantenimiento y de
separación, esta dado por
C  1,000  2,000Y  40Y 2
Halle la media y la varianza de C.
Distribución t de Student.
Si T 
Z
Y
v
, donde Y ~  2 ( v ) entonces la densidad de y será:
Universidad de Sonora
96
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
 v  1 
 

 2 
f y 

y2 
  2v 1  
v 

v 1
2
Se ha demostrado que si se tiene una variable normal, y se toma una muestra de tamaño v + 1, se calcula la media de la
muestra y la S2 (varianza de la muestra), entonces:
y
 /  1  y  
s /  1
 s2
 2
tendrá una densidad como la anterior, con v grados de libertad.
Así, cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye t, con v
grados de libertad, es decir, con parámetro v, denotándose esto:
Y ~ t(v)
La Tabla II trae los valores de y para algunos valores usuales de


y
f ( y )dy para algunos valores de  .
,
Ejercicio 3.27. Investigue cómo son las graficas de las Distribuciones t de Student para distintos gados de libertad.
Ejemplo 3.23. La resistencia a la tensión para cierto tipo de alambre de púas se distribuye normalmente con una media
desconocida  y una varianza desconocida  2 . Se seleccionaron al azar 6 segmentos de alambre de un rollo grande y
se midió Yi , la resistencia a la tensión para el segmento i, en donde i = 1, 2, ..., 6. La media de la población  y la
varianza  2 se pueden estimar por Y y S 2 , respectivamente. Ya que  Y2 
Obtenga la probabilidad aproximada de que Y esté a lo más a
2S
n
2
n
,  Y2 puede ser estimada por
S2
.
n
de la verdadera media poblacional  .
Solución. Se desea encontrar


 2S
 Y    
2S 
  2
P 
 Y    
  P  2  n 
n
n
 S 



 P2  T  2
en donde T tiene una distribución t con n - 1 = 5 grados de libertad en este caso. Observando la tabla II, vemos que el
área a la derecha de 2.015 es 0.05. Por lo tanto,
Universidad de Sonora
97
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
P 2.015  T  2.015  0.90
y la probabilidad de que Y esté dentro de dos desviaciones estándar estimadas de  será un poco menor que 0.90.
Obsérvese que si se conociera  2 la probabilidad de que Y tome un valor que difiera a lo más en 2 Y de  estará
dada por

 2
 Y    
2 
 
P 
 Y    
  P  2  n 
n
n
  



2

 P2  Z  2  0.9544
Distribución  2 (Ji cuadrada).

, 2), en donde  es un entero positivo, entonces se dice que se distribuye ji
2
cuadrada con  grados de libertad, denotándose esto: Y ~  2 (  ) La densidad para este tipo de variables viene dada por
Si una variable aleatoria continua Y ~ G(
la función:
f(2 ) 
(2 )
( 2 ) 1 
e

2 
2
2
2
2  0
2 

La Tabla III trae los valores de y para algunos valores usuales de  2 y varios valores de  .
La distribución  2 desempeña un papel importante cuando se desea hacer una inferencia con respecto a la varianza  2
de la población basada en una muestra aleatoria Y1 , Y2 ,  Yn tomada de una población normal. esto se analizará a su
tiempo. Un buen estimador de  2 es la varianza de la muestra
S2 
1
n 1
n
 Y
i
Y
2
i 1
El teorema siguiente nos da la distribución de probabilidad para una función del estadístico S2.
Teorema 3.1. Sea Y1 , Y2 ,  Yn una muestra elegida al azar de una variable aleatoria que sigue una
distribución normal con media  y varianza  2 . Entonces ~
Y  Y 2  n  12S
2  i
1

Universidad de Sonora
n
2

i 1
98
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
tiene una distribución  2 con n  1 grados de libertad. Y y S 2 son variables aleatorias independientes.
Teorema 3.2 (Cochran). Sea X 1 , X 2 ,  X n ~ N
X 

i 1
n

X i  X 2
i 1
2
2
 2 
1 n
X
~
N
 i   , n 
n i 1


n
X y
,   variables aleatorias independientes. Entonces
X
 X
2
i

2
~  n21
son variables aleatorias independientes.
Ejercicio 3.28. Investigue cómo son las graficas de las Distribuciones  2 para distintos grados de libertad.
Ejemplo 3.24. Una máquina embotelladora de refrescos puede regularse de tal manera que llene un promedio de 
onzas por botella. Se ha observado que las onzas del contenido que vacía la máquina embotelladora tiene una
distribución normal con  2  1 . Supóngase que se desea obtener una muestra aleatoria de 10 botellas y medir el
contenido en cada botella. Si se utilizan estas 10 observaciones para calcular S 2 , podría ser útil especificar un intervalo
de valores que incluyeran a S 2 con una alta probabilidad. Encontrar los números b1 y b2 tales que


P b1  S 2  b2  0.90
Solución. Observemos que
 n  1 b1 n  1 S 2 n  1 b2 
P b1  S 2  b2  P 



2
2
 2 
 

Ya que  2  1 , en consecuencia

n  1S 2
2
 n  1 S 2 tiene una distribución  2 con ( n  1) grados de libertad.
Podemos utilizar la tabla III para encontrar los números a1 y a 2 tales que


P a1  n  1 S 2  a 2  0.90
un método para hacerlo es encontrar el valor a2 que limita un área de 0.05 de la cola derecha y un valor a1 que limita un
área de 0.05 de la cola izquierda (0.95 de área a la derecha). Ya que hay 9 grados de libertad, la tabla III nos da
a 2  16.919 y a1  3.325 . Así debemos tener
Universidad de Sonora
99
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
a1 
n  1b1  n  1b
a2 
n  1b2  n  1b  9b
2
2
2
1
2
 9b1

O sea
b1 
3.325
 0.369
9
b2 
y
16.919
 1.880
9
De donde se deduce que sise desea tener un intervalo que incluya a S2 con una probabilidad de 0.90, uno de tales
intervalos es (0.369, 1.880). Obsérvese que este intervalo es demasiado grande.
Distribución F de Fisher.
U
Sea X  m , siendo U y V dos variables ji cuadrada con m y n grados de libertad, respectivamente. Entonces la
V
n
densidad de X será:
m
f x  
 m  n  m  2

  x
 2  n 
m2
2
 m   n  1  mx 
   

 2   2  n 
m n
2
,
x0
= 0, de otra manera.
Así, cualquier variable aleatoria continua X, cuya densidad se ajuste a este patrón, se dirá que se distribuye F, con
parámetros m y n (con m y n grados de libertad) denotándose esto:
X~ F(m, n).
La función de densidad para variables aleatorias con la distribución F es un miembro de la familia de las distribuciones
beta y es muy utilizada en las pruebas de Análisis de Varianza (ANDEVA).
Ejercicio 3.29. Investigue cómo es la grafica de la Distribución F de Fisher para cualesquiera grados de libertad m y n.
Considerando nuevamente las muestras aleatorias independientes de distribuciones normales, sabemos que
Universidad de Sonora
100
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
m  1S12 S12
U
m  1 12  12
m
X 


V
n  1S 22 S 22
n
n  1 22  22
tiene una distribución F con
m  1 grados de libertad del numerador y n  1 grados de libertad del denominador.
Ejemplo 3.25. Si tomamos dos muestras independientes de tamaño n1  6 y n2  10 de dos poblaciones normales con
la misma varianza poblacional, encuentre el número b tal que
 S2

P 12  b   0.95
 S2

Solución. Como n1  6, n2  10 y las varianzas poblacionales son iguales, entonces
S12
 12
S 22

S12
S 22
 22
tiene una distribución F con n  n1  1  5 grados de libertad del numerador y m  n2  1  9 grados de libertad del
denominador. También
 S2

 S2

P 12  b   1  P 12  b 
 S2

 S2

Por lo tanto, se desea encontrar el número b que limita un área a la derecha de 0.05 bajo la función de densidad F con 5
grados de libertad del numerador y 9 grados de libertad del denominador. Al buscar en la columna 5 y el renglón 9 en la
Tabla IV, vemos que el valor apropiado para b es 3.48. Obsérvese que aún cuando las varianzas poblacionales son
iguales, la probabilidad de que la razón de las varianzas de las muestras exceda a 3.48 es aún de 0.05 (suponiendo
tamaños de muestras de n1  6, n2  10 ).
Si Y es una variable aleatoria que tiene una distribución F con n1 grados de libertad del numerador y n2 grados de
1
libertad del denominador, U 
tendrá una distribución F con n2 grados de libertad del numerador y n1 grados de
Y
U

U
1
libertad del denominador. Además, P 1  k   P 2   . Use estos hechos para resolver el Ejercicio 3.30 .
 U2

 U1 k 
Ejercicio 3.30. Sea S12 la varianza de la muestra de una muestra aleatoria de 10 valores de ln(CL50) para cobre y sea
S 22 la varianza de la muestra de una muestra aleatoria de 8 valores de ln(CL50) para plomo, habiendo utilizado en
ambas muestras la misma especie de peces. Supóngase que la varianza poblacional para las mediciones con respecto al
Universidad de Sonora
101
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
cobre es el doble de la varianza poblacional correspondiente para las mediciones con respecto al plomo. Encuentre dos
números a y b tales que


S2
P a  12  b   0.90
S2


suponiendo que S12 y S 22 son independientes.
Universidad de Sonora
102
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Tabla I. Area bajo la densidad de la distribución normal estándar
a la izquierda de Z.
PZ  z 
Z ~ N(0,1)
z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.5000
0.5040
0.5080
0.5120
0.5160
0.5199
0.5239
0.5279
0.5319
0.5359
0.1
0.5398
0.5438
0.5478
0.5517
0.5557
0.5596
0.5636
0.5675
0.5714
0.5753
0.2
0.5793
0.5832
0.5871
0.5910
0.5948
0.5987
0.6026
0.6064
0.6103
0.6141
0.3
0.6179
0.6217
0.6255
0.6293
0.6331
0.6368
0.6406
0.6443
0.6480
0.6517
0.4
0.6554
0.6591
0.6628
0.6664
0.6700
0.6736
0.6772
0.6808
0.6844
0.6879
0.5
0.6915
0.6950
0.6985
0.7019
0.7054
0.7088
0.7123
0.7157
0.7190
0.7224
0.6
0.7257
0.7291
0.7324
0.7357
0.7389
0.7422
0.7454
0.7486
0.7517
0.7549
0.7
0.7580
0.7611
0.7642
0.7673
0.7704
0.7734
0.7764
0.7794
0.7823
0.7852
0.8
0.7881
0.7910
0.7939
0.7967
0.7995
0.8023
0.8051
0.8078
0.8106
0.8133
0.9
0.8159
0.8186
0.8212
0.8238
0.8264
0.8289
0.8315
0.8340
0.8365
0.8389
1.0
0.8413
0.8438
0.8461
0.8485
0.8508
0.8531
0.8554
0.8577
0.8599
0.8621
1.1
0.8643
0.8665
0.8686
0.8708
0.8729
0.8749
0.8770
0.8790
0.8810
0.8830
1.2
0.8849
0.8869
0.8888
0.8907
0.8925
0.8944
0.8962
0.8980
0.8997
0.9015
1.3
0.9032
0.9049
0.9066
0.9082
0.9099
0.9115
0.9131
0.9147
0.9162
0.9177
1.4
0.9192
0.9207
0.9222
0.9236
0.9251
0.9265
0.9279
0.9292
0.9306
0.9319
1.5
0.9332
0.9345
0.9357
0.9370
0.9382
0.9394
0.9406
0.9418
0.9429
0.9441
1.6
0.9452
0.9463
0.9474
0.9484
0.9495
0.9505
0.9515
0.9525
0.9535
0.9545
1.7
0.9554
0.9564
0.9573
0.9582
0.9591
0.9599
0.9608
0.9616
0.9625
0.9633
1.8
0.9641
0.9649
0.9656
0.9664
0.9671
0.9678
0.9686
0.9693
0.9699
0.9706
1.9
0.9713
0.9719
0.9726
0.9732
0.9738
0.9744
0.9750
0.9756
0.9761
0.9767
2.0
0.9772
0.9778
0.9783
0.9788
0.9793
0.9798
0.9803
0.9808
0.9812
0.9817
2.1
0.9821
0.9826
0.9830
0.9834
0.9838
0.9842
0.9846
0.9850
0.9854
0.9857
2.2
0.9861
0.9864
0.9868
0.9871
0.9875
0.9878
0.9881
0.9884
0.9887
0.9890
2.3
0.9893
0.9896
0.9898
0.9901
0.9904
0.9906
0.9909
0.9911
0.9913
0.9916
2.4
0.9918
0.9920
0.9922
0.9925
0.9927
0.9929
0.9931
0.9932
0.9934
0.9936
2.5
0.9938
0.9940
0.9941
0.9943
0.9945
0.9946
0.9948
0.9949
0.9951
0.9952
2.6
0.9953
0.9955
0.9956
0.9957
0.9959
0.9960
0.9961
0.9962
0.9963
0.9964
2.7
0.9965
0.9966
0.9967
0.9968
0.9969
0.9970
0.9971
0.9972
0.9973
0.9974
2.8
0.9974
0.9975
0.9976
0.9977
0.9977
0.9978
0.9979
0.9979
0.9980
0.9981
2.9
0.9981
0.9982
0.9982
0.9983
0.9984
0.9984
0.9985
0.9985
0.9986
0.9986
3.0
0.9987
0.9987
0.9987
0.9988
0.9988
0.9989
0.9989
0.9989
0.9990
0.9990
Universidad de Sonora
103
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Tabla II. Valores críticos para la distribución t de Student.
alfa = área a la derecha de t (df, alfa)
T~t(df)
P(T > t(df,alfa))
grados
de
libertad
alfa
0.1000
0.0500
0.0250
0.0100
0.0050
0.0010
0.0005
1
3.078
6.314
12.706
31.821
63.656
318.289
636.578
2
1.886
2.920
4.303
6.965
9.925
22.328
31.600
3
1.638
2.353
3.182
4.541
5.841
10.214
12.924
4
1.533
2.132
2.776
3.747
4.604
7.173
8.610
5
1.476
2.015
2.571
3.365
4.032
5.894
6.869
6
1.440
1.943
2.447
3.143
3.707
5.208
5.959
7
1.415
1.895
2.365
2.998
3.499
4.785
5.408
8
1.397
1.860
2.306
2.896
3.355
4.501
5.041
9
1.383
1.833
2.262
2.821
3.250
4.297
4.781
10
1.372
1.812
2.228
2.764
3.169
4.144
4.587
11
1.363
1.796
2.201
2.718
3.106
4.025
4.437
12
1.356
1.782
2.179
2.681
3.055
3.930
4.318
13
1.350
1.771
2.160
2.650
3.012
3.852
4.221
14
1.345
1.761
2.145
2.624
2.977
3.787
4.140
15
1.341
1.753
2.131
2.602
2.947
3.733
4.073
16
1.337
1.746
2.120
2.583
2.921
3.686
4.015
17
1.333
1.740
2.110
2.567
2.898
3.646
3.965
18
1.330
1.734
2.101
2.552
2.878
3.610
3.922
19
1.328
1.729
2.093
2.539
2.861
3.579
3.883
20
1.325
1.725
2.086
2.528
2.845
3.552
3.850
21
1.323
1.721
2.080
2.518
2.831
3.527
3.819
22
1.321
1.717
2.074
2.508
2.819
3.505
3.792
23
1.319
1.714
2.069
2.500
2.807
3.485
3.768
24
1.318
1.711
2.064
2.492
2.797
3.467
3.745
25
1.316
1.708
2.060
2.485
2.787
3.450
3.725
26
1.315
1.706
2.056
2.479
2.779
3.435
3.707
27
1.314
1.703
2.052
2.473
2.771
3.421
3.689
28
1.313
1.701
2.048
2.467
2.763
3.408
3.674
29
1.311
1.699
2.045
2.462
2.756
3.396
3.660
30
1.310
1.697
2.042
2.457
2.750
3.385
3.646
31
1.309
1.696
2.040
2.453
2.744
3.375
3.633
32
1.309
1.694
2.037
2.449
2.738
3.365
3.622
Universidad de Sonora
104
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Tabla II. Valores críticos para la distribución t de Student.
alfa = área a la derecha de t (df, alfa)
T~t(df)
P(T > t(df,alfa))
grados
de
libertad
alfa
0.1000
0.0500
0.0250
0.0100
0.0050
0.0010
0.0005
33
1.308
1.692
2.035
2.445
2.733
3.356
3.611
34
1.307
1.691
2.032
2.441
2.728
3.348
3.601
35
1.306
1.690
2.030
2.438
2.724
3.340
3.591
36
1.306
1.688
2.028
2.434
2.719
3.333
3.582
37
1.305
1.687
2.026
2.431
2.715
3.326
3.574
38
1.304
1.686
2.024
2.429
2.712
3.319
3.566
39
1.304
1.685
2.023
2.426
2.708
3.313
3.558
40
1.303
1.684
2.021
2.423
2.704
3.307
3.551
60
1.296
1.671
2.000
2.390
2.660
3.232
3.460
120
1.289
1.658
1.980
2.358
2.617
3.160
3.373
inf
1.282
1.645
1.960
2.327
2.576
3.091
3.291
Universidad de Sonora
105
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Tabla III. Valores críticos para la distribución Ji Cuadrado
alfa = área a la izquierda de  2 (df, alfa)
X ~  2 (df)
Universidad de Sonora
P(X >  2 (df.alfa))
grados
de
libertad
alfa
0.100
0.050
0.025
0.010
0.005
1
2.7055
3.8415
5.0239
6.6349
7.8794
2
4.6052
5.9915
7.3778
9.2104
10.5965
3
6.2514
7.8147
9.3484
11.3449
12.8381
4
7.7794
9.4877
11.1433
13.2767
14.8602
5
9.2363
11.0705
12.8325
15.0863
16.7496
6
10.6446
12.5916
14.4494
16.8119
18.5475
7
12.0170
14.0671
16.0128
18.4753
20.2777
8
13.3616
15.5073
17.5345
20.0902
21.9549
9
14.6837
16.9190
19.0228
21.6660
23.5893
10
15.9872
18.3070
20.4832
23.2093
25.1881
11
17.2750
19.6752
21.9200
24.7250
26.7569
12
18.5493
21.0261
23.3367
26.2170
28.2997
13
19.8119
22.3620
24.7356
27.6882
29.8193
14
21.0641
23.6848
26.1189
29.1412
31.3194
15
22.3071
24.9958
27.4884
30.5780
32.8015
16
23.5418
26.2962
28.8453
31.9999
34.2671
17
24.7690
27.5871
30.1910
33.4087
35.7184
18
25.9894
28.8693
31.5264
34.8052
37.1564
19
27.2036
30.1435
32.8523
36.1908
38.5821
20
28.4120
31.4104
34.1696
37.5663
39.9969
21
29.6151
32.6706
35.4789
38.9322
41.4009
22
30.8133
33.9245
36.7807
40.2894
42.7957
23
32.0069
35.1725
38.0756
41.6383
44.1814
24
33.1962
36.4150
39.3641
42.9798
45.5584
25
34.3816
37.6525
40.6465
44.3140
46.9280
26
35.5632
38.8851
41.9231
45.6416
48.2898
27
36.7412
40.1133
43.1945
46.9628
49.6450
28
37.9159
41.3372
44.4608
48.2782
50.9936
29
39.0875
42.5569
45.7223
49.5878
52.3355
30
40.2560
43.7730
46.9792
50.8922
53.6719
31
41.4217
44.9853
48.2319
52.1914
55.0025
32
42.5847
46.1942
49.4804
53.4857
56.3280
33
43.7452
47.3999
50.7251
54.7754
57.6483
34
44.9032
48.6024
51.9660
56.0609
58.9637
35
46.0588
49.8018
53.2033
57.3420
60.2746
106
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Tabla III. Valores críticos para la distribución Ji Cuadrado
alfa = área a la izquierda de  2 (df, alfa)
X ~  2 (df)
Universidad de Sonora
P(X >  2 (df.alfa))
grados
de
libertad
alfa
0.100
0.050
0.025
0.010
0.005
36
47.2122
50.9985
54.4373
58.6192
61.5811
37
48.3634
52.1923
55.6680
59.8926
62.8832
38
49.5126
53.3835
56.8955
61.1620
64.1812
39
50.6598
54.5722
58.1201
62.4281
65.4753
40
51.8050
55.7585
59.3417
63.6908
66.7660
50
63.1671
67.5048
71.4202
76.1538
79.4898
60
74.3970
79.0820
83.2977
88.3794
91.9518
70
85.5270
90.5313
95.0231
100.4251
104.2148
80
96.5782
101.8795
106.6285
112.3288
116.3209
90
107.5650
113.1452
118.1359
124.1162
128.2987
100
118.4980
124.3421
129.5613
135.8069
140.1697
150
172.5812
179.5806
185.8004
193.2075
198.3599
200
226.0210
233.9942
241.0578
249.4452
255.2638
300
331.7885
341.3951
349.8745
359.9064
366.8439
400
436.6490
447.6324
457.3056
468.7244
476.6068
500
540.9303
553.1269
563.8514
576.4931
585.2060
107
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Tabla III. Valores críticos para la distribución Ji Cuadrado
alfa = área a la derecha de  2 (df, alfa)
X ~  2 (df)
Universidad de Sonora
P(X >  2 (df, alfa))
grados
de
libertad
alfa
0.995
0.990
0.975
0.950
0.900
1
0.0000
0.0002
0.0010
0.0039
0.0158
2
0.0100
0.0201
0.0506
0.1026
0.2107
3
0.0717
0.1148
0.2158
0.3518
0.5844
4
0.2070
0.2971
0.4844
0.7107
1.0636
5
0.4118
0.5543
0.8312
1.1455
1.6103
6
0.6757
0.8721
1.2373
1.6354
2.2041
7
0.9893
1.2390
1.6899
2.1673
2.8331
8
1.3444
1.6465
2.1797
2.7326
3.4895
9
1.7349
2.0879
2.7004
3.3251
4.1682
10
2.1558
2.5582
3.2470
3.9403
4.8652
11
2.6032
3.0535
3.8157
4.5748
5.5778
12
3.0738
3.5706
4.4038
5.2260
6.3038
13
3.5650
4.1069
5.0087
5.8919
7.0415
14
4.0747
4.6604
5.6287
6.5706
7.7895
15
4.6009
5.2294
6.2621
7.2609
8.5468
16
5.1422
5.8122
6.9077
7.9616
9.3122
17
5.6973
6.4077
7.5642
8.6718
10.0852
18
6.2648
7.0149
8.2307
9.3904
10.8649
19
6.8439
7.6327
8.9065
10.1170
11.6509
20
7.4338
8.2604
9.5908
10.8508
12.4426
21
8.0336
8.8972
10.2829
11.5913
13.2396
22
8.6427
9.5425
10.9823
12.3380
14.0415
23
9.2604
10.1957
11.6885
13.0905
14.8480
24
9.8862
10.8563
12.4011
13.8484
15.6587
25
10.5196
11.5240
13.1197
14.6114
16.4734
26
11.1602
12.1982
13.8439
15.3792
17.2919
27
11.8077
12.8785
14.5734
16.1514
18.1139
28
12.4613
13.5647
15.3079
16.9279
18.9392
29
13.1211
14.2564
16.0471
17.7084
19.7677
30
13.7867
14.9535
16.7908
18.4927
20.5992
31
14.4577
15.6555
17.5387
19.2806
21.4336
32
15.1340
16.3622
18.2908
20.0719
22.2706
33
15.8152
17.0735
19.0467
20.8665
23.1102
34
16.5013
17.7891
19.8062
21.6643
23.9522
35
17.1917
18.5089
20.5694
22.4650
24.7966
108
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Tabla III. Valores críticos para la distribución Ji Cuadrado
alfa = área a la derecha de  2 (df, alfa)
X ~  2 (df)
Universidad de Sonora
P(X >  2 (df, alfa))
grados
de
libertad
alfa
0.995
0.990
0.975
0.950
0.900
36
17.8868
19.2326
21.3359
23.2686
25.6433
37
18.5859
19.9603
22.1056
24.0749
26.4921
38
19.2888
20.6914
22.8785
24.8839
27.3430
39
19.9958
21.4261
23.6543
25.6954
28.1958
40
20.7066
22.1642
24.4331
26.5093
29.0505
50
27.9908
29.7067
32.3574
34.7642
37.6886
60
35.5344
37.4848
40.4817
43.1880
46.4589
70
43.2753
45.4417
48.7575
51.7393
55.3289
80
51.1719
53.5400
57.1532
60.3915
64.2778
90
59.1963
61.7540
65.6466
69.1260
73.2911
100
67.3275
70.0650
74.2219
77.9294
82.3581
150
109.1423
112.6676
117.9846
122.6918
128.2750
200
152.2408
156.4321
162.7280
168.2785
174.8353
300
240.6631
245.9727
253.9122
260.8781
269.0679
400
330.9029
337.1552
346.4817
354.6410
364.2074
500
422.3034
429.3874
439.9360
449.1467
459.9261
109
Departamento de Matemáticas
Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales.
Dr. Francisco Javier Tapia Moreno. Marzo de 2011.
Tabla IV: Valores percentiles en 95avos (niveles de 0.05), F0.95, m , n ,
para la distribución F.
1
m grados de libertad en el numerador
n grados de libertad en el denominador
0.95
0.05
F0.95
m
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

1
2
3
4
5
6
7
8
9
10
12
15
20
24
30
40
60
120

161
18.5
10.1
7.71
6.61
5.99
5.59
5.32
5.12
4.96
4.84
4.75
4.67
4.60
4.54
4.49
4.45
4.41
4.38
4.35
4.32
4.30
4.28
4.26
4.24
4.23
4.21
4.20
4.18
4.17
4.08
4.00
3.92
3.84
200
19.0
9.55
6.94
5.79
5.14
4.74
4.46
4.26
4.10
3.98
3.89
3.81
3.74
3.68
3.63
3.59
3.55
3.52
3.49
3.47
3.44
3.42
3.40
3.39
3.37
3.35
3.34
3.33
3.32
3.23
3.15
3.07
3.00
216
19.2
9.28
6.59
5.41
4.75
4.35
4.07
3.86
3.71
3.59
3.49
3.41
3.34
3.29
3.24
3.20
3.16
3.13
3.10
3.07
3.05
3.03
3.01
2.99
2.98
2.96
2.95
2.93
2.62
2.84
2.76
2.68
2.60
225
19.2
9.12
6.39
5.19
4.53
4.12
3.84
3.63
3.48
3.36
3.26
3.18
3.11
3.06
3.01
2.96
2.93
2.90
2.87
2.84
2.82
2.80
2.78
2.76
2.74
2.73
2.71
2.70
2.69
2.61
2.53
2.45
2.37
230
19.3
9.01
6.26
5.05
4.39
3.97
3.69
3.48
3.33
3.20
3.11
3.03
2.96
2.90
2.85
2.81
2.77
2.74
2.71
2.68
2.66
2.64
2.62
2.60
2.59
2.57
2.56
2.55
2.53
2.45
2.37
2.29
2.21
234
19.3
8.94
6.16
4.95
4.28
3.87
3.58
3.37
3.22
3.09
3.00
2.92
2.85
2.79
2.74
2.70
2.66
2.63
2.60
2.57
2.55
2.53
2.51
2.49
2.47
2.46
2.45
2.43
2.42
2.34
2.25
2.18
2.10
237
19.4
8.89
6.09
4.88
4.21
3.79
3.50
3.29
3.14
3.01
2.91
2.83
2.76
2.71
2.66
2.61
2.58
2.54
2.51
2.49
2.46
2.44
2.42
2.40
2.39
2.37
2.36
2.35
2.33
2.25
2.17
2.09
2.01
239
19.4
8.85
6.04
4.82
4.15
3.73
3.44
3.23
3.07
2.95
2.85
2.77
2.70
2.64
2.59
2.55
2.51
2.48
2.45
2.42
2.40
2.37
2.36
2.34
2.32
2.31
2.29
2.28
2.27
2.18
2.10
2.02
1.94
241
19.4
8.81
6.00
4.77
4.10
3.68
3.39
3.18
3.02
2.90
2.80
2.71
2.65
2.59
2.54
2.49
2.46
2.42
2.39
2.37
2.34
2.32
2.30
2.28
2.27
2.25
2.24
2.22
2.21
2.12
2.04
1.96
1.88
242
19.4
8.79
5.96
4.74
4.06
3.64
3.35
3.14
2.98
2.85
2.75
2.67
2.60
2.54
2.49
2.45
2.41
2.38
2.35
2.32
2.30
2.27
2.25
2.24
2.22
2.20
2.19
2.18
2.16
2.08
1.99
1.91
1.83
244
19.4
8.74
5.91
4.68
4.00
3.57
3.28
3.07
2.91
2.79
2.69
2.60
2.53
2.48
2.42
2.38
2.34
2.31
2.28
2.25
2.23
2.20
2.18
2.16
2.15
2.13
2.12
2.10
2.09
2.00
1.92
1.83
1.75
246
19.4
8.70
5.86
4.62
3.94
3.51
3.22
3.01
2.85
2.72
2.62
2.53
2.46
2.40
2.35
2.31
2.27
2.23
2.20
2.18
2.15
2.13
2.11
2.09
2.07
2.06
2.04
2.03
2.01
1.92
1.84
1.75
1.67
248
19.4
8.66
5.80
5.56
3.87
3.44
3.15
2.94
2.77
2.65
2.54
2.46
2.39
2.33
2.28
2.23
2.19
2.16
2.12
2.10
2.07
2.05
2.03
2.01
1.99
1.97
1.96
1.94
1.93
1.84
1.75
1.66
1.57
249
19.5
8.64
5.77
4.53
3.84
3.41
3.12
2.90
2.74
2.61
2.51
2.42
2.35
2.29
2.24
2.19
2.15
2.11
2.08
2.05
2.03
2.01
1.98
1.96
1.95
1.93
1.91
1.90
1.89
1.79
1.70
1.61
1.52
250
19.5
8.62
5.75
4.50
3.81
3.38
3.08
2.86
2.70
2.57
2.47
2.38
2.31
2.25
2.19
2.15
2.11
2.07
2.04
2.01
1.98
1.96
1.94
1.92
1.90
1.88
1.87
1.85
1.84
1.74
1.65
1.55
1.46
251
19.5
8.59
5.72
4.46
3.77
3.34
3.04
2.83
2.66
2.53
2.43
2.34
2.27
2.20
2.15
2.10
2.06
2.03
1.99
1.96
1.94
1.91
1.89
1.87
1.85
1.84
1.82
1.81
1.79
1.69
1.59
1.50
1.39
252
19.5
8.57
5.69
4.43
3.74
3.30
3.01
2.79
2.62
2.49
2.38
2.30
2.22
2.16
2.11
2.06
2.02
1.98
1.95
1.92
1.89
1.86
1.84
1.82
1.80
1.79
1.77
1.75
1.74
1.64
1.53
1.43
1.32
253
19.5
8.55
5.66
4.40
3.70
3.27
2.97
2.75
2.58
2.45
2.34
2.25
2.18
2.11
2.06
2.01
1.97
1.93
1.90
1.87
1.84
1.81
1.79
1.77
1.75
1.73
1.71
1.70
1.68
1.58
1.47
1.35
1.22
254
19.5
8.53
5.63
4.37
3.67
3.23
2.93
2.71
2.54
2.40
2.30
2.21
2.13
2.07
2.01
1.96
1.92
1.88
1.84
1.81
1.78
1.76
1.73
1.71
1.69
1.67
1.65
1.64
1.62
1.51
1.39
1.25
1.00
http://www.edustatspr.com/documentos/mi_lugar_en_el_ciberespacio.htm
Universidad de Sonora
110
Departamento de Matemáticas
Descargar