Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Tema III Distribuciones discretas y continuas En este tema analizaremos dos importantes temas de la inferencia estadística: las distribuciones discretas y las distribuciones continuas. Las distribuciones discretas son aquellas en las que la variable aleatoria puede pude tomar un número determinado de valores. Por ejemplo, el número de trabajadores en cada uno de los departamentos de un centro comercial o el número de automóviles ensamblados por día en la planta Ford de Hermosillo. Las distribuciones continuas son aquellas que la variable aleatoria puede tomar un número infinito de posibles valores. Por ejemplo, el peso promedio de las bolsas de 1 kg de café mexicano para exportación puede tomar una infinidad de valores en un intervalo (0.995kg, 0.996kg., 09965kg., 0.998 kg., 0.9985 kg, …, 1.001 kg, 1.005 kg, 1.010 kg., etc.). Como se mencionó en el tema II, una tabla, gráfico o expresión matemática que dé las probabilidades con que una variable aleatoria toma diferentes valores, se llama distribución de la variable aleatoria. La inferencia estadística se relaciona con las conclusiones que se pueden sacar acerca de una población de observaciones basándose en una muestra de observaciones. Entonces intervienen las probabilidades en el proceso de la selección de la muestra; en este caso se desea saber algo sobre una distribución con base en una muestra aleatoria de esa distribución. De tal manera vemos que trabajamos con muestras aleatorias de una población que es más grande que la muestra obtenida; tal muestra aleatoria aislada no es más que una de muchas muestras diferentes que se habrían podido obtener mediante el proceso de selección. Este concepto es realmente importante en estadística. 3.1. Distribuciones discretas. Muchas cuestiones de probabilidad, de gran importancia para los gerentes, comprenden resultados aleatorios numéricos. Por ejemplo, el número de pasajeros que no hacen uso de una reservación en una línea aérea es de suma importancia al fijar las políticas de la empresa en lo relativo a este aspecto. El número de pasajeros que no se presentan es aleatorio, varía de un vuelo a otro, como de un día a otro en el mismo vuelo. El número de pasajeros que no toman el vuelo es una variable numérica, y hablar del número promedio de pasajeros que no se presentaron tiene un sentido muy claro. El concepto de variable aleatoria es la idea central para entender los resultados numéricos aleatorios. Variables aleatorias discretas. Para definir el concepto de variable aleatoria discreta, nos basaremos en el siguiente problema: Suponga que se lanzan dos dados sobre una mesa y nuestro objetivo es obtener la probabilidad de que la suma de los puntos en los dados sea 11 o 7. Si suponemos que todos los resultados observados al tirar los dados son equiprobables (tienen la misma posibilidad de salir) entonces el espacio de muestra del experimento, con 36 resultados posibles es Universidad de Sonora 73 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. TABLA 3.1 ESPACIO DE MUESTRA DEL LANZAMIENTO DE DOS DADOS. Dado D a d o 1 1 2 3 4 5 6 1 (1, 1) (2, 1) (3, 1) (4, 1) (5, 1) (6, 1) 2 (1, 2) (2, 2) (3, 2) (4, 2) (5, 2) (6, 2) 2 3 (1, 3) (2, 3) (3, 3) (4, 3) (5, 3) (6, 3) 4 (1, 4) (2, 4) (3, 4) (4, 4) (5, 4) (6, 4) 5 (1, 5) (2,5) (3, 5) (4, 5) (5,5) (6, 5) 6 (1, 6) (2, 6) (3, 6) (4, 6) (5, 6) (6, 6) Como nuestro interés es la suma de los puntos observados, si obtenemos el resultado (4 ,3) le asignamos el valor 7, el cual corresponde a la suma de 4 y 3. Podemos calcular la probabilidad de que la suma sea igual a 7 contando todos los resultados donde la suma es 7 y dividiendo este valor entre el número de casos posibles (36). El evento de que la suma es 7 contiene 6 resultados (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) por lo tanto, la probabilidad de obtener la suma de 6 7 es 36 16 . Podemos repetir el proceso para cada uno de los resultados y obtener la tabla siguiente: TABLA 3.2. DISTRIBUCIÓN DE PROBABILIDAD DE LA SUMA OBSERVADA EN EL LANZAMIENTO DE DOS DADOS. Resultado Probabilidad 2 3 4 5 6 7 8 9 10 11 12 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 Hemos encontrado la distribución de probabilidad de los valores posibles de la suma al lazar dos dados si D1 representa el resultado observado en el dado 1 y D2 el resultado que se obtiene en el dado 2, podemos expresar el valor que nos interesa así: X = D1 + D2. Antes de lanzar los dados, no se sabe qué valores se observarán para D1 y D2, por lo tanto tampoco se sabe el valor para X. El valor que X tomará puede variar de tirada en tirada sujeto a la distribución especificada en la tabla 3.2. Así X es una variable, que asume un número finito de valores sujeto a una distribución de probabilidad. Este es un ejemplo de una variable aleatoria discreta. Otros ejemplos son las variables D1 y D2. En general, si S es un espacio de muestra con una medida de probabilidad P, se define una variable aleatoria como una función que asigna un número real a cada uno de los elementos de S. Es decir, X es una función cuyo dominio es el espacio de muestra S y su rango es el conjunto de los números reales , en la notación usual X : S . Así, por ejemplo X = 7 se interpretará como el evento de que se observó el resultado 7 al tirar los dos dados, esto es el evento (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) ocurrió. Por lo tanto, vemos que P(X = 7) = P( (1, 6), (2, 5), (3, 6 16 . Nótese que no obstante de que X es una función, usualmente no se escribe el 4), (4, 3), (5, 2), (6, 1) ) = 36 argumento de la función, es decir, si s es un elemento del espacio de muestra S, en lugar de escribir X(s), sólo escribimos X. Es común denotar las variables aleatorias por letras mayúsculas y los valores que puede tomar por letras minúsculas. En este caso, la variable X puede asumir un valor de entre un conjunto finito de valores posibles. Cualquier variable que pueda tomar un número finito de valores decimos que es una variable aleatoria discreta. También son variables aleatorias discretas aquellas que pueden asumir un número muy grande o infinito de valores que potencialmente podrían ser contados, tal como el número de latas de atún producidas por la empresa Guaymex, el número de clientes que han comprado en las tiendas Mazon desde su apertura, el número de estrellas en el firmamento, el número de hojas en los árboles, el número de granos de arena en Bahía de Kino etc. Universidad de Sonora 74 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Ejercicio 3.1. Dé 6 ejemplos de variables aleatorias discretas. Indique cuáles pueden tomar un número finito de valores distintos y cuáles un número infinito de valores. Ejercicio 3.2. Dé 3 ejemplos de variables aleatorias que no sean discretas. En la tabla 3.2 observamos que a cada valor posible de X, le asignamos un número correspondiente a su probabilidad. De esta forma podemos definir otra función: f ( x ) P( X x ), para cada número x en el campo de valores de la variable X. Esta función se llama función de probabilidad o distribución de probabilidad de la variable X. Para el ejemplo que estamos tratando de la suma en el lanzamiento de dos dados, los valores de esta función están dados en la tabla 3.3, la cual podemos rescribir utilizando los conceptos estudiados. TABLA 3.3. DISTRIBUCIÓN DE PROBABILIDAD DE LA SUMA OBSERVADA EN EL LANZAMIENTO DE DOS DADOS. x f ( x) 2 3 4 5 6 7 8 9 10 11 12 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 Ejercicio 3.3. Examine la tabla 3.3 y usa la definición de f ( x ) para deducir algunas propiedades de esta función. Podemos observar que f ( x ) nunca adquiere un valor menor que cero. Esto se debe a que f ( x ) representa una probabilidad, la cual nunca puede ser negativa. De igual manera f ( x ) nunca puede ser mayor que 1. Si sumamos todos los valores que puede tomar f ( x ) obtenemos 1, debido a que estamos sumando las probabilidades de que la variable aleatoria tome uno de los valores establecidos. Por definición, la función de probabilidad tiene las siguientes características: 1. f ( x ) 0 para todo valor x en el dominio. 2. f ( x ) 1 donde la sumatoria se extiende sobre todos los valores x en el dominio de f. x Ejercicio 3.4. Verifica que la función f ( x ) x es una función de probabilidad para x = 1, 2, 3, 4, 5. Indique su 15 dominio y su campo de valores. Ejercicio 3.5. Considera el lanzamiento de 4 monedas al aire. Defina la variable aleatoria Y como el número de sellos observados. Construya la función de probabilidad de Y. Ejercicio 3.6. Considera el lanzamiento de dos dados al aire. Defina la variable aleatoria X como la diferencia de los puntos observados en los dados. Construya la función de probabilidad de X. Los valores de la función de probabilidad, para el caso “sumar los resultados al lanzar dos dados”, se pueden representar en una gráfica como lo muestra la Figura3.1. Universidad de Sonora 75 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. 0.18 0.16 P( X = x) 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 2 3 4 5 6 7 8 9 10 11 12 Valor observado de la variable x Figura 3.1. Histograma de probabilidad de x. La probabilidad de observar un valor particular de la variable aleatoria, por ejemplo X = 4 está dado por la altura de la 3 barra sobre el 4, es decir P( X 4 ) 36 121 0.083 . De manera similar, en lugar de asociar la altura de la barra con la probabilidad, podemos ver que el área de la barra sobre el 4 es barra es de 3 36 3 36 1 3 36 121 0.083 , ya que la altura de la 121 0.083 y su ancho es 1. Utilizar el área de las barras para representar la probabilidad es muy útil para extender la noción de probabilidad a otras variables. Ejercicio 3.7. Encuentre las siguientes probabilidades: P( X = 11 ), P( X < 5 ), P( X 6 ), P( X 4.5) y P(X = 7.3) para el ejemplo anterior. Podemos usar el histograma de probabilidad para calcular probabilidades tal como P( X 5 ). Vemos que P(X 5 ).= P(X = 2 ó X = 3 ó X = 4 ó X =5) = P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5), ya que los eventos donde X = 2, X = 3, X = 1 4 y X = 5 son disjuntos o ajenos, se tiene que P(X 5 ).= 36 362 363 364 10 36 , que se obtiene sumando las áreas de las barras que están sobre el 5 y a su izquierda. Se debe ser muy cuidadoso con las desigualdades ya que P(X 5 ).= 10 5 6 1 36 18 , mientras que P( X < 5 ) = 36 6 . Si extendemos la idea de probabilidades acumulativas, podemos definir otra función partiendo de la distribución de probabilidad. Si X es una variable aleatoria discreta, definimos la función de distribución de X o función acumulativa de X de la manera siguiente: F(x) = P(X x ) = f ( t ) para x tx Ejercicio 3.8. Calcule la función de distribución acumulativa de la suma de los puntos de dos dados. Ejercicio 3.9. Use las propiedades de la función de probabilidad para encontrar algunas propiedades de la función de distribución acumulativa. La tabla 3.4 presenta la función de distribución acumulativa del resultado observado al tirar dos dados. Universidad de Sonora 76 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. TABLA 3.4. FUNCIÓN DE DISTRIBUCIÓN ACUMULATIVA DEL TOTAL OBSERVADO AL TIRAR DOS DADOS. x F( x ) 2 3 4 5 6 7 8 9 10 11 12 1 36 3 36 6 36 10 36 15 36 21 36 26 36 30 36 33 36 De esa tabla podemos deducir algunas propiedades. Por ejemplo, observamos que que se evalúa la función es mayor, el valor de la función también será mayor. 35 36 36 36 F(4) F(5), es decir si el valor en Ejercicio 3.10. ¿Esta propiedad es siempre cierta? Examine que sucede con x = 5, x = 6 y con x 5.7 . A pesar de que el valor de la función de la distribución acumulativa para x = 5.7 no está incluida entre los valores en la tabla, podemos utilizar la definición para obtenerlo F(x) = P(X x ), así F(5.7) = P(X 5.7 ). Cuando escribimos esta última probabilidad nos preguntamos ¿cuál es la probabilidad de observar que el total de puntos de dos dados es menor o igual que 5.7? Por la naturaleza del experimento, vemos que no es posible observar valores distintos a 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, por esta razón los resultados que pueden observarse y que son menores o iguales a 5.7 son 2, 3, 4, 5, 5 se tiene que, F(5.7) = P(X 5.7) = F(5) = 10 . 36 18 Esto demuestra que la propiedad que habíamos visto antes, en la que establecimos que si a y b son dos números reales con a b entonces F(a) F(b) no siempre es cierta. La que si es cierta es que si tenemos dos números reales a y b, tal que a b entonces F(a) F(b). Por la definición de probabilidad y por esta propiedad, vemos que el valor más grande que puede tener F(x) es 1 y el valor más pequeño de esta función es 0. Hagamos un resumen de las propiedades encontradas. 1. 2. 3. 4. F(-) = 0 F() = 1 Si a y b son números reales a b, entonces F(a) F(b). Esto significa, en el lenguaje matemático, que F es una función no decreciente. F(x) es una función continua por la derecha: si a es un número real, entonces lim F ( x ) F ( a ) . x a Figura 3.2. Gráfica de la función de distribución acumulativa del total de puntos al tirar dos dados. Universidad de Sonora 77 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. La gráfica de F(x) parece una escalera tal y como se muestra en la Figura3.2. Podemos observar la razón por la cual esta gráfica debe ser de esta manera si examinamos los valores de la función de distribución en un intervalo tal como [6, 7]. Vemos que F(6) = 15 si escogemos un número x mayor que 6, pero menor que 7, tenemos que F(x) = 15 . Sin embargo, 36 36 al evaluar la función en x = 7 vemos que F(7) = 21 36 127 , por esta razón la gráfica muestra un salto en ese punto. También podemos notar que el tamaño del salto en x = 6 nos dice la probabilidad de X = 7. Para valores de x entre 6 y 7 21 (sin incluir el 7) tenemos que F(x) = 15 , como habíamos visto y luego F(7) = 36 , así el tamaño del salto en X = 6 es 36 21 36 15 36 16 . Este último valor es la probabilidad de que el total de puntos en dos dados, X sea igual a 7, es decir, P(X = 7) = 6 36 1 . 6 Visto de otra manera, P(X = 7) = P(X 7) P(X 7). Esto es igual a P(X 7) P(X 6) = 21 36 15 36 6 36 16 . En general, el tamaño del salto de la función de distribución en un valor particular, nos da la probabilidad de que la variable aleatoria sea igual a ese valor. Ejercicio 3.11. Utilice la función de distribución para encontrar P(X = 9.8) Valor esperado de variables aleatorias discretas. Sea X f ( x ), entonces el valor esperado de X es una variable aleatoria con función de probabilidad E( X ) x f ( x ). Ilustremos esta fórmula mediante dos ejemplos. x Ejemplo 3.12. Si X es el número de puntos obtenidos al lanzar un dado de seis caras, obtenemos el valor esperado de la variable aleatoria Y X2. La función de probabilidad de X es Y X 2 es entonces f ( y ) 1 6 si f ( x) 1 6 si x 1, 2, 3, 4, 5, 6. La función de probabilidad de y 1, 4, 9, 16, 25, 36, así E( Y ) Px 1 4 Px 2 9 Px 3 16 Px 4 25Px 5 36 Px 6. E( Y ) 1 1 1 4 1 9 1 16 1 25 1 36 6 6 6 6 6 6 2 2 1 P( X 1) 2 P( X 2 ) 3 P( X 3 ) 2 2 2 4 P( X 4 ) 5 P( X 5 ) 6 P( X 6 ) x 2 P( X x ). x Ejemplo 3.11.2 Si X es una variable aleatoria que tiene función de probabilidad x 2, - 1, 0, 1, 2, 3 y Y X 2 . La función de probabilidad de Y es f ( y ) 2 6 si y 1, 4 y f ( x) f ( y) y 0, 9. Entonces E( Y ) 2 1 2 4 1 0 1 9. Esta ecuación la podemos rescribir como: 6 6 6 6 Universidad de Sonora 78 1 6 Departamento de Matemáticas si 1 6 si Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. E( Y ) 2 1 2 4 1 0 1 9. 6 6 6 6 1 P( Y 1) 4 P( Y 4 ) 0 P( Y 0 ) 9 P( Y 1) 2 2 2 2 1 P( X 1 ó X 1) 2 P( X 2 ó X 2 ) 0 P( X 0 ) 3 P( X 3 ). 2 2 2 1 P( X 1 ) ( 1) P( X 1 ) 2 P( X 2 ) (-2 ) 2 P( X 2 ) 2 2 + 0 P( X 0 ) 3 P( X 3 ). x 2 P( X x ). x A través de estos ejemplos, e visualiza que no es necesario calcular la función de probabilidad de Y , sólo se tiene que usar la función de probabilidad de X y los valores obtenidos al aplicar la función Y g( X ) X . Esto es cierto aún en el caso en que la función no es uno a uno. Esto conduce al teorema siguiente cuya prueba se omite. 2 Nota. Todas las demostraciones de los teoremas se omitirán, por no estar dentro de los intereses de este texto. Teorema 3.1. Si X es una v. a. discreta y f ( x ) es su función de linealidad, Y g( X ) es una función a valores reales, es decir, Y es E( Y ) E( g ( x )) g ( x ) f ( x ). una variable aleatoria, entonces su valor esperado es x En particular se puede utilizar este teorema en el caso especial en que la función g ( X ) es lineal, es decir Y g( X ) aX b, donde a, b . Así se obtiene E( Y ) E( aX b ) ( ax b ) P( X x ) ax P( X x ) b P( X x ) x x x a xP( X x ) b P( X x ) aE( X ) b. x x Este resultado nos lleva al siguiente teorema. Teorema 3.2. Si a y b son constantes reales y g( X ) aX b es una función a valores reales, entonces E( aX b ) aE( X ) b. Corolario 3.1. Si a es una constante real, entonces E( aX ) aE( X ). Corolario 3.2. Si b es una constante real, entonces E( b ) b. Teorema 3.3. Si c1 , c2 , , cn son constantes reales, y g1 ( X ), g 2 ( X ), , g n ( X ), son funciones reales de X, entonces n n E ci g i ( X ) ci E( g i ( X )) i 1 i 1 Universidad de Sonora 79 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Existen casos especiales de la función g ( X ) las cuales requieren más atención. En nuestro caso, nos interesa el g( X ) X r para r = 0, 1, 2, 3,... . La expresión E( X r ) se conoce como el r r errésimo momento de X alrededor del origen de la variable aleatoria X. Se tiene que E( X ) x f ( x ). comportamiento de E( g( X )) cuando x El primer momento E( X ) se conoce como la media (poblacional) de la variable aleatoria X y se indica usualmente por la letra griega (se lee mu ), E( X ). Otros momentos nos permiten describir la forma de la distribución de X. El errésimo momento de X alrededor de la media es E ( X ) r ( x ) r f ( x ), para r = 0, 1, 2, ... x El segundo momento alrededor de la media es de gran interés en estadística y se conoce como la varianza (poblacional) de la variable X. La varianza se denota a menudo mediante la letra griega (sigma minúscula) elevada al cuadrado: 2 EX E( X )) 2 E( X ) 2 . Su raíz cuadrada positiva, , se conoce como la desviación estándar (poblacional) de X. Frecuentemente es más fácil calcular la varianza a partir del primer y segundo momento alrededor del origen. Teorema 3.4. Var ( X ) 2 E( X 2 ) E( X ) E X 2 2 . 2 Teorema 3.5. Si X es una variable aleatoria con varianza 2 , entonces Var ( aX b ) a 2 Var ( X ) a 2 2 . La varianza es un valor muy útil para estudiar la distribución de una variable aleatoria. En particular, nos ofrece información sobre la probabilidad de observar valores extremos de X. Esta relación se establece en el siguiente teorema. Teorema 3.6. (Teorema de Chebyshev). Si X es una variable aleatoria con varianza entonces para cualquier constante positiva k, se tiene que P X k 1 2 y media , 1 . k2 3.1.1. Distribuciones discretas más comunes. En el estudio de las variables aleatorias, por lo general nos interesan las probabilidades de que puedan tomar diversos valores posibles, es decir, sus distribuciones de probabilidad, en esta sección se mencionan las más importantes. Universidad de Sonora 80 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Distribución uniforme discreta. La variable aleatoria X tiene una distribución uniforme discreta si su función de probabilidad está dada por 1 f ( x k ) f x para x x1 , x 2 , , x k , ( xi x j , si i j ). Donde, k k E ( X ) xi i 1 1 y 2 k k ( xi ) i 1 2 1 k Las aplicaciones de las variables aleatorias distribuidas uniformemente se encuentran en el desarrollo de las loterías y otras formas de juegos de azar; en la generación de números aleatorios para experimentos de ingeniería o de simulación y en la evaluación de “probabilidades previas” de una persona en relación con el resultado de algún evento futuro para la toma de decisiones. Ejemplo 3.10. La probabilidad de que en el lanzamiento de un dado legal aparezca un 5 es 1 6 y , es la misma que la probabilidad de obtener un 3, o un 7, o un 2, etc. Ejercicio 3.12. El número de productos empaquetados por un trabajador en una hora oscilan entre 10 a 18 unidades y se piensa que están distribuidos uniformemente. ¿Cuál es la probabilidad de que se empaqueten entre 12 y 15 productos en una hora determinada? Distribución Bernoulli A esta distribución también se le conoce como binomial punto. Si una variable aleatoria discreta X sólo tiene dos valores posibles, como sucede por ejemplo en experimentos en los que sólo existen dos resultados posibles, fracaso o éxito, se le asigna 0 a fracaso y 1 a éxito; si le llamamos p a la probabilidad de éxito, la probabilidad de fracaso es 1- p, que generalmente se le llama q, por lo que la densidad de X es: f ( x) q, x0 p, x 1 = 0 de otro modo. Esta función se puede resumir de la manera siguiente: f ( x) p x (1 - p)1 - x para x 0, 1 Cualquier variable aleatoria discreta X, cuya densidad se ajuste a esta patrón, se dirá que se distribuye Bernoulli, con parámetro p, denotándose esto por: X ~ Ber(p) Universidad de Sonora 81 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Ejemplo 3.11.. La probabilidad de que un presunto cliente elegido aleatoriamente realice una compra es 0.20. Por lo tanto, la probabilidad de que el cliente elegido no realice la compra será de 1 – 0.20 = 0.80. Distribución Binomial. La distribución binomial es una distribución de probabilidad discreta, aplicable cada vez que suponga que un proceso de muestreo conforma un proceso de Bernoulli. Un proceso de Bernoulli es un proceso de muestreo en el cual: i) ii) iii) Hay dos resultados posibles mutuamente excluyentes en cada ensayo u observación. Estos resultados obtenidos se denominan éxito y fracaso. La serie de ensayos u observaciones constituyen evento independientes. La probabilidad de éxito, designada por p, permanece constante de ensayo a ensayo. Es decir, el proceso es estacionario En una distribución Binomial, se realizan n repeticiones independientes de un experimento de Bernoulli. La variable X representa el número de éxitos obtenidos en las n repeticiones. Nos preguntamos sobre la probabilidad de obtener x éxitos en las n repeticiones, así, la función de probabilidad es: x nx P( X x ) f ( x k ) C nx p ( 1 p ) , x 1, 2, , n. np y np( 1 p ). 2 Ejemplo 3.12. Suponga que un lote de 300 fusibles eléctricos contiene 5% defectuosos. Determine la probabilidad de que se pueda encontrar al menos un fusible defectuoso en una muestra de cinco fusibles. Solución. Es pertinente suponer que X, número de fusibles defectuosos observados, tenga aproximadamente una distribución binomial debido a que el lote es grande. Así 5 P(al menos uno defectuoso) = 1 p(0) 1 q 5 0 1 0.955 1 0.774 0.226 obsérvese que existe una probabilidad bastante grande de obtener al menos uno defectuoso, aunque la muestra sea relativamente pequeña. Ejercicio 3.13. Muchos jefes se dan cuenta de que algunas personas que contrataron no son lo que pretenden ser. Detectar personas que solicitan un trabajo y que falsifican la información en su solicitud ha generado un nuevo negocio: agencias investigadoras de antecedentes. Una revista nacional, notificó sobre este problema mencionando que una agencia, en un periodo de dos meses, encontró que el 35% de los antecedentes examinados habían sido alterados. Supóngase que usted ha contratado la semana pasada a cinco nuevos empleados y que la probabilidad de que un empleado haya falsificado la información en su solicitud de trabajo es 0.35. ¿Cuál es la probabilidad de que al menos una de las cinco solicitudes haya sido falsificada? Universidad de Sonora 82 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Distribución Geométrica. Se efectúan tantas repeticiones independientes de un experimento de Bernoulli como sean necesarias para obtener el primer éxito. Si la probabilidad de éxito es p, la de fracaso es 1 - p, entonces la función de probabilidad de X, el número de repeticiones hasta observar el primer éxito es: P( X x ) f ( x p ) p( 1 p ) x1 , Su valor esperado es E ( X ) x 1, 2, 3, 1 1 p y su varianza es igual a 2 V (Y ) 2 . p p Una variable aleatoria geométrica no tiene memoria, es decir: P( X n m X n ) P( X m ) : Utilizando la definición de probabilidad condicional obtenemos: P( X n m X n ) P( X n m, X n / P( X n ) P( X n m / P n ). Ahora obtenemos el denominador: n P( X n ) 1 P( X n ) 1 p( 1 p ) x 1 x 1 n 1 1 (1 p ) n 1 p ( 1 p ) x 1 p 1 x 0 p (1 p ) n Así tenemos que P( X n m, X n / P( X n ) P( X n m ) p( 1 p ) n m1 P( X n ) (1 p ) n p( 1 p ) m1 P( X m ). Ejemplo 3.13. Suponga que la probabilidad de que un motor falle durante cualquier periodo de una hora es p 0.02 . a) Encuentre la probabilidad de que dicho motor funcione bien durante 2 horas. b) Halle la media y la desviación estándar de Y. Solución. a) Sea X el número de intervalos de una hora hasta la primera falla, entonces Universidad de Sonora 83 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. P(de funcionar bien por dos horas) = P X 3 px y 3 Como px 1, y 1 P(de funcionar bien por dos horas) = 1 px y 3 = 1 p qp 1 0.02 0.980.02 0.9604 b) Se tiene que la media = E ( X ) 1 1 p y su varianza es igual a 2 V ( X ) 2 . Así que p p 1 50 , esto significa que se tendrá que esperar muchas horas hasta que ocurra la primera falla. Por oto 0.02 1 0.02 lado, 2 V ( X ) 2,450 , entonces la desviación estándar de Y es 2,450 49.497 . 0.022 E( X ) Ejercicio 3.14. Se supone que el 30% de los aspirantes para cierto trabajo industrial tiene un entrenamiento avanzado de programación computacional. Los aspirantes son entrevistados, uno tras otro, y son seleccionados al azar del conjunto de aspirantes. a) b) Determine la probabilidad de que se encuentre el primer aspirante con un entrenamiento avanzado en programación en la quinta entrevista. ¿Cuál es el número esperado de aspirantes que hay que entrevistar para encontrar el primer aspirante con un entrenamiento avanzado en programación? Distribución Binomial Negativa. En esta distribución se hacen tantas repeticiones independientes de un experimento de Bernoulli como sean necesarias para obtener k éxitos. Si la probabilidad de éxito es p, la de fracaso es 1 - p y la función de probabilidad de Y, el número de repeticiones necesarias hasta observar k éxitos es: P( X x) f ( x p, k ) La media de X es E ( X ) Universidad de Sonora C x 1 k 1 p k (1 p) x k , x k , k 1, k 2, k k 1 p y la varianza es 2 V (Y ) . p p2 84 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Ejemplo 3.14. Un estudio geológico indica que un pozo exploratorio, perforado en una región particular, debería manar petróleo con una probabilidad de 0.20. a) b) Encuentre la probabilidad de que el tercer encuentro de petróleo ocurra en el quinto pozo que se perfora. Halle la media y la desviación estándar. Solución. a) Sea Y el número de la prueba en la cual ocurre el tercer descubrimiento de petróleo, suponiendo perforaciones independientes con una probabilidad de 0.2 de encontrar petróleo en cualquier paso. Entonces es razonable suponer que Y tiene una distribución binomial negativa con p 0.2 . Así 4 PY 5 p5 0.23 0.82 0.0307 2 k k 3 k 1 p 15 y la varianza es 2 V (Y ) , se tiene que 2 p 0.2 p p . Esto indica que se espera perforar 15 pozos antes de que emane petróleo de alguno de ellos y 31 0.2 2 12 por lo que 12 3.464 . 0.2 b) Como la media de Y es E (Y ) Ejercicio 3.15. Se aplican análisis a los obreros de una empresa que fabrica material aislante, a fin de detectar la existencia de asbesto en sus pulmones. La fábrica tiene que mandar tres obreros, con indicaciones positivas de asbesto, a un centro médico para realizar más pruebas. Si el 40% de los trabajadores tienen indicaciones positivas de asbesto en los pulmones, Encuentre la probabilidad de que se tengan que examinar a diez operarios para encontrar “tres” positivos. b) Si cada prueba cuesta 200 pesos, obtenga el valor esperado y la varianza del costo total de la realización de las pruebas necesarias para localizar tres empleados “positivos”. a) Distribución hipergeométrica. En esta distribución se tiene una población finita de N elementos de los cuales k son de un tipo (digamos éxitos) y N - k son fracasos. Seleccionamos n elementos sin reemplazo de la población de N. Nos interesa la probabilidad de obtener x éxitos entre los n elementos seleccionados. La función de probabilidad de Y, el número de éxitos obtenidos entre los n elementos seleccionados está dada por: P( X x) f x k N k x n x C C n, N , k ) C N , para x 0, 1, 2, , n; x k , n x N k. n La media de X, o valor esperado es: E ( X ) Universidad de Sonora nk y la varianza de X es N 85 2 nk ( N k )( N n ) . N 2 ( N 1) Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Ejemplo 3.15. Un problema importante que enfrentan los jefes de personal y otras personas encargadas de la selección de los mejores de un conjunto finito de elementos se describe mediante la situación siguiente. Se seleccionan 10 personas para un trabajo de un grupo de 20 ingenieros con doctorado. a) ¿Cuál es la probabilidad de que el grupo de los 10 ingenieros seleccionados incluya a los cinco mejores del grupo de 20? b) Encuentre la media y la varianza para el grupo de los 20 ingenieros. Solución. a) Para este ejemplo N 20, n 10 y k 5 , es decir, hay solamente cinco en el conjunto de los 5 mejores ingenieros y nosotros buscamos la probabilidad de que X 5 , siendo X el número de los mejores entre los 10 seleccionados. Entonces 5 15 5 5 15 10 10 21 P5 0.162 5 10 20 1,292 20 10 b) Dado que la media de Y es E ( X ) E (Y ) 105 2.5 20 nk ( N k )( N n) nk y la varianza 2 , entonces N N 2 ( N 1) esto significa que en el grupo seleccionado de 10 ingenieros, se espera que 2 o 3 de ellos sean de los mejores. Como 2 105(20 5)( 20 10) 7,500 0.9868, 20 2 (20 1) 7,600 entonces 0.9868 0.9934 Ejercicio 3.16. Un producto industrial particular se embarca en lotes de 50. La prueba para determinar si el artículo es defectuoso es costosa y por lo tanto el productor selecciona una muestra de su producción en lugar de usar un plan de inspección al 100%. Un proyecto de muestreo elaborado para minimizar el número de artículos defectuosos surtidos a los consumidores exige un muestreo de 10 artículos de cada lote y el rechazo del lote si se encuentra más de dos artículos defectuosos. (En el caso de ser rechazados el lote, se prueba cada artículo de éste). Si un lote contiene 6 artículos defectuosos, ¿Cuál es la probabilidad de que sea rechazado? ¿Cuál es el número esperado de defectuosos en la muestra de tamaño 10? ¿Cuál es la varianza del número de defectuosos en la muestra de tamaño 10? Distribución de Poisson. En esta distribución se observan eventos a través del tiempo o espacio con las siguientes propiedades; la probabilidad de observar un evento en una unidad de tiempo o espacio t es t para algún 0 . La probabilidad de observar dos o más eventos simultáneamente es muy pequeña. A los procesos que ocurren en un espectro continuo de tiempo y espacio se le denomina proceso de Poisson; es similar al proceso de Bernoulli visto en la sección 3.2.3 excepto que los eventos suceden en un espectro continuo en vez de ocurrir en ensayos u observaciones fijas. Un ejemplo de tal proceso es la llegada de personas a la cola de una ventanilla bancaria. Tal como en el proceso de Bernoulli, se supone que los eventos son independientes y que el proceso es estacionario. Sea X la variable aleatoria que nos dice el número de eventos observados en un intervalo de tiempo o de espacio de longitud t, entonces su función de probabilidad viene dada por: Universidad de Sonora 86 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. f ( x , t) ( t ) x e t , x = 0, 1, 2, ... x! La media de X es E(X) t y su varianza es 2 0 t. En el caso particular cuando el periodo de tiempo y espacio es t 1 (digamos 1 mes, una semana, un metro, un kilómetro, etc) se tiene que f (x ) ( ) x e , x! 0 x = 0, 1, 2, ... La media de X es E(X) y su varianza es 2 . Ejemplo 3.16. El promedio mensual de accidentes en una fábrica resulta ser igual a 3. Durante el mes pasado hubo 6 accidentes. ¿Consideraría este número demasiado alto (muy poco probable si es todavía 3) e indicador de un aumento en la media ? Solución. El número de accidentes X tendría posiblemente una distribución de probabilidad de Poisson con 3 . La probabilidad de que X sea de 6 es P( X 6) x 6 Así, 3x e3 1 P( X 6) 1 x! 5 x 0 3x e3 x! P( X 6) 1 0.0498 0.1498 0.1494 0.2240 0.2240 0.1680 0.1008 1 0.916 0.084 Además, se tiene que 3 , 2 3 y 3 1.73 . Una regla empírica indica que hay que esperar que Y tome valores en el intervalo 2 con una alta probabilidad. Obsérvese que 2 3 21.73 6.46 . El número de accidentes observado X = 6, no se encuentra a más de 2 de , pero está cerca de la frontera. Por lo tanto, el resultado observado no es muy improbable, pero puede tener la suficiente improbabilidad para justificar una investigación. Ejercicio 3.17. En un almacén particular, los clientes llegan al mostrador de caja de acuerdo a una distribución de Poisson con un promedio de 7 por hora. En una hora determinada, ¿Cuál es la probabilidad de que: a) no lleguen más de tres clientes? b) Lleguen al menos dos clientes? c) Lleguen exactamente 5 clientes? Universidad de Sonora 87 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. 3.2. Distribuciones continuas Surgen espacios de muestra continuos siempre que se manejan cantidades que se miden en escala continua (por ejemplo cuando medimos la velocidad de fabricación de un producto, el peso neto de un paquete de comida, la pureza de un producto, la cantidad de alcohol que contiene una bebida o el tiempo de duración de un artículo eléctrico). En casos como éstos existen continuidades de posibilidades y en la práctica lo que realmente interesa son probabilidades asociadas con intervalos o regiones, no números o puntos individuales de un espacio de muestra. Por ejemplo podríamos desear conocer la probabilidad de que un tipo dado de maquinaria empaque entre 500 y 600 productos por hora (no exactamente 550.5) o que un paquete de comida congelada pese más de 750 gramos (no exactamente 800.6 gramos) En esta sección conoceremos las distribuciones de probabilidad de las variables continuas más comunes así como sus funciones de densidad las cuales son modelos teóricos para la distribución de frecuencias de una población de mediciones. Variables aleatorias continuas. El tipo de variable aleatoria que toma cualquier valor en un intervalo se llama variable continua, por ejemplo, el tiempo de producción de un producto en un proceso de ensamblaje y el tiempo de duración de una lavadora. El intervalo sobre el cual se definen estas dos variables es la parte positiva de la línea de los números reales. Esto no significa que al observar suficientes lavadoras, se observaría en algún momento cada número real positivo como al menos un resultado. No obstante, lo importante es que no puede descartarse algún número real como un posible resultado de una observación de la durabilidad de una lavadora. Forma de las distribuciones continuas. La distribución de probabilidad de una variable aleatoria discreta siempre se puede obtener asignando una probabilidad positiva a cada uno de los posibles valores que puede tomar la variable. Naturalmente se tiene que estar seguro de que la suma de las probabilidades asignadas sea siempre igual a 1. Desafortunadamente, la distribución de probabilidad de una variable aleatoria continua no puede establecerse de la misma manera. Es matemáticamente imposible asignar probabilidades diferentes de cero a todos los puntos de un intervalo real y al mismo tiempo satisfacer el requisito de que la suma de probabilidades de los distintos valores posibles tiene que ser 1. Por lo que se debe desarrollar un método diferente para describir la distribución de probabilidad para una variable aleatoria continua. Para obtener una definición formal de una variable aleatoria continua debemos definir primero una función de distribución (o función de distribución acumulativa). Definición 3.1. Sea Y cualquier variable aleatoria. La función de distribución de Y, denotada por F(y) está dada por F(y) = P(Y y), para y . La naturaleza de una función de distribución asociada a una variable aleatoria se utiliza para determinar si la variable aleatoria es continua o discreta. Las funciones de distribución de variables aleatorias discretas siempre son funciones escalonadas, puesto que la función de distribución acumulativa solamente se incrementa en un conjunto numerable de puntos. Universidad de Sonora 88 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Como la función de distribución asociada a cualquier variable aleatoria se define tal que F ( y ) P( Y y ), es claro que en la práctica P( Y ) F ( ) tiene que ser cero. Si se consideran dos valores y1 y 2 , entonces P( Y y1 ) P( Y y 2 ) . Es decir, F ( y1 ) F ( y 2 ) ; esto significa que la función F(y) es una función monótona, no decreciente. Además, es claro que P( Y ) F ( ) 1 . Estas tres características definen las propiedades de cualquier función de distribución. Definición 3.2. Sea Y una variable aleatoria con una función de distribución F(y). Se dice que Y es continua si F(y) es continua, para y . Definición 3.3. Sea F(y) la función de distribución de una variable continua Y. Entonces f ( y ) , dado por f ( y) dF ( y ) F ( y ) dy siempre y cuando exista la derivada, se denomina la función de densidad de probabilidad para la variable aleatoria Y. De las definiciones 3.2 y 3.3 se deduce que F(y) se puede escribir como F( y ) y f ( t )dt en donde f ( y ) es la función de densidad de probabilidad y t se utiliza como la variable para la integración. La representación gráfica de esta relación entre la función de distribución y la función de densidad está dada en la figura 3.3. Como la función F(y) para cualquier variable aleatoria tiene ciertas propiedades , también las funciones de densidad tendrán algunas propiedades correspondientes. Como F(y) es una función no decreciente, la derivada f ( y ) nunca es negativa. Además, se sabe que F ( ) 1 y por esto, que f (t )dt 1 . f ( y) F( y0 ) y0 y Figura 3.3. Universidad de Sonora 89 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Valor esperado de variables aleatorias continuas. En esta sección veremos cómo se calculan las medias, las varianzas y desviaciones estándar de las variables aleatorias continuas y de esta manera la obtención las medidas numéricas descriptivas de sus funciones de densidad. Definición 3.4. El valor esperado de una variable aleatoria continua es E( Y ) yf ( y )dy siempre que exista la integral. La varianza y la desviación estándar podemos encontrarla mediante la relación 2 V ( Y ) E( Y 2 ) E( Y )2 3.2.1. Distribuciones continuas más comunes. Varias distribuciones de probabilidad continua específicas son aplicables a una gran variedad de variables continuas bajo circunstancias designadas. Por lo tanto se han preparado tablas de probabilidad para algunas de estas distribuciones continuas para que el estadístico no se vea involucrado en la integración de áreas bajo curvas de probabilidad. Las distribuciones de probabilidad continua específicas descritas en esta sección son las distribuciones de probabilidad más comunes. Distribución uniforme. Sea y una variable aleatoria continua cuya densidad sea una constante dentro de un intervalo (a, b) (no importa si es abierto o cerrado), entonces su función densidad será: f ( y) 1 , ba a yb = 0 de otra manera Así, cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye uniforme, con parámetros a y b , denotándose esto: Y ~ U ( a, b ) . La media y la varianza vienen dadas por las fórmulas Media Universidad de Sonora ab 2 y Varianza 90 a b 2 12 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Ejercicio 3.18. Investigue cómo son las gráficas de las distribuciones de probabilidad uniformes de una variable aleatoria continua Ejemplo 3.17: el precio medio del kilo de aguacate durante el próximo año se estima que puede oscilar entre 10 y 15 pesos . Podría ser, por tanto, de 11 pesos., o de 12.5 pesos., o de 12.56 pesos., o de 12.95 pesos, etc. Hay infinitas posibilidades, todas ellas con la misma probabilidad. Solución. Su función de densidad, nos permite conocer la probabilidad que tiene cada punto del intervalo, en el ejemplo, b : es el extremo superior del intervalo, 15 pesos; a :es el extremo inferior del intervalo, 10 pesos. Por lo tanto, la función de distribución es: f ( y) 1 0.20 15 10 Es decir, que el valor final esté entre 10 pesos. y 11 pesos. tiene un 20% de probabilidad, que esté entre 11 y 12, otro 20%, etc. El valor medio de esta distribución se calcula: E( y ) ab 2 En el ejemplo: E( y ) 15 10 12.5 2 Por lo tanto, el precio medio esperado del aguacate para el próximo año es de 12.5 pesos. Ejercicio 3.19. El volumen de precipitaciones estimado para el próximo año en la ciudad de Hermosillo va a oscilar entre 40 y 50 litros por metro cuadrado. Calcular la función de distribución y la precipitación media esperada: Distribución normal. Sea y una variable aleatoria continua con densidad: f ( y) ( y ) , 1 exp 2 1 2 2 2 y . Así, cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye normal, con parámetros y 2 , denotándose esto: Y ~ N( , 2 ). La distribución normal es muy importante en la investigación, por eso conviene mencionar sus características: Universidad de Sonora 91 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. 1. 2. 3. 4. 5. 6. 7. Tiene forma de campana Es simétrica con respecto a la media La media, la moda y la mediana coinciden La p( - < y < + ) = 0.6826 La p( - 2 < y < + 2 ) = 0.9544 La p( - 3 < y < + 3 ) = 0.9974 Fue desarrollada por Carl F.Gauss Distribución normal estándar. Sea y una variable aleatoria continua tal que Y ~ N( , 2 ) y sea Z= (X - ) , entonces: Z ~ N(0 , 1) De lo anterior deducimos que Z es un caso particular de la Distribución Normal. Nota: Cualquier variable que siga la distribución normal se puede transformar a una Z; dada esta cualidad, esto ha traído como resultado que se pueden efectuar comparaciones entre variables normales, aunque tengan distintos parámetros. La Tabla I trae la integral a la derecha para cualquier valor de Z positivo (los negativos se evitan, por la simetría, ya que la media de la distribución es cero). Ejemplo 3.19. Sea Z una variable aleatoria normal con media 0 y desviación estándar 1. Determinar a) P( Z 2 ). b) c) P( 2 Z 2 ). P( 0 Z 1.73 ). Solución. a) Se procede hacia abajo en la primera columna (z) en la Tabla I, y se lee el área frente al valor z = 2.0. Esta área, denotada por el símbolo A(z), es A(z = 2.0) = 0.0228. Entonces P( Z 2 ) 0.0228 b) En la parte a) se determinó que A1 = A(Z =2.0) = 0.0228. Como la función de densidad es simétrica con respecto a la media, 0, tenemos que A2 = A1 = 0.0228 y se tiene entonces que P( 2 Z 2 ) 1 A1 A2 1 20.0228 0.9544 c) Obsérvese que P( 0 Z 1.73 ) 0.5 A1.73 en donde A(1.73) se obtiene al proceder hacia abajo en la columna z de la Tabla I hasta la hilera "1.7" y después se va a la parte superior de la tabla hasta la columna marcada "0.03", en donde se lee A(1.73) = 0.0418. Entonces P(0 Z 1.73) 0.5 0.0418 0.4582 Universidad de Sonora 92 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Ejemplo 3.20. Los resultados de un examen de admisión en un colegio de bachilleres de la localidad tiene una distribución normal con media 75 y desviación estándar 10. ¿Qué fracción de resultados queda entre 80 y 90? Solución. z representa la distancia de la media de una distribución normal expresada en unidades de la desviación estándar. Así, z (y - ) Entonces la fracción buscada de la población está dada por el área entre (80 - 75 ) 0.5 10 z y z (90 - 75 ) 1.5 10 Se tiene que A A0.5 A1.5 0.3085 0.0668 0.2417 Ejercicio 3.21.1. Utilice la Tabla I para encontrar las probabilidades siguientes para una variable aleatoria normal estándar Z. a) b) c) d) e) P0 Z 1.2 P0.9 Z 0 P0.3 Z 1.56 P0.2 Z 0.2 P1.56 Z 0.2 Ejercicio 3.21.2. Se observó durante un largo periodo que la cantidad semanal gastada en el mantenimiento y en las reparaciones en cierta fabrica tiene aproximadamente una distribución normal con una media de 4 mil pesos y una desviación estándar de 200 pesos. Si el presupuesto para la próxima semana es de 4 mil 500 pesos, a) ¿Cuál es la probabilidad de que los costos reales sean mayores que la cantidad presupuestada? b) ¿De cuánto tendría que ser el presupuesto para reparaciones semanales y mantenimiento, para que la cantidad presupuestada solamente se rebasara con una probabilidad de 0.1? Distribución lognormal. Sea Y una variable aleatoria continua, se dice que la variable tiene una distribución log-normal si X lnY tiene una distribución normal. (el símbolo ln indica logaritmo natural.). En este caso Y no debe ser negativo. La ecuación de la función de densidad lognormal es f ( y) Universidad de Sonora 1 e (ln y ) 2 2 2 , y0 y 2 0 en cualquier otro punto 93 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Así, cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye logaritmo normal o simplemente lognormal, con parámetros y , denotándose: Y ~ LN ( , ) . Ya que ln(Y ) es una función monótona de y, PY y PlnY ln y PX ln y En donde X tiene una distribución normal con media y varianza 2 La distribución lognormal se usa con frecuencia en las ciencias biológicas y físicas como modelo de magnitudes, de volumen de peso, de diversas cantidades, tales como partículas de carbón molido, cultivos, colonias de bacterias y animales individuales. Ejercicio 3.22. Si Y tiene distribución log-normal con 4 y 2 a) PY 4 y 1, , encuentre, b) PY 8 Distribución gamma. Sea y una variable aleatoria continua con densidad: 1 y 1 f ( y) y e ( ) 0 y , , 0 = 0 en cualquier otro punto. en donde 0 y 1e y dy . La cantidad se conoce como la función gamma. La integración directa da que 1 1 . La integración por partes indica 1 1 para cualquier 1 y que n n 1! , para un número entero n. Si no es un número entero, es imposible encontrar la antiderivada del integrando de la expresión d c 1 1 y y e dy ( ) 0cd y por lo tanto es imposible encontrar las áreas bajo la función de densidad tipo gamma mediante la integración directa. Para estos casos, se hace una aproximación mediante las sumas de probabilidades de Poisson . Cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye gamma, con parámetros y , denotándose esto: y ~ G ( , ). La media y la varianza vienen dadas por las fórmulas: Media y Varianza 2 Universidad de Sonora 94 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. La función de densidad Gamma para el caso especial 1 se denomina función de densidad exponencial y en muchas ocasiones es útil en los modelos de duración de componentes eléctricos. Ejercicio 3.23. Investigue cómo son las graficas de las Distribuciones Gamma para distintos valores de y . Ejemplo 3.21. Los ingresos anuales de los jefes de familia en cierta sección de la ciudad de Hermosillo tienen aproximadamente una distribución gamma con 1 000 y 5 . Determine la media y la varianza de estos ingresos. ¿Esperaría encontrar muchos ingresos superiores a $ 8,000 en esta área de la ciudad? Solución. La media de los ingresos es 1,0005 $5,000, mientras que la varianza es 2 1,00052 = $25,000. De la varianza se obtiene la desviación estándar igual a $158.11 por lo que la respuesta a la pregunta es no, es decir, la probabilidad de encontrar ingresos superiores a 8 mil pesos en esta sección de Hermosillo es prácticamente nula. Ejercicio.3.24. El tiempo semanal Y (en horas) durante el que cierta máquina industrial no funciona, tiene aproximadamente una distribución gamma con 3 y 2 . La pérdida, en pesos para la operación industrial debido a esta baja, está dada por L 300Y 20Y 2 . Calcule el valor esperado y la varianza de L. Distribución Beta. Sea X una variable aleatoria continua con densidad 1 1 f ( y) y 1 y 0 y 1 = 0 en cualquier otro punto.. Cualquier variable aleatoria continua y, cuya densidad se ajusta a este patrón, se dirá que se distribuye beta, con parámetros y , denotándose esto: y ~ B (, ) NOTA: Si y ~ B(1, 1) se puede demostrar que y ~ U (0,1). La media y la varianza para esta distribución vienen dadas por las fórmulas E( Y ) y 2 V(Y ) 1 2 . Ejercicio 3.25. Investigue cómo son las graficas de las Distribuciones Beta. Universidad de Sonora 95 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Ejemplo 3.22. Un distribuidor mayorista de gasolina dispone de tanques de almacenaje que contienen una cantidad fija de gasolina y que llenan cada lunes. La proporción de esta reserva que se vende durante la semana es de sumo interés para el distribuidor. Mediante observaciones durante muchas semanas se encontró que se podría representar el modelo de esta proporción mediante una distribución beta con 4 y 2 . Encontrar la probabilidad de que el mayorista venda al menos 90% de su reserva durante una semana dada. Solución. Sea Y la proporción vendida durante la semana, entonces 4 2 3 f ( y) y 1 y 4 2 0 y 1 = 0 en cualquier otro punto. Y así, P( Y 0.9 ) 1 f ( y )dy 0.9 4 y5 1 y 1 20 y 3 y 4 dy 20 20(.004 ) .08 0.9 0 . 9 0 . 9 4 5 1 Este resultado indica que no es muy probable que como mínimo se venda el 90% de la reserva en una semana dada. Ejercicio 3.26. Durante un turno de 8 horas, la proporción, Y, del tiempo que una máquina de estampado en lámina metálica no está funcionando por mantenimiento o reparación, tiene una distribución beta con 1 y 2 . Es decir, 2(1 y ), f ( y) 0, 0 y 1, en cualquier otro punto. El costo (en miles de pesos) por tiempo de inactividad, debido a producción perdida y costos de mantenimiento y de separación, esta dado por C 1,000 2,000Y 40Y 2 Halle la media y la varianza de C. Distribución t de Student. Si T Z Y v , donde Y ~ 2 ( v ) entonces la densidad de y será: Universidad de Sonora 96 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. v 1 2 f y y2 2v 1 v v 1 2 Se ha demostrado que si se tiene una variable normal, y se toma una muestra de tamaño v + 1, se calcula la media de la muestra y la S2 (varianza de la muestra), entonces: y / 1 y s / 1 s2 2 tendrá una densidad como la anterior, con v grados de libertad. Así, cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye t, con v grados de libertad, es decir, con parámetro v, denotándose esto: Y ~ t(v) La Tabla II trae los valores de y para algunos valores usuales de y f ( y )dy para algunos valores de . , Ejercicio 3.27. Investigue cómo son las graficas de las Distribuciones t de Student para distintos gados de libertad. Ejemplo 3.23. La resistencia a la tensión para cierto tipo de alambre de púas se distribuye normalmente con una media desconocida y una varianza desconocida 2 . Se seleccionaron al azar 6 segmentos de alambre de un rollo grande y se midió Yi , la resistencia a la tensión para el segmento i, en donde i = 1, 2, ..., 6. La media de la población y la varianza 2 se pueden estimar por Y y S 2 , respectivamente. Ya que Y2 Obtenga la probabilidad aproximada de que Y esté a lo más a 2S n 2 n , Y2 puede ser estimada por S2 . n de la verdadera media poblacional . Solución. Se desea encontrar 2S Y 2S 2 P Y P 2 n n n S P2 T 2 en donde T tiene una distribución t con n - 1 = 5 grados de libertad en este caso. Observando la tabla II, vemos que el área a la derecha de 2.015 es 0.05. Por lo tanto, Universidad de Sonora 97 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. P 2.015 T 2.015 0.90 y la probabilidad de que Y esté dentro de dos desviaciones estándar estimadas de será un poco menor que 0.90. Obsérvese que si se conociera 2 la probabilidad de que Y tome un valor que difiera a lo más en 2 Y de estará dada por 2 Y 2 P Y P 2 n n n 2 P2 Z 2 0.9544 Distribución 2 (Ji cuadrada). , 2), en donde es un entero positivo, entonces se dice que se distribuye ji 2 cuadrada con grados de libertad, denotándose esto: Y ~ 2 ( ) La densidad para este tipo de variables viene dada por Si una variable aleatoria continua Y ~ G( la función: f(2 ) (2 ) ( 2 ) 1 e 2 2 2 2 2 0 2 La Tabla III trae los valores de y para algunos valores usuales de 2 y varios valores de . La distribución 2 desempeña un papel importante cuando se desea hacer una inferencia con respecto a la varianza 2 de la población basada en una muestra aleatoria Y1 , Y2 , Yn tomada de una población normal. esto se analizará a su tiempo. Un buen estimador de 2 es la varianza de la muestra S2 1 n 1 n Y i Y 2 i 1 El teorema siguiente nos da la distribución de probabilidad para una función del estadístico S2. Teorema 3.1. Sea Y1 , Y2 , Yn una muestra elegida al azar de una variable aleatoria que sigue una distribución normal con media y varianza 2 . Entonces ~ Y Y 2 n 12S 2 i 1 Universidad de Sonora n 2 i 1 98 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. tiene una distribución 2 con n 1 grados de libertad. Y y S 2 son variables aleatorias independientes. Teorema 3.2 (Cochran). Sea X 1 , X 2 , X n ~ N X i 1 n X i X 2 i 1 2 2 2 1 n X ~ N i , n n i 1 n X y , variables aleatorias independientes. Entonces X X 2 i 2 ~ n21 son variables aleatorias independientes. Ejercicio 3.28. Investigue cómo son las graficas de las Distribuciones 2 para distintos grados de libertad. Ejemplo 3.24. Una máquina embotelladora de refrescos puede regularse de tal manera que llene un promedio de onzas por botella. Se ha observado que las onzas del contenido que vacía la máquina embotelladora tiene una distribución normal con 2 1 . Supóngase que se desea obtener una muestra aleatoria de 10 botellas y medir el contenido en cada botella. Si se utilizan estas 10 observaciones para calcular S 2 , podría ser útil especificar un intervalo de valores que incluyeran a S 2 con una alta probabilidad. Encontrar los números b1 y b2 tales que P b1 S 2 b2 0.90 Solución. Observemos que n 1 b1 n 1 S 2 n 1 b2 P b1 S 2 b2 P 2 2 2 Ya que 2 1 , en consecuencia n 1S 2 2 n 1 S 2 tiene una distribución 2 con ( n 1) grados de libertad. Podemos utilizar la tabla III para encontrar los números a1 y a 2 tales que P a1 n 1 S 2 a 2 0.90 un método para hacerlo es encontrar el valor a2 que limita un área de 0.05 de la cola derecha y un valor a1 que limita un área de 0.05 de la cola izquierda (0.95 de área a la derecha). Ya que hay 9 grados de libertad, la tabla III nos da a 2 16.919 y a1 3.325 . Así debemos tener Universidad de Sonora 99 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. a1 n 1b1 n 1b a2 n 1b2 n 1b 9b 2 2 2 1 2 9b1 O sea b1 3.325 0.369 9 b2 y 16.919 1.880 9 De donde se deduce que sise desea tener un intervalo que incluya a S2 con una probabilidad de 0.90, uno de tales intervalos es (0.369, 1.880). Obsérvese que este intervalo es demasiado grande. Distribución F de Fisher. U Sea X m , siendo U y V dos variables ji cuadrada con m y n grados de libertad, respectivamente. Entonces la V n densidad de X será: m f x m n m 2 x 2 n m2 2 m n 1 mx 2 2 n m n 2 , x0 = 0, de otra manera. Así, cualquier variable aleatoria continua X, cuya densidad se ajuste a este patrón, se dirá que se distribuye F, con parámetros m y n (con m y n grados de libertad) denotándose esto: X~ F(m, n). La función de densidad para variables aleatorias con la distribución F es un miembro de la familia de las distribuciones beta y es muy utilizada en las pruebas de Análisis de Varianza (ANDEVA). Ejercicio 3.29. Investigue cómo es la grafica de la Distribución F de Fisher para cualesquiera grados de libertad m y n. Considerando nuevamente las muestras aleatorias independientes de distribuciones normales, sabemos que Universidad de Sonora 100 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. m 1S12 S12 U m 1 12 12 m X V n 1S 22 S 22 n n 1 22 22 tiene una distribución F con m 1 grados de libertad del numerador y n 1 grados de libertad del denominador. Ejemplo 3.25. Si tomamos dos muestras independientes de tamaño n1 6 y n2 10 de dos poblaciones normales con la misma varianza poblacional, encuentre el número b tal que S2 P 12 b 0.95 S2 Solución. Como n1 6, n2 10 y las varianzas poblacionales son iguales, entonces S12 12 S 22 S12 S 22 22 tiene una distribución F con n n1 1 5 grados de libertad del numerador y m n2 1 9 grados de libertad del denominador. También S2 S2 P 12 b 1 P 12 b S2 S2 Por lo tanto, se desea encontrar el número b que limita un área a la derecha de 0.05 bajo la función de densidad F con 5 grados de libertad del numerador y 9 grados de libertad del denominador. Al buscar en la columna 5 y el renglón 9 en la Tabla IV, vemos que el valor apropiado para b es 3.48. Obsérvese que aún cuando las varianzas poblacionales son iguales, la probabilidad de que la razón de las varianzas de las muestras exceda a 3.48 es aún de 0.05 (suponiendo tamaños de muestras de n1 6, n2 10 ). Si Y es una variable aleatoria que tiene una distribución F con n1 grados de libertad del numerador y n2 grados de 1 libertad del denominador, U tendrá una distribución F con n2 grados de libertad del numerador y n1 grados de Y U U 1 libertad del denominador. Además, P 1 k P 2 . Use estos hechos para resolver el Ejercicio 3.30 . U2 U1 k Ejercicio 3.30. Sea S12 la varianza de la muestra de una muestra aleatoria de 10 valores de ln(CL50) para cobre y sea S 22 la varianza de la muestra de una muestra aleatoria de 8 valores de ln(CL50) para plomo, habiendo utilizado en ambas muestras la misma especie de peces. Supóngase que la varianza poblacional para las mediciones con respecto al Universidad de Sonora 101 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. cobre es el doble de la varianza poblacional correspondiente para las mediciones con respecto al plomo. Encuentre dos números a y b tales que S2 P a 12 b 0.90 S2 suponiendo que S12 y S 22 son independientes. Universidad de Sonora 102 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Tabla I. Area bajo la densidad de la distribución normal estándar a la izquierda de Z. PZ z Z ~ N(0,1) z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 Universidad de Sonora 103 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Tabla II. Valores críticos para la distribución t de Student. alfa = área a la derecha de t (df, alfa) T~t(df) P(T > t(df,alfa)) grados de libertad alfa 0.1000 0.0500 0.0250 0.0100 0.0050 0.0010 0.0005 1 3.078 6.314 12.706 31.821 63.656 318.289 636.578 2 1.886 2.920 4.303 6.965 9.925 22.328 31.600 3 1.638 2.353 3.182 4.541 5.841 10.214 12.924 4 1.533 2.132 2.776 3.747 4.604 7.173 8.610 5 1.476 2.015 2.571 3.365 4.032 5.894 6.869 6 1.440 1.943 2.447 3.143 3.707 5.208 5.959 7 1.415 1.895 2.365 2.998 3.499 4.785 5.408 8 1.397 1.860 2.306 2.896 3.355 4.501 5.041 9 1.383 1.833 2.262 2.821 3.250 4.297 4.781 10 1.372 1.812 2.228 2.764 3.169 4.144 4.587 11 1.363 1.796 2.201 2.718 3.106 4.025 4.437 12 1.356 1.782 2.179 2.681 3.055 3.930 4.318 13 1.350 1.771 2.160 2.650 3.012 3.852 4.221 14 1.345 1.761 2.145 2.624 2.977 3.787 4.140 15 1.341 1.753 2.131 2.602 2.947 3.733 4.073 16 1.337 1.746 2.120 2.583 2.921 3.686 4.015 17 1.333 1.740 2.110 2.567 2.898 3.646 3.965 18 1.330 1.734 2.101 2.552 2.878 3.610 3.922 19 1.328 1.729 2.093 2.539 2.861 3.579 3.883 20 1.325 1.725 2.086 2.528 2.845 3.552 3.850 21 1.323 1.721 2.080 2.518 2.831 3.527 3.819 22 1.321 1.717 2.074 2.508 2.819 3.505 3.792 23 1.319 1.714 2.069 2.500 2.807 3.485 3.768 24 1.318 1.711 2.064 2.492 2.797 3.467 3.745 25 1.316 1.708 2.060 2.485 2.787 3.450 3.725 26 1.315 1.706 2.056 2.479 2.779 3.435 3.707 27 1.314 1.703 2.052 2.473 2.771 3.421 3.689 28 1.313 1.701 2.048 2.467 2.763 3.408 3.674 29 1.311 1.699 2.045 2.462 2.756 3.396 3.660 30 1.310 1.697 2.042 2.457 2.750 3.385 3.646 31 1.309 1.696 2.040 2.453 2.744 3.375 3.633 32 1.309 1.694 2.037 2.449 2.738 3.365 3.622 Universidad de Sonora 104 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Tabla II. Valores críticos para la distribución t de Student. alfa = área a la derecha de t (df, alfa) T~t(df) P(T > t(df,alfa)) grados de libertad alfa 0.1000 0.0500 0.0250 0.0100 0.0050 0.0010 0.0005 33 1.308 1.692 2.035 2.445 2.733 3.356 3.611 34 1.307 1.691 2.032 2.441 2.728 3.348 3.601 35 1.306 1.690 2.030 2.438 2.724 3.340 3.591 36 1.306 1.688 2.028 2.434 2.719 3.333 3.582 37 1.305 1.687 2.026 2.431 2.715 3.326 3.574 38 1.304 1.686 2.024 2.429 2.712 3.319 3.566 39 1.304 1.685 2.023 2.426 2.708 3.313 3.558 40 1.303 1.684 2.021 2.423 2.704 3.307 3.551 60 1.296 1.671 2.000 2.390 2.660 3.232 3.460 120 1.289 1.658 1.980 2.358 2.617 3.160 3.373 inf 1.282 1.645 1.960 2.327 2.576 3.091 3.291 Universidad de Sonora 105 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Tabla III. Valores críticos para la distribución Ji Cuadrado alfa = área a la izquierda de 2 (df, alfa) X ~ 2 (df) Universidad de Sonora P(X > 2 (df.alfa)) grados de libertad alfa 0.100 0.050 0.025 0.010 0.005 1 2.7055 3.8415 5.0239 6.6349 7.8794 2 4.6052 5.9915 7.3778 9.2104 10.5965 3 6.2514 7.8147 9.3484 11.3449 12.8381 4 7.7794 9.4877 11.1433 13.2767 14.8602 5 9.2363 11.0705 12.8325 15.0863 16.7496 6 10.6446 12.5916 14.4494 16.8119 18.5475 7 12.0170 14.0671 16.0128 18.4753 20.2777 8 13.3616 15.5073 17.5345 20.0902 21.9549 9 14.6837 16.9190 19.0228 21.6660 23.5893 10 15.9872 18.3070 20.4832 23.2093 25.1881 11 17.2750 19.6752 21.9200 24.7250 26.7569 12 18.5493 21.0261 23.3367 26.2170 28.2997 13 19.8119 22.3620 24.7356 27.6882 29.8193 14 21.0641 23.6848 26.1189 29.1412 31.3194 15 22.3071 24.9958 27.4884 30.5780 32.8015 16 23.5418 26.2962 28.8453 31.9999 34.2671 17 24.7690 27.5871 30.1910 33.4087 35.7184 18 25.9894 28.8693 31.5264 34.8052 37.1564 19 27.2036 30.1435 32.8523 36.1908 38.5821 20 28.4120 31.4104 34.1696 37.5663 39.9969 21 29.6151 32.6706 35.4789 38.9322 41.4009 22 30.8133 33.9245 36.7807 40.2894 42.7957 23 32.0069 35.1725 38.0756 41.6383 44.1814 24 33.1962 36.4150 39.3641 42.9798 45.5584 25 34.3816 37.6525 40.6465 44.3140 46.9280 26 35.5632 38.8851 41.9231 45.6416 48.2898 27 36.7412 40.1133 43.1945 46.9628 49.6450 28 37.9159 41.3372 44.4608 48.2782 50.9936 29 39.0875 42.5569 45.7223 49.5878 52.3355 30 40.2560 43.7730 46.9792 50.8922 53.6719 31 41.4217 44.9853 48.2319 52.1914 55.0025 32 42.5847 46.1942 49.4804 53.4857 56.3280 33 43.7452 47.3999 50.7251 54.7754 57.6483 34 44.9032 48.6024 51.9660 56.0609 58.9637 35 46.0588 49.8018 53.2033 57.3420 60.2746 106 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Tabla III. Valores críticos para la distribución Ji Cuadrado alfa = área a la izquierda de 2 (df, alfa) X ~ 2 (df) Universidad de Sonora P(X > 2 (df.alfa)) grados de libertad alfa 0.100 0.050 0.025 0.010 0.005 36 47.2122 50.9985 54.4373 58.6192 61.5811 37 48.3634 52.1923 55.6680 59.8926 62.8832 38 49.5126 53.3835 56.8955 61.1620 64.1812 39 50.6598 54.5722 58.1201 62.4281 65.4753 40 51.8050 55.7585 59.3417 63.6908 66.7660 50 63.1671 67.5048 71.4202 76.1538 79.4898 60 74.3970 79.0820 83.2977 88.3794 91.9518 70 85.5270 90.5313 95.0231 100.4251 104.2148 80 96.5782 101.8795 106.6285 112.3288 116.3209 90 107.5650 113.1452 118.1359 124.1162 128.2987 100 118.4980 124.3421 129.5613 135.8069 140.1697 150 172.5812 179.5806 185.8004 193.2075 198.3599 200 226.0210 233.9942 241.0578 249.4452 255.2638 300 331.7885 341.3951 349.8745 359.9064 366.8439 400 436.6490 447.6324 457.3056 468.7244 476.6068 500 540.9303 553.1269 563.8514 576.4931 585.2060 107 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Tabla III. Valores críticos para la distribución Ji Cuadrado alfa = área a la derecha de 2 (df, alfa) X ~ 2 (df) Universidad de Sonora P(X > 2 (df, alfa)) grados de libertad alfa 0.995 0.990 0.975 0.950 0.900 1 0.0000 0.0002 0.0010 0.0039 0.0158 2 0.0100 0.0201 0.0506 0.1026 0.2107 3 0.0717 0.1148 0.2158 0.3518 0.5844 4 0.2070 0.2971 0.4844 0.7107 1.0636 5 0.4118 0.5543 0.8312 1.1455 1.6103 6 0.6757 0.8721 1.2373 1.6354 2.2041 7 0.9893 1.2390 1.6899 2.1673 2.8331 8 1.3444 1.6465 2.1797 2.7326 3.4895 9 1.7349 2.0879 2.7004 3.3251 4.1682 10 2.1558 2.5582 3.2470 3.9403 4.8652 11 2.6032 3.0535 3.8157 4.5748 5.5778 12 3.0738 3.5706 4.4038 5.2260 6.3038 13 3.5650 4.1069 5.0087 5.8919 7.0415 14 4.0747 4.6604 5.6287 6.5706 7.7895 15 4.6009 5.2294 6.2621 7.2609 8.5468 16 5.1422 5.8122 6.9077 7.9616 9.3122 17 5.6973 6.4077 7.5642 8.6718 10.0852 18 6.2648 7.0149 8.2307 9.3904 10.8649 19 6.8439 7.6327 8.9065 10.1170 11.6509 20 7.4338 8.2604 9.5908 10.8508 12.4426 21 8.0336 8.8972 10.2829 11.5913 13.2396 22 8.6427 9.5425 10.9823 12.3380 14.0415 23 9.2604 10.1957 11.6885 13.0905 14.8480 24 9.8862 10.8563 12.4011 13.8484 15.6587 25 10.5196 11.5240 13.1197 14.6114 16.4734 26 11.1602 12.1982 13.8439 15.3792 17.2919 27 11.8077 12.8785 14.5734 16.1514 18.1139 28 12.4613 13.5647 15.3079 16.9279 18.9392 29 13.1211 14.2564 16.0471 17.7084 19.7677 30 13.7867 14.9535 16.7908 18.4927 20.5992 31 14.4577 15.6555 17.5387 19.2806 21.4336 32 15.1340 16.3622 18.2908 20.0719 22.2706 33 15.8152 17.0735 19.0467 20.8665 23.1102 34 16.5013 17.7891 19.8062 21.6643 23.9522 35 17.1917 18.5089 20.5694 22.4650 24.7966 108 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Tabla III. Valores críticos para la distribución Ji Cuadrado alfa = área a la derecha de 2 (df, alfa) X ~ 2 (df) Universidad de Sonora P(X > 2 (df, alfa)) grados de libertad alfa 0.995 0.990 0.975 0.950 0.900 36 17.8868 19.2326 21.3359 23.2686 25.6433 37 18.5859 19.9603 22.1056 24.0749 26.4921 38 19.2888 20.6914 22.8785 24.8839 27.3430 39 19.9958 21.4261 23.6543 25.6954 28.1958 40 20.7066 22.1642 24.4331 26.5093 29.0505 50 27.9908 29.7067 32.3574 34.7642 37.6886 60 35.5344 37.4848 40.4817 43.1880 46.4589 70 43.2753 45.4417 48.7575 51.7393 55.3289 80 51.1719 53.5400 57.1532 60.3915 64.2778 90 59.1963 61.7540 65.6466 69.1260 73.2911 100 67.3275 70.0650 74.2219 77.9294 82.3581 150 109.1423 112.6676 117.9846 122.6918 128.2750 200 152.2408 156.4321 162.7280 168.2785 174.8353 300 240.6631 245.9727 253.9122 260.8781 269.0679 400 330.9029 337.1552 346.4817 354.6410 364.2074 500 422.3034 429.3874 439.9360 449.1467 459.9261 109 Departamento de Matemáticas Notas de Estadística Aplicada a la Administración, Contaduría, Informática Administrativa I y Negocios y Comercio Internacionales. Dr. Francisco Javier Tapia Moreno. Marzo de 2011. Tabla IV: Valores percentiles en 95avos (niveles de 0.05), F0.95, m , n , para la distribución F. 1 m grados de libertad en el numerador n grados de libertad en el denominador 0.95 0.05 F0.95 m n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 161 18.5 10.1 7.71 6.61 5.99 5.59 5.32 5.12 4.96 4.84 4.75 4.67 4.60 4.54 4.49 4.45 4.41 4.38 4.35 4.32 4.30 4.28 4.26 4.24 4.23 4.21 4.20 4.18 4.17 4.08 4.00 3.92 3.84 200 19.0 9.55 6.94 5.79 5.14 4.74 4.46 4.26 4.10 3.98 3.89 3.81 3.74 3.68 3.63 3.59 3.55 3.52 3.49 3.47 3.44 3.42 3.40 3.39 3.37 3.35 3.34 3.33 3.32 3.23 3.15 3.07 3.00 216 19.2 9.28 6.59 5.41 4.75 4.35 4.07 3.86 3.71 3.59 3.49 3.41 3.34 3.29 3.24 3.20 3.16 3.13 3.10 3.07 3.05 3.03 3.01 2.99 2.98 2.96 2.95 2.93 2.62 2.84 2.76 2.68 2.60 225 19.2 9.12 6.39 5.19 4.53 4.12 3.84 3.63 3.48 3.36 3.26 3.18 3.11 3.06 3.01 2.96 2.93 2.90 2.87 2.84 2.82 2.80 2.78 2.76 2.74 2.73 2.71 2.70 2.69 2.61 2.53 2.45 2.37 230 19.3 9.01 6.26 5.05 4.39 3.97 3.69 3.48 3.33 3.20 3.11 3.03 2.96 2.90 2.85 2.81 2.77 2.74 2.71 2.68 2.66 2.64 2.62 2.60 2.59 2.57 2.56 2.55 2.53 2.45 2.37 2.29 2.21 234 19.3 8.94 6.16 4.95 4.28 3.87 3.58 3.37 3.22 3.09 3.00 2.92 2.85 2.79 2.74 2.70 2.66 2.63 2.60 2.57 2.55 2.53 2.51 2.49 2.47 2.46 2.45 2.43 2.42 2.34 2.25 2.18 2.10 237 19.4 8.89 6.09 4.88 4.21 3.79 3.50 3.29 3.14 3.01 2.91 2.83 2.76 2.71 2.66 2.61 2.58 2.54 2.51 2.49 2.46 2.44 2.42 2.40 2.39 2.37 2.36 2.35 2.33 2.25 2.17 2.09 2.01 239 19.4 8.85 6.04 4.82 4.15 3.73 3.44 3.23 3.07 2.95 2.85 2.77 2.70 2.64 2.59 2.55 2.51 2.48 2.45 2.42 2.40 2.37 2.36 2.34 2.32 2.31 2.29 2.28 2.27 2.18 2.10 2.02 1.94 241 19.4 8.81 6.00 4.77 4.10 3.68 3.39 3.18 3.02 2.90 2.80 2.71 2.65 2.59 2.54 2.49 2.46 2.42 2.39 2.37 2.34 2.32 2.30 2.28 2.27 2.25 2.24 2.22 2.21 2.12 2.04 1.96 1.88 242 19.4 8.79 5.96 4.74 4.06 3.64 3.35 3.14 2.98 2.85 2.75 2.67 2.60 2.54 2.49 2.45 2.41 2.38 2.35 2.32 2.30 2.27 2.25 2.24 2.22 2.20 2.19 2.18 2.16 2.08 1.99 1.91 1.83 244 19.4 8.74 5.91 4.68 4.00 3.57 3.28 3.07 2.91 2.79 2.69 2.60 2.53 2.48 2.42 2.38 2.34 2.31 2.28 2.25 2.23 2.20 2.18 2.16 2.15 2.13 2.12 2.10 2.09 2.00 1.92 1.83 1.75 246 19.4 8.70 5.86 4.62 3.94 3.51 3.22 3.01 2.85 2.72 2.62 2.53 2.46 2.40 2.35 2.31 2.27 2.23 2.20 2.18 2.15 2.13 2.11 2.09 2.07 2.06 2.04 2.03 2.01 1.92 1.84 1.75 1.67 248 19.4 8.66 5.80 5.56 3.87 3.44 3.15 2.94 2.77 2.65 2.54 2.46 2.39 2.33 2.28 2.23 2.19 2.16 2.12 2.10 2.07 2.05 2.03 2.01 1.99 1.97 1.96 1.94 1.93 1.84 1.75 1.66 1.57 249 19.5 8.64 5.77 4.53 3.84 3.41 3.12 2.90 2.74 2.61 2.51 2.42 2.35 2.29 2.24 2.19 2.15 2.11 2.08 2.05 2.03 2.01 1.98 1.96 1.95 1.93 1.91 1.90 1.89 1.79 1.70 1.61 1.52 250 19.5 8.62 5.75 4.50 3.81 3.38 3.08 2.86 2.70 2.57 2.47 2.38 2.31 2.25 2.19 2.15 2.11 2.07 2.04 2.01 1.98 1.96 1.94 1.92 1.90 1.88 1.87 1.85 1.84 1.74 1.65 1.55 1.46 251 19.5 8.59 5.72 4.46 3.77 3.34 3.04 2.83 2.66 2.53 2.43 2.34 2.27 2.20 2.15 2.10 2.06 2.03 1.99 1.96 1.94 1.91 1.89 1.87 1.85 1.84 1.82 1.81 1.79 1.69 1.59 1.50 1.39 252 19.5 8.57 5.69 4.43 3.74 3.30 3.01 2.79 2.62 2.49 2.38 2.30 2.22 2.16 2.11 2.06 2.02 1.98 1.95 1.92 1.89 1.86 1.84 1.82 1.80 1.79 1.77 1.75 1.74 1.64 1.53 1.43 1.32 253 19.5 8.55 5.66 4.40 3.70 3.27 2.97 2.75 2.58 2.45 2.34 2.25 2.18 2.11 2.06 2.01 1.97 1.93 1.90 1.87 1.84 1.81 1.79 1.77 1.75 1.73 1.71 1.70 1.68 1.58 1.47 1.35 1.22 254 19.5 8.53 5.63 4.37 3.67 3.23 2.93 2.71 2.54 2.40 2.30 2.21 2.13 2.07 2.01 1.96 1.92 1.88 1.84 1.81 1.78 1.76 1.73 1.71 1.69 1.67 1.65 1.64 1.62 1.51 1.39 1.25 1.00 http://www.edustatspr.com/documentos/mi_lugar_en_el_ciberespacio.htm Universidad de Sonora 110 Departamento de Matemáticas