TERCER SEMESTRE DE LICENCIATURA EN INFORMÁTICA. CENTRO UNIVERSITARIO DE LOS ALTOS. CAPITULO I. DESCRIPCION DE UN CONJUNTO DE DATOS. CONCEPTOS. • ESTADÍSTICA: Es una disciplina de las matemáticas cuyo objetivo es analizar la información obtenida a fin de poder obtener un resultado mediante el método de análisis para la toma de decisiones. • ESTADÍSTICAS: Son los resultados de los eventos que deberán ser sujetos a un análisis estadístico. • POBLACIÓN: Es un conjunto entero de datos. Las poblaciones pueden ser de tipo finito o infinito. Ejemplo: Finito: Número de alumnos de un grupo. Infinito: Los números. • TOMA DE DATOS: Es un conjunto o una colección de datos que no han sido ordenados numéricamente. Ejemplo: Un edificio tiene 15 apartamentos con el siguiente número de inquilinos: 2,1,3,5,2,2,2,1,4,2,6,2,4,3,1 DISTRIBUCIONES DE FRECUENCIAS. Estas pueden utilizarse cuando el número de datos es mayor que 30. Para ellos se recomienda utilizar el siguiente procedimiento: • Se calcula el rango, el cual es igual al dato mayor menos el dato menor. Rango = Dato mayor − Dato menor. • Se obtiene en forma aproximada el número de clases, el cual se divide el rango entre un valor arbitrario. Número de clases = ___Rango_____ X = valor arbitrario. • Se ordenan las clases y se calculan las frecuencias absolutas y frecuencias relativas. MARCAS DE CLASE. Estas se obtienen sumando el limite real inferior mas el limite real superior y el resultado se divide entre 2. 1 LIMITES REALES SUPERIORES E INFERIORES. Estos se obtienen sumando 0.5 a los limites superiores y restando 0.5 a los limites inferiores. LONGITUD TAMAÑO O ANCHURA DE CLASE (c). Este se obtiene restando el limite real superior menos el limite real inferior para cada clase. Ejemplo 1. Supongamos que las temperaturas en grados Fahrenheit medidas a las 6 de la tarde durante un periodo de 35 días son las siguientes: DATOS AGRUPADOS. 72 82 92 92 81 78 81 83 93 77 86 77 76 84 73 93 87 78 107 76 106 82 73 99 80 107 91 81 94 88 98 95 86 86 91 Hacer una distribución de frecuencias. • Rango= 107 − 72 = 35 • Número de clases = Rango = 35 = 7 clases aproximadamente. X=5 5 DISTRIBUCIÓN DE FRECUENCIAS. Frecuencia Frecuencia Marca Limite de Real Absoluta Relativa Clase Inferior Frecuencia Limite Real Frecuencia Superior Acumulada Relativa Acumulada 35 99.6% HISTOGRAMA Y POLÍGONO DE FRECUENCIAS. Clases Es una representación gráfica mediante rectángulos cuyas bases corresponden a la longitud de la clase y las alturas a las frecuencias absolutas. HISTOGRAMAS: Se grafican en el eje horizontal las marcas de clase y en el eje vertical las frecuencias absolutas. POLÍGONO DE FRECUENCIAS: Es una representación gráfica que se obtiene en los puntos medios de los techos de los rectángulos, se unen con líneas rectas. 2 POLÍGONO DE FRECUENCIAS RELATIVAS. Es una representación gráfica que se obtiene mediante las marcas de clase y las frecuencias relativas. DIAGRAMA DE PARETO. Es una representación gráfica en base a rectángulos, con la característica de la mayor frecuencia absoluta hasta la menor. FRECUENCIAS ACUMULADAS. Estas se obtienen para cada una de las clases sumando la frecuencia absoluta de la clase actual mas la frecuencia o frecuencias absolutas anteriores. La gráfica se llama OJIVA y esta se obtiene con los límites reales superiores y las frecuencias acumuladas. MEDIDAS DE TENDENCIA CENTRAL. Entre las medidas de tendencia central más comunes son: • Media Aritmética ( x ). • Moda. • Mediana. Las medidas de tendencia central son las que representan a un conjunto de datos. • MEDIA ARITMÉTICA: Es aquella que se define como el promedio de un conjunto de datos. La media Aritmética se obtiene tanto para datos agrupados como los no agrupados. • DATOS NO AGRUPADOS: Donde: X = Datos. N = Número total de datos. Ejemplo: 66, 100, 98, 96, 58, 94, 90 = 66, 100, 98, 96, 58, 94, 90 = 602 = 86. 77 • DATOS AGRUPADOS: 3 Donde: X = Número de datos N = Número total de datos. f = Frecuencias absolutas. Ejemplo: • MODA: Es la medida de tendencia central que se define como el valor que se presenta con mayor frecuencia, es decir el más común. La moda para datos no agrupados presenta los siguientes casos: Caso 1: 2, 3, 3, 4, 4, 4, 5, 7, 8, 9. Moda = 4. Caso 2: 2, 5, 5, 6, 6, 7, 9, 16. Moda = 6, 5. Caso 3: 2, 4, 5, 6, 7, 8, 11. No existe Moda. La moda para datos agrupados presenta la siguiente formula: Donde: L1 = Es el limite inferior de la clase que contiene la moda. 4 = Es la diferencia de la frecuencia modal menos la frecuencia de la clase contigua inferior. = Es la diferencia de la frecuencia de la clase menos la frecuencia de la clase contigua superior. C = Es el tamaño, longitud o anchura de clase. Ejemplo: =8−5=3 =8−7=1 3 Moda = 76.5 + 5 = 76.5 + 3 (5) = 76.5 + 3.75 = 80.25 3+1 Moda = 80.25. • MEDIANA: Es la medida que se define como el valor que divide a un conjunto de datos en dos partes iguales. La moda presenta los siguientes casos: Caso 1: (Conjunto impar). 2, 3, 4, 5, 7 , 7, 8, 9, 13 Mediana Mediana = 7 Caso 2: (Conjunto par ). 1, 3, 3, 6, 7, 8, 9, 15 6 + 7 = 13 = 6.5 2 Mediana = 6.5 Para calcular la mediana para datos agrupados se aplica la siguiente fórmula: Mediana = L + N _ f C 2 fm 5 Donde: L = Es el límite real inferior de la clase que contiene la mediana. N = Es el número total de datos en el conjunto. f =Es la suma de las frecuencias acumuladas inferiores sin contar la frecuencia de la clase que contiene la mediana. C = Es el tamaño, longitud o anchura de la clase. *NOTA: La clase que contiene la mediana se obtiene contando las frecuencias absolutas, de arriba hacia abajo y viceversa localizándola donde nos de la mitad de N. Ejemplo: 35 − 13 Mediana = 81.5 + 2 5 = 81.5 + (17.5 − 13 ) = 77 Mediana = 81.5 + 3.21 = 84.71 RELACION EMPÍRICA ENTRE MEDIA ARITMÉTICA, MODA Y MEDIANA. 86.57 − 80.25 " 3 (86.57 − 84.71) 6.32 " 5.58 MEDIDAS DE DISPERSIÓN. DISPERSIÓN: Es el grado en que los datos numéricos tienden a extenderse alrededor de un valor medio. 3 X 85 • Entre las medidas mas importantes de dispersión se tienen AMPLITUD DE VARIACIÓN (RANGO). • DESVIACIÓN MEDIA ABSOLUTA (D.M): Es la media aritmética de los valores absolutos de las desviaciones con respecto a la media aritmética. Para calcular las desviación media para los datos no agrupados se utiliza la siguiente fórmula: N Donde: 6 X = Datos = Media Aritmética. | | = Valor absoluto. N = Número Total de Datos. Ejemplo: D.M = |66−86| + |100−86| + |98−86| + 96−86| + |58−86| + |94−86| + |90−86| 7 D.M = |20| + |14| + |12| + |10| + |28| + |8| + |14| =13.71 7 Para calcular la desviación media para datos agrupados se utiliza la siguiente fórmula: Donde: X = Marcas de clase. f = Frecuencias Absolutas. = Media Aritmética. N = Número total de datos en el conjunto. Ejemplo: D.M = 5|74−86.57|+8|79−86.57|+7|84−86.57|+4|89−86.57|+ 6|94−86.57|+2|99−86.57|+1|104−86.57|+2|109−86.57| = 35 D.M =|62.85|+|60.56|+|17.99|+|9.72|+|44.58|+|24.86|+|17.43|+|44.86|= 35 D.M = 282.85 = 8.08 35 • DESVIACIÓN TIPICA O ESTÁNDAR: Se define como la raíz cuadrada de la varianza. 7 Para calcular las desviación típica para los datos no agrupados mayores de 30 se utiliza la siguiente fórmula: Para menores de 30: Ejemplo: Para calcular la desviación típica o estándar para datos agrupados se utiliza la siguiente fórmula: Donde: f1 = Frecuencia Absoluta. Ejemplo: 8 = 9.66 • VARIANZA: Se define como la desviación típica o estándar elevada al cuadrado; su símbolo es . Ejemplo: = (9.66)2 = 93.31 • REGLA EMPÍRICA PARA UNA, DOS Y TRES DESVIACIONES TIPICAS: • Para una desviación típica el porcentaje es del 68.27% • El porcentaje para 2 desviaciones típicas es igual al 95.45%. 9 • El porcentaje para 3 desviaciones típicas es igual a 99.73%. MODELO. El presidente de Ocean Airlines intenta hacer una estimación de cuanto se tardará el Departamento de Aeronáutica Civil en decidir acerca de la solicitud de la compañía sobre una nueva ruta entre la ciudad de Charlotte y Los Angeles. Los asesores del presidente han conseguido los siguientes tiempos de espera de las solicitudes hechas durante el año anterior. Los datos están en días desde la fecha de solicitud hasta la respuesta del D.A.C. 34 49 29 24 29 40 34 40 44 22 23 38 31 37 28 28 31 30 39 44 31 33 34 32 51 40 42 31 36 31 25 26 38 34 44 35 35 35 36 28 47 27 37 41 47 32 31 33 39 31 a) Construya ana distribución de frecuencias utilizando 10 intervalos cerrados igualmente espaciados. Rango = 51 − 22 = 29 = 9.66 " 10 3 Frecuencia Frecuencia Frecuencia Marca Limite de Real Limite Real Frecuencia Absoluta Relativa Clase Inferior Superior Acumulada 3 3 6 12 8 6 5 4 6% 6% 12% 24% 16% 12% 10% 8% 23 26 29 32 35 38 41 44 21.5 24.5 27.5 30.5 33.5 36.5 39.5 42.5 24.5 27.5 30.5 33.5 36.5 39.5 42.5 45.5 3 6 12 24 32 38 43 47 Clases 1 2 3 4 5 6 7 8 21 − 24 25 − 27 28 − 30 31 − 33 34 − 36 37 − 39 40 − 42 43 − 45 Relativa Acumulada 6 12 24 48 64 76 86 94 10 9 49 − 48 10 49 − 51 2 1 4% 2% 47 50 45.5 48.5 48.5 51.5 49 50 98 100 50 100% Longitud = 3. HISTOGRAMA Y POLÍGONO DE FRECUENCIAS. DIAGRAMA DE PARETO. POLÍGONO DE FRECUENCIAS RELATIVAS. OJIVA. • MEDIA. 3(23)+3(26)+6(29)+12(32)+8(35)+6(38)+5(41)+4(44)+2(47)+1(50)= 50 X = 34.76 • MODA. 6 Moda = 30.5 + 3 = 30.5 + 1.8 = 32.3 6+4 • MEDIANA. Mediana = L + N _ f C 2 fm 50 24 3 Mediana = 33.5 + 2 = 33.5 + 0.375 = 33.875 11 • RELACION EMPÍRICA. 37.46 − 32.3 " 3 (34.76 − 33.875) 2.46 " 2.65 • DESVIACIÓN MEDIA. 3|23−34.76|+3|26−34.76|+6|29−34.76|+12|32−34.76|+8|35−34.76|+ 6|38−34.76|+5|41−34.76|+4|44−34.76|+2|47−34.76|+1|50−34.76| = 50 35.28+26.28+34.56+33.12+1.92+19.44+31.2+36.96+24.48+15.24 = 50 D.M = 5.16 • DESVIACIÓN TÍPICA O ESTÁNDAR. ="3(23−34.76)2+3(26−34.76)2+6(29−34.76)2+12(32−34.76)2+8(35−34.76)2 +6(38−34.76)2+5(41−34.76)2+4(44−34.76)2+2(47−34.76)2+1(50−34.76)2 50 = 6.4298 • VARIANZA. = (6.4298)2 = 41.3423 • REGLA EMPÍRICA PARA UNA, DOS Y TRES DESVIACIONES TÍPICAS. Para una desviación típica: X±. 34.76 ± 9.66 12 34.76 + 9.66=44.42 34.76 − 9.66= 25.1 Para dos desviaciones típicas: X ± 2. 34.76 ± 2(9.66) 34.76 + 19.32=54.08 34.76 − 19.32= 15.44 Para tres desviaciones típicas: X ± 3. 34.76 ± 3(9.66) 34.76 + 28.98=63.74 34.76 − 28.98= 5.78 CAPITULO II. DESCRIPCIÓN DE DOS CONJUNTOS DE DATOS. ANÁLISIS DE CORRELACIÓN. Es el grupo de técnicas estadísticas empleado para medir la intensidad de la relación entre dos variables. Se deben identificar la variable dependiente y la independiente. Ejemplo: Se está efectuando un proyecto de investigación en una empresa para determinar si existe relación entre los años de servicio y la eficiencia de un empleado. El objetivo de estudio fue predecir la eficiencia de un empleado con base en los años de servicio. Los resultados de la muestra son: x = 61 y = 30 xy=254 x2 =795 y2=128 DIAGRAMA DE DISPERSIÓN. Es la gráfica que representa la relación entre dos variables de intereses. COEFICIENTE DE CORRELACIÓN. Es la medida de la intensidad de la relación entre dos conjuntos de variables. Para calcular el coeficiente de correlación se utiliza la siguiente fórmula: 13 Ejemplo: r = .3531 ANÁLISIS DE REGRESIÓN. Es la técnica empleada para hacer predicciones. Para ello se emplea la ecuación de regresión mediante el método de mínimos cuadrados; dicha ecuación se le conoce como la ecuación de estimación de o de pronóstico la cual se expresa: y' = a +bX donde: a = Coordenada de la intersección con el eje y. b = Es la pendiente de la recta. x = Cualquier valor seleccionado para la variable independiente. y' = Es el valor pronosticado de la variable y para un valor seleccionado de x. Matemáticamente se obtiene de la siguiente manera: Ejemplo: b = 202 = .0765 14 2639 a = 3.75 − .0765 ( 7.625) = 3.16 COEFICIENTE DE DETERMINACIÓN (r2). Se define como la proporción de la variación total en la variable dependiente y que se explica por o se debe a la variación en la variable dependiente x. El coeficiente de determinación se obtiene aplicando la siguiente fórmula: r2 = Variación total − Variación no explicada. Variación Total. ( y − y )2 5.0625 1.5625 0.5625 1.5625 3.0625 3.0625 0.0625 0.5625 ( y − y´ )2 7.6729 0.0961 0.3721 1.5129 1.7161 1.5129 0.09 0.5929 15.5 13.5659 r2 = 15.5 − 13.5659 = 0.1247 = 0.1247 15.5 ERROR ESTÁNDAR DE ESTIMACIÓN. Es aquel que mide la dispersión de los valores observados con respecto a la recta de regresión. El error estándar de estimación se obtiene aplicando cualquiera de las siguientes fórmulas. 15 Ejemplo: 1. " 13.5659 = 1.5036 6 2. " 128 − 3.166(30) − 0.0765(254) = 1.5049 MODEL0. Un analista de operaciones realiza un estudio para analizar la relación entre la producción y costos de fabricación de la industria electrónica. Se toma una muestra de 10 empresas seleccionadas de la industria y se dan los siguientes datos: Miles de Miles de Unidades 40 42 48 55 65 79 88 100 120 140 $ 150 140 160 170 150 162 185 165 190 185 Empresa A B C D E F G H I J xy y2 y2 6000 5880 7680 9350 9750 12798 16280 16500 22800 25900 1600 1764 2304 3025 4225 6241 7744 10000 14400 19600 22500 19600 25600 28900 22500 26244 34225 27225 36100 34225 777 1657 132,938 70,903 277,118 Determinar: • Cual es la variable dependiente y cual la independiente. • Hacer el diagrama de dispersión. • El coeficiente de correlación. • La recta de regresión mediante el método de mínimos cuadrados. • El coeficiente de determinación. • El error estándar de estimación. • Determinar el costo que se tiene al producir 50,000 y 150,000 unidades. • Variable dependiente: Miles de unidades. Variable Independiente: Miles de pesos. • DIAGRAMA DE DISPERSIÓN. c) 16 r = 1´329,380 − 1´287,489 = " [709030 − 603729][2771190 − 2745949] r = ___41891 = _41891__ = 0.8078 " (105301)(25541) 51860.32 d) y´ = a + bX b = 41891 = 0.3978 105301 a = 165.7 − (.3978) (77.7) = 134.7909 y´= 134.7909 + 0.3978 X e) r2 = (0.8078)2 = 0.65254084 f) Syx = (277119) − 134.7909 (1657) − (.3978) (132.938) " 10 − 2 Syx = 10.53 g) 134.9909 + 0.3978(50) = 154.8809 134.9909 + 0.3978(150) = 199.6609 CAPITULO III. VARIABLES ALEATORIAS Y FUNCIONES DE PROBALIDAD. ESPACIO MUESTRAL: Es el conjunto de todos los resultados posibles de un experimento o muestra. EVENTO: Es el resultado de un experimento. Los eventos se clasifican en tres tipos: • Simple. • Múltiple. • Imposible. 17 VARIABLE OPCIONAL: Es aquella que está en función valorada numéricamente, cuyo valor está regido por factores en los que interviene el azar. Las variables aleatorias se clasifican en dos tipos: • Variables aleatorias continuas: Son aquellas en las que se considera si se puede asumir cualquier valor dentro de un determinado intervalo. • Variables aleatorias discretas: Son aquellas que se consideran si los valores que se asumen se pueden contar. Ejemplo: Continua: • Estatura de una persona. • Número de litros de agua en un estanque. Discreta: • Número de muestra de un lote. • Cantidad de alumnos de un grupo. Las probabilidades se utilizan para expresar cuan probable es un determinado evento. La probabilidad de que un evento ocurra está representada del 0 a 1. Ejemplo: Evento: Lanzamiento de una par de dados. ¿Qué número sumado puede dar? • Hallar la variable aleatoria. • El espacio muestral. • La probabilidad. • La gráfica en forma técnica. • Hacer la gráfica de un experimento aleatorio con 100 lanzamientos. y compararla con la anterior. Variable Espacio Probabilidad Aleatoria 2 3 4 5 6 7 8 9 10 11 12 Muestral (1,1) (2,1),(1,2) (3,1),(2,2),(1,3) (4,1),(3,2),(2,3),(1,4) (5,1),(4,2),(3,3),(2,4),(1,5) (6,1),(5,2),(4,3),(3,4),(2,5),(1,6) (6,2),(5,3),(4,4),(3,5),(2,6) (6,3),(5,4),(4,5),(3,6) (6,4),(5,5),(4,6) (6,5),(5,6), (6,6) Clásica. 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 Probabilidad en el experimento 1.66 6.66 10 12.5 15 17.5 11.66 10 9.3 4.16 2.5 18 d) Gráfica en forma clásica. e) Gráfica del experimento de 100 lanzamientos. FACTORIAL DE N. Para calcular el factorial de un número positivo se aplican la siguiente fórmula: n! = n(n − 1) (n − 2) . . . 1 Ejemplos: 0! = 1 1! = 1 2! = 2 3! = 6 4! = 24 PERMUTACIONES Y COMBINACIONES. Una permutación se representa nPr, es una ordenación de n objetos tomados de r en r. Una permuta aplica la siguiente fórmula: nPr = n! (n − r)! Ejemplo: r = 2 6P2 = 6! = 720 = 30 n = 6 (6− 2)! Una combinación es una selección de n objetos o cosas seleccionadas de r en r. Una combinación se obtiene con la siguiente fórmula: nCr =_ n!___ r! (n − r)! Ejemplo: r=2 n=6 19 6C2 = 6!___ = 6!__ = 6 . 5. 4. 3. 2. 1 = 30 = 15 2!(6−2)! 2!.4! 2. 1 4. 3. 2. 1 2 Ejemplo: En cuantas formas puede una sucursal local en una sociedad programar a 3 conferencistas en 3 diferentes congresos, si los primeros están disponibles en cualquiera de 5 fechas posibles. n = 5 nPr = n!__ r = 3 (n − r)! 5. 4. 3. 2. 1 = 60 Formas 2. 1 En cuantas formas diferentes puede un superior seleccionar un equipo de 5, de 8 personas que trabajan para el. n = 8 nCr =_ n!___ r = 5 r! (n − r)! 8!__ = 8. 7. 6. 5. 4. 3. 2. 1 = 336 = 56 Formas. 5!(8−5)! (5. 4. 3. 2. 1)(3. 2. 1) PRINCIPIO FUNDAMENTAL. Si un suceso o evento puede presentarse con cualquiera de las n1 formas distintas y si otro suceso ha ocurrido relacionado con el primero de las n2 distintas, entonces el número de formas en que ambos sucesos en orden específico pueden presentarse será n1 . n2 formas. Ejemplo: ¿De cuantas formas pueden ordenarse 7 libros en un estante? • Si es posible cualquier ordenación. • 3 libros determinados deben estar juntos. • 2 libros determinados deben ocupar los extremos. a) 7P7 = 7!__ = 7. 6. 5. 4. 3. 2. 1 = 5040 (7−7)! 1 b) 5P4 . 3P3 = 5!_ 3!_ = 5. 4. 3. 2. 1 3 .2. 1 = 120 x 6=720 (5−5)! (2−2)! 1 1 c) 5P2 . 2P2 = 5!_ 2!_ = 5. 4. 3. 2. 1 2. 1 = 120 x 2=240 20 (5−5)! (2−2)! 1 1 Una clase de 9 niños y 3 niñas. • Hallar el número de posibilidades que tiene un profesor de elegir un comité de 4 integrantes. • Tiene que haber 2 niños y 2 niñas. • Tiene que haber exactamente una niña. a) 12C4 = 12!_ = 12. 11. 10. 9. 8. 7. 6. 5. 4. 3. 2. 1 = 495 Formas. 4!(12−4)! (4. 3. 2. 1) (8. 7 .6 .5 .4 .3. 2. 1) b) 3C2 . 9C2 = (3) (36) = 108 Formas. c) 3C1 . 9C3 = (3) (84) = 252 Formas. Un granjero compra 3 vacas, 2 cerdos, 4 gallinas a un hombre que tiene 6 vacas, 5 cerdos y 8 gallinas. ¿Cuántas elecciones puede hacer? 6C3 . 5C2 . 8 C4 = (20) (10) (70) = 14,000 formas. ESPERANZA MATEMÁTICA. Es la cantidad que un jugador espera ganar como media cada vez que juega. Si el valor de E es positivo se dice que el juego está a favor del jugador, si E es negativo esta en su contra y se dice que es una perdida. Para calcular la esperanza matemática de un cierto evento se aplica: E = W1P1 + W2P2 + . . . +WnPn Ejemplo: 1. Un jugador tira 2 dados, si la suma es de 7 ó 11 gana 7 dólares, con cualquier otro resultado pierde 2 dólares. Determine el valor esperado del juego. E=? W1 = $7 E = (7) (8/36) − (2) (28/36) P1 = 6 + 2 = 8 36 36 56 − 56 = 0 36 36 W2 =−$2 P2 = 28 21 36 2. Si un hombre compra una papeleta de rifa en la que puede ganar un primer premio de 5,000 dólares ó un segundo premio de 2,000 dólares con probabilidades de .001 y .003. ¿Cuál sería el precio justo a pagar por la papeleta? E=? W1 = $5,000 E = (5000) (.001) − (2000) (.003) P1 = .001 W2 =−$2,000 P2 = .003 E = $5 + $6 = $11 3. Un juego consiste en tirar una moneda no−truncada 4 veces. Un jugador gana 3 dólares si sale 2 o mas veces cara, de cualquier otra forma el jugador pierde 4 dólares. Hallar el valor esperado E del juego. E=? W1 = $3 E = (3)(11/16) − (4)(5/16) P1 = 11/16 W2 =−$4 E = 33 − 20 = 13 P2 = 5/16 16 16 16 CAPITULO IV. FUNCIONES DE PROBABILIDAD. DISTRIBUCIÓN DE PROBABILIDAD: Es la distribución de frecuencias relativas respecto a resultados del espacio muestral, señala la proporción de veces en que la variable aleatoria tiende a obtener diversos valores. Considerando que la probabilidad de que un evento suceda o no suceda es igual a 1, para ello se aplica la siguiente fórmula: 1 = p + q p = 1 − q q = 1 −p p = Probabilidad de éxito. q = Probabilidad de no éxito. Las distribuciones de probabilidad se clasifican de 2 tipos: Binomial. 22 • LAS DISCRETAS. Poison. Hipergeométrica. • CONTINUAS. Normal. • Distribuciones de probabilidad discretas: 1. Distribución Binomial: Para calcular la probabilidad mediante esta distribución de acuerdo a las características, se aplica la siguiente fórmula. P(x) = _ n!___ px qn−x x! (n−x)! Donde: n = Número de ensayos. p = Proporción de éxito que se tiene en el evento. q = Proporción de no−éxito o de fracaso que se tiene en el evento. x = Es el número de veces que se obtiene al obtener éxito. Ejemplo: 1. El 8% de las hamburguesas que se venden en un estadio de béisbol, se piden sin mayonesa. Si 7 personas ordenan hamburguesas encuentre la probabilidad de que: • Todas las quieran con mayonesa. • Solo 1 la quiera con mayonesa. Datos: p = .92% q = .08% n=7 • x = 7 P(7) = 7!___ (.92)7 (.08)7−7 = 0.5578 7!(7−7)! • x = 1 P(1) = 7!___ (.92)1 (.08)7−1 = 0.000001688 1!(7−1)! 2. El 90% de probabilidades de que un tipo particular de complemento funcione adecuadamente en condiciones de alta temperatura. Si el dispositivo en cuestión incluye 4 de esos componentes, determine la probabilidad de que: 23 • Todos los componentes funcionen adecuadamente y por lo tanto el dispositivo es operante. • El dispositivo es inoperante por que falla exactamente 1 de los 4 componentes. • El dispositivo es inoperante por que falla 1 o mas de los componentes. Datos: p = .90% q = .10% x=4 a) x = 4 P(4) = 4!___ (.90)4 (.10)4−4 = 0.6561 4!(4−4)! b) p = 0.10% P(1) = 4!___ (.10)1 (.90)4−3 = .2916 q = 0.90% 1!(4−1)! x=1 c) p = 0.10% q = 0.90% x = 1, 2, 3,4 P(1, 2, 3, 4) = 4!___ (.10)1 (.90)3+ 4!___ (.10)2 (.90)4−2+ 1!(4−1)! 2!(4−2)! 4!__ (.10)3 (.90)4−3+ 4!__ (.10)4 (.90)4−4= 3!(4−3)! 4!(4−4)! 0.2916 +0.0486 + 0.0036 +0.0001 = 0.3439 Una familia tiene 6 hijos. Hallar la probabilidad de que sean: • 3 niños y 3 niñas. • Menos niños que niñas. Tomaremos 0.5 como la probabilidad de que un hijo sea niño. Datos: p = 0.5% niños. q = 0.5% niñas. n = 6 hijos. a) x = 3 P(3)= 6!__ (0.5)3 (0.5)6−3= 0.3125 24 3!(6−3)! b) x =0, 1, 2 P(0,1, 2) = 6!___ (0.5)0 (0.5)6−0+ 6!___ (0.5)1 (0.5)6−1+ 0!(6−0)! 1!(6−1)! 6!__ (0.5)2 (0.5)6−2= .0152 + .09375 + .2343 = .3436 2!(6−2)! 2. Distribución de probabilidad Poison: Esta distribución tiene muchas aplicaciones y se utiliza como modelo para describir fenómenos, por ejemplo el número de errores en captura de datos, las imperfecciones en piezas recientemente pintadas, el número de partes defectuosas en ciertos embarques, el número de clientes que llegan a un banco a solicitar servicio, el número de errores que una secretaria comete por página, el número de accidentes que ocurren en un determinado tiempo, etc. Esta probabilidad utiliza la siguiente fórmula: P(x) = e− . x x! = Promedio de ocurrencia del suceso o evento. x = Número pedido de acuerdo a la probabilidad. e = Número de Euter ( 2.7172). Cuando la probabilidad es muy pequeña se debe de contar el número de la población, para ello el promedio de ocurrencia se obtiene: =N.P Ejemplo: 1. La señora García esta encargada de los préstamos de un banco. Con base en sus años de experiencia, estima que la probabilidad de que un solicitante no sea capaz de pagar oportunamente sus préstamo es de .025, el mes pasado realizo 40 préstamos: • ¿Cuál es la probabilidad de que 3 préstamos no se paguen oportunamente? • ¿Cuál es la probabilidad de que al menos 3 préstamos se liquiden a tiempo? Datos: P = .025 N = 40 = (40)(.025)=1 cliente. 25 • x = 3 P(3)= e−1.13 = (.3678)(1) = .0613 3! 6 • x = 3 o más. P(0,1,2) = e−1. 10 + e−1. 11 + e−1 . 12 = 0! 1! 2! .3679+ .3679+ .3679 = .3679 + .3679 + .1839 = 0.9197 112 P(3 o más) = 1 − q = 1 − 0.9197 = 0.0803 % Probabilidad pedida. 2. Los automóviles que llegan a una salida de una carretera a razón de 2 por minuto. • ¿Cuál es la probabilidad que en un minuto dado no lleguen automóviles? • ¿Cuál es la probabilidad e que al menos 1 automóvil llegue durante un minuto especifico? Datos: = 2 autos / minuto. Probabilidad a) x = 0 P(0)= e−2.20 = (0.1353)(1) = 0.1353 pedida. 0! 1 b) x = 1 o más. P(1 o más) = 1 − q = 1 − 0.1353% Probabilidad pedida. 3. Supongamos que el 2% de la población es zurda. Hallar la probabilidad de encontrar 3 o más zurdos en 100 personas. Datos: P = 2% = .02 N = 100 = (100)(.02) = 2 P(0,1,2) = e−2. 20 + e−2. 21 + e−2 . 22 = 0! 1! 2! .1353(1) + .1353(2)+ .1353(4) = .1353 + .2706 + .3706 = 0.6765 112 26 Probabilidad 1 − q = 1 − .6765 = .3234 pedida. 4. A una construcción llegan camiones de carga a razón media de 2.8 camiones por hora. Obtenga la probabilidad de tener 3 o más camiones que lleguen en un: • Lapso de 30 minutos. • Lapso de 1 hora. • Lapso de 2 horas. Datos: P = 2.8 Camiones / minuto a) x = 0, 1,2 P(0,1,2) = e−1.4. 1.40 + e−1.4. 1.41 + e−1.4 . 1.42 = = 1.4 0! 1! 2! .2465(1) + .2465(1.4)+ .2465(1.96)=.2465 + .3451 + .2415 = .8331 112 Probabilidad pedida = 1 − .8331 = .1669 b) x = 0, 1,2 P(0,1,2) = e−2.8. 2.80 + e−2.8. 2.81 + e−2.8 . 2.82 = = 2.8 0! 1! 2! .0608(1) + .0608(2.8)+ .0608(7.84)= .0608 + .1702 + .2383 = .4693 112 Probabilidad pedida = 1 − .4693 = .5307 c) x = 0, 1,2 P(0,1,2) = e−5.6. 5.60 + e−5.6. 5.61 + e−5.6 . 5.62 = = 5.6 0! 1! 2! .0036(1) + .0036(5.6)+ .0036(31.36) =.0036 + .0207 + .0596 = .0823 112 Probabilidad pedida = 1 − .0823 = .9177 3. Distribución de probabilidad Hipergeométrica: Cuando la población es finita y el muestreo se hace sin reemplazo, la probabilidad cambiará para cada nueva observación, en tales circunstancias se tendrá una distribución Hipergeométrica, está debe estar formada por 2 grupos de individuos u objetos. Un primer grupo constituido por aquellos individuos que poseen las característica de estudio; se representará N1; y el otro grupo estará conformado por los que no poseen la característica y el número de sus elementos se representará con N2. 27 La probabilidad mediante una distribución Hipergeométrica se obtiene: Donde: x = Número de éxitos el los n ensayos donde el muestreo es sin repetición. Ejemplo: 1. Una empresa produce 100 unidades de las cuales 90 son buenas y 10 son defectuosas. Se toman 20 unidades sin remplazo; halle la probabilidad de que resulten 5 defectuosas. Datos: N1 = 10 N2 = 90 P(5) = 10C5 . 90C15 = (252)(4.58 x 1016) = 0.0215 N = N1 + N2 = 100 100C20 5.36 x 1020 n = 20 x=5 2. 15 de los 20 estudiantes de una grupo escolar están insatisfechos con el texto que se emplea. Si una muestra aleatoria de 4 estudiantes es interrogada sobre el libro de texto. Determine la probabilidad: • Exactamente 3. • Al menos 3 estudiantes. Se muestren insatisfechos con el libro. Datos: N1 = 15 N2 = 5 N = N1 + N2 =20 n=4 28 Probabilidad a) x = 3 P(3) = 15C3 . 5C1 = (455)(5) = 0.4695 pedida 20C4 4845 Probabilidad b) x = 3, 4 P(4) = 15C4 . 5C0 = (1365)(1)= 0.2817 pedida 20C4 4845 3. Una caja contiene 30 baterias para radio de las cuales 5 son defectuosas. De la caja se escogen al azar 6 baterias; halle la probabilidad de que: • 2 sean defectuosas. • Ninguna sea defectuosa. • Menos de 3 sean defectuosas. Datos: N1 = 5 N2 =25 N = N1 + N2 = 30 n=6 a) x = 2 P(2) = 5C2 . 25C4 = (10)(12650) = 0.2130 P.P 30C6 593775 b) x = 0 P(0) = 5C0 . 25C6 = (1)(177100) = 0.2982 P.P 30C6 593775 b) x = 0,1,2 P(1) = 5C1 . 25C5 = (5)(53130) = 0.4473 30C6 593775 P(0,1,2) = 0.2982 + 0.4473 + 0.2130 = 0.9585 P.P 4. Distribucion Normal: Esta distrbucion se aplica en muchos fenómenos naturales, los cuales para el cálculo de la probabilidad se utiliza la curva simétrica llamada campana, la cual se expresa a continuación: .5000 .5000 Para calcular la probabilidad mediante una distribución normal se utiliza la siguiente fórmula: Z=X−M 29 Donde: M = Es la media aritmética o promedio. = Desviación típica o estándar de la población. X = Valor buscado de acuerdo a la probabilidad pedida. Z = Es el valor típificado (Área bajo la curva). Ejemplo. 1. El número de días entre la facturación y el pago de las cuentas a crédito en una gran tienda de departamentos, tiene uyna distribución aproximadamente normal con una media de 18 días y una desviación estándar de 4 días: • ¿Qué población de las cuentas serán pagadas entre 12 y 19 días? • Entre 20 y 23 días. • En menos de 8 días. • En 12 días o más. Datos: M = 18 =4 • x = Entre 12 y 19 . 0.5319 Z1 = 12 − 18 = −1.5 4 .4332 .0987 Z1 = 19 − 18 = 0.25 4 Z1= −1.5 Z2=0.25 P.P = 0.5319 • x= Entre 20 y 23 0.2029 Z1 = 20 − 18 = 0.5 4 0.1915 0.3944 30 Z2 = 23 − 18 = 1.25 4 Z1= 0.5 Z2=1.25 P.P = 0.1915 − 0.3944 = 0.2029 0.9938 • x= Menos de 8 0.0062 Z = 8 − 18 = −2.5 0.4938 .5000 4 Z= −2.5 P.P = 1 − 0.9938 = 0.0062 0.9332 • x= 12 o mas Z = 12 − 18 = −1.5 0.4332 .5000 4 Z= −1.5 12 días o mas 2. El tiempo requerido para instalar un motor nuevo de un avión es distribuido con una media de 20 horas y una desviación típica de 1 hora. ¿Cuál es la probabilidad de que la siguiente instalación toma:? • 19 o menos y 22 o más horas. • Entre 17 y 18 horas. Datos: M = 20 horas. = 1 hora. • x= 19 o menos y 22 o más. 0.8115 Z1 = 19 − 20 = −1 1 Z2 = 22 − 20 = 2 0.3413 0.4772 1 P.P=1 − 0.8185 = 0.1815 Z1 =−1 Z2 = 2 31 • x = 17 y 18 0.0215 Z1 = 17 − 20 = −3 1 0.4987 0.4772 Z2 = 18 − 20 = −2 Z1= −3 Z2= −2 1 P.P = 0.4987 − 0.4772 = 0.0215 3. Suponga que se diseña una prueba de inteligencia que tenga una distribución normal con una media de 100 y una desviación estándar de 15. • ¿Qué proporción de personas tienen resultados inferiores a 115. • ¿Mayores a 130? • ¿Entre 85 y 115? • ¿Entre 70 y 130? Datos. M = 100 = 15 0.8413 • x = menores a 115. Z = 115 − 100 = 1 .5000 .3413 15 Z=1 P.P=0.3413 0.9772 • x = Más de 130 Z = 130 − 100 = 2 .5000 .4772 15 Z=2 P.P = .9772 .6826 32 • x = Entre 85 y 115 Z1 = 85 − 100 = 1 15 .3413 .3413 Z2 = 115 − 100 = 1 15 Z1=−1 Z2=1 P.P = .3413 + .3413 =.6826 • x = Entre 70 y 130 .9544 Z1 = 70 − 100 = −2 15 .4772 .4772 Z2 = 130 − 100 = 2 15 Z1= −2 Z2= 2 P.P = .4772 + .4772 = .9544 El gerente de un club de natacion sabe por experiencia de años pasados que el número de niños que cada miembro trae a la alberca en una sesión dada es una variable aleatoria con media de 3.1 y desviación típica de 0.56. Entre 200 miembros ¿Cuántos se pueden esperar que traigan de 2 a 4 niños a las piscina en una sesión? Datos: M = 3.1 = 0.56 x = 2 a 4 .9213 N = 200 miembros. Z1 = 2 − 31 = −1.96 .56 .4750 .4463 Z2 = 4 − 31 = 1.61 Z1 = −1.96 Z2 = 1.61 .56 P.P = .4750 + .4463 = .9213 Número de niños = (200)(.9213) = 184.26 " 184 Niños. 33 CAPITULO V DISTRIBUCIONES DERIVADAS DEL MUESTREO. ESTIMACIÓN DE PARÁMETROS. La estimación de parámetros puede ser de 2 formas: • Estimación por intervalo. • Estimación por punto. Estimación por punto: Es la estimación de un valor único de un parámetro de la población. Estimación por intervalo: Es la estimación que incluye un intervalo de valores posibles en el que se considera que está comprendido un parámetro de la poblacióon. Para calcular el nivel de confianza deseado con respecto al Zc se tiene: ESTIMACIÓN PARA MEDIAS ARITMÉTICAS DE ACUERDO AL TAMAÑO DE LA MUESTRA. Para calcular los intervalos de confianza para muestras grandes se utiliza la siguente fórmula: X ± Zc _ "n Donde: X = Es la media aritmética o promedio muestral. = Es la desviación típica o estándar de la población (muestra). n = Es el tamaño de la muestra. Zc = Es el valor buscado en la tabla de acuerdo al nivel de confianza deseado. Para calcular la estimacion de intervalos para muestras pequeñas (menores de 30), se utiliza la siguiente fórmula: X ± tc S_ "n Donde: X = Es la media aritmética o promedio muestral. tc = Es el valor buscado en la tabla (t de student) y esta se busca de acuerda a los grados de libertad. 34 S = Desviación típica o estándar de la muestra. n = Tamañ de la muestra. En el caso de utilizar la tabla T de student se utilizan los grados de libertad aplicando la soguiente fórmula: V=n−1 Ejemplo: 1. Una psicóloga de una industria, desea estimar la media de edad de cierta población de empleadas. Extrae una muestra de de 60 mujeres de la población. La muestra da como resultado una media de edad de 23.67 años. Sabe que la población de edades tiene una desviación típica de 15 años. Construya un intervalo de confianza: • 96% • 99% Datos: X =23.67 años. =15 años. n = 60 NC. a) 96% Zc= 2.05 27.6398 23.67 ± 2.05 (15) = 23.67 ± 30.75 = 23.67 ± 3.9698 = "60 7.7459 19.70 b) 99% Zc= 2.58 28.6661 23.67 ± 2.58 (15) = 23.67 ± _38.7 = 23.67 ± 4.9961 = "60 7.7459 18.6739 2. Al final de cada llamada en una estación teléfonica se hace un reporte en el que se indica la duración de la llamada. Una muestra aleatoria simple de 9 reportes da como resultado una media de duración de llamada de 1.2 minutos con uan desviación típica o estándar de 0.6 minutos. Construya un intervalo de confianza: • 95% • 99% para la media de la población. 35 Datos: X =1.2 minutos. s =0.6 minutos n=9 V = 9 − 1 =8 Tc. a) 95% tc = 2.306 1.6612 1.2 ± 2.306 (.6) = 1.2 ± _1.3836 = 1.2 ± 0.4612 = "9 3 0.7388 2.5% 2.5% 95% 0 .025 .95 .975 1 b) 99% tc = 3.355 1.871 1.2 ± 3.355 (.6) = 1.2 ± _2.013 = 1.2 ± 0.671 = "9 3 0.529 .5% .5% 99% 0 .005 .99 .995 1 3. Las alturas de una muestra de 50 estudiantes mostraron una media de 174.5 cm y una desviación típica de 6.9 cm. determine un intervalo de confianza: • 90% • 98% Para la altra promedio de todos los estudiantes. Datos: X =174.5 cm. 36 =6.9 cm. n = 50 NC. a) 90% Zc= 1.645 27.6398 174.5 ± 1.645 (6.9) = 23.67 ± 11.3505 = 23.67 ± 1.0652= "50 7.0710 19.70 b) 98% Zc= 2.33 176.77 174.5 ± 2.33 (6.9) = 23.67 ± 16.077 = 23.67 ± 2.2736 = "60 7.0710 172.23 Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de piezas cuyos diámetros son: 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01, 1.03 centímetros. Encuentre: • Un intervalo de confianza del 90%. • Un intervalo de confianza del 99%. Para el diámetro promedio de piezas de esta máquina. Datos: X =1.0055 Sn−1 =0.02455 n=9 V = 9 − 1 =8 Tc. a) 90% tc = 1.860 1.0207 1.0055 ± 1.860 (.02455) = 1.0055 ± 0.0456 = 1.0055 ± 0.0152= 37 "9 3 .9903 5% 5% 90% 0 .05 .90 .95 1 b) 99% tc = 3.355 1.03296 1.0055 ± 3.355 (.02455) = 1.0055 ± 0.0824 = 1.0055 ± 0.02746= "9 3 .97804 .5% .5% 99% 0 .005 .99 .995 1 47 HISTOGRAMA POLÍGONO DE FRECUENCIAS 8 7 6 5 1 2 3 4 38 79 84 94 74 89 99 109 104 MARCA DE CLASE 74 79 84 89 94 32 35 99 104 109 114 0 MARCA DE CLASE X 23 26 29 38 41 44 47 50 MARCA DE CLASE 32 35 29 38 41 44 23 26 47 50 39 8 1/36 2/36 3/36 4/36 5/36 1/36 , x = 0, 1, . . . n si n " N1 40