DISTRIBUCIÓN PROBABILISTICA. Estadística inferencial: conjunto de métodos utilizados para saber algo acerca de una población, basándose en una muestra Concepto Enumeración de todos los resultados de un experimento junto con la probabilidad asociada a cada uno. Probabilidad de un evento: #de resultados favorables/ #total de resultados posibles. Variable aleatoria: Es un valor numérico determinado por el resultado de un experimento. Una distribución probabilística discreta tiene las siguientes características: 1. La suma de todas las probabilidades asociadas a cada evento es igual a 1 2. La probabilidad de un resultado de un evento esta entre 0 y 1 3. Los resultados son mutuamente excluyentes. Una distribución continua puede a sumir un número infinito de valores dentro de un intervalo específico. Calculo de la media y la varianza de una distribución de probabilidad. Media= valor promedio a largo plazo de la variable aleatoria. Es un promedio ponderado para el que os valores posibles que se consideran son a afectados o sopesados por las probabilidades correspondientes de ocurrencia. µ = Σ (Xi * P (Xi)) = E(Xi) = valor esperado Varianza: describe el grado de dispersión o variación de una distribución. σ2 =Σ (Xi -µ) 2 * P(Xi) Para la desviación estándar: es la raíz cuadrada de Prof. Olatz Ermina σ2 Página 1 ejm Sea X el número de equipos MSM que fallaron en una industria en los últimos 250 días. Equipos que fallaron 0 1 2 3 4 5 6 a) b) c) d) e) f) Numero de días 100 60 35 20 12 15 8 Construya una distribución de probabilidades. Cuál es la probabilidad de que fallen 3 equipos mañana. Cuál es la probabilidad de que fallen menos de 3 equipos mañana Cuál es la probabilidad de que fallen entre 1 y 3 equipos mañana Cuantos equipos se espera que fallen mañana Calcule la desviación estándar DISTRIBUCIÓN BINOMIAL Las observaciones posibles pueden obtenerse mediante 2 métodos de muestreo distintos. Cada observación puede considerarse como seleccionada de una población infinita sin reemplazo o de una población finita con reemplazo. Una distribución probabilística binomial tiene las siguientes características: 1. La suma de todas las probabilidades asociadas a cada evento es igual a 1 2. La probabilidad de un resultado de un evento esta entre 0 y 1 3. Los resultados son mutuamente excluyentes. La distribución binomial posee 4 propiedades esenciales: 1 un resultado de cada ensayo o realización de un experimento se clasifica en una de dos categorías mutuamente excluyentes: éxito o fracaso; verdadero o falso; positivo o negativo; aceptable o no aceptable; empleado o desempleado. 2. la variable aleatoria es el resultado de contar el número de éxitos en una cantidad fija de ensayos: Ejm. Se lanza una moneda 5 veces y se cuenta el número de veces que salió cara. Prof. Olatz Ermina Página 2 Se escogen 20 lotes y se cuentan los que no cumplieron con las especificaciones del producto. 3. La probabilidad de un éxito permanece igual para cada ensayo. Lo mismo sucede con la probabilidad de un fracaso. Ejm. En un examen de verdadero y falso, la probab que sea verdadera es ½ y de igual manera que sea falsa es ½ para todas las preguntas. 4. Los ensayos son independientes, lo cual significa que el resultado de un ensayo no afecta el resultado de algún otro. Esto significa que no existe una configuración rítmica con respecto a los resultados ¿Cómo se elabora una distribución probabilística binomial? Se debe saber 1. El numero de ensayos. 2. La probabilidad de éxito en cada ensayo. Por ejm: Si un examen de estadística consiste en 20 preguntas de opción múltiple, el número de ensayos es 20. Si cada pregunta tiene 5 opciones y solo una es correcta la probabilidad de éxito para una persona que desconozca la materia es 1/5 = 0.20 La distribución manera: probabilística binomial se puede describir de la siguiente 𝑛 𝑛 P(X = Xi) = ∑ ( ) 𝑝 𝑥 𝑎𝑛−𝑥 𝑥 𝑥=0 𝑛! P(X = Xi) = ∗ 𝑃 𝑋𝑖 ∗ (1 − 𝑃)𝑛−𝑋𝑖 𝑋𝑖! (𝑛 − 𝑋𝑖)! Donde: n= es el numero de ensayos x= es el numero de éxitos de cada ensayo. P= en la probabilidad de éxito en cada ensayo. q= 1-p = es la probabilidad de fracaso en cada ensayo. La media de una distribución binomial Puede obtenerse fácilmente Prof. Olatz Ermina Página 3 µ = E(x) = n * p donde: E(x)= valor esperado n= numero de observaciones p= probabilidad de éxito. Desviación estándar de la distribución binomial Ơ= √𝑛 ∗ 𝑝 ∗ 𝑞 Donde: n= numero de observaciones p= probabilidad de éxito. q= 1-p = es la probabilidad de fracaso. Forma: Puede ser simétrica o sesgada. Siempre que p=0.5 la distribución simétrica sin importar que tan grande o pequeña sea el valor de n. binomial será Cuando p ≠ 0.5 la distribución binomial será sesgada. Mientras mas cercana este p de 0.5 mayor sea el numero de observaciones, n, menos sesgada será la distribución. Ejm: Un 10% de los empleados de producción en la empresa W están ausentes del trabajo en un determinado día de verano. Supóngase que se seleccionan al azar 10 trabajadores de producción para un estudio riguroso del ausentismo. a) Cual es la variable aleatoria. b) Tal variable es discreta o continua. c) Desarrolle una distribución probabilística binomial para el experimento. d) Cual es la probabilidad de que mas de 3 empleados seleccionados este ausente. e) Cuál es la probabilidad de que menos de 7 empleados seleccionados este ausente. f) Cuál es la probabilidad de que entre4 y 8 empleados seleccionados este ausente. g) Calcule la media, varianza y la desviación estándar de la distribución. DISTRIBUCIÓN POISSON Es ideal para probabilidades de éxito menores de 0.05 y para n muy grandes (n≥ 100) Prof. Olatz Ermina Página 4 La forma limite de la distribución binomial cuando la probabilidad de éxito es muy pequeña y n muy grande se denomina distribución probabilidad de Poisson. Se le conoce la ley de eventos improbables. Aplicaciones: Como modelo para describir la distribución de errores en la captura de datos. # de ralladura y otros. # de llamadas por hora. # de llegadas de carros al día. # de huelgas industriales importantes al año. # de defectos por lote. # de carreras por entrada # de accidentes en una carretera en un periodo. Etc. Una distribución probabilística Poisson tiene las siguientes características: 1. La suma de todas las probabilidades asociadas a cada evento es igual a 1 2. La probabilidad de un resultado de un evento esta entre 0 y 1 3. Los resultados son mutuamente excluyentes. La distribución Poisson resulta de un conteo del # de éxitos en una cantidad fija de ensayos. Como se calcula: P(X = Xi) = µXi ∗ 𝑒 −µ 𝑋𝑖! Donde: µ: es la media aritmética del número de ocurrencias (éxitos) en un intervalo de tiempo específico. e: es la constante 2.71828 X: es el # de ocurrencias ( éxitos) por unidad. Cálculo de la media Media = µ = E(x) = valor esperado. Prof. Olatz Ermina Página 5 Calculo de la varianza y desviación estándar. Varianza= σ2 = µ Desviación estándar= σ = √µ Para una distribución binomial existe un número fijo de ensayos por ejm. Prueba de opción múltiple de 4 preguntas, puede ser 0,1,2,3,4 respuestas correctas para una distribución poisson puede tomar un numero infinito de valores esto es 0,1,2,3,4………. Pero las probabilidades se vuelven muy pequeñas después de las primeras ocurrencias (éxitos) Ejm En un banco a la hora del almuerzo llegan en promedio 0.05 clientes por segundo ¿Cuál es la probabilidad de que en un minuto dado lleguen exactamente 2 clientes? ¿Lleguen mas de 2 clientes? Haga la distribución de probabilidad. USO DE LA DISTRIBUCION DE POISSON PARA APROXIMARSE A LA DISTRIBUCION BINOMIAL Para aquellas situaciones en la que n es grande (n ≥ 20) y p es muy pequeña (p ≤ 0.05) se utiliza la formula de la distribución binomial. En estos casos X no debe exceder el valor de n pues se esta utilizando como una distribución binomial. Características: Media µ = E(x) = n * p Desviación estándar = Ơ= √𝑛 ∗ 𝑝 ∗ 𝑞 Ejm El 50% de los residentes de Puerto Ordaz están registrados para votar, si se eligen 25 personas al azar: a) Cuál es la probabilidad que estén registrados menos de 6 personas. b) Cuál es la probabilidad que no estén registrados mas de 8 personas. c) Cuál es la probabilidad que estén registrados entre 1 y 6 personas. DISTRIBUCION NORMAL Prof. Olatz Ermina Página 6 La mayoría de los productos de consumo masivo siguen este tipo de distribución, pues describe el comportamiento que debe tener la mayoría de la población, se dice que en este tipo de distribución más del 90% tiene los valores cercanos a la media Una distribución probabilística continua cumple con las mismas características de las distribuciones discretas: 1. La suma de todas las probabilidades asociadas a cada evento es igual a 1 2. La probabilidad de un resultado de un evento está entre 0 y 1 3. Los resultados son mutuamente excluyentes. Características físicas de la distribución normal: a) Es acampanada y la media, mediana y moda tienen el mismo valor (son iguales) b) Es simétrica. c) Es asintónica (la curva se aproxima al eje X pero nunca lo toca) d) Queda descrita por la media y la desviación estándar. e) Existe una familia de distribuciones normales. Cada vez que cambien la media o la desviación estándar, se origina una nueva distribución normal. Medias iguales pero distintas desviaciones estándar: Prof. Olatz Ermina Página 7 La distribución normal estándar es un caso especial de la del tipo normal. Tiene una media de 0 y una desviación estándar de 1. Pero en la realidad no es así, la media es diferente de 0 al igual que la desviación puede ser diferente de 1 Así que cualquier distribución normal puede convertirse a una del tipo normal estándar mediante la siguiente fórmula: 𝑍= X−µ Ơ Donde: X = es el valor de cualquier medida u observación especifica. µ = es la media aritmética de la distribución. Ơ = es la desviación estándar de la distribución. Z= para este caso es la distancia desde menos infinito hasta el valor denotado por los parámetros. (x,Ơ,µ) Ejm: Luego de un gran número de observaciones se ha llegado a la conclusión de que el ingreso semanal específico de una empresa responde a una distribución normal y es de 250 Bs fuerte con una desviación estándar de 10 Bs fuerte. Calcule el % de ingreso semanal cuyos sueldos son: Prof. Olatz Ermina Página 8 DISTRIBUCION PONDERADA, BINOMIAL, POISSON Y NORMAL PROF: OLATZ ERMINA 1.Sea X el número de días en los que ocurrieron accidentes en una empresa durante el años pasado. Número de accidentes 0 1 2 3 4 Número de días 185 102 55 12 11 a) Es esta una distribución de frecuencias o una distribución de probabilidad? b) Construya una distribución de probabilidad. c) Cuál es la prob de que haya dos accidentes mañana? d) Cuál es la prob de que haya menos de dos accidentes mañana? e) Cuál es la prob de que haya mas de dos accidentes mañana? f) Cuantos accidentes se espera que ocurran mañana? g) Calcule la desviación estándar. 2.Sea x el numero de Equipos que fallaron un una industria en los últimos 250 días. equipos que fallaron Número de días 0 100 1 60 2 35 3 20 4 12 5 15 6 8 a) b) c) d) e) f) Construya una distribución de probabilidad. Cuál es la prob de que fallen 3 Equipos mañana? Cuál es la prob de que fallen menos de 3 Equipos mañana? Cuál es la prob de que fallen entre 1 y 4 Equipos mañana? Cuantos Equipos se espera que fallen mañana? Calcule la desviación estándar. 3. Una máquina fabrica una determinada pieza y se sabe que produce un 7 por 1000 de piezas defectuosas. Hallar la probabilidad de que al examinar 50 piezas sólo haya una defectuosa. 4. La probabilidad de éxito de una determinada vacuna es 0,70. Calcula la probabilidad de a que una vez administrada a 15 pacientes: a) Ninguno sufra la enfermedad. Prof. Olatz Ermina Página 9 b) Todos sufran la enfermedad. c) Dos de ellos contraigan la enfermedad. d) Mas de 3 contraigan la enfermedad 5. La probabilidad de éxito de cierto medicamento para tratar el cáncer es 0,60%. Calcular la probabilidad de que una vez administrado a 12 pacientes: a) ninguno sufra cáncer; b) todos continúen enfermos; c) tres de ellos contraigan la enfermedad. d) menos de 8 mejoren 6. D. Un jugador de rugby tiene 2/5 de probabilidad de hacer gol cuando juega. Si juega 5 partidos, hallar la probabilidad de que haga: a) mas de 2 goles; b) un gol por lo menos 7. Entre los trabajadores de una fábrica se producen 2 accidentes por semana en promedio. a) Calcular la probabilidad que haya 2 o menos accidentes durante dos semanas b) Calcular la probabilidad que haya 2 o menos accidentes en cada una de 2 semanas. 8) Una computadora que opera las 24 horas se cuelga 0.25 veces por hora. Cual es la probabilidad que no falle durante 2 horas? 9. Un agente de seguros vende pólizas a 5 individuos, todos de la misma edad. De acuerdo con las tablas actuariales, la probabilidad de que un individuo con esa edad viva 30 años más es de 3/5. Determinar la probabilidad de que dentro de 30 años vivan: a. Mas de 3 individuos b. Exactamente 2 individuos. 10. El número medio de automóviles que llega a una estación de suministro de gasolina es de 210 por hora. Si dicha estación puede atender a un máximo de 10 automóviles por minuto, determinar la probabilidad de que en un minuto dado lleguen a la estación de suministro más automóviles de los que puede atender. 11. La probabilidad de que un paciente se recupere de una enfermedad sanguínea es 0,4. Si se sabe que 15 personas han contraído esta enfermedad, ¿cuál es la probabilidad de que: a. Sobrevivan menos de 10 personas? b. Sobrevivan entre 3 y 8 inclusive? c. No Sobrevivan mas de 5? 12 El gerente de control de calidad de las galletas Marilyn esta inspeccionando un lote de galletas de chispas de chocolate que se acaban de hornear. Si el proceso de producción esta bajo control, el numero promedio de chispas por galleta es de 6.0 ¿Cuál es la probabilidad de que en cualquier galleta inspeccionada. a) se encuentren mas de 4 chispas? b) Entre 2 y 6 chispas? c) Menos de 4 chispas? Prof. Olatz Ermina Página 10 13. Basándose en registros anterior, el número promedio de accidentes de dos carros en un distrito de policia de Barinas es de 3.4 al día. Cual es la probabilidad de que haya: a) menos de 6 accidentes en un día cualquiera b) entre 2 y 8 accidentes en un día cualquiera. 14. Suponga que la cantidad de tiempo que lleva a la superintendencia de contribuciones enviar reembolsos a los contribuyentes se distribuye normalmente con una media de 12 semanas y una desviación de 3. Que proporción de contribuyentes debe tener un reembolso: a) menor a 6 semanas. b) mayor a 8 semanas c) entre 2 y 10 semanas. 15. Suponga que la cantidad de sodio por rebanada de pan blanco producido por una compañía de procesamiento de comida particular se distribuye normalmente con una media de 110 mg y una desviación estándar de 25 mg. Cual es la probabilidad de que una rebanada seleccionada aleatoriamente contenga: a) entre 82 y 100 mg de sodio. b) menos de 90 mg de sodio. c) mas de 100 mg de sodio. 16. La probabilidad de que un arquero ataje un penal es del 80%. Si el hombre lo intenta en 4 oportunidades, calcular la probabilidad de que: a) No ataje la pelota; b) ataje más de 2 penal; c) ataje 3 penales. 17. La probabilidad de que un hombre lave la ropa en su casa es del 10%. Si lo hace 7 veces, calcular la probabilidad de que: a) no lave nunca; b) lave alguna vez; c) lave 5 veces. 18 se realiza una prueba de vida útil para un gran número de pilas alcalinas tipo AAA. Se reveló que la duración media para un uso especifico antes de la falla es de 19 horas con una desviación estándar de 1.2 horas. La distribución de las duraciones se aproxima a una distribución normal. Cuál es la probabilidad. A) que falle con más de 16 horas de uso. B) que falle entre 14 y 18 horas de uso. c) que falle antes de 15 horas Prof. Olatz Ermina Página 11