Combinatoria y definiciones básicas de probabilidad Introducción a la Probabilidad Francisco Rodríguez Henríquez Definiciones de probabilidad • Probabilidad como intuición • Probabilidad como la razón de resultados favorables • Probabilidad como medida de la frecuencia de ocurrencia • Definición axiomática de la probabilidad Introducción a la Probabilidad Francisco Rodríguez Henríquez Probabilidad como intuición En este modelo, la probabilidad intenta predecir eventos con base en la intuición. Por ejemplo, “mañana lloverá” o “él está manejando muy rápido”. Introducción a la Probabilidad Francisco Rodríguez Henríquez Probabilidad como la razón de resultados favorables En esta línea de razonamiento, la cual es no experimental, la probabilidad de un evento puede ser calculada a priori a través del cálculo del número de maneras en que un determinado evento E puede ocurrir seguido por el cálculo de la razón NE/N, donde N representa el conjunto de todos los resultados posibles. Este modelo supone que todos los resultados son igualmente probables. Introducción a la Probabilidad Francisco Rodríguez Henríquez Probabilidad como medida de la frecuencia de ocurrencia Sea E una colección de resultados que poseen un cierto atributo. Suponga que un experimento o juego es repetido N veces y que NE representa el número de veces que el resultado E fue obtenido. La razón nE P ( A) lim n n para N suficientemente grande se define como la probabilidad de A. Introducción a la Probabilidad Francisco Rodríguez Henríquez Definición axiomática de la probabilidad La probabilidad P[·] asigna a cada evento E en el universo de posibilidades un número P[E], llamado la probabilidad de E, tal que: 1. P[E] ≥ 0 2. P[] = 1 3. P[EF] = P[E] + P[F] si EF = . Introducción a la Probabilidad Francisco Rodríguez Henríquez Definición axiomática de la probabilidad Los tres axiomas básicos de la probabilidad son suficientes para establecer toda una serie de definiciones básicas. En particular: 4. P[] = 0 5. P[E] = 1 - P[EC] 6. P[EFC] = P[E] - P[EF] 7. P[E F] = P[E] +P[F] - P[EF] Introducción a la Probabilidad Francisco Rodríguez Henríquez Definición axiomática de la probabilidad El último resultado de la lámina anterior nos permite escribir la cota superior del operador unión como sigue: n n P Ei PEi si Ei E j i 1 i 1 Por lo que, n n P Ei PEi i 1 i 1 Introducción a la Probabilidad Francisco Rodríguez Henríquez Probabilidad conjunta Suponga que se realizan experimentos del estado del tiempo en la ciudad de México. En particular estamos interesados en tres eventos A, B, C, tales que: • A es el evento en que en un cierto día la temperatura ambiente estuvo por encima de los 15C; • B es el evento en que en un determinado día haya caído una precipitación pluvial superior a los 8 milímetros y; • C es el evento en que en un determinado día tanto A como B hayan acontecido. Introducción a la Probabilidad Francisco Rodríguez Henríquez Probabilidad conjunta Puesto que C es un evento, P[C] es su probabilidad de ocurrencia de acuerdo a las definiciones axiomáticas dadas anteriormente. Pero P[C] = P[AB]. Por lo que definimos el número P[AB] como la probabilidad conjunta de los eventos A y B. Claramente, la probabilidad conjunta puede ser extendida a más de dos eventos, por ejemplo, P[EFG] es la probabilidad conjunta que E, F, y G ocurran simultáneamente. Introducción a la Probabilidad Francisco Rodríguez Henríquez Probabilidad conjunta Suponga ahora que ni denota el número de días (veces) que el evento i ha ocurrido. Entonces, a través de un período de 1000 días (n = 1000) se hicieron las siguientes observaciones: nA = 811, nB = 306, nAB = 290. Utilizando el modelo de frecuencia de eventos de la probabilidad concluimos: n 811 P A A 0.811 n 1000 nB 306 PB 0.306 n 1000 n AB 290 PAB 0.29 n 1000 Introducción a la Probabilidad Francisco Rodríguez Henríquez Probabilidad Condicional Considere ahora el cociente nAB/nA. Este valor representa la frecuencia con la cual el evento C = AB ocurrió cuando A aconteció. En palabras, es el número de días en que la cantidad de lluvia excedió 8 milímetros en aquellos días en los cuales la temperatura excedió los 15C. Note que: n AB n AB / n P AB nA nA / n P A Por lo que se puede definir el concepto de probabilidad condicional PAB P[B|A] como: PB | A , PA 0 PA Introducción a la Probabilidad Francisco Rodríguez Henríquez Probabilidad incondicional • En muchos problemas de ingeniería conviene calcular probabilidades incondicionales, P[B], de un evento B en términos de la suma ponderada de probabilidades condicionales. Teorema Suponga que A1, A2, …, An son n eventos mutuamente n excluyentes, esto es, Ai . Entonces, con P[Ai]0 para toda i 1 i, se tiene PB PB | A1 PA1 PB | An PAn Introducción a la Probabilidad Francisco Rodríguez Henríquez Probabilidad incondicional: ejemplo Para El canal simétrico binario mostrado en la figura, calcule P[Y=0] y P[Y=1]. 0.9 X=0, P[X=0]=1/2 Y=0 0.1 0.9 X=1, P[X=1]=1/2 Introducción a la Probabilidad 0.1 Y=1 Francisco Rodríguez Henríquez Probabilidad incondicional: ejemplo Para El canal simétrico binario mostrado en la figura, calcule P[Y=0] y P[Y=1]. 0.9 X=0, P[X=0]=1/2 Y=0 0.1 0.9 0.1 X=1, P[X=1]=1/2 Y=1 P[Y = 0] = P[Y = 0|X = 0]P[X = 0] + P[Y = 0|X = 1]P[X = 1] = (0.9)(0.5) + (0.1)(0.5) = 0.5 = P[Y=1] Introducción a la Probabilidad Francisco Rodríguez Henríquez Independencia Se dice que dos eventos A, B con P[A] > 0 y P[B] >0 son independientes, si y sólo si P[AB] = P[A]P[B]. Puesto que en general, P[AB] = P[B|A]P[A] = P[A|B]P[B], se concluye que para eventos independientes se cumple que: P[A|B] = P[A] y P[B|A] = P[B] Tres eventos son independientes si y sólo si: P[ABC] = P[A]P[B]P[C] y P[AB] = P[A]P[B]; P[AC] = P[A]P[C]; P[BC] = P[B]P[C] Introducción a la Probabilidad Francisco Rodríguez Henríquez Nuevamente el canal binario simétrico Para el canal simétrico binario mostrado en la figura, sabiendo que un 1 ha sido recibido ¿Cuál es la probabilidad que un 1 fue transmitido? X=0, P[X=0]=P0 X=1, P[X=1]=1- P0=P1 Introducción a la Probabilidad 1- Y=0 1- Y=1 Francisco Rodríguez Henríquez Nuevamente el canal binario simétrico Sabiendo que un 1 ha sido recibido ¿Cuál es la probabilidad que un 1 fue transmitido? 1- X=0, P[X=0]=P0 X=1, P[X=1]=1- P0=P1 Y=0 1- Y=1 P X 1, Y 1 PY 1 PY 1 | X 1PX 1 PY 1 | X 1PX 1 PY 1 | X 0PX 0 P1 1 P1 1 P0 PX 1 | Y 1 Introducción a la Probabilidad Francisco Rodríguez Henríquez Nuevamente el canal binario simétrico P X 1, Y 1 PY 1 PY 1 | X 1PX 1 PY 1 | X 1PX 1 PY 1 | X 0PX 0 P1 1 P1 1 P0 PX 1 | Y 1 Introducción a la Probabilidad Francisco Rodríguez Henríquez Ejemplo: prueba de cáncer Suponga que existe una prueba de cáncer con las siguientes propiedades. Sea: – A := Evento que la prueba dictamine que el paciente tiene cáncer – B := Evento que la persona tiene cáncer – AC := Evento que la prueba dictamine que el paciente está sano – BC := Evento que la persona está sana Se conoce que P[A|B] = P[AC|BC] =0.95 y P[B] = 0.005. ¿Es la prueba confiable? Introducción a la Probabilidad Francisco Rodríguez Henríquez Ejemplo: prueba de cáncer Suponga que existe una prueba de cáncer con las siguientes propiedades. Sea: – – – – A := Evento que la prueba dictamine que el paciente tiene cáncer B := Evento que la persona tiene cáncer AC := Evento que la prueba dictamine que el paciente está sano BC := Evento que la persona está sana Se conoce que P[A|B] = P[AC|BC] =0.95 y P[B] = 0.005. ¡Sólo en el ¿Es la prueba confiable? PB PA | B PB | A PA | B PB P A | B C P B C 0.0050.95 0.087 0.0050.95 0.050.95 Introducción a la Probabilidad 8.7% de los casos se da el diagnóstico correcto! Francisco Rodríguez Henríquez Combinatoria • Considera una población de n elementos a1, a2,…, an. Cualquier arreglo ordenado ak1, ak2,…,akr de r símbolos se conoce como una muestra ordenada de tamaño r. • Considera una urna genérica que contiene n pelotas numeradas. Pregunta ¿De cuántas maneras se pueden formar muestras ordenadas de tamaño r? Se consideraran dos casos. Introducción a la Probabilidad Francisco Rodríguez Henríquez Muestras con reemplazo • Después que se extrae una pelota de la urna su número es anotado y después la pelota es regresada a la urna. • Note que para la primera muestra hay n opciones, y para la segunda, también n opciones. • Por lo tanto para una población de n elementos, existen nr muestras ordenadas de tamaño r que pueden ser formadas. • Ejemplo: ¿Cuántas contraseñas se pueden formar utilizando el alfabeto inglés [26 letras] y un tamaño fijo de 8 caracteres? 268. Introducción a la Probabilidad Francisco Rodríguez Henríquez Muestras sin reemplazo • Después que cada pelota es extraída, no se vuelve a regresar a la urna. • Note que para la primera muestra hay n opciones, para la segunda, n-1 opciones, etc. • Por lo tanto para una población de n elementos, existen . • P(n, r ) n r nn 1n 2 n r 1 n! n r ! Ejemplo: ¿De cuántas maneras se puede seleccionar tres libros de un total de 10? (10)3 = 10*9*8= 720. Introducción a la Probabilidad Francisco Rodríguez Henríquez Combinaciones Pregunta frecuente en probabilidad: ¿Cuántos grupos, esto es, sub-poblaciones de tamaño r pueden ser formados de una población total de tamaño n? Por ejemplo, suponga que se tienen 6 pelotas numeradas, ¿cuántos grupos de tamaño 2 pueden ser formados? 12 23 34 45 56 13 24 35 46 14 25 36 15 26 16 Introducción a la Probabilidad Francisco Rodríguez Henríquez Combinaciones Note que el resultado anterior es diferente del número de muestras ordenadas que pueden ser formadas sin reemplazo: Con reemplazo 12 21 31 41 51 61 11 21 31 41 51 61 13 23 32 42 52 62 12 22 32 42 52 62 14 24 34 43 53 63 13 23 33 43 53 63 15 25 35 45 54 64 14 24 34 44 54 64 16 26 36 46 56 15 25 35 45 55 65 65 16 26 36 46 56 66 Introducción a la Probabilidad Francisco Rodríguez Henríquez Combinaciones • Una fórmula general para el número de subpoblaciones C(n, r) de tamaño r en una población de tamaño n puede ser calculada como sigue. • Ya convinimos que el número de muestras ordenadas de tamaño r que se pueden formar es P(n,r). Considere una subpoblación específica de tamaño r. Para este grupo hay r! diferentes muestras ordenadas, por lo tanto se puede escribir: C(n, r) r! = P(n,r). Es decir: n r C n, r n n! r! (n r )!r! r Introducción a la Probabilidad Francisco Rodríguez Henríquez Teorema del Binomio • Una fórmula muy famosa que se remonta a los tiempos de Newton se conoce como el teorema del binomio: n k nk a b a b k 0 k n • n Con ayuda del teorema del binomio se puede demostrar n [pero, ¿cómo?] n n 2 k 0 k Introducción a la Probabilidad Francisco Rodríguez Henríquez Distribución binomial Bernoulli Suponga que la probabilidad que un evento ocurra es p y que no ocurra es q = 1-p. Considere además que se realizan un total de n experimentos Bernoulli, de los cuales k son exitosos y el resto son fracasos. Pregunta: ¿Cuál es la probabilidad de observar exactamente k éxitos? Una posibilidad sería: ppp…pqqq…q = pkqn-k ¿Pero cuántas posibilidades hay en total? Respuesta en la próxima lámina Introducción a la Probabilidad Francisco Rodríguez Henríquez Distribución binomial Bernoulli b ( k ; n, p ) C ( n , k ) p q k nk n k nk p q k N = 10; P= 2/3. Introducción a la Probabilidad Francisco Rodríguez Henríquez