ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas Tema 3 Espacios de probabilidad: Definición axiomática y propiedadades básicas de la probabilidad 1. Objetivo del Cálculo de Probabilidades El objetivo del Cálculo de Probabilidades es establecer y desarrollar modelos matemáticos adaptados al estudio de situaciones que presentan cierto grado de incertidumbre. Este tipo de situaciones son, asimismo, objeto de estudio de la Estadı́stica, ciencia de la que puede darse la siguiente definición (Barnett, 1973): ”La Estadı́stica es la ciencia que estudia cómo debe emplearse la información y dar una guı́a de acción en situaciones prácticas que envuelven incertidumbre” Ası́, el Cálculo de Probabilidades y la Estadı́stica son disciplinas ı́ntimamente relacionadas en cuanto que ambas se refieren al estudio de un mismo tipo de situaciones. El Cálculo de Probabilidades desarrolla los modelos teóricos para tratar tales situaciones y la Estadı́stica ajusta dichos modelos a situaciones concretas. En este primer tema estableceremos las nociones básicas para el desarrollo formal del Cálculo de Probabilidades, por lo que comenzaremos describiendo el tipo de situaciones objeto de estudio; esto es, los fenómenos aleatorios. La manifestación fı́sica de una situación que envuelve incertidumbre es lo que en el lenguaje estadı́stico se denomina fenómeno aleatorio, y se caracteriza esencialmente porque su desarrollo no es previsible. 2. Fenómenos y experimentos aleatorios Entre los diversos fenómenos que pueden presentarse o abstraerse en un determinado campo de interés existen los denominados fenómenos determinı́sticos, cuyo desarrollo es perfectamente previsible; y aquellos que se desarrollan en un ambiente de incertidumbre, pudiendo dar lugar a distintas manifestaciones o resultados, llamados fenómenos aleatorios. La imposibilidad de prever el resultado de un fenómeno aleatorio puede tener diversas causas, según los casos. Por ejemplo: Las leyes que rigen el fenómeno pueden no ser conocidas suficientemente para ser formuladas matemáticamente. Los factores que intervienen en el desarrollo del fenómeno son muy numerosos, o difı́ciles de apreciar; o, incluso, no pueden medirse sin perturbar su desarrollo. En tales casos se dice que el resultado es consecuencia del azar. El carácter imprevisible de estas consecuencias hace inútil cualquier intento de hallar reglas determinı́sticas que rijan la aparición de los resultados. Patricia Román Román 1 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas En la actividad diaria nos encontramos con cierto tipo de fenómenos que pueden ser sometidos a experimentación con el fin de recabar información sobre ellos. En el sentido usual del término, un experimento es un procedimiento u operación que puede dar lugar a distintos resultados, todos ellos previamente identificables. Nos ocuparemos por el momento de aquellos experimentos que pueden repetirse sucesivamente bajo las mismas condiciones. Entre ellos cabe distinguir igualmente dos tipos: Experimentos determinı́sticos: aquellos que dan lugar al mismo resultado siempre que se realicen bajo idénticas condiciones. Un ejemplo claro serı́a el experimento consistente en medir el espacio recorrido por un cuerpo, en movimiento rectilı́neo, a velocidad constante, v, durante un tiempo t. El resultado serı́a e = vt; es decir, fijadas las condiciones iniciales, v y t, el espacio e queda totalmente determinado por ellas. Experimentos aleatorios: se caracterizan porque sus resultados pueden variar, incluso si el experimento se realiza bajo idénticas condiciones iniciales. Serı́an ejemplos de este tipo de experimentos el lanzamiento de una moneda, la extracción de una bola de una urna, etc. Ası́, podemos definir un experimento aleatorio como aquel que satisface las siguientes condiciones: Todos sus posibles resultados son conocidos por anticipado. Puede repetirse sucesivamente en las mismas condiciones. Bajo las mismas condiciones, puede dar lugar a distintos resultados. No puede preverse su resultado en una experiencia particular. Comenzaremos definiendo una serie de conceptos básicos asociados a un experimento aleatorio (espacio muestral y suceso). Señalaremos el paralelismo entre suceso y conjuntos; en definitiva, siempre podrá identificarse un suceso con un subconjunto del espacio muestral, lo que nos permitirá hacer uso de la Teorı́a de Conjuntos para especificar las relaciones entre sucesos en términos de operaciones entre conjuntos. Seguidamente, introduciremos dos estructuras de conjuntos, álgebra y σ-álgebra, siendo ésta última la que constituye el soporte material sobre el que se define la función de probabilidad. 2.1. Espacio muestral • Si consideramos un experimento aleatorio arbitrario, cada uno de sus posibles resultados indescomponibles en otros más simples (de forma que no pueden ocurrir dos simultáneamente, pero sı́ uno necesariamente) se denomina resultado elemental, suceso elemental o punto muestral. Patricia Román Román 2 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas • El conjunto formado todos los sucesos elementales asociados a un experimento aleatorio se le denomina espacio muestral y se le designa por Ω. Por ejemplo, en el experimento aleatorio consistente en lanzar un dado, el espacio muestral es Ω = {1, 2, 3, 4, 5, 6}. • El espacio muestral asociado a un experimento aleatorio puede ser de tres tipos, dependiendo de su cardinal: Espacio muestral finito, cuando tiene un número finito de elementos. Por ejemplo, en el experimento aleatorio consistente en lanzar un dado, el espacio muestral es finito Ω = {1, 2, 3, 4, 5, 6}. Espacio muestral infinito numerable, si tiene un número infinito numerable de elementos; o, dicho de otra forma, si se puede establecer una aplicación biyectiva entre los elementos del espacio muestral y los números naturales. Como ejemplo de un espacio muestral infinito numerable, consideremos el experimento aleatorio consistente en lanzar un dado hasta que aparezca un 1. En este caso el espacio muestral es Ω = {1, 21, 31, 41, 51, 61, 221, 231, 241, 251, 261, 321, 331, 341, 351, 361, 421, 431, 441, 451, 461, 521, 531, 541, 551, 561, 621, 631, 641, 651, 661, 2221, 2231, . . .} Si consideramos como elementos del espacio muestral el número de lanzamientos necesarios hasta obtener un 1, entonces se tiene Ω1 = {1, 2, 3, 4, 5, 6, 7, 8, . . .} También se suele llamar espacio muestral discreto indistintamente a los casos finito e infinito numerable. Espacio muestral continuo, si tiene un número infinito no numerable de elementos. Es decir, si no se puede establecer una correspondencia biunı́voca entre los elementos del espacio muestral y los números naturales. Por ejemplo, si lanzamos un dardo a un diana y estamos interesados en la posición que ocupará el dardo que puede ser cualquier punto de la superficie de la diana; en este caso, el espacio muestral es Ω = {todos los puntos de la superficie de la diana}. Otro ejemplo, serı́a la observación de la duración de una bombilla; en este caso Ω = R+ 2.2. Sucesos En ocasiones, podemos no estar interesados en el resultado elemental que aparece en la realización de un experimento aleatorio, sino que nuestro interés se centrará en alguna caracterı́stica Patricia Román Román 3 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas concreta que puede consistir en más de un suceso elemental. Por ejemplo en el experimento aleatorio de lanzar un dado, consideramos el hecho de que salga un número par. Llamaremos suceso aleatorio o simplemente suceso a cualquier caracterı́stica, hecho o proposición lógica que pueda formularse en relación a un experimento aleatorio, cuya ocurrencia o no pueda ser observada tras la realización del experimento. Ası́, todo suceso puede identificarse con un subconjunto del espacio muestral, el conjunto de resultados o sucesos elementales cuya aparición implica la ocurrencia del suceso. Esta identificación de un suceso con un subconjunto del espacio muestral hace posible el uso de la Teorı́a de Conjuntos para especificar las relaciones y operaciones entre sucesos. Cabe destacar, en principio, cuatro tipos de sucesos, según el número de elementos que lo constituyan: Suceso elemental, suceso simple o punto muestral es cada uno de los resultados posibles del experimento aleatorio; es decir, un suceso elemental consta de un solo elemento del espacio muestral Ω. Suceso compuesto, es el que consta de dos o más sucesos elementales. Suceso seguro, cierto o universal, es aquel que ocurre siempre. Consta de todos los sucesos elementales del espacio muestral y se identifica con el espacio muestral total Ω. Suceso imposible, es el que no ocurre nunca. No contiene ningún elemento del espacio muestral y se identifica con ∅. Ejemplo.- Supongamos el experimento aleatorio de lanzar un dado y observar el número que aparece. El espacio muestral es Ω = {1, 2, 3, 4, 5, 6} y algunos posibles sucesos son A1 A2 A3 A4 A5 = que = que = que = que = que aparezca aparezca aparezca aparezca aparezca el 1 = {1} un número un número un número un número par = {2, 4, 6} mayor que 4 = {5, 6} mayor que 6 = ∅ entre 1 y 6 = Ω El suceso A1 es simple, los sucesos A2 y A3 son compuestos, el suceso A4 es el suceso imposible y A5 el suceso seguro. Nota.- Observemos que el suceso aparecer un número mayor que 8 será un suceso que, en principio, podrı́a parecer distinto de A4 ; sin embargo, en la práctica se identifica con el mismo subconjunto del espacio muestral. 2.3. Operaciones y relaciones entre sucesos Como ya hemos indicado, la identificación de un suceso con un subconjunto del espacio muestral hace posible el uso de la Teorı́a de Conjuntos para especificar matemáticamente las relaciones y operaciones entre sucesos. Recordamos a continuación las ideas y notaciones básicas de la Teorı́a de Conjuntos en relación a los sucesos asociados a un experimento aleatorio. Patricia Román Román 4 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas Las operaciones básicas entre conjuntos: complementación, unión e intersección, equivalen, en el lenguaje probabilı́stico a la no ocurrencia de un suceso, la ocurrencia alternativa y a la ocurrencia simultánea, respectivamente. Suceso complementario o contrario. Dado un suceso A, se define el suceso complementario o contrario de A como aquel suceso que ocurre si y sólo si no ocurre el suceso A; o bien, es el suceso constituido por los sucesos elementales del espacio muestral Ω que no pertenecen a A. Lo notaremos por A. Su representación viene dada por Si consideramos el suceso A = obtener un número par = {2, 4, 6} el suceso complementario es A = {1, 3, 5} = obtener un número impar. Propiedades ∅=Ω Ω=∅ A=A Unión de sucesos. Dados dos sucesos A y B de un experimento aleatorio, se define la unión de ambos sucesos como aquel suceso que ocurre siempre que ocurra el suceso A, o el B o ambos a la vez y se denota por A ∪ B. Está compuesto por los sucesos elementales que pertenecen a A, o a B o a ambos a la vez. Gráficamente usando un diagrama de Venn se representa como Patricia Román Román 5 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas Por ejemplo, dados los sucesos A = obtener un número impar al lanzar un dado B = obtener un número mayor que 4 el suceso unión será A ∪ B = {1, 3, 5} ∪ {5, 6} = {1, 3, 5, 6}. Propiedades Conmutativa A ∪ B = B ∪ A Asociativa A ∪ (B ∪ C) = (A ∪ B) ∪ C Idempotente A ∪ A = A A∪A=Ω A∪Ω=Ω A∪∅=A En general, dados n sucesos A1 , A2 , . . . , An , su unión A1 ∪ A2 ∪ · · · ∪ An = n [ Ai es aquel suceso i=1 que ocurre cuando ocurre al menos uno de los sucesos Ai . Esta constituido por los resultados o sucesos elementales que pertenecen al menos a uno de los sucesos Ai , i = 1, 2, . . . , n, es decir, el suceso que ocurre cuando ocurre al menos uno de los sucesos Ai . De manera análoga se puede definir la unión para un número infinito numerable o no numerable de sucesos. Patricia Román Román 6 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas Intersección de sucesos. Dados dos sucesos A y B de un experimento aleatorio, se define la intersección de ambos sucesos como aquel suceso que ocurre cuando ocurren A y B simultáneamente y se denota por A ∩ B. Está constituido por los resultados elementales que pertenecen simultáneamente a A y a B. Gráficamente usando un diagrama de Venn se representa como Por ejemplo, dados los sucesos A = obtener un número impar al lanzar un dado B = obtener un número mayor que 4 el suceso intersección será A ∩ B = {1, 3, 5} ∩ {5, 6} = {5}. Propiedades Conmutativa A ∩ B = B ∩ A Asociativa A ∩ (B ∩ C) = (A ∩ B) ∩ C Idempotente A ∩ A = A A∩A=∅ A∩Ω=A A∩∅=∅ Distributiva Patricia Román Román A1 ∪ (A2 ∩ A3 ) = (A1 ∪ A2 ) ∩ (A1 ∪ A3 ) A1 ∩ (A2 ∪ A3 ) = (A1 ∩ A2 ) ∪ (A1 ∩ A3 ) 7 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas Leyes de De Morgan A∪B =A∩B A∩B =A∪B En general, dados n sucesos A1 , A2 , . . . , An , su intersección A1 ∩ A2 ∩ · · · ∩ An = n \ Ai es otro i=1 suceso formado por los resultados o sucesos elementales que pertenecen a todos los sucesos Ai , i = 1, 2, . . . , n, es decir, el suceso que ocurre cuando ocurren todos los sucesos Ai . De manera análoga se puede definir la intersección para un número infinito numerable o no numerable de sucesos. En este caso las leyes de De Morgan quedan n [ Ai = n \ Ai n \ Ai = n [ i=1 i=1 i=1 i=1 ∞ [ ∞ \ ∞ \ ∞ [ Ai o bien, i=1 Ai = i=1 Ai Ai = i=1 Ai i=1 Diferencia de sucesos. Dados dos sucesos A y B de un experimento aleatorio, se define la diferencia A − B como aquel suceso que ocurre siempre que ocurra A y no ocurra B. Está constituido por los sucesos elementales que pertenecen a A y no pertenecen a B. Su representación viene dada por Además, la diferencia de dos sucesos se puede expresar como A − B = A ∩ B. Observemos que no se cumple la propiedad conmutativa Patricia Román Román 8 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas A − B 6= B − A ni la asociativa (A − B) − C 6= A − (B − C) y que el complementario de un suceso se puede expresar en términos de diferencias como A=Ω−A Por ejemplo, dados A = que aparezca el 2 ó el 4 = {2, 4} B = que aparezca un número par = {2, 4, 6} la diferencia B − A es B − A = {6}. Diferencia simétrica de sucesos. Dados dos sucesos A y B, se define la diferencia simétrica A4B como el suceso que ocurre si ocurre uno y sólo uno de los dos. Está constituido por los sucesos elementales de B que no están en A y los de A que no están en B A4B = (A − B)U (B − A) Su representación viene dada por Esta operación cumple la propiedad conmutativa pero no la asociativa. Suceso contenido en otro. Dados dos sucesos A y B de un experimento aleatorio, diremos que el suceso A está contenido en B, y lo notaremos por A ⊂ B si siempre que ocurre Patricia Román Román 9 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas el suceso A, también ocurre el suceso B. En la identificación con conjuntos, si cada suceso elemental perteneciente a A pertenece también a B, es decir. Por ejemplo, dados A = que aparezca el 2 ó el 4 = {2, 4} B = que aparezca un número par = {2, 4, 6} entonces A ⊂ B. También se dice que A implica B y se denota por A ⇒ B. Igualdad de sucesos. Dados dos sucesos A y B de un experimento aleatorio, diremos que son iguales si siempre que ocurre el suceso A ocurre el suceso B y siempre que ocurre el suceso B ocurre el suceso A y lo notaremos por A = B. Es decir, se verifica A⊂B A = B ⇐⇒ B⊂A En la identificación con conjuntos coincide con la definición de igualdad de conjuntos, es decir, dos sucesos serán iguales si contienen exactamente los mismos puntos muestrales. Por ejemplo, los sucesos A = obtener un número par al lanzar un dado B = obtener un 2, 4 o 6 son iguales. Además, son de interés los siguientes conceptos: Sucesos disjuntos, incompatibles o mutuamente excluyentes. Dos sucesos A y B son disjuntos o incompatibles si no pueden ocurrir simultáneamente; o bien, dicho de otra forma, si siempre que ocurre uno de los sucesos no se verifica el otro, o sea, la ocurrencia de uno excluye la posibilidad de que ocurra el otro. En términos de conjuntos, dados dos sucesos A y B de un experimento aleatorio, diremos que son disjuntos, incompatibles o mutuamente excluyentes si su intersección es el suceso imposible A ∩ B = ∅, es decir, si no tienen ningún suceso elemental en común. Gráficamente, su representación es Patricia Román Román 10 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas En el ejemplo considerado del lanzamiento de un dado los sucesos A = obtener un número impar B = obtener un número par verifican A ∩ B = ∅, es decir, son excluyentes o disjuntos. En general, dados n sucesos A1 , A2 , . . . , An diremos que son mutuamente excluyentes, disjuntos o incompatibles dos a dos, si cada pareja de sucesos son mutuamente excluyentes, es decir, si Ai ∩ Aj = ∅, ∀i 6= j (i, j = 1, 2, . . . , n). Sistema exhaustivo de sucesos. Si los sucesos A1 , A2 , . . . , An son tales que verifican que la unión de ellos es igual al espacio muestral A1 ∪ A2 ∪ · · · An = Ω se dice que forman una colección o sistema exhaustivo de sucesos. Sistema completo de sucesos o partición del espacio muestral. Si un conjunto de sucesos constituyen un sistema exhaustivo de sucesos y, además, son mutuamente excluyentes entonces, se dice que forman un sistema completo de sucesos o una partición de E. Por ejemplo, el conjunto formado por todos los sucesos elementales constituye un sistema completo o partición de Ω. Ejemplo. Sean A1 , A2 y A3 tres sucesos de un espacio muestral Ω. Expresar los siguientes sucesos en términos de ellos. 1) Los tres sucesos ocurren: A1 ∩ A2 ∩ A3 . 2) No ocurre ninguno de los tres: A1 ∩ A2 ∩ A3 , que usando las leyes de Morgan se puede escribir también como A1 ∪ A2 ∪ A3 . 3) Exactamente ocurre uno: (A1 ∩ A2 ∩ A3 ) ∪ (A1 ∩ A2 ∩ A3 ) ∩ (A1 ∩ A2 ∩ A3 ) 4) Exactamente ocurren dos: (A1 ∩ A2 ∩ A3 ) ∪ (A1 ∩ A2 ∩ A3 ) ∩ (A1 ∩ A2 ∩ A3 ) 5) Ocurre A1 y A2 o A3 , pero no ambos: A1 ∩ (A2 ∪ A3 ) ∩ (A2 ∩ A3 ) = A1 ∩ (A2 4A3 ) 6) Ocurre A2 o A3 pero no A1 : A1 ∩ (A2 ∪ A3 ) Patricia Román Román 11 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas 2.4. Álgebra y σ-álgebra de sucesos • En ciertas ocasiones, al considerar un experimento aleatorio, podemos no estar interesados en calcular la probabilidad de cualquier subconjunto del espacio muestral sino que sólo serán de interés una determinada familia de sucesos. La finalidad de la definición axiomática de la probabilidad es formalizar la asignación de probabilidades a los sucesos de interés, de modo que esta asignación de probabilidades sea consistente con las operaciones lógicas de sucesos. Para ello es necesario dotar de una estructura algebraica adecuada a la familia de sucesos a los que se va a aplicar la probabilidad. • Antes de definir las estructuras básicas (álgebra para espacios muestrales finitos y σ-álgebra para espacios muestrales arbitrarios) definiremos una Clase de conjuntos a un conjunto cuyos elementos son conjuntos, esto es, dado un espacio arbitrario Ω, una clase de conjuntos de Ω será un subconjunto de P(Ω) (partes de Ω, esto es, el conjunto formado por todos los subconjuntos de él). Se dice que una clase de conjuntos es cerrada para una determinada operación si al realizar dicha operación con elementos de la clase, el resultado sigue siendo un elemento de la clase. A una clase de conjuntos del espacio muestral asociado a un experimento aleatorio se le denomina clase de sucesos. Álgebra de Boole (Campo). Una clase no vacı́a de conjuntos de Ω, A ⊂ P(Ω), tiene estructura de Álgebra de sucesos o Álgebra de Boole, si es cerrada para uniones finitas y para la operación de complementario, esto es, si 1. ∀A ∈ A se verifica que su complementario A ∈ A. 2. ∀A1 , A2 , . . . An ∈ A se verifica que A1 ∪ A2 ∪ · · · ∪ An = n [ Ai ∈ A. i=1 De estas propiedades se deducen las siguientes a) El espacio muestral Ω ∈ A. En efecto, dado un suceso A ∈ A, por la condición 1 se verifica que A ∈ A y por la condición 2, A ∪ A = Ω ∈ A. b) El suceso imposible ∅ ∈ A. En efecto, Ω = ∅ c) En función de las leyes de De Morgan, la condición 2 se puede intercambiar por: ∀A1 , A2 , . . . An ∈ A se verifica A1 ∩ A2 ∩ · · · ∩ An = n \ Ai ∈ A i=1 d) Si A, B ∈ A, entonces • A−B =A∩B ∈A • A4B = (A − B) ∪ (B − A) ∈ A Patricia Román Román 12 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas Si extendemos las propiedades de ser cerrada para uniones o intersecciones finitas al caso infinito numerable aparece una nueva estructura algebraica que recibe el nombre de σ− álgebra. σ-ÁLGEBRA (σ-CAMPO). Diremos que una clase de sucesos no vacı́a, A ⊂ P(Ω), tiene estructura de σ-álgebra si se verifica que es cerrada para complementarios y uniones numerables, esto es, si verifica las condiciones: 1. ∀A ∈ A se verifica que su complementario A ∈ A. 2. Dada una colección numerable de sucesos, {Ai }i∈N ⊂ A, se verifica que A1 ∪ A2 ∪ A3 ∪ · · · = ∞ [ Ai ∈ A. i=1 De la misma forma que en el caso de álgebra se puede comprobar que el vacı́o y el total pertenecen a cualquier σ−álgebra, y que, aplicando las leyes de De Morgan, la condición 2 se puede intercambiar con la condición de ser una clase cerrada para intersecciones numerables. Notemos además que toda σ-álgebra es un álgebra. Por último, al par formado por un espacio muestral Ω y una clase de conjuntos A con estructura de σ−álgebra, esto es (Ω, A), se le denomina espacio medible y a los conjuntos de A, conjuntos medibles. Estudiaremos cómo es posible definir sobre esta estructura una medida, y en particular, una medida de probabilidad. Observemos previamente que es posible tener espacios medibles distintos asociados a un mismo espacio Ω. Por ejemplo Ω = {1, 2, 3, 4} A = {∅, Ω, {1}, {2, 3, 4}} A0 = {∅, Ω, {1, 2}, {3, 4}} Entonces (Ω, A) es un espacio medible distinto de (Ω, A0 ) Si recordamos la definición de suceso: caracterı́stica, hecho o proposición lógica de interés en relación a un experimento aleatorio, cuya ocurrencia o no pueda ser observada tras la realización del experimento, desde una perspectiva intuitiva notamos que la clase de sucesos a considerar en un experimento aleatorio debe tener estructura de álgebra (en espacios muestrales finitos) o de σ-álgebra (en espacios muestrales infinitos). En efecto, si A es un suceso (nos interesamos por su ocurrencia o no) también lo será A, cuya ocurrencia o no está totalmente determinada por la de A. Por otra parte, si {An }n es una colección numerable de sucesos, también puede ser S de interés el hecho de que ocurra o no alguno de esos sucesos, esto es, n An debe ser también un suceso. Patricia Román Román 13 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas 3. Distintas concepciones de Probabilidad Debemos indicar desde un principio que no existe en la actualidad una definición universal del concepto probabilidad. De hecho, a lo largo de la historia se han dado diferentes interpretaciones y definiciones de este concepto y aún hoy en dı́a existe una gran controversia entre los probabilistas sobre cómo debe interpretarse la probabilidad y dar una definición formal de acuerdo a la interpretación, ası́ como el tipo de situaciones a las que debe aplicarse. Antes de establecer la definición axiomática de probabilidad, que nos proporcionará las bases para el desarrollo matemático formal de la Teorı́a de la Probabilidad (que será nuestro objetivo en este curso) vamos a exponer dos de las interpretaciones más significativas más significativas de la probabilidad, cada una de las cuales, como veremos, es apropiada para aplicar la Teorı́a de la Probabilidad a distintas situaciones. 3.1. Concepción clásica: Regla de Laplace (1812) Consideremos un experimento aleatorio con un número finito de posibles resultados (espacio muestral finito) de forma que todos ellos sean igualmente factibles, esto es, todos tienen la misma posibilidad de aparecer en una realización particular del experimento. Sea A un suceso arbitrario asociado al experimento, que se puede presentar en m de los n posibles resultados del experimento. Se define la probabilidad del suceso A como P (A) = número de resultados favorables m = . n número de resultados posibles Esta es la denominada Regla de Laplace para el cálculo de las probabilidades de los distintos sucesos en la situación descrita previamente. Ejemplo: Sea A el suceso de que aparezcan los números 1 ó 2 al lanzar un dado no cargado. Calcular la probabilidad de que ocurra A y de que no ocurra A . P (A) = 2 6 P (Ac ) = 4 2 =1− . 6 6 Objeciones a la definición clásica El espacio muestral ha de ser finito. Sólo es aplicable en el caso de resultados elementales equiprobables. El concepto de equiprobabilidad se basa, en esencia, en el concepto de probabilidad que queremos definir. Hay que especificar muy bien las distintas alternativas en los resultados del experimento aleatorio. Por ejemplo, al lanzar dos monedas si se considera XC distinto de CX, al suceso “obtener dos caras” se le asignarı́a una probabilidad de 1/4 mientras que si no se distinguen se le asignara, de forma incorrecta, una probabilidad de 1/3. Patricia Román Román 14 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas 3.2. Concepción frecuentista La concepción frecuentista de la probabilidad se desarrolló a partir de las crı́ticas realizadas a la definición clásica de Laplace que acabamos de comentar. La definición fue formalmente establecida por R. von Mises en 1928, y se basa en el concepto de frecuencia relativa de un suceso asociado a un experimento aleatorio que se repite sucesivamente bajo idénticas condiciones. Si se realizan N repeticiones de un experimento, y un determinado suceso A se ha presentado en NA ocasiones, se define la frecuencia relativa de A en las N pruebas como fN (A) = NA . N Supongamos que el número de realizaciones del experimento crece indefinidamente y consideremos la sucesión de frecuencias relativas de A: fN (A), fN +1 (A), . . . , fN +k (A), . . . Estas frecuencias relativas tienden a aproximarse a un valor fijo cuando aumenta el número de repeticiones del experimento, lo que se conoce como principio de estabilidad o regularidad de las frecuencias. De hecho, la teorı́a frecuentista asegura que existe el lı́mite de esas frecuencias relativas, y define la probabilidad de un suceso como dicho lı́mite; esto es, P (A) = lı́m fN (A) N →∞ Objeciones a la definición frecuentista Las principales crı́ticas a esta definición se refieren a su irrelevancia en la realidad. Se define la probabilidad como lı́mite de frecuencias cuando el número de pruebas crece indefinidamente. Ya que en la realidad, no puede asegurarse la existencia de una sucesión ilimitada de repeticiones idénticas de un experimento, nunca podrá saberse si existe una probabilidad (el lı́mite de las frecuencias), cuánto vale (no hay una indicación clara del número de pruebas que deben realizarse para obtener la probabilidad de un suceso) o si el valor asignado a una probabilidad es o no correcto. Otra de las crı́ticas frecuentes a esta definición de probabilidad se refiere a su alcance. Aunque, indudablemente, esta definición cubre un gran número de situaciones prácticas, no puede aplicarse a situaciones en las que no pueda realizarse un gran número de pruebas. De hecho, no puede aplicarse para calcular probabilidades de sucesos individuales no susceptibles de repetición como, por ejemplo, que gane uno u otro equipo al disputar un partido, si un determinado proyecto de investigación va a concluir con éxito, si mañana lloverá, etc.. Hay que indicar, no obstante, que por su base empı́rica, esta concepción está ampliamente aceptada en distintas ciencias experimentales. Patricia Román Román 15 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas 4. Definición axiomática de probabilidad (Kolmogorov, 1932) Es, quizás, la más simple de todas las definiciones y, de hecho, la menos controvertida ya que se basa en un conjunto de axiomas que establecen los requisitos mı́nimos para dar una definición de probabilidad. La principal ventaja de esta definición es que permite llegar a un desarrollo matemático riguroso de la Teorı́a de la Probabilidad y, por otra parte, la definición es tan general que permite incorporar las distintas interpretaciones de probabilidad que se han mencionado anteriormente. Esto es, la probabilidad definida según cada una de las concepciones anteriores, satisface los axiomas de probabilidad de Kolmogorov. Definición Dado un espacio muestral Ω asociado a un determinado experimento aleatorio y una clase de conjuntos de Ω con estructura de σ−álgebra, A, (esto es, (Ω, A) un espacio medible) se define una función de probabilidad, medida de probabilidad o simplemente probabilidad como una función de conjunto P definida sobre A y con valores en [0, 1] P : A −→ R que verifica los siguientes axiomas: I. Axioma de no negatividad P (A) ≥ 0, ∀A ∈ A II. Axioma del suceso seguro P (Ω) = 1 III. Axioma de σ−aditividad o aditividad numerable Dada una colección numerable de sucesos, {Ai }i∈N ⊂ A, incompatibles dos a dos, es decir, Ai ∩ Aj = ∅ ∀i 6= j, entonces P ∞ [ i=1 ! Ai = ∞ X P (Ai ). i=1 Ası́, P (A) ∀A ∈ A denota la probabilidad del suceso A. A la terna formada por el espacio muestral Ω, la σ−álgebra A y la probabilidad P , (Ω, A, P ) se le denomina espacio probabilı́stico o espacio de probabilidad. Es fácil comprobar que las definiciones de probabilidad clásica y frecuentista satisfacen los axiomas de Kolmogorov. Patricia Román Román 16 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas 4.2. Propiedades: Consecuencias de la definición axiomática de la probabilidad I. Reglas para calcular probabilidades de sucesos expresados en términos de otros I1. La probabilidad del suceso imposible es nula: P (∅) = 0. I2. Aditividad finita A1 , . . . , An ∈ A y Ai ∩ Aj = ∅, ∀i 6= j ⇒ P n [ ! Ai i=1 = n X P (Ai ). i=1 I3. Para cualquier suceso A ∈ A se verifica que la probabilidad de su complementario P (Ac ) es P (Ac ) = 1 − P (A). I4. Para dos sucesos cualesquiera A, B ∈ A se verifica que P (A − B) = P (A) − P (A ∩ B). I5. Para dos sucesos cualesquiera A, B ∈ A, con A ⊂ B, P (A − B) = P (A) − P (B). I6. Regla de adición: Para dos sucesos cualesquiera A, B ∈ A se verifica que P (A ∪ B) = P (A) + P (B) − P (A ∩ B). I7. Principio de inclusión-exclusión Sean A1 , A2 , . . . , AN ∈ A, entonces P N [ i=1 ! Ai = N X P (Ai )− i=1 N X i<j P (Ai ∩Aj )+ N X P (Ai ∩Aj ∩Ak )+. . .+(−1)N +1 P i<j<k N \ ! Ai i=1 II. Otras propiedades II1. Para cualquier suceso A ∈ A, se verifica que 0 ≤ P (A) ≤ 1. Patricia Román Román 17 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas II2. Monotonı́a: La probabilidad P es monótona no decreciente, es decir ∀A, B ∈ A, con A ⊂ B ⇒ P (A) ≤ P (B). II3. Subaditividad: i) Dados A1 , A2 , . . . , AN ∈ A se verifica N [ P ! ≤ Ai i=1 N X P (Ai ) i=1 ii) Dada una colección numerable de sucesos {Ai }i∈N ⊂ A se verifica ∞ [ P ! Ai i=1 ≤ ∞ X P (Ai ) i=1 II4. Desigualdad de Bonferroni Sean A1 , A2 , . . . , AN ∈ A, entonces P N [ ! Ai ≥ i=1 N X P (Ai ) − i=1 N X P (Ai ∩ Aj ). i,j=1 i<j II5. Desigualdad de Boole i) Dados A1 , A2 , . . . , AN ∈ A se verifica P N \ ! ≥1− Ai i=1 N X P (Aci ). i=1 ii) Dada una colección numerable de sucesos {Ai }i∈N ⊂ A se verifica P ∞ \ i=1 ! Ai ≥1− ∞ X P (Aci ). i=1 EJEMPLO 1 Sean los sucesos A, B y C con probabilidades P (A) = 1/2, P (B) = 1/3 y P (C) = 1/4 y supongamos que P (A ∩ B) = 1/6, que A y C son incompatibles y que B y C son incompatibles. Calcular: 1) Probabilidad de que A y B no ocurran simultáneamente. Patricia Román Román 18 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas 2) Probabilidad de que ocurra A pero no B. 3) Probabilidad de que no ocurran ni A ni B. 4) Probabilidad de que ocurra alguno de los tres. Solución 1) P A ∩ B = 1 − P (A ∩ B) = 1 − 1/6 = 5/6. 2) P A ∩ B = P (A − B) = P (A − (A ∩ B)) = P (A) − P (A ∩ B) = 1/2 − 1/6 = 2/6 = 1/3. 3) P A ∩ B = P A ∪ B = 1−P (A∪B) = 1−P (A)−P (B)+P (A∩B) = 1−1/2−1/3+1/6 = 2/6 = 1/3. 4) P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C) = 1/2 + 1/3 + 1/4 − 1/6 − 0 − 0 + 0 = 11/12 EJEMPLO 2 La probabilidad de que un estudiante A apruebe un determinado examen es 0.7, la de otro estudiante B es 0.5 y la probabilidad de que aprueben los dos es 0.4. Obtener las probabilidades de los siguientes sucesos: 1) Que apruebe al menos uno de los dos. 2) Que no apruebe ninguno. 3) Que sólo apruebe uno. Solución En primer lugar, notamos los sucesos A : que apruebe el alumno A B : que apruebe el alumno B 1) P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 0.7 + 0.5 − 0.4 = 0.8 2) P (A ∩ B) = 1 − P A ∩ B = 1 − P (A ∪ B) = 0.2 3) P (A ∩ B) ∪ (A ∩ B) = P (A ∩ B) + P (A ∩ B) Por una parte P (A ∩ B) = P (A) − P (A ∩ B) = 0.7 − 0.4 = 0.3 y, por otra P (A ∩ B) = P (B) − P (A ∩ B) = 0.5 − 0.4 = 0.1 de donde se deduce Patricia Román Román 19 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas P (A ∩ B) ∪ (A ∩ B) = 0.4 5. Asignación de probabilidades 5.1. Espacios muestrales discretos La probabilidad de un suceso proporciona una medida del grado de incertidumbre de dicho suceso. Hasta ahora conocemos las reglas (axiomas) que debe cumplir una función de probabilidad pero no disponemos de un método general que permita asignar una probabilidad a cada suceso. Este es un problema que conecta directamente con la interpretación de la probabilidad según las distintas concepciones. Ası́, bajo una perspectiva clásica, el método para asignar probabilidades es la Regla de Laplace, y bajo la perspectiva frecuentista las probabilidades se determinan a partir de las frecuencias relativas. Todas estas concepciones son compatibles con los axiomas de Kolmogorov y, según hemos visto en los ejemplos anteriores, las propiedades de la probabilidad permiten calcular probabilidades de sucesos que puedan expresarse en términos de otro, una vez que se conocen las probabilidades de los primeros, denominadas probabilidades iniciales. Existen casos en los que no es preciso realizar una asignación de probabilidad a cada suceso, sino que un conjunto de probabilidades iniciales determina la probabilidad de cualquier suceso. Esto ocurre en los espacios muestrales discretos en los que basta asignar una probabilidad a cada suceso elemental con la condición de que la suma de todas ellas sea la unidad. En efecto, cada suceso se puede expresar como unión disjunta de los resultados elementales que lo constituyen y, al ser el espacio muestral discreto, dicha unión ser finita o, a lo sumo, numerable. Entonces, a partir de la probabilidad de los sucesos elementales, por la propiedad de σ-aditividad, queda determinada la probabilidad de cada suceso. Vamos a exponer a continuación un método de asignación, que se denomina asignación uniforme, aplicable a espacios muestrales finitos, que conduce a la definición clásica de probabilidad. La extensión de este método a espacios muestrales continuos conduce a las denominadas probabilidades geométricas. Asignación uniforme en espacios finitos Ω = {a1 , . . . , an }, A = P(Ω) Si no hay razón para suponer que un suceso elemental sea más probable que otro, todos deben tener la misma probabilidad P (ai ) = p, i = 1, . . . , n y, entonces, P (Ω) = n X i=1 P (ai ) = np = 1 =⇒ p = 1 n Con estas probabilidades iniciales queda determinada la probabilidad de cualquier suceso Patricia Román Román 20 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas A = {ai1 , . . . , aim } =⇒ P (A) = X P (aij ) = mp = aij ∈A m n es decir, la Regla de Laplace. Entonces, el cálculo de la probabilidad de un suceso se reduce al conteo del número de elementos que tiene ese suceso. A este efecto, hemos recordamos las nociones básicas de Combinatoria. 5.2. Probabilidad Geométrica En todo espacio muestral continuo donde se pueda definir una medida de forma que el propio espacio muestral tenga medida finita (tal como longitud, área, volumen, etc..) es posible establecer espacios probabilı́sticos equiprobables, asignando igual probabilidad a conjuntos con la misma medida. En estos espacios, se define la probabilidad de un suceso A como la razón: P (A) = medida(A) . medida(Ω) Estas probabilidades se conocen con el nombre de probabilidades geométricas. Ası́, por ejemplo, la probabilidad de que al seleccionar un número real cualquiera en el intervalo [0, 1], éste sea mayor que 1/3, será el cociente entre la longitud del intervalo [1/3, 1] y la del propio espacio muestral [0, 1]; esto es, 2/3. EJEMPLO 3 Se considera un dado cargado de forma que la probabilidad de que salga un número es directamente proporcional a dicho número. Sea A el suceso “salir número par”, B el suceso “salir número primo” y C el suceso “salir número impar”. 1) Calcular la probabilidad de cada suceso elemental. 2) Calcular P (A), P (B) y P (C). 3) Calcular la probabilidad de que salga un número par o primo. 4) Calcular la probabilidad de que salga un número par pero no primo. Solución 1) El espacio muestral es Ω = {1, 2, 3, 4, 5, 6} y las probabilidades de cada suceso elemental son P {n} = kn n = 1, 2, 3, 4, 5, 6. de forma que Patricia Román Román 21 ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD Doble Grado en Ingenierı́a Informática y Matemáticas P (Ω) = k + 2k + 3k + 4k + 5k + 6k = 1 es decir 6+1 6k = 21k = 1 2 ⇒ k= 1 21 Por tanto P {n} = n 21 n = 1, 2, 3, 4, 5, 6 2) P (A) = P ({2, 4, 6}) = 2 4 6 12 + + = 21 21 21 21 P (B) = P ({1, 2, 3, 5}) = P (C) = P ({1, 3, 5}) = 2 2 5 11 1 + + + = 21 21 21 21 21 3 5 9 1 + + = 21 21 21 21 3) P ({1, 2, 3, 4, 5, 6}) = 1 4) P ({4, 6}) = 10 21 Patricia Román Román 22