Tema 5: Funciones medibles. Variables aleatorias. Función de distribución. El concepto de variable aleatoria formaliza las magnitudes numéricas asociadas a los resultados de una experimento aleatorio. En este tema supondremos que (Ω, A, P ) es un espacio de probabilidad, y como es usual, denotaremos (IR, B(IR)) el espacio medible formado por el conjunto de los números reales y el σ-álgebra de los borelianos. 1. Inversa de una función. Propiedades Definición. Sean Ω, Ω0 dos conjuntos, y X : Ω → Ω0 una función. La función de conjunto, X −1 : P(Ω0 ) → P(Ω) definida como, X −1 (B) = {ω ∈ Ω | X(ω) ∈ B}, ∀B ∈ P(Ω0 ) se denomina inversa de X. Al conjunto X −1 (B) ⊆ Ω se le denomina imagen inversa de B. NOTA: Obsérvese que X es una función puntual pero X −1 transforma conjuntos en Ω0 en conjuntos en Ω, es decir, es una función de conjunto. A veces, por abuso de lenguaje, la llamaremos función inversa de f , pero no ha de confundirse con la correspondencia inversa. Resultado. La función inversa verifica, 1. X −1 (∅) = ∅ 2. X −1 (Ac ) = (X −1 (A))c S∞ S∞ 3. X −1 ( i=1 Ai ) = i=1 X −1 (Ai ) T∞ T∞ 4. X −1 ( i=1 Ai ) = i=1 X −1 (Ai ) 5. A1 ⊆ A2 ⇒ X −1 (A1 ) ⊆ X −1 (A2 ) 6. A1 ∩ A2 = ∅ ⇒ X −1 (A1 ) ∩ X −1 (A2 ) = ∅ 7. Si F 0 es un σ-álgebra sobre Ω0 entonces, not X −1 (F 0 ) = X −1 (A) | A ∈ F 0 es un σ-álgebra sobre Ω. 1 2. Funciones medibles. Variables aleatorias Definición. Dados dos espacios medibles, (Ω, F) y (Ω0 , F 0 ), diremos que la función X : Ω → Ω0 es medible si verifica, X −1 (B) ∈ F ∀B ∈ F 0 OBSERVACIÓN: Ya que los σ-álgebras desempeñan un papel fundamental para que una función sea medible o no, se suele emplear la notación, X : (Ω, F) → (Ω0 , F 0 ) para resaltar las estructuras medibles, y la dependencia que tiene la definición anterior de dichas estructuras. Resultado. Dados dos espacios medibles, (Ω, F) y (Ω0 , F 0 ), sea X : Ω → Ω0 una función, y C ⊆ F 0 una clase de sucesos tal que σ(C) = F. En estas condiciones, X es medible si y sólo si, X −1 (B) ∈ F ∀B ∈ C Definición. Diremos que la función, X : (Ω, F) → (IR, B(IR)) es una variable aleatoria si verifica, X −1 (B) ∈ F ∀ B ∈ B(IR) Corolario. La función, X : (Ω, F) → (IR, B(IR)) es variable aleatoria si y sólo si, X −1 ((−∞, x]) = {ω ∈ Ω | X(ω) ≤ x} ∈ F ∀x ∈ IR Definición. Una función g : IR → IR se denomina medible Borel o Borel medible si verifica, g −1 (B) ∈ B(IR) ∀B ∈ B(IR) Es decir, es una función real de variable real, medible en relación al σ-álgebra de Borel que define las estructuras medibles. Observemos que, según el resultado anterior, bastará que se cumpla g −1 (A) ∈ B(IR) para todo A de alguna clase de subconjuntos de IR que genere a los borelianos. Al ser los abiertos (de la topologı́a usual en IR) una de tales clases, se tiene obviamente que toda función real de variable real, continua, es medible Borel. Es decir, Corolario. Si la función, g : IR → IR es continua [con la topologı́a de los intervalos abiertos], entonces es medible Borel. Resultado. Si X : (Ω, F) → (IR, B(IR)) es una variable aleatoria y g es una función real de variable real, medible Borel, entonces la composición, g ◦ X = g(X) : (Ω, F) → (IR, B(IR)), es también variable aleatoria. Corolario. Si X : (Ω, F) → (IR, B(IR)) es una variable aleatoria, c ∈ IR, n ∈ IN y h : IR → IR es una función polinómica, entonces también son variables aleatorias: c (considerada como función constante), X + c, cX, |X|, X n y h(X). Resultado. Si X, Y : (Ω, F) → (IR, B(IR)) son variables aleatorias, entonces también son variables aleatorias X + Y , X − Y , X Y , X/Y (supuesto que {ω ∈ Ω | Y (ω) = 0} = ∅), máx{X, Y }, mı́n{X, Y }, X + = máx{X, 0} y X − = máx{−X, 0} = − mı́n{X, 0}. 2 3. Probabilidad asociada a una variable aleatoria. Función de distribución Definición. Sea (Ω, F, P ) un espacio de probabilidad y X : (Ω, F) → (IR, B(IR)) una variable aleatoria. La función, PX : B(IR) → IR definida como, PX (B) = P (X −1 (B)), ∀B ∈ B(IR) se denomina probabilidad asociada a, o inducida por, la variable aleatoria X. Resultado. La función PX está bien definida y (IR, B(IR), PX ) es un espacio de probabilidad. Definición. El espacio de probabilidad (IR, B(IR), PX ), previamente construido, se denomina espacio de probabilidad asociado a, o inducido por, la variable aleatoria X. NOTA: La probabilidad PX , definida sobre B(IR) se denomina genéricamente distribución de probabilidad de X o distribución de X. Definición. Dada una variable aleatoria X : Ω → IR, la función real de variable real, FX (x) = F (x) = PX ((−∞, x]) ∀x ∈ IR se denomina función de distribución de X. NOTA: Observemos que F está bien definida, es no negativa y está acotada superiormente por 1, es decir, 0 ≤ F (x) ≤ 1, ∀x ∈ IR Resultado (Propiedades básicas de la función de distribución). La función de distribución F , previamente definida, presenta las siguientes propiedades, 1. Es monótona creciente [o no decreciente]. 2. ∃ lı́mx→−∞ F (x) = 0, ∃ lı́mx→+∞ F (x) = 1. 3. Es continua por la derecha, es decir, ∀a ∈ IR, ∃F (a+ ) = lı́m F (x) = F (a) x→a+ Resultado (Propiedades adicionales de la función de distribución). . La función de distribución de X verifica las propiedades siguientes, 1. Tiene lı́mite por la izquierda en todo punto a ∈ IR. Dicho lı́mite es, F (a− ) = lı́m− F (x) = PX ((−∞, a)) x→a que en general es distinto de F (a) Por consiguiente, presenta a lo sumo una discontinuidad de primera especie [o de salto] en todo punto a ∈ IR, siendo la magnitud del salto, F (a+ ) − F (a− ) = F (a) − lı́m F (x) = PX ({a}) x→a− 2. Si dos funciones de distribución, FX y FY verifican que FX (x) = FY (x), ∀ x ∈ D siendo D un subconjunto denso en IR, entonces FX (x) = FY (x), ∀ x ∈ IR. 3. El conjunto de los puntos de discontinuidad de una función de distribución es numerable. 3 4. Si FX y FY son dos funciones de distribución, CX y CY sus respectivos conjuntos de puntos de continuidad y FX (x) = FY (x) ∀x ∈ CX ∩ CY entonces FX (x) = FY (x) ∀x ∈ IR. NOTACIÓN ABREVIADA PARA VARIABLES ALEATORIAS: El tratamiento de variables aleatorias tiene su notación especial abreviada a la que hay que acostumbrarse. Ası́, para abreviar el conjunto X −1 (B) = {ω ∈ Ω | X(ω) ∈ B} se escribe [X ∈ B] ó {X ∈ B}. Nosotros emplearemos [X ∈ B]. De forma similar se denotarı́an, not X −1 ((−∞, x]) = {ω ∈ Ω | X(ω) ≤ x} = [X ≤ x] not X −1 ((−∞, x)) = {ω ∈ Ω | X(ω) < x} = [X < x] not X −1 ((a, b]) = {ω ∈ Ω | a < X(ω) ≤ b} = [a < X ≤ b] not not X −1 ({x}) = X −1 (x) = {ω ∈ Ω | X(ω) = x} = [X = x] not X −1 ((a, +∞)) = {ω ∈ Ω | X(ω) > a} = [X > a] = {ω ∈ Ω | X(ω) ≤ a}c = [X ≤ a]c Y un largo etcétera. A partir de la función de distribución asociada a X es posible calcular, de manera simple, probabilidades asociadas a dicha variable aleatoria. Exponemos un pequeño resumen, con la notación abreviada. Suponemos a, b ∈ IR, a < b. P [X ≤ b] = P (X −1 ((−∞, b])) = PX ((−∞, b]) = F (b) P [X < b] = P (X −1 ((−∞, b))) = PX ((−∞, b)) = F (b− ) P [a < X ≤ b] = P (X −1 ((a, b])) = PX ((a, b]) = PX ((−∞, b] − (−∞, a]) = PX ((−∞, b]) − PX ((−∞, a]) = F (b) − F (a) y análogamente, P [a < X < b] = F (b− ) − F (a) P [X > a] = 1 − F (a) P [X ≥ a] = 1 − F (a− ) P [X = a] = F (a) − F (a− ) P [a ≤ X < b] = F (b− ) − F (a− ) NOTA: Recordemos que las posibles discontinuidades de F son de salto. Ası́, si x es un punto de continuidad de F entonces P [X = x] = 0. En caso contrario, P [X = x] = p > 0, siendo precisamente p la magnitud del salto. Por supuesto, si F es continua en IR, tendremos P [X = x] = 0, ∀x ∈ R. 4. Variables aleatorias discretas y continuas. Descomposición de una función de distribución Definición. Una variable aleatoria, X : Ω → IR se denomina discreta si existe un conjunto, S ⊂ IR, numerable [o discreto], tal que, PX (S) = 1. El conjunto S se denomina conjunto soporte de X. 4 Notemos que si X es una variable aleatoria discreta y S es su conjunto soporte, al ser PX (S c ) = 1−PX (S) = 0, tendremos ∀B ∈ B(IR), X X PX (B) = PX (B ∩ S) + PX (B ∩ S c ) = PX (B ∩ S) = PX ({z}) = (F (x+ ) − F (x− )) z∈B∩S z∈B∩S y en particular, si x ∈ IR y B = (−∞, x], se tiene para la función de distribución, X X F (x) = PX ((−∞, x]) = PX ({z}) = F (z + ) − F (z − ) = {z∈S|z≤x} z∈(−∞,x]∩S X s(z) {z∈S|z≤x} siendo s(z) = F (z + ) − F (z − ) el salto en z. Es decir, esta función, monótona creciente, presenta un crecimiento producido exclusivamente por saltos en un conjunto numerable, siendo la suma de los saltos, X X F (z + ) − F (z − ) = PX ({z}) = 1 z∈S z∈S Este tipo de funciones, denominadas de salto, incluye por ejemplo a las funciones escalonadas [o constantes a trozos] pero también a otras más complejas. Recı́procamente, si la función de distribución, F , es una función de salto, siendo S ⊂ IR el conjunto [numerable] de puntos de salto, se tiene, X X PX (S) = PX ({z}) = F (z + ) − F (z − ) = 1 z∈S z∈S ya que el segundo sumatorio representa el crecimiento total de F , que como sabemos es 1. Por consiguiente, X es variable aleatoria discreta. Podemos resumir lo anterior en el siguiente resultado. Resultado. La variable aleatoria X : Ω → IR es discreta si y sólo si su función de distribución es una función de salto. Definición. Si X : Ω → IR es una variable aleatoria discreta siendo S ⊂ IR numerable tal que PX (S) = 1, el conjunto (numerable) de valores {PX ({z}) | z ∈ S, PX (z) > 0} se denomina función de probabilidad de X. Observemos que PX ({z}) = P (X −1 ({z})) = P [X = z], que es la notación usualmente empleada para la función de probabilidad. Observemos también que P [X = z] = F (z) − F (z − ), es decir, los valores de la función de probabilidad son las magnitudes de los saltos de la función de distribución, ası́, la función de distribución determina de forma única la función de probabilidad y recı́procamente. Ejemplo 1. Se lanzan dos dados tetraédricos, equilibrados y se considera el espacio muestral formado por las parejas de resultados obtenidos, Ω = {(i, j) | 1 ≤ i, j ≤ 4} con el σ-álgebra P(Ω), y la probabilidad definida a partir de la regla de Laplace en virtud del equilibrio de los dados. Dicha probabilidad verifica pues P ({(i, j)}) = 1/16, ∀(i, j) ∈ Ω. La función X : Ω → IR, definida como X((i, j)) = i/j es, obviamente, una variable aleatoria pues la imagen inversa de un boreliano siempre es un suceso. Observemos que su imagen es, X(Ω) = {1, 2, 3, 4, 1/4, 1/3, 1/2, 2/3, 3/4, 3/2, 4/3} Observemos que si denotamos S = X(Ω), se tiene PX (S) = P (X −1 (X(Ω))) = P (Ω) = 1, es decir, X es discreta. Notemos que esto sucede siempre que X(Ω) es numerable pero que en general, si X es discreta, X(Ω) no tiene por que ser numerable. Veamos algunos valores de la función de probabilidad, P [X = 4/3] = P [X −1 ({4/3})] = P [{(4, 3)}] = 1/16 P [X = 1/2] = P [X −1 ({1/2})] = P [{(1, 2), (2, 4)}] = 1/16 + 1/16 = 1/8 5 P [X = 1] = P [X −1 ({1})] = P [{(1, 1), (2, 2), (3, 3), (4, 4)}] = 1/16 + 1/16 + 1/16 + 1/16 = 1/4 Por supuesto, si intentamos calcular la función de probabilidad en un punto no perteneciente a X(Ω) obtendremos el valor P [X = x] = P (∅) = 0. Es decir, la función de probabilidad se puede definir realmente en todo IR, pero sólo en el conjunto numerable X(Ω) tiene interés desde el punto de vista probabilı́stico. Si queremos hallar la probabilidad inducida sobre un boreliano, B, basta aplicar la expresión, X PX (B) = P [X = x] x∈B∩X(Ω) deducida anteriormente. Por ejemplo, P [X > 2] = PX ((2, +∞)) = P [X = 3] + P [X = 4] = 1/16 + 1/16 = 1/8 Finalmente, la función de distribución será una función de salto, en este caso escalonada, con saltos en los puntos X(Ω). Aplicando la expresión ya vista para dicha función, X P [X = z] F (x) = {z∈X(Ω)|z≤x} podemos hallar explı́citamente dicha función, F (x) = 0 1/16 2/16 4/16 5/16 6/16 10/16 11/16 12/16 14/16 15/16 16/16 = 1 −∞ < x < 1/4 1/4 ≤ x < 1/3 1/3 ≤ x < 1/2 1/2 ≤ x < 2/3 2/3 ≤ x < 3/4 3/4 ≤ x < 1 1 ≤ x < 4/3 4/3 ≤ x < 3/2 3/2 ≤ x < 2 2≤x<3 3≤x<4 4 ≤ x < +∞ 4 Ejemplo 2. Dos jugadores, A y B, tienen cada uno una moneda equilibrada que lanzan, independientemente uno del otro, y con independencia entre unos lanzamientos y otros, hasta que cada uno obtiene la cara. Para este experimento, se considera el espacio muestral formado por las parejas ordenadas (i, j) donde i es el número de lanzamientos que ha necesitado A para obtener dicho resultado, y j el que ha necesitado B. Obviamente dicho espacio muestral es Ω = IN × IN. Como σ-álgebra vamos a considerar el usual para espacios muestrales numerables, esto es, 2Ω , y como probabilidad, la definida por una función de peso congruente con las condiciones del experimento. Consideremos la función X : Ω → IR definida como X((i, j)) = i/j, ∀i, j ∈ IN, que obviamente es una variable aleatoria. Ella es discreta pues su imagen es X(Ω) = Q I + , es decir, racionales mayores que cero, que constituyen un + + −1 conjunto numerable. De hecho, PX (I Q ) = P (X (IQ )) = P (Ω) = 1. Calculemos la función de probabilidad. Dado r ∈ Q I + , expresémoslo en forma irreducible, r = n/m con n, m ∈ IN, primos entre si. Se tiene, X P [X = r] = P [X = n/m] = P (X −1 ({n/m})) = P [{(nk, mk)|k ∈ IN}] = P [{(nk, mk)}] k∈IN El hecho de que las monedas sean equilibradas [probabilidad de cara 1/2], que cada jugador actúe independientemente, y que los lanzamientos sean independientes nos lleva a considerar que, para cada uno por separado, la probabilidad n de obtener la primera cara en el lanzamiento n-ésimo serı́a 1/2 × 1/2 × · · · × 1/2 = 1/2n , y por consiguiente, P [{(nk, mk)}] = (1/2)nk (1/2)mk = (1/2)(n+m)k 6 siendo pues, P [X = r] = P [X = n/m] = ∞ X (1/2)(n+m)k = k=1 1 n+m 2 −1 Ası́, por ejemplo, P [X = 3/4] = 1/127, P [X = 1] = 1/3, P [X = 5] = 1/63, P [X = 1/5] = 1/63, etc. La función de distribución de X será, empleando una de las expresiones vistas anteriormente, X P [X = z] F (x) = {z∈Q I + | z≤x} es decir, F (x) es la suma de la función de probabilidad para aquellos racionales mayores que cero y menores o iguales que x. Como puede verse, es una función de salto, pero presenta una estructura algo más compleja que una función escalonada debido a la estructura densa de Q I +. 4 Ejemplo 3. Un experimento puede tener dos resultados posible, que llamaremos ÉXITO y FRACASO, con probabilidades respectivas p y 1 − p = q. Si repetimos el experimento n veces, de forma que las repeticiones sean independientes entre sı́, denotemos por X la variable aleatoria que cuenta el número de ÉXITOS obtenidos, y que puede recorrer los valores enteros de 0 a n. Diremos que X es una variable aleatoria [discreta] con distribución binomial, o simplemente binomial. Su soporte es S = {0, 1, . . . , n}, y su función de probabilidad será, n k n−k P [X = k] = p q , k ∈ {0, 1, . . . , n} k k n−k ya que una ristra , ordenada de k ÉXITOS y n − k FRACASOS tiene, por la independencia, una probabilidad p q n y como hay k ordenaciones posibles [permutaciones con repetición], obtenemos el resultado anterior. Aunque ya se sabe a priori, es fácil comprobar, n X n k n−k p q = (p + q)n = 1 k k=0 4 ∗ Ejemplo 4. Si X es una variable aleatoria con soporte S = IN = IN ∪ {0}, y con función de probabilidad, λk k ∈ IN∗ k! siendo λ > 0, diremos que X tiene una distribución de Poisson de parámetro λ. Obviamente, P [X = k] = e−λ ∞ X k=0 e−λ λk = e−λ eλ = 1 k! 4 Definición (Importante). Dado un conjunto cualquiera U , y un subconjunto A ⊆ U , definimos la función indicadora de A como, 1 si u ∈ A IA (u) = 0 si u ∈ /A Definición. Una variable aleatoria, X : Ω → IR se denomina continua si su función de distribución asociada es continua. Ejemplo 5. Sea X una variable aleatoria cuya función de distribución es, F (x) = (1 − e−λx )I[0,+∞) (x), λ > 0, x ∈ IR Se comprueba fácilmente que F es realmente una función de distribución, en el sentido de verificar las propiedades requeridas. Además es continua en todo IR, es decir, X es una variable aleatoria de tipo continuo o continua. 4 7 En general, una variable aleatoria no tiene por qué ser ni discreta ni continua. Esto se estudia a continuación. Véase el Ejemplo 6. Teorema 1. Si X : Ω → IR es una variable aleatoria, su función de distribución, F , se puede descomponer como, F = αFd + (1 − α)Fc α ∈ [0, 1] donde Fd es una función de distribución de salto y Fc es una función de distribución continua, siendo única dicha descomposición salvo los casos triviales α = 0, α = 1. Ejemplo 6. Sea X una variable aleatoria cuya función de distribución es, F (x) = (1 − pe−λx )I[0,+∞) (x), λ > 0, p ∈ (0, 1), x ∈ IR Se comprueba fácilmente que F es realmente una función de distribución, en el sentido de verificar las propiedades requeridas, sin embargo no es continua ya que F (0) − F (0− ) = 1 − p, es decir, tiene en cero una discontinuidad de salto por la izquierda, ası́, X es una variable aleatoria de tipo mixto. Según el primer teorema de descomposición, la parte correspondiente a la función de salto será Fd (x) = G(x)/α = I[0,+∞) (x), siendo α = 1 − p La parte continua vendrá dada por H(x)/(1 − α), siendo H(x) = F (x) − G(x), que mediante un cálculo directo, resulta ser, H(x) = p(1 − e−λx )I[0,+∞) (x) siendo pues, Fc (x) = (1 − e−λx )I[0,+∞) (x) Como puede verse, esta función de distribución coincide con la del ejemplo anterior. Se tiene entonces la descomposición, F (x) = (1 − p)I[0,+∞) + p(1 − e−λx )I[0,+∞) (x) Hemos visto pues que F se ha sido expresada como combinación convexa de una función de distribución de salto [en este caso escalonada] y de una función de distribución continua. 4 5. Variables aleatorias absolutamente continuas Veamos ahora un caso particular de las variables aleatorias continuas. Definición. Una variable aleatoria, X : Ω → IR, con función de distribución F , seR denomina absolutamente ∞ continua si existe una función f : IR → IR, no negativa, y tal que la integral impropia −∞ f (t) dt es convergente, verificando, Z x F (x) = f (t) dt ∀x ∈ IR −∞ La función f se denomina función de densidad de probabilidad o función de densidad de la variable aleatoria X. OBSERVACIONES: 1. Una función de densidad ha de verificar, Z ∞ f (t) dt = 1 −∞ 2. Si X es absolutamente continua entonces es continua. Además se verifica F 0 = f donde dicha derivada exista. 8 Ejemplo 7. Retornemos al Ejemplo 6. Recordemos que X es una variable aleatoria cuya función de distribución es, F (x) = (1 − e−λx )I[0,+∞) (x), λ > 0, x ∈ IR Se comprueba fácilmente que F es realmente una función de distribución, en el sentido de verificar las propiedades requeridas. Además es continua en todo IR, es decir, X es una variable aleatoria de tipo continuo o continua. Si ahora consideramos la función real de variable real f (x) = (λe−λx )I[0,+∞) (x), λ > 0, x ∈ IR, es fácil ver que dicha función es no negativa y su integral impropia en (−∞, ∞) es convergente, además, mediante un cálculo directo se comprueba fácilmente que, Z x F (x) = f (t)dt −∞ siendo pues X también una variable aleatoria absolutamente continua y la función f su función de densidad. Observemos que F 0 = f en IR − {0} pues en 0, F no es derivable. 4 Resultado. Si X : Ω → IR es una variable aleatoria absolutamente continua, su función de densidad determina unı́vocamente la distribución de probabilidad PX . Ejercicio: Sea (Ω, F) un espacio medible, A ⊆ Ω, e IA : Ω → IR, la función indicadora de A definida [como ya se ha visto anteriormente] de la forma, 1 si ω ∈ A IA (ω) = 0 si ω ∈ /A Demostrar las siguientes propiedades de IA , I∅ = 0, IΩ = 1 IAc = 1 − IA IA∩B = IA IB IA∪B = IA + IB − IA∩B Si consideramos IA : (Ω, F) → (IR, B(IR)), entonces, Ω A −1 IA (B) = Ac ∅ dado B ∈ B(IR), se tiene, si si si si 0 ∈ B, 0∈ / B, 0 ∈ B, 0∈ / B, 1∈B 1∈B 1∈ /B 1∈ /B Ası́, IA es variable aleatoria si y sólo si A ∈ F. Bibliografı́a [1] Cuadras, C.M. (1983). Problemas de probabilidades y estadı́stica. P.P.U. [2] Renyi, A. (1976). Cálculo de probabilidades. Reverté. [3] Rohatgi, V.K. (1976). An Introduction to Probability Theory and Mathematical Statistics. Wiley. 9