M. Iniesta Grado en Ciencia y Tecnología de los Alimentos Universidad de Murcia Tema 4: Variables aleatorias discretas Objetivos Dominar el uso de las funciones asociadas a una variable aleatoria discreta para calcular probabilidades. Conocer el signicado y saber calcular la esperanza y la varianza de una variable aleatoria discreta. Reconocer y aplicar modelos de probabilidad discretos 1. Variable Aleatoria y Función de Probabilidad Lo que pretendemos en este tema es transformar el problema de la asignación de probabilidades a otro consistente en el empleo de ciertas funciones reales de variable real, de forma que la probabilidad de cierto suceso aleatorio vendrá dada por el cálculo de ciertos valores de dichas funciones. 1.1. Denición de Variable aleatoria Sea Ω el espacio muestral asociado a un fenómeno aleatorio. Una variable aleatoria es una función X:Ω→R que asocia a cada suceso elemental un número real. El conjunto X(Ω) = X se le llamará espacio muestral de la variable aleatoria X y es el conjunto de todos los valores posibles de X . Diremos que una variable aleatoria es discreta si su espacio muestral es un conjunto discreto, es decir, un conjunto nito o bien un conjunto innito pero numerable. Si el espacio muestral de la variable es innito no numerable, como el conjunto de puntos de un intervalo real, diremos que la variable aleatoria es continua. En este tema trataremos con variables aleatorias discretas. Ejemplo 1.1 Si lanzamos una moneda al aire dos veces y obtenidas X transforma X = {0, 1, 2}. el espacio muestral original X es el número de caras Ω = {(c, c), (x, c), (c, x), (x, x)} en 1.2. Función de Probabilidad La función puntual de probabilidad va a asignar probabilidad a cada punto del espacio muestral de X . Tema 4 Página: 1 M. Iniesta Grado en Ciencia y Tecnología de los Alimentos Universidad de Murcia Si X es una variable aleatoria discreta, la Función simplemente la Función de Probabilidad es la función Puntual de Probabilidad o p : R → [0, 1] que asigna probabilidades a cada uno de los puntos muestrales de X . Es decir, p(x) = P (X = x), si x ∈ X ; 0, si x ∈ / X. es decir De la denición se derivan las siguientes propiedades de la función de probabilidad: 1. Se dene la Función de Distribución de la variable X como F (x) = y∈X ,y≤x p(y) = F (x). La función F (x), en este caso, acumula la probabilidad asociada al punto muestral x a la de los puntos muestrales menores que x. P 2. P x∈X p(x) = 1 3. Si I ⊆ R, P (X ∈ I) = Ejemplo 1.2 Si probabilidad es P x∈I,x∈X p(x) X =número de caras al tirar dos veces una moneda, 1/4, si x = {0, 2}; 1/2, si x = 1; p(x) = 0, si x ∈ / {0, 1, 2}. su función de y su función de distribución es 0 1/4, F (x) = 3/4, 1, si si si si x < 0; x ∈ [0, 1); x ∈ [1, 2); x ≥ 2. 1.3. Actividades Estudiar si las funciones siguientes pueden ser funciones puntuales de probabilidad 1. p(x) = 1 si x = 0, 1, 2, 3, 4 y p(x) = 0 en el resto 5 2. p(x) = k si x = −10, −9, ..., 9, 10 y p(x) = 0 en el resto 3. p(x) = 2. 2x + 1 si x = 1, 2, 3, 4 y p(x) = 0 en el resto 24 Esperanza y Varianza de una variable aleatoria discreta Con estos parámetros, que denimos a continuación, pretendemos describir una variable aleatoria respecto a sus características de centralización y dispersión. Tema 4 Página: 2 M. Iniesta Grado en Ciencia y Tecnología de los Alimentos Universidad de Murcia 2.1. Esperanza Matemática o Media Teórica La Esperanza o Media Teórica de una v.a. E(X) indica un valor teórico al que tendería el valor medio de n realizaciones de X , cuando n tiende a innito. Para aclarar esto supongamos que X es nuestra ganancia cuando jugamos a un juego de lotería en el que podemos ganar un millón de euros con cierta probabilidad o perder lo invertido en el billete. En una realización concreta ganaremos o perderemos y la esperanza de X sería el valor al que tendería el valor medio de mi ganancia cuando juego un número grande de veces. Se dene mediante la siguiente expresión: E(X) = X xp(x) x∈X Ejemplo 2.1 Supongamos que en un juego ganamos 10 euros si al tirar un dado sacamos un cinco o un seis, ganamos 5 si sale un 2 o un 3 o un 4 y perdemos 25 si sale un 1. Si llamamos X a la ganancia obtenida en una jugada, la función de probabilidad de 2 , 63 , 6 p(x) = 1 , 6 0, cuya esperanza vale: si si si si X es x = 10; x = 5; x = −25; x∈ / {10, 5, −25}. 3 1 10 2 E(X) = 10 + 5 − 25 = 6 6 6 6 que sería el valor medio de nuestras ganancias a largo plazo (en un gran número de jugadas). Ejemplo 2.2 La esperanza de la variable del ejemplo (1.1) vale 1 1 1 E(X) = 0. + 1. + 2. = 1 4 2 4 esto signica que en un gran número de experiencias, el valor medio del número de caras tendería a 1. 2.2. Varianza y Desviación Típica La varianza de una variable aleatoria X , que representaremos por V (X), y la Desviación Típica, D(X), indicarán el grado de dispersión de los valores de la variable respecto a la esperanza matemática. La Desviación Típica será la raíz cuadrada positiva de la p varianza, D(X) = V (X) y tiene la ventaja que se expresa en la misma unidad que la propia variable. Variables con desviación típica pequeña indicará que hay alta probabilidad de observar valores próximos a la esperanza matemática o media teórica E(X). Si denotamos E(X) mediante µ y V (X) mediante σ 2 Denimos V (X) = σ 2 = E((X − µ)2 ) = E(X 2 ) − µ2 y podemos calcularla mediante la siguiente expresión: V (X) = σ 2 = X x∈X Tema 4 x2 p(x) − µ2 = X x∈X x2 p(x) − ( X xp(x))2 x∈X Página: 3 M. Iniesta Grado en Ciencia y Tecnología de los Alimentos Universidad de Murcia Ejemplo 2.3 La varianza de la variable del ejemplo (1.1) es 1 1 1 1 σ 2 = 02 + 12 + 22 − 12 = 4 2 4 2 y su desviación típica es 1 D(X) = σ = √ 2 2.3. Actividades Calcular la esperanza y la varianza en los casos en donde sea posible de las actividades de la sección 1.3. 3. Modelos de probabilidad discretos 3.1. El modelo de Bernoulli Consideremos un experimento con únicamente dos resultados posibles, o puede suceder A (que llamaremos éxito ) o bien A y supongamos que la probabilidad de Éxito es conocida, es decir, P (A) = p (con 0 ≤ p ≤ 1 ). Cuando realizamos un experimento en las condiciones anteriores diremos que hemos realizado una Prueba de Bernoulli. Si llamamos X=número de éxitos obtenidos en una prueba de Bernoulli su espacio muestral es X = {0, 1} y la función puntual de probabilidad de X tiene la siguiente expresión si X = 1; p, q = (1 − p), si X = 0; p(x) = P (X = x) = 0, en otro caso. o lo que es igual p(x) = P (X = x) = px (1 − p)1−x , si x ∈ X = {0, 1}; 0, en otro caso. Podemos, para este modelo, fácilmente calcular su esperanza y su varianza: que son E(X) = 1p + 0(1 − p) = p V (V ) = 12 p + 02 (1 − p) − p2 = p(1 − p) Si la variable X tiene una distribución de probabilidad como la del modelo de Bernoulli con P (A) = p, lo indicaremos poniendo X ∼ B(p) Tema 4 Página: 4 M. Iniesta Grado en Ciencia y Tecnología de los Alimentos Universidad de Murcia 3.2. Modelo Binomial Imaginemos un experimento como el anterior, con dos resultados posibles A y A y P (A) = p conocido, pero que lo repetimos n veces en idénticas condiciones. Sea ahora X=número de éxitos en n pruebas de Bernoulli idénticas e independientes El espacio muestral de la variable es X = {0, 1, ...., n} y la función puntual de probabilidad es: n x p (1 − p)n−x , si x ∈ X = {0, 1, ..., n}; x p(x) = 0, si x ∈ / X. En este caso la esperanza y la varianza valen: E(X) = np V (X) = np(1 − p) Si la variable X tiene una distribución de probabilidad como la del modelo Binomial de parámetros n =número de pruebas y P (A) = p, lo indicaremos poniendo X ∼ B(n, p) 3.2.1. Actividades 1. Aporta cinco situaciones experimentales en donde la v.a. X siga una distribución Binomial. 2. Demuestra que la función puntual de probabilidad anteriormente denida cumple los requisitos necesarios. 3.3. Modelo Hipergeométrico Supongamos una urna con N bolas de dos tipos, por ejemplo N1 blancas y N2 = N − N1 negras, y supongamos que denimos la v.a. X =número miento. de bolas blancas obtenidas en una muestra de tamaño n con reemplaza- Puesto que las distintas extracciones son independientes y la probabilidad de obtener bola blanca es igual en cada extracción (P (A) = NN1 ) la variable anterior sigue una distribución Binomial, es decir X ∼ B(n, NN1 ). Pero vamos a suponer ahora que de dicha población se extraen n bolas sin reemplazamiento. El modelo ya no es binomial puesto que las distintas extracciones ni son independientes ni tienen la misma probabilidad de éxito. Si la población consta de N objetos, con N1 objetos de la clase A y N2 objetos de la clase A (N1 + N2 = N ), denimos ahora la variable X=número de objetos de la clase A en una muestra de tamaño n extraída sin reemplazamiento Tema 4 Página: 5 M. Iniesta Grado en Ciencia y Tecnología de los Alimentos Universidad de Murcia el espacio muestral es X = {máx{0, n−(N −N1 )}, ....., mı́n{N1 , n}} y su función puntual de probabilidad es ( p(x) = −N1 ) (Nx1 )(Nn−x , si máx{0, n − (N − N1 )} ≤ x ≤ mı́n{N1 , n}; N (n) 0, en otro caso. En este caso la esperanza y la varianza valen: E(X) = n NN1 V (X) = n NN1 (1 − N1 N −n ) N N −1 Si la variable X tiene una distribución de probabilidad como la del modelo hipergeométrico lo indicaremos poniendo X ∼ H(N, N1 , n) donde N es tamaño de la población, n es el tamaño de la muestra y N1 es el número de objetos de la clase A en la población. Además es posible demostrar que si N es muy grande y n es pequeño frente a N , las probabilidades hipergeométricas valen aproximadamente las probabilidades binomiales; haciendo p = NN1 , H(N, N1 , n) → B(n, es decir lı́m N →∞ N1 x N1 ) si N → ∞, N N −N1 n−x N n p= N1 N n x = p (1 − p)n−x x Lo anterior supone que cuando se dan esas circunstancias en problemas de extracción de muestras (N grande y n pequeño), podemos suponer reemplazamiento porque los resultados van a ser muy parecidos y es más cómodo trabajar en este caso. 3.3.1. Actividades 1. Dene cinco situaciones experimentales que se asocien al modelo hipergeométrico, expresando en cada caso cuál es el espacio muestral. 2. Si una urna contiene 95 bolas blancas y 5 negras y elegimos al azar 3 sin reemplazamiento, calcula la probabilidad de obtener 2 bolas blancas y 1 negra. 3. Calcula una aproximación de la probabilidad anterior, mediante la aproximación de la distribución hipergeométrica a la distribución binomial. Tema 4 Página: 6 M. Iniesta Grado en Ciencia y Tecnología de los Alimentos Universidad de Murcia 3.4. Modelo de Poisson Supongamos que conocemos el número medio de veces que ocurre el suceso A en una unidad de soporte continuo (tiempo, espacio, volumen, longitud, supercie,....) y que vamos a denotar mediante λ. Decimos que la variable X =número de veces que ocurre A en un intervalo unidad cuyo espacio muestral es X = {0, 1, 2, ...}, sigue una distribución de Poisson (también llamada Ley de los Sucesos Raros) de parámetro λ si su función de probabilidad está dada por: −λ λx e x! , si x ∈ X = {0, 1, 2, ....}; p(x) = 0, en otro caso. En este caso: E(X) = λ V (X) = λ Si X es una variable cuya distribución de probabilidad es como la del modelo de Poisson, lo indicaremos poniendo X ∼ P(λ) donde λ = E(X) es el número medio de veces que ocurre A en un intervalo unidad. Además las probabilidades Binomiales cuando n es grande y p es pequeño se aproximan a las probabilidades de Poisson, haciendo λ = np. Es decir, n x λx p (1 − p)n−x → e−λ , x! x si n → ∞, λ = np Lo anterior signica que podemos aproximar probabilidades binomiales mediante probabilidades de Poisson cuando n sea sucientemente grande y p pequeño. Ejemplo 3.1 En un núcleo urbano de n = 100000 personas la probabilidad de infección p = 0.00002, el número X =Número de infectados sigue X ∼ B(100000, 0.00002) que podemos aproximar a un modelo de parámetro λ = np = 2. La probabilidad exacta, según el modelo Binomial, de de cada una de ellas es un modelo Binomial Poisson de que en un determinado momento haya más de un infectado es P (X > 1) = 1 − P (X = 0) − P (X = 1) = 1 − 0.1353326 − 0.2706706 = 0.5939969 Mientras que aproximando la misma probabilidad por el modelo de Poisson se obtiene P (X > 1) = 1 − P (X = 0) − P (X = 1) = 1 − 0.1353353 − 0.2706706 = 0.5939942 (Todas las probabilidades anteriores se calcularon mediante R) Tema 4 Página: 7 M. Iniesta Grado en Ciencia y Tecnología de los Alimentos 3.4.1. Universidad de Murcia Actividades 1. Denir cinco situaciones experimentales que se ajusten a un modelo de Poisson. Establecer el parámetro λ en cada caso. 2. Denir cinco situaciones experimentales que se ajusten a un modelo de Binomial pero con aproximación razonablemente buena al modelo de Poisson. Establecer en cada caso los correspondientes parámetros. 4. Bibliografía 1. Tema 2, sección 2 del texto Estadística para Ciencias Agropecuarias. Autor: Di Riezo, J. A. 2. Tema 2 del texto Probabilidad y Estadística Delgado de la Torre. Editorial Delta. para Ciencias e Ingenierías. Rosario 3. Tema 2, secciones 2.3 y 2.4 y Tema 4, secciones 4.1, 4.2, 4.3 y 4.4 del texto Estadística para ingenieros y cientícos. William Navidi. Editorial McGraw-Hill. Tema 4 Página: 8