ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL. Variables aleatorias DEFINICIÓN En temas anteriores, se han estudiado las variables estadı́sticas, que representaban el conjunto de resultados observados al realizar un experimento aleatorio, presentando para cada valor su frecuencia, esto es, el número de veces que sucede cada resultado. Sin embargo, antes de realizar un experimento aleatorio no se puede predecir con exactitud qué resultados se van a observar, sino que, como mucho, se puede describir cuáles van a ser los resultados posibles y con qué probabilidad puede ocurrir cada uno de ellos. En muchas ocasiones, nos interesa más que el resultado completo del experimento, una función real de los resultados. Tales funciones cuyos valores dependen de los posibles resultados de un experimento aleatorio, se llaman variables aleatorias. En todo proceso de observación o experimento aleatorio podemos definir una variable aleatoria asignando a cada resultado del experimento un número: • si el resultado del experimento es numérico porque contamos o medimos, los posibles valores de la variable coinciden con los resultados del experimento. • si el resultado del experimento es cualitativo, hacemos corresponder a cada resultado un número siguiendo algún criterio. Una variable aleatoria X es una función definida sobre el espacio muestral Ω (conjunto de los resultados de un experimento aleatorio) que toma valores en el cuerpo de los números reales IR, es decir X : Ω → IR Una variable aleatoria puede ser discreta o continua según sea el rango de esta aplicación. • Una variable aleatoria es discreta si toma un número de valores finito o infinito numerable. Estas variables corresponden a experimentos en los que se cuenta el número de veces que ha ocurrido un suceso. • Una variable aleatoria es continua cuando puede tomar cualquier valor de un intervalo real de la forma (a, b), (a, ∞), (−∞, b), (−∞, +∞) o uniones de ellos. Por ejemplo, el peso de una persona, el tiempo de duración de un suceso, etc. VARIABLES ALEATORIAS DISCRETAS Para la descripción de una variable aleatoria discreta, se especifican los posibles valores de la variable con sus respectivas probabilidades. Sea X una variable aleatoria que toma valores x1 , x2 , . . . , xn , . . .. Entenderemos por P (X = xi ) como la probabilidad del suceso X −1 (xi ) = {w ∈ Ω : X(w) = xi } = A ∈ Q. Por ejemplo, en el experimento consistente en lanzar dos monedas, el espacio muestral es Ω = {(c, c), (c, f ), (f, c), (f, f )}, donde c representa cara y f representa cruz. Sobre este espacio se puede definir la función X : Ω → IR dada por X(w) = ”número de caras que aparecen”. Ésta es una variable aleatoria discreta, ya que toma los valores X(f, f ) = 0; X(c, f ) = X(f, c) = 1; Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada X(c, c) = 2 1 ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL. y las probabilidades con que toma estos valores serán 1 P (X = 0) = ; 4 2 P (X = 1) = ; 4 1 P (X = 2) = . 4 La tabla formada por los valores que toma la variable junto con sus probabilidades, recibe el nombre de distribución o función de probabilidad de la variable. Muchas veces interesa conocer con qué probabilidad una variable aleatoria toma valores que no sobrepasan un determinado número real x, es decir, la probabilidad acumulada de que la variable tome valores inferiores a ese x. La función de distribución de una variable aleatoria discreta X se define por F (x) = P (X ≤ x) = X P (X = xi ) xi ≤x Caracterı́sticas de la función de distribución: • F (x) está definida para todos los números reales. • 0 ≤ F (x) ≤ 1, puesto que está definida a través de una probabilidad. • lim F (x) = 0 x→−∞ • lim F (x) = 1 x→∞ • Gráficamente, F (x) es una función escalonada(constante a trozos), cuyos saltos se producen en los valores que toma la variable. La función de distribución para la variable X=”número de caras que aparecen al lanzar dos veces una moneda” es: 0 si x < 0 1/4 si 0 ≤ x < 1 F (x) = 3/4 si 1 ≤ x < 2 1 si x ≥ 2 En ocasiones, resulta cómodo utilizar la función de distribución para el cálculo de probabilidades. Analizemos distintos casos: • P (X ≤ x) = F (x), por definición. • P (X > x) = 1 − P (X ≤ x) = 1 − F (x) • Si consideramos n, m ∈ IN, valores que toma la variable X, se verifica P (n < X ≤ m) = P (X ≤ m) − P (X ≤ n) = F (m) − F (n) • Como P (n ≤ X ≤ m) = P (n − 1 < X ≤ m) = F (m) − F (n − 1). • Para k ∈ IN cualquiera de los valores de la variable, se tiene P (X = k) = P (k ≤ X ≤ k) = P (k − 1 < X ≤ k) = F (k) − F (k − 1) La función de probabilidad de una variable aleatoria discreta es un modelo teórico de la distribución de frecuencia relativa de los resultados de un experimento aleatorio. Por tanto, se pueden describir los datos del experimento con medidas descriptivas numéricas similares a las que se trataron en Estadı́stica Descriptiva. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 2 ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL. Sea X una variable aleatoria discreta que toma valores x1 , x2 , . . . , xn , . . .. El valor esperado o esperanza matemática es la medida de centralización más utilizada y se obtiene promediando cada posible valor por su probabilidad. µ = E(X) = X xi P (X = xi ) i donde el sumatorio va extendido a todos los posibles valores que tome la variable. Asimismo, se define la varianza como 2 = σX X (xi − µ)2 P (X = xi ) = X i x2i P (X = xi ) − µ2 i Igual que en el caso de Estadı́stica Descriptiva, se define la desviación tı́pica como la raı́z cuadrada positiva de la varianza. VARIABLES ALEATORIAS CONTINUAS En las variable continuas, hay que observar que la probabilidad de que la variable tome un valor particular se considera igual a cero. Se supone que no es posible conocer el valor exacto de una variable continua, ya que medir su valor consiste en clasificarlo dentro de un intervalo. Las variables aleatorias continuas se describen por medio de una función real de variable real, a la que se denomina función de densidad, que surge como la generalización de las curvas de frecuencias asociadas a los histogramas, cuando la amplitud de los intervalos se considera infinitamente pequeña. Llamaremos función de densidad de una variable aleatoria X a una función real f (x) no negativa (f (x) ≥ 0) tal que Z +∞ f (x) dx = 1 −∞ y de forma que es posible calcular la probabilidad de que X tome valores en un cierto intervalo [a, b], por integración P (a < X < b) = Z b f (x) dx. a Conviene resaltar de nuevo que en variables aleatorias continuas se mide la probabilidad de intervalos y que la probabilidad de que la variable tome un valor concreto se considera cero. Por lo tanto, Z b f (x) dx = P (a < X < b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a ≤ X ≤ b) a La función de distribución de X se define igual que para variables discretas. Viene dada por F (x) = P (X ≤ x), ahora bien, la forma de acumular probabilidades está ahora asociada a acumular áreas de la función de densidad F (x) = Z x f (t) dt. −∞ Las caracterı́sticas de la función de distribución para variables continuas son similares a las del caso discreto, con la diferencia fundamental de que en el caso continuo, la función de distribución es una función continua en todo IR. Si pensamos en el teorema Fundamental del Cálculo, obtenemos cómo ”recuperar” la función de densidad, conociendo la de distribución f (x) = F 0 (x). Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 3 ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL. Lo que implica, si aplicamos la regla de Barrow, P (a < X < b) = Z b f (x) dx = F (b) − F (a). a En el caso continuo, la fórmula del valor esperado o esperanza matemática queda µ = E(X) = Z +∞ xf (x) dx −∞ donde f (x) es la función de densidad de la variable aleatoria X. Análogamente, para la varianza 2 σX = Z +∞ (x − µ)2 f (x) dx = −∞ Z +∞ x2 f (x) dx − µ2 −∞ MODELOS PROBABILÍSTICOS Con frecuencia, al considerar variables aleatorias distintas, asociadas incluso a experimentos aleatorios diferentes, se observa que las distribuciones de probabilidad son, en esencia, similares. Se pueden, por tanto, considerar modelos de distribuciones de probabilidad, aplicables a numerosas situaciones reales. Nuestra intención ahora es exponer las condiciones teóricas que caracterizan a la situación que se desea modelar, para, a partir de ellas, razonar la forma de la correspondiente función de probabilidad o de la función de densidad, según se estén considerando variables que, por sus caracterı́sticas, se pueden clasificar como discretas o continuas. Ahora bien, ante una situación real, es responsabilidad del observador, decidir qué modelo teórico es el adecuado para describir el problema. Distribuciones discretas Distribución uniforme discreta Una variable aleatoria discreta X que toma n valores enteros equiprobables recibe el nombre de variable uniforme discreta. Si la variable toma valores 1, 2, . . . , n, sus probabilidades asociadas serán 1 para todo k ∈ {1, 2, . . . , n} P (X = k) = n Su media y varianza son n+1 n2 − 1 σ2 = µ= 2 12 Distribución de Bernoulli Consideremos un experimento aleatorio que admite sólo dos resultados posibles excluyentes: suceso A (éxito) con probabilidad P (A) = p y suceso Ac (fracaso) con probabilidad P (Ac ) = 1 − p = q. La realización de un experimento de este tipo recibe el nombre de prueba de Bernoulli. Asociada una prueba de Bernoulli, se puede definir una variable aleatoria discreta X=”número de éxitos al realizar una prueba de Bernoulli”, que toma el valor 0, cuando ocurre el suceso Ac con probabilidad q y el valor 1, cuando ocurre el suceso A, con probabilidad p. La función de probabilidad de esta variable se puede escribir, por tanto: P (X = k) = pk q 1−k para k = 0, 1. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 4 ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL. Su media y varianza son µ=p σ2 = p q Distribución binomial Supongamos que se realizan n pruebas de Bernoulli independientes, es decir, la probabilidad de éxito, p, es la misma en todas las pruebas. Por ejemplo, si se lanza un dado tres veces, la probabilidad de sacar un seis es igual a 1/6, en los tres lanzamientos. A la variable aleatoria discreta X = ”número de veces que ocurre el suceso A (éxito) en las n pruebas” se la denomina variable aleatoria binomial de parámetros n y p. Los valores que toma la variable X son los éxitos que se pueden producir cuando repito el mismo experimento n veces, luego irı́an desde 0 éxitos hasta n éxitos. La variable tomará el valor k arbitrario, cuando se produzcan k éxitos y n − k fracasos. La probabilidad de k éxitos es pk y la de n − k fracasos es (1 − p)n−k , luego la probabilidad de un resultado elemental con k éxitos y n − k fracasos será pk (1 − p)n−k . Ahora bien, los k éxitos se pueden producir de varias formas distintas a lo largo de las n pruebas: pueden ocurrir en las k primeras pruebas o en las k últimas o un éxito en la primera prueba y los k −1 fracasos, todos seguidos al final o...Hay que contar el número de subconjuntos de k elementos que se pueden formar con las n pruebas, esto es, nk . Por lo tanto, si se denota por q a 1 − p, la función de probabilidad de esta variable será k n−k P (X = k)= n k p q para k = 0, 1, 2, . . . , n. Para indicar que una variable X es una binomial de parámetros n y p, se escribirá X ∼ B(n, p). Su media y varianza son µ = np σ 2 = np q. Los valores de P (X = k) se encuentran tabulados para algunos valores de p entre 0 y 0.5. Si el valor de p es mayor que 0.5, entonces hay que tener en cuenta la denominada propiedad de simetrı́a: dado un experimento de Bernoulli repetido n veces, se consideran las variables aleatorias X=” número de éxitos en las n pruebas” (X ∼ B(n, p)) e Y =” número de fracasos en las n pruebas” (Y ∼ B(n, q)). Entonces, P (X = k) = P (Y = n − k). Distribución de Poisson Éste es un modelo probabilı́stico útil para describir el número de veces que ocurre un determinado suceso a lo largo de una unidad de tiempo, área, volumen, etc., establecido. Una situación caracterı́stica de este tipo se da cuando se observa la cola que se forma en determinados servicios. El número de clientes que llegan a una caja de un supermercado en un cuarto de hora, el número de pacientes que llegan a la sala de urgencias de un hospital en una hora, el número de trabajos que recibe una impresora en red de una empresa por minuto, son variables cuya distribución se puede describir con este modelo probabilı́stico. Todas ellas tienen ciertas caracterı́sticas comunes: el número de clientes, pacientes o trabajos por unidad de tiempo es independiente del número de los mismos que llegan en otra unidad de tiempo; la probabilidad de que un cliente, paciente o trabajo llegue en una unidad de tiempo es la misma para todas las unidades. Si se denota por la letra griega λ al número esperado de ocurrencias de un suceso por unidad de tiempo, área, volumen, etc., la variable aleatoria X=”número de veces que ocurre un determinado Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 5 ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL. suceso por unidad de tiempo, área, volumen, etc.” se dice que sigue una distribución de probabilidad de Poisson de parámetro λ. Puede tomar todos los valores enteros 0, 1, 2, . . . con probabilidades P (X = k) = λk −λ e , k! para k = 0, 1, 2, . . . . Su media y varianza son σ2 = λ µ=λ Esta distribución es una buena aproximación de la binomial cuando n es grande y p pequeña, a saber, cuando p ≤ 0.1 y np < 5. Distribuciones continuas Distribución uniforme continua Una variable aleatoria continua X que toma valores en un intervalo acotado de los números reales sigue una distribución uniforme cuando la probabilidad de que la variable tome valores en cualquier subintervalo del mismo, es proporcional a la longitud de dicho subintervalo, con lo que la probabilidad asociada a dos subintervalos de igual longitud es la misma. En tal caso, si [a, b] es el intervalo de la recta real en la que la variable toma valores, la función de densidad es ( f (x) = 1 b−a si 0 x ∈ [a, b] en el resto Por tanto, su función de distribución es F (x) = 0 si x < a si x ∈ [a, b] si x>b x−a b−a 1 Obsérvese que la probabilidad de cualquier subintervalo [x1 , x2 ] ⊆ [a, b] viene dada por P (x1 ≤ X ≤ x2 ) = Z x2 x1 x2 − x1 1 dx = b−a b−a Un cálculo simple muestra que la media y varianza de la variable uniforme continua son µ= a+b 2 σ2 = (b − a)2 12 Distribución normal Sin duda, es la más importante de todos los modelos probabilı́sticos, pues su aplicación se extiende a numerosos campos de la naturaleza, la industria, la Economı́a, etc. Tiene su origen en la modelización de la distribución de frecuencias relativas de errores cometidos al efectuar repetidas veces una medición. Una variable continua X se dice que tiene una distribución normal de media µ y desviación tı́pica σ y se representa por X ∼ N(µ, σ), si puede tomar cualquier valor de los números reales y su función de densidad es 2 1 (x−µ) 1 f (x) = √ e− 2 σ2 σ 2π La función de densidad f (x) presenta un máximo en x = µ, dos puntos de inflexión en x = µ−σ y x = µ + σ y tiene al eje OX como ası́ntota. Su gráfica es simétrica respecto a la recta x = µ. Al tratarse de una variable continua, para calcular probabilidades asociadas a la normal, por ejemplo Z x2 2 1 (x−µ) 1 √ e− 2 σ 2 P (x1 ≤ X ≤ x2 ) = x1 σ 2π Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 6 ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL. habrı́a que calcular la integral anterior, pero ésto no puede hacerse analı́ticamente, sino que habrı́a que emplear métodos de integración numérica. El recurso que queda es tabular las dististas probabilidades posibles, pero como depende de los valores de los parámetros µ y σ, en principio, serı́a necesario construir una tabla distinta para cada par de valores. Sin embargo la tipificación de una variable normal de parámetros µ y σ, da lugar a otra variable normal, ésta, de media 0 y desviación tı́pica 1. Si una variable X es N(µ, σ), la nueva variable Z= X −µ σ sigue también una distribución normal de media 0 y desviación tı́pica 1, es decir Z es N(0, 1). A la variable Z se le denomina variable tipificada de X y a la curva de su función de densidad curva normal estándar o tipificada. La distribución de la variable normal de media 0 y desviación tı́pica 1 se encuentra tabulada. En las tablas aparecen áreas bajo la curva normal, a la derecha de un punto zα . Por zα se representa el valor de la abcisa que tiene a la derecha un área bajo la curva normal igual a α, es decir P (Z ≥ zα ) = α. Habitualmente, sólo se encuentran tabulados valores de Z positivos o áreas α ≤ 0.5. Para valores de Z menores que cero, debido a la simetrı́a se tendrá en cuenta que si −zα ≤ 0, entonces P (Z ≤ −zα ) = P (Z ≥ zα ). Para las áreas a la izquierda, se tiene que P (Z ≤ zα ) = 1 − P (Z ≥ zα ) = 1 − α. Por otra parte, para calcular probabilidades asociadas a intervalos, distinguimos los casos siguientes: a) si a, b ≥ 0, entonces P (a ≤ Z ≤ b) = P (Z ≥ a) − P (Z ≥ b) b) si −a, −b ≤ 0, entonces P (−a ≤ Z ≤ −b) = P (a ≤ Z ≤ b) y se calcuları́a como el caso anterior c) si −a ≤ 0 y b ≥ 0, entonces P (−a ≤ Z ≤ b) = 1 − [P (Z ≤ −a) + P (Z ≥ b)] = 1 − [P (Z ≥ a) + P (Z ≥ b)] La gran utilidad de la variable tipificada Z es que nos permite calcular áreas (y por tanto probabilidades) de cualquier distribución normal. Si X es N(µ, σ) entonces P (a ≤ X ≤ b) = P X −µ b−µ a−µ ≤ ≤ σ σ σ ! ! =P a−µ b−µ ≤Z≤ . σ σ Si X es una variable binomial de parámetros n y p, entonces si n es grande y ni p ni q son √ próximos a cero, podemos considerar que X sigue aproximadamente una distribución N(np, npq). Por tanto, la variable tipificada correspondiente X − np Z= √ npq es N(0, 1). Se puede afirmar que la aproximación es suficientemente buena cuando np > 5, si p ≤ 0.5, o bien nq > 5, si p > 0.5. Hay que tener en cuenta que para utilizar correctamente esta transformación de una variable discreta X (con distribución binomial) en una variable continua Z (con distribución normal) es Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 7 ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL. necesario hacer una corrección de continuidad. Téngase en cuenta que P (X = a), saldrı́a siempre igual a cero. Ésto se evita identificando el suceso {X = a} con {a − 0.5 ≤ X ≤ a + 0.5}, es decir √ P (X = a) = P (a − 0.5 ≤ X ≤ a + 0.5) = P (a − 0.5 ≤ N(np, npq) ≤ a + 0.5) = P a − 0.5 − np a + 0.5 − np ≤Z≤ √ √ npq npq ! Esta corrección puede extenderse a cualquier intervalo de forma que √ P (a ≤ X ≤ b) = P (a − 0.5 ≤ N(np, npq) ≤ b + 0.5) Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 8