Variables aleatorias

Anuncio
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
Variables aleatorias
DEFINICIÓN
En temas anteriores, se han estudiado las variables estadı́sticas, que representaban el conjunto
de resultados observados al realizar un experimento aleatorio, presentando para cada valor su
frecuencia, esto es, el número de veces que sucede cada resultado.
Sin embargo, antes de realizar un experimento aleatorio no se puede predecir con exactitud
qué resultados se van a observar, sino que, como mucho, se puede describir cuáles van a ser los
resultados posibles y con qué probabilidad puede ocurrir cada uno de ellos. En muchas ocasiones,
nos interesa más que el resultado completo del experimento, una función real de los resultados.
Tales funciones cuyos valores dependen de los posibles resultados de un experimento aleatorio,
se llaman variables aleatorias. En todo proceso de observación o experimento aleatorio podemos
definir una variable aleatoria asignando a cada resultado del experimento un número:
• si el resultado del experimento es numérico porque contamos o medimos, los posibles valores
de la variable coinciden con los resultados del experimento.
• si el resultado del experimento es cualitativo, hacemos corresponder a cada resultado un
número siguiendo algún criterio.
Una variable aleatoria X es una función definida sobre el espacio muestral Ω (conjunto de los
resultados de un experimento aleatorio) que toma valores en el cuerpo de los números reales IR,
es decir
X : Ω → IR
Una variable aleatoria puede ser discreta o continua según sea el rango de esta aplicación.
• Una variable aleatoria es discreta si toma un número de valores finito o infinito numerable.
Estas variables corresponden a experimentos en los que se cuenta el número de veces que ha
ocurrido un suceso.
• Una variable aleatoria es continua cuando puede tomar cualquier valor de un intervalo real
de la forma (a, b), (a, ∞), (−∞, b), (−∞, +∞) o uniones de ellos. Por ejemplo, el peso de
una persona, el tiempo de duración de un suceso, etc.
VARIABLES ALEATORIAS DISCRETAS
Para la descripción de una variable aleatoria discreta, se especifican los posibles valores de la
variable con sus respectivas probabilidades.
Sea X una variable aleatoria que toma valores x1 , x2 , . . . , xn , . . .. Entenderemos por P (X = xi )
como la probabilidad del suceso
X −1 (xi ) = {w ∈ Ω : X(w) = xi } = A ∈ Q.
Por ejemplo, en el experimento consistente en lanzar dos monedas, el espacio muestral es
Ω = {(c, c), (c, f ), (f, c), (f, f )}, donde c representa cara y f representa cruz. Sobre este espacio
se puede definir la función X : Ω → IR dada por X(w) = ”número de caras que aparecen”. Ésta
es una variable aleatoria discreta, ya que toma los valores
X(f, f ) = 0;
X(c, f ) = X(f, c) = 1;
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
X(c, c) = 2
1
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
y las probabilidades con que toma estos valores serán
1
P (X = 0) = ;
4
2
P (X = 1) = ;
4
1
P (X = 2) = .
4
La tabla formada por los valores que toma la variable junto con sus probabilidades, recibe el
nombre de distribución o función de probabilidad de la variable.
Muchas veces interesa conocer con qué probabilidad una variable aleatoria toma valores que no
sobrepasan un determinado número real x, es decir, la probabilidad acumulada de que la variable
tome valores inferiores a ese x.
La función de distribución de una variable aleatoria discreta X se define por
F (x) = P (X ≤ x) =
X
P (X = xi )
xi ≤x
Caracterı́sticas de la función de distribución:
• F (x) está definida para todos los números reales.
• 0 ≤ F (x) ≤ 1, puesto que está definida a través de una probabilidad.
• lim F (x) = 0
x→−∞
• lim F (x) = 1
x→∞
• Gráficamente, F (x) es una función escalonada(constante a trozos), cuyos saltos se producen
en los valores que toma la variable.
La función de distribución para la variable X=”número de caras que aparecen al lanzar dos
veces una moneda” es:

0
si x < 0



 1/4 si 0 ≤ x < 1
F (x) =

3/4 si 1 ≤ x < 2



1
si x ≥ 2
En ocasiones, resulta cómodo utilizar la función de distribución para el cálculo de probabilidades. Analizemos distintos casos:
• P (X ≤ x) = F (x), por definición.
• P (X > x) = 1 − P (X ≤ x) = 1 − F (x)
• Si consideramos n, m ∈ IN, valores que toma la variable X, se verifica
P (n < X ≤ m) = P (X ≤ m) − P (X ≤ n) = F (m) − F (n)
• Como P (n ≤ X ≤ m) = P (n − 1 < X ≤ m) = F (m) − F (n − 1).
• Para k ∈ IN cualquiera de los valores de la variable, se tiene
P (X = k) = P (k ≤ X ≤ k) = P (k − 1 < X ≤ k) = F (k) − F (k − 1)
La función de probabilidad de una variable aleatoria discreta es un modelo teórico de la distribución de frecuencia relativa de los resultados de un experimento aleatorio. Por tanto, se
pueden describir los datos del experimento con medidas descriptivas numéricas similares a las que
se trataron en Estadı́stica Descriptiva.
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
2
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
Sea X una variable aleatoria discreta que toma valores x1 , x2 , . . . , xn , . . .. El valor esperado o
esperanza matemática es la medida de centralización más utilizada y se obtiene promediando cada
posible valor por su probabilidad.
µ = E(X) =
X
xi P (X = xi )
i
donde el sumatorio va extendido a todos los posibles valores que tome la variable.
Asimismo, se define la varianza como
2
=
σX
X
(xi − µ)2 P (X = xi ) =
X
i
x2i P (X = xi ) − µ2
i
Igual que en el caso de Estadı́stica Descriptiva, se define la desviación tı́pica como la raı́z
cuadrada positiva de la varianza.
VARIABLES ALEATORIAS CONTINUAS
En las variable continuas, hay que observar que la probabilidad de que la variable tome un
valor particular se considera igual a cero. Se supone que no es posible conocer el valor exacto de
una variable continua, ya que medir su valor consiste en clasificarlo dentro de un intervalo.
Las variables aleatorias continuas se describen por medio de una función real de variable
real, a la que se denomina función de densidad, que surge como la generalización de las curvas
de frecuencias asociadas a los histogramas, cuando la amplitud de los intervalos se considera
infinitamente pequeña.
Llamaremos función de densidad de una variable aleatoria X a una función real f (x) no
negativa (f (x) ≥ 0) tal que
Z
+∞
f (x) dx = 1
−∞
y de forma que es posible calcular la probabilidad de que X tome valores en un cierto intervalo
[a, b], por integración
P (a < X < b) =
Z
b
f (x) dx.
a
Conviene resaltar de nuevo que en variables aleatorias continuas se mide la probabilidad de
intervalos y que la probabilidad de que la variable tome un valor concreto se considera cero. Por
lo tanto,
Z
b
f (x) dx = P (a < X < b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a ≤ X ≤ b)
a
La función de distribución de X se define igual que para variables discretas. Viene dada
por F (x) = P (X ≤ x), ahora bien, la forma de acumular probabilidades está ahora asociada a
acumular áreas de la función de densidad
F (x) =
Z
x
f (t) dt.
−∞
Las caracterı́sticas de la función de distribución para variables continuas son similares a las del
caso discreto, con la diferencia fundamental de que en el caso continuo, la función de distribución
es una función continua en todo IR.
Si pensamos en el teorema Fundamental del Cálculo, obtenemos cómo ”recuperar” la función
de densidad, conociendo la de distribución
f (x) = F 0 (x).
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
3
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
Lo que implica, si aplicamos la regla de Barrow,
P (a < X < b) =
Z
b
f (x) dx = F (b) − F (a).
a
En el caso continuo, la fórmula del valor esperado o esperanza matemática queda
µ = E(X) =
Z
+∞
xf (x) dx
−∞
donde f (x) es la función de densidad de la variable aleatoria X.
Análogamente, para la varianza
2
σX
=
Z
+∞
(x − µ)2 f (x) dx =
−∞
Z
+∞
x2 f (x) dx − µ2
−∞
MODELOS PROBABILÍSTICOS
Con frecuencia, al considerar variables aleatorias distintas, asociadas incluso a experimentos
aleatorios diferentes, se observa que las distribuciones de probabilidad son, en esencia, similares. Se
pueden, por tanto, considerar modelos de distribuciones de probabilidad, aplicables a numerosas
situaciones reales. Nuestra intención ahora es exponer las condiciones teóricas que caracterizan a
la situación que se desea modelar, para, a partir de ellas, razonar la forma de la correspondiente
función de probabilidad o de la función de densidad, según se estén considerando variables que,
por sus caracterı́sticas, se pueden clasificar como discretas o continuas. Ahora bien, ante una
situación real, es responsabilidad del observador, decidir qué modelo teórico es el adecuado para
describir el problema.
Distribuciones discretas
Distribución uniforme discreta
Una variable aleatoria discreta X que toma n valores enteros equiprobables recibe el nombre
de variable uniforme discreta. Si la variable toma valores 1, 2, . . . , n, sus probabilidades asociadas
serán
1
para todo k ∈ {1, 2, . . . , n}
P (X = k) =
n
Su media y varianza son
n+1
n2 − 1
σ2 =
µ=
2
12
Distribución de Bernoulli
Consideremos un experimento aleatorio que admite sólo dos resultados posibles excluyentes:
suceso A (éxito) con probabilidad P (A) = p y
suceso Ac (fracaso) con probabilidad P (Ac ) = 1 − p = q.
La realización de un experimento de este tipo recibe el nombre de prueba de Bernoulli.
Asociada una prueba de Bernoulli, se puede definir una variable aleatoria discreta X=”número
de éxitos al realizar una prueba de Bernoulli”, que toma el valor 0, cuando ocurre el suceso Ac
con probabilidad q y el valor 1, cuando ocurre el suceso A, con probabilidad p. La función de
probabilidad de esta variable se puede escribir, por tanto:
P (X = k) = pk q 1−k
para k = 0, 1.
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
4
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
Su media y varianza son
µ=p
σ2 = p q
Distribución binomial
Supongamos que se realizan n pruebas de Bernoulli independientes, es decir, la probabilidad
de éxito, p, es la misma en todas las pruebas. Por ejemplo, si se lanza un dado tres veces, la
probabilidad de sacar un seis es igual a 1/6, en los tres lanzamientos. A la variable aleatoria
discreta
X = ”número de veces que ocurre el suceso A (éxito) en las n pruebas”
se la denomina variable aleatoria binomial de parámetros n y p. Los valores que toma la variable
X son los éxitos que se pueden producir cuando repito el mismo experimento n veces, luego irı́an
desde 0 éxitos hasta n éxitos. La variable tomará el valor k arbitrario, cuando se produzcan k
éxitos y n − k fracasos. La probabilidad de k éxitos es pk y la de n − k fracasos es (1 − p)n−k ,
luego la probabilidad de un resultado elemental con k éxitos y n − k fracasos será pk (1 − p)n−k .
Ahora bien, los k éxitos se pueden producir de varias formas distintas a lo largo de las n pruebas:
pueden ocurrir en las k primeras pruebas o en las k últimas o un éxito en la primera prueba y los
k −1 fracasos, todos seguidos al final o...Hay que contar
el número de subconjuntos de k elementos
que se pueden formar con las n pruebas, esto es, nk . Por lo tanto, si se denota por q a 1 − p, la
función de probabilidad de esta variable será
k n−k
P (X = k)= n
k p q
para k = 0, 1, 2, . . . , n.
Para indicar que una variable X es una binomial de parámetros n y p, se escribirá X ∼ B(n, p).
Su media y varianza son
µ = np
σ 2 = np q.
Los valores de P (X = k) se encuentran tabulados para algunos valores de p entre 0 y 0.5.
Si el valor de p es mayor que 0.5, entonces hay que tener en cuenta la denominada propiedad de
simetrı́a: dado un experimento de Bernoulli repetido n veces, se consideran las variables aleatorias
X=” número de éxitos en las n pruebas” (X ∼ B(n, p)) e
Y =” número de fracasos en las n pruebas” (Y ∼ B(n, q)).
Entonces,
P (X = k) = P (Y = n − k).
Distribución de Poisson
Éste es un modelo probabilı́stico útil para describir el número de veces que ocurre un determinado suceso a lo largo de una unidad de tiempo, área, volumen, etc., establecido. Una situación
caracterı́stica de este tipo se da cuando se observa la cola que se forma en determinados servicios.
El número de clientes que llegan a una caja de un supermercado en un cuarto de hora, el número
de pacientes que llegan a la sala de urgencias de un hospital en una hora, el número de trabajos
que recibe una impresora en red de una empresa por minuto, son variables cuya distribución se
puede describir con este modelo probabilı́stico. Todas ellas tienen ciertas caracterı́sticas comunes:
el número de clientes, pacientes o trabajos por unidad de tiempo es independiente del número de
los mismos que llegan en otra unidad de tiempo; la probabilidad de que un cliente, paciente o
trabajo llegue en una unidad de tiempo es la misma para todas las unidades.
Si se denota por la letra griega λ al número esperado de ocurrencias de un suceso por unidad de
tiempo, área, volumen, etc., la variable aleatoria X=”número de veces que ocurre un determinado
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
5
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
suceso por unidad de tiempo, área, volumen, etc.” se dice que sigue una distribución de probabilidad
de Poisson de parámetro λ. Puede tomar todos los valores enteros 0, 1, 2, . . . con probabilidades
P (X = k) =
λk −λ
e ,
k!
para k = 0, 1, 2, . . . .
Su media y varianza son
σ2 = λ
µ=λ
Esta distribución es una buena aproximación de la binomial cuando n es grande y p pequeña,
a saber, cuando p ≤ 0.1 y np < 5.
Distribuciones continuas
Distribución uniforme continua
Una variable aleatoria continua X que toma valores en un intervalo acotado de los números
reales sigue una distribución uniforme cuando la probabilidad de que la variable tome valores en
cualquier subintervalo del mismo, es proporcional a la longitud de dicho subintervalo, con lo que
la probabilidad asociada a dos subintervalos de igual longitud es la misma. En tal caso, si [a, b]
es el intervalo de la recta real en la que la variable toma valores, la función de densidad es
(
f (x) =
1
b−a
si
0
x ∈ [a, b]
en el resto
Por tanto, su función de distribución es
F (x) =





0
si x < a
si x ∈ [a, b]
si
x>b
x−a
b−a
1
Obsérvese que la probabilidad de cualquier subintervalo [x1 , x2 ] ⊆ [a, b] viene dada por
P (x1 ≤ X ≤ x2 ) =
Z
x2
x1
x2 − x1
1
dx =
b−a
b−a
Un cálculo simple muestra que la media y varianza de la variable uniforme continua son
µ=
a+b
2
σ2 =
(b − a)2
12
Distribución normal
Sin duda, es la más importante de todos los modelos probabilı́sticos, pues su aplicación se
extiende a numerosos campos de la naturaleza, la industria, la Economı́a, etc. Tiene su origen
en la modelización de la distribución de frecuencias relativas de errores cometidos al efectuar
repetidas veces una medición.
Una variable continua X se dice que tiene una distribución normal de media µ y desviación
tı́pica σ y se representa por X ∼ N(µ, σ), si puede tomar cualquier valor de los números reales y
su función de densidad es
2
1 (x−µ)
1
f (x) = √ e− 2 σ2
σ 2π
La función de densidad f (x) presenta un máximo en x = µ, dos puntos de inflexión en x = µ−σ
y x = µ + σ y tiene al eje OX como ası́ntota. Su gráfica es simétrica respecto a la recta x = µ.
Al tratarse de una variable continua, para calcular probabilidades asociadas a la normal, por
ejemplo
Z x2
2
1 (x−µ)
1
√ e− 2 σ 2
P (x1 ≤ X ≤ x2 ) =
x1 σ 2π
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
6
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
habrı́a que calcular la integral anterior, pero ésto no puede hacerse analı́ticamente, sino que habrı́a
que emplear métodos de integración numérica. El recurso que queda es tabular las dististas
probabilidades posibles, pero como depende de los valores de los parámetros µ y σ, en principio,
serı́a necesario construir una tabla distinta para cada par de valores. Sin embargo la tipificación
de una variable normal de parámetros µ y σ, da lugar a otra variable normal, ésta, de media 0 y
desviación tı́pica 1.
Si una variable X es N(µ, σ), la nueva variable
Z=
X −µ
σ
sigue también una distribución normal de media 0 y desviación tı́pica 1, es decir Z es N(0, 1). A
la variable Z se le denomina variable tipificada de X y a la curva de su función de densidad curva
normal estándar o tipificada.
La distribución de la variable normal de media 0 y desviación tı́pica 1 se encuentra tabulada.
En las tablas aparecen áreas bajo la curva normal, a la derecha de un punto zα . Por zα se
representa el valor de la abcisa que tiene a la derecha un área bajo la curva normal igual a α, es
decir
P (Z ≥ zα ) = α.
Habitualmente, sólo se encuentran tabulados valores de Z positivos o áreas α ≤ 0.5. Para valores
de Z menores que cero, debido a la simetrı́a se tendrá en cuenta que si −zα ≤ 0, entonces
P (Z ≤ −zα ) = P (Z ≥ zα ).
Para las áreas a la izquierda, se tiene que P (Z ≤ zα ) = 1 − P (Z ≥ zα ) = 1 − α.
Por otra parte, para calcular probabilidades asociadas a intervalos, distinguimos los casos
siguientes:
a) si a, b ≥ 0, entonces P (a ≤ Z ≤ b) = P (Z ≥ a) − P (Z ≥ b)
b) si −a, −b ≤ 0, entonces P (−a ≤ Z ≤ −b) = P (a ≤ Z ≤ b) y se calcuları́a como el caso
anterior
c) si −a ≤ 0 y b ≥ 0, entonces
P (−a ≤ Z ≤ b) = 1 − [P (Z ≤ −a) + P (Z ≥ b)] = 1 − [P (Z ≥ a) + P (Z ≥ b)]
La gran utilidad de la variable tipificada Z es que nos permite calcular áreas (y por tanto
probabilidades) de cualquier distribución normal. Si X es N(µ, σ) entonces
P (a ≤ X ≤ b) = P
X −µ
b−µ
a−µ
≤
≤
σ
σ
σ
!
!
=P
a−µ
b−µ
≤Z≤
.
σ
σ
Si X es una variable binomial de parámetros n y p, entonces si n es grande y ni p ni q son
√
próximos a cero, podemos considerar que X sigue aproximadamente una distribución N(np, npq).
Por tanto, la variable tipificada correspondiente
X − np
Z= √
npq
es N(0, 1).
Se puede afirmar que la aproximación es suficientemente buena cuando np > 5, si p ≤ 0.5, o
bien nq > 5, si p > 0.5.
Hay que tener en cuenta que para utilizar correctamente esta transformación de una variable
discreta X (con distribución binomial) en una variable continua Z (con distribución normal) es
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
7
ESTADÍSTICA APLICADA Y MODELIZACIÓN. I.T. DISEÑO INDUSTRIAL.
necesario hacer una corrección de continuidad. Téngase en cuenta que P (X = a), saldrı́a siempre
igual a cero. Ésto se evita identificando el suceso {X = a} con {a − 0.5 ≤ X ≤ a + 0.5}, es decir
√
P (X = a) = P (a − 0.5 ≤ X ≤ a + 0.5) = P (a − 0.5 ≤ N(np, npq) ≤ a + 0.5) =
P
a − 0.5 − np
a + 0.5 − np
≤Z≤
√
√
npq
npq
!
Esta corrección puede extenderse a cualquier intervalo de forma que
√
P (a ≤ X ≤ b) = P (a − 0.5 ≤ N(np, npq) ≤ b + 0.5)
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
8
Descargar