VARIABLE ALEATORIA

Anuncio
INDICE.-
1.1-
I.-“VARIABLES ALEATORIAS”.
INTRODUCCIÓN.
1.2.- ESPERANZA MATEMÁTICA Y MOMENTOS
1.3.- FUNCIÓN GENERADORA DE MOMENTOS.
1.4.- DESIGUALDAD DE TCHEBYCHEFF
1.5.- TRANSFORMACIÓN DE VARIABLES ALEATORIAS
1.6.- DESVIACIÓN MEDIA, DM
1.7.- VARIANZA Y DESVIACIÓN TÍPICA
II. DISTRIBUCIONES DE VARIABLES ALEATORIA DISCRETA.
2.1.- DISTRIBUCIÓN UNIFORME.
2.2.- DISTRIBUCIÓN BINOMIAL [ X ~ B(n,p) ].
2.3.- DISTRIBUCIÓN GEOMÉTRICA [ X ~ G(p) ](caso particular de la Binomial).
2.4.- BINOMIAL NEGATIVA [ X ~ BN(r,p) ].
2.5.- DISTRIBUCIÓN HIPERGEOMETRICA
2.6.-
2.7.- EJERCICIOS DE SELECTIVIDAD
]
BIBLIOGRAFIA.-
VARIABLES ALEATORIAS.
1.1 Introducción
VARIABLE ALEATORIA.
Frecuentemente el resultado de un experimento aleatorio se denota con un número:
 el resultado de lanzar un dado,
 el número de unidades defectuosas entre 10 unidades seleccionadas,
 el tiempo que hay que esperar para que se presente una falla en un circuito,
 el número de estaciones de una red de computadoras que requieren la atención del servidor de la red en un
momento dado,
 el número de personas en una comunidad que requieren atención médica en un día especificado,
 el peso sumado de las personas que están en un elevador en un momento determinado del día,
 la cantidad en dinero de lo transportado en un camión antes de que sufra una descompostura, etc.
A un número tal, le llamamos variable aleatoria. Ponga atención al hecho de que una variable aleatoria no es una
variable en el sentido usual. Las variables que estamos acostumbrados a manejar son, por ejemplo: el peso de un
cohete que va quemando el combustible que lo impulsa, la distancia del piso a un objeto que cae hacia él, la
concentración de una solución dentro de un tanque conforme pasa el tiempo, etc. En los ejemplos anteriores el
valor de la variable puede cambiar con el tiempo, pero es predecible a partir de las leyes de la mecánica, la
química, la hidráulica o alguna otra ciencia. Con una variable aleatoria la situación es enteramente diferente. El
valor de una variable aleatoria no se puede conocer con exactitud de antemano a la realización del experimento.
¿Qué otros ejemplos de variables aleatorias se le ocurren además de los mencionados arriba? Al contestar esta
pregunta tenga en cuenta que el azar debe jugar algún papel en la medición de la variable y que su valor no debe
ser predecible.
Una variable aleatoria presenta dos características importantes:
1. Una colección (conjunto) de valores posibles al que llamamos imagen de la variable aleatoria (antes lo
llamábamos espacio muestral).
2. Una probabilidad asociada a los posibles resultados la cual queda expresada mediante una función de
probabilidad.
Las variables aleatorias que tienen un conjunto de posibles valores discreto, se llaman discretas. Estas variables
son el resultado de contar . ¿Cuáles de las variables aleatorias mencionadas arriba son discretas? Ciertamente el
peso de las personas en el elevador no es discreto, pero entre las otras ¿cuáles son discretas?
Por otra parte, las variables aleatorias cuyos valores posibles se encuentran en cualquier parte de un intervalo, se
llaman continuas. Estas variables son el resultado de medir.
El hecho de que una variable aleatoria nos interesa cuando aún no tiene un valor específico, nos obliga a utilizar
una notación extraña al referirnos a ella. Denotamos con letras mayúsculas a las variables aleatorias y con
minúsculas a los valores que contemplamos para ellas.
Si tomamos como variable aleatoria el resultado (suma) de lanzar dos dados, desde el punto de vista de la
probabilidad, el número resultante nos interesa antes de que realizemos el experimento. Conocido el resultado, ya
no es interesante (al menos, no para la probabilidad). La imagen de esta variable aleatoria es S = { 2, 3, 4, 5, 6, 7,
8, 9, 10, 11, 12 }. Llamando X al resultado del experimento, podemos contemplar el evento de que X sea igual a x,
donde x es cualquier elemento de S. Claro que nos resultará muy interesante saber cosas como P(X = x) para los
diferentes valores de x en S; por ejemplo, P(X = 6) = 5/36 [esto se lee: ``la probabilidad de que X sea igual a seis
es un sexto'']. ¿Puede Ud. mostrar que P(X = 8) = 5/36 ?
Siguiendo con el ejemplo de los dos dados, el lanzar dados para ver que número cae no es muy apasionante que
digamos, acompañemos los dados con un tablero de oca o de serpientes y escaleras o de turista o de backgamon o
algún otro juego interesante. Ya puestos a jugar turista o monopolio, es natural que nos interesen otro tipo de
eventos. Podríamos estar interesados en saber
 si el resultado es menor que 8: P(X < 8) = 21/36 ¿Puede Ud. ver por qué?;
 que el resultado sea desde 4 hasta menos que 9: P(3 < X < 9) = 23/36 ¿Por qué?;
 también podemos estar interesados en que X sea distinta de 7: P(X distinto de 7) = 1 - P(X = 7) = 1 - 1/6 =
5/6.
Naturalmente esta notación se extiende de manera natural a todo tipo de intervalos y desigualdades.
Regresando a donde estábamos,
A la función: f(x) = P(X = x) se le llama función de probabilidad de X.
Esta función es una función ordinaria de las que estudiamos en los cursos de matemáticas; no tiene nada de
aleatorio. Dicho de otra forma, una vez determinados los valores de las probabilidades, la función de probabilidad
es una función común y corriente, tiene su dominio, su codominio, su gráfica, puede ser inyectiva, etc.
Hay algunos hechos importantes respecto a esta función:
1. Para una variable aleatoria discreta los valores posibles son los únicos para los cuales esta probabilidad
es diferente de cero. Dicho de otra forma, no nos hace daño ampliar el dominio de la función de
probabilidad a todos los reales, pero va a valer cero casi siempre excepto en un conjunto discreto de
puntos.
2. El valor de la función de probabilidad depende esencialmente de la variable aleatoria a la que nos
referimos, cuando no sea claro a cuál variable nos referimos, es conveniente poner el símbolo de la
variable como subíndice para la función: fX(x).
Esta costumbre puede causar estragos en la comprensión de los novatos, esté Ud. prevenido. ¿Qué querrá
decir fY(w)?
3. La gráfica de una función como ésta se presenta en el pizarrón.
Una función de probabilidad de una variable aleatoria discreta, para ser correcta, debe satisfacer dos propiedades
:
 f(x) debe ser siempre mayor o igual a 0
 la suma de f(x) para todos los valores de x debe dar 1
Frecuentemente en los experimentos el interés está en una función del resultado del experimento y no en el
resultado propiamente dicho. Por ejemplo, en el lanzamiento de dados el interés esta en que la suma de los
resultados sea igual a 7 y se es indiferente si este resulta de (1,6), (2,5), (3,4) o (4,3).
En otra situación, por ejemplo, en el contexto de comunicación a través de mensajes, el interés del analista podría
centrarse en el numero de transmisiones exitosas de mensajes en un tiempo dado, mas que en el estado de la
transmisión cada mensaje.
-----> R, son
conocidas como Variables Aleatorias (VA). Por ello, el valor de la variable aleatoria es determinado por el
resultado del experimento y a esos valores se les asignará una probabilidad, como se muestra con los siguientes
ejemplos.
Ejemplos
e1) Si X denota una VA definida como la suma de los resultados en el lanzamiento de 2 dados, entonces:
-----> {2,...,12}
donde:
P(X=2) = P{(1,1)} = 1/36
P(X=3) = P{(1,2),(2,1)} = 2/36
P(X=4) = P{(1,3),(2,2),(3,2)} = 3/36
P(X=5) = P{(1,4),(2,3),(3,2),(4,1)} = 4/36
..
..
P(X=12) = = 1/36
e2) X una VA que representa el numero de transmisiones con éxito de mensajes enviados en un intervalo de tiempo
dado, entonces:
t -----> N
t: conjunto de mensajes transmitidos exitosamente en un intervalo de tiempo t.
e3) Sea Y la VA que representa el número de caras que aparecen luego de lanzar 2 monedas. Luego la VA Y puede
tomar valores 0, 1 o 2, y sus valores probabílisticos son:
P(Y=0) = P{(s,s)} = 1/4
P(Y=1) = P{(s,c),(c,s)} = 2/4
P(Y=2) = P{(c,c)} = 1/4
-----e4) Suponiendo que una moneda esta "cargada" y que la probabilidad de que salga cara es 'p', definamos una VA N
de la siguiente manera:
N : Número de lanzamientos necesarios para que salga cara por primera vez.
Entonces:
P(N=1) = = p
P(N=2) = P{(s,c)} = (1-p)p
P(N=3) = P{(s,s,c)} = (1-p)2p
..
..
..
P(N=n) = P{....} = (1-p)n-1p
Lo cual es una función probabílistica, ya que es positiva y
Todos los ejemplos de VA hasta ahora ilustrados son VA discretas.
Por otro lado una VA se dice continua si toma valores de un conjunto continuo de posibles valores. Un ejemplo de
VA continua es el tiempo de transmisión de un mensaje, la vida útil de un motor, asumiendo que la vida útil del
motor toma un valor en un intervalo (a, b) de los reales.
Definición
Sea F(.), una función definida para cualquier valor real b de una VA aleatoria X, con b en el intervalo (siguiente manera:
, es conocida como Función de distribución acumulada de X y denota la
probabilidad de que X pueda tomar un valor menor o igual a b.
Propiedades de F(.)
(i) F(b) es una función no decreciente en b
(ii) lim F(b) = 1 cuando b-(iii) lim F(b) = 0 cuando b--> (iv). F es estrictamente continua. Si x1, x2, ... es una serie decreciente con limite en x, entonces
lim F(xn) = F(x) cuando
Observaciones sobre F(.):
= F(b) - F(a), para todo a < b; ya que (Para VA discretas definimos la función de densidad de X con p(a) = P{X=a}.
Si X = {x1, x2,... } en Z, entonces p(xi) > 0 con i=1,2,...
y p(x) = 0 para todo x que no esta en X. Además se debe cumplir que:
En este caso F(.) puede ser definida en términos de p(a) de la manera siguiente:
e1) Supongamos que p(1)=1/2 ; p(2)=1/3 ; p(3)=1/6.
Luego la función acumulada de X es dado por:
Para VA continuas la relación entre la función de distribución acumulada F(.) y la función de densidad f(.) de una
VA X continua es expresada a través de
(la derivada de la función de distribución acumulada es la función de densidad).
Nota:
Sin embargo, para mantener consistencia en
1.2 Esperanza Matemática y Momentos
Caso de VA Discretas:
Sea X una VA discreta finita que puede tomar valores x 1, x2, .. , xn, con las probabilidades p(x1), p(x2), .. , p(xn).
Definición 1
Esperanza matemática o valor esperado (medio) de la VA X discreta finita es la expresión:
Definición 2
Esperanza matemática o valor medio de una función g(x) de la VA X a la expresión:
Ejemplos
e1) El valor esperado de la VA X:= número que resulta al lanzar un dado, será:
e2) Sea X: Suma de los números resultantes del lanzamiento de 2 dados, entonces,
e3) Sea X: Número de divisores del número obtenido al sacar de una bolsa papeles numerados del 1 al 12.
No. Extraído 1
2
3
4
5
6
7
8
9
10
11
12
X
1
2
2
3
2
4
2
4
3
4
2
6
X
1
2
3
4
6
P
1/
5/12
1/6
1/
1/12
12
4
Entonces,
Momentos de una VA.
En muchas aplicaciones existe la necesidad de medir en alguna forma la dispersión de los valores de X alrededor
de su valor medio E(X). Estos valores suelen ser esperanza matemática de ciertas funciones g(x), como por ejemplo:
g(x) = | x - E(X) |
Sin embargo, el manejo de valores absolutos es incómodo y por ello se prefieren potencias de X que dan lugar a los
llamados momentos.
Definición 1
Momento de X de grado (ó orden) m es el valor esperado de X elevado a la m, es decir:
Los momentos centrados se definen a través de la ecuación:
En particular, como medida de dispersión, es importante el momento centrado de orden 2 definido a continuación.
Definición 2
Se conoce como Varianza de una VA X la siguiente expresión:
El número no negativo , es decir, la raíz cuadrada de la Varianza se le conoce como la Desviación Típica ó
Standard de la VA X.
Observación: Cuando la Varianza es grande ello indica que los valores de X están muy separados de su valor
medio.
Caso de VA Continuas:
Si X es una VA continua con la función de densidad f(x), entonces:
)
1.3 Función generadora de Momentos
Definición 1
La función generadora de momentos se define como:
Esta función se le conoce como generadora de momentos debido a que los momentos de X pueden ser obtenidos a
Igualmente:
1.4 Desigualdad de Tchebycheff
2
, entonces
Demostración.
Sea g(x) una función de X, tal que g(xi)>=0, para todo xi en X, sea a > 0 constante, y sean xa aquellos valores tales
que: g(xa
Con el hecho siguiente,
podemos concluir que,
En particular, con g(x):= x tendremos la Desigualdad de Markov
En el caso de Tchebychef obtendremos la desigualdad con g(x) = (x -
2
y a = k2 tendremos,
por ello,
Observación.
La importancia de las desigualdades de Markov y Tchebychef reside en el hecho de que solo con el conocimiento de
buena es decir, informativa en la mayoría de los casos y por ello son usadas más frecuentemente en demostraciones
de otras hipótesis.
Ejemplos
e1) En una fabrica de componentes, la producción semanal es aleatoria con un valor medio igual a 50
componentes. Que se puede decir acerca de la probabilidad de que la producción exceda las 75 componentes en
una semana.
Solución:
Al aplicar la desigualdad de Markov se tiene:
e2) Si la varianza de la producción semanal del problema anterior es igual a 25 que se puede decir acerca de la
probabilidad de que la producción en una semana este entre 40 y 60 componentes.
Solución:
Aplicando la desigualdad de Tchebychef tendremos:
Entonces,
1.5 Transformación de Variables Aleatorias
VA de tipo discreto:
Sea p(x) la función de densidad probabílistica de una VA X. Si otra VA Y es obtenida de la VA X con una
transformación Y = U(X), cuya inversa es X= W(Y). Entonces la función de densidad de Y viene dad por la siguiente
expresión:
Ejemplo.
Sea X una VA con la siguiente función de densidad:
Sea la transformación y = 4x [y = U(x)], luego la VA Y = {0,4,8,12,..}.
Note que la transformación y = 4x establece una correspondencia uno a uno entre los espacios X e Y.
Nuestro objetivo consiste en hallar la f.d.p. de la VA Y, digamos g(y)=P[Y = y].
Obsérvese que la realización del evento Y = y ó 4X=y se da sii el evento X=(1/4)*y ocurre. En consecuencia:
VA de tipo continuo:
Sea f(x) una f.d.p. de una VA X. Si otra VA Y es obtenida de X con la transformación Y = U(X) (diferenciable para
producir X= W(Y) (la inversa de Y = U(X)), y en consecuencia la función de densidad de Y viene dada por la
siguiente expresión:
Para mostrar la afirmación anterior con ayuda gráfica, observe que:
1
1
1
-1
(y1)} ]
Ahora, debido a que U(x)=Y, W(y1)=x1
donde X=U-1(Y) y en consecuencia:
FY(y) = F X(x)
por lo tanto:
f Y (y) = g(y) = dFY (y)/dy = dF X(x)/dx = f (W(y)).|W’(y)|
Ejemplo.
Sea X una V.A. con función de densidad,
Sea Y = 8X3, luego la V.A. Y = { y / 0< y <8 }
Sea 0< a < b < 8, luego el evento a < y < b ocurre sii el evento a<8x3<b ocurre, es decir: (a/8)1/3 < x < (b/8)1/3 ;
Ahora, si quisiéramos conocer f(y) o P(a<Y<b), tenemos que hacer las siguientes consideraciones:
Como:
Considerando los extremos de la integral:
Es decir:
Observe que Y=U(x)=8x3 y en consecuencia X=W(y)=1/2y1/3, de donde se de donde se puede derivar que dx =
W'(y)dy
1.6.- Desviación media, Dm
Se define la desviación media como la media de las diferencias en valor absoluto de los valores de la variable a la
media, es decir, si tenemos un conjunto de n observaciones, x1, ..., xn, entonces
Si los datos están agrupados en una tabla estadística es más sencillo usar la relación
Como se observa, la desviación media guarda las mismas dimensiones que las observaciones. La suma de valores
absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un inconveniente: Desde el punto de
vista geométrico, la distancia que induce la desviación media en el espacio de observaciones no es la natural (no
permite definir ángulos entre dos conjuntos de observaciones). Esto hace que sea muy engorroso trabajar con ella a
la hora de hacer inferencia a la población .
1.7.- Varianza y desviación típica
Como forma de medir la dispersión de los datos hemos descartado:


, pues sabemos que esa suma vale 0, ya que las desviaciones con respecto a la media
se compensan al haber términos en esa suma que son de signos distintos.
Para tener el mismo signo al sumar las desviaciones con respecto a la media podemos realizar la suma
con valores absolutos. Esto nos lleva a la Dm, pero como hemos mencionado, tiene poco interés por las
dificultades que presenta.
Si las desviaciones con respecto a la media las consideramos al cuadrado,
de nuevo obtenemos que
todos los sumandos tienen el mismo signo (positivo). Esta es además la forma de medir la dispersión de los datos de
forma que sus propiedades matemáticas son más fáciles de utilizar. Vamos a definir entonces dos estadísticos que
serán fundamentales en el resto del curso: La varianza y la desviación típica.
La varianza,
se define como la media de las diferencias cuadráticas de n puntuaciones con respecto a su
media
aritmética,
es
decir
Para datos agrupados en tablas, usando las notaciones establecidas en los capítulos anteriores, la varianza se
puede escibir como
Una fórmula equivalente para el cálculo de la varianza está basada en lo siguiente:
Con lo cual se tiene
Si los datos están agrupados en tablas, es evidente que
La varianza no tiene la misma magnitud que las observaciones (ej. si las observaciones se miden en metros, la
varianza lo hace en ). Si queremos que la medida de dispersión sea de la misma dimensionalidad que las
observaciones bastará con tomar su raíz cuadrada. Por ello se define la desviación típica,
como
Ejemplo
Calcular la varianza y desviación típica de las siguientes cantidades medidas en metros:
3,3,4,4,5
Solución: Para calcular dichas medidas de dispersión es necesario calcular previamente el valor con respecto al
cual vamos a medir las diferencias. Éste es la media:
La varianza es:
siendo la desviación típica su raíz cuadrada:
Las siguientes propiedades de la varianza (respectivamente, desviación típica) son importantes a la hora de hacer
un cambio de origen y escala a una variable. En primer lugar, la varianza (resp. Desviación típica) no se ve
afectada si al conjunto de valores de la variable se le añade una constante. Si además cada observación es
multiplicada por otra constante, en este caso la varianza cambia en relación al cuadrado de la constante (resp. La
desviación típica cambia en relación al valor absoluto de la constante). Esto queda precisado en la siguiente
proposicion:
Proposición
Si
entonces
Demostración Para cada observación xi de X,
, tenemos una observación de Y que es por definición
. Por la proposición ,se tiene que
. Por tanto, la varianza de Y es
Observación
Las consecuencias del anterior resultado eran de esperar: Si los resultados de una medida son trasladados una
cantidad b, la dispersión de los mismos no aumenta. Si estos mismos datos se multiplican por una cantidad a <1, el
resultado tenderá a concentrarse alrededor de su media (menor varianza). Si por el contrario a>1 habrá mayor
dispersión.
Otra propiedad fundamental de la varianza es la siguiente:
Proposición
Dados r grupos, cada uno de ellos formado por n i observaciones de media
varianza,
y de varianza
. Entonces la
, del conjunto de todas las
observaciones vale
Demostración
Dicho de otro modo, pretendemos demostrar que la varianza total es igual a la media de las varianzas más la
varianza de las medias. Comenzamos denotando mediante xij la observación j-ésima en el i-ésimo grupo,
donde
y
. Entonces
Observación
Además de las propiedades que hemos demostrado sobre la varianza (y por tanto sobre la desviación típica), será
conveniente tener siempre en mente otras que enunciamos a continuación:
 Ambas son sensibles a la variación de cada una de las puntuaciones, es decir, si una puntuación cambia,
cambia con ella la varianza. La razón es que si miramos su definición, la varianza es función de cada una
de las puntuaciones.
 Si se calculan a traves de los datos agrupados en una tabla, dependen de los intervalos elegidos. Es decir,
cometemos cierto error en el cálculo de la varianza cuando los datos han sido resumidos en una tabla
estadística mediante intervalos, en lugar de haber sido calculados directamente como datos no agrupados.
Este error no será importante si la elección del número de intervalos, amplitud y límites de los mismos ha
sido adecuada.
 La desviación típica tiene la propiedad de que en el intervalo

se encuentra, al menos, el 75% de las observaciones. Incluso si tenemos muchos datos y estos provienen de
una distribución normal .
No es recomendable el uso de ellas, cuando tampoco lo sea el de la media como medida de tendencia
central.
Método abreviado para el cálculo de la varianza
Puede ser utilizada para simplificar cálculos. Si una variable X toma unos valores para los cuales las operaciones
de cálculo de media y varianza son tediosas, podemos realizar los cálculos sobre una variable Z definida como
Una vez que han sido calculadas
y
, obtenemos
y
teniendo en cuenta que:
Grados de libertad
Los grados de libertad de un estadístico calculado sobre n datos se refieren al número de cantidades independientes
que se necesitan en su cálculo, menos el número de restricciones que ligan a las observaciones y el estadístico. Es
decir, normalmente n-1.
Ilustremoslo con un ejemplo. Consideramos una serie de valores de una variable,
que han sido tomados de forma independiente.
Su media es
y se ha calculado a partir de las n=5observaciones independientes x i, que están ligadas a la
media por la relación:
Luego el número de grados de libertad de la media es n-1=4.
Si calculamos a continuación la varianza, se han de sumar n cantidades
Sin embargo esas cantidades no son totalmente independientes, pues están ligadas por una restricción:
El número de grados de libertad del estadístico es el número de observaciones de la variable menos el número de
restricciones que verifican, así que en este caso, los grados de libertad de la varianza sobre los n=5 datos son
también n-1 =4.
Un principio general de la teoría matemática nos dice que si pretendemos calcular de modo aproximado la
varianza de una población a partir de la varianza de una muestra suya, se tiene que el error cometido es
generalmente más pequeño, si en vez de considerar como estimación de la varianza de la población, a la varianza
muestral
consideramos lo que se denomina cuasivarianza muestral,
denominador por el número de grados de libertad, n-1:
que se calcula como la anterior, pero cambiando el
Tipificación
Se conoce por tipificación al proceso de restar la media y dividir por su desviación típica a una variable X. De este
modo se obtiene una nueva variable
de media
y desviación típica
, que denominamos variable tipificada.
II. DISTRIBUCIONES DE VARIABLES ALEATORIA
DISCRETA.
2.1. DISTRIBUCIÓN UNIFORME
1 y su función de masa (
la Variable Uniforme ya que las probabilidades son uniformes sobre esta imagen. Ejemplos de ella son los
resultados del lanzamiento de un dado, extracción de una baraja desde un paquete, etc.
4.1 PROCESOS DE BERNOULLI (1713).
Una repetición de pruebas o experimentos aleatorios independientes se llama Proceso de Bernoulli si solo hay dos
posibles resultados para cada prueba y la probabilidad para cada resultado posible permanece constante durante
la prueba.
A estas dos probabilidades se les suele denotar por p y q, indicando con p la probabilidad de éxito E y q la
probabilidad de falla F.
p, q > 0 y p + q = 1.
El espacio muestral para cada prueba de Bernoulli (VA Bernoulli) es constituido solo por dos puntos X = {1, 0}ó
{Exito, Fracaso} ó {v, f}, etc. Su Esperanza matemática E[X] será igual a p y su Varianza será p(1-p).(Verificar!)
e1) De sucesivos lanzamientos de una moneda simétrica se tiene que p=q=1/2.
e2) De sucesivos lanzamientos de un dado no cargado, donde:
E: sale 1 y
F: Sale 2,3,4,5 y 6; tendremos p=1/6 y q=5/6.
Con E: sale par y con F: sale impar se tendrá p=q=1/2.
Las pruebas de Bernoulli constituyen un modelo teórico y solo la experiencia puede mostrarnos si este es adecuado
o no para describir determinada observación.
En este sentido, el hecho de sucesivos lanzamientos de una moneda "simétrica" conforma una prueba de Bernoulli
se basa en experiencias obtenidas vía experimentación. Sin embargo no se puede dejar de mencionar que cada uno
de nosotros después de que se han realizado 20 lanzamientos y ha caído siempre sello se ve más probable de que en
el próximo lanzamiento saldrá cara. Esto último no tiene que ver con imperfecciones de la moneda, más bien esta
relacionado con la "memoria", es decir se está negando la independencia estocástica de pruebas sucesivas.
El espacio muestral de n pruebas de Bernoulli tiene 2 n puntos, cada uno con una secuencia de n letras E, F
representando los posibles resultados.
Como cada prueba es independiente de la otra tendremos:
P(EEEFF...FEFE) = P(E)P(E)P(E)P(F)P(F)...P(F)P(E)P(F)P(E) = pppqq...qpqp
2.2 DISTRIBUCIÓN BINOMIAL [ X ~ B(n,p) ].
Si X es una VA del número de éxitos que hay en 'n' ensayos de Bernoulli independientes, entonces esta VA se dice
que sigue una distribución Binomial.
La función de densidad probabilistica de dicha distribución es como sigue:
i=0
p(i) = 1, lo cual resulta
bastante fácil al aplicar el desarrollo de Binomio de Newton:
n
n
i=0 p(i) = (p + q) = (p + (1 - p)) = 1 ,
ya que:
Esperanza matemática.
Usando la función generadora de momentos tenemos:
Por lo tanto,
Entonces
Varianza.
Para calcular la Varianza, derivemos primero E[X2] de la siguiente manera:
Por lo tanto,
Entonces:
Ejercicios.
e1) Una moneda es lanzada 20 veces. Calcule el número más probable de salidas de cara y cual es la probabilidad
de que salga ese número.
Solución:
El número más probable de caras es evidentemente n p =10. Y la probabilidad de que salga 10 veces es:
e2) Supongamos que la probabilidad de recuperar un carro robado en Caracas es de 0.04.
a) ¿Cuál es la probabilidad de que de 10 carros robados sean recuperados a lo sumo 3 de ellos?
b) ¿ Cuál es la probabilidad de que al menos 7 de los 10 carros sean recuperados?
Solución:
a) P(X=0) + P(X=1) + P(X=2) + P(X=3) = .66 + .27 + .05 + .0058 = .9995
b) P(X=7) + P(X=8) + P(X=9) = .00055
e3) Supongamos que un motor de avión de una determinada marca falla en vuelo con una probabilidad (1-p)
independientemente de un motor a otro. Igualmente se puede suponer que un avión realiza un vuelo exitoso si el
50% de sus motores se mantiene trabajando. ¿Para que valores de p es preferible un cuatrimotor a un bimotor?.
Solución:
Sea X: # de motores que se mantienen en operación durante el vuelo.
Luego, la probabilidad de que un cuatrimotor realice un vuelo exitoso es:
Y la probabilidad de que un bimotor realice un vuelo exitoso será:
Por lo tanto el cuatrimotor será más seguro que el bimotor si:
es decir:
Por lo tanto el cuatrimotor será más seguro que el bimotor sí: p
2.3 DISTRIBUCIÓN GEOMÉTRICA [ X ~ G(p) ](caso particular de la
Binomial).
Consideremos un proceso de Bernoulli con fracaso (F) y éxito (E), donde la probabilidad de éxito es p=P(E).
Sea una secuencia de experimentos que culmina cuando el primer éxito se presente, es decir
F F F F F F F F E, con n como el número de F antes de ocurrir E, entonces
P(X = n) = P(F)*P(F)*...P(F)*P(E) = (1-p)np
donde X representa el número de ensayos sin éxito.
Para mostrar que esta función es una función probabílistica nos resta mostrar que la suma sobre todo su espacio es
1.
En relación con la función de distribución acumulada se puede notar lo siguiente:
e1) En el lanzamiento de un dado, la probabilidad de que el 4 sea observado por 1a. vez en el 6to. lanzamiento es
P(X=5) = (5/6)5*(1/6) = .067
Y la probabilidad de que al menos 6 lanzamientos sean requeridos para observar un 4 es:
i
5
i=5 (5/6) *(1/6) = (5/6) = .402
Esperanza matemática de X Geométrica (Redefiniendo Y como el # de intentos antes del 1er éxito)
E[X] = E[Y] –1 = (1-p)/p
2.4 BINOMIAL NEGATIVA [ X ~ BN(r,p) ].
Supongamos que se realizan experimentos independientes con una probabilidad de éxito en cada experimento 'p'
hasta que 'r' éxitos sean alcanzados. Entonces si X denota el número de ensayos requeridos tendremos que:
Obsérvese que el r-ésimo éxito debe coincidir con el n-ésimo ensayo, por lo tanto r-1 éxitos deben haberse
presentado en los primeros n-1 ensayos y además el n-ésimo ensayo debe ser un éxito.
Como, la probabilidad del 1er. evento es:
y la probabilidad del 2do. evento es p, en consecuencia debido a la independencia entre estos eventos tendremos
que la probabilidad de que n ensayos sean requeridos para alcanzar r éxitos será:
Nota
La VA Geométrica es una Binomial negativa con parámetros 1,p. (Verificar!).
e1) ¿Si la probabilidad de éxito de ensayos independientes es p, cual es la probabilidad de que r- éxitos ocurran
antes de m fracasos?.
Solución;
Como el r-ésimo éxito debe ocurrir no antes del r+m-1 -ensayo, entonces la probabilidad deseada es:
2.5 DISTRIBUCIÓN HIPERGEOMETRICA
La distribución Binomial es importante en muestreos con reemplazo.
Supongamos que queremos conocer el # de elementos defectuosos presentes en una muestra de ‘n’ elementos,
extraídos de una urna que contiene ‘N’ elementos de los cuales ‘M’ están defectuosos. Si la extracción es con
reemplazo entonces la probabilidad de escoger x elementos defectuosos tendrá un comportamiento Binomial, es
decir:
Sin embargo, lo correcto en un caso como el de inspección, sería hacer la selección sin reemplazo, en cuyo caso en
la 1ª. selección la probabilidad de que salga defectuoso es M/N, pero la segunda vez seria (M-1)/(N-1) ó M/(N-1) si
antes salió defectuoso o no (# de casos favorables / # de casos posibles).
-
Los casos posibles son .
- En cuanto a los casos favorables se debe considerar lo siguiente:
Los x éxitos (defectuosos) pueden ser elegidos desde los M posibles
de formas diferentes y cada forma de
estas es combinada con las formas diferentes de escoger ‘n-x’ elementos no defectuosos que son:
En consecuencia x éxitos y n-x fracasos pueden elegir de
.
formas o maneras diferentes.
Luego, la probabilidad de escoger x elementos defectuosos en una muestra de n elementos sin reemplazo será:
la cual da lugar a la distribución conocida como Hypergeométrica.
Esperanza matemática de la Hypergeométrica:
Supongamos que n elementos de la muestra son seleccionados desde los N de la población manera secuencial. Si
definimos la VA:
Entonces,
Luego,
, nos señala el # de elementos defectuosos de la muestra de n elementos.
y como E[Xi] = 1. p(Xi=1) + 0 . p(Xi=0) = p(Xi=1) = M/N, se tiene que:
E[ X ] = n . M/N
El calculo de la Varianza es problemático porque las Xi no son independientes y en consecuencia hay que
considerar indicadores no considerados hasta ahora (Covarianzas). El resultado es:
COMPARACIÓN DE LA HYPERGEOMETRICA Y LA BINOMIAL
Para que la probabilidad de éxito (p=M/N) se mantenga mas o menos constante y en ese caso se pueda aplicar la
Binomial, la N debe ser muy grande (tender a infinito). En algunos casos prácticos, usualmente se acepta esta
aproximación cuando n
sin reemplazo cuando N, M y N-M son mayores que n.
Una VA X que toma valores 0,1,2,... se dice que sigue una distribución
Obsérvese que:
Esperanza Matemática y Varianza.
Con la ayuda de la función generadora de momentos tenemos:
Por ello,
Nota: Es conveniente señalar que algunos autore
Relación con la Binomial: Esta distribución se puede derivar de la Binomial cuando el número de experimentos es
muy grande y en cada uno de ellos la probabilidad de un éxito es sumamente pequeña.
Por lo tanto,
Nota:
En la practica se considera una buena aproximación, cuando p< 0.1 y np< 5.
PROCESOS DE POISSON
En esta sección presentaremos una situación muy importante que es descrita por la distribución de Poisson.
Para calcular la probabilidad de que se presenten x éxitos (Por ejemplo; llegadas a un sistema) en un intervalo de
tiempo de longitud T, dividimos el intervalo en n subintervalos iguales de longitud dt, de tal forma que T = n.dt y
suponemos que:
1. La probabilidad de éxito en cada subintervalo es independiente de lo ocurrido en los otros subintervalos
2. La probabilidad de mas de un éxito en cada subintervalo en cada subintervalo es despreciable.
a el numero promedio de ocurrencias por unidad de tiempo.
Esto significa que se satisfacen las condiciones para presentar una Binomial que represente el fenómeno a través de
suma de n Bernuolli en cada subintervalo y por ello la probabilidad de tener x éxitos en un intervalo de longitud T
viene dado por b(x;n,p) donde n=T/dt y p=
2.7.- Ejercicios de Selectividad
Variable aleatoria continua. Distribución normal.
1) Las estaturas de 500 reclutas están distribuidas normalmente con una media de 169 cm. y una desviación típica
de 7 cm. Calcular el número esperado de reclutas cuya altura,
a) está entre 165 y 175 cm.
b) es mayor que 180 cm.
2) Calcular el valor de a para que la función f(x) =
función de densidad.
Calcular su función de distribución.
sea una
3) Un equipo de fútbol ha conseguido en las últimas temporadas unos resultados que se distribuyen normalmente
con media 25 victorias y desviación típica 5. ¿Cuál es la probabilidad de que gane más de 30 partidos?
4) Las calificaciones de los estudiantes de un curso siguen una distribución normal. Si las puntuaciones tipificadas
de dos estudiantes fueron 0'8 y -0'4 y sus notas reales fueron 88 y 64 puntos, ¿cuál es la media y la desviación típica
de las puntuaciones del examen?
5) Un valor de una variable se dice "normal" dentro de la distribución si |z| < 1, donde z es el valor tipificado de la
variable. Si 1 < |z| < 2 se dice "anormal" y si |z| > 2 se dice "muy anormal". En un equipo de fútbol los goles
marcados tienen media = 4'5 y desviación típica  = 2 y los encajados = 1'5 y  = 1. ¿Qué se puede decir del
resultado de un partido en el que metió dos goles y encajó uno?
6) La altura de los 20 000 habitantes de una ciudad sigue una distribución normal de media 170 cm. y desviación
típica 10 cm.
a) ¿Cuántos habitantes tienen menos de 1'50 m.?
b) ¿Cuántos tienen una estatura comprendida entre 1'68 y 1'75?
7) Las calificaciones de un examen, puntuado entre 0 y 10, siguen una distribución normal de media 5'5 y
desviación típica 1'2. Al examen se presentaron 300 alumnos. Hallar el número de alumnos que:
a) Aprueban el examen (5 ó más puntos).
b) Obtienen notable (entre 7 y 8'5 puntos).
8) Una fábrica produce tuercas con diámetros que siguen una distribución normal de media 0'65 cm. y desviación
típica 0'004 cm., las piezas deben tener un diámetro entre 0'645 y 0'660 cm. Si se elige una muestra de 2000 piezas,
¿cuántas es de esperar que sean rechazadas?.
9) La duración media de las bombillas de una cierta marca sigue una distribución normal de media 780 horas con
desviación típica 200. ¿Cuál es la probabilidad de que una bombilla se funda a las 700 horas de uso? ¿Qué
porcentaje de bombillas es de esperar que se funda antes de las 200 horas de encendido?
10) Estudiar si la función definida por f(x) =
es una función de densidad.
¿Cuál es la probabilidad de que la variable tome un valor en el intervalo [2,6]?
11) Las puntuaciones de un examen calificado entre 0 y 100 puntos siguen una distribución normal de media 50. El
7 por ciento de los alumnos tiene una puntuación por encima de 75, ¿qué tanto por ciento de los alumnos es de
esperar que tengan una puntuación por debajo de 40 puntos?
12) Una compañía ha emitido acciones que se reparten entre los accionistas siguiendo una distribución normal de
media 100 acciones y desviación típica 20 acciones. ¿Cuál es la probabilidad de que un accionista tenga más de
150 acciones?
13) Estudiar si la función f(x) =
es una función de densidad y, en caso
afirmativo, encontrar su función de distribución. Calcular P(X5) y P(X6).
14) Las alturas de 300 estudiantes están distribuidas normalmente con media 170 cm. y desviación típica 3 cm.,
¿cuántos estudiantes tienen altura mayor que 180?, ¿cuántos tienen altura entre 168 y 172?
15) En una distribución normal de media 4 y desviación típica 2, calcular el valor de a para que P(4-aX4+a) =
0'5934
16) Calcular a para que f(x) =
Calcular su función de distribución.
represente una función de densidad.
17) Si los pesos de 500 estudiantes están distribuidos normalmente con una media de 60 Kg y desviación típica de 2
Kg, encontrar el número de estudiantes con peso mayor de 65 Kg.
18) Las alturas de los alumnos de un Instituto responde a una distribución normal de media 165 cm. y desviación
típica 5 cm. ¿Qué porcentaje de alumnos es de esperar que tenga una altura comprendida entre 170 y 175 cm.?
19) Se considera la función f(x) =
sea una función de densidad. Halla su media, varianza y desviación típica.
Encontrar a para que f(x)
20) La duración de las bombillas de una fábrica sigue una distribución normal de media 1000 horas y desviación
típica 700. ¿Cuál es la probabilidad de que una bombilla elegida al azar dure al menos 1400 horas?
21) a) Haz un comentario crítico del siguiente texto ( Selectividad, Junio 1997 ):
" El peso de las naranajas sigue una distribución normal de media 175 gramos y desviación típica 12 gramos.
Se compran 30000 Kgs. Encontrar cuantos kilos habrá cuyas naranjas pesen menos de 150 gramos y cuantos
es de esperar que tengan un peso comprendido entre 160 gramos y 200 gramos."
b) ¿Cuál es el peso medio de las naranjas que pesan menos de 150 gramos?
22) Se considera la función f(x) =
¿Es f una función de
densidad de probabilidad de una variable aleatoria? En caso afirmativo hallar la media y la desviación típica de
dicha variable aleatoria. Encontrar P(X0'6)
23) La vida media de los televisores de una cierta marca sigue una distribución normal de media 12 años y
desviación típica 1 año. Encontrar la probabilidad de que un televisor elegido al azar dure entre 11 y 13 años.
24) La media de ventas diarias de un vendedor de unos grandes almacenes es de 95000 pesetas y la desviación
típica es 20000 pesetas. Suponiendo que la distribución de ventas es normal, ¿cuál es la probabilidad de vender
más de 125000 pesetas en un día?
25) Un jugador de baloncesto lanza 230 tiros libres a lo largo de la temporada. Sabiendo que su probabilidad de
encestar en un lanzamiento libre es del 85%, ¿cuál es la probabilidad de que enceste más de 185 tiros libres en la
temporada?
Soluciones
1) a) 262'1 262
b) 29'1 29
2) a = 1/50 , F(x) =
3) P(X30) = 0'1587
4) Media = 72, desviación típica = 20
5) Es "anormal" que marque 2 y "normal" que encaje 1.
6) a) 456
b) 5416
7) a) 198'84 199
b) 29'82 30
8) 223'6 224
9) P(X=700) = 0
P(X200) = 0'0019 , 0'19%
10) Es función de densidad, P(2X6) = 22/49 0'4490
11)  25/1'48 , P(X40) = 0'2776 , 27'76%
12) P(X150) = 0'0062
13) Es función de densidad , F(x) =
P(X5) = F(5) = 1/7 , P(X6) = 5/7
14) P(X180) = P(Z3'33) 0 , ninguno
149'16 149
15) a = 1'66
16) a = 1/5 F(x) =
17) 3'1 3
18) 13'59%
19) a = 1/3, media = 4, varianza = 2 , desviación típica =
20) 0'2843
21) Resolver el ejercicio propuesto en Selectividad es equivalente a resolver el apartado b. Este ejercicio no se
puede resolver usando el programa de esta asignatura. Su dificultad es superior al nivel de COU. El planteamiento
" X = peso de las naranjas = N(175,12)
P(X150) = 0'0188 (el 1'88% de las naranjas, no el 1'88% del peso total)
Peso = 0'0188·30000 = 564 Kg. "
es incorrecto pues estaríamos suponiendo que las "naranjas" que pesan menos de 150 gr. tienen un peso medio de
175 gr.
22) Es función de densidad, media = 8 , desviación típica =
, P(X0'6) = 1
23) 0'6826
24) 0'0668
25) 0'9678
BIBLIOGRAFIA.Probabilidad – Shaum – Seymour Lipschutz
URL: http://strix.ciens.ucv.ve/~matcomp/proba.../cap4/cap4.htm
URL: http://strix.ciens.ucv.ve/~teorprob/guia.../cap3/cap3.html
http://strix.ciens.ucv.ve/~matcomp/probabilidades/guiasteoricas/cap4/cap4.html
http://strix.ciens.ucv.ve/~matcomp/probabilidades/guiasteoricas/cap3/cap3.html
URL: http://www.it.uc3m.es/~prometeo/trdt/htm...tema1/tt1_5.htm
URL: http://pepe.ceu.es/Matematicas/Diapos/Es...rias/sld005.htm
http://centros5.pntic.mec.es/ies.alfonso.x.el.sabio/Colabo/uno/normal.htm
http://www.bioestadistica.uma.es/libro/node21.htm
Descargar