TEOREMA DE BERNOULLI GENERALIZADO Dada una sucesión x1, x2 , x3 ,.....xn dos a dos independientes, con una misma distribución de probabilidad y con esperanza µ y varianza σ 2 Se verifica que ∀ε > 0 lím P x − µ ≤ ε = 1 ó lím P x − µ > ε = 0 n →∞ n →∞ El límite, en probabilidad, de la media muestral para n→∞ es igual a su esperanza matemática Demostración x 1 , x 2 , x 3 ,..... x n Son variables aleatorias independientes de una variable X con esperanza y varianza iguales. E ( xi ) = µ y V ( xi ) = σ 2 n x = ∑ i =1 xi n Es una función de x 1 , x 2 , x 3 ,..... x n Por lo tanto es otra variable aleatoria. 1 n xi 1 n E ( x ) = E ∑ = ∑ E ( xi ) = .n.µ = µ n i =1 n n i =1 n xi 1 V ( x ) = V ∑ = 2 i =1 n n n 1 σ 2 V ( xi ) = 2 .n.σ = ∑ n n i =1 2 Aplicando la desigualdad de Tchebyshev Consideramos ε = k. σ n σ 1 P x − µ ≤ k. ≥ 1- k 2 n ε σ σ2 P x − µ ≤ k. ≥ 1- nε 2 n ε ⇒k = 2 nε 2 σ2 σ 1 P x − µ ≤ k. ≥ 1- nε 2 n ε σ2 2 σ ó P x − µ > ε < 2 nε Aplicando Límite para n tendiendo a infinito σ2 lím P x − µ ≤ ε ≥ lím 1 − 2 nε n→∞ n→∞ lím P x − µ ≤ ε = 1 n→∞ n→∞ ó ∀ε > 0 límP x − µ > ε = 0 n→∞ El teorema se puede generalizar a variables aleatorias con distintas esperanzas y varianzas. SUMA DE VARIABLES ALEATORIAS Teorema del límite central El teorema afirma que, con ciertas restricciones leves, la distribución de la suma de un gran número de variables aleatorias, tiene aproximadamente una distribución normal. El valor de este teorema es que no requiere condiciones para las distribuciones de las variables aleatorias individuales que se suman. Enunciado del TLC Si S es la suma de un gran número de variables aleatorias, entonces, bajo ciertas condiciones, la función de densidad de probabilidad de la variable aleatoria S se distribuye normalmente, para n tendiendo a infinito. n S − ∑ µi z= ∼ N ( 0,1) i =1 n ∑σ 2 i i =1 Observar que n E (s ) = ∑ µ i i =1 n σ (S ) = 2 σ ∑ i i =1 Esta generalización es válida cuando las variables aleatorias individuales sólo hacen una contribución relativamente pequeña a la suma total En particular, si las xi están idénticamente distribuidas, es decir, tienen la misma media y la misma varianza, E ( xi ) = µ n n E (S ) = E ∑ xi = ∑ E ( xi ) = n.µ i =1 i =1 V ( xi ) = σ 2 n n V (S ) = V ∑ xi = ∑V ( xi ) = n.σ 2 i =1 i =1 Por ser las xi independientes. Entonces el teorema afirma que la fdp de la variable S se distribuye normalmente S − nµ z= ∼ N ( 0,1) Luego n .σ Ejemplo 1 Supóngase que un proceso de fabricación produce lavadoras de las cuales, alrededor del 5% son defectuosas. Si se inspeccionan 100 lavadoras ¿Cuál es la probabilidad de que haya entre 2 y 6 lavadoras defectuosas? P ( 2 < x < 6 ) = P ( x = 3 ) + P ( x = 4) + P ( x = 5) 100 100 100 3 97 4 96 5 95 = 0,05 .0,95 + 0,05 .0,95 + 0,05 .0,95 = 3 4 5 0,4977 Comparemos el resultado del cálculo directo con el cálculo aproximado, es decir, aplicando el TCL: Aplicamos el TCL Calculamos E(x)=np=100.0,05=5 V(x)= np(1-p)=100.0,05.0,95= 4,75 6−5 2−5 P (2 < x < 6) = Φ − Φ = Φ ( 0,46 ) − Φ ( −1,38 ) = 4,75 4,75 = 0,6772 − 0,0838 = 0,5934 Comparamos con el resultado exacto 0,4977. No es una buena aproximación. Por ser x una variable discreta, calculemos 5−5 3−5 P (3 ≤ x ≤ 5) = Φ − Φ = 4,75 4,75 = Φ ( 0 ) − Φ ( −0,92 ) = 0,5 − 0,1788 = 0,3212 Tampoco es buena aproximación La distribución Binomial converge a la normal cuando n tiende a ∞ (teorema de de Moivre, caso particular del teorema central del límite) 1 1 Si a ≤ x ≤ b ⇒ a − ≤ x ≤ b + 2 2 p(x) a -0.5 a b b + 0.5 Corrección por continuidad Para variables discretas, consiste en ampliar el intervalo en una unidad, es decir: 1 1 Si a ≤ x ≤ b ⇒ a − ≤ x ≤ b + 2 2 5,5 − 5 2,5 − 5 P ( 2,5 ≤ x ≤ 5,5 ) = Φ − Φ = 4,75 4,75 0,4659 = Φ ( 0,23 ) − Φ ( −1,15 ) = 0,591 − 0,1251 = Es una buena aproximación Ejemplo 2 Una fábrica de productos alimenticios produce carne enlatada, con un peso medio de 250 grs y una varianza de 900 grs cuadrados por lata. Si los pesos de las latas son estadísticamente independientes. Las cajas contienen 60 latas. Se elige una al azar, hallar la probabilidad de que: a) El peso de la caja sea a lo sumo 14,5 kg. b) El peso de la caja sea al menos 15,3 kg. xi : es el peso de cada lata C: es el peso de la caja E ( x i ) = 250 grs. V ( x i ) = 30 2 grs 60 60 C = ∑ xi ⇒ E (C ) = E ∑ xi = ∑ E ( xi ) = 60.250 = 15.000grs = 15kg. i =1 i =1 i =1 60 60 60 V (C ) = V ∑ xi = ∑V ( xi ) = 60.900 = 54.000grs 2 i =1 i =1 ⇒ σ (C ) = 60.900 = 60.30 = 232,38grs = 0,23238kg Calculamos las probabilidades pedidas 14,5 − 15 a ) P (C ≤ 14,5 ) = Φ = Φ ( −2,15 ) = 0,0158 0,23238 15,3 − 15 b ) P (C ≥ 15,3 ) = 1 − Φ = 1 − Φ (1,29 ) = 0,23238 = 1 − 0,9015 = 0,0985 Consideraciones finales • El n que se requiere para aplicar el teorema central del límite en gran parte depende de la forma de la distribución de las variables aleatorias individuales que se suman •Si los sumandos están normalmente distribuidos , al aplicar el teorema central del límite, las probabilidades obtenidas son exactas. No importa n. •Si no se conoce la distribución de los sumandos, para n mayor o igual que 25, se obtienen buenas aproximaciones. •Si las variables aleatorias se distribuyen binomialmente, n >10 si p ≅ 0,5 tambien si p ≅0 ó 1 , n debe ser bastante mayor.