I.T. INDUSTRIAL METODOS ESTADÍSTICOS FORMULARIO I. ESTADISTICA DESCRIPTIVA X v.a k modalidades x1 , x2 , ..., xk ; n datos Media i=1 x̄ = k P i=1 2 Varianza poblacional σ = S2 = Varianza muestral Coeficiente de Asimetría γ1 = Coeficiente de Apuntamiento γ2 = Covarianza " ni xi n ni x2i − x̄2 n k P ni (xi − x̄)2 k P (xi − x)3 ni i=1 n−1 i=1 k P i=1 nσ 3 (xi − x)4 ni Cov(X, Y ) = Coeficiente de correlación lineal Recta de regresión de Y sobre X k P nσ4 p K P P i=1 j=1 nij xi yj N Cov(X, Y ) ρ= σxσy # " −3 − x̄ȳ # Cov [X, Y ] Cov [X, Y ] ŷ = x + ȳ − x̄ V ar (X) V ar (X) 1 II. PROBABILIDAD Operaciones con sucesos Suceso Ocurre siempre que − Probabilidad µ ¶ − no ocurre A A A/B A∩B A∪B P A = 1 − P (A) P (A ∩ B) ocurre A si ya ha ocurrido B P (A/B) = P (B) P (A ∩ B) = P (A)P (B/A) ocurra A o B P (A ∩ B) = P (B)P (A/B) ocurren A y B P (A ∪ B) = P (A) + P (B) − P (A ∩ B) Si A y B son incompatibles P (A/B) = 0 P (A ∩ B) = 0 P (A ∪ B) = P (A) + P (B) Si A y B independientes P (A/B) = P (A) P (A ∩ B) = P (A)P (B) P (A ∪ B) = P (A) + P (B) − P (A)P (B) Teorema de la probabilidad total y fórmula de Bayes Probabilidad total P (A) = k P P (A/Bi )P (Bi ) i=1 Fórmula de Bayes P (Bi /A) = P (A ∩ Bi ) P (A/Bi )P (Bi ) = k P P (A) P (A/Bi )P (Bi ) i=1 2 ALGUNAS DISTRIBUCIONES IMPORTANTES Distribución Función masa de probabilidad/función de densidad EX U(n) B(n, p) P 1 P [X = xi ] = n P [X = k] = Xi n à ! n k p (1 − p)n−k k ; np k = 0, 1, 2...n P (λ) H(N, n, p) e−λ λk P [X = k] = ; k = 0, 1, 2... k! à !à ! Np Nq k n−k à ! P [X = k] = N λ , np n max{0, n − Nq } ≤ k ≤ min{n, Np } à ! BN(K, p) K +x−1 k P (X = x) = p (1 − p)x ; x = 0, 1, 2.... x G(p) P (X = x) = pqx ; x = 0, 1, 2.... N(µ, σ 2 ) N(0, 1) G(α, λ) χ2n −1 2 1 f(x) = √ e 2σ2 (x−µ) , x ∈ R 2πσ 1 −1 2 f(z) = √ e 2 z , z ∈ R 2πα λ xα−1 e−λx , x > 0 f (x) = Γ(α) R Γ(α) = 0∞ xα−1 e−x dx f(x) = 1 n Γ( n2 )2 2 n x x 2 −1 e− 2 , x > 0 Γ(α + β) α−1 x (1 − x)β−1 ; 0 < x < 1 Γ(α)Γ(β) B(α, β) f(x) = tn Γ( n+1 ) t2 n+1 f(t) = √ 2 n (1 + )−( 2 ) ; t ∈ R nπΓ( 2 ) n Fn1,n2 g(f ) = n +n Γ(n1 + n2 ) n21 n22 n1 −2 −( 1 2 2 ) ;f > 0 n1 n2 n1 n2 f 2 (n1 f + n2 ) Γ( )Γ( ) 2 2 3 kq p q p µ 0 α λ n α α+β 0 n2 n2 − 2 III. INFERENCIA ESTADISTICA INTERVALOS DE CONFIANZA Intervalo de confianza para la media de una normal Varianza conocida (σ 20 ) Varianza desconocida " # σ0 µ ∈ x ± √ z1− α2 n " # S − µ ∈ x ± √ t1− α2 n − Intervalo de confianza para la varianza de una normal Media conocida (µ0 ) Media desconocida P n (xi − µ0 )2 i=1 σ2 ∈ χ2 ;n 1− α 2 n P , i=1 χ2α ;n 2 (n − 1)S 2 (n − 1)S 2 σ2 ∈ 2 , χ1− α ;n−1 χ2α ;n−1 2 (xi − µ0 )2 2 Intervalo de confianza para la diferencia de medias de dos poblaciones normales e independientes − − − − µx − µy ∈ x − y ± z1− α2 Varianza conocidas " s Varianza desconocidas pero iguales (σ 2 ) µx − µy ∈ x − y ± t1− α2 ;nx +ny −2 Sp v u u (nx − 1)Sx2 + (ny − 1)Sy2 con Sp = t nx + ny − 2 4 σx σy + nx ny s 1 1 + nx ny # Intervalo de confianza para el cociente de varianzas de dos poblaciones normales e independientes Medias conocidas Medias desconocidas ny ³ P ´2 ny ³ P ´2 y i − µy yi − µy σ 2y nx nx i=1 i=1 α α ∈ F , F ;n ,n 1− ;n ,n x y x y n n x x 2 P P 2 2 σx (x − µ )2 ny (x − µ )2 ny σ 2y ∈ σ 2x i x i=1 " 2 Sy F α2 ;nx −1,ny −1 , Sx2 i=1 Sy2 F1− α2 ;nx −1,ny −1 Sx2 Intervalo de confianza para una proporción ˆ p∈ p v uˆ ˆ up t (1− p) ±z1− α2 n 5 i x # CONTRASTES DE HIPÓTESIS Contraste para la media de una normal con varianza conocida Hipótesis nula H0 : µ = µ0 Hipótesis alternativa H1 : µ 6= µ0 H1 : µ > µ0 H1 : µ < µ0 Estadístico de contraste X̄ − µ √ Z= σ0/ n Criterios de rechazo Z ≤ zα/2 o Z ≥ z1−α/2 Z ≥ z1−α Z ≤ zα Contraste para la media de una normal con varianza desconocida Hipótesis nula H0 : µ = µ0 Hipótesis alternativa H1 : µ 6= µ0 H1 : µ > µ0 H1 : µ < µ0 Estadístico de contraste X̄ − µ √ T = S/ n Criterios de rechazo T ≤ tα/2,n−1 o T ≥ t1−α/2,n−1 T ≥ t1−α,n−1 T ≤ tα,n−1 Contraste para la varianza de una normal con media conocida Hipótesis nula H0 : σ 2 = σ 20 Hipótesis alternativa H1 : σ 2 6= σ 20 H1 : σ 2 > σ 20 H1 : σ 2 < σ 20 Estadístico de contraste Pn (xi − µ0 )2 2 χ = i=1 2 σ0 Criterios de rechazo 2 χ ≤ χ2α/2,n o χ2 ≥ χ21−α/2,n χ2 ≥ χ21−α,n χ2 ≤ χ2α,n 6 Contraste para la varianza de una normal con media desconocida Hipótesis nula H0 : σ 2 = σ 20 Hipótesis alternativa H1 : σ 2 6= σ 20 H1 : σ 2 > σ 20 H1 : σ 2 < σ 20 Estadístico de contraste (n − 1) S 2 χ2 = σ 20 Criterios de rechazo 2 χ ≤ χ2α/2,n−1 o χ2 ≥ χ21−α/2,n−1 χ2 ≥ χ21−α,n−1 χ2 ≤ χ2α,n−1 Contraste para el cociente de varianzas de dos normales independientes con medias conocidas Hipótesis nula H0 : σ 2X = σ 2Y Hipótesis alternativa H1 : σ 2X 6= σ 2Y H1 : σ 2X > σ 2Y H1 : σ 2X < σ 2Y Estadístico de contraste PnX (xi − µX )2 /nX F = Pi=1 2 nY i=1 (yi − µY ) /nY Criterios de rechazo F ≤ 1/f1−α/2,nY ,nX o F ≥ f1−α/2,nX ,nY F ≥ f1−α,nX ,nY 2 F ≤ 1/f1−α,n Y ,nX Contraste para el cociente de varianzas de dos normales independientes con medias desconocidas Hipótesis nula H0 : σ 2X = σ 2Y Hipótesis alternativa H1 : σ 2X 6= σ 2Y H1 : σ 2X > σ 2Y H1 : σ 2X < σ 2Y Estadístico de contraste S2 F = 2X SY Criterios de rechazo F ≤ 1/f1−α/2,nY −1,nX −1 o F ≥ f1−α/2,nX −1,nY −1 F ≥ f1−α,nX −1,nY −1 F ≤ 1/f1−α,nY −1,nX −1 7 Contraste para la diferencia de medias de dos normales independientes con varianzas conocidas Hipótesis nula H0 : µX − µY = δ 0 Hipótesis alternativa H1 : µX − µY 6= δ 0 H1 : µX − µY > δ 0 H1 : µX − µY < δ 0 Estadístico de contraste Ȳ −δ 0 Z = r X̄− 2 2 σ n, X nX σ + n, Y nY Criterios de rechazo Z ≤ zα/2 o Z ≥ z1−α/2 Z ≥ z1−α Z ≤ zα Contraste para la diferencia de medias de dos normales independientes con varianzas desconocidas pero iguales Hipótesis nula H0 : µX − µY = δ 0 Hipótesis alternativa H1 : µX − µY 6= δ 0 H1 : µX − µY > δ 0 H1 : µX − µY < δ 0 Estadístico de contraste X̄ − Ȳ − δ 0 T =s µ ¶ 1 1 Sp2 + nX nY Criterios de rechazo T ≤ tα/2,n o T ≥ t1−α/2,n T ≥ t1−α,n T ≤ tα,n donde n = nX + nY − 2 (nX − 1) S 2X + (nY − 1) S 2Y Sp2 = n 8 Contraste para la diferencia de medias de dos normales relacionadas (muestras apareadas) con varianzas desconocidas pero iguales Hipótesis nula H0 : µX − µY = δ0 Hipótesis alternativa H1 : µX − µY 6= δ0 H1 : µX − µY > δ0 H1 : µX − µY < δ0 Estadístico de contraste D̄ − δ 0 T = r 2 SD n Criterios de rechazo T ≤ tα/2,n−1 o T ≥ t1−α/2,n−1 T ≥ t1−α,n−1 T ≤ tα,n−1 donde D = X − Y Contraste para una proporción Hipótesis nula H0 : p = p0 Hipótesis alternativa H1 : p 6= p0 H1 : p > p0 H1 : p < p0 Estadístico de contraste p̂ − p0 Z=s p0 (1 − p0 ) n Criterios de rechazo Z ≤ zα/2 o Z ≥ z1−α/2 Z ≥ z1−α Z ≤ zα Contraste para la comparación de dos proporciones Hipótesis nula H0 : p1 = p2 Hipótesis alternativa H1 : p1 6= p2 H1 : p1 > p2 H1 : p1 < p2 Estadístico de contraste p̂1 − p̂2 Z=q pT (1 − pT ) /n1 + pT (1 − pT ) /n2 Criterios de rechazo Z ≤ zα/2 o Z ≥ z1−α/2 Z ≥ z1−α Z ≤ zα 9 donde n1 p̂1 + n2 p̂2 n1 + n2 p̂T = TABLA ANOVA Y CONTRASTE DE LA F Fuentes de Variación Entre grupos (VE) Suma de Cuadrados I P i=1 Interna, no explicada o residual (VNE) TOTAL (VT) − ni (xi µ ni I P P xij − i=1 j=1 = ni I P P − I P i=1 µ i=1 j=1 − 2 x) − xi ¶2 ni σ 2i ¶2 − xij − x Grados de libertad Varianzas I −1 Se2 = VE I −1 n−I SR2 = V NE n−I n−1 Sy2 = VT n−1 − donde ni denota el número de observaciones en el grupo i, xi la media − 2 , σ i la varianza (en calculadora σ n al cuadrado), y x la media del conjunto total de observaciones. I es el no de grupos y n el no total de observaciones. Hipótesis nula H0 : µ1 = ... = µI Hipótesis alternativa No todas las medias son iguales 10 Estadístico de contraste S2 F = 2e SR Rechazar H0 si: F > F1−α,I−1,n−I