ESTADISTICA CURSO 2017/2018 GRADO EN INGENIERIA EN TECNOLOGIAS INDUSTRIALES (GITI) GRADO EN INGENIERIA DE ORGANIZACION (GIO) GRADO EN INGENIERIA QUIMICA (GIQ) Departamento de ingenier a de organizacion, administracion de empresas y estad stica. 1. PROFESORES Jesus Juan Ruiz. M1 y GIO Mar a Jesus Sanchez Naranjo. T2 Jose Mira McWilliams. GIQ Camino Gonzalez Fernandez. M2 Carolina Garc a Martos. M3 Francisco Javier Cara Ca~ nas. T1 Eduardo Caro Huertas. T3 2. PROGRAMA 1. Fundamentos de Probabilidad. Probabilidad. De nicion y propie-dades. Probabilidad condicionada. Independencia de sucesos. Teorema de la probabi-lidad total y teorema de Bayes. 2. Variable Aleatoria. Variables aleatorias discretas y continuas. Funciones de probabilidad, densidad y distribucion. Esperanza, varianza y momentos. Transformaciones lineales y no lineales. Generacion de numeros aleatorios (Metodo de Monte Carlo). Distribucion conjunta. Distribuciones marginales y condicionadas. Independencia de variables aleatorias. Esperanza de vectores aleatorios. Covarianza y correlacion. Matriz de varianzas. Esperanzas y varianzas condicionadas. Suma de variables aleatorias. 3. Modelos de Probabilidad. Distribucion binomial y distribucion geometrica. Distribucion de Poisson y distribucion exponencial. Distribucion normal. Teorema central del l mite. Relacion entre binomial, Poisson y normal. Aplicacion a control de recepcion. Planes de muestreo simple por atributos. Riesgo del comprador y riesgo del vendedor. La distribucion normal n-dimensional. 4. Estad stica descriptiva. Descripcion de una variable: datos y distribucion de frecuencias. Representaciones gra cas: histogramas. Medidas de centralizacion y dispersion. Medidas de asimetr a y curtosis. Diagramas de cajas y diagrama de tallos y hojas. Transformaciones lineales y no lineales. Descripcion de varias variables. Gra cos de dispersion. Covarianza y correlacion. Matriz de varianzas y covarianzas. Transformaciones lineales de varias variables. 5. Estimacion. Muestra y poblacion. Muestreo aleatorio simple. La identi cacion del modelo. Metodo de los momentos. Metodo de maxima verosimilitud. Propiedades de los estimadores. Distribucion de medias, varianzas y proporciones muestrales. Distribucion 2 . Intervalo para una proporcion. Intervalo para la media de la distribucion de Poisson. Intervalos para medias de distribuciones normales: va-rianza conocida y varianza desconocida. Distribucion t de Student. Intervalo para varianzas de distribuciones normales. Intervalo general (asintotico) para la media. 6. Contraste de hipotesis. Contraste para la proporcion, contraste para la media y la varianza de distribuciones normales. Contraste para la media de la distribucion de Poisson. Comparacion de dos tratamientos. Contraste de dos varianzas. Distribucion F: Contrastes de bondad de ajustes de 2 . LIBROS RECOMENDADOS Estad stica. Apuntes de la Asignatura. ETSII-UPM. Fundamentos de Estad stica. Daniel Pe~ na, Alianza Editorial (2010). Problemas resueltos de Estad stica. J. Juan, J.G. Palomo, M.J. Sanchez, e I. Sanchez. S ntesis (2000): Estadística Parte I. Probabilidad 1. Fundamentos de Probabilidad 2. Variable Aleatoria 3. Modelos de Probabilidad Parte II. Inferencia 4. Estadística Descriptiva 5. Estimación 6. Contraste de Hipótesis Fundamentos de Probabilidad 1 Laboratorio de Estadística Escuela Técnica Superior de Ingenieros Industriales Universidad Politécnica de Madrid http://www.etsii.upm.es/ingor/estadistica/ Profesores Jesús Juan Ruiz. María Jesús Sánchez Naranjo. José Manuel Mira McWilliams. Camino González Fernández. Carolina García Martos. Francisco Javier Cara Cañas. Eduardo Caro Huertas. Fundamentos de Probabilidad 2 Estadística Parte I. Probabilidad Tema 1. Fundamentos de Probabilidad Experimento Aleatorio El término “experimento aleatorio” se utiliza en la teoría de la probabilidad para referirse a un proceso cuyo resultado no es conocido de antemano con certeza. “Suma de valores en el lanzamiento de 2 dados.” Fundamentos de Probabilidad 4 Ejemplos • Número de piezas defectuosas en una muestra de 100 piezas. • Número de llamadas a una centralita telefónica en un día. • Energía eléctrica consumida en Madrid durante un periodo de tiempo. Fundamentos de Probabilidad 5 Espacio Muestral Conjunto formado por todos los posibles resultados de un experimento aleatorio. • DISCRETOS: • Lanzamiento de un DADO: S = {1,2,3,4,5,6} • Piezas defectuosas en una muestra de 100 S = {0,1,2,...,100} • Llamadas a una centralita durante un día S = {0,1,2,3,...,∞} • CONTINUOS: • Energía consumida en Madrid: S={[0, ∞)} Fundamentos de Probabilidad 6 Suceso Cualquier subconjunto del espacio muestral. • “Obtener un número par al lanzar un dado”: A = {2,4,6} • “Observar menos de 5 piezas defectuosas en una muestra de 100”: B = {0,1,2,3,4} • “Tener más de 50 llamadas de teléfono en una hora”: C = {51,52,...,∞} • “Tener una demanda de energía eléctrica entre 300 Mwh y 400 Mwh” : D =(300,400) 7 Fundamentos de Probabilidad Operaciones Sean A y B dos subconjuntos de S • Unión A ∪ B = {x : (x ∈ A) o (x ∈ B)} • Intersección A ∩ B = {x : (x ∈ A) y (x ∈ B)} A∪B A∩B • Complementario A = {x : x∉ A} Fundamentos de Probabilidad A 8 Propiedades Dados tres sucesos A,B y C de un espacio muestral S A ∪ B = B ∪ A Conmutativa : A ∩ B = B ∩ A A ∪ ( B ∪ C ) = ( A ∪ B) ∪ C Asociativa : A ∩ ( B ∩ C ) = ( A ∩ B) ∩ C A ∪ ( B ∩ C ) = ( A ∪ B) ∩ ( A ∪ C ) Distributiva : A ∩ ( B ∪ C ) = ( A ∩ B) ∪ ( A ∩ C ) A ∪ B = A ∩ B Leyes de De Morgan : A ∩ B = A ∪ B Fundamentos de Probabilidad 9 Axiomas de Probabilidad Dado un espacio muestral S, una función de probabilidad asigna valores P(A) a cada suceso A ⊂ S y satisface : 1. 0 ≤ P(A) ≤ 1 2. P(S) = 1 3. Para una secuencia de sucesos A1,A2 ,… , An que cumplen Ai ∩ A j = ∅ cuando i ≠ j n P (∪ Ai ) = i =1 P( Ai ) n i =1 Fundamentos de Probabilidad 10 Problema fundamental Dado un espacio muestral discreto con resultados A1, A2, ..., An disjuntos, el experimento aleatorio queda caracterizado si asignamos un valor P(Ai) no negativo a cada resultado Ai de forma que P(A1)+P( A2)+ ...+P(An)=1. • Ejemplo. Se lanza dos veces una moneda. {XX,XC,CX,CC} Se asigna probabilidad 1/4 a cada uno de los cuatro resultados anteriores. ¿ Es una asignación correcta? Fundamentos de Probabilidad 11 Propiedades elementales 1. P (∅) = 0. 2. P ( A) = 1 − P( A). 3. Si A ⊂ B entonces P(A) ≤ P(B). 4. Para dos sucesos cualesquiera A, B ⊂ S , P ( A ∪ B) = P ( A) + P( B) − P( A ∩ B). 5. Para n sucesos A1,A2 ,...,An ⊂ S , n n i =1 i =1 n n P(∪ Ai ) = P( Ai ) − P( Ai ∩ A j ) + n n i =1 j > i n P(A ∩ A i j ∩ Ak ) + ⋯ + (−1) n +1 P( A1 ∩ A2 ∩ ⋯ ∩ An ) i =1 j >i k > j Fundamentos de Probabilidad 12 Asignación de probabilidades 1. Clásica (Laplace): Equiprobabilidad 2. Frecuencialista (von Mises, 1931) 3. Subjetiva Fundamentos de Probabilidad 13 Clásica: sucesos equiprobables Sea un experimento con un número finito N de resultados excluyentes y equiprobables, la probabilidad del suceso A es N ( A) P( A) = , N donde N es el número de resultados posibles del experimento y N(A) el número de resultados favorables al suceso A. Fundamentos de Probabilidad 14 Ejemplos (equiprobabilidad) • Lanzamiento de una moneda. S={C,X} P(C ) = 1 2 • Lanzamiento de un dado. S={1,2,3,4,5,6} P (" Número par " ) = 3 1 = . 6 2 • Extracción de una de las 40 cartas de la baraja, S={1 Oros,2 Oros,...., Rey Bastos} P ( Bastos ) = 10 1 = . 40 4 Fundamentos de Probabilidad 15 Lanzamiento de dos dados 1er Dado 2º Dado 1 2 3 4 5 6 1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) 2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) 3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) 4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) 5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) 6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) P(“suma 7”) = 6/36 = 1/6 Fundamentos de Probabilidad 16 Urna: 2 Negras y 3 Blancas 1ª Bola B1 B1 B2 B3 N1 N2 B1,B2 B1,B3 B1,N1 B1,N2 B2 B3 B2,B1 B3,B1 B3,B2 B2,B3 B2,N1 B3,N1 B2,N2 B3,N2 N1 N2 N1,B1 N2,B1 N1,B2 N2,B2 N1,B3 N2,B3 N2,N1 N1,N2 Se extraen dos bolas al azar, una detrás de otra, sin reposición. P(“1ª Blanca y 2ª Negra”) = 6/20 = 3/10 Fundamentos de Probabilidad 17 Urna: 2 Negras y 3 Blancas 2ª Bola 1ª Bola B1 B2 B3 N1 N2 B1 B1,B1 B1,B2 B1,B3 B1,N1 B1,N2 B2 B2,B1 B2,B2 B2,B3 B2,N1 B2,N2 B3 B3,B1 B3,B2 B3,B3 B3,N1 B3,N2 N1 N1,B1 N1,B2 N1,B3 N1,N1 N1,N2 N2 N2,B1 N2,B2 N2,B3 N2,N1 N2,N2 Se extraen dos bolas al azar, una detrás de otra, con reposición. P(“1ª Blanca y 2ª Negra”) = 6/25 Fundamentos de Probabilidad 18 Combinatoria: 5 objetos tomados de dos en dos SIN REEMPLAZAMIENTO EL ORDEN 1 2 3 4 5 (1,2) (1,3) (1,4) (1,5) Primera extracción 2 3 4 (2,1) (3,1) (4,1) (3,2) (4,2) (2,3) (4,3) (2,4) (3,4) (2,5) (3,5) (4,5) 5 (5,1) (5,2) (5,3) (5,4) 1 2 3 4 5 1 (1,1) (1,2) (1,3) (1,4) (1,5) Primera Extracción 2 3 4 (2,1) (3,1) (4,1) (2,2) (3,2) (4,2) (2,3) (3,3) (4,3) (2,4) (3,4) (4,4) (2,5) (3,5) (4,5) Número = 20 1 EL ORDEN NO IMPORTA IMPORTA 1 CON REEMPLAZAMIENTO 1 2 3 4 5 (1,2) (1,3) (1,4) (1,5) Número = 25 Primera extracción 2 3 4 (2,3) (2,4) (2,5) (3,4) (3,5) 5 (5,1) (5,2) (5,3) (5,4) (5,5) 5 1 2 3 4 5 (4,5) Número = 10 1 (1,1) (1,2) (1,3) (1,4) (1,5) Primera extracción 2 3 4 (2,2) (2,3) (2,4) (2,5) (3,3) (3,4) (3,5) (4,4) (4,5) 5 (5,5) Número = 15 Fundamentos de Probabilidad 19 Combinatoria: Número posible de reordenaciones de n objetos tomados de r en r EL ORDEN SIN REEMPLAZAMIENTO n! (n − r ) ! NO IMPORTA EL ORDEN n r IMPORTA Fundamentos de Probabilidad CON REEMPLAZAMIENTO nr n + r − 1 r 20 S=('A','B','C','D') elección de tres elementos Sin Reemplazamiento Orden No Importa Orden Importa ## ## ## ## ## ## ## ## ## ## ## ## ## X1 X2 X3 1 A B C 2 A C B 3 C A B 4 C B A 5 B C A 6 B A C 7 A B D 8 A D B 9 D A B 10 D B A 11 B D A 12 B A D ## ## ## ## ## 1 2 3 4 ## ## ## ## ## ## ## ## ## ## ## ## ## 13 14 15 16 17 18 19 20 21 22 23 24 X1 X2 X3 A C D A D C D A C D C A C D A C A D B C D B D C D B C D C B C D B C B D X1 X2 X3 A B C A B D A C D B C D Con Reemplazamiento ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## 1 2 3 4 5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 X1 X2 X3 A A A B A A C A A D A A A B A B B A C B A D B A A C A B C A C C A D C A A D A B D A C D A D D A X1 X2 X3 A A A A A B A A C A A D A B B ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 X1 X2 X3 ## X1 X2 X3 A A B ## 33 A A C B A B ## 34 B A C C A B ## 35 C A C D A B ## 36 D A C A B B ## 37 A B C B B B ## 38 B B C C B B ## 39 C B C D B B ## 40 D B C A C B ## 41 A C C B C B ## 42 B C C C C B ## 43 C C C D C B ## 44 D C C A D B ## 45 A D C B D B ## 46 B D C C D B ## 47 C D C D D B ## 48 D D C ## ## ## ## ## ## 6 7 8 9 10 X1 X2 X3 A B C A B D A C C A C D A D D ## ## ## ## ## ## 11 12 13 14 15 ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## ## 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 X1 X2 X3 A A D B A D C A D D A D A B D B B D C B D D B D A C D B C D C C D D C D A D D B D D C D D D D D X1 X2 X3 X1 X2 X3 ## B B B ## 16 B D D B B C ## 17 C C C B B D ## 18 C C D B C C ## 19 C D D B C D ## 20 D D D Fundamentos de Probabilidad 21 Lotería Primitiva 1 - 6 - 21 - 29 - 33 -43 1. La primitiva. Se eligen 6 números distintos del 1 al 49, ambos inclusive. • Probabilidad de acertar los 6. • Probabilidad de acertar 5. • Probabilidad de acertar 4. • Probabilidad de no acertar ninguno. • Probabilidad de que salga un número concreto, por ejemplo el número 1. Fundamentos de Probabilidad 22 Ejemplo 1: Lotería Primitiva P (Acertar 6) = 1 1 = = 0,000000072 49 13.983.816 6 6 43 × 4 2 13.545 P (Acertar 4) = = = 0,00097 13.983.816 49 6 6 43 × 5 1 258 P (Acertar 5) = = = 0,000018 13.983.816 49 6 43 6 6.096.454 P(Ninguno) = = = 0,44 49 13.983.816 6 48 5 6 P (Salga el 1) = = = 0,1224 49 49 6 Fundamentos de Probabilidad 23 Ejemplo 2: Metro En una estación de metro hay 5 pasajeros esperando a un tren con 10 vagones, si cada pasajero elige un vagón al azar, ¿cuál es la probabilidad de que todos elijan un vagón diferente? P ( A) = N ( A) 10 × 9 × 8 × 7 × 6 = = 0.3024 N 105 Fundamentos de Probabilidad 24 Ejemplo 3: Fabricación por lotes De un lote con 100 piezas se toman al azar 10, si todas las piezas elegidas son buenas se acepta el lote y se rechaza en caso contrario. ¿Cuál es la probabilidad de aceptar un lote con 10 piezas defectuosas? 100 100 ! 90 90 ! = N = ; N ( A) = = 10 10 ! 90 ! 10 80 !10 ! N ( A) 90 ! 90 ! 90 × 89 × ⋯ × 81 P ( A) = = = = 0.330 80 ! 100 ! 100 × 99 × ⋯ × 91 N Fundamentos de Probabilidad 25 Ejemplo 4: Cumpleaños Probabilidad de que en un grupo de r = 25 personas haya al menos dos con el mismo cumpleaños. 1 2 ... 365 A1 A2 ... Ar r A = " No haya ninguna coincidencia" 365 × (365 - 1) × ⋯ × (365 − r + 1) 365 r P( A ) = 1 - P(A) , r = 25 → P( A ) = 0.578 P ( A) = Fundamentos de Probabilidad 26 Probabilidad y Frecuencia Relativa La probabilidad P(A) de un suceso A es el límite nA P ( A) = lim n →∞ n dónde nA es el número de veces que ha ocurrido A al repetir ir el experimento n veces en idénticas condiciones. Fundamentos de Probabilidad 27 Proporción de caras observadas al lanzar una moneda 200 veces Nº de Caras / Nº de Lanzam ientos Frecuencia relativa de caras 1,00 0,50 0,00 0 50 100 150 200 Nº de lanzam iento Fundamentos de Probabilidad 28 Simulación lanzamiento de un dado u = sample(1:6,size=20,replace=TRUE) u ## [1] 4 1 3 1 2 1 6 4 2 5 6 2 6 5 6 1 5 5 1 2 table(u) ## u ## 1 2 3 4 5 6 ## 5 4 1 2 4 4 barplot(table(u)) Fundamentos de Probabilidad 29 Simulación lanzamiento de un dado u1 = sample(1:6, size=100, replace=TRUE) table(u1)/100 ## u1 ## 1 2 3 4 5 6 ## 0.18 0.14 0.17 0.12 0.19 0.20 barplot(table(u3)/100,xlab='100 dados’) Fundamentos de Probabilidad u2 = sample(1:6, size=10000, replace=TRUE) table(u2)/10000 ## u2 ## 1 2 3 4 5 6 ## 0.1645 0.1599 0.1644 0.1704 0.1715 0.1693 barplot(table(u2)/10000,xlab='10000 dados') 30 Resultados de 3036 sorteos de la Primitiva Núm Veces 1 376 2 361 3 400 4 360 5 381 6 385 7 367 8 345 9 366 10 374 11 382 12 369 13 357 14 378 15 376 16 363 17 365 % 0.12385 0.11891 0.13175 0.11858 0.12549 0.12681 0.12088 0.11364 0.12055 0.12319 0.12582 0.12154 0.11759 0.12451 0.12385 0.11957 0.12022 Núm Veces 18 351 19 354 20 345 21 369 22 388 23 386 24 348 25 356 26 364 27 361 28 364 29 380 30 398 31 363 32 363 33 358 34 373 % 0.11561 0.11660 0.11364 0.12154 0.12780 0.12714 0.11462 0.11726 0.11989 0.11891 0.11989 0.12516 0.13109 0.11957 0.11957 0.11792 0.12286 Núm Veces 35 374 36 379 37 378 38 405 39 408 40 375 41 386 42 363 43 361 44 363 45 393 46 372 47 403 48 379 49 TOTAL 351 18216 % 0.12319 0.12484 0.12451 0.13340 0.13439 0.12352 0.12714 0.11957 0.11891 0.11957 0.12945 0.12253 0.13274 0.12484 0.11561 0.12245 La frecuencia con la que ha aparecido cada número es muy próxima a 0.12245=6/49, que es la probabilidad de que aparezca un número concreto en cada sorteo Fundamentos de Probabilidad 31 Simulación con R: muestras sample( 1:49, size = 6, replace = FALSE) # Extrae 6 números al azar entre 1 y 49 sin reemplazamiento ## [1] 8 35 3 40 32 23 Calculo por simulación de la probabilidad de aparición del número 27 u = for { x v # creo un vector con 10.000 ceros # Bucle k toma valores de 1 a 10.000 # comienzo bucle = sample(1:49, size = 6, replace = FALSE) # sorteo k = x == 27 # por ejem. v es [FALSE FALSE FALSE FALSE TRUE FALSE], indicaría que el quinto número es el 27 u[k] = sum(v) # sum(v) es cero o uno , según esté o no el 27 } # fin del bucle sum(u)/10000 # Probabilidad de obtener 27 rep(0,10000) (k in 1:10000) ## [1] 0.1255 Fundamentos de Probabilidad 32 Simulación con R: cumpleaños Simular con R una muestra al azar de 25 fechas de cumpleaños y comprobar si hay repeticiones. x = sample(1:365,25,replace=TRUE) # extrae con reemplazamiento 25 num. u = sort(x) # los ordena print(u) ## [1] 3 4 6 13 32 41 41 68 ## [18] 232 272 299 312 318 330 330 353 74 88 89 121 204 207 212 214 221 duplicated(u) # indica si hay valores repetidos (FALSE no y TRUE sí) ## [1] FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE ## [12] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE ## [23] FALSE TRUE FALSE sum(duplicated(u)) # número de 'TRUES' ## [1] 2 Fundamentos de Probabilidad 33 Simulación con R: ejemplos 1. Lanzamiento de 10 monedas x = sample(c('C','X'), size = 10, replace = TRUE) print (x) ## [1] "C" "X" "X" "C" "X" "X" "X" "X" "X" "C“ 2.Lanzamiento de 3 dados y = sample(1:6, size = 3, replace = TRUE) print(y) ## [1] 2 4 4 3. Quiniela al azar z = sample(c('1','X','2'),size = 14, replace = TRUE) print (z) ## [1] "X" "X" "2" "2" "X" "1" "X" "1" "X" "2" "X" "2" "2" "2“ 4.Quiniela al azar no equiprobable u = sample(c('1','X','2'),size = 14, replace = TRUE, prob = c(.7,.2,.1)) print (u) ## [1] "2" "1" "X" "1" "2" "1" "X" "1" "1" "X" "X" "1" "1" "1" Fundamentos de Probabilidad 34 Probabilidad Condicionada Definición. Sea B un suceso con probabilidad distinta de cero, se define probabilidad del suceso A dado B a: P( A | B) = P( A ∩ B) . P( B) Fundamentos de Probabilidad 35 Probabilidad Condicionada Fumadores (F) No Fumadores (N) TOTAL Mujeres (M) Hombres (H) TOTAL 0,12 0,18 0,30 0,39 0,31 0,70 0,51 0,49 1,00 0,18 P ( F | H ) = = 0,37 0,49 P( F ) = 0,30 0,12 = 0,24 P( F | M ) = 0 , 51 Fundamentos de Probabilidad 36 Utilidad • Actualizar probabilidad del suceso A en función de la información disponible I P(A|I) = P(A∩I)/P(I) • Cálculo de la intersección de sucesos P(A ∩ B) = P(A|B)P(B) • Cálculo de probabilidad de un suceso P( A) = P(( A ∩ B) ∪ ( A ∩ B)) = P( A | B) P( B) + P( A | B) P( B) Fundamentos de Probabilidad 37 Ejemplo Urna Probabilidad de “1ª Blanca y 2ª Negra” • Sin reemplazamiento: P(B1 ∩ N2) = P(B1) P(N2| B1) = (3/5)(2/4) = 3/10 • Con reemplazamiento: P(B1 ∩ N2) = P(B1) P(N2| B1) = (3/5)(2/5) = 6/25 Fundamentos de Probabilidad 38 Cumpleaños Probabilidad de que en un grupo de r = 25 personas haya al menos dos con el mismo cumpleaños. 1 2 ... 365 A1 Br = " No haya ninguna coincidencia en r " A2 ... Ar r P(Br ) = P(B1 ) P ( B2 | A1 ) P ( B3 | A1 ≠ A2 ) ⋯ P( Br | A1 ≠ A2 ≠ ⋯ ≠ Ar −1 ) 365 − 1 365 − 2 365 − r + 1 × × ⋯× 365 365 365 P( Br ) = 1 - P(Br ) , r = 25 → P( Br ) = 0.578 = 1× Fundamentos de Probabilidad 39 Ejemplo Urna U1 Urna U2 Se elige una urna al azar y se extrae una bola: ¿ P(Blanca) ? P( B) = P( B | U 1) P(U 1) + P( B | U 2) P(U 2) 3 1 1 1 17 = × + × = = 0.425 5 2 4 2 40 Fundamentos de Probabilidad 40 Ejemplo (cont.) Urna U1 Urna U2 Se toma al azar una bola de U1 y se mete en U2. Se extrae una bola de U2: ¿ P(Blanca) ? P( B) = P( B | B1) P( B1) + P( B | N1) P( N1) 2 3 1 2 8 = × + × = = 0.32 5 5 5 5 25 Fundamentos de Probabilidad 41 Cuentas de colores Un coleccionista tiene 73 cuentas de 6 colores en un vaso: 8 rojas, 9 rosas, 11 verdes, 12 azules, 15 amarillas y 18 moradas. Saca dos cuentas al azar sin reposición: 1. ¿Cuál es la probabilidad de que sean las dos rojas? 2. ¿Cuál es la probabilidad de que una sea roja y otra verde? 3. ¿Cuál es la probabilidad de que ninguna sea roja? 4. ¿Cuál es la probabilidad de que sean del mismo color? Rojas 8 Rosas 9 Verdes 11 Azules 12 Amarillas 15 5. ¿Cuál es la probabilidad de que sean Moradas 18 diferentes? Fundamentos de Probabilidad 42 Cuentas de colores: Solución 1. ∩ 2. ∩ 3. P ∩ 8 8 7 73 72 8 11 11 73 72 73 ∩ 65 73 8 72 64 72 7 9 8 11 8 7 9 8 4. 5. 1 10 12 11 15 14 18 17 73 72 11 10 12 11 15 14 18 17 73 72 Fundamentos de Probabilidad 43 Independencia Si el conocimiento de la ocurrencia de un suceso B cambia la probabilidad de que ocurra otro A, se dice que A y B son dependientes, en ese caso P(A|B)≠ P(A). Cuando el suceso A es independiente de B, la ocurrencia de B no cambia la probabilidad de A, es decir P(A|B) = P(A). Como P(A|B) = P(A∩B)/P(B), A y B son independientes ⇔ P(A∩B) = P(A) P(B) Fundamentos de Probabilidad 44 Lanzamiento de dos monedas S = {CC, CX, XC,XX} Hipótesis: • Monedas equilibradas: P(C) = P(X) • Independientes P (CC) = P(C) P(C) = (1/2)×(1/2) = 1/4 P (CX) = P(C) P(X) = (1/2)×(1/2) = 1/4 P (XC) = P(X) P(C) = (1/2)×(1/2) = 1/4 P (XX) = P(X) P(X) = (1/2)×(1/2) = 1/4 Fundamentos de Probabilidad 45 Independencia (3 o más sucesos) • Tres sucesos A, B y C son independientes si •P(A ∩ B∩ C) = P(A) P(B) P(C) •P(A ∩ B) = P(A) P(B) •P(A ∩ C) = P(A) P(C) •P(B ∩ C) = P(B) P(C) • Los sucesos A1 , A2 , ..., An son independientes si cualquier subconjunto Ai1, Ai2, ..., Aik, cumple P(Ai1∩Ai2∩...∩ Aik) = P(Ai1)P( Ai2)...P(Aik) Fundamentos de Probabilidad 46 Probabilidad Total B1 B6 B2 B3 B7 A B8 B4 B9 Partición. B1,B2 ,...,Bn : B j ⊂ S B5 Bi ∩ B j = ∅, ∀i ≠ j B10 B1 ∪ B2 ∪ ⋯ ∪ Bn = S P( A) = P( A ∩ S ) = P[ A ∩ ( B1 ∪ B2 ∪ ⋯ ∪ Bn )] = P[( A ∩ B1 ) ∪ ( A ∩ B2 ) ∪ ⋯ ∪ ( A ∩ Bn )] = P ( A ∩ B1 ) + P ( A ∩ B2 ) + ⋯ + P ( A ∩ Bn ) P( A) = P( A | B1 ) P ( B1 ) + P( A | B2 ) P( B2 ) + ⋯ P( A | Bn ) P( Bn ) Fundamentos de Probabilidad 47 Teorema de Bayes Sea B1 ,B2 ,...,Bn una partición del espacio S tal que P(B j ) > 0, para j = 1,2 ,...,n y sea A cualquier suceso con P(A) > 0, entonces para cualquier Bi : P(Bi|A) = P(A|Bi )P(Bi ) n P(A|B j . )P(B j ) j =1 Fundamentos de Probabilidad 48 Ejemplo Bayes 1: Almacén M-1 M-2 M-3 5% D 20 % D 10 % D 200 p/h 100 p/h 100 p/h ALMACÉN El porcentaje de piezas defectuosas fabricadas por tres máquinas es 5%, 20% y 10%. La primera fabrica 200 piezas por hora y las otras dos 100 piezas por hora. Todas las piezas fabricadas se llevan a un almacén. Al final del día se toma una pieza del almacén y es defectuosa, ¿cuál es la probabilidad de que proceda de M-1, M-2 o M-3? Fundamentos de Probabilidad P(M 1 | D) = P( D | M 1 ) P(M 1 ) P( D | M 1 ) P(M 1 ) + P( D | M 2 ) P(M 2 ) + P( D | M 3 ) P(M 3 ) = P(M 2 | D) = 0.05 × 0.5 = 0.25 0.05 × 0.5 + 0.20 × 0.25 + 0.10 × 0.25 P( D | M 2 ) P(M 2 ) P( D | M 1 ) P(M 1 ) + P( D | M 2 ) P(M 2 ) + P( D | M 3 ) P(M 3 ) = P(M 3 | D) = 49 0.20 × 0.25 = 0.50 0.05 × 0.5 + 0.20 × 0.25 + 0.10 × 0.25 P( D | M 3 ) P(M 3 ) P( D | M 1 ) P(M 1 ) + P( D | M 2 ) P(M 2 ) + P( D | M 3 ) P(M 3 ) = 0.10 × 0.25 = 0.25 0.05 × 0.5 + 0.20 × 0.25 + 0.10 × 0.25 P(M 1 | D) + P(M 2 | D) + P(M 3 | D) = 1 Fundamentos de Probabilidad 50 Ejemplo Bayes 2: Virus Si una persona es portadora del virus A, un análisis de sangre lo detecta el 99% de las veces. Sin embargo, el test también proporciona “falsos positivos”, indicando la presencia del virus en el 3% de personas sanas. Si sólo 5 de cada 1000 personas tienen el virus, ¿cuál es la probabilidad de que una persona tenga el virus realmente si el análisis ha dado positivo? V =" Tener el Virus" S =" El análisis es positivo" P(V ∩ S ) P ( S | V ) P(V ) = P (V | S ) = P( S ) P( S | V ) P (V ) + P( S | V ) P (V ) 0.99 × 0.005 = = 0.142 0.99 × 0.005 + 0.03 × 0.995 Fundamentos de Probabilidad 51 Ejemplo Virus (Aplicado a 1.000.000 personas) NEGATIVO POSITIVO Total SANOS 965.150 29.850 995.000 ENFERMOS 50 4.950 5.000 Total 965.200 34.800 1.000.000 Entre los 34.800 que han dado positivo, sólo 4.950 tienen el virus P(V|S) = 4.950/34.800 = 0.142 Fundamentos de Probabilidad 52 Capı́tulo 1: Ejercicios propuestos 1. Sean A y B dos sucesos no disjuntos cualesquiera de un experimento aleatorio. Indicar cual de las siguientes probabilidades es mayor P1 = P (AB | A) ó P2 = P (AB | A ∪ B). Justificar la respuesta. 2. Dado dos sucesos A y B, tal que P (A) > 0 y P (B) > 0 indicar, justificando la respuesta, si son ciertas o no las afirmaciones siguientes: (a) Si A y B son sucesos mutuamente excluyentes entonces no pueden ser independientes. (b) Si A y B son independientes entonces no pueden ser mutuamente excluyentes. 3. Demostrar que si dos sucesos A y B son independientes, también los son A y B, y A y B, donde A y B representan los sucesos complementarios de A y B respectivamente. 4. Sean dos sucesos equiprobables e independientes tal que la probabilidad de su unión es 0.75. Obtener la probabilidad de cada uno de ellos. 5. Si la probabilidad de que un interruptor cualquiera de la figura se encuentre cerrado (es decir, pase corriente) es p, calcular la probabilidad de que pase corriente de A a B para las tres configuraciones siguientes: 6. Teniendo en cuenta que para cualquier par de sucesos, A1 , A2 se cumple que Pr(A1 A2 ) ≥ Pr(A1 ) + Pr(A2 ) − 1, P demostrar que la extensión a n sucesos es Pr(A1 A2 ...An ) ≥ ni=1 Pr(Aı ) − (n − 1). 7. La probabilidad de que un componente de una máquina se averı́e antes de 100 horas es 0.01. La máquina tiene 50 componentes; calcular la probabilidad de averı́s de la máquina antes de 100 horas en los casos siguientes: (a) La máquina se averı́a cuando lo hace uno o más componentes. 1 (b) La máquina se averı́a cuando fallan dos o más componentes. (c) La máquina sólo se averı́a cuando lo hacen todos los componentes. 8. Un matrimonio tiene dos hijos y se sabe que uno de ellos es varón. Aceptando que la probabilidad de varón y hembra es la misma. ¿ Cuál es la probabilidad de que los dos sean varones? 9. Una urna contiene 5 bolas rojas, 3 blancas y 2 azules. Si se extraen 6 bolas con reposición, calcular la probabilidad de obtener 2 bolas de cada color. 10. El sorteo de la loterı́a primitiva consiste en acertar los seis números extraı́dos al azar y sin reposicin de una bombo que contiene 49 bolas numeradas del 1 al 49. Un participante ha realizado una apuesta múltiple y ha tachado 8 números. Calcular la probabilidad de acertar 6, 5, 4, 3, 2, 1 o ninguno de los números premiados. Si juega todos los dı́as del año (365 sorteos) la misma apuesta ¿cuál es la probabilidad de que no acierte más de cuatro en ningún sorteo del año? 11. Dos pueblos de alta montaña están comunicados por cuatro tramos de carretera según se muestra en la figura (a). Los dı́as de invierno debido a la nieve es frecuente que las carreteras estén cortadas. Cuando nieva, la probabilidad de que cualquier tramo sea transitable es 0.8 con independencia de lo que ocurra con el resto. ¿Cuál es la probabilidad de que un vehı́culo pueda viajar de Villarriba a Villabajo un dı́a con nieve? Para mejorar las comunicaciones se piensa construir un nuevo tramo de carretera entre los puntos A y B. Cuando nieva la probabilidad de accesibilidad es también 0.8 con independencia del resto. ¿Cuál es la probabilidad de que una persona pueda hacer el viaje anterior con esta nueva configuración (b)? 12. Dos estudiantes A y B están matriculados en un curso. A asiste a las clases el 80% de los dı́as y B el 60%, siendo las asistencias de ambos independientes. Si exactamente uno de los dos está en clase un dı́a concreto, ¿cuál es la probabilidad de que sea A? 13. La probabilidad de que un componente se averı́e en un perı́odo de tiempo dado es 0.01. Su estado (averiado o funcionando) se comprueba con un ensayo que cumple que cuando el componente 2 funciona la probabilidad de que el ensayo diga lo contrario es 0.05, pero si el componente está averiado el ensayo no se equivoca. Si el ensayo indica que el componente está averiado, ¿cuál es la probabilidad de que realmente lo esté? 14. Cuatro estudiantes comparten piso, después de una comida deciden el siguiente procedimiento para elegir quin lava los platos: en un sombrero meten cuatro papeles doblados e indistinguibles, en uno de ellos pone ‘Sı́’ y en los otros tres ‘No’. El primero coge un papel y lo abre, si el resultado es ‘Sı́’ le toca fregar, si el resultado es que ‘No’ se libra. No se devuelve el papel al sombrero. A continuacin el segundo coge el papel, y se aplica el mismo criterio, y as sucesivamente hasta que uno de ellos obtiene el papel con el ‘Sı́’. ¿Quién tiene más probabilidad de lavar los platos, el primero o el último? 15. Tres fichas están marcadas con las letras A, B, C, respectivamente, y una cuarta con las tres ABC. Se meten en una urna y se toma una de ellas al azar. Se pregunta si los tres sucesos consistentes en la presencia de la letra A, la letra B o la C sobre la ficha son o no independientes. 16. Tres personas comparten una oficina con un teléfono. De las llamadas que llegan, 2/5 son para A, 2/5 para B y 1/5 para C. El trabajo de estos hombres les obliga a frecuentes salidas, de manera que A está fuera el 50% de su tiempo, y B y C el 25%. Calcular la probabilidad de que : (a) (b) (c) (d) No esté ninguno para responder al teléfono. Esté la persona a la que se llama. Haya tres llamadas seguidas para una persona. Haya tres llamadas seguidas para tres personas diferentes. 17. En un campeonato de tenis usted tiene la opción de escoger la secuencia de partidos A − B − A o la B − A − B, donde A y B indican sus oponentes. Para clasificarse debe usted ganar dos partidos consecutivos. El jugador A es mejor que el B. ¿ Qué secuencia será preferida? 18. Un jurado de tres miembros que decide por mayorı́a tiene dos miembros que deciden independientemente el veredicto correcto con probabilidad p y el tercero lanza una moneda. Si un juez tiene probabilidad p de acertar, ¿cuál de los dos sistemas tiene mayor probabilidad de acertar? 19. Una comunidad de vecinos ha contratado un sistema de alarma para evitar robos en sus hogares. En caso de robo la alarma se pone en funcionamiento con seguridad. La probabilidad de que se produzca un robo en el vecindario es 0.001. Existen además otras causas (viento, golpes bruscos, ...) que ponen en funcionamiento el sistema de alarma, la probabilidad de que en una noche se produzca una falsa alarma es 0.01. Si se declara una señal de alarma, ¿cuál es la probabilidad de que sea falsa? 20. Una pareja que espera un hijo está preocupada porque un test practicado al feto ha dado positivo a una enfermedad muy rara que solo la padecen uno de cada 10000 individuos. Sin embargo, el test es bastante seguro: de acuerdo con el laboratorio acierta el 99 por ciento de los casos, tanto para los bebés con la enfermedad como para los sanos. ¿Cuál es la probabilidad de que el feto tenga la enfermedad teniendo en cuenta que el resultado del test ha sido positivo? 21. Un concursante debe elegir entre tres puertas, detrás de una de las cuales se encuentra un magnı́fico regalo. Hecha la elección, el presentador que sabe donde se encuentra el premio le abre una de las dos puertas no escogidas donde (lógicamente) no está el premio y a continuación le da al concursante la posibilidad de cambiar la puerta elegida. ¿Qué debe hacer el concursante? 3 Estadística Parte I. Probabilidad Tema 2. Variable Aleatoria Variable Aleatoria Una variable aleatoria es una función que asigna un número real a cada uno de los resultados de un experimento aleatorio. Lanzamiento de 2 monedas X(s) ≡Número de CARAS s X(s) CC→ 2 CX → 1 XC → 1 XX → 0 Probabilidad y variable aleatoria 2 Variable Aleatoria Discreta Cuando los valores que toma una variable aleatoria son finitos o infinitos numerables se dice que es discreta. • Resultado obtenido al lanzar un dado {1,2,3,4,5,6} • Número de veces que hay que lanzar una moneda hasta obtener una CARA {1,2,3,4, ...} Probabilidad y variable aleatoria 3 Distribución de probabilidad Sea { x1 , x2 , ..., xn } los valores que puede tomar la variable aleatoria X. Se denomina distribución de probabilidad de la variable aleatoria a P( X=xi ) que cumple: • P ( X = xi ) ≥ 0 • Σi=1 P ( X = xi ) = 1. x P(X=x) 0 → 1/4 Nº de Caras al lanzar 2 monedas 1 → 1/2 2 → 1/4 Probabilidad y variable aleatoria 4 Distribución de probabilidad = p(X) 1/4 = 1/2 1/4 =0 =1 =2 1 3 1/2 1/4 0 2 x Nº de Caras al lanzar 2 monedas 5 Probabilidad y variable aleatoria Lanzamiento de un dado x P ( X = x) 1 2 1/ 6 1/ 6 3 4 1/ 6 1/ 6 5 6 1/ 6 1/ 6 = P (X = x) 1/6 1 1 = , 6 2 3 4 5 6 x = 1,2,3,4,5,6 6 Función de distribución La función de distribución FX ( x ) de una variable aleatoria X se define para todo número real x como: FX ( x ) = PX ( X ≤ x ). Ejemplo. X = Número de caras al lanzar 2 monedas x FX ( x ) (-∞,0) 0 [0,1) 1/4 [1,2) 3/4 [2,∞) 1 F(x) 1 3/4 1/2 1/4 0 1 2 3 x 7 Probabilidad y variable aleatoria 1 Función de Distribución 3/4 1/2 1/4 0 1 2 3 x Distribución puntual de probabilidad 1/2 1/4 0 1 2 3 x Probabilidad y variable aleatoria 8 Lanzamiento de un dado F(x) 1 1 2 3 4 5 6 x p(x) 1/6 1 2 3 4 5 6 x P ( X = x) 1 2 1/ 6 1/ 6 3 4 1/ 6 1/ 6 5 6 1/ 6 1/ 6 x 9 Probabilidad y variable aleatoria Función de Distribución F(x) Una función F(x) es una función de distribución si y sólo si cumple las siguientes condiciones: a. lim F ( x) = 0 y x → −∞ lim F ( x) = 1. x → +∞ b. F(x) es una función no decreciente. c. F(x) es continua por la derecha : ∀h > 0, lim F ( x + h) = F ( x). h →0 Probabilidad y variable aleatoria 10 Variable aleatoria continua Una variable aleatoria X es continua si su función de distribución FX ( x ) es continua. F(x) 1 0 3/4 x 1/2 1/4 0.25 0.75 0 0,5 = 0.50 0 1 1 1,5 <0 0≤ ≤1 >0 x 11 Probabilidad y variable aleatoria Generación números aleatorios Generar valores al azar de la distribución uniforme runif(1) #genera un valor al azar en el intervalo [0,1] con dist. uniforme ## [1] 0.5498192 runif(25) # genera 25 valores independientes con dist. uniforme en [0,1] ## [1] 0.13841597 ## [7] 0.13076084 ## [13] 0.90280394 ## [19] 0.52071798 ## [25] 0.34428384 0.24418695 0.12667461 0.30585911 0.09812817 Probabilidad y variable aleatoria 0.71302890 0.97046547 0.89637537 0.42877694 0.83867345 0.98281857 0.33943981 0.59504927 0.55214026 0.84036605 0.62345635 0.52124912 0.50127997 0.60393346 0.87002649 0.71727385 12 Instrucciones en R x = runif(1000) # crea un vector con 1000 valores con dist. uniforme en [0,1] plot(x,cex=.8,col='blue') #dibuja en orden los 1000 valores de x en c olor azul (cex controla el tamaño de cada punto) hist(x) # histograma de los 1000 valores 13 Probabilidad y variable aleatoria n = 1.000 n = 100.000 n = 10.000 n = 1.000.000 hist(x,probability = TRUE, nclass=50,col='grey') 14 Función de densidad La función de densidad de probabilidad fX(x) de una variable aleatoria continua X es la función que verifica x FX ( x) = f X (t ) dt , ∀ x. −∞ Si FX(x) es derivable, además d FX ( x) = f X ( x). dx 15 Probabilidad y variable aleatoria F(x) Función de distribución 1 3/4 FX(x) = x, x∈[0,1] 1/2 1/4 0 0,5 1 1,5 x f(x) Función de densidad 1 fX(x) = 1, x∈[0,1] 0 0,5 1 1,5 x 2. Variable aleatoria 16 Propiedades de la función de densidad Una función fX (x) es una función de densidad de probabilidad de una variable aleatoria X si y sólo si cumple: a. f X ( x) ≥ 0 para todo x. b. ∞ -∞ f X ( x) dx = 1. Área = 1 17 Probabilidad y variable aleatoria Cálculo de probabilidades f X (x) b a a f X ( x) dx b P(a ≤ X ≤ b) = FX (b) − FX (a ) b = f X ( x) dx a Esperanza de una variable aleatoria Se define esperanza o media de una variable aleatoria discreta X y se representa n por E[X] al valor E[ X ] = xi P ( X = xi ). i =1 Ejemplo: Lanzamiento de un dado 1 1 1 1 1 1 E[ X ] = 1× + 2 × + 3 × + 4 × + 5 × + 6 × = 3.5 6 6 6 6 6 6 Centro de la distribución de probabilidad 1/6 1 3 5 x 3.5 19 Probabilidad y variable aleatoria Esperanza de una variable aleatoria Se define esperanza o media de una variable aleatoria continua X con función de densidad fX(x) y se representa por E[X] al valor ∞ E[ X ] = x f X ( x) dx. −∞ Ejemplo : Distribución uniforme f X (x) = 1, 0 ≤ x ≤ 1 1 1 x2 1 E[ X ] = x × 1 dx = = . 2 0 2 0 Centro de la distribución de probabilidad 1 0 0,5 1 1,5 x Probabilidad y variable aleatoria 20 Propiedades de E[X] Transformaciones lineales Y = a X+b (a y b constantes) E[aX + b] = a E [ X ] + b Demostración: = + = = ( = E[X] )+ ( = ) 1 21 Probabilidad y variable aleatoria Varianza Sea X una variable aleatoria con media µ, se denomina varianza a Var ( X ) = E[ ( X - µ )2 ]. • Variable aleatoria discreta ∞ Var[ X ] = (x − µ) 2 P( X = x). x = −∞ • Variable aleatoria continua ∞ Var[ X ] = ( x − µ ) 2 f X ( x) dx −∞ Probabilidad y variable aleatoria 22 Propiedades de la varianza 1. Var ( X ) = E[( X − µ ) 2 ] = E[ X 2 ] − µ 2 . 2. Var (aX + b) = a 2Var ( X ) Ejemplos Lanzamiento de un dado 35 1 1 1 1 1 1 Var[ X ] = (12 × + 2 2 × + 32 × + 4 2 × + 52 × + 6 2 × ) − (3.5) 2 = . 12 6 6 6 6 6 6 Distribución uniforme 1 1 1 1 x3 Var[X] = x ×1 dx − (1 / 2) = − = . 3 0 4 12 0 2 2 23 Probabilidad y variable aleatoria Desigualdad de Tchebychev Area ≥ 1 − µ-k σ µ 1 k2 µ+k σ Para cualquier variable aleatoria µ = E[ X ] σ 2 = Var[ X ] 1 P( X − µ ≤ kσ ) > 1 − 2 . k Probabilidad y variable aleatoria 24 Momentos de una Variable Aleatoria Momentos respecto al Origen µ1 = E[ X ] = µ µ 2 = E[ X 2 ] µ p = E[ X p ] Momentos respecto a la media α1 = E[( X − µ )] = 0 α 2 = E[( X − µ ) 2 ] = σ 2 α p = E[( X − µ ) p ] 25 Probabilidad y variable aleatoria Transformaciones Dada una variable aleatoria X con función de densidad f X ( x) vamos a ver como se obtiene la función de densidad fY ( y ) de la variable aleatoria Y , definida como Y = g(X) Casos a considerar : * La función g es monótona creciente * La función g es monótona decreciente * La función g no es monótona Probabilidad y variable aleatoria 26 Función g creciente FY ( y ) = P (Y ≤ y ) = P( g ( X ) ≤ y ) = P( X ≤ g −1 ( y ) ) y = FX ( g −1 ( y )) Y≤ y x = g -1(y) X ≤ g -1(y) fY ( y ) = dFY ( y ) dy d g −1 ( y ) = × f X ( g −1 ( y )) dy 27 Probabilidad y variable aleatoria Función g decreciente FY ( y ) = P (Y ≤ y ) = P( g ( X ) ≤ y) = P ( X ≥ g −1 ( y ) ) y = 1 − FX ( g −1 ( y )) fY ( y ) = x = g -1(y) X ≥ g -1(y) Probabilidad y variable aleatoria dFY ( y ) dy d g −1 ( y ) =− × f X ( g −1 ( y )) dy 28 Función monótona d g −1 ( y ) fY ( y ) = × f X ( g −1 ( y )) dy 29 Probabilidad y variable aleatoria Transformación no monótona Y ≤y y x1 x2 x3 x4 x5 x6 x FY ( y ) = P (Y ≤ y ) = P( x1 ≤ X ≤ x2 ) + P( x3 ≤ X ≤ x4 ) + P( x5 ≤ X ≤ x6 ) Probabilidad y variable aleatoria 30 Ejemplo de transformación El radio de una esfera es una variable aleatoria cuya función de densidad es f X ( x) = 3 x 2 , 0 ≤ x ≤ 1. ¿Cuál es la función de densidad del volumen? Y = Volumen de la esfera 4 3Y Y = π X3 X = 3 4π fY ( y ) = 1 3 1 4 3y 3 g ( x) = π x 3 ; g −1 ( y ) = ; 3 4π = d −1 g ( y ) × f X ( g −1 ( y )) dy 3 4π . , 0≤ y≤ 4π 3 31 Probabilidad y variable aleatoria 4 y = π x3 3 0 1 f X ( x ) = 3 x 2 , 0 ≤ x ≤ 1. Probabilidad y variable aleatoria x 0 fY ( y ) = 4π/3 y 3 4π , 0≤ y≤ . 4π 3 32 Un caso muy relevante del problema inverso Dada una variable aleatoria X con distribución uniforme (0,1), encontrar la transformación Y = g(X) que hace que Y tenga la función de densidad fY(y) d g −1 ( y ) = fY ( y ) dy −1 g ( x) = Fy ( x) Probabilidad y variable aleatoria 33 Representación gráfica con ejemplo Generar valores al azar con función de densidad fY ( y) = 0.3 e−0.3y , y ≥ 0 FY ( y) =1− e−0.3y 1 g(x) = F (x) = − log(1− x ) 0.3 −1 Y Generamos valores U[0,1] x = 0.65→ y = g(0.65) = 3.5 Probabilidad y variable aleatoria 34 Distribución conjunta de variables aleatorias Definiciones (v. a. discretas) Distribución de probabilidad conjunta de dos variables aleatorias X, Y P( X = x, Y = y ) ≥ 0, ∀x, y P ( X = x, Y = y ) x = ∞ y = ∞ P( X = x, Y = y ) = 1. x = −∞ y = −∞ Función de distribución conjunta: FXY ( x, y ) = P ( X ≤ x, Y ≤ y ) Modelos Multivariantes 36 Lanzamiento de dos dados Dado ROJO 1 1/36 1/36 1/36 1/36 1/36 1/36 1 2 3 4 5 6 Dado AZUL 2 1/36 1/36 1/36 1/36 1/36 1/36 3 1/36 1/36 1/36 1/36 1/36 1/36 4 1/36 1/36 1/36 1/36 1/36 1/36 5 1/36 1/36 1/36 1/36 1/36 1/36 6 1/36 1/36 1/36 1/36 1/36 1/36 X = “ Resultado de dado ROJO” Y = “ Resultado de dado AZUL” Distribución conjunta de probabilidad P ( X=i , Y=j ) =1/36, (i,j de 1 a 6) 37 Modelos Multivariantes Ejemplo Ejemplo: Se lanzan dos dados y se definen las variables aleatorias suma (S) y valor absoluto de la diferencia (D) de los resultados. Distribución Conjunta P(S= x, D= y) 0 1 D : DIFERENCIA 2 DE DOS DADOS 3 4 5 Modelos Multivariantes 2 1/36 S : SUMA DE DOS DADOS 5 6 7 8 9 10 11 12 1/36 1/36 1/36 1/36 1/18 1/18 1/18 1/18 1/18 1/18 1/18 1/18 1/18 1/18 1/18 1/18 1/18 1/18 1/18 3 4 1/36 38 Distribuciones Marginales 0 1 D : DIFERENCIA 2 DE DOS DADOS 3 4 5 S : SUMA DE DOS DADOS 2 3 4 5 6 7 8 9 10 11 12 1/36 1/36 1/36 1/36 1/36 1/36 6/36 1/18 1/18 1/18 1/18 1/18 10/36 1/18 1/18 1/18 1/18 8/36 1/18 1/18 1/18 6/36 1/18 1/18 4/36 1/18 2/36 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 Marginal de S Marginal de D 39 Modelos Multivariantes Distribuciones Marginales y =∞ P ( X = x ) = P ( X = x, Y = y ) y = −∞ x =∞ P(Y = y ) = P( X = x, Y = y ) x = −∞ 0,18 0,16 0,14 0,12 0,1 0,08 0,06 Suma de dos dados Modelos Multivariantes 0,04 0,02 0 1 2 3 4 5 6 7 8 9 10 11 12 13 40 Distribuciones condicionadas 0 1 2 3 4 5 D : DIFERENCIA DE DOS DADOS S : SUMA DE DOS DADOS 2 3 4 5 6 7 8 9 10 11 12 1/36 1/36 1/36 1/36 1/36 6/36 1/36 1/18 1/18 1/18 1/18 1/18 10/36 1/18 1/18 1/18 8/36 1/18 1/18 1/18 1/18 6/36 1/18 4/36 1/18 1/18 2/36 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 D|S= 8 Distribución de la diferencia entre los dados condicionada a que la suma es 8. 0 1 2 3 4 5 P(D = y | S=8) = P(D=y, S=8) / P(S=8) 1/5 0 2/5 0 2/5 0 1 41 Modelos Multivariantes Independencia Las variables aleatorias X, Y son independientes si y sólo si P (X = x , Y = y ) = P( X = x ) × P( Y = y ) Dado ROJO Dado AZUL 1 2 3 4 5 6 Modelos Multivariantes 1 1/36 1/36 1/36 1/36 1/36 1/36 2 1/36 1/36 1/36 1/36 1/36 1/36 3 1/36 1/36 1/36 1/36 1/36 1/36 4 1/36 1/36 1/36 1/36 1/36 1/36 5 1/36 1/36 1/36 1/36 1/36 1/36 6 1/36 1/36 1/36 1/36 1/36 1/36 42 Variables aleatorias continuas d b P(a ≤ X ≤ b, c ≤ Y ≤ d ) = c a f XY ( x, y ) dx dy Siendo f XY ( x, y ) la función de densidad conjunta, que cumple : 1) f XY ( x, y ) ≥ 0, ∀x, y ∞ ∞ 2) −∞ −∞ f XY ( x, y ) dx dy = 1 43 Modelos Multivariantes Variables aleatorias continuas Función de distribución FX , Y ( x, y ) = x y −∞ −∞ f X , Y (u , v) du dv Funciones de densidad marginales ∞ f X ( x) = f X ,Y ( x, y ) dy −∞ ∞ fY ( y ) = f X ,Y ( x, y ) dx −∞ Modelos Multivariantes 44 Las variables aleatorias X, Y tienen como función de densidad conjunta f XY ( x, y ) = 6 xy 2 , 0 < x < 1, 0 < y < 1 1. P( X ≤ x, Y ≤ y ) = x 0 2. P( X + Y ≤ 1) = y 0 6uv 2 dudv = x 2 y 3 6 xy 2 dxdy y x + y ≤1 = 1 0 1− y 0 6 xy 2 dxdy = 1 5 x = 1-y 3. Marginales 1 f X ( x ) = 6 xy 2 dy = 2 x, 0 < x < 1 0 1 fY ( y ) = 6 xy 2 dx = 3 y 2 , 0 < y < 1 0 45 Modelos Multivariantes Independencia Las variablesaleatorias X, Y son independientes si y sólo si f XY (x,y) = f X (x)fY (y). 1. 2. f X ( x ) = 2 x, 0 < x < 1 f XY ( x, y ) = 6 xy 2 , 0 < x < 1, 0 < y < 1 f ( y) = 3 y 2 , 0 < y < 1 Y Independientes x1 f X ( x) = 0 x dy = 1, 0 < x < 1 1 f XY ( x, y ) = , 0 ≤ y ≤ x ≤ 1 11 x fY ( y ) = dx = − log( y ), 0 < y < 1 yx 1 y No independientes 0 Modelos Multivariantes x 1 46 Funciones de densidad condicionadas , #) , (#) " # = |" # "| ," ( ," ( , #) , ( ) = %& '() %& '() Modelos Multivariantes " # >0 >0 47 Independencia -II 1. f X ( x ) = 2 x, 0 < x < 1 f XY ( x, y ) = 6 xy , 0 < x < 1, 0 < y < 1 2 fY ( y ) = 3 y , 0 < y < 1 6 xy 2 = 2 x, 0 < x < 1 f X |Y ( x | y ) = 3x2 2 Independientes x1 f x = ( ) X 0 x dy = 1, 0 < x < 1 1 2. f XY ( x, y ) = , 0 ≤ y ≤ x ≤ 1 11 x fY ( y ) = dx = − log( y ), 0 < y < 1 y x 1 f X |Y ( x | y ) = − , y ≤ x ≤1 x log( y ) No independientes 1 f Y | X ( y | x) = , 0 ≤ y ≤ x x Modelos Multivariantes 48 Independencia -III Las variables aleatorias X, Y son independientes si y sólo si f X |Y (x | y) = f X (x) fY | X (y | x) = fY (y) 49 Modelos Multivariantes Ejemplo c, x 2 + y 2 ≤ r 2 f ( x, y ) = 2 2 2 0, x + y > r 1. c= 1 . 2 πr ∞ 2. f X ( x) = −∞ f ( x, y )dy 1 + = π r2 − = Modelos Multivariantes r 2 −x2 dy r 2 − x2 2 2 2 r − x , −r ≤ x≤r 2 πr 50 Ejemplo (cont.) 3. f Y ( y ) = ∞ −∞ = = f ( x, y )dx 1 π r2 2 πr 2 4. f X |Y ( x | y ) = + r2 − y2 − r 2 − y2 dx r2 − y2 , − r ≤ y ≤ r f ( x, y ) 1 = , − r2 − y2 ≤ x ≤ r 2 − y2 fY ( y ) 2 r 2 − y 2 fY(y) fX|Y(x|y) 51 Modelos Multivariantes Independencia Las variables aleatorias X, Y son independientes si y sólo si f XY (x,y) = f X (x)f Y (y). 1. f X ( x ) = 2 x, 0 < x < 1 f XY ( x, y ) = 6 xy , 0 < x < 1, 0 < y < 1 f ( y) = 3 y 2 , 0 < y < 1 Y Independientes 2. 2 = f x r 2 − x2 ( ) X 2 1 πr , x2 + y2 ≤ r 2 f ( x, y ) = πr 2 0, x 2 + y 2 > r 2 2 = f y r 2 − y2 ( ) Y 2 πr 2 ,− r ≤ x ≤ r ,− r ≤ y ≤ r No Independientes Modelos Multivariantes 52 Esperanza de g(X,Y) (a ) Si X, Y son variables aleatorias discretas, se define esperanza de la función g ( X , Y ) como : x =∞ y =∞ E[g(X,Y)] = g ( x, y ) P ( X = x, Y = y ) x = −∞ y = −∞ (b) Si X, Y son variables aleatorias continuas, se define esperanza de la función g ( X , Y ) como : E[g(X,Y)] = ∞ ∞ −∞ −∞ g ( x, y ) f XY ( x, y )dxdy 53 Modelos Multivariantes Propiedades de E[g(X,Y)] Si g(X, Y) = g1(X) + g 2(Y ) se cumple E[g1(X) + g 2(Y)] = ∞ ∞ = ∞ ∞ ( g (x) + g 2(y)) f XY ( x, y )dxdy −∞ −∞ 1 ∞ ∞ g (x) f XY ( x, y )dxdy + g 2(y) f XY ( x, y )dxdy −∞ −∞ 1 −∞ − ∞ ∞ ∞ ∞ g1 ( x) f XY ( x, y ) dy dx + g 2 ( y ) f XY ( x, y )dx dy −∞ − ∞ − ∞ − ∞ = ∞ = ∞ −∞ g1 ( x) f X ( x)dx + ∞ −∞ g 2 ( y ) fY ( y )dy = E[ g1 ( X )] + E[ g 2 (Y )] Ejemplo E[X + Y] = E[X] + E[Y] Modelos Multivariantes 54 Covarianza La covarianza de dos variables aleatorias X, Y , se denota por Cov(X,Y) y se define como : Cov(X,Y) = E[(X − μ X )(Y − μY )] ∞ ∞ = −∞ −∞ (x − μ X )(y − μY ) f ( x, y )dxdy donde μ X = E[X] y μY = E[Y]. Si las v.a' s son discretas : Cov(X,Y) = E[(X − μ X )(Y − μY )] = (xi − μ X )(y j − μY )P ( X = xi , Y = y j ) i j 55 Modelos Multivariantes Propiedades de la covarianza La covarianza es una medida de la dependencia lineal entre las dos variables. Si las variables son independientes, Cov(X,Y)=0 ∞ ∞ −∞ −∞ (x − μ X )(y − μY ) f ( x, y )dxdy ∞ ∞ = −∞ − ∞ (x − μ X )(y − μY )f X ( x) f Y ( y )dxdy Cov(X,Y) = ∞ ∞ = −∞ (x − μ X )f X ( x )dx −∞ (y − μY )f Y ( y )dy = 0 Propiedades • Cov(X,Y)=E[XY] - E[X]E[Y] •Var (X+Y) = Var(X) + Var(Y) + 2 Cov(X,Y) Modelos Multivariantes 56 Medias y Matriz de Varianzas X, Y dos variables aleatorias con función de densidad conjunta f (x,y) X : f X ( x) → µ X = E[ X ], σ X2 = Var[ X ] σ Y2 = Var[Y ] Y : f Y ( y ) → µY = E[Y ], σ XY = Cov( X , Y ) Vector aleatorio X U = ; Y Vector de medias µ E [U ] = X µY Matriz σ Var [U ] = σ XY 2 X de varianzas σ XY σ Y2 57 Modelos Multivariantes Correlación Se define coeficiente de correlación ρ entre dos variables aleatorias X, Y como ρ(X,Y) = Cov ( X , Y ) . Var ( X ) Var (Y ) Propiedades • -1 ≤ ρ(X,Y) ≤ +1 • Si X e Y son independientes, entonces ρ(X,Y) = 0. • Y = a + b X ⇔ ρ(X,Y) = 1 (b>0) o ρ(X,Y) = -1 (b<0) Modelos Multivariantes 58 n variables aleatorias Para calcular probabilidades de un suceso en el que intervienen variables aleatorias X1, X2, ..., Xn es preciso conocer la distribución de probabilidad conjunta de todas ellas. Si las variables son continuas se emplea la función de densidad conjunta X1 X2 X= ⋮ X n f X (x1 ,x 2 ,..., x n ) 59 Modelos Multivariantes Vector de variables aleatorias X = ( X 1 , X 2 ,..., X n ) → Conjunto (vector) de n v.a. continuas Su distribución de probabilidad viene determinada por su función de densidad conjunta : f X ( x1 , x2 ,..., xn ) o por la función de distribución conjunta FX ( x1 , x2 ,..., xn ). FX ( x1 , x2 ,..., xn ) = xn xn−1 −∞ −∞ Modelos Multivariantes x1 ⋯ f X (t1 , t 2 ,..., t n )dt1dt 2 ⋯ dt n −∞ 60 Distribuciones marginales X = ( X 1 , X 2 ,..., X n ) → Conjunto (vector) de n v.a. continuas La función de densidad marginal de X i , f i ( xi ), f i ( xi ) = ∞ ∞ −∞ −∞ ⋯ ∞ f ( x , x ,..., xn )dx1dx2 ⋯ dxn −∞ X 1 2 Todas menos xi La función de densidad marginal de ( X i , X j ), f ij ( xi , x j ), f ij ( xi , x j ) = ∞ ∞ −∞ −∞ ∞ ⋯ f X ( x1 , x2 ,..., xn )dx1dx2 ⋯ dxn −∞ Todas menos xi y xj Modelos Multivariantes 61 Esperanza Esperanza de g( X) = g ( X1, X 2 ,..., X n ) E[ g ( X)] = −∞∞ −∞∞ ⋯ −∞∞ g ( x1, x2 ,..., xn ) f X ( x1, x2 ,..., xn )dx1dx2 ⋯ dxn Es fácil demostrar : E[ X i ] = −∞∞ −∞∞ ⋯ −∞∞ xi f X ( x1, x2 ,..., xn )dx1dx2 ⋯ dxn = −∞∞ xi f i ( xi ) dxi E[ g ( X1, X 2 )] = −∞∞ −∞∞ ⋯ −∞∞ g ( x1, x2 ) f X ( x1, x2 ,..., xn )dx1dx2 ⋯ dxn = −∞∞ −∞∞ g ( x1, x2 ) f12 ( x1, x2 )dx1dx2 Modelos Multivariantes 62 Vector de Medias y Matriz de Varianzas X = ( X 1 , X 2 ,..., X n )T , → Vector de n variables aleatorias µ1 µ1 = E[ X 1 ] µ 2 µ 2 = E[ X 2 ] E[ X] = → ⋮ ⋮ µ µ = E[ X ] n n n σ 12 σ 12 ⋯ σ 1n σ 12 σ 22 ⋯ σ 2n Var ( X i ) = σ i2 → = Var [ X] = σ ij i ≠ j ⋮ ⋮ ⋱ ⋮ Cov( X i , X j ) σ 2 1n σ 2n ⋯ σ n Modelos Multivariantes 63 Independencia Las variables aleatorias X 1,X 2 ,..., X n son independientes si y sólo si f(x1,x2 ,..., xn ) = f1(x1 )f 2(x2 )⋯ f n(xn ). Modelos Multivariantes 64 Transformaciones Lineales X = ( X 1 , X 2 ,..., X n )T , → Vector de n variables aleatorias a = ( a1 , a2 ,..., an )T , → Vector de n constantes Y = a1 X 1 + a2 X 2 + ⋯ + an X n = a T X E[Y ] = a T E[ X] = a1µ1 + a2 µ 2 + ⋯ + an µ n σ 12 σ Var [Y ] = a T Var [ X ] a = (a1 a2 ⋯ an ) 12 ⋮ σ 1n σ 12 σ 22 ⋮ σ 2n a1 ⋯ σ 2 n a 2 ⋱ ⋮ ⋮ ⋯ σ 2n an ⋯ σ 1n 65 Modelos Multivariantes Transformaciones Lineales Caso General X = ( X 1 , X 2 ,..., X n )T , → Vector de n variables aleatorias a11 a12 ⋯ a22 ⋯ a a = 21 ⋮ ⋮ ⋱ a m1 am 2 ⋯ Y1 a11 a12 ⋯ Y2 a21 a22 ⋯ ⋮ = ⋮ ⋮ ⋱ Y a m m1 am 2 ⋯ Var[Y ] = A Var[ X] AT a11 a = 21 ⋮ a m1 Modelos Multivariantes a12 a22 ⋮ am 2 a1n a2 n → Matriz de m × n constantes ⋮ amn a1n X 1 a2 n X 2 = AX → E[Y ] = AE[ X] ⋮ ⋮ amn X n ⋯ a1n σ 12 σ 12 ⋯ a2 n σ 12 σ 22 ⋱ ⋮ ⋮ ⋮ ⋯ amn σ 1n σ 2 n a11 ⋯ σ 2 n a12 ⋱ ⋮ ⋮ ⋯ σ 2n a1n ⋯ σ 1n a21 ⋯ am1 a22 ⋯ am 2 ⋮ ⋱ ⋮ a2 n ⋯ amn 66 Transformaciones Lineales (Independencia) X = ( X 1 , X 2 ,..., X n )T , → Vector de n variables aleatorias independie ntes a = ( a1 , a 2 ,..., a n ) T , → Vector de n constantes Y = a1 X 1 + a 2 X 2 + ⋯ + an X n σ 12 0 ⋯ 0 σ 22 ⋯ ( ) Var [Y ] = a1 a 2 ⋯ a n ⋮ ⋱ ⋮ 0 0 ⋯ = a12σ 12 + a22σ 22 + ⋯ + an2σ n2 0 a1 0 a 2 ⋮ ⋮ σ n2 a n 67 Modelos Multivariantes Ejemplo: Calcular la media y la varianza de la suma de 12 variables aleatorias independientes con distribución uniforme en (0,1) U1 U2 U = , U i → Uniforme(0,1) ⋮ U 12 Y = U1 + U 2 + ⋯ + U12 E[U i ] = 1 / 2 Var[U i ] = 1 / 12 Cov(U i ,U j ) = 0 12 E[Y ] = E[U i ] =6 i =1 12 Var[Y ] = Var[U i ] =1 i =1 Modelos Multivariantes 68 Ejemplo Se dispone de n sobres con sus correspondientes cartas. Se extraen las cartas de los sobres, se sortean y se vuelven a introducir de forma aleatoria cada una en un sobre. ¿Cuál es el número esperado de cartas que coinciden con su sobre inicial? X ≡ Número de coincidencias X = X1 + X 2 + ⋯ + X n 0, Si la carta i no coincide con su sobre inicial Xi = 1, Si la carta i sí coincide con su sobre inicial E[ X ] = E[ X 1 ] + E[ X 2 ] + ⋯ + E[ X n ] = 1 1 1 + + ⋯ + = 1. n n n 69 Modelos Multivariantes Media de n variables aleatorias independientes X = ( X 1 , X 2 ,..., X n )T , → Vector de n variables aleatorias independie ntes E[ X 1 ] + E[ X 2 ] + ⋯ + E[ X n ] = [ ] E X n X1 + X 2 + ⋯ + X n X = n Var[ X 1 ] + Var[ X 2 ] + ⋯ + Var[ X n ] = [ ] Var X n2 Si las variables tienen la misma media y varianza μ = E[X i ] ∀i σ 2 = Var[X i ] ∀i E[ X ] = µ X1 + X 2 + ⋯ + X n X = σ2 n Var[ X ] = n Modelos Multivariantes 70 Capı́tulo 2: Ejercicios propuestos 1. Dada la variable aleatoria discreta X, cuya función de probabilidad viene definida por P (X = x) = kx, x = 1, 2, ..., 5 (a) Calcular el valor de la constante k (b) Calcular P (X > 2) (c) Calcular E[X] y V ar[X]. (d) Calcular E[Y ] si Y = 2X + 5 2. Dada la variable aleatoria X, cuya función de densidad es f (x) = k(1 − x2 ), si 0 < x < 1 0, en el resto (a) Obtener k. (b) Dibujar la función de densidad. (c) Calcular la probabilidad P (X < 0.3). (d) Obtener la media y la varianza de X. (e) Obtener la media y la varianza de la variable Y = 3X − 1. (f) Obtener la media y la varianza de la variable Z = 3X 2 . 3. Un modelo que habitualmente se utiliza en balı́stica para comprobar la correcta calibración de las armas es x x2 f (x) = 2 exp − 2 , x ≥ 0, σ ≥ 0, σ 2σ donde la variable aleatoria X es la distancia del punto de impacto del proyectil al centro del blanco al que iba dirigido y σ es el parámetro que mide la precisión. Si para una distancia determinada de disparo la precisión del arma es σ = 10 cm, (a) ¿Cuál es la probabilidad de que un impacto esté a una distancia menor o igual de 5 cm del centro? (b) Calcular la función de distribución. (c) ¿Cuál es la probabilidad de que al lanzar 10 proyectiles, ninguno haya impactado a una distacia menor de 5 cm del centro del blanco? (d) ¿Cuál es la probabilidad de que al lanzar 10 proyectiles, todos hayan impactado a una distacia menor de 5 cm del centro del blanco? 4. Un gran almacén guarda cajas que contienen piezas de distinto tipo. La proporción X de piezas de tipo A en una caja se puede considerar una variable aleatoria con función de densidad: f (x) = kx(1 − x) con 0 ≤ x ≤ 1 (a) Calcular el valor de k, la media y la varianza de la variable aleatoria X. 1 (b) Si se toman 10 cajas al azar.¿Cuál es la probabilidad de que ninguna de ellas contenga una proporción de piezas de tipo A igual o superior al 75% ? 5. De acuerdo con la teorı́a cinética de los gases, la velocidad V de una molécula de masa m de un gas a la temperatura (absoluta) T es una variable aleatoria con la siguiente función de densidad: f (v) = donde α = 4 2 2 √ v 2 e−v /α , α3 π v≥0 p 2kT /m, siendo k la constante de Boltzmann. Además, √ E(V ) = 2α/ π, Var(V ) = (3/2 − 4/π)α2 (a) Calcular el valor medio de la energı́a cinética, mV 2 /2, de una molécula. ¿ A una misma temperatura T , qué gas tiene mayor valor medio de energı́a cinética, uno ligero u otro más pesado? (b) Obtener la función de densidad de la energı́a cinética de una molécula. Indicar si depende de la masa molecular. 6. Sea X una variable aleatoria con distribución uniforme en (0, 1). Calcular la probabilidad de que 2 Y > 0.8 si Y = e−X . 7. Si X es una variable aleatoria con media µ. Demostrar que cuando m = µ, E[(X − m)2 ] es mı́nima. 8. Una variable aleatoria tiene distribución uniforme en el intervalo [−a, +a]. Calcular la media, la varianza, el coeficiente de asimetrı́a y el coeficiente de apuntamiento o curtosis. 9. La variable aleatoria Z tiene como función de densidad 1 z2 f (z) = √ exp − 2 , −∞ < z < ∞, 2σ 2πσ σ>0 Obtener la función de densidad de Y = |Z| y su media. 10. Si X es una variable aleatoria con √ distribución uniforme entre 0 y θ, obtener la función de densidad de la variable aleatoria Y = + X. 11. La función de densidad de una variable aleatoria X es f (x) = 1/2, −1 < x < 1 (a) Calcular la media y la varianza de X. (b) Obtener la función de densidad de Y = X 2 . (c) Calcular la media de Y . 12. La función de distribución de la variable aleatoria X es FX (x). Obtener la función de densidad de la variable aleatoria Y = F (X). 13. Adaptar la demostración de la desigualdad de Chebychev y demostrar la desigualdad de Markov P (X > a) ≤ 1 E [X] a donde X es una variable aleatoria positiva (P (X > 0) = 1) 2 14. Se elige un punto al azar interior a la circunferencia de ecuación x2 + y 2 = r2 . Llamando Z a la variable aleatoria definida por la distancia entre el punto elegido y el centro de la circunferencia, calcular las funciones de densidad y distribución de Z. 15. Supóngase una diana circular con centro en el origen de coordenadas de radio r y X, Y las coordenadas de un punto elegido al azar (por ejemplo, el lanzamiento de un dardo). Supóngase que cualquier otro punto de la diana tiene la misma probabilidad de ser elegido. Calcule fXY (x, y) y fX (x). 16. La función de densidad de una variable aleatoria bidimensional viene dada por la expresión: fXY (x, y) = xy + cex , cuando 0 < x < 1 y 0 < y < 1 0, en el resto Indicar si son independientes las variables aleatorias X e Y . 17. La cantidad en miligramos de dos componentes contenidos en un producto es una variable aleatoria bidimensional, cuya función de densidad viene dada por la expresión fXY (x, y) = 4xy, cuando 0 ≤ x ≤ 1 y 0 ≤ y ≤ 1 0, en el resto (a) Obtener las funciones de densidad marginales. (b) Calcular la covarianza. (c) Calcular P (X + Y ≤ 0.5) (d) Calcular la probabilidad de que la cantidad del primer componentes sea menor que 0.3 miligramos cuando la del segundo es 0.8 miligramos. 18. La función de densidad de la variable aleatoria bidemendional (X, Y ), bien dada por la expresión: kxy, cuando 0 < x < y < 1 fXY (x, y) = 0, en el resto (a) Calcular el valor de k. (b) Calcular P (X < 0.5|Y = 0.5). (c) ¿Son independientes las variables aleatorias X e Y ? 19. X e Y son dos variables aleatorias continuas independientes con la misma función de distribución F . Calcular la función de densidad de U = max(X, Y). 20. Obtén la distribución de probabilidad del máximo, del mı́nimo y de la media de los resultados obtenidos al lanzar dos dados equilibrados. Se acepta que los resultados de los dados son variables aleatorias independientes. 21. X e Y son variables aleatorias con coeficiente de correlación lineal ρ = −1. Si las varianzas son iguales, calcular la varianza de Z = X + Y − 1. 3 22. La distribución de probabilidad conjunta de las variables aleatorias Y1 e Y2 es la siguiente: Y2 -1 0 1 -1 1/16 3/16 1/16 Y1 0 3/16 0 3/16 1 1/16 3/16 1/16 Calcular su coeficiente de correlación e indicar si son independientes. 23. La función de densidad conjunta de X e Y viene dada por f (x, y) = xy, 0 < x < 1, 0 < y < 2 (a) Obtener las funciones de densidad marginales y decir si X e Y son independientes. (b) Calcular P(X + Y < 1). 24. Un ordenador tarda un total de Y segundos en procesar un mensaje de correo electrónico, esta cantidad incluye el tiempo X durante el cual el mensaje está en la cola esperando a ser procesado (Y ≥ X). La función de densidad conjunta de las variables aleatorias X, Y es fX,Y (x, y) = e−y , 0≤x≤y<∞ Calcular la probabilidad de que un mensaje haya estado menos de un segundo en la cola si el tiempo total que ha durado su procesamiento ha sido mayor que dos segundos. 25. Sea X un valor elegido al azar de la distribución uniforme en el intervalo [0,1]. A continuación se toma al azar otro valor Y de la distribución uniforme [X, 1]. Calcular la función de densidad marginal de Y. 26. Sean X, Y, U y V variables aleatorias, demostrar que si Y = U + V, entonces Cov(X, Y ) = Cov(X, U ) + Cov(X, V ). 27. Dos variables aleatorias X1 e X2 tienen la misma distribución de probabilidad y son independientes. La función de densidad de Xi para i = 1, 2 es f (xi ) = e−xi , xi ≥ 0. (a) Obtener la función de densidad conjunta. (b) Se define Y2 = X1 + X2 , obtener la función de densidad de Y2 (c) Se disponen de tres variables aleatorias independientes con la misma función de densidad definida anteriormente, obtener la función de densidad de Y3 = X1 + X2 + X3 . (d) Se disponen de n variables aleatorias independientes con la misma función de densidad definida anteriormente, obtener la función de densidad de Yn = X1 + X2 + ... + Xn . (e) Calcular la media y la varianza de Yn . 4 Estadística Parte I. Probabilidad Tema 3. Modelos de Probabilidad Proceso de Bernoulli El resultado de un experimento admite dos categorías: “Aceptable” y “Defectuoso”. Se repite el experimento n veces. La probabilidad de “defectuoso” es la misma p en todos los experimentos. Los experimentos son independientes. Modelos univariantes 2 Ejemplos de procesos de Bernoulli Lanzamiento de n monedas. Resultado: cara o cruz. Se extraen piezas al azar de un sistema continuo de fabricación. Se clasifican las piezas en aceptables o no. Lanzamiento de un dado n veces. En cada lanzamiento se clasifica como 6 o distinto de 6. 3 Modelos univariantes Distribución Binomial (n,p) n Proporción defectuosas = p X = “ Nº de defectuosas al extraer n piezas” Modelos univariantes 4 Distribución binomial (n=10,p) p 4 (1 − p) 6 10 4 ↓ 10 P( X = 4) = p 4 (1 − p) 6 4 5 Modelos univariantes Distribución binomial (n,p) n P( X = k ) = p k (1 − p) n − k , k = 0, 1, 2,..., n k 0,4 (1) P(X = k) ≥ 0, ∀ k . (2) n n k =0 k p k (1 − p) n − k = 1. n =10, p=0.2 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 8 9 10 x Modelos univariantes 6 Propiedades de la dist. binomial n E[ X ] = k × P( X = k ) = np. k =0 Var[ X ] = E[ X 2 ] − E[ X ] 2 = np(1 − p) 0,08 0,06 5 0,04 n = 100, p = 0.5 0,02 0 0 20 40 50 60 80 100 7 Modelos univariantes Distribuciones binomiales 0,16 0,2 n = 25, p = 0.5 0,12 n = 25, p = 0.2 2 0,12 2.5 0,08 0,16 0,08 0,04 0,04 0 0 0 5 10 12.5 15 20 25 x 0,08 55 10 15 20 25 x 0,1 n = 100 , p = 0.5 0,06 0 0,08 n = 100, p = 0.2 0,06 5 0,04 4 0,04 0,02 0,02 0 0 0 20 40 50 60 x Modelos univariantes 80 100 0 2020 40 60 80 100 x 8 Ejemplo Un contrato estipula la compra de componentes en lotes grandes que deben contener un máximo de 10% de piezas con algún defecto. Para comprobar la calidad se toman 11 unidades y se acepta el lote si hay como máximo 2 piezas defectuosas. ¿Es un buen procedimiento de control? Sea p la proporción de piezas en un lote, X ≡ Número de defectuosas en la muestra P(Aceptar) = P(X ≤ 2) 11 11 11 = p 0 (1 − p )11 + p 1 (1 − p )10 + p 2 (1 − p ) 9 0 1 2 p 5% 10% 15% 20% 25% P( Aceptar ) 0.985 0.910 0.779 0.617 0.45 9 Modelos univariantes Distribución binomial P1 P2 Q1 x Si = = = = dbinom(27,size=50,prob=0.5) # o P1=dbinom(10,50,.5) pbinom(27,size=50,prob=0.5) qbinom(.95,size=50,prob=0.5) rbinom(5,size=50,prob=0.5) es una variable con distribición binomial de parámetros = 50 y = 0.5, 1 = ( = 27), 2= ≤ 27 , y Q1 es el valor tal que ( ≤ 1) = 0.95 es un vector con 5 valores generados al azar de X. ## [1] 25 26 26 22 32 Modelos univariantes 10 Distribución binomial k=0:50 pk = dbinom(k,size=50,prob=0.5) plot(k,pk,col='blue',type='h',lwd=2,main='dbinom(n=50,p=0.5)') Modelos univariantes 11 Ejemplo: control de procesos Las piezas de un proceso de fabricación pueden ser aceptables o defectuosas. Cuando el proceso está bajo control, el porcentaje de piezas defectuosas fabricadas es 3%. De la producción de cada hora se toma una muestra de 200 piezas al azar. 1. El ingeniero de calidad decide que si el número de defectuosas en la muestra es 8 o más, se detenga el proceso y se analice si está bajo control. ¿Cuál es la probabilidad de parar el proceso de manera injustificada? 2. Calcular la probabilidad de parar el proceso, cuando está fabricando con un porcentaje de defectuosas del 5%. 3. Calcular la probabilidad de no detener el proceso si está fabricando un 6% de piezas defectuosas. 4. Repetir el cálculo del apartado 3 para p (porcentaje de defectuosas) entre 1% y 10%. Dibujar las probabilidades en función de p. Modelos univariantes 12 Solución 1. P1 = pbinom(8,200,0.03) igual a 0.8504038 2. P2 = 1- pbinom(8,200,0.05) igual a 0.6729755 3. P3 = pbinom(8,200,0.06) igual a 0.1469911 4. px = seq(0.01,0.10,0.005) P3 = 1 - pbinom(8,200,px) plot(px,P3,type='l',col='red', main=‘Prob de detener proceso') 13 Modelos univariantes Distribución Geométrica (p) Y n Proporción defectuosas = p Y = “Piezas extraídas hasta que aparezca una defectuosa” Modelos univariantes 14 Distribución geométrica (p) p (1-p)p (1-p)2p ↓ (1-p)k-1p 1 2 3 ↓ ... k P( X = k ) = (1 − p) k −1 p, k = 1,2,3,... 15 Modelos univariantes Propiedades de la v.a. geométrica E[Y ] = 1 , p Var[Y ] = 1− p p2 0,3 0,25 0,2 p=0.3 0,15 0,1 0,05 0 0 Modelos univariantes 4 8 12 16 20 16 Distribución Geométrica p1 p2 q1 x = = = = dgeom(6, prob=0.10) pgeom(6, prob=0.10) qgeom(.90, prob=0.10) rgeom(5, prob=0.10) Si es una variable con distribición geométrica de parámetro 1= = 6 = 0.0531441, p2 = ≤ 6 = 0.5217031, y q1 es el valor tal que = 0.10, ≤ 1 = 0.90 → 1 = 21 es un vector con 5 valores generados al azar de X. ## [1] 11 21 2 3 64 Modelos univariantes 17 Distribución Geométrica k=0:40 pk=dgeom(k,prob=0.10) plot(k,pk,type='h',col='red',lwd=3,main='d geom(p=0.10)') Modelos univariantes 18 Distribución de Poisson Número de defectos aparecidos en tramos de longitud fija de hilos de cobre. Número de partículas por centímetro cúbico en líquidos con sustancias en suspensión. Emisiones radiactivas: número de partículas emitidas en intervalos de tiempo fijo. Número de llamadas a una centralita de teléfonos en un día Modelos univariantes 19 Distribución de Poisson Ejemplo: Fabricación continua de conductor de cobre. λ ≡ Número medio de defectos cada 100 m X ≡ Número de defectos en un tramo de 100 m Modelos univariantes 20 Límite de la dist. binomial n PX ( x ) = p x (1 − p ) n − x , x p= x n! λ λ PX ( x ) = lim 1 − n n → ∞ ( n − x )! x! n λ n n− x n λx n ( n − 1) ⋯ ( n − x + 1) λ λ − = − 1 1 lim x! n → ∞ n n nx → e −λ →1 = λx x! e−λ , −x →1 x = 0 ,1, 2 ,... 21 Modelos univariantes Distribución de Poisson P( X = x) = λx x! e −λ , x = 0,1,2,.. 2,5000E-01 2,0000E-01 λ=3 1,5000E-01 1,0000E-01 5,0000E-02 0,0000E+00 0 Modelos univariantes 2 4 6 8 10 12 14 16 22 Media y Varianza P ( X = x) = ∞ λx x! E[ X ] = x × x=0 = λe E[ X ] = λ −λ e −λ , λx x! ∞ e −λ x = 0 ,1, 2 ,... ∞ λx x =1 x! = x× λ x −1 x =1( x − 1)! e −λ =λ eλ Var [ X ] = λ Modelos univariantes 23 Ejemplo Una fuente radiactiva emite partículas según un proceso de Poisson de media 10 partículas por minuto. Se desea calcular: Probabilidad de 5 partículas en un minuto Probabilidad de 0 partículas en un minuto Probabilidad de más de 5 partículas en un minuto. Probabilidad de 30 o menos partículas en 5 minutos. Modelos univariantes 24 Ejemplo Poisson 105 = 0.0378 1. P ( X = 5) = e 5! 2. P ( X = 0) = e −10 = 4.54 ×10 −5. 3. P( X > 5) = 1 − P ( X ≤ 5) −10 5 10 x = 1− e = 0.933. ! x x =0 4. Y ≡ Nº de partículas en 5 minutos λ ' = 5 ×10 = 50 −10 P (Y ≤ 30) = e −50 30 50 x = 0.0016 x = 0 x! 25 Modelos univariantes Ejemplo Poisson 1. p1 = dpois(5, lambda = 10) = 3.783327e-02 2. p2 = dpois(0, lambda = 10) = 4.539993e-05 3. p3 = 1 - ppois (5, 10) 4. p4 = ppois(30,lambda=50) Modelos univariantes = 0.932914 = 1.594027e-03 26 Poisson de media 10 k=0:30 pk=dpois(k,lambda=10) plot(k,pk,type='h',col='blue',lwd=3,main='dpois(lambda=10)') 27 Modelos univariantes Distribución Exponencial T t1 t2 t3 t4 t5 t6 t7 Ejemplo: Fabricación continua de conductor de cobre. λ ≡ Número medio de defectos cada 100 m T ≡ “Distancia entre dos defectos consecutivos” Modelos univariantes 28 Distribución Exponencial T≥ t 0 t P(T ≥ t ) = P {0 defectos en el intervalo [0, t)} = e −λt , t ≥ 0 FT (t ) = P(T ≤ t ) = 1 − e −λt , t ≥ 0 fT (t ) = λe −λt , t ≥ 0. 29 Modelos univariantes Función de densidad Propiedades (Exponencial) fT (t ) = λe − λt , t ≥ 0. 0,1 0,08 0,06 λ = 0.1 0,04 0,02 0 0 10 20 30 40 50 60 T ∞ E[T ] = t fT (t )dt ∞ −∞ −λt = λte 0 Modelos univariantes dt = 1 λ Var[T ] = E[T 2 ] − E[T ]2 ∞ = λt 2e −λt dt − 0 1 λ2 = 1 λ2 . 30 Ejemplo distribución exponencial Una fuente radiactiva emite partículas según un proceso de Poisson de media 10 partículas por minuto. Se desea calcular: Tiempo medio entre partículas Calcula la función de densidad del tiempo en segundos entre dos partículas y dibújala Probabilidad de que aparezca la primera partícula antes de 4 segundos Probabilidad de un minuto sin partículas. 31 Modelos univariantes Ejemplo distribución exponencial (sol.) 1. = 10 ,→ = ! " = 0.1 1 & 2. $% & = exp − , & > 0 6 6 3. 4. =6 # 2 1 & 1 - ≤ 4 = . exp − /& = 1 − 0 3 = 0.486582 6 4 6 2 34 - > 60 = 1 − . 4 Modelos univariantes 1 & exp − /& = 0 1!4 = 4.54 × 1017 6 6 32 Ejemplo distribución exponencial 1. Rate = 10 part/min = 10 part/60 s= 1/6 part/s 2. t=seq(0,35,.01) ft = dexp(t,rate = 1/6) plot(t,ft,col='red',lwd='2',type='l') 3. p3 = pexp(4,1/6) = 0.4865829 4. p4 = 1- pexp(60,1/6) = 4.539993e-05 33 Modelos univariantes Distribución Normal: Campana de Gauss σ µ 1 x − µ 2 1 f X ( x) = exp− , x ∈ ℜ σ 2 2π σ Modelos univariantes 34 Medidas Características X → N (µ ,σ ) σ µ Var[ X ] = σ 2 E[ X ] = µ E[( X − µ )3 ] = 0 CA = Asimetría = E[( X − µ ) 4 ] = 3σ 4 E[( X − µ )3 ] σ 3 =0 CAp = Curtosis = E[( X − µ ) 4 ] σ 4 =3 35 Modelos univariantes 0.6 8 σ µ-σ µ 0.95 5 µ2σ Modelos univariantes µ +2σ µ+σ 0.997 µ3σ µ +3σ 36 Normal Estándar Z → N (0,1) 1 0 1 −z2 / 2 f Z ( z) = e , z ∈ℜ 2π z Φ( z ) = −∞ 1 −t 2 / 2 e dt 2π TABLAS 37 Modelos univariantes Estandarización X → N (µ ,σ ) P( X ≤ a) = P( X −µ σ Z= ≤ X −µ a−µ σ N(µ,σ) σ → N (0,1) ) = P( Z ≤ a−µ σ ) = Φ( a−µ σ ). N(0,1) µ a P( X ≤ a) Modelos univariantes P(Z ≤ z ) z = (a-µ)/σ 38 z TABLA Normal Estándar P (Z ≤ z) N(0,1) z Ejemplo. P ( Z ≤ 1.96) = 0.9750 0 .5000 .5398 .5793 .6179 .6554 .6915 .7257 .7580 .7881 .8159 .8413 .8643 .8849 .9032 .9192 .9332 .9452 .9554 .9641 .9713 .9772 .9821 .9861 .9893 .9918 .9938 .9953 .9965 .9974 .9981 .9987 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 0,01 .5040 .5438 .5832 .6217 .6591 .6950 .7291 .7611 .7910 .8186 .8438 .8665 .8869 .9049 .9207 .9345 .9463 .9564 .9649 .9719 .9778 .9826 .9864 .9896 .9920 .9940 .9955 .9966 .9975 .9982 .9987 0,02 .5080 .5478 .5871 .6255 .6628 .6985 .7324 .7642 .7939 .8212 .8461 .8686 .8888 .9066 .9222 .9357 .9474 .9573 .9656 .9726 .9783 .9830 .9868 .9898 .9922 .9941 .9956 .9967 .9976 .9982 .9987 0,03 .5120 .5517 .5910 .6293 .6664 .7019 .7357 .7673 .7967 .8238 .8485 .8708 .8907 .9082 .9236 .9370 .9484 .9582 .9664 .9732 .9788 .9834 .9871 .9901 .9925 .9943 .9957 .9968 .9977 .9983 .9988 0,04 .5160 .5557 .5948 .6331 .6700 .7054 .7389 .7704 .7995 .8264 .8508 .8729 .8925 .9099 .9251 .9382 .9495 .9591 .9671 .9738 .9793 .9838 .9875 .9904 .9927 .9945 .9959 .9969 .9977 .9984 .9988 0,05 .5199 .5596 .5987 .6368 .6736 .7088 .7422 .7734 .8023 .8289 .8531 .8749 .8944 .9115 .9265 .9394 .9505 .9599 .9678 .9744 .9798 .9842 .9878 .9906 .9929 .9946 .9960 .9970 .9978 .9984 .9989 0,06 .5239 .5636 .6026 .6406 .6772 .7123 .7454 .7764 .8051 .8315 .8554 .8770 .8962 .9131 .9279 .9406 .9515 .9608 .9686 .9750 .9803 .9846 .9881 .9909 .9931 .9948 .9961 .9971 .9979 .9985 .9989 0,07 .5279 .5675 .6064 .6443 .6808 .7157 .7486 .7794 .8078 .8340 .8577 .8790 .8980 .9147 .9292 .9418 .9525 .9616 .9693 .9756 .9808 .9850 .9884 .9911 .9932 .9949 .9962 .9972 .9979 .9985 .9989 0,08 .5319 .5714 .6103 .6480 .6844 .7190 .7517 .7823 .8106 .8365 .8599 .8810 .8997 .9162 .9306 .9429 .9535 .9625 .9699 .9761 .9812 .9854 .9887 .9913 .9934 .9951 .9963 .9973 .9980 .9986 .9990 0,09 .5359 .5753 .6141 .6517 .6879 .7224 .7549 .7852 .8133 .8389 .8621 .8830 .9015 .9177 .9319 .9441 .9545 .9633 .9706 .9767 .9817 .9857 .9890 .9916 .9936 .9952 .9964 .9974 .9981 .9986 .9990 39 Modelos univariantes P (Z N(0,1) ≤ z ) z z 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 0,00 .9990323 .9993128 .9995165 .9996630 .9997673 .9998409 .9998922 .9999276 .9999519 .9999683 0,01 .9990645 .9993363 .9995335 .9996751 .9997759 .9998469 .9998963 .9999305 .9999538 .9999696 Modelos univariantes 0,02 .9990957 .9993590 .9995499 .9996868 .9997842 .9998527 .9999004 .9999333 .9999557 .9999709 0,03 .9991259 .9993810 .9995657 .9996982 .9997922 .9998583 .9999042 .9999359 .9999575 .9999721 0,04 .9991552 .9994023 .9995811 .9997091 .9997999 .9998636 .9999080 .9999385 .9999592 .9999733 0,05 .9991836 .9994229 .9995959 .9997197 .9998073 .9998688 .9999116 .9999409 .9999609 .9999744 0,06 .9992111 .9994429 .9996102 .9997299 .9998145 .9998739 .9999150 .9999433 .9999625 .9999755 0,07 .9992377 .9994622 .9996241 .9997397 .9998215 .9998787 .9999184 .9999456 .9999640 .9999765 0,08 .9992636 .9994809 .9996375 .9997492 .9998282 .9998834 .9999216 .9999478 .9999655 .9999775 0,09 .9992886 .9994990 .9996505 .9997584 .9998346 .9998878 .9999247 .9999499 .9999669 .9999784 40 Ejemplo (Normal) La longitud X de ciertos tornillos es una variable aleatoria con distribución normal de media 30 mm y desviación típica 0.2 mm. Se aceptan como válidos aquellos que cumplen 29.5 ≤ X ≤ 30.4. 2. Proporción de tornillos no aceptables por cortos. Proporción de tornillos no aceptables por largos. 3. Proporción de tornillos válidos. 1. 41 Modelos univariantes Ejemplo (Solución2) X → N (30, 0.2) Z= X −µ σ → N (0,1) X − 30 29.5 − 30 ≤ ) 0 .2 0.2 = P ( Z ≤ −2.5) = Φ (−2.5) = 0.0062 1. P ( X ≤ 29.5) = P ( 0.0062 0.9938 0.0062 -2.5 Tablas 2.5 Modelos univariantes 42 Ejemplo (Solución) X − 30 30.4 − 30 ) ≤ 0 .2 0 .2 = P ( Z ≤ 2) = Φ (2) = 0.9772 P ( X > 30.4) = 1 − 0.9772 = 0.0228 2. P ( X ≤ 30.4) = P ( 29.5 − 30 X − 30 30.4 − 30 ≤ ≤ ) 0.2 0.2 0.2 = P (−2.2 ≤ Z ≤ 2) 3. P (29.5 ≤ X ≤ 30.4) = P ( = Φ (2) − Φ (−2.2) = 0.9772 − 0.0062 = 0.9710 Modelos univariantes 43 Ejemplo (Solución R) 1. p1 = pnorm(29.5, mean = 30, sd = 0.2) = 0.006209665 2. p2 = 1- pnorm(30.4, mean = 30, sd = 0.2) = 0.022750132 3. p3 = pnorm(30.4, mean = 30, sd = 0.2)- pnorm(29.5, mean = 30, sd = 0.2) = 0.97104 Modelos univariantes 44 Teorema Central del Límite Sean variables aleatorias !, 8, … , independientes con media µ y desviación típica σ, entonces cuando n tiende a infinito X1 + X 2 + ⋯ + X n σ2 → N (µ , ) X= n n Válido en muchos casos prácticos para n pequeños Modelos Multivariantes 45 Teorema Central del Límite Sea X 1,X 2 ,...,X n una secuencia de variables aleatorias independientes con la misma distribución de probabilidad de media µ y varianza σ 2 < ∞. Entonces X −µ ≤ t = Φ (t ), − ∞ < t < ∞ lim P n →∞ σ / n donde X = ( X 1 + X 2 + ⋯ + X n ) / n y 1 t −x2 / 2 e dx −∞ 2π es la función de distribución de la normal estándar. Φ (t) = Modelos Multivariantes 46 Aplicación: Media de 12 “Uniformes” Se lanza 12 veces la ruleta circular que aparece en la figura. Se calcula la media de los doce valores. 0 x (a) Genera por simulación 12 valores y obtén la media (b) Repite el experimento anterior cuatro veces más y proporciona los valores medios obtenidos 0.25 0.75 (c) Repite el experimento anterior 10000 veces y dibuja el histograma 0.50 (d) Analiza teóricamente el experimento y determina la distribución de probabilidad de la media de 12 variables aleatorias independientes con distribución uniforme en [0,1] Modelos univariantes 47 Simulaciones de 12 uniformes Medias ## ## [1] 0.720904 0.875773 0.760982 0.886125 0.456481 0.166372 0.325095 [8] 0.509224 0.727705 0.989737 0.034535 0.152373 0.55044 s2=runif(12) ## ## [1] 0.735685 0.001136 0.391203 0.462494 0.388144 0.402485 0.1789636 [8] 0.951658 0.453728 0.326752 0.965415 0.707481 0.49709 s3=runif(12) ## ## [1] 0.644542 0.389828 0.698543 0.544057 0.226467 0.484557 0.793007 [8] 0.005987 0.187712 0.681833 0.370104 0.361625 0.44902 s4=runif(12) ## ## [1] 0.868795 0.904155 0.617425 0.134032 0.782193 0.429199 0.927274 [8] 0.773243 0.259681 0.321225 0.060195 0.043456 0.51007 s5=runif(12) ## ## [1] 0.055053 0.625542 0.964470 0.827302 0.315028 0.213025 0.732496 [8] 0.499241 0.729772 0.080336 0.435530 0.236580 0.47619 s1=runif(12) Modelos univariantes 48 Simulaciones y distribución de las medias x Media 0.5 49 Modelos univariantes Simulación de 10000 medias e histograma x = matrix(runif(120000),10000,12) con número aleatorios con dist. unif. m= rowMeans(x) hist(rowMeans(x),nclass=50,col='light ='Media de 12 v.a. U[0,1]') Modelos univariantes # crea una matriz de dimensión 10.000 x 12 [0,1] # calcula las medias de las 10.000 filas blue',xlab='Media',xlim=c(0,1),prob=T,main 50 Aplicación Teorema Central del Límite (media de 12 V.A. con dist. Uniforme [0,1]) := = : == ?@A : = ?@A ! ! + + 8 8 ! + +⋯+ 12 +⋯+ 12 !8 8 + ⋯+ 12 !8 = = ?@A = !8 = += 8 + ?@A 8 ! ! = 1 > 2 + ⋯+ = 12 ?@A !8 + ⋯ + ?@A 128 : ~D 0.5, = = 1 12 1B + 1B + ⋯ + 1B 2 2 2=1 2 12 !8 = 1B + 1B + ⋯ + 1B 12 12 12 = 1 8 12 128 1 12 51 Modelos univariantes Media y Varianza de Uniforme [0,1] = 1,5 ! =. / = E 1 ?@A 0,5 0 -0,2 0 0,2 0,4 0,6 0,8 x Modelos Multivariantes 1 1,2 == 8 2 F 1 0 1 = 2 − =[ ]8 ! I 1 1 8 8 = =. / = F = 3 3 E 0 8 1 1 1 ?@A = − = 3 2 12 8 52 Aplicación Teorema Central del Límite (media de 12 V.A. con dist. Uniforme [0,1]) x = matrix(runif(120000),10000,12) con número aleatorios con dist. unif. m= rowMeans(x) hist(rowMeans(x),nclass=50,col='light ='Media de 12 v.a. U[0,1]') # crea una matriz de dimensión 10.000 x 12 [0,1] # calcula las medias de las 10.000 filas blue',xlab='Media',xlim=c(0,1),prob=T,main x1 = seq(0,1,.005) lines(x1,dnorm(x1,mean=0.5,sd=1/12),col='red',lwd=2) Modelos univariantes 53 Modelos univariantes 54 2. Aplicación Teorema Central del Límite Binomial como suma de variables aleatorias Proporción de defectuosas p Extraigo una pieza con reposición 0, KL0 &@MN0 =J 1, O0$0L&PQR@ J Repito el experimento n veces, llamo 1* , , !, 8, … , 0 1 El número de piezas defectuosas en la muestra de n es igual a S Y ->Binomial ! ; 8 ; ⋯; 55 Modelos univariantes 2. Aplicación Teorema Central del Límite Binomial como suma de variables aleatorias El número de piezas defectuosas en la muestra de n es igual a S ! ; 8 ; ⋯; ?@A 1* E[Y]= E[ = 0× 1* = 8 *= ; 18 × * 8 ! ; Var[Y]=Var[ Modelos univariantes ! 8 ; ;1× 8 ; ⋯; 8 08 × 1* ; ⋯; ] ] 1* 56 2. Aplicación Teorema Central del Límite Binomial como suma de variables aleatorias Proporción de defectuosas p Extraigo n piezas con reposición 0 1* 0, 1, 1 El número de piezas defectuosas en la muestra de n es igual a S ! ; 8 ; ⋯; J Y tiene distribución Binomial (n, p) Y tiende a distribución normal T U, V ~W UV, UV X * V 57 Modelos univariantes Aproximación Binomial-Normal n=25, p=1/2 0.18 0.16 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0 1 Modelos Multivariantes 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 58 Aproximación Binomial-Normal n = 50, p=0.5 0.12 0.1 0.08 0.06 0.04 0.02 0 0 5 10 15 20 25 30 35 40 45 Modelos Multivariantes 50 59 Corrección por continuidad Binomial: P(X ≤ 10) Normal: P(X ≤ 10.5) Modelos Multivariantes 60 Corrección por continuidad Normal: P(X ≤ 10.5) Binomial: P(X ≤ 10) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 61 Modelos Multivariantes Se ha tomado una muestra de 45 piezas de un proceso que fabrica un promedio de 25% de piezas fuera de especificación. 1.¿Cuál es la probabilidad de que en la muestra haya exactamente 13 elementos defectuosos? Cálculo exacto: X → Binomial(n = 45 , p = 0 .25 ) 45 P(X = 13 ) = 0 .25130 .7532 = 0 .110 13 Aproximación Normal: Y → N( 11 .25 , 2 .9 ) P(X = 13 ) = P( 12 .5 ≤ Y ≤ 13 .5 ) = 0 .1142 2. ¿Cuál es la probabilidad de que la muestra contenga 13 o más piezas defectuosas? E : P(X ≥ 13 ) = P(X = 13 ) + P(X = 14 ) + ⋯ + P(X = 45 ) = 0 .325 A : P(Y ≥ 12 .5 ) = 1 - Φ ( Modelos Multivariantes 12 .5 - 11 .25 ) = 1 − Φ( 0 .4310 ) = 0 .333 2 .9 62 3. Aplicación teorema central del límite Aprox. de la distribución de Poisson Ejemplo: Fabricación continua de conductor de cobre. λ ≡ Número medio de defectos cada 100 m 100 m Dividimos los 100 metros en 100 tramos de 1 metro, sea ! el número de defectos en el primer metro, 8 el número de defectos en el segundo metro, y así sucesivamente. X ≡ Número de defectos en un tramo de 100 m Y = YX + YZ + ⋯ + YX[[ ~\]^__]U(`) 63 Modelos univariantes 3. Aplicación teorema central del límite Aprox. de la distribución de Poisson 100 m X ≡ Número de defectos en un tramo de 100 m = ! + 8 + ⋯+ !44 = "⁄!44 E[ ] = "⁄!44 , ?@A =[ ] = =[ Var[ ] = ?@A[ !] + =[ !] + 8] ?@A[ ~D( , Modelos univariantes + ⋯ + =[ 8] + !44 ] = ⋯ + ?@A[ ) !44 ] = 64 Binomial-Poisson-Normal Binomial n,p n→∞ p → 1/ 2 µ = np σ = np (1 − p ) n → ∞, p → 0 λ = np Poisson λ λ →∞ µ =λ Normal µ,σ σ= λ Modelos Multivariantes 65 Aplicación a Control de Recepción Modelos Multivariantes 66 Plan de muestreo simple por atributos Una compañía recibe lotes con un gran número de piezas. Según el contrato cada lote debe tener como máximo una proporción de piezas defectuosas igual pA (AQL). Un plan de muestreo simple por atributos consiste en determinar n: número de piezas muestreadas c: número máximo de piezas defectuosas en la muestra De forma que si X es el número de piezas defectuosas en la muestra se aplica la siguiente regla: x ≤ c se acepta el lote x > c se rechaza el lote Modelos Multivariantes 67 Riesgos del vendedor y comprador Riesgo del vendedor: Probabilidad de rechazar un lote bueno (con porcentaje de defectuosas igual al pA (AQL)) α=P( X > c| p = pA). Riesgo del comprador: Probabilidad de aceptar un lote malo (con un porcentaje de defectuosas pR>> pA) β = P( X≤ c| p = pR). Modelos Multivariantes 68 Planteamiento del problema n Muestra Lote DATOS: OBJETIVO: pA= AQL α: Riesgo vendedor n: tamaño muestral pR = RQL β: Riesgo comprador c: máximo defectuosas 69 Modelos Multivariantes Ecuación del vendedor p ≡ Proporción de piezas defectuosa s en el lote X ≡ Número de piezas defectuosa s en una muestra de n X → Binomial ( n , p ) ≈ N ( np , np (1 − p ) ) Si p = p A α = P(X > c|p = p A ) = P( X − np A > np A (1 − p A ) c − np A ) np A (1 − p A ) = P ( Z ≥ z1−α ) Conocido α z1−α = N(0,1) c − np A np A (1 − p A ) α 0 Modelos Multivariantes z1-α 70 Ecuación del comprador Si p = p R : X − np R ≤ np R (1 − p R ) β = P(X ≤ c|p = p R ) = P( c − np R ) np R (1 − p R ) = P( Z ≤ zβ ) Conocido β z β = c − np R np R (1 − p R ) N(0,1) β zβ 0 71 Modelos Multivariantes Valores de n y c z1−α = c − np A np A (1 − p A ) z1−α n= zβ = p A (1 − p A ) − z β pR − p A c − npR npR (1 − pR ) p R (1 − p R ) 2 c = np A + z1−α np A (1 − p A ) Modelos Multivariantes 72 Lote Bueno p=pA Probabilidad de aceptar un lote bueno α npA c Lote Malo p=pR β c npR Rechazar Lote Aceptar Lote Modelos Multivariantes Probabilidad de rechazar un lote malo c 73 Ejemplo: plan de muestreo Diseñar un plan de muestreo para lotes de 10000 unidades con un AQL igual al 0.02, RQL igual a 0.08, riesgo de comprador de 0.10 y del vendedor igual al 0.05. Para α = 0.05 z1-α = 1.64 y β = 0.10 z β = −1.28 2 1.65 0.02 × 0.98 + 1.28 0.08 × 0.92 ≈ 93 n = 0 . 08 0 . 02 − c = 93 × 0.02 + 1.65 93 × 0.02 × 0.98 ≈ 4 Modelos Multivariantes 74 Plan de muestreo simple por atributos planSimple = function(pa, pr, alfa = 0.05, beta = 0.05) # # Plan de muestreo simple por atributos # # pa : AQL # pr : RQL # alfa : riesgo del vendedor # beta : riesgo del comprador # # RESULTADOS: n = tamaño de muestra # c = máximo número de piezas defectuosas para aceptar un lote { zalfa = qnorm (1-alfa ,0 ,1) zbeta = qnorm (beta, 0, 1) n = ( (zalfa*sqrt(pa*(1-pa))-zbeta*sqrt(pr*(1-pr)) )/( pr-pa ) )^2 c = n*pa + zalfa * sqrt( n*pa*(1-pa) ) n=round(n) c=round(c) names(n) = 'n' names(c) = 'c' sol = c(n,c) sol } Modelos univariantes 75 Plan de muestreo simple por atributos en R source('planSimple.R') planSimple(pa = .02, pr=0.08, alfa = 0.05, beta = 0.10) ## n ## 93 c 4 p = seq(0,.15,0.001) px = 1-pbinom(4,size=93,prob=p) plot(p,px,type='l',lwd=2,col='red', xlab='prop. defectuosas', main='Probabilidad de Rechazar Lote') Modelos univariantes 76 Distribución normal multivariante σ 12 σ 12 X1 µ1 σ 12 σ 22 X2 µ2 X = ; µ = E[ X ] = ; M = Var[ X ] = ⋮ ⋮ ⋮ ⋮ X µ σ n n 1n σ 2 n f ( x1 , x2 ,..., xn ) = 1 (2π ) n / 2 M 1/ 2 ⋯ σ 2n ⋱ ⋮ ⋯ σ n2 ⋯ σ 1n 1 exp− (x − µ )T M −1 (x − µ ) 2 x = ( x1 , x2 ,..., xn )T ∈ ℜ n µ = ( µ1 , µ 2 ,..., µ n )T ∈ ℜ n M ∈ Matriz n × n semidefinida positiva 77 Modelos Multivariantes Distribución normal bivariante f ( x1 , x2 ) = 1 2π M 1/ 2 1 x − µ exp− ( x1 − µ1 x2 − µ 2 )M −1 1 1 x2 − µ 2 2 σ 12 σ 12 σ 12 ρσ 1σ 2 = ; M = T 2 2 µ = ( µ1, µ 2 ) ∈ ℜ σ 22 σ 12 σ 2 ρσ 1σ 2 −ρ 1 2 σ1 σ 2 1 σ1 −1 2 2 2 M = σ 1 σ 2 (1 − ρ ), M = 1 (1 − ρ 2 ) − ρ σ 22 σ1 σ 2 x = ( x1, x2 )T ∈ ℜ 2 f ( x1 , x2 ) = 1 2πσ 1σ 2 x − µ 2 x − µ 2 1 2 1 1 + 2 exp− 2 σ 2 σ 2 ( 1 ) ρ − 1 2 1− ρ x − µ x − µ 2 − 2 ρ 1 1 2 σ 1 σ 2 Modelos Multivariantes 78 79 Modelos Multivariantes 2 2 2 0 0 0 -2 -2 -2 -2 0 rho= 0 2 -2 0 rho= 0.5 2 2 2 2 0 0 0 -2 -2 -2 -2 0 rho= -0.2 Modelos Multivariantes 2 -2 0 rho= -0.5 2 -2 0 rho= 0.9 2 -2 0 rho= -0.9 2 80 Propiedades Las dist. marginales son normales N(µi, σi). Las dist. condicionadas son normales. ρ=0 ⇔ Las variables son independientes Transformaciones lineales: Y = AX X es N(µ, M) Y es N(A µ, AMAT) 81 Modelos Multivariantes Ejemplo Sea la (X 1 , X 2 , X 3 ) normal tridimens ional de media (10, 20, 30) y matriz de varianzas 1 M = 0 0 0 1 0 0 0 . 4 ¿ P(X 1 + X 2 ≥ X 3 + 1 ) ? E [Y ] = 10 + 20 − 30 = 0 Y = X 1 + X 2 − X 3 → Normal Var [Y ] = Var ( X ) + Var ( X ) + Var ( X ) = 6 1 2 3 P(X 1 + X 2 ≥ X 3 + 1 ) = P(X 1 + X 2 − X 3 ≥ 1 ) = P (Y ≥ 1) = P( Y −0 ≥ 1 ) 6 6 ( = 1− Φ 1 Modelos Multivariantes 6 ) 82 Distribuciones de Probabilidad en R Cada distribución de probabilidad tiene cuatro funciones. Cada una tiene un nombre que la identifica, por ejemplo en el caso de la distribución normal, el nombre es norm. Al nombre se le añade un prefijo de una letra: p para probabilidad p=pnorm(x), = ( ≤ ) q para la inversa, q = qnorm(p) si = ( ≤ ) d para la función de densidad fx = dnorm(x) r para generar valores aleatorios x=rnorm(n) genera n valores aleatorios pnorm(x) se utiliza para la normal estándar, para otra normal hay que indicarles los parámetros, por ejemplo, p=pnorm(x, mean = 100, sd= 5). Lo mismo para las otras tres funciones. Para las distribuciones dicretas, por ejemplo la binomial, p=pbinom(x,size=100,prob=.5) proporciona ( = ). Y k=qbinom(q,size=100,prob=.5)es mínimo valor k tal que ( ≤ b)] ≥ . Modelos univariantes 83 Principales Funciones de Distribución Beta pbeta qbeta dbeta rbeta Binomial pbinom qbinom dbinom rbinom Cauchy pcauchy qcauchy dcauchy rcauchy Chi-Square pchisq qchisq dchisq rchisq Exponential pexp qexp dexp rexp F pf qf df rf Gamma pgamma qgamma dgamma rgamma Geometric pgeom qgeom dgeom rgeom Hypergeometric phyper qhyper dhyper rhyper Logistic plogis qlogis dlogis rlogis Log Normal plnorm qlnorm dlnorm rlnorm Negative Binomial pnbinom qnbinom dnbinom rnbinom Normal pnorm qnorm dnorm rnorm Poisson ppois qpois dpois rpois Student t pt qt dt rt Uniform punif qunif dunif runif Weibull pweibull qweibull dweibull rweibull Modelos univariantes 84 Capı́tulo 3: Ejercicios propuestos 1. Si las llamadas telefónicas a una centralita siguen una distribución de Poisson de parámetro λ = 3 llamadas/cinco minutos, calcular la probabilidad de: (a) Seis llamadas en cinco minutos. (b) Tres llamadas en diez minutos. (c) Más de 15 en un cuarto de hora. (d) Dos en un minuto. 2. La variable aleatoria X tiene distribución exponencial con media 1. Obtener la función de distribución y la función de densidad de W = aX 1/b , a > 0, b > 0 3. El número de averı́as diarias de una máquina sigue una distribución de Poisson de media 0.4 averı́as. Calcular la probabilidad de que haya tres dı́as sucesivos sin averı́as. 4. A un puesto de servicio llegan de manera inedependiente, por término medio, 10 clientes/hora. Calcular la probabilidad de que lleguen 8 clientes en la próxima media hora sabiendo que en la última hora llegaron 14 clientes, y que la variable aleatoria número de clientes que llegan en un hora siguen una distribución de Poisson. 5. Sean X e Y dos variables independientes con distribucin geomtrica de parmetros 0.4 y 0.6 respectivamente. Calcular P (X + Y = 3). 6. En una planta industrial dos bombas B1 y B2 en paralelo conducen agua desde un pozo a una depuradora D, y posteriormente otras dos bombas B3 y B4 , también en paralelo, la trasladan a un depósito como indica la figura. Los tiempos de vida de la depuradora y de las bombas son variables aleatorias independientes con distribución exponencial, siendo 20 mil horas la vida media de la depuradora y 30 mil horas la de cada bomba. Pozo - B1 B3 @ R @ D Depsito @ R B4 @ - B2 7. (a) Calcular la probabilidad de que llegue agua al depósito después de 20 mil horas de funcionamiento. (b) Calcular la probabilidad de que una depuradora que ha trabajado T horas falle antes de las mil horas siguientes. ¿Es razonable que para evitar fallos de la depuradora se renueve ésta cada 20 mil horas? ¿Por qué? 1 8. Un laboratorio de análisis realiza pruebas de sangre para detectar la presencia de un tipo de virus. Se sabe que una de cada 100 personas es portadora del virus. Se va a realizar un estudio en un colegio, para abaratar las pruebas se realiza un análisis combinado que consiste en: En lugar de analizar la sangre de cada individuo, se toman las muestras de 50 y se analiza la mezcla. Si el resultado del análisis es negativo, se concluye que los 50 individuos están sanos. Si el análisis es positivo, se repite a cada persona de manera individual. El análisis es infalible. (a) Determinar el número esperado de pruebas (análisis) que se tendrá que realizar si se sigue este tipo de estrategia. (b) ¿Cuál es la probabilidad de que un individuo determinado sea portador del virus, si el resultado del análisis realizado a su grupo de 50 ha resultado positivo? 9. De un lote con una proporción de piezas defectuosas p, se extraen piezas con reposición hasta que se observa la k−ésima defectuosa. Obtener la distribución de probabilidad de la variable aleatoria X número total de piezas observadas. 10. La función de densidad de una variable aleatoria X viene dada por la expresión x/8, si 0 ≤ x ≤ 4 11. f (x) = 0, en el resto Se generan secuencialmente valores de esta variable. ¿Cuántos valores de X habrá que generar por término medio hasta obtener un valor mayor que 3? 12. Una pareja decide tener hijos hasta el nacimiento de la primera niña. Calcular la probabilidad de que tengan más de 4 hijos. (Supóngase P (niño) = P (niña) = 0.5) 13. La distancia D entre dos vehı́culos consecutivos es una autopista sigue una distribución exponencial con media 200 metros. ¿Cuál es la probabilidad de que en un tramo de 1 km haya exactamente 5 vehı́culos? 14. Ricardo es un pescador experto que ha comprobado, después de una larga experiencia practicando su deporte favorito, que el número de peces capturados por la mañana puede ser representado por una variable aleatoria de Poisson de media 3 peces a la hora. Quiere ir a pescar el sábado próximo, si empieza a las 7 de la mañana, ¿cuál es la probabilidad de que capture el primer pez antes de las 7 h. 15 min.? ¿Cuál es la probabilidad de que capture 5 peces durante dos horas de pesca? 15. La variable aleatoria T representa la duración de vida de un componente electrónico. En teorı́a de la fiabilidad la probabilidad de que un componente falle en el instante t sabiendo que ha durado hasta t se denomina tasa de fallo y se representa por λ(t), siendo su valor en función de t λ(t) = f (t) , 1 − F (t) donde f y F son, respectivamente, las funciones de densidad y de distribución de la variable aleatoria T . Obtener la tasa de fallo en caso que T sea una variable aleatoria exponencial de media 1000 horas e interpretar el resultado. 16. Un examen consiste en 25 cuestiones. En cada cuestión, el alumno debe elegir entre 5 soluciones propuestas, de las que una (y sólo una) es cierta. El número mı́nimo de respuestas correctas que debe tener un alumno para aprobar es a. El profesor decide fijar a con el siguiente criterio: que 2 la probabilidad de aprobar para un alumno que conteste todas las cuestiones al azar sea menor de 0.05. Obtener a. (Una cuestión es respondida al azar si cada uno de los cinco resultados propuestos tiene la misma probabilidad de ser escogido). 17. Obtener la función de densidad de una variable aleatoria χ2 con un grado de libertad. (Si X N (0, 1), Y = X 2 es una χ21 .) 18. Dada una variable aleatoria X, cuya distribución es N (0, σ 2 ), calcular la mediana de la variable Y = |X|. 19. La longitud L en milı́metros de las piezas fabricadas en un proceso es una variable aleatoria que se distribuye según una N (32, 0.3), considerándose aceptables aquellas cuya medida se encuentra dentro del intervalo (31.1, 32.6). (a) Calcular la probabilidad de que una pieza elegida al azar sea aceptable. (b) Si se toma al azar una muestra de tres piezas, ¿cuál es la probabilidad de que la primera y la tercera sean aceptables y la segunda no lo sea? (c) ¿Cuál es la probabilidad de que en una muestra de tamaño 3 al menos una sea aceptable? (d) Las piezas se embalan en lotes de 500. Calcular la probabilidad de que un lote tenga más de 15 defectuosas. 20. Un concesionario de automóviles recibe pedidos de un modelo según un proceso de Poisson de media 2 vehı́culos por semana. Los pedidos al fabricante se deben realizar con una antelación mı́nima de un mes, de forma que el concesionario pide en cada mes los vehı́culos que necesita para el mes siguiente. ¿Cuántos automóviles disponibles ha de tener a principios de un mes para satisfacer con probabilidad igual o mayor que 0.95 la demanda mensual? (Se considera que el mes tiene cuatro semanas). 21. Si la probabilidad de que un disparo impacte una diana es 0.0001, ¿cuál es la probabilidad de impactar en la diana 4 o más veces en 50000 disparos? Da un resultado numérico empleando la aproximación que consideres más adecuada. Se supone independencia. 22. En una urna hay 20 bolas, 5 son negras y 15 blancas. Se extraen 4 sin reposición y se define la variable aleatoria Y como el número de bolas negras. (a) Demostrar que la distribución de probabilidad de Y es 15 5 P (Y = k) = k 4−k 20 4 , k = 0, 1, 2, 3, 4 (b) Generalizar el resultado anterior si en la urna hay M bolas blancas, N bolas negras, se extraen K bolas e interesa conocer la distribución de probabilidad de Y número de bolas negras. La extracción es sin reposición. (Esta distribución se denomina Hipergeométrica y se utiliza en los problemas de muestreo sin reposición) (c) Plantear el problema del número de aciertos en la loterı́a primitiva como un caso particular de la distribución anterior. Aplicarlo para el caso en el que el participante tacha (elige) 6 números y en el caso en el que tacha 8 números. 3 23. Para controlar la calidad de un proceso textil se cuenta el número de defectos que aparecen en la tela fabricada. Según el fabricante, cuando el proceso funciona correctamente el número de defectos en una bobina de 100 metros cuadrados es una variable aleatoria de Poisson con media 4. Se ha instalado un equipo de visión artificial para realizar el recuento que permite inspeccionar 900 m2 de tela cada hora. ¿Cuál es la probabilidad de que aparezcan más de 50 defectos en una hora si el proceso funciona bien? 24. Un compañı́a compra chips para montar en placas de ordenadores clónicos. Una empresa de reciclado le ofrece lotes de 10.000 chips a precios muy ventajosos pero con un porcentaje de defectuosos alto, alrededor del 10%. Para realizar el control de calidad de los lotes recibidos está considerando dos alternativas: (a) Tomar 100 unidades al azar y rechazar el lote si existen más de 15 defectuosas. (b) Tomar 100 unidades al azar, dividirlas en 10 grupos y si en algún grupo hay más de una pieza defectuosa rechazar el lote.¿Cuál es la probabilidad de rechazar un lote con el 10% de chips defectuosos para cada uno de los métodos? ¿Cuál es la probabilidad de aceptar un lote con el 20% de chips defectuoso para cada método? 25. Una compañı́a para comprobar la calidad de ciertos lotes de 30000 piezas realiza el siguiente control: toma una muestra al azar de 300 piezas y si tiene 15 o más piezas defectuosas rechaza el lote, aceptándolo en caso contrario. La compañı́a cada mes aplica este control a 200 lotes, ¿cuál es el número esperado de lotes rechazados si todos los lotes de un mes tienen exáctamente un 4% de piezas defectuosas? 26. Un servicio telefónico de urgencias recibe por término medio 10 llamadas cada minuto, ¿cuál es la probabilidad de recibir más de 550 llamadas en una hora? Se ha diseñado un ”call center” con capacidad de respuesta de 650 llamadas a la hora, ¿cuál es el número esperado de horas al año con número de llamadas superior a su capacidad? (Se supone que las llamadas son independientes y todas las horas son similares) 27. A un congreso de medicina acuden 500 personas. Un laboratorio farmaceútico va a regalar corbatas a los hombres y pañuelos a las mujeres. Desgraciadamente no conocen el número exacto de cada sexo, aunque saben de otros congresos que la proporción es similar. Calcula el número mı́nimo de corbatas y de pañuelos que deben tener disponibles los organizadores para que todos los asistentes tengan el regalo que les corresponde con probabilidad de 0.99 (es decir ninguna mujer se quede sin pañuelo y ningún hombre sin corbata). Se supone que la probabilidad de hombre o mujer es igual a 0.5 y que la probabilidad de que un asistente sea de un determinado sexo es independiente del sexo de los restantes. 28. Federer y Nadal se encuentran empatados, 40-40 en un juego en el que está sacando Nadal. Según las estadı́sticas la probabilidad de que Nadal gane un punto determinado cuando tiene el saque es 0.6. ¿Cuál es la probabilidad de que el juego lo termine ganando Nadal? (Nota. Piensa en el desempate de la siguiente forma: se juegan dos puntos: si los gana un jugador ese jugador ha ganado el juego, si cada jugador gana un punto se juegan otros dos puntos y se vuelve a aplicar la misma regla). 29. ”Cibeles in Concert” es una empresa que organiza viajes en autobus para asistir a actuaciones musicales. Para un concierto de Bruce Springsteen en Paris ha ofertado 300 plazas que salen de Madrid y Sevilla. Las reservas se hacen por Internet, el precio del viaje para los de Sevilla es de 60 e y para los de Madrid 50e. Las 300 plazas se cubren con seguridad. Si la probabilidad de que un asistente salga de Sevilla es 1/3 y de Madrid 2/3, y se acepta independencia entre las 300 reservas, calcula los ingresos esperados por la compañı́a y la varianza de estos ingresos. 4 30. Una empresa de celulosa tiene dos lı́neas para fabricar pasta de papel en planchas de 1m × 1m. Una medida de su calidad es la limpieza, que se mide en número de impurezas (partı́culas) por m2 . La lı́nea I, fabrica con una tasa media de 5 impurezas por m2 y la lı́nea II con 3 impurezas por m2 . El número de impurezas por plancha es una variable aleatoria con distribución de Poisson. Las planchas de pasta se empaquetan en balas de 2000 unidades y se almacenan clasificadas según la lı́nea de procedencia. Cuando por algún motivo se encuentra en el almacén una bala sin clasificar se adopta el siguiente criterio: tomar una muestra aleatoria de 10 planchas y determinar el número medio de impurezas. Asignarla al grupo de la lı́nea I si el número medio de impurezas es mayor que 4 y a la lı́nea II en caso contrario. (Se supone que la probabilidad inicial de pertenecer a una u otra linea es la misma). (a) Calcular la probabilidad de clasificar erróneamente una bala. (b) En un caso concreto, el número de impurezas en cada una de las diez planchas han sido 1, 2, 3, 3, 4, 4, 5, 5, 6, 8. Calcular la probabilidad de que pertenezca a cada una de las lı́neas. 31. Los billetes de banco son fabricados en pliegos. La impresión se realiza por dos máquinas iguales, una de ellas imprime el anverso y la otra el reverso. Sea X e Y , respectivamente, el número de defectos de impresión en el anverso y reverso de un pliego. Ambas variables son independientes con distribución de Poisson de parámetros λ1 y λ2 . (a) Demostrar que el número total de defectos en un pliego Z = X + Y tiene distribución de Poisson. (Nota.- Utilizar que Pr{Z = n} = n X Pr{X = k}Pr{Y = n − k} k=0 y el desarrollo del binomio de Newton para (λ1 + λ2 )n .) (b) Si el número total de defectos en un pliego es Z = n, ¿ cuál es la probabilidad de que haya exáctamente X = k defectos en el anverso? (Obtener la expresión en función de λ1 , λ2 , n y k). ¿ De qué distribución de probabilidad se trata? 32. La llegada de los clientes a un banco se considera un proceso Poisson con parámetro λ. Sabiendo que en la última hora han llegado 2 clientes, ¿cuál es la probabilidad de que los dos entraran en los primeros 15 minutos? 33. Un equipo de radio tiene dos partes, el receptor y el amplificador. La duración del receptor es una variable aleatoria exponencial de media 500 horas y la duración del amplificador una variable exponencial de media 1000 horas. ¿Cuál es la probabilidad de que el fallo del equipo (cuando se produzca) sea debido a un fallo del receptor? (Se supone que las variables son independientes) 34. Sea X1 una variable aleatoria N(10,1), X2 una variable aleatoria N(20,1), y X3 una variable aleatoria N(30,4). Se define Z1 = X1 + X2 − X3 Z2 = X1 + X2 + X3 Z3 = X1 − X2 − X3 Si X1 , X2 , X3 son independientes, calcular la matriz de varianzas de (Z1 , Z2 , Z3 ). 5 35. Una oficina de correos tiene dos ventanillas de atención al público. Tres personas A,B y C llegan en el mismo instante a la oficina de correos y encuentran las dos ventanillas desocupadas. Los tiempos de servicio requeridos por las tres personas son variables aleatorias independientes con distribución exponencial de parámetro λ. Los tiempos de servicio de A y B comienzan de inmediato, mientras que C debe esperar a que termine el primero de los dos. ¿Cuál es la probabilidad de que C no sea el último en salir de la oficina de correos? 36. En cierta fabricación mecánica el 96% de las piezas resultan con longitudes admisibles (dentro de tolerancias), un 3% son piezas defectuosas cortas y un 1% son defectuosas largas. Calcular la probabilidad de: (a) En un lote de 250 piezas sean admisibles 242 o más. (b) En un lote de 500 sean cortas 10 o menos. (c) En 1000 piezas haya entre 6 y 12 largas. Todas las aproximaciones se calculan la distribución normal. 37. La estatura de los ciudadanos varones de un paı́s sigue una distribución normal: N (µ = 175cm, σ = 5cm); si se seleccionan al azar 100 ciudadanos, ¿cuál es la probabilidad de que al menos 30 superen los 180cm? 38. En un proceso de fabricación de pelı́cula fotográfica aparecen por término medio 1 defecto de cada 20 metros de pelı́cula. Si la distribución de defectos es Poisson, calcular la probabilidad de 6 defectos en un rollo de 200 metros de pelicula (a) directamente; (b) utilizando la aproximación normal. Para controlar la recepción de lotes de 10000 unidades de discos compactos se toma una muestra al azar de n = 200 discos clasificándolos como aceptables y defectuosos. Si el número de discos defectuosos es igual o inferior a c = 15 se acepta el lote, en caso contrario se rechaza. ¿Cuál es la probabilidad de aceptar un lote con el 12% de discos defectuosos? ¿Cuál es la probabilidad de rechazar un lote con el 5% de discos defectuosos? ¿Que valores de n y c deben utilizarse si se desea que las probabilidades anteriores sean iguales a 0.05? 39. La función de densidad conjunta de las variables aleatorias X, Y es la siguiente normal bidimensional: 1 −1 2 2 f (x, y) = exp (x − 2ρxy + y ) 2(1 − ρ2 ) 2π(1 − ρ2 )1/2 Si ρ = 0.3, calcular Pr(Y ≤ X + 1). 40. Un inversor tiene su dinero repartido en acciones de dos compañı́as. La rentabilidad (% de beneficio) de las compañı́as pueden ser consideradas como dos variables aleatorias, con media anual igual para las dos del 10%, aunque el riesgo es muy diferente. Una tiene una desviación tı́pica de 2.5% y la otra del 1%. Además se sabe que la correlación entre ellas es -0.50. ¿Qué proporción debe invertir en cada una para que el riesgo sea mı́nimo? (Nota: Mı́nimo riesgo es lo mismo que mı́nima varianza. X → N (10, 2.5) y Y → N (10, 1), corr(X, Y ) = −0.5). 41. Cierto compuesto metálico se ha sometido durante una hora a una atmósfera de oxı́geno a 200 grados centı́grados. Una medida de su corrosión es la ganancia de peso durante este tiempo. Se ha comprobado que para un determinado compuesto esta ganancia X1 , en una hora, se distribuye segúun una normal N (100, 5). 6 (a) Si se realizan los ensayos de manera secuencial, ¿cuántos se tendrán que hacer por término medio para encontrar una probeta con una ganancia mayor que 105? (b) Se comprueba que sometiendo la probeta al ensayo durante dos horas, la ganancia en la segunda hora X2 tiene una distribución normal N (60, 5), siendo el coeficiente de correlación entre las variables X1 y X2 , ρ = −0.28. Calcular la probabilidad de que una probeta tenga mayor ganancia de peso en la segunda hora que en la primera. (c) Se forman los ı́ndices de oxidación Z1 = X1 + X2 y Z1 = X1 − X2 . Calcular la función de densidad conjunta de estas dos nuevas variables. ¿Son independientes? (d) Si la ganancia durante las dos horas ha sido 170, ¿cuál es el valor medio de la ganancia en la primera hora? 42. El abastecimiento de energı́a eléctrica de una comarca depende de tres centrales: una nuclear, una térmica de carbón y una hidráulica con potencias instaladas de 500 M W , 300 M W y 200 M W , respectivamente. Desde el punto de vista de fiabilidad, cada central sólo puede estar en uno de estos dos estados: disponible (con toda su potencia) o averiada (con potencia cero). En un dı́a, la probabilidad de averı́a de la central nuclear es 0.10, de la térmica es 0.12 y de la hidráulica 0.05. Las averı́as son independientes y supondremos como hipótesis simplificadora que a lo largo de un dı́a la central no cambia de estado. (a) Para un dı́a, calcular la función de distribución de la variable aleatoria Y =Potencia disponible en la comarca. (b) Un pais tiene 30 centrales de cada uno de los tipos del apartado 1. Calcular la probabilidad de que en un dı́a la potencia disponible en el pais sea menor que24000 M W . (Utilizar la aproximación normal). (c) La potencia máxima diaria demandada en el pais es una variable aleatoria con distribución normal de media 23000 M W y desviación tı́pica 1000 M W . ¿Cuál es la probabilidad de que en un dı́a la demanda sea superior a la potencia disponible? 43. Una compañı́a desea aplicar un plan de muestreo para controlar la compra de lotes de 10000 unidades. La capacidad de inspección máxima que tienen es de 200 piezas. Determinar c, ”el número máximo de piezas defectuosas en la muestra que debe tener un lote aceptado” si se desea que la probabilidad de rechazar un lote con el 10% de piezas defectuosas sea igual 0.02. Un proveedor estima que sus lotes tienen un 5% de piezas defectuosas, ¿qué probabilidad tiene de que un lote suyo sea aceptado? 44. Se tienen dos variables aleatorias U y V que se distribuyen según un modelo de probabilidad uniforme continuo entre (0, 1) independientes. A partir de las anteriores se definen 2 nuevas variables aleatorias Z y W como función de las anteriores: √ Z = −2 log U W = 2πV (a) Calcular las probabilidades P (Z < z0 ) y P (W < w0 ). Utilizar estos resultados para deducir la expresión de la función de densidad de probabilidad conjunta fZ,W (z, w) para las variables aleatorias Z y W, ası́ como el domino donde están definidas. 7 (b) Una vez caracterizadas las variables aleatorias Z y W por su función de densidad de probabilidad conjunta fZ,W (z, w)se vuelve a definir 2 nuevas variables aleatorias X e Y mediante X = Z · cos W la siguiente transformación: Y = Z · senW Para estas nuevas variables se comprueba que la función de densidad de probabilidad conjunta es: 1 1 fX,Y (x, y) = exp − x2 + y 2 , con (x, y) ∈ R2 . 2π 2 Demostrar que las variables aleatorias X e Y son independientes. Calcular la media y la varianza de las variables y sus funciones de densidad marginal identificando el tipo de variables de las que se trata. (c) Con la información del apartado (a) y (b) obtener el valor numérico de las siguientes probabilidades: • P (−1 < X < 1, −1 < Y < 1) • P (X 2 + Y 2 < 1) • P (Y < X) (d) Finalmente, calcular los coeficientes de la siguiente tansformación lineal 0 X c 0 a X + = Y d e b Y0 con c, e > 0, para que las nuevas variables aleatorias (X 0 , Y 0 )T tengan una distribución de probrobabilidad con vector de medias y matriz de varianzas dadas por: 4 2 1 . , S= µ= 2 5 3 45. Hay un juego muy popular en EEUU que se juega en carnavales en los que un jugador paga 1 dólar, elige un número del 1 al 6 y lanza tres dados. La banca le paga tantos dólares como veces aparece el número elegido. En un dı́a de carnaval participan en el juego 500 personas. Obtén la distribución de probabilidad de las ganancias de la banca para ese dı́a, indicando su media y desviación tı́pica. 46. Se lanzan 100 dados. Obtén la distribución de la suma de los números pares. Calcula la media y la varianza. 8 Estadística Parte II. Inferencia Tema 4. Estadística Descriptiva Datos Número 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ... 391 Consumo l/100Km 15 16 24 9 11 17 12 17 18 12 16 12 9 8 7 7 12 13 9 9 ... 7 Estadística Descriptiva Cilindrada cc 4982 6391 5031 1491 2294 5752 2294 6555 6555 1147 5735 1868 2294 1295 1163 1360 3802 3687 1475 1983 ... 1753 Potencia CV 150 190 200 70 72 153 90 175 190 97 145 91 75 67 65 61 90 95 71 115 ... 75 Peso kg 1144 1283 1458 651 802 1384 802 1461 1474 776 1360 860 847 666 612 667 1070 1261 741 890 ... 735 Aceleración segundos 12 9 15 21 19 14 20 12 13 14 13 14 17 16 21 19 17 19 17 14 ... 15 Año País Nº Cilindros 70 70 70 71 71 71 72 72 72 72 73 73 74 74 74 74 75 75 75 75 ... 82 EEUU EEUU EEUU EEUU EEUU EEUU EEUU EEUU EEUU Japón EEUU Europa EEUU Europa Japón Japón EEUU EEUU Europa Europa ... Japón 8 8 8 4 4 8 4 8 8 3 8 4 4 4 4 4 6 6 4 4 ... 4 2 Tipos de datos Cuantitativos Continuos: consumo, potencia,aceleración, peso Discretos: nº de cilindros Cualitativos Ordinales: categoría No ordinales: país, gasolina/gasoil Estadística Descriptiva 3 Lectura de datos Para leer datos de un achivo de texto organizado en columnas se utiliza la instrucción read.table(). coches = read.table('coches2.txt',header=TRUE) head(coches) ## ## ## ## ## ## ## 1 2 3 4 5 6 Consumo 11 11 13 11 17 15 Estadística Descriptiva CC CV Peso Acel Ano Origen Cilindros 3277 85 862 16 70 1 6 3261 90 882 15 70 1 6 3261 97 924 16 70 1 6 3245 95 944 16 70 1 6 7456 225 1028 10 70 1 8 4982 150 1144 12 70 1 8 4 Descriptiva de variables cualitativas coches$origen2 = factor(coches$Origen,labels=c('USA','UE','JAP')) table(coches$origen2) ## ## USA UE JAP ## 246 68 79 barplot(table(coches$origen2),col= terrain.colors(3)) pie(table(coches$origen2),col=terrain.colors(3)) Estadística Descriptiva 5 Distribución de frecuencias: consumo l/100 km ------------------------------------------------------------Limite Limite Punto Frecuencia Frecuencia Clase Inferior Superior Medio Absoluta Relativa ------------------------------------------------------------1 0,0 2,5 1,25 0 0,0000 2 2,5 5,0 3,75 6 0,0153 3 5,0 7,5 6,25 65 0,1662 4 7,5 10,0 8,75 126 0,3223 5 10,0 12,5 11,25 64 0,1637 6 12,5 15,0 13,75 62 0,1586 7 15,0 17,5 16,25 36 0,0921 8 17,5 20,0 18,75 26 0,0665 9 20,0 22,5 21,25 4 0,0102 10 22,5 25,0 23,75 2 0,0051 ------------------------------------------------------------Total 391 1,0000 Estadística Descriptiva 6 Histograma 150 120 90 60 30 0 0 5 10 15 20 25 consumo Estadística Descriptiva 7 Histogramas para coches Estadística Descriptiva 8 Descriptiva de variables continuas hist( coches$Consumo, color = 'tomato', probability =TRUE) 9 Estadística Descriptiva Medidas de centro x1 , x2 ,..., xn Media aritmética x + x + ⋯ + xn x= 1 2 n Media geométrica Media armónica (si xi > 0 para todo i ) (si xi > 0 para todo i ) n xG = n x1 x2 ⋯ xn xH = 1 1 1 + +⋯+ x1 x2 xn xH ≤ xG ≤ x Estadística Descriptiva 10 Medidas de dispersión x1, x2 ,..., xn s=2 Desviación Típica 90 95 100 105 110 s= s = 5.4 90 n (x i =1 i 95 100 105 − x )2 n Varianza : s 2 110 Media 100 11 Estadística Descriptiva Densidad de la tierra (Cavendish, 1798) 5,5 5,57 5,42 5,61 5,53 4 5,47 4,88 5,62 5,63 4,07 4,4 5,55 5,34 5,3 5,36 5,79 4,8 Media = 5.42 Estadística Descriptiva 5,75 5,29 5,1 5,86 5,58 5,2 densidad 5,29 5,34 5,26 5,44 5,46 5,6 5,27 5,85 5,65 5,39 6 Desv. Típ. = 0.338 12 Desigualdad de Chebychev fr (| x i − x |≤ ks ) > 1 − 235 240 245 x x −k×s s2 = n ( xi i =1 s ≥ − x) x − x > ks k2 255 x +k×s 2 n 2 250 1 = x − x ≤ ks n > n fr (| xi − x |> ks) ≤ k k2 x − x > ks ( xi − x ) 2 i n 2 2 s x − x > ks 1 + i ( xi − x ) 2 i ( xi − x ) 2 i n = fr (| xi − x |> ks)k 2 s 2 ⇔ fr (| xi − x |≤ ks) > 1 − 1 k2 13 Estadística Descriptiva Mediana y Cuartiles x1, x2 ,..., xn Datos ordenados x(1) ≤ x( 2) ≤ ⋯ ≤ x( n) x( p ) Mediana x +x ( p ) ( p +1) 2 Cuartiles Q1 = x( r ) Q3 = x( s ) p + 1 r = s = n − r +1 2 Estadística Descriptiva n +1 : n impar 2 n p = : n par 2 p= 14 Mediana y Cuartiles x1 , x2 ,..., xn 50% Mediana : ( Med ) fr(xi ≤ Med) = 0.50 25% 25% 235 Cuartiles 240 245 Q1 Med Q1 Q3 fr(xi ≤ Q1 ) = 0.25 fr(xi ≤ Q3 ) = 0.75 250 255 Q3 15 Estadística Descriptiva Medidas características Media Desv. Típica Primer Cuartil Mediana Tercer Cuartil Rango Intercuartílico Consumo 11.2 3.9 8 10 13.5 5.5 Cilindrada Potencia 3181.2 104.2 1714.6 38.3 1721 75 2474 93 4334 125 2613 50 Peso 990.7 281.9 741.5 933 1203.5 462 Aceleración 15.7 2.8 14 16 17 3 summary(coches) ## ## ## ## ## ## ## ## Consumo Min. : 5.00 1st Qu.: 8.00 Median :10.00 Mean :11.22 3rd Qu.:13.00 Max. :24.00 CC Min. :1114 1st Qu.:1721 Median :2474 Mean :3179 3rd Qu.:4293 Max. :7456 Estadística Descriptiva CV Min. : 46.0 1st Qu.: 75.0 Median : 93.0 Mean :104.2 3rd Qu.:125.0 Max. :230.0 NA's :2 Peso Min. : 537.0 1st Qu.: 742.0 Median : 935.0 Mean : 990.6 3rd Qu.:1203.0 Max. :1713.0 Acel Min. : 8.00 1st Qu.:14.00 Median :16.00 Mean :15.67 3rd Qu.:17.00 Max. :25.00 16 Diagrama de caja Q1 Q2 Min {xi : xi ≥ LI} Q3 Max {xi : xi ≤ LS} atípicos 0 4 8 12 16 20 24 consumo LI = Q1 -1.5 RI LS = Q3+1.5 RI RI = Q3 - Q1 17 Estadística Descriptiva Densidad de la tierra (Cavendish, 1798) 5,5 5,57 5,42 5,61 5,53 4 5,47 4,88 5,62 5,63 4,07 4,4 5,55 5,34 5,3 5,36 5,79 4,8 5,75 5,29 5,1 5,86 5,58 5,2 5,29 5,34 5,26 5,44 5,46 5,6 5,27 5,85 5,65 5,39 6 densidad Media = 5.42 Desv. Típ. = 0.338 Estadística Descriptiva 18 Diagrama de caja múltiple EEUU Europa Japón 0 4 8 12 16 20 24 consumo 19 Estadística Descriptiva Diagrama de caja múltiple EEUU Europa Japón 500 800 1100 1400 1700 2000 peso Estadística Descriptiva 20 Consumo según año de fabricación 70 71 72 73 74 75 76 77 78 79 80 81 82 0 4 8 12 16 20 24 consumo Estadística Descriptiva 21 Box plot en R coches$origen2 = factor(coches$Origen,labels=c('USA','UE','JAP')) boxplot(coches$Consumo~coches$origen2,horizontal=TRUE, col=terrain.colors(3)) Estadística Descriptiva 22 Diagrama de Caja Múltiple EEUU Grecia OCDE Europa Oriental Japón Asia/Pacífico África Gabón Oriente Medio America Latina Barbados 0 4 8 12 16 20 Producto interior bruto per capita 24 X1000 23 Estadística Descriptiva Diagrama de tallos y hojas LO|4,07 1 1 1 1 2 3 12 (9) 8 2 4| 4| 4| 4| 4|8 5|1 5|222233333 5|444455555 5|666677 5|88 Estadística Descriptiva • Media 5,419 • Des. Típica 0,339 • Mínimo 4,07 • Máximo 5,86 • Cuartil 1 5.3 • Mediana 5.46 • Cuartil 3 5.61 24 Diagrama de tallos y hojas con R 25 Estadística Descriptiva Medidas características de forma: asimetría y curtosis Coeficiente Coeficiente de curtosis o de asimetría m C AS = 33 s apuntamiento m C AP = 44 s ( xi − x ) 4 = ( xi − x )3 = ns 3 ns 4 Momento respecto al origen xk i =1 i = Momentos respecto a la media n ak Estadística Descriptiva n ( x − x )k i =1 i = n mk n 26 Modelo ideal CAP = 3 CAS = 0 1000 frecuencia 800 600 400 200 0 230 235 240 245 250 255 260 30 30 25 frecuencia 25 20 15 10 5 20 15 10 5 0 0 0 100 200 300 400 500 600 700 220 CAS > 0 230 240 250 260 270 280 CAP < 3 Estadística Descriptiva 27 Transformaciones de datos • Transformaciones Lineales yi = a + bxi y = a + bx s y = b sx La " forma" de la distribución no cambia (Asimetría y curtosis no cambia) • Transformaciones no-lineales yi = h( xi ) y ≠ h( x ) Cambia la " forma" de la distribución (coeficientes de asimetría y curtosis cambian) Estadística Descriptiva 28 Efecto de la transformación de datos 150 240 200 120 160 90 120 60 80 30 40 0 0 -10 10 30 50 70 0 1 2 X 3 4 5 6 Y yi = log xi 29 Estadística Descriptiva Transformaciones Box-Cox 1,5 1 0,5 0 -0,5 -1 xip − 1 yi = p -1,5 p = 0 yi = log xi Estadística Descriptiva 30 Datos Multivariantes Variables Y1 x11 Y2 ⋯ Yk x21 ⋯ xk1 2 x12 x22 ⋯ xk 2 1 ⋮ ⋮ n x1n ⋮ x2 k ⋱ ⋮ ⋯ xkn x1 x2 ⋮ xn 31 Estadística Descriptiva Vector de Medias x1i x2 i x i = ; ⋮ x ki Estadística Descriptiva x1 n x x2 i =1 i x= = ⋮ n x n 32 Covarianza 24 Coche 1 2 ⋮ n consumo 20 16 12 8 4 0 500 800 1100 1400 1700 Peso x1 x2 Consumo y1 y2 ⋮ xn ⋮ yn 2000 peso s xy = n (x i =1 i − x )( yi − y ) n 33 Estadística Descriptiva Matriz de Varianzas x1i 1 x 2i 2 S = n i =1 x ki n − x1 − x2 ( x1i − x1 ⋮ − x k x 2i − x 2 ⋯ x ki − x k ) ( x1i − x1 ) 2 1 n ( x − x1 )( x 2i − x 2 ) = 1i n i =1 ⋮ ( x − x )( x − x ) ki k 1 1i ( x1i − x1 )( x 2i − x 2 ) ( x 2i − x 2 ) 2 ⋮ ⋯ ⋯ ⋱ ( x 2i − x 2 )( x ki − x k ) ⋯ s12 s = 12 ⋮ s 1k s1k s 2k ⋮ s k2 s12 s 22 ⋯ ⋯ ⋮ ⋱ ⋯ s 2k Estadística Descriptiva ( x1i − x1 )( x ki − x k ) ( x 2i − x 2 )( x ki − x k ) ⋮ 2 ( x ki − x k ) 34 Gráficos de dispersión: ejemplo coches pairs(coches[,1:5]) Estadística Descriptiva 35 Matriz de Varianzas var(coches[,1:5],use="complete.obs") ## ## ## ## ## ## Consumo CC CV Peso Acel Consumo 15.1557 5824.4 127.304 971.53 -5.0073 CC 5824.4404 2939742.5 58965.409 451460.55 -2597.4073 CV 127.3035 58965.4 1465.220 9312.79 -73.5510 Peso 971.5264 451460.5 9312.785 79495.52 -328.0469 Acel -5.0073 -2597.4 -73.551 -328.05 7.6156 Estadística Descriptiva 36 Propiedades de S2 x11 − x1 ~ = x12 − x1 X ⋮ x − x 1 1n 1 ~T~ S2 = X X n x 21 − x 2 x 22 − x 2 ⋮ x2n − x2 ⋯ x k1 − x k ⋯ xk 2 − xk ⋱ ⋮ ⋯ x kn − x k Cuadrada k x k Simétrica Semidef. positiva S 2 es semidefinida positiva : ∀w ∈ ℜ k , w T S 2 w ≥ 0 1 ~T~ 1 ~ T ~ w TS 2 w = w T ( X X)w = (X w) (Xw) n n ~ w, w T S 2 w = 1 v T v = v=X n i=1 vi2 n n ≥0 37 Estadística Descriptiva Correlación 24 consumo 20 16 12 8 4 0 500 800 1100 1400 1700 2000 Obs. Var − 1 Var − 2 1 2 ⋮ x1 x2 y1 y2 ⋮ ⋮ n xn yn peso rxy = s xy sx s y i=1 ( xi − x )( yi − y ) n n i=1 ( xi − x ) 2 i=1 ( yi − y ) 2 n = Estadística Descriptiva • Adimensional • -1 ≤ rxy ≤ +1 • |rxy| = 1 ⇔ yi = a + b xi 38 Coef. correlación 2 r =1 r 2 = 0 . 50 r 2 = 0 . 80 r2 = 0 Estadística Descriptiva 39 Matriz de Correlación cor(coches[,1:5],use="complete.obs") ## ## ## ## ## ## Consumo CC CV Peso Consumo 1.00000 0.87259 0.85428 0.88510 CC 0.87259 1.00000 0.89844 0.93389 CV 0.85428 0.89844 1.00000 0.86289 Peso 0.88510 0.93389 0.86289 1.00000 Acel -0.46609 -0.54895 -0.69628 -0.42161 Estadística Descriptiva Acel -0.46609 -0.54895 -0.69628 -0.42161 1.00000 40 library('car') scatterplotMatrix(coches[1:5]) Estadística Descriptiva 41 scatterplotMatrix(coches[1:5],groups=coches$Origen, cex=.2,by.groups = TRUE,col= rainbow(3), main='USA=Rojo, UE=Verde, JAP= Azul') Estadística Descriptiva 42 Transformaciones Lineales yi = a1 x1i + a2 x2i + ⋯ + ak xki = (a1 y= n = n i =1 s 2 y yi n = n i =1 ( yi − y ) 2 i =1 n a2 a T ( i =1 x i ) x1i x ⋯ ak ) 2i = a T x i ⋮ x ki n aTxi = n = n = aTx n ( yi − y )( yi − y ) i =1 n = n i =1 (a T x i − a T x)(x Tia − x Ta) n n (x i − x)(x i − x)T a = a T S 2a = a i =1 n T 43 Estadística Descriptiva s12 s S 2 = 12 ⋮ s 1k s12 s22 ⋮ s2 k ⋯ s1k ⋯ s2 k ⋱ ⋮ ⋯ sk2 s12 s Var (a T x) = (a1 , a2 ,⋯ , ak ) 12 ⋮ s 1k ⋯ s1k a1 ⋯ s2 k a2 ⋱ ⋮ ⋮ 2 ⋯ sk ak = a12 s12 + a22 s22 + ⋯ + ak2 sk2 + 2a1a2 s12 + 2a1a3 s13 + ⋯ + 2ak −1ak sk −1,k Estadística Descriptiva s12 s22 ⋮ s2 k 44 Casos particulares 1. = + = 2. = +2 ( , ) + −2 ( , ) − = 3. + = + = + +2 ( , ) 45 Estadística Descriptiva Transformaciones lineales II y1i = a11 x1i + a12 x2i + ⋯ + a1k xki y1i a11 a12 y 2i a21 a22 ⋮ = ⋮ ⋮ y a mi m1 am 2 y2i = a21 x1i + a22 x2i + ⋯ + amk xki ⋮ ymi = am1 x1i + am 2 x2i + ⋯ + amk xki ⋯ a1k x1i ⋯ a2 k x2i ⋱ ⋮ ⋮ ⋯ amk xki y i = Ax i i =1 y i n y= n i =1 Axi n = Estadística Descriptiva n A(i =1 x i ) n = n = Ax 46 Transformaciones lineales III y1i a11 a12 y 2i a21 a22 ⋮ = ⋮ ⋮ y a mi m1 am 2 S 2 Y = n = n i =1 ⋯ a1k x1i ⋯ a2 k x2i ⋱ ⋮ ⋮ ⋯ amk xki = (y i − y )(y i − y )T n i =1 ( Ax i − Ax)(x Ti A T − x T A T ) n = AS 2X A T n ( x i − x)(x i − x)T = A i =1 n AT SX2 Estadística Descriptiva 47 Ejercicio: Notas de Diseño (X1) y Regresión (X2) y Nota Final (Y=X1+X2) En la tabla siguiente se proporciona las notas de las dos pruebas de evaluación continua de la asignatura Diseño de Experimentos (X1) y Modelos de Regresión (X2) y la suma de ambas (Y=X1+X2). Además se proporcionan la media y la desviación típica de cada una de las tres variables. 1. Calcula la covarianza entre X1 y X2 2. Calcula la correlación entre X1 y X2 3. Proporciona la matriz de varianzas de X1 y X2 y la matriz de correlaciones de X1 y X2 4. Como las notas de X1 son en general inferiores a X2, se decide utilizar como nota final Z = 0.8 X1 + 1.2 X2. Calcula la media y la varianza de Z. 5. Calcula la matriz de correlación de las variables (Y y Z). Estadística Descriptiva 48 Notas de Diseño (X1) y Regresión (X2) y Nota Final (Y=X1+X2) matrícula 76020 76032 76056 76077 76079 76084 76133 76151 76218 76235 76241 76251 76268 76272 76303 76354 76377 76433 76435 76517 X1 3.3 0.1 3.7 3.0 3.7 1.0 3.0 1.8 2.8 2.4 1.8 2.4 3.7 2.0 0.1 1.2 0.8 0.0 1.6 1.6 X2 4.3 3.4 5.1 4.5 4.3 1.8 5.5 3.3 5.0 3.8 2.6 3.3 3.0 2.4 1.5 3.8 3.0 1.3 3.8 2.4 Y 7.5 3.5 8.8 7.5 7.9 2.8 8.5 5.0 7.8 6.3 4.4 5.7 6.7 4.4 1.6 5.0 3.8 1.3 5.4 4.0 matrícula 76523 76564 76575 76581 76639 76668 76740 76742 76745 76765 76770 76792 76796 76816 76834 76853 76885 76889 76990 76991 Media DesvTipic X1 3.5 0.8 3.0 1.4 0.1 0.1 2.8 3.7 1.8 1.6 2.8 4.1 3.5 2.6 3.9 2.8 2.4 1.2 2.0 3.8 2.19 1.21 X2 4.7 2.9 4.3 2.6 1.0 1.2 3.3 4.7 2.6 1.6 5.5 3.8 5.5 3.3 4.2 3.2 3.0 2.5 1.9 5.0 3.37 1.24 Y 8.1 3.7 7.3 4.0 1.1 1.3 6.1 8.3 4.4 3.2 8.3 7.9 9.0 6.0 8.1 6.0 5.4 3.7 3.9 8.8 5.56 2.29 X1 versus X2 06 05 04 03 02 01 00 00 01 01 02 02 03 03 04 04 05 49 Estadística Descriptiva Solución: Notas de Diseño (X1) y Regresión (X2) y Nota Final (Y=X1+X2) 1. = 1, 2 = 2. 3. 1, 2 = 1 + 2 +2 1 + ( ) 2 ( 1, 2) ( 1) 1 1.45 1.138 = 2 1.138 1.54 Estadística Descriptiva 2 − 1, 2 ( 2) = 1.138 = 0.76 1. 0.76 1 = 0.76 1. 2 50 4. $̅ = 0.8 × 2.19 + 1.2 × 3.37 = 5.79 $ = 0.8 5. $ = 1 + 1.2 2 + 2 × 0.8 × 1.2 × 1, 2 = 5.33 1 1 1.45 1.138 1 .8 5.266 5.284 = .8 1.2 1.138 1.54 1 1.2 5.284 5.331 Z versus Y $ = 1 .997 .997 1 10,00 9,00 8,00 7,00 6,00 5,00 4,00 3,00 2,00 1,00 0,00 00 Estadística Descriptiva 02 04 06 08 10 51 Capı́tulo 4: Ejercicios propuestos 1. Para los datos siguientes: 28, 22, 35, 42, 44, 53, 58, 41, 40, 32, 31, 38, 37, 61, 25, 35. (a) Calcula la mediana y los cuartiles. (b) Dibuja el box-plot (c) Construye un diagrama de tallo y hojas (d) Calcula la media y la desviación tı́pica (e) Llamando xi a los datos anteriores, calcula la media y la desviación tı́pica para los datos yi obtenidos como yi = 5 + 10xi . 2. A continuación se proporciona el consumo en millas por galón de 68 coches fabricados en Europa. 29.5 31.9 41.5 26.0 25.0 27.0 43.1 26.0 30.5 37.3 24.0 29.0 30.0 44.3 21.5 29.0 31.5 19.0 16.5 21.0 30.0 25.0 33.0 23.0 24.0 25.0 29.0 19.0 17.0 24.0 35.0 20.0 23.0 30.7 23.0 26.0 26.0 36.0 21.6 25.0 36.4 43.4 24.0 18.0 27.0 16.2 25.0 25.4 44.0 28.0 30.0 29.8 34.3 26.0 28.1 27.2 29.0 22.0 28.0 20.3 22.0 26.0 20.0 29.0 26.0 31.0 36.0 26.0 (a) Construye el histograma con 6 clases (b) Realiza el diagrama de tallos y hojas (c) Obtén la mediana y los cuartiles (d) Dibuja el box-plot. Indica las observaciones atı́picas. (e) Transforma los datos con la función logarı́tmo: calcula la mediana y los cuartiles y dibuja el box-plot de los datos transformados. 3. En un departamento cuatro profesores imparten clases en grupos con 10, 18, 22 y 150 alumnos respectivamente. Si se pregunta a los profesores por el tamaño de su clase ¿cuál serı́a el valor medio y la desviación tı́pica obtenida? ¿Y si se pregunta a todos los alumnos del departamento? 4. En la figura se presenta el diagrama de tallos y hojas de los residuos obtenidos de un diseño factorial. Representa el diagrama de caja (box plot) de los datos. (Nota.- La rama -6|91 representa los valores -0.69 y -0.61). 2 2 4 10 18 29 (16) 36 27 20 14 6 -6 -5 -4 -3 -2 -1 -0 0 1 2 3 4 | | | | | | | | | | | | 91 00 766320 98754310 98654321100 9977666554433211 015566677 2333478 134789 23455699 011355 1 5. Para n piezas se han medido dos dimensiones xi e yi . Es posible que la varianza de la variable xi sea 4, la de yi sea 9 y la de zi = xi + yi sea igual a 2? Justificar la respuesta. 6. Se toman 2 medidas xi e yi de n individuos. Dada dos constantes a y b positivas, demostrar que al multiplicar xi por a e yi por b, el coeficiente de correlación entre ambas no varı́a. 7. Demostrar que si entre dos variables xi e yi existe una relación lineal exacta yi = a + bxi , con b > 0, el coeficiente de correlación es uno. 8. Demostrar que el coeficiente de correlación es siempre en valor absoluto menor que uno. 9. En un proceso de fabricación se han medido tres variables y calculado la matriz de varianzas con el resultado siguiente: 2 3 1 3 4 2 1 2 2 (a) ¿Podemos afirmar que hay un error en los cálculos? (b) ¿Por qué? 10. A la variable x de media x = 100 se le ha aplicado una transformación con el logaritmo decimal obteniéndose la nueva variable y = log10 (x). La media de la nueva variable es y = 2.5. ¿Es posible este resultado? 2 Estadística Parte II. Inferencia Tema 5. Estimación Población p % DEFECTUOSA Probabilidad ¿Conocido p cuanto vale X ? Muestra n X ≡Nº Defectuosa ¿Conocido X cuanto vale p ? Estimación puntual Inferencia 2 Inferencia X σ MUESTRA n µ X → N (µ ,σ ) X 1 , X 2 ,..., X n Parámetros ¿ µ ,σ ? Datos Conocidos ? 3 Estimación puntual Espesores de 150 obleas de Silicio (micras) X Estimación puntual 240 243 250 253 248 238 242 245 251 247 239 242 246 250 248 235 237 246 249 246 240 241 246 247 249 240 243 244 248 245 240 243 244 249 246 245 250 250 247 248 238 240 245 248 246 240 242 246 249 248 240 243 246 250 248 241 245 243 247 245 247 245 255 250 249 237 239 243 247 246 242 244 245 248 245 237 239 242 247 245 242 244 246 251 248 243 245 247 252 249 243 245 248 251 250 244 246 246 250 246 241 239 244 250 246 242 245 248 251 249 242 245 248 243 246 241 244 245 249 247 236 239 241 246 242 243 246 247 252 247 241 243 245 248 246 239 240 242 243 244 239 240 250 252 250 241 243 249 255 253 4 Histograma y función de densidad Normal Histograma para Espesor frecuencia 40 30 20 10 0 230 235 240 245 250 255 260 Espesor 5 Estimación puntual Distintos problemas de inferencia Dado un modelo para los datos: x1 , x 2 ,..., x n σ µ Estimar µ y σ Dar un intervalo de confianza para µ y σ Elegir entre (contraste de hipótesis): µ ≥ 250 o µ < 250 Comprobar la validez del modelo (contraste de bondad de ajuste). Estimación puntual 6 Métodos de Estimación X → f X ( x, θ1 , θ 2 ,..., θ r ) fX conocida Parámetros desconocid os θ1 , θ 2 ,..., θ r Dada una muestra aleatoria simple de X x1 , x2 , … , xn ¿θ1 ,θ 2 ,...,θ r ? → 1. Método de los momentos 2. Método de máxima verosimilitud 7 Estimación puntual Métodos de los momentos DATOS VAR. ALEATORIA x1 , x2 ,… , xn a1 = n x i =1 i n x2 i =1 i = f X ( x,θ1 ,θ 2 ,...,θ r ) α1 = E[ X ] = g1 (θ1,θ 2 ,...,θ r ) n a2 n ⋮ ar = n xr i =1 i n α 2 = E[ X 2 ] = g 2 (θ1,θ 2 ,...,θ r ) ⋮ α r = E[ X r ] = g r (θ1,θ 2 ,...,θ r ) g1 (θˆ1,θˆ2 , … ,θˆr ) = a1 Estimadores g 2 (θˆ1,θˆ2 , … ,θˆr ) = a2 → θˆ1 ,θˆ2 , …,θˆr ⋮ g (θˆ ,θˆ , … ,θˆ ) = a r r r 1 2 Estimación puntual 8 Método de los momentos: Distribución normal 1 x − µ 2 1 exp − , 2 σ 2π σ f X ( x) = σ Parámetros : ¿ µ , σ ? µ x1, x2 ,…, xn a1 = a2 = n x i=1 i n n 2 x i=1 i n x∈ℜ f X (x, µ,σ ) µˆ = x α1 = E[ X ] = µ σˆ 2 = α2 = E[ X 2 ] = σ 2 + µ 2 1 xi2 − x 2 = s 2 n i =1 n 9 Estimación puntual Método de máxima verosimilitud Una fuente radiactiva emite partículas según un proceso de Poisson con media λ desconocida. Durante 10 minutos se han contado el número de partículas emitidas: 12, 6, 11, 3, 8, 5, 3, 9, 7, 5 P( X 1 = 12, X 2 = 6,..., X 10 = 5) = e −λ =e 12! −10λ l (λ ) = e −10λ Estimación puntual λ12 ×e −λ λ6 6! ×⋯× e λ12+6+⋯+5 12!×6!×⋯× 5! −λ =e λ5 5! −10λ λ69 12!×6!×⋯× 5! λ69 12!×6!×⋯ × 5! 10 Función de verosimilitud l (λ ) = e 2 4 6 8 10 6,9 λ69 −10λ 12!×6!×⋯ × 5! λ λˆ = 6,9 Estimador máximo-verosímil: 11 Estimación puntual Función de verosimilitud 0 1,6E-11 -5 1,4E-11 -10 1,2E-11 -15 1E-11 -20 8E-12 -25 6E-12 lambda −10λ λ69 12!×6!×⋯ × 5! L(λ) = log l(λ) 10 9,4 6,9 8,8 8,2 7,6 -40 7 0 6,4 -35 5,8 2E-12 5,2 -30 4 4E-12 l (λ ) = e log probabilidad 1,8E-11 4,6 probabilidad verosimilitud Estimador máximo-verosímil: λˆ = 6,9 Estimación puntual 12 Estimación por máxima verosimilitud X → f X ( x,θ1 , θ 2 ,..., θ r ) fX conocida Parámetros desconocidos : θ1 , θ 2 ,..., θ r Muestra aleatoria simple : x1 , x2 ,..., xn Distribución conjunta : f ( x1 , x2 ,..., xn ;θ1 ,..., θ r ) = = f X ( x1 ,θ1 , θ 2 ,..., θ r ) f X ( x2 , θ1 ,θ 2 ,..., θ r )⋯ f X ( xn ,θ1 , θ 2 ,..., θ r ) n log f ( x1 , x2 ,..., xn ) = log f X ( xi , θ1 ,θ 2 ,..., θ r ) = L(θ1 ,θ 2 ,..., θ r ) i =1 θˆ1 ,θˆ2 ,..., θˆr L(θˆ1 , θˆ2 ,..., θˆr ) = max L(θ1 , θ 2 ,..., θ r ) 13 Estimación puntual Máx. verosimilitud: Distribución normal 1 x − µ 2 1 exp− f X ( x) = , x ∈ ℜ 2π σ 2 σ Parámetros : ¿ µ , σ ? x1, x2 ,...,xn : muestraaleatoriasimple 1 1 1 1 − 2 ( xi −µ )2 1 − 2σ 2 ( x1 −µ )2 1 − 2σ 2 ( x2 −µ )2 1 − 2σ 2 ( xn −µ )2 1 i=1 f (x1, x2 ,...,xn ) = e e e e 2σ = ⋯ n/ 2 n (2π ) σ 2π σ 2πσ 2πσ n n 1 L(µ,σ 2 ) = log f (x1, x2 ,...,xn ) = − log(2π ) − logσ 2 − 2 in=1 (xi − µ)2 2 2 2σ ∂L 1 n ˆ µ x ( ) 0 = − = 1 = i i ∂µ σ 2 µˆ = x max L : 2 2 ∂L σˆ = s n 1 1 n 2 ∂σ 2 = − 2 σˆ 2 + 2σˆ 4 i=1 ( xi − µˆ ) = 0 Estimación puntual n 14 Máx. Verosimilitud: Poisson P( X = x) = e −λ λx x! Muestra aleatoria simple : x1 , x2 ,..., xn , x = 0,1,2,... → Parámetro λ p ( x1, x2 ,..., xn ) = P( X 1 = x1 , X 2 = x2 ,⋯ , X n = xn ) =e −λ λx 1 x1! e −λ λx 2 x2 ! ⋯e −λ λx n xn ! =e λΣ x i −λn x1! x2!⋯ xn ! L(λ ) = −λn + (Σ xi ) log λ − log xi ! max L(λ ) : Σx dL(λ ) = −n + i = 0 λˆ = x dλ λˆ 15 Estimación puntual Máx. verosimilitud: Binomial(n,p) Proporción defectuosas = ¿ p ? Muestra (Bernoulli ) : x1 , x 2 ,..., x n n 0 si es Aceptable xi = 1 si es Defectuosa p( x1 , x 2 ,..., x n ) = P( X 1 = x1 , X 2 = x 2 ,..., X n = x n ) = P( X 1 = x1 ) P ( X 2 = x 2 ) ⋯ P ( X n = x n ) x n− x = p i (1 − p ) i = p r (1 − p ) n−r donde r = xi es el nº de defectuosas L(p) = r log p + (n − r ) log(1 − p ) dL( p ) r n − r r = − = 0 → pˆ = dp pˆ 1 − pˆ n Estimación puntual 16 Distribución de media (normal) X 1 , X 2 ,..., X n σ X = µ X → N (µ ,σ ) X1 + X 2 + ⋯ + X n n E[ X 1 ] + E[ X 2 ] + ⋯ + E[ X n ] µ + µ + ⋯ + µ = =µ n n Var[ X 1 ] + Var[ X 2 ] + ⋯ + Var[ X n ] σ 2 + σ 2 + ⋯ + σ 2 σ 2 = = Var[ X ] = n n2 n2 E[ X ] = X → N (µ , σ n ) 17 Estimación puntual Histograma de Espesores 1000 frecuencia 800 600 400 200 0 230 235 240 245 250 255 260 Espesores Frecuencia/Probabilidad Distribución de la Media de 5 observaciones 1200 1000 800 600 400 200 0 230 235 240 245 250 255 260 Media Estimación puntual 18 Distribución de S2 (Normal) X 1 , X 2 ,..., X n σ ( X1 − X )2 + ( X 2 − X )2 + ⋯ + ( X n − X ) S = n 2 µ X → N (µ ,σ ) S2 = 1 n 1 n ( X i − X ) 2 = 1 X i2 − X 2 1 n n E[ S 2 ] = 1 1 n −1 2 σ2 Σ E[ X i2 ] − E[ X 2 ] = Σ (σ 2 + µ 2 ) − ( + µ2) = σ n n n n ( X − X )2 + ( X 2 − X )2 + ⋯ + ( X n − X )2 Sˆ 2 = 1 n −1 n S 2 E[ Sˆ 2 ] = σ 2 Sˆ 2 = n −1 19 Estimación puntual Distribución χ2 Z1, Z2 ,...,Zn → N (0,1) independientes Z12 + Z22 + ⋯+ Zn2 → χn2 Propiedades ⊗ E[χ n2 ] = n ⊗ Var[χ n2 ] = 2n ⊗ χ n2 + χ m2 = χ n2+ m Estimación puntual ( χ n2 y χ m2 indep.) 20 Chi-Cuadrado con 4 gl Distribución Chi-cuadrado con 4 g.l. 0.2 densidad 0.16 0.12 0.08 0.04 0 0 4 8 12 16 20 21 Estimación puntual Tabla χ2 α χν,1-α ν: grados de libertad (g.l.) EJEMPLO P(χ9 ≥ 19,02) = 0,025 Estimación puntual g.l. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 0,995 ,00004 ,01002 ,0717 0,207 0,412 0,676 0,989 1,344 1,735 2,156 2,603 3,074 3,565 4,075 4,601 5,142 5,697 6,265 6,844 7,434 8,034 8,643 9,260 9,886 10,520 11,160 11,808 12,461 13,121 13,787 20,707 27,991 35,534 43,275 51,172 59,196 67,328 83,852 0,990 ,00016 ,0201 0,115 0,297 0,554 0,872 1,239 1,647 2,088 2,558 3,053 3,571 4,107 4,660 5,229 5,812 6,408 7,015 7,633 8,260 8,897 9,542 10,196 10,856 11,524 12,198 12,878 13,565 14,256 14,953 22,164 29,707 37,485 45,442 53,540 61,754 70,065 86,923 0,975 ,00098 0,051 0,216 0,484 0,831 1,237 1,690 2,180 2,700 3,247 3,816 4,404 5,009 5,629 6,262 6,908 7,564 8,231 8,907 9,591 10,283 10,982 11,689 12,401 13,120 13,844 14,573 15,308 16,047 16,791 24,433 32,357 40,482 48,758 57,153 65,647 74,222 91,573 0,950 ,00393 0,103 0,352 0,711 1,145 1,635 2,167 2,733 3,325 3,940 4,575 5,226 5,892 6,571 7,261 7,962 8,672 9,390 10,117 10,851 11,591 12,338 13,091 13,848 14,611 15,379 16,151 16,928 17,708 18,493 26,509 34,764 43,188 51,739 60,391 69,126 77,929 95,705 0,500 0,455 1,386 2,366 3,357 4,351 5,348 6,346 7,344 8,343 9,342 10,341 11,340 12,340 13,339 14,339 15,338 16,338 17,338 18,338 19,337 20,337 21,337 22,337 23,337 24,337 25,336 26,336 27,336 28,336 29,336 39,335 49,335 59,335 69,334 79,334 89,334 99,334 119,334 0,050 3,841 5,991 7,815 9,488 11,07 12,59 14,07 15,51 16,92 18,31 19,68 21,03 22,36 23,68 25,00 26,30 27,59 28,87 30,14 31,41 32,67 33,92 35,17 36,42 37,65 38,89 40,11 41,34 42,56 43,77 55,76 67,50 79,08 90,53 101,88 113,15 124,34 146,57 0,025 5,024 7,378 9,348 11,14 12,83 14,45 16,01 17,53 19,02 20,48 21,92 23,34 24,74 26,12 27,49 28,85 30,19 31,53 32,85 34,17 35,48 36,78 38,08 39,36 40,65 41,92 43,19 44,46 45,72 46,98 59,34 71,42 83,30 95,02 106,63 118,14 129,56 152,21 0,010 6,635 9,210 11,34 13,28 15,09 16,81 18,48 20,09 21,67 23,21 24,73 26,22 27,69 29,14 30,58 32,00 33,41 34,81 36,19 37,57 38,93 40,29 41,64 42,98 44,31 45,64 46,96 48,28 49,59 50,89 63,69 76,15 88,38 100,43 112,33 124,12 135,81 158,95 0,005 7,879 10,60 12,84 14,86 16,75 18,55 20,28 21,95 23,59 25,19 26,76 28,30 29,82 31,32 32,80 34,27 35,72 37,16 38,58 40,00 41,40 42,80 44,18 45,56 46,93 48,29 49,65 50,99 52,34 53,67 66,77 79,49 91,95 104,21 116,32 128,30 140,17 163,65 22 Distribución de S2 (Normal) 23 Estimación puntual Distribución de S2 (Normal) nS 2 σ2 n X −X = i σ i =1 (n − 1) Sˆ 2 σ2 Estimación puntual n 2 dist → χ n2−1 X −X = i σ i =1 2 dist → χ n2−1 24 Histograma de Espesores 1000 frecuencia 800 600 400 200 0 230 235 240 245 250 255 260 Espesores Histograma para Varianzas 500 frecuencia 400 300 200 100 0 0 20 40 60 80 varianza muestral 25 Estimación puntual Distribución de la media (general) X i → f ( x,θ ) : Var[ X i ] < ∞ X = ( X 1 , X 2 ,..., X n )T , → Vector de n variables aleatorias independientes X1 + X 2 + ⋯ + X n n E[ X 1 ] + E[ X 2 ] + ⋯ + E[ X n ] E[ X ] = n Var[ X 1 ] + Var[ X 2 ] + ⋯ + Var[ X n ] Var[ X ] = n2 Si las variables tienen la misma media y varianza X= µ = E[X i ] ∀i σ 2 = Var[X i ] ∀i n→∞ E[ X ] = µ X1 + X 2 + ⋯ + X n σ X= σ 2 X → N (µ , ) n n Var[ X ] = n Estimación puntual 26 Binomial Binomial : X 1 , X 2 ,..., X n E[ X i ] = p 0 si es Aceptable Xi = Var[ X i ] = p (1 − p ) 1 si es Defectuosa E[ pˆ ] = p X1 + X 2 + ⋯ + X n p (1 − p ) → pˆ = Var[ pˆ ] = n n pˆ → N ( p, n →∞ p (1 − p ) ) n 27 Estimación puntual Poisson Poisson : X 1 , X 2 ,..., X n λk E[ X i ] = λ k! Var[ X i ] = λ E[λˆ ] = λ X X X + + + ⋯ n 1 2 λˆ = → ˆ] = λ λ Var [ n n P( X i = k ) = e −λ λˆ → N (λ , n →∞ Estimación puntual λ n ) 28 Propiedades de los estimadores X 1 , X 2 ,..., X n m.a.s de f ( x ,θ ) : θˆ ≡ θˆ ( X 1 , X 2 ,..., X n ) (Sesgo[θˆ] = E[θˆ] − θ ) Centrados: E[θˆ] = θ Varianza mínima: ∀θˆ': Var[θˆ] ≤ Var[θˆ' ] Error cuadrático medio mínimo ECM[θˆ] = E[(θˆ − θ ) 2 ] = Sesgo 2 (θˆ) + Var (θˆ) Consistentes lim E[θˆ] = θ n →∞ y lim Var[θˆ] = 0 n →∞ 29 Estimación puntual Ejemplo 1 1 n X 1 , X 2 ,..., X n m.a.s de N ( µ , σ ) : X = X i n i =1 Es centrado : E[ X ] = µ Es de varianza mínima Es consistente : lim E[ X ] = µ y n →∞ Estimación puntual lim Var[ X ] = 0 n →∞ 30 Ejemplo 2 1 n X 1 , X 2 ,..., X n m.a.s de N ( µ , σ ) : S = ( X i − X ) 2 n i =1 n −1 2 σ No es centrado : E [ S 2 ] = n 2 2 Sesgo ( S ) = − σ2 n Varianza : nS 2 2 ( n − 1) 4 σ Var 2 = Var χ n2−1 = 2( n − 1) Var [ S 2 ] = 2 σ n [ ] Es consistent e : lim n→∞ E[ S 2 ] = σ 2 y lim n→∞ Var[ S 2 ] = 0 31 Estimación puntual Concepto de intervalo de confianza Se ha realizado una encuesta a 400 personas elegidas al azar para estimar la proporción p de votantes de un partido político. ¿p? Intervalos de confianza Resultado Encuesta Sí 220 No/Otros 180 32 Introducción aprox . X → B (n, p ) pˆ = X → N ( np , np (1 − p ) ) X → N ( p, n p (1 − p ) ) n N(0,1) pˆ − p → N ( 0 ,1) p (1 − p ) n 33 Intervalos de confianza Nivel de CONFIANZA α/2 N(0,1) α/2 1-α -zα/2 zα/2 pˆ − p ≤ zα / 2 ) = 1 − α p(1 − p) n pˆ − p Despejando p de : − zα / 2 ≤ ≤ zα / 2 p (1 − p ) n P(− zα / 2 ≤ Intervalos de confianza 34 − zα / 2 ≤ − zα / 2 ≤ pˆ − zα / 2 pˆ (1 − pˆ ) ≤ n pˆ − p ≤ zα / 2 p(1 − p ) n pˆ − p ≤ zα / 2 pˆ (1 − pˆ ) n Nivel de confianza: (1-α) Tamaño n Muestral Intervalos de confianza Ejemplo pˆ = 0,63 0,55× 0,45 400 n = 100 n = 400 0,51 0,67 0.55× 0.45 400 n = 100 n = 400 0,49 Intervalos de confianza 95 % 0,55 0,59 0,43 p ∈ 0.55 ± 2.58 35 220 = 0,55 400 0,47 p ∈ 0,55±1,96 pˆ (1 − pˆ ) n p ≤ pˆ + zα / 2 0,55 99 % 0,61 36 1. Normal: Intervalo para µ con σ conocido X 1 , X 2 ,..., X n → N ( µ ,σ ) X → N (µ , σ n ) N(0,1) X −µ → N (0,1) σ/ n X −µ − zα / 2 ≤ ≤z σ / n α /2 x − zα / 2 σ n ≤ µ ≤ x + zα / 2 α/2 α/2 -zα/2 σ n zα/2 µ ∈ x ± zα / 2 σ n 37 Intervalos de confianza 2. Normal:Intervalo para µ con σ desconocido X → N (µ , σ n ) X 1, X 2 ,..., X n → N ( µ ,σ ) X −µ tn-1 → N (0,1) σ/ n α/2 X −µ → tn −1 Sˆ / n - tα/2 tα/2 X −µ − t n −1,α / 2 ≤ ≤ tn −1,α / 2 Sˆ / n sˆ sˆ sˆ ≤ µ ≤ x + tn −1,α / 2 x − t n −1,α / 2 µ ∈ x ± tn−1,α / 2 n n n Intervalos de confianza α/2 38 Distribución t de Student Z → N (0,1) V → χ 2p Z ,V son independientes Z → tp V/p -4,00 -3,00 N(0,1) t4 t2 t1 -2,00 -1,00 0,00 1,00 2,00 3,00 4,00 39 Intervalos de confianza 3. Normal: Intervalo para σ2 X 1, X 2 ,..., X n → N ( µ ,σ ) 2 n X − X ( ) i S = i =1 ˆ2 (n − 1) Sˆ 2 σ2 n −1 2 P( χα / 2 ≤ (n − 1) sˆ 2 χ12−α / 2 (n − 1) Sˆ 2 σ2 2 ≤σ ≤ Intervalos de confianza → χ n2−1 ≤ χ12−α / 2 ) = 1 − α (n − 1) sˆ 2 2 χα / 2 χ n2−1 α/2 χα2 / 2 α/2 χ12−α / 2 40 EJEMPLO 1. La resistencia a la compresión de 15 probetas de acero elegidas al azar es: 40,15 65,10 49,50 22,40 38,20 60,40 43,40 26,35 31,20 55,60 47,25 73,20 35,90 45,25 52,40 X −µ → t14 Sˆ / 15 − 2,98 ≤ t14 X −µ ≤ 2,98 Sˆ / 15 0,005 x = 45,75 sˆ = 14,2 14,2 14,2 45,75 − 2,98 ≤ µ ≤ 45,75 + 2,98 15 15 99 % confianza: 0,005 - 2,98 2,98 34,8 ≤ µ ≤ 56,7 41 Intervalos de confianza 2 χ 14 0,005 0,005 0,00 5,00 10,00 15,00 20,00 25,00 ( n − 1) Sˆ 2 P(4,07 ≤ 35,00 31,3 4,07 σ2 30,00 → χ n2−1 14 Sˆ 2 sˆ 2 = 201,6 σ 2 14 Sˆ 2 σ2 2 → χ14 ≤ 31,3) = 0,99 14 × 201,6 14 × 201,6 ≤σ2 ≤ 31,3 4,07 99% confianza: 90,2 ≤ σ2 ≤ 693,6 Intervalos de confianza 42 4. Poisson: Intervalo para λ X 1 , X 2 ,… , X n → Poisson (λ ) aprox λˆ = X → N(λ , λ n ) N(0,1) α/2 α/2 λˆ − λ -zα/2 zα/2 → N(0,1) λ/n λˆ − λ P (− zα / 2 ≤ ≤ zα / 2 ) = 1 − α λ/n λˆ λˆ ˆ ˆ λ − zα / 2 ≤ λ ≤ λ + zα / 2 n n 43 Intervalos de confianza α Tabla t-Student α tν,α ν: grados de libertad (g.l.) EJEMPLO P(t9 ≥ 2,262) = 0,025 Intervalos de confianza g.l 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 infinito 0,20 1,376 1,061 0,978 0,941 0,920 0,906 0,896 0,889 0,883 0,879 0,876 0,873 0,870 0,868 0,866 0,865 0,863 0,862 0,861 0,860 0,859 0,858 0,858 0,857 0,856 0,856 0,855 0,855 0,854 0,854 0,851 0,849 0,848 0,847 0,846 0,846 0,845 0,842 0,20 0,15 1,963 1,386 1,250 1,190 1,156 1,134 1,119 1,108 1,100 1,093 1,088 1,083 1,079 1,076 1,074 1,071 1,069 1,067 1,066 1,064 1,063 1,061 1,060 1,059 1,058 1,058 1,057 1,056 1,055 1,055 1,050 1,047 1,045 1,044 1,043 1,042 1,042 1,036 0,15 0,10 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,303 1,299 1,296 1,294 1,292 1,291 1,290 1,282 0,10 0,05 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,684 1,676 1,671 1,667 1,664 1,662 1,660 1,645 0,05 0,025 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,021 2,009 2,000 1,994 1,990 1,987 1,984 1,960 0,025 0,01 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,423 2,403 2,390 2,381 2,374 2,368 2,364 2,327 0,01 0,005 63,656 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,704 2,678 2,660 2,648 2,639 2,632 2,626 2,576 0,005 0,0025 127,321 14,089 7,453 5,598 4,773 4,317 4,029 3,833 3,690 3,581 3,497 3,428 3,372 3,326 3,286 3,252 3,222 3,197 3,174 3,153 3,135 3,119 3,104 3,091 3,078 3,067 3,057 3,047 3,038 3,030 2,971 2,937 2,915 2,899 2,887 2,878 2,871 2,808 0,0025 0,001 318,289 22,328 10,214 7,173 5,894 5,208 4,785 4,501 4,297 4,144 4,025 3,930 3,852 3,787 3,733 3,686 3,646 3,610 3,579 3,552 3,527 3,505 3,485 3,467 3,450 3,435 3,421 3,408 3,396 3,385 3,307 3,261 3,232 3,211 3,195 3,183 3,174 3,091 0,001 0,0005 636,578 31,600 12,924 8,610 6,869 5,959 5,408 5,041 4,781 4,587 4,437 4,318 4,221 4,140 4,073 4,015 3,965 3,922 3,883 3,850 3,819 3,792 3,768 3,745 3,725 3,707 3,689 3,674 3,660 3,646 3,551 3,496 3,460 3,435 3,416 3,402 3,390 3,291 0,0005 44 α Tabla χ2 α χν,1-α ν: grados de libertad (g.l.) EJEMPLO P(χ9 ≥ 19,02) = 0,025 Intervalos de confianza g.l. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 0,995 ,00004 ,01002 ,0717 0,207 0,412 0,676 0,989 1,344 1,735 2,156 2,603 3,074 3,565 4,075 4,601 5,142 5,697 6,265 6,844 7,434 8,034 8,643 9,260 9,886 10,520 11,160 11,808 12,461 13,121 13,787 20,707 27,991 35,534 43,275 51,172 59,196 67,328 83,852 0,990 ,00016 ,0201 0,115 0,297 0,554 0,872 1,239 1,647 2,088 2,558 3,053 3,571 4,107 4,660 5,229 5,812 6,408 7,015 7,633 8,260 8,897 9,542 10,196 10,856 11,524 12,198 12,878 13,565 14,256 14,953 22,164 29,707 37,485 45,442 53,540 61,754 70,065 86,923 0,975 ,00098 0,051 0,216 0,484 0,831 1,237 1,690 2,180 2,700 3,247 3,816 4,404 5,009 5,629 6,262 6,908 7,564 8,231 8,907 9,591 10,283 10,982 11,689 12,401 13,120 13,844 14,573 15,308 16,047 16,791 24,433 32,357 40,482 48,758 57,153 65,647 74,222 91,573 0,950 ,00393 0,103 0,352 0,711 1,145 1,635 2,167 2,733 3,325 3,940 4,575 5,226 5,892 6,571 7,261 7,962 8,672 9,390 10,117 10,851 11,591 12,338 13,091 13,848 14,611 15,379 16,151 16,928 17,708 18,493 26,509 34,764 43,188 51,739 60,391 69,126 77,929 95,705 0,500 0,455 1,386 2,366 3,357 4,351 5,348 6,346 7,344 8,343 9,342 10,341 11,340 12,340 13,339 14,339 15,338 16,338 17,338 18,338 19,337 20,337 21,337 22,337 23,337 24,337 25,336 26,336 27,336 28,336 29,336 39,335 49,335 59,335 69,334 79,334 89,334 99,334 119,334 0,050 3,841 5,991 7,815 9,488 11,07 12,59 14,07 15,51 16,92 18,31 19,68 21,03 22,36 23,68 25,00 26,30 27,59 28,87 30,14 31,41 32,67 33,92 35,17 36,42 37,65 38,89 40,11 41,34 42,56 43,77 55,76 67,50 79,08 90,53 101,88 113,15 124,34 146,57 0,025 5,024 7,378 9,348 11,14 12,83 14,45 16,01 17,53 19,02 20,48 21,92 23,34 24,74 26,12 27,49 28,85 30,19 31,53 32,85 34,17 35,48 36,78 38,08 39,36 40,65 41,92 43,19 44,46 45,72 46,98 59,34 71,42 83,30 95,02 106,63 118,14 129,56 152,21 0,010 6,635 9,210 11,34 13,28 15,09 16,81 18,48 20,09 21,67 23,21 24,73 26,22 27,69 29,14 30,58 32,00 33,41 34,81 36,19 37,57 38,93 40,29 41,64 42,98 44,31 45,64 46,96 48,28 49,59 50,89 63,69 76,15 88,38 100,43 112,33 124,12 135,81 158,95 0,005 7,879 10,60 12,84 14,86 16,75 18,55 20,28 21,95 23,59 25,19 26,76 28,30 29,82 31,32 32,80 34,27 35,72 37,16 38,58 40,00 41,40 42,80 44,18 45,56 46,93 48,29 49,65 50,99 52,34 53,67 66,77 79,49 91,95 104,21 116,32 128,30 140,17 163,65 45 Capı́tulo 5: Ejercicios propuestos 1. La variable aleatoria X tiene distribución binomial con parámetros n y p, ambos desconocidos. Si {16,18,22,25,27} es una muestra aleatoria simple de la distribución anterior, estimar por el método de los momentos n y p. 2. Los taxis en servicio de una ciudad están numerados del 1 al N. Se observa una muestra de 10 taxis y se apuntan sus números. Obtener un estimador de N por el método de los momentos. 3. Una variable aleatoria discreta puede tomar los valores 0, 1 y 2 con probabilidades 1.5/θ, 2.5/θ y (θ − 4)/θ respectivamente. Se toma una muestra de tamaño 25 con los resultados siguientes (la segunda fila corresponde a la fracción observada Oi para 0, 1 y 2). x Oi 0 17 1 5 2 3 (a) Estimar θ por máxima verosimilitud. (b) Se ha tomado una muestra de tamaño 10 del tiempo, en minutos, entre el paso de dos autobuses T en una parada con los siguientes resultados: 9,10,6,4,15,6,1,5,4,10. (c) Si la función de distribución del tiempo de paso es F (t) = 1−exp(−αt), calcular la probabilidad estimada de esperar al autobús más de 10 minutos. 4. La función de distribución de una variable aleatoria es x < 0, 0 α (x/β) 0 ≤ x ≤ β, F (x) = 1 x > β. donde los parámetros α y β son positivos. Estimar los parámetros de la distribución por el método de máxima verosimilitud. 5. El club de tiro de una determinada ciudad está estudiando la distancia X del punto de impacto del proyectil al centro de la diana de sus 13 mejores tiradores. Sabiendo que la función de densidad de la variable aleatoria presentada es 2x x2 x ≥ 0, θ ≥ 0, 2 exp[− 2 ], θ θ Estimar θ si la distancia en cm al blanco de 10 tiradores fue f (x) = 2,1 3,2 6,3 5,4 2,2 6,9 7,1 6,6 2,5 9,1 y la distancia de los otros tres fue mayor que la distancia máxima permitida en su categorı́a que es de 11cm. 6. Una compañı́a, para determinar el número de consumidores de un determinado producto en Madrid, ha encuestado a personas elegidas al azar hasta encontrar a 20 que utilicen el producto. Estimar por máxima verosimilitud la proporción de consumidores en la ciudad si el número total de entrevistados ha sido 115 1 7. Se supone que el tiempo que tarda un paciente en recuperarse totalmente de una dolencia cuando se le aplica el tratamiento A es una variable aleatoria exponencial. Si al observar a 20 pacientes, al cabo de 20 dı́as 15 no se han recuperado, mientras que los 5 restantes tardaron 17, 15, 19, 18 y 17 dı́as en hacerlo, estime por máxima verosimilitud el tiempo medio hasta la recuperación total.. 8. El tiempo de duración de ciertos componentes electrónicos es una variable aleatoria con distribución exponencial. Se ha realizado un ensayo con 10 componentes cuyos tiempos de duración han sido: 37,45,92,104,109,200,295. Despues de 400 horas, tres componentes seguı́an funcionando. Con esta información, estimar por máxima verosimilitud el parámetro de la distribución exponencial. 9. Sea X1 , X2 , ..., Xn una muestra aleatoria simple de la función de densidad f (x) = 2(θ − x)/θ2 , 0 ≤ x ≤ θ. Obtener por el método de los momentos un estimador insesgado de θ y calcular su varianza. 10. Sea X la media aritmética de una muestra aleatoria simple de una distribución N(µ, σ). Se define X̂ = cX como nuevo estimador para µ. Determinar c (en función de µ y σ) para que el nuevo estimador tenga Error Cuadrático Medio (ECM) mı́nimo. Calcular c si se sabe que el coeficiente de variación σ/µ = 2. 11. x1 , x2 , ..., xn es una muestra aleatoria simple de una distribución normal con parámetros desconocidos. Para estimar la varianza se propone el siguiente estimador S2 = k n−1 X n X (xi − xj )2 . i=1 j=i+1 Determinar k para que el estimador sea centrado. 12. Para estimar la media σ 2 de una población normal se utiliza el estimador σ b2 = kb s2 , siendo sb2 la varianza muestral corregida y k una constante. Calcular el valor de k que minimiza el error cuadrático medio. (Utilizar V ar[χ2g ] = 2g, siendo g el número de grados de libertad). 13. Los tiempos de funcionamiento de dos componentes electrónicos distintos siguen distribuciones exponenciales con esperanzas µ y 2µ. Se han obtenido los tiempos de fallo de una muestra de cada tipo de componente, en ambos casos de tamaño n. Obtener el estimador de máxima verosimilitud de µ, calcular su media y su varianza. 14. Un sistema de lectura telemática de consumo de energı́a eléctrica emplea un mensaje de 128bit. Ocasionalmente las interferencias aleatorias provocan que un bit se invierta produciéndose un error de transmisión. Se acepta que la probabilidad de que cada bit cambie en una transmisión es constante e igual a p, y que los cambios son independientes. Estima el valor de p si se ha comprobado que de las últimas 10000 lecturas efectuadas (todas de 128-bit) 340 eran erróneas. 15. Un estudiante ha realizado el siguiente ejercicio de simulación. Ha generado con STATGRAPHICS 100 observaciones de una normal de media 10 y desviación tı́pica 1. Para estos 100 datos ha obtenido la mediana y la ha denominado M1 . Ha repetido el mismo proceso n= 10000 veces. De forma que ha obtenido M1 , M2 , ..., Mn . En el gráfico se muestra el histograma de estos 10000 valores, que tienen media 10.002 y desviación tı́pica 0.1266. 2 A partir de esta simulación, explica qué propiedades tiene la mediana como estimador de la media de una distribución normal, sus ventajas e inconvenientes. 16. Se han tomado 12 valores de una variable fı́sica X, que se supone sigue una distribucin Normal, resultando 30.2, 30.8, 29.3, 29, 30.9, 30.8, 29.7, 28.9, 30.5, 31.2, 31.3, 28.5. (a) Construir un intervalo de confianza para la media de la población al 95% de confianza. (b) Construir un intervalo de confianza para la varianza de la población con el mismo nivel de confianza del apartado anterior. 17. En la lista adjunta se indica la edad y el área cientı́fica en que trece importantes cientı́ficos de diversas áreas descubrieron la teorı́a que les ha dado la fama. Construir con estos datos un intervalo de confianza para la edad a la que los cientı́ficos realizan su contribución más importante: Galileo (34, astronomı́a), Franklin (40, electricidad), Lavoisier (31, quı́mica), Lyell (33, geologı́a), Darwin (49, biologı́a), Maxwell (33, ecuaciones de la luz), Curie (34, radiactividad), Plank (43, teorı́a cuántica), Marx (30, socialismo cientı́fico), Freud (31, psicoanálisis), Bohr (26, modelo del átomo), Einstein (26, relatividad), Keynes (36, macroeconomı́a). 18. Una muestra de 12 estaciones de servicio de una cadena de gasolineras proporciona un ingreso medio por persona al mes de 2340 euros con una desviación tı́pica de 815 euros. Calcular un intervalo de confianza para el ingreso medio por trabajador en esta empresa. Calcular el número de estaciones que debemos estudiar para que el intervalo tenga una amplitud máxima de 500 euros. 19. Se han escogido al azar 15 probetas de un determinado acero, cuya resistencia a la compresión se supone que se distribuye normalmente, y se ha medido ésta en las unidades adecuadas, habiéndose observado los resultados siguientes 40.15, 65.10, 49.5, 22.4, 38.2, 60.4, 43.4, 26.35, 31.2, 55.6, 47.25, 73.2, 35.9, 45.25, 52.4 (a) Estimar la resistencia media del acero y su varianza. 3 (b) Hallar un intervalo de confianza del 99% para la resistencia media. (c) Hallar un intervalo de confianza del 99% para la varianza. (d) Cuántas probetas deberı́an haberse utilizado en el estudio si se quisiera estimar la resistencia media del acero con una precisión de ±6 unidades y una confianza del 95%?. 20. Una compañı́a de comida precocinada desea lanzar al mercado un nuevo producto. Para conocer la aceptación del mismo realiza previamente una encuesta entre 200 personas elegidas al azar, de las que 37 manifiestan su disposición a comprarlo. Obtener un intervalo de confianza (α = 0.05) para la proporción p de compradores potenciales de este nuevo producto. ¿Cúal deberı́a ser el tamaño muestral si se quisiera reducir la longitud del intervalo a la mitad. 21. Se desea estimar la proporción de niños entre 0 y 14 años que se encuentran adecuadamente vacunados contra la poliomielitis. Si se quiere que la diferencia en valor absoluto entre la estimación final y el verdadero valor de la proporción sea menor que 0.05 con probabilidad 0.95, ¿ Cúal es el tamaño muestral mı́nimo requerido?. 22. Una roca lunar es enviada a un laboratorio para determinar su nivel de radiactividad θ, nivel que se mide por el número medio de partı́culas emitidas por hora. Después de 15 horas, el equipo Geiger ha contabilizado un total de 3.547 partı́culas emitidas. Aceptando que el número de partı́culas emitidas sigue una distribución de Poisson, dar un intervalo con 95% de confianza para el nivel de radiactividad de la roca. (Nota.- Utilizar que si Z tiene distribución N(0,1), entonces P (Z ≤ 1.96) = 0.975). 23. Teniendo en cuenta que si X1 , X2 , . . . , Xn es una muestra aleatoria simple de una variable aleatoria exponencial con función de densidad, f (x) = λ1 e−x/λ , x ≥ 0, λ > 0; el estadı́stico U = 2nX/λ tiene distribución χ22n , donde X = (X1 +X2 +· · ·+Xn )/n; resolver la cuestión siguiente: El tiempo de funcionamiento de un equipo electrónico es una variable aleatoria con distribución exponencial. Se han tomado los tiempos de funcionamiento hasta el fallo de 30 equipos elegidos al azar, obteniéndose 6.2 × 103 horas de media. Calcular un intervalo con 95 % de confianza para la vida media de un equipo. 24. En una centralita ha habido 180 llamadas durante las últimas dos horas. Obtenga un intervalo de confianza para la esperanza del número de llamadas por hora suponiendo que el número de llamadas durante un periodo de duración T cualquiera sigue una distribución de Poisson. 25. La velocidad de una molécula según el modelo de Maxwell, es una variable aleatoria con función de densidad √4 × 1 x2 exp −(x/α)2 , x ≥ 0 f (x) = π α3 0, x ≤ 0. donde α > 0, es el parámetro de la distribución y se verifica que 2α 3 4 E(X) = √ y V ar(X) = − α2 . 2 π π (a) Calcular el estimador máximo verosı́mil de α y su varianza asintótica. (b) Calcular el estimador por momentos de α y la varianza de dicho estimador. 4 (c) Para una muestra de tamaño n=100, para la que se verifica que 100 P i=1 xi = 342 y que 100 P i=1 x2i = 1339, hallar un intervalo de confianza de α con el 95% de confianza utilizando ambos estimadores. 26. Los núcleos (radionucleidos) del elemento radiactivo Carbono 14 (C 14 ) se desintegran aleatoriamente. El tiempo que tarda en desintegrarse cada radionucleido es una variable aleatoria con distribución exponencial de media 8, 27 × 103 años. (a) Si inicialmente habı́a 1012 radionucleidos, obtener el número esperado de los radionucleidos sin desintegrar al cabo de los 20.000 años. (b) Obtener, para la variable aleatoria número de radionucleidos sin desintegrar al cabo de 20.000 años, un intervalo que contenga al valor de esa variable con probabilidad 0, 95 e interpretar el resultado. (c) Una pieza arqueológica ha estado enterrada durante 20.000 años al cabo de los cuales se han observado 1010 radionucleidos de C 14 . Estimar por el método de los momentos el número inicial de radionucleidos N y calcular la media y la varianza del estimador obtenido. (d) Determinar el tiempo que debe transcurrir para que el número de radionucleidos iniciales se reduzca a la mitad. 5 Estadística Parte II. Inferencia Tema 6. Contraste de Hipótesis Karl Pearson (1857-1936) Contraste de Hipótesis Se ha realizado una encuesta a 400 personas elegidas al azar Llamando p a la proporción de votantes del partido político A. Podemos afirmar que p > 0.5. ¿p? Resultado Encuesta Sí No/Otros Contrastes de hipótesis 220 180 2 Contraste de hipótesis H0 : p ≤ 0.5 H1 : p > 0.5 Pˆ → N ( p, H0 : p = 0 .5 H1 : p > 0 .5 p (1 − p ) ) n Si H 0 es cierto p = 0.5 Pˆ − 0.5 → N (0,1) 0.5 × 0.5 400 3 Contrastes de hipótesis Nivel de significación α α = P( rechazar H0 | H0 es cierta) Región de Aceptación de Ho N(0,1) Región de Rechazo Ho α zα Contrastes de hipótesis 4 0.55 − 0.5 =2 0.5 × 0.5 400 Elegido el nivel de significación α = 0.05 Muestra pˆ = 0.55 z0 = R.R. H0 R.A. Ho 0.05 0 1.64 2 z0 = 2 > zα = 1.64 Se rechaza H 0 Con un nivel de significación de α = 0.05 p > 0.5 5 Contrastes de hipótesis Probabilidad de Aceptar Ho H0 CIERTA α Error I p=0.5 0.5 H0 FALSA Error II p = 0.6 c Probabilidad de Rechazar Ho β c 0.6 Rechazar Ho Aceptar Ho c Contrastes de hipótesis 6 Tipos de errores RESULTADO CONTRASTE Se Rechaza Ho REALIDAD Se Acepta Ho Ho CIERTA Ho FALSA Ok Error tipo I Error tipo II Ok α β 7 Contrastes de hipótesis Tipos de Contrastes H0 : p = 0 .5 H0 : p = 0 .5 H1 : p > 0 .5 H1 : p ≠ 0 .5 BILATERAL UNILATERAL R.R.Ho R.R.Ho R.A. Ho α zα α/2 R.R.Ho α/2 R.A. Ho -zα/2 zα/2 Nivel de significación α Contrastes de hipótesis 8 Nivel crítico o p-valor H0 : p = p0 H1 : p > p0 Pˆ → N ( p, p (1 − p ) ) n p − valor = Pr ( Pˆ > pˆ | H 0 es cierto) Pˆ − p0 pˆ − p0 > = Pr( ) p0 (1 − p0 ) p0 (1 − p0 ) n n = Pr( Z > z0 ) 9 Contrastes de hipótesis Ejemplo Datos: pˆ = 220 = 0.55 400 R.R. H0 Región de Aceptación Ho 0 α = 0.05 p − valor 0.0228 2 1.64 Contrastes de hipótesis 10 Relación entre p-valor y α R.R. H0 p-valor < α α p − valor < α 0 Se rechaza H0 zα R.R. H0 p-valor ≥ α α p − valor ≥ α No se rechaza H0 0 zα 11 Contrastes de hipótesis 1. Normal: Contraste para µ con σ conocido X1, X 2 ,..., X n → N (µ,σ ) H 0 : µ = µ0 X → N (µ , σ n ) X −µ → N (0,1) σ/ n x − µ0 z0 = σ/ n Contrastes de hipótesis R.R R.R. H1 : µ ≠ µ 0 1-α α/2 N(0,1) α/2 R. Acept. -zα/2 zα/2 z0 ≤ zα / 2 No se rechaza H 0 z0 > zα / 2 Se rechaza H 0 12 2. Normal: Contraste para µ con σ desconocido X 1, X 2 ,..., X n → N ( µ ,σ ) H 0 : µ = µ0 X → N (µ , σ n R.R R.R. H1 : µ ≠ µ 0 ) 1-α α/2 X −µ → tn−1 ˆ S/ n x − µ0 t0 = sˆ / n tn-1 α/2 R. Acept. -tα/2 tα/2 t0 ≤ tα / 2 No se rechaza H 0 t0 > tα / 2 Se rechaza H 0 13 Contrastes de hipótesis 3. Normal: Contraste para σ2 X 1 , X 2 ,..., X n → N ( µ ,σ ) H 0 : σ 2 = σ 02 H0 : σ 2 χ n2−1 RRHo α/2 ≠ σ 02 R. A. Ho RRHo α/2 1 2 n 2 2 χ χ − ( ) Sˆ 2 = X X 1 −α / 2 α / 2 i n − 1 i =1 (n − 1) Sˆ 2 2 P( χα2 / 2 ≤ χ n2−1 ≤ χ12−α / 2 ) = 1 − α → χ n − 1 2 σ Datos: ŝ2 (n − 1) sˆ 2 2 χ0 = 2 σ0 Contrastes de hipótesis [ ∉ [χα χ 02 ∈ χα2 / 2 , χ12−α / 2 χ 02 2 2 / 2 , χ1−α / 2 ] ] No rechazo H 0 Rechazo H 0 14 EJEMPLO 1. La resistencia a la compresión de 15 probetas de acero elegidas al azar es: 40,15 65,10 49,50 22,40 38,20 60,40 43,40 26,35 31,20 55,60 47,25 73,20 35,90 45,25 52,40 H 0 : µ = 60 t14 α = 0.01 H1 : µ ≠ 60 0,005 X −µ → t14 ˆ S / 15 P(−2,98 ≤ t14 ≤ 2,98) = 0.99 Datos: 0,005 - 2,98 2,98 45,75 − 60 = −3.88 14,2 / 15 Como 3.88 > 2.98 Se rechaza H0 con α=0.01 x = 45,75 sˆ = 14,2 t0 = 15 Contrastes de hipótesis H 0 : σ 2 = 200 ( n − 1) Sˆ 2 H1 : σ 2 ≠ 200 σ 2 → 14 Sˆ 2 χ n2−1 σ 2 2 → χ14 2 P (4,07 ≤ χ14 ≤ 31,3) = 0,99 2 χ 14 0,005 0,00 Datos: 0,005 5,00 10,00 15,00 20,00 25,00 30,00 35,00 31,3 4,07 14 × 201,6 = 14.1 200 Como 4,07 ≤ 14,1 ≤ 31,3 No se rechaza H0 sˆ 2 = 201,6 Contrastes de hipótesis χ 02 = 16 4. Poisson: Contraste para λ X1, X 2 ,…, X n → Poisson (λ ) aprox λ ˆ λ = X → N(λ , ) n λˆ − λ Z= → N(0,1) λ H 0 : λ = λ0 H1 : λ ≠ λ0 P(− zα / 2 ≤ Z ≤ zα / 2 ) = 1 − α λˆ − λ0 z0 = λ0 R.R R.R. 1-α α/2 n nivel de significación α N(0,1) α/2 R. Acept. -zα/2 zα/2 z0 ≤ zα / 2 No se rechaza H 0 z0 > zα / 2 Se rechaza H 0 n 17 Contrastes de hipótesis Comparación de dos tratamientos A 51,3 39,4 26,3 39,0 48,1 34,2 69,8 31,3 45,2 46,4 B 29,6 47,0 25,9 13,0 33,1 22,1 34,1 19,5 43,8 24,9 Contrastes de hipótesis Sea desea comparar dos tratamientos para reducir el nivel de colesterol en la sangre. Se seleccionan 20 individuos y se asignan al azar a dos tipos de dietas A y B. La tabla muestra la reducción conseguida después de dos meses. 18 Método: 4 pasos Definición del modelo de distribución de probabilidad: Hipótesis Parámetros Estimación de los parámetros Diagnosis de las hipótesis Aplicación 19 Contrastes de hipótesis Modelo σ σ µ1 µ2 y11 y12 y 21 ⋮ y1n1 Contrastes de hipótesis y 22 ⋮ y 2 n2 M O D E L O D A T O S 20 Modelo: Hipótesis y Parámetros Hipótesis básicas: Normalidad Parámetros µ1 µ2 yij N(µi,σ2) Homocedasticidad σ2 Var [yij] = σ2 Independencia Cov [yij, ykl] = 0 21 Contrastes de hipótesis Modelo yij = µ i + uij , uij → N (0, σ 2 ) Las observaciones se descomponen en: Parte predecible µi Parte aleatoria uij σ 0 Contrastes de hipótesis 22 Estimación medias: n1 A 51,3 39,4 26,3 39,0 48,1 34,2 69,8 31,3 45,2 46,4 43,1 y1 j µ1 : → y1• = j =1 n1 n2 y2 j µ 2 : → y2• = j =1 n2 B 29,6 47,0 25,9 13,0 33,1 22,1 34,1 19,5 43,8 24,9 29,3 23 Contrastes de hipótesis Estimación varianza (residuos) yij = µ i + uij , uij → N (0, σ 2 ) Residuos A 8,2 -3,7 -16,8 -4,1 5,0 -8,9 26,7 -11,8 2,1 3,3 0,0 uij = yij − µ i eij = yij − yi• eij : RESIDUO 2 ni eij2 σ 2 : → sˆR2 = i =1 j =1 n−2 n i j =1 Contrastes de hipótesis B 0,3 17,7 -3,4 -16,3 3,8 -7,2 4,8 -9,8 14,5 -4,4 0,0 eij = 0;sˆ R2 = 130 .95 24 2 ˆ s Varianza residual: R σ σ µ1 y11 y12 2 sˆ = ⋮ 1 y1 n1 µ2 ( y1 j − y1• ) y 21 y 22 2 sˆ = ⋮ 2 y 2 n 2 2 n1 − 1 2 ni e sˆR2 = 2 ij i =1 j =1 = n−2 ( y 2 j − y 2• ) 2 n2 − 1 n1 − 1 2 n2 − 1 2 sˆ1 + sˆ2 n−2 n−2 25 Contrastes de hipótesis Diferencia de medias: y1• − y2• σ σ µ1 y11 y12 ⋮ y1 n1 µ2 y1• → N ( µ 1 , σ2 σ 2 n1 σ2 ) n1 n2 ( y1• − y2• ) − ( µ1 − µ 2 ) → N (0,1) 1 1 + σ n1 n2 y1• − y2• → N ( µ1 − µ 2 , Contrastes de hipótesis + y 21 y 22 ⋮ y 2 n 2 y 2• → N ( µ 2 , σ 2 n2 ) ) ( y1• − y2• ) − ( µ1 − µ 2 ) → tn−2 1 1 + sˆR n1 n2 26 Contraste de igualdad de medias H 0 : µ1 = µ 2 H1 : µ1 ≠ µ 2 y − y2• t0 = 1• → tn−2 1 1 sˆR + n1 n2 R.R R.R. tn-2 1-α α/2 R. Acept. -tα/2 α/2 tα/2 t0 ≤ tα / 2 No se rechaza H 0 t0 > tα / 2 Se rechaza H 0 27 Contrastes de hipótesis Ejemplo: α = 0.05 H 0 : µ1 = µ 2 H1 : µ1 ≠ µ 2 43.1 − 29.3 t0 = = 2.69 1 1 11.44 + 10 10 R.R. t18 R.R 0.025 0.025 -2.10 2.10 2.69 > 2.10 Se rechaza H 0 Contrastes de hipótesis 28 Ejemplo: α = 0.01 H 0 : µ1 = µ 2 H1 : µ1 ≠ µ 2 43.1 − 29.3 t0 = = 2.69 1 1 11.44 + 10 10 R.R R.R. 0.005 0.99 t18 0.005 α/2 -2.88 2.88 2.69 ≤ 2.88 No se rechaza H 0 29 Contrastes de hipótesis Nivel crítico (bilateral) H 0 : µ1 = µ 2 t18 H 1 : µ1 ≠ µ 2 43.1 − 29.3 t0 = = 2.69 1 1 11.44 + 10 10 0.0074 -2.69 0.0074 2.69 p − valor = Pr( t18 > 2.69) = 0.0147 •α = 0.05 > p-valor Se rechaza H0 •α = 0.01 < p-valor No se rechaza H0 Contrastes de hipótesis 30 Conclusiones (fijado α) Si |to| > tα/2 se dice que la diferencia de medias es significativa. O simplemente que los tratamientos son distintos (tienen medias distintas) Contrastes de hipótesis Si |to| ≤ tα/2 se dice que la diferencia de medias no es significativa. No hay evidencia suficiente para afirmar que las medias de los tratamientos sean diferentes. 31 No rechazar Ho, no implica que Ho sea cierta El resultado |to| ≤ tα/2, (no se rechaza Ho) no debe interpretarse como que “se ha demostrado que las dos medias son iguales”. No-rechazar la hipótesis nula implica que la diferencia entre las medias µ1 - µ2 no es lo suficientemente grande como para ser detectada con el tamaño muestral dado. Contrastes de hipótesis 32 Intervalo de confianza para la diferencia de medias: µ1 − µ 2 ( y1• − y2• ) − ( µ1 − µ 2 ) → tn−2 1 1 sˆR + α/2 n1 n2 tn-2 α/2 1-α -tα/2 Pr { − tα / 2 ≤ tα/2 ( y1• − y2• ) − ( µ1 − µ 2 ) ≤ tα / 2 } = 1 − α 1 1 sˆR + n1 n2 µ1 − µ 2 ∈ ( y1• − y2• ) ± tα / 2 sˆR 1 1 + n1 n2 33 Contrastes de hipótesis Ejemplo: intervalo de confianza µ1 − µ 2 t18 0.025 0.025 -2.10 2.10 1 1 µ1 − µ 2 ∈ ( y1• − y 2 • ) ± tα / 2 sˆ R + n1 n 2 µ1 − µ 2 ∈ ( 43 .1 − 29 .3) ± 2 .10 × 11 .44 × 1 1 + 10 10 µ1 − µ 2 ∈ 13 .8 ± 10 .74 Contrastes de hipótesis 34 Hipótesis de homocedasticidad σ1 σ2 µ1 y11 y12 2 sˆ = ⋮ 1 y1 n1 µ2 y 21 y 22 2 sˆ = ⋮ 2 y 2 n 2 ( y1 j − y1• ) 2 n1 − 1 ( y 2 j − y 2• ) 2 n2 − 1 H 0 : σ 12 = σ 22 H1 : σ 12 ≠ σ 22 35 Contrastes de hipótesis Distribución F y11 y12 2 sˆ = ⋮ 1 y1n1 y 21 y 22 2 sˆ = ⋮ 2 y 2 n2 ( y1 j − y1• ) 2 n1 − 1 ( n1 − 1) sˆ12 σ 12 → 1 F= Contrastes de hipótesis ( n2 − 1) sˆ22 χ n21 −1 χ n2 −1 χ n22 −1 ( y 2 j − y 2• ) 2 σ 22 n2 − 1 → χ n22 −1 sˆ12 ( n1 − 1) ( n2 − 1) = σ 12 sˆ22 σ 22 → Fn1 −1,n2 −1 36 Distribución F F40,40 F20,40 F10,40 F5,40 37 Contrastes de hipótesis Algunas distribuciones F F10,80 F10,40 F10,20 F10,10 Contrastes de hipótesis 38 Contraste de igualdad de varianzas H 0 : σ 12 = σ 22 H1 : σ 12 ≠ σ 22 Si H 0 es cierto σ 12 = σ 22 , sˆ12 F0 = 2 → Fn1 −1,n2 −1 sˆ1 RR α/2 RR 1-α R.A. Ho F1-α/2 α/2 Fα/2 Si F0 ∈ [F1−α / 2 , Fα / 2 ] No se rechaza H 0 Si F0 ∉ [F1−α / 2 , Fα / 2 ] Se rechaza H 0 39 Contrastes de hipótesis Ejemplo: Contraste de igualdad de varianzas H 0 : σ 12 = σ 22 H1 : σ 12 ≠ σ 22 sˆ12 = 154.02 sˆ22 = 111.7 154.02 F0 = = 1.37 111.7 RR 0.025 0.248 1.37 RR 0.025 4.03 1.37 ∈ [0.248,4.03] No se rechaza H 0 Contrastes de hipótesis 40 Tabla F Fν1 ,ν 2 ,α P ( Fν1 ,ν 2 ≥ Fν1 ,ν 2 ,α ) = α Grados de libertad del denominador: ν2 α=0.05 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf 1 161,4 18,51 10,13 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,84 4,75 4,67 4,60 4,54 4,49 4,45 4,41 4,38 4,35 4,32 4,30 4,28 4,26 4,24 4,23 4,21 4,20 4,18 4,17 4,08 4,03 4,00 3,98 3,96 3,95 3,94 3,92 3,84 1 2 199,5 19,00 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,98 3,89 3,81 3,74 3,68 3,63 3,59 3,55 3,52 3,49 3,47 3,44 3,42 3,40 3,39 3,37 3,35 3,34 3,33 3,32 3,23 3,18 3,15 3,13 3,11 3,10 3,09 3,07 3,00 2 3 215,7 19,16 9,28 6,59 5,41 4,76 4,35 4,07 3,86 3,71 3,59 3,49 3,41 3,34 3,29 3,24 3,20 3,16 3,13 3,10 3,07 3,05 3,03 3,01 2,99 2,98 2,96 2,95 2,93 2,92 2,84 2,79 2,76 2,74 2,72 2,71 2,70 2,68 2,60 3 4 224,6 19,25 9,12 6,39 5,19 4,53 4,12 3,84 3,63 3,48 3,36 3,26 3,18 3,11 3,06 3,01 2,96 2,93 2,90 2,87 2,84 2,82 2,80 2,78 2,76 2,74 2,73 2,71 2,70 2,69 2,61 2,56 2,53 2,50 2,49 2,47 2,46 2,45 2,37 4 5 230,2 19,30 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3,11 3,03 2,96 2,90 2,85 2,81 2,77 2,74 2,71 2,68 2,66 2,64 2,62 2,60 2,59 2,57 2,56 2,55 2,53 2,45 2,40 2,37 2,35 2,33 2,32 2,31 2,29 2,21 5 6 234,0 19,33 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,53 2,51 2,49 2,47 2,46 2,45 2,43 2,42 2,34 2,29 2,25 2,23 2,21 2,20 2,19 2,18 2,10 6 7 236,8 19,35 8,89 6,09 4,88 4,21 3,79 3,50 3,29 3,14 3,01 2,91 2,83 2,76 2,71 2,66 2,61 2,58 2,54 2,51 2,49 2,46 2,44 2,42 2,40 2,39 2,37 2,36 2,35 2,33 2,25 2,20 2,17 2,14 2,13 2,11 2,10 2,09 2,01 7 8 238,9 19,37 8,85 6,04 4,82 4,15 3,73 3,44 3,23 3,07 2,95 2,85 2,77 2,70 2,64 2,59 2,55 2,51 2,48 2,45 2,42 2,40 2,37 2,36 2,34 2,32 2,31 2,29 2,28 2,27 2,18 2,13 2,10 2,07 2,06 2,04 2,03 2,02 1,94 8 9 240,5 19,38 8,81 6,00 4,77 4,10 3,68 3,39 3,18 3,02 2,90 2,80 2,71 2,65 2,59 2,54 2,49 2,46 2,42 2,39 2,37 2,34 2,32 2,30 2,28 2,27 2,25 2,24 2,22 2,21 2,12 2,07 2,04 2,02 2,00 1,99 1,97 1,96 1,88 9 10 241,9 19,40 8,79 5,96 4,74 4,06 3,64 3,35 3,14 2,98 2,85 2,75 2,67 2,60 2,54 2,49 2,45 2,41 2,38 2,35 2,32 2,30 2,27 2,25 2,24 2,22 2,20 2,19 2,18 2,16 2,08 2,03 1,99 1,97 1,95 1,94 1,93 1,91 1,83 10 12 243,9 19,41 8,74 5,91 4,68 4,00 3,57 3,28 3,07 2,91 2,79 2,69 2,60 2,53 2,48 2,42 2,38 2,34 2,31 2,28 2,25 2,23 2,20 2,18 2,16 2,15 2,13 2,12 2,10 2,09 2,00 1,95 1,92 1,89 1,88 1,86 1,85 1,83 1,75 12 15 245,9 19,43 8,70 5,86 4,62 3,94 3,51 3,22 3,01 2,85 2,72 2,62 2,53 2,46 2,40 2,35 2,31 2,27 2,23 2,20 2,18 2,15 2,13 2,11 2,09 2,07 2,06 2,04 2,03 2,01 1,92 1,87 1,84 1,81 1,79 1,78 1,77 1,75 1,67 15 20 248,0 19,45 8,66 5,80 4,56 3,87 3,44 3,15 2,94 2,77 2,65 2,54 2,46 2,39 2,33 2,28 2,23 2,19 2,16 2,12 2,10 2,07 2,05 2,03 2,01 1,99 1,97 1,96 1,94 1,93 1,84 1,78 1,75 1,72 1,70 1,69 1,68 1,66 1,57 20 24 249,1 19,45 8,64 5,77 4,53 3,84 3,41 3,12 2,90 2,74 2,61 2,51 2,42 2,35 2,29 2,24 2,19 2,15 2,11 2,08 2,05 2,03 2,01 1,98 1,96 1,95 1,93 1,91 1,90 1,89 1,79 1,74 1,70 1,67 1,65 1,64 1,63 1,61 1,52 24 30 250,1 19,46 8,62 5,75 4,50 3,81 3,38 3,08 2,86 2,70 2,57 2,47 2,38 2,31 2,25 2,19 2,15 2,11 2,07 2,04 2,01 1,98 1,96 1,94 1,92 1,90 1,88 1,87 1,85 1,84 1,74 1,69 1,65 1,62 1,60 1,59 1,57 1,55 1,46 30 40 251,1 19,47 8,59 5,72 4,46 3,77 3,34 3,04 2,83 2,66 2,53 2,43 2,34 2,27 2,20 2,15 2,10 2,06 2,03 1,99 1,96 1,94 1,91 1,89 1,87 1,85 1,84 1,82 1,81 1,79 1,69 1,63 1,59 1,57 1,54 1,53 1,52 1,50 1,39 40 60 252,2 19,48 8,57 5,69 4,43 3,74 3,30 3,01 2,79 2,62 2,49 2,38 2,30 2,22 2,16 2,11 2,06 2,02 1,98 1,95 1,92 1,89 1,86 1,84 1,82 1,80 1,79 1,77 1,75 1,74 1,64 1,58 1,53 1,50 1,48 1,46 1,45 1,43 1,32 60 100 253,0 19,49 8,55 5,66 4,41 3,71 3,27 2,97 2,76 2,59 2,46 2,35 2,26 2,19 2,12 2,07 2,02 1,98 1,94 1,91 1,88 1,85 1,82 1,80 1,78 1,76 1,74 1,73 1,71 1,70 1,59 1,52 1,48 1,45 1,43 1,41 1,39 1,37 1,24 100 120 253,3 19,49 8,55 5,66 4,40 3,70 3,27 2,97 2,75 2,58 2,45 2,34 2,25 2,18 2,11 2,06 2,01 1,97 1,93 1,90 1,87 1,84 1,81 1,79 1,77 1,75 1,73 1,71 1,70 1,68 1,58 1,51 1,47 1,44 1,41 1,39 1,38 1,35 1,22 120 Inf. 254,3 19,50 8,53 5,63 4,37 3,67 3,23 2,93 2,71 2,54 2,40 2,30 2,21 2,13 2,07 2,01 1,96 1,92 1,88 1,84 1,81 1,78 1,76 1,73 1,71 1,69 1,67 1,65 1,64 1,62 1,51 1,44 1,39 1,35 1,32 1,30 1,28 1,25 1,00 Inf. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf Ejemplo : P ( F7,8 ≥ 3.50) = 0.05 Tabla F Fν1 ,ν 2 ,α P ( Fν1 ,ν 2 ≥ Fν1 ,ν 2 ,α ) = α Grados de libertad del denominador: ν2 α=0.025 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf 1 647,8 38,51 17,44 12,22 10,01 8,81 8,07 7,57 7,21 6,94 6,72 6,55 6,41 6,30 6,20 6,12 6,04 5,98 5,92 5,87 5,83 5,79 5,75 5,72 5,69 5,66 5,63 5,61 5,59 5,57 5,42 5,34 5,29 5,25 5,22 5,20 5,18 5,15 5,02 1 2 799,5 39,00 16,04 10,65 8,43 7,26 6,54 6,06 5,71 5,46 5,26 5,10 4,97 4,86 4,77 4,69 4,62 4,56 4,51 4,46 4,42 4,38 4,35 4,32 4,29 4,27 4,24 4,22 4,20 4,18 4,05 3,97 3,93 3,89 3,86 3,84 3,83 3,80 3,69 2 3 864,2 39,17 15,44 9,98 7,76 6,60 5,89 5,42 5,08 4,83 4,63 4,47 4,35 4,24 4,15 4,08 4,01 3,95 3,90 3,86 3,82 3,78 3,75 3,72 3,69 3,67 3,65 3,63 3,61 3,59 3,46 3,39 3,34 3,31 3,28 3,26 3,25 3,23 3,12 3 4 899,6 39,25 15,10 9,60 7,39 6,23 5,52 5,05 4,72 4,47 4,28 4,12 4,00 3,89 3,80 3,73 3,66 3,61 3,56 3,51 3,48 3,44 3,41 3,38 3,35 3,33 3,31 3,29 3,27 3,25 3,13 3,05 3,01 2,97 2,95 2,93 2,92 2,89 2,79 4 5 921,8 39,30 14,88 9,36 7,15 5,99 5,29 4,82 4,48 4,24 4,04 3,89 3,77 3,66 3,58 3,50 3,44 3,38 3,33 3,29 3,25 3,22 3,18 3,15 3,13 3,10 3,08 3,06 3,04 3,03 2,90 2,83 2,79 2,75 2,73 2,71 2,70 2,67 2,57 5 6 937,1 39,33 14,73 9,20 6,98 5,82 5,12 4,65 4,32 4,07 3,88 3,73 3,60 3,50 3,41 3,34 3,28 3,22 3,17 3,13 3,09 3,05 3,02 2,99 2,97 2,94 2,92 2,90 2,88 2,87 2,74 2,67 2,63 2,59 2,57 2,55 2,54 2,52 2,41 6 7 948,2 39,36 14,62 9,07 6,85 5,70 4,99 4,53 4,20 3,95 3,76 3,61 3,48 3,38 3,29 3,22 3,16 3,10 3,05 3,01 2,97 2,93 2,90 2,87 2,85 2,82 2,80 2,78 2,76 2,75 2,62 2,55 2,51 2,47 2,45 2,43 2,42 2,39 2,29 7 Ejemplo : P ( F7,8 ≥ 4.53) = 0.025 8 956,6 39,37 14,54 8,98 6,76 5,60 4,90 4,43 4,10 3,85 3,66 3,51 3,39 3,29 3,20 3,12 3,06 3,01 2,96 2,91 2,87 2,84 2,81 2,78 2,75 2,73 2,71 2,69 2,67 2,65 2,53 2,46 2,41 2,38 2,35 2,34 2,32 2,30 2,19 8 9 963,3 39,39 14,47 8,90 6,68 5,52 4,82 4,36 4,03 3,78 3,59 3,44 3,31 3,21 3,12 3,05 2,98 2,93 2,88 2,84 2,80 2,76 2,73 2,70 2,68 2,65 2,63 2,61 2,59 2,57 2,45 2,38 2,33 2,30 2,28 2,26 2,24 2,22 2,11 9 10 968,6 39,40 14,42 8,84 6,62 5,46 4,76 4,30 3,96 3,72 3,53 3,37 3,25 3,15 3,06 2,99 2,92 2,87 2,82 2,77 2,73 2,70 2,67 2,64 2,61 2,59 2,57 2,55 2,53 2,51 2,39 2,32 2,27 2,24 2,21 2,19 2,18 2,16 2,05 10 12 976,7 39,41 14,34 8,75 6,52 5,37 4,67 4,20 3,87 3,62 3,43 3,28 3,15 3,05 2,96 2,89 2,82 2,77 2,72 2,68 2,64 2,60 2,57 2,54 2,51 2,49 2,47 2,45 2,43 2,41 2,29 2,22 2,17 2,14 2,11 2,09 2,08 2,05 1,94 12 15 984,9 39,43 14,25 8,66 6,43 5,27 4,57 4,10 3,77 3,52 3,33 3,18 3,05 2,95 2,86 2,79 2,72 2,67 2,62 2,57 2,53 2,50 2,47 2,44 2,41 2,39 2,36 2,34 2,32 2,31 2,18 2,11 2,06 2,03 2,00 1,98 1,97 1,94 1,83 15 20 993,1 39,45 14,17 8,56 6,33 5,17 4,47 4,00 3,67 3,42 3,23 3,07 2,95 2,84 2,76 2,68 2,62 2,56 2,51 2,46 2,42 2,39 2,36 2,33 2,30 2,28 2,25 2,23 2,21 2,20 2,07 1,99 1,94 1,91 1,88 1,86 1,85 1,82 1,71 20 24 30 40 60 100 120 Inf. 997,3 1001,4 1005,6 1009,8 1013,2 1014,0 1018,3 39,46 39,46 39,47 39,48 39,49 39,49 39,50 14,12 14,08 14,04 13,99 13,96 13,95 13,90 8,51 8,46 8,41 8,36 8,32 8,31 8,26 6,28 6,23 6,18 6,12 6,08 6,07 6,02 5,12 5,07 5,01 4,96 4,92 4,90 4,85 4,41 4,36 4,31 4,25 4,21 4,20 4,14 3,95 3,89 3,84 3,78 3,74 3,73 3,67 3,61 3,56 3,51 3,45 3,40 3,39 3,33 3,37 3,31 3,26 3,20 3,15 3,14 3,08 3,17 3,12 3,06 3,00 2,96 2,94 2,88 3,02 2,96 2,91 2,85 2,80 2,79 2,72 2,89 2,84 2,78 2,72 2,67 2,66 2,60 2,79 2,73 2,67 2,61 2,56 2,55 2,49 2,70 2,64 2,59 2,52 2,47 2,46 2,40 2,63 2,57 2,51 2,45 2,40 2,38 2,32 2,56 2,50 2,44 2,38 2,33 2,32 2,25 2,50 2,44 2,38 2,32 2,27 2,26 2,19 2,45 2,39 2,33 2,27 2,22 2,20 2,13 2,41 2,35 2,29 2,22 2,17 2,16 2,09 2,37 2,31 2,25 2,18 2,13 2,11 2,04 2,33 2,27 2,21 2,14 2,09 2,08 2,00 2,30 2,24 2,18 2,11 2,06 2,04 1,97 2,27 2,21 2,15 2,08 2,02 2,01 1,94 2,24 2,18 2,12 2,05 2,00 1,98 1,91 2,22 2,16 2,09 2,03 1,97 1,95 1,88 2,19 2,13 2,07 2,00 1,94 1,93 1,85 2,17 2,11 2,05 1,98 1,92 1,91 1,83 2,15 2,09 2,03 1,96 1,90 1,89 1,81 2,14 2,07 2,01 1,94 1,88 1,87 1,79 2,01 1,94 1,88 1,80 1,74 1,72 1,64 1,93 1,87 1,80 1,72 1,66 1,64 1,55 1,88 1,82 1,74 1,67 1,60 1,58 1,48 1,85 1,78 1,71 1,63 1,56 1,54 1,44 1,82 1,75 1,68 1,60 1,53 1,51 1,40 1,80 1,73 1,66 1,58 1,50 1,48 1,37 1,78 1,71 1,64 1,56 1,48 1,46 1,35 1,76 1,69 1,61 1,53 1,45 1,43 1,31 1,64 1,57 1,48 1,39 1,30 1,27 1,00 24 30 40 60 100 120 Inf. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf Tabla F Fν1 ,ν 2 ,α P ( Fν1 ,ν 2 ≥ Fν1 ,ν 2 ,α ) = α Grados de libertad del denominador: ν2 α=0.01 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf 1 4052,2 98,50 34,12 21,20 16,26 13,75 12,25 11,26 10,56 10,04 9,65 9,33 9,07 8,86 8,68 8,53 8,40 8,29 8,18 8,10 8,02 7,95 7,88 7,82 7,77 7,72 7,68 7,64 7,60 7,56 7,31 7,17 7,08 7,01 6,96 6,93 6,90 6,85 6,63 1 2 4999,3 99,00 30,82 18,00 13,27 10,92 9,55 8,65 8,02 7,56 7,21 6,93 6,70 6,51 6,36 6,23 6,11 6,01 5,93 5,85 5,78 5,72 5,66 5,61 5,57 5,53 5,49 5,45 5,42 5,39 5,18 5,06 4,98 4,92 4,88 4,85 4,82 4,79 4,61 2 3 5403,5 99,16 29,46 16,69 12,06 9,78 8,45 7,59 6,99 6,55 6,22 5,95 5,74 5,56 5,42 5,29 5,19 5,09 5,01 4,94 4,87 4,82 4,76 4,72 4,68 4,64 4,60 4,57 4,54 4,51 4,31 4,20 4,13 4,07 4,04 4,01 3,98 3,95 3,78 3 4 5624,3 99,25 28,71 15,98 11,39 9,15 7,85 7,01 6,42 5,99 5,67 5,41 5,21 5,04 4,89 4,77 4,67 4,58 4,50 4,43 4,37 4,31 4,26 4,22 4,18 4,14 4,11 4,07 4,04 4,02 3,83 3,72 3,65 3,60 3,56 3,53 3,51 3,48 3,32 4 5 5764,0 99,30 28,24 15,52 10,97 8,75 7,46 6,63 6,06 5,64 5,32 5,06 4,86 4,69 4,56 4,44 4,34 4,25 4,17 4,10 4,04 3,99 3,94 3,90 3,85 3,82 3,78 3,75 3,73 3,70 3,51 3,41 3,34 3,29 3,26 3,23 3,21 3,17 3,02 5 6 5859,0 99,33 27,91 15,21 10,67 8,47 7,19 6,37 5,80 5,39 5,07 4,82 4,62 4,46 4,32 4,20 4,10 4,01 3,94 3,87 3,81 3,76 3,71 3,67 3,63 3,59 3,56 3,53 3,50 3,47 3,29 3,19 3,12 3,07 3,04 3,01 2,99 2,96 2,80 6 7 5928,3 99,36 27,67 14,98 10,46 8,26 6,99 6,18 5,61 5,20 4,89 4,64 4,44 4,28 4,14 4,03 3,93 3,84 3,77 3,70 3,64 3,59 3,54 3,50 3,46 3,42 3,39 3,36 3,33 3,30 3,12 3,02 2,95 2,91 2,87 2,84 2,82 2,79 2,64 7 8 5981,0 99,38 27,49 14,80 10,29 8,10 6,84 6,03 5,47 5,06 4,74 4,50 4,30 4,14 4,00 3,89 3,79 3,71 3,63 3,56 3,51 3,45 3,41 3,36 3,32 3,29 3,26 3,23 3,20 3,17 2,99 2,89 2,82 2,78 2,74 2,72 2,69 2,66 2,51 8 9 6022,4 99,39 27,34 14,66 10,16 7,98 6,72 5,91 5,35 4,94 4,63 4,39 4,19 4,03 3,89 3,78 3,68 3,60 3,52 3,46 3,40 3,35 3,30 3,26 3,22 3,18 3,15 3,12 3,09 3,07 2,89 2,78 2,72 2,67 2,64 2,61 2,59 2,56 2,41 9 10 6055,9 99,40 27,23 14,55 10,05 7,87 6,62 5,81 5,26 4,85 4,54 4,30 4,10 3,94 3,80 3,69 3,59 3,51 3,43 3,37 3,31 3,26 3,21 3,17 3,13 3,09 3,06 3,03 3,00 2,98 2,80 2,70 2,63 2,59 2,55 2,52 2,50 2,47 2,32 10 12 6106,7 99,42 27,05 14,37 9,89 7,72 6,47 5,67 5,11 4,71 4,40 4,16 3,96 3,80 3,67 3,55 3,46 3,37 3,30 3,23 3,17 3,12 3,07 3,03 2,99 2,96 2,93 2,90 2,87 2,84 2,66 2,56 2,50 2,45 2,42 2,39 2,37 2,34 2,18 12 15 6157,0 99,43 26,87 14,20 9,72 7,56 6,31 5,52 4,96 4,56 4,25 4,01 3,82 3,66 3,52 3,41 3,31 3,23 3,15 3,09 3,03 2,98 2,93 2,89 2,85 2,81 2,78 2,75 2,73 2,70 2,52 2,42 2,35 2,31 2,27 2,24 2,22 2,19 2,04 15 20 6208,7 99,45 26,69 14,02 9,55 7,40 6,16 5,36 4,81 4,41 4,10 3,86 3,66 3,51 3,37 3,26 3,16 3,08 3,00 2,94 2,88 2,83 2,78 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,37 2,27 2,20 2,15 2,12 2,09 2,07 2,03 1,88 20 24 6234,3 99,46 26,60 13,93 9,47 7,31 6,07 5,28 4,73 4,33 4,02 3,78 3,59 3,43 3,29 3,18 3,08 3,00 2,92 2,86 2,80 2,75 2,70 2,66 2,62 2,58 2,55 2,52 2,49 2,47 2,29 2,18 2,12 2,07 2,03 2,00 1,98 1,95 1,79 24 30 6260,4 99,47 26,50 13,84 9,38 7,23 5,99 5,20 4,65 4,25 3,94 3,70 3,51 3,35 3,21 3,10 3,00 2,92 2,84 2,78 2,72 2,67 2,62 2,58 2,54 2,50 2,47 2,44 2,41 2,39 2,20 2,10 2,03 1,98 1,94 1,92 1,89 1,86 1,70 30 40 6286,4 99,48 26,41 13,75 9,29 7,14 5,91 5,12 4,57 4,17 3,86 3,62 3,43 3,27 3,13 3,02 2,92 2,84 2,76 2,69 2,64 2,58 2,54 2,49 2,45 2,42 2,38 2,35 2,33 2,30 2,11 2,01 1,94 1,89 1,85 1,82 1,80 1,76 1,59 40 60 6313,0 99,48 26,32 13,65 9,20 7,06 5,82 5,03 4,48 4,08 3,78 3,54 3,34 3,18 3,05 2,93 2,83 2,75 2,67 2,61 2,55 2,50 2,45 2,40 2,36 2,33 2,29 2,26 2,23 2,21 2,02 1,91 1,84 1,78 1,75 1,72 1,69 1,66 1,47 60 100 6333,9 99,49 26,24 13,58 9,13 6,99 5,75 4,96 4,41 4,01 3,71 3,47 3,27 3,11 2,98 2,86 2,76 2,68 2,60 2,54 2,48 2,42 2,37 2,33 2,29 2,25 2,22 2,19 2,16 2,13 1,94 1,82 1,75 1,70 1,65 1,62 1,60 1,56 1,36 100 120 6339,5 99,49 26,22 13,56 9,11 6,97 5,74 4,95 4,40 4,00 3,69 3,45 3,25 3,09 2,96 2,84 2,75 2,66 2,58 2,52 2,46 2,40 2,35 2,31 2,27 2,23 2,20 2,17 2,14 2,11 1,92 1,80 1,73 1,67 1,63 1,60 1,57 1,53 1,32 120 Inf. 6365,6 99,50 26,13 13,46 9,02 6,88 5,65 4,86 4,31 3,91 3,60 3,36 3,17 3,00 2,87 2,75 2,65 2,57 2,49 2,42 2,36 2,31 2,26 2,21 2,17 2,13 2,10 2,06 2,03 2,01 1,80 1,68 1,60 1,54 1,49 1,46 1,43 1,38 1,00 Inf. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf Ejemplo : P ( F7,8 ≥ 6.18) = 0.01 Contraste χ2 de bondad de ajuste POBLACIÓN X σ MUESTRA n ¿Tienen los datos distribución Normal? x1, x2 ,..., xn µ ¿ X → N (µ , σ ) ? Datos Conocidos µˆ = x σˆ = sˆ Contrastes de hipótesis 44 Espesores de 150 obleas de Silicio (micras) 240 243 250 253 248 238 242 245 251 247 239 242 246 250 248 X 235 237 246 249 246 240 241 246 247 249 240 243 244 248 245 240 243 244 249 246 245 250 250 247 248 238 240 245 248 246 240 242 246 249 248 240 243 246 250 248 241 245 243 247 245 247 245 255 250 249 237 239 243 247 246 242 244 245 248 245 237 239 242 247 245 242 244 246 251 248 243 245 247 252 249 243 245 248 251 250 244 246 246 250 246 241 239 244 250 246 242 245 248 251 249 242 245 248 243 246 241 244 245 249 247 236 239 241 246 242 243 246 247 252 247 241 243 245 248 246 239 240 242 243 244 239 240 250 252 250 241 243 249 255 253 45 Contrastes de hipótesis ¿Tiene distribución normal? Histograma para Espesor frecuencia 40 30 20 10 0 230 235 240 245 250 255 260 Espesor Contrastes de hipótesis 46 Contraste χ2 de bondad de ajuste H 0 : X i , ∀i = 1,2,..., n → f X H1 : X i , ∀i = 1,2,..., n → / fX Si H 0 es cierto : Clases Fr. Observada Fr. Esperada co ≤ xi < c1 c1 ≤ xi < c2 O1 O2 E1 E2 ⋮ ck −1 ≤ xi < ck ⋮ Ok ⋮ Ek ⋮ cK −1 ≤ xi < cK ⋮ OK ⋮ EK Ek = npk pk = Pr(ck −1 ≤ X < ck ) K K k =1 k =1 Ok = Ek = n (Ok − Ek ) 2 → χ K2 − r −1 Ek k =1 K 47 Contrastes de hipótesis Justificación del contraste χ2 n →∞ Ok → B (n, pk ) → Ok → N (npk , npk (1 − pk ) ) Ek = npk Ok − npk → N (0,1) npk (1 − pk ) ≅1 Ok − Ek Ok − Ek → N (0,1) Ek Ek k =1 K K ≡ Nº de CLASES Contrastes de hipótesis 2 2 aprox → χ K − r −1 r ≡ Nº de parámetro estimados 48 Obleas: Frecuencias Observadas Clase -inf 238 240 242 244 246 248 250 252 Fr. Observada Oi 7 16 17 21 34 24 20 7 4 150 238 240 242 244 246 248 250 252 +inf Total x = 245.1 micras sˆ = 4 micras 49 Contrastes de hipótesis Frecuencias esperadas N(245.1;4) Clase -inf 238 240 242 244 246 248 250 252 238 240 242 244 246 248 250 252 +inf Total Fr. Observada Oi 7 16 17 21 34 24 20 7 4 150 Fr. Esperada Ei 5,88 9,58 17,71 25,71 29,35 26,34 18,58 10,3 6,54 150 p4 = Pr( 242 ≤ X ≤ 244) 242 − 245.1 X − 245.1 244 − 245.1 ≤ ≤ ) 4 4 4 = P (−0.275 ≤ Z ≤ −0.775) = 0.1714 = Pr( E4 = np4 = 150 × 0.1714 = 25.71 Contrastes de hipótesis 50 Contraste de Normalidad H 0 : xi → Normal H1 : xi → / Normal χ 02 (7 − 5.88) 2 (16 − 9,58) 2 (4 − 6.54) 2 = + +⋯+ = 8.5 5.88 9.58 6.54 0,160 0,140 0,120 p − valor = 0.2037 0,100 0,080 0,060 α = 0.05 0,040 0,020 0,000 0,00 5,00 Pr( χ 62 ≤ 12.59) = 0.95 10,00 12,59 15,00 20,00 χ 02 = 8.5 < 12.59 No se rechaza la hipótesis de normalidad 51 Contrastes de hipótesis Se ha lanzado 300 veces un dado y se han obtenido los resultados: Resultados Observadas 1 49 2 59 3 49 4 51 5 43 6 49 Total 300 ¿Se puede afirmar con α=0.05 que el dado está desequilibrado? Contrastes de hipótesis 52 Pr( X = i) = 1 / 6, ∀i = 1,2,...,6 H o : xi → Equiprobable H1 : xi → No equiprobable χ 02 = Resultados Observados Esperados 1 49 50 2 59 50 3 49 50 4 51 50 5 43 50 6 49 50 Total 300 300 (49 − 50) 2 (59 − 50) 2 (49 − 50) 2 + +⋯+ = 2.68 50 50 50 Pr( χ 52 ≤ 11.07) = 0.95 χ 02 = 2.68 < 11.07 No se Rechaza H 0 0,180 0,160 χ 52 0,140 p-valor = 0.749 0,120 0,100 0,080 0,060 α=0.05 0,040 0,020 0,000 0,00 Contrastes de hipótesis 2.68 5,00 10,00 11.07 15,00 53 Capı́tulo 6: Ejercicios propuestos 1. Un proceso industrial fabrica piezas cuya longitud en mm se distribuye según una N (190, 10). Una muestra de 5 piezas proporciona los resultados siguientes: 187, 212, 195, 208, 192 (a) Contrastar la hipótesis de que la media del proceso µ es efectivamente 190. (b) Contrastar la hipótesis de que la varianza del proceso σ 2 es 100 (c) Admitiendo que la varianza del proceso es 100, construir la curva de potencia para un contraste de la media con 5 observaciones. Tómese α = 0.05 en todos los contrastes. 2. Para contrastar unilateralmente que la esperanza µ de una variable aleatoria normal es 10, se toma una muestra de tamaño 16 y se rechaza la hipótesis en el caso en que la media muestral sea mayor que 11, aceptándose en el caso contrario. Sabiendo que la desviación tı́pica de la población es σ = 2, ¿cúal es la probabilidad de error de tipo I de este contraste?. ¿Cúal serı́a la probabilidad de error de tipo II del contraste si el valor verdadero de la esperanza fuese 12?. 3. Una medicina estándar es efectiva en el 75% de los casos en los que se aplica. Se ha comprobado un nuevo medicamento en 100 pacientes, observándose su efectividad en 85 de ellos. ¿ Es la nueva medicina más efectiva que la estándar ? (Contrastar con α = 0.05). 4. Un empresario quiere comprar una empresa que fabrica cojinetes. Durante los 5 últimos años la proporción de cojinetes defectuosos se ha mantenido en un 3%. Para verificar esto, se toma una muestra de 200 cojinetes y obtiene que 9 son defectuosos. ¿Se puede concluir que la proporción de cojinetes defectuosos ha aumentado? Calcular la potencia del contraste planteado anteriormente en función de p. Calcular la probabilidad de error de tipo II cuando la hipótesis alternativa es p = 0.06, siendo p la proporción de defectuosos.(Nota: Utilı́cese la aproximación normal y α = 0, 05.). 5. Teniendo en cuenta que si X1 , X2 , . . . , Xn es una muestra aleatoria simple de una variable aleatoria exponencial con función de densidad, f (x) = λ1 e−x/λ , x ≥ 0, λ > 0; el estadı́stico U = 2nX/λ tiene distribución χ22n , donde X = (X1 + X2 + · · · + Xn )/n; resolver las cuestiones siguientes: (a) El tiempo de funcionamiento de un equipo electrónico es una variable aleatoria con distribución exponencial. Se han tomado los tiempos de funcionamiento hasta el fallo de 30 equipos elegidos al azar, obteniéndose 6.2 × 103 horas de media. Contrastar con nivel de significación igual a 0.05, H0 : λ = 5 × 103 horas, frente a H1 : λ > 5 × 103 horas; indicando: (a) el valor crı́tico, y (b) la probabilidad de error tipo II cuando λ = 7 × 103 horas. (Es suficiente con proporcionar el valor más proximo obtenido en las tablas del libro de texto). (b) Se va a realizar un ensayo con 15 equipos fabricados por una segunda empresa. Si el tiempo de funcionamiento de estos tiene también distribución exponencial. ¿ Cuál es el valor máximo de la media muestral de estos quince equipos que permitirı́a concluir con α = 0.05 que son peores que los de la primera empresa? Después de 6000 horas de ensayo han fallado 6 equipos, siendo el promedio de estos seis valores igual a 2350 horas. ¿Es necesario seguir el ensayo para tomar una decisión ? 1 6. En la tabla se reproducen los valores para la velocidad de la luz en el aire que obtuvieron Michelson y Newcomb en 1879 y 1992 respectivamente, utilizando métodos distintos . A los datos originales en km/s se les ha restado 299000 para facilitar su tratamiento matemático. Mic. New. 1 850 883 Mic. New. 11 1000 578 2 740 816 12 980 796 3 900 778 13 930 774 4 1070 796 5 930 682 6 850 711 7 950 611 14 650 820 15 760 772 y 896,6 763,2 8 980 599 9 980 1051 10 880 781 sb 119,47 111,91 (a) Contraste la hipótesis de que la variabilidad es la misma en los experimentos de Michelson y Newcomb. (α = 0, 05) (b) Sabiendo que la velocidad de la luz en el vacio es 299.792,5 km/s (792,5 si se le resta 299.000), y que en aire debe ser igual o menor que en el vacio, contraste la hipótesis de que los experimentos no tienen error sistemático, es decir la medida obtenida es igual al verdadero valor más un error aleatorio de media cero.(α = 0, 05) 7. Se estudian dos tipos de neumáticos con los resultados siguientes: Tipo A B ni 121 121 xi (Km) 27465 27572 sbi (Km) 2500 3000 (a) Calcular, con α = 0.01, un intervalo de confianza para σ 21 . σ 22 (b) Obtener un intervalo de confianza para µ1 − µ2 . 8. Se dispone de rendimientos de dos máquinas. Los resultados de la máquina A son 137.5; 140.7; 106.9; 175.1; 177.3; 120.4; 77.9 y 104.2, mientras que los reultados para la B son: 103.3; 121.7; 98.4; 161.5; 167.8 y 67.3. ¿Son las máquinas iguales? (Suponer que los rendimientos de ambas máquinas siguen distribuciones normales). 9. Un fabricante de automóviles debe elegir entre un determinado tipo de piezas de acero suministradas por un proveedor A y otras suministradas por otro proveedor B. Para proceder a la elección se ha analizado la resistencia a la tracción de las piezas suministradas por ambos proveedores, tomando una muestra de tamaño 10 de las piezas del primero, y otra de tamaño 12 del segundo. La resistencia media de la muestra de A es de 54000 unidades y la de la muestra de B es de 49000 unidades, siendo las desviaciones tı́picas muestrales corregidas sbA = 2100 y sbB = 1900. Las resistencias de las piezas de ambos proveedores se distribuyen normalmente. Las piezas del proveedor B son más baratas que las del proveedor A, por lo que estas últimas sólo son rentables si tienen una resistencia media al menos 2000 unidades mayor que las de B, y la misma variabilidad. (a) ¿A qué proveedor habrı́a que comprar las piezas a la vista de los resultados muestrales? (b) Obtener un intervalo de confianza del 90\% 10. La estatura de 60 niños de una escuela infantil se resume en la siguiente tabla de frecuencias, dónde la última columna muestra la frecuencia esperada bajo la hipótesis de normalidad. 2 Intervalo 41,5-43,5 43,5-45,5 45,5-47,5 47,5-49,5 49,5-51,5 51,5-53,5 53,5-55,5 55,5-57,5 Total Frecuencia Observada 4 7 12 8 6 11 9 3 60 Frecuencia Esperada 4,08 5,58 9,06 11,27 11,27 9,08 5,58 4,08 60 ¿Se puede aceptar la hipótesis de normalidad de los datos (α = 0.05) ? 11. Se tira 120 veces un dado y se obtienen los resultados de la tabla VALOR FRECUENCIA 1 20 2 14 3 23 4 12 5 26 6 25 Contrastar la hipótesis de que el dado está equilibrado y que, por tanto, sus caras son equiprobables. (Tómese α = 0.05). 12. Un modelo sı́smico indica que la distribución de los epicentros de sismos en una región deberı́a seguir una distribución de Poisson en el plano. Un grupo de expertos pretende contrastar si ese modelo se cumple, para ello ha representado un mapa de la región dividido en cuadrı́culas de tamaño 100 km2 , y ha señalado con puntos las posiciones de los epicentros (véase figura adjunta). Realizar el contraste χ2 de bondad de ajuste con nivel de significación α = 0, 05 proporcionando el nivel crı́tico aproximado del contraste. 13. El Ministerio de defensa está considerando un nuevo sistema de apoyo para el lanzamiento de misiles de corto alcance. El sistema existente tiene errores en el 7% de los lanzamientos y se desea comprobar si el nuevo sistema tiene una probabilidad de fallo menor. El ensayo va a consistir 3 en realizar 20 lanzamientos y se concluirá que el nuevo sistema es mejor si no se produce ningún fallo. Llamando p a la probabilidad de fallo del sistema nuevo y aceptando independencia entre los resultados del lanzamiento, obtenga y represente gráficamente la probabilidad de error de tipo II del contraste H0 : p = 0.07 H1 : p < 0.07 Obtenga la probabilidad de error tipo I. Interprete el resultado y valore si el método de decisión es adecuado. 14. El tiempo de duración T de un componente electrodinámico es una variable aleatoria con distribución exponencial de media µ. Veinte componentes han sido sometidos a un ensayo y el número de horas que han durado ha sido: 10.99 15.79 24.14 34.43 43.72 51.72 56.12 60.27 77.20 88.47 91.07 117.58 130.40 133.12 152.90 159.00 193.62 208.71 308.82 316.07 Teniendo en cuenta que 2T /µ tiene distribución χ2 con dos grados de libertad, realiza el siguiente contraste H0 : µ = 200 horas, H1 : µ < 200 horas, con α = 0.05. 4 EXÁMENES CURSO 2016/17 Evaluación Continua 1 Estadı́stica 17 de octubre de 2016 Problema (45 minutos) Para una sesión de juegos de azar existen dos dados: el primero está equilibrado (es decir, todos los resultados son equiprobables), y para el otro, las probabilidades de los cinco primeros resultados son 0.2, 0.13, 0.16, 0.15 y 0.19. 1. Calcular la media, mediana y varianza del resultado de lanzar cada uno de los dos dados. 2. De un cubilete se extrae al azar uno de los dos dados y se lanza dos veces: a) ¿Cuál es la probabilidad de que la suma de los dos lanzamientos sea mayor que dos? b) La suma ha resultado mayor que dos, ¿cuál es la probabilidad de que se haya lanzado el segundo dado? 3. Se lanza el segundo dado seis veces: a) ¿Cuál es la probabilidad de obtener dos veces el 3? b) ¿Cuál es la probabilidad de que salga dos veces el 3 y cuatro veces el 4? Evaluación Continua 1 Estadı́stica 17 de octubre de 2016 Solución del problema 1. Para el dado equilibrado 6 P E[X] = i × 1/6 = 3, 5 i=1 var[X] = E[X 2 ] − (E[X])2 = 6 P i2 × 1/6 − (3, 52 ) = 2, 91 i=1 mediana = 3 (la probabilidad acumulada 0,5 se alcanza en 3). Para el dado no equlibrado: 6 P E[X] = i × P (X = i) = 3, 51 i=1 var[X] = E[X 2 ] − (E[X])2 = 6 P i2 × P (X = i) − (3, 512) = 3, 11 i=1 mediana = 4 (la probabilidad acumulada 0,5 se alcanza en 4). 2. 3. a) Por el teorema de la probabilidad total: P [S > 2] = P [dadoeq] ∗ P [S > 2|dadoeq] + P [dadoNoeq] ∗ P [S > 2|dadoNoeq] = (1/2) ∗ (1 − (1/6)2) + (1/2) ∗ (1 − (0, 2)2 ) = 0, 9667 ya que la suma será mayor que 2 cuando la pareja de resultados sea distinta de la (1,1) b) Por el teorema de Bayes P [dadoNoeq|S > 2] = P [dadoNoeq] ∗ P [S > 2|dadoNoeq]/P [S > 2] = 0, 497 a) Hay 62 combinaciones para las cuales dos de los resultados son el 3 P [2 veces el 3] = 62 0, 1620, 844 = 0, 191 b) También hay 62 combinaciones para las cuales dos de los resultados son el 3 y 4 veces el 4 P[2 veces el 3 y 4 veces el 4] = 62 0, 1620, 144 = 1, 94 · 10−4 Corrected Parcial 1 GITI, GIQ y GIO 17-10-2016 Tiempo: 60 minutos. No se permite realizar esquemas, dibujos o anotaciones en este documento, sólo marcar la opción elegida. Para marcar su respuesta, rellene todo el cuadrado de la opción seleccionada. Para corregir, emplee un corrector sin reconstruir el cuadrado original. Las preguntas correctas suman 1 punto. Las preguntas sin respuesta, preguntas incorrectas o preguntas con más de una respuesta suman 0 puntos. 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 ←− Marque su número de matrícula con los dígitos en los re- cuadros (con ceros a la izquierda si es necesario). En el recuadro de aquí abajo escriba apellidos y nombre. Apellidos, Nombre: ............................................................... Pregunta 1 Se sabe que E[X ]=4 y E[X 2 ]=25. Determinar los intervalos alrededor de la media de esta variable aleatoria que contengan al menos el 75 % de la probabilidad. (-2, 10) N/A (-1, 11) (-3, 9) (0, 12) Pregunta 2 En una universidad hay un 20 % de estudiantes de humanidades, un 30 % de económicas y empresariales, un 20 % de ciencias y un 30 % de ingeniería. Las proporciones de estudiantes extranjeros en cada rama son del 30 %, 50 %, 60 % y 70 % respectivamente. Si se elige un alumno al azar y es extranjero, ¾cuál es la probabilidad de que sea de ciencias? 0.22 Pregunta 3 N/A 0.17 0.33 0.51 Una variable aleatoria continua X tiene como función de densidad fX (x) = x 1 exp(− ), 4 4 si x ≥ 0 Se obtienen de manera independiente cinco valores de dicha variable. ¾Cuál es la probabilidad de que ninguno los valores esté comprendido entre 1 y 4? 0.52 0.21 N/A 0.48 0.83 Pregunta 4 La baraja francesa es un conjunto de cartas formado por 52 unidades repartidas en cuatro palos: corazones, diamantes, tréboles y picas. Cada uno de estos palos está compuesto por 13 cartas: AS, Dos, Tres, Cuatro, Cinco, Seis, Siete, Ocho, Nueve, Diez, y las tres guras, que se llaman Valet (V), Dame (D) y Roi (R). Se reparten al azar las 52 cartas de una de estas barajas a dos jugadores, 26 a cada uno. ¾Cuál es la probabilidad de que uno de los jugadores tenga los cuatro ases? 4!(48 22) 52 26 ( ) N/A 4(48 22) 52 26 ( ) 48!52! 22!26! (48 22) (52 26) Corrected Pregunta 5 Una urna contiene 10 bolas, de las cuales 3 son rojas, 5 verdes y 2 azules. Se extraen al azar 3 bolas sin reposición. Calcular la probabilidad de que la primera sea azul, y las otras dos verdes. 1/6 Pregunta 6 2/18 3/83 N/A 1/18 Sea X una variable aleatoria con función de densidad x ∈ (0, 1] fX (x) = 1, Calcular la esperanza de U = − ln X . 0.0 1.5 1.0 0.5 N/A Pregunta 7 El número de horas dedicadas al estudio de una asignatura y la calicación nal obtenida en el correspondiente examen de ocho personas vienen dados en la siguiente tabla: X: Horas de estudio Y: Calicación de examen 20 6.5 16 6.0 34 8.5 23 7.0 27 9.0 32 9.5 18 7.5 22 8.0 Calcular la covarianza. N/A Pregunta 8 5.75 5.60 5.50 5.85 La función de densidad de la variable aleatoria X es fX (x) = kx2 , si x ∈ [1, 7] Calcular P (X ≥ 3|X ≤ 4). 0.74 N/A 0.43 0.52 0.38 Pregunta 9 Sea el circuito de la gura. La probabilidad de que un elemento tipo X falle es 0,10 y la probabilidad de que un elemento tipo Y falle es 0,05. ¾Cuál es la probabilidad de que pase corriente del punto A al punto B? 0.77 0.99 0.88 N/A 0.66 Pregunta 10 Sean A y B dos sucesos de un experimento aleatorio tales que P (A) = 1/2, P (B) = 1/3, P (A ∩ B) = 1/4. Calcular P (Ā|B̄ ). 1/8 5/8 1/6 N/A 3/8 𝑃(𝑋𝑚 = 1) = 0.3 𝑒 −0.3 = 0.222 𝑃(𝑋𝑀 = 1) = 0.02 𝑒 −0.02 = 0.020 120 0.405 ∗ 370 𝑃(𝑋𝑚 = 1|𝑚)𝑃(𝑚) 𝑃(𝑚 | 𝑋 = 1) = = 𝑃(𝑋𝑚 = 1|𝑚)𝑃(𝑚) + 𝑃(𝑋𝑀 = 1|𝑀)𝑃(𝑀) 0.405 ∗ 120 + 0.0204 ∗ 250 370 370 = 0.8421 𝑓𝑋𝑌 (𝑥, 𝑦) = 1 6 −2<𝑥 <0 𝑃(|𝑋 − 𝑌| > 3) = 0<𝑦<3 ∬ 𝑓𝑋𝑌 (𝑥, 𝑦)𝑑𝑥𝑑𝑦 = |𝑋−𝑌|>3 1 3 𝑃(𝑋 > 0.9 | 𝑋 ~𝑁(0.9, 0.1))) = 0.5 0.53 = 0.031 𝑃(99.6 < 𝑋 < 100.4 | 𝑋 ~𝑁(100, 0.25))) = 0.89 1 𝐸[𝑌] = = 9.09 𝑝 𝐸[𝑋] = 3.5 𝑉𝑎𝑟[𝑋] = 2.92 𝑌~𝑁(100 · 3.5, √100 · 2.92) = 𝑁(350, 17.09 ) 𝑃(𝑌 > 365) = 0.19 𝑍 = 𝑋1 − 𝑋2 − 𝑋3 𝑃(𝑋1 > 𝑋2 + 𝑋3 ) = 𝑃(𝑍 > 0) 𝑋1 𝑋1 𝑧 = [ 1 − 1 − 1 ] [𝑋2 ] = 𝐴 [𝑋2 ] 𝑋3 𝑋3 𝜇𝑧 = −10 𝜎𝑧2 = 10 𝑃(𝑍 > 0 | 𝑍~𝑁(−10, √10)) = 0.001 𝑉𝑎𝑟𝑌 = [ 1/𝜎1 1/𝜎1 𝜎2 1/𝜎2 ][ 1 −1/𝜎2 𝜌𝜎1 𝜎2 𝜌𝜎1 𝜎2 1/𝜎1 ][ 1/𝜎2 𝜎22 1/𝜎1 2 + 2𝜌 ] =[ 0 −1/𝜎2 0 ] 2 − 2𝜌 𝑃(𝑋 > 52 | 𝑋 ~𝑁(45, 4))) = 0.0401 10 𝑃(𝑌 = 3 | 𝑌~𝐵𝑖𝑛𝑜𝑚(𝑛 = 10, 𝑝 = 0.04)) = ( ) 0.043 0.967 = 0.006 3 𝜆 = 25 𝑃(𝑋 = 20) = 𝑐𝑜𝑐ℎ𝑒𝑠 500 𝑚 2520 −25 𝑒 = 0.0519 20! 2 𝑧𝛼 √𝑝𝐴 · (1 − 𝑝𝐴 ) − 𝑧𝛽 √𝑝𝐵 · (1 − 𝑝𝐵 ) 𝑛=( ) 𝑝𝑅 − 𝑝𝐴 2 1.64√0.02 · (1 − 0.02) + 1.64√0.04 · (1 − 0.04) =( ) = 762 0.04 − 0.02 21 de noviembre de 2016 Problema (45 minutos, 5 puntos) El examen MIR para acceder a la formación de especialistas médicos en España consta de 225 preguntas tipo test con 4 opciones de las que solo una es válida. La valoración del examen se calcula multiplicando el número de preguntas correctas por 3 y restando las preguntas erróneas. Por lo tanto, si el aspirante responde r preguntas (r ≤ 225) y denominando X al número de preguntas correctamente respondidas por el aspirante de un total de 225, entonces la valoración será: V = 3X − (r − X). Con esta información responda a las siguientes preguntas: 1. En los cuestionarios similares realizados para preparar el examen, un aspirante responde a las 225 preguntas (r = 225) con una probabilidad de acertar la respuesta de 0.9 ¿Cuál es la probabilidad de que la valoración del aspirante en un examen supere los 600 puntos? Solución: V = 3X − (r − X) = 4X − r √ r = 225 =⇒ X −→ B(n = 225, p = 0,9) =⇒ X N(225 ∗ 0,9; 225 ∗ 0,9 ∗ 0,1) =⇒ X N(202,5, 4,5) E[V ] = 4E[X] − 225 = 4 ∗ 202,5 − 225 = 585 V ar[V ] = 42 V ar[X] = 16 ∗ 4,52 = 322,4 =⇒ σ V = 18 =⇒ V N(585, 18) Por lo tanto: 600 − 585 ) = P (Z > 0,83) = 1 − Φ(0,83) = 0,2033. P (V > 600|V N(585, 18)) = P (Z > 18 2 Un grupo de 10 aspirantes de la academia A contestan a todas las preguntas y tienen una probabilidad de acertar la respuesta de 0.9 ¿Cuál es la probabilidad de que la valoración media de los 10 aspirantes supere los 590 puntos? ¿Cuál es la probabilidad de que la valoración de un aspirante de la academia B, con una probabilidad de acertar la respuesta de 0.7, supere el 80 % de la valoracion media de los aspirantes de la academia A? Solución: a) V = V1 + V2 + V3 + .... + V10 . 10 Piden P (V > 590). E[V ] = E[V ] = 585 y V ar[V ] = V ar[V ] 322,4 = =⇒ σV = 5,69. =⇒ 10 10 V N(585, 5,69). P (V > 590|V N(585, 5,69)) = P ( V − 585 590 − 585 > ) = P (Z > 0,8784) = 1−Φ(0,88) = 0,1894 . 5,69 5,69 21 de noviembre de 2016 b) Piden P (VB > 0,8 ∗ V ) = P (VB − 0,8 ∗ V > 0) =⇒ Se sabe que VB = 3XB − (r − XB ) = 4XB − 225, siendo XB −→ B(n = 225, p = 0,7) =⇒ √ XB N(225 ∗ 0,7, 225 ∗ 0,7 ∗ 0,3) =⇒ √ XB N(157,5, 47,25). Por lo tanto E[VB ] = 4 ∗ E[XB ] − 225 = 4 ∗ 157,5 − 225 = 405 y V ar[VB ] = 16 ∗ V ar[XB ] = 16 ∗ 47,25 = 756 =⇒ σV B = 27,5. VB N(405, 27,5). Denominando W = VB − 0,8 ∗ V =⇒La probabilidad pedida se puede escribir como P (W > 0). Se calcula E[W ] = E[VB ] − 0,8E[V ] = 405 − 0,8 ∗ 585 = −63,0; V ar[W ] = V ar[VB ] + 0,82 ∗ V ar[V ] = 756 + 0,64 ∗ 32,24 = 776,63 =⇒ σW = 27,87 =⇒ W N(−63, 27,87) P (W > 0|W −→ N(−63, 27,87)) =⇒ P (Z > 63 ) = P (Z > 2,26) = 1 − Φ(2,26) = 0,0119. 27,87 3. ¿Cuál es la probabilidad de que la valoración máxima alcanzada por alguno de los 10 aspirantes de la academia A supere los 590 puntos? Solución Piden: P(Valoracion de alguno de los 10 alumnos >590)=1-P(Valoración de todos<590)= = 1 − [P (V1 < 590.V2 < 590.......V10 < 590)] = = 1 − [P (V1 < 590)]10 = 1 − [0,6103]10 = 0,9928. Esta probabilidad se ha calculado sabiendo que V1 , V2 ..V10 tienen todos la misma distribución calculada en el primer apartado V N(585, 18). P (V < 590) = P (Z < 590 − 585 5 ) = P (Z < ) = P (Z < 0,28) = 0,6103. 18 18 Corrected Parcial 3 GITI, GIQ y GIO 19-12-2016 Tiempo: 60 minutos. No escribir nada en este documento, sino marcar una única opción en cada pregunta. Rellenar todo el cuadrado (no es válido marcarlo con una cruz o un tick), con bolígrafo azul o negro (no lápiz). Para corregir, emplee un corrector sin reconstruir el cuadrado original. Las preguntas correctas suman 1 punto. Las preguntas sin respuesta, preguntas incorrectas o preguntas con más de una respuesta suman 0 puntos. El incumplimiento de las normas anteriores podría anular la totalidad de la nota correspondiente a esta parte del examen. 0 0 0 0 0 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 6 6 6 6 6 7 7 7 7 7 8 8 8 8 8 9 9 9 9 9 ←− Marque su número de matrícula con los dígitos en los recuadros (con ceros a la izquierda si es necesario). En el recuadro de aquí abajo escriba apellidos y nombre. Apellidos, Nombre: ....................................................................... Pregunta 1 de densidad es: La longitud de una molécula fragmentada en un proceso de químico es una variable cuya función fX (x) = β(1 − x)β−1 , 0 < x < 1, donde β > 0 es un parámetro desconocido. La medida de la molécula es muy difícil de obtener, pero en un experimento se ha observado que de las 180 moléculas obtenidas, 64 eran menores o iguales que 0.5 y el resto mayores. La función de verosimilitud para el parámetro β en este caso es: l(β) = (1 − 0,5β )64 ·0,5116·β l(β) = β 180 (1 − x)180(β−1) l(β) = β 180 (1 − x1 )β−1 (1 − x2 )β−1 · · · (1 − x180 )β−1 l(β) = β 180 (1 − 0,5)180(β−1) l(β) = (1 − 0,5β )180 ·0,5180·β Sea X una variable aleatoria con función de densidad fX (x) = (1 + θ)xθ , 0 < x < 1, θ > 0. Determine el estimador de θ por el método de los momentos para la muestra (0.25 ,0.6, 0.1, 0.65, 0.5). Pregunta 2 0.276 NDLA 0.42 -0.276 0.42 Corrected La duración de las bombillas de 100 W que fabrica una empresa sigue una distribución normal con una desviación típica de 120 horas de duración. Se sabe que su vida media es de 800 horas. Se escoge al azar una muestra de 50 bombillas de un lote y, después de comprobarlas, se obtiene una vida media de 750 horas. ¾Habría que rechazar el lote por no cumplir la garantía? Pregunta 3 NDLA Se acepta H0 tanto para α = 0,05 como para α = 0,01. Con α = 0,05 se acepta H0 , pero con α = 0,01 no. Rechazamos la hipótesis nula tanto para α = 0,05 como para α = 0,01. correcta Con α = 0,01 se acepta H0 , pero con α = 0,05 no. Pregunta 4 Determine el tamaño n de la muestra para estimar la media µ de una población con σ = 5, si se quiere tener una conanza del 95 % de que el error cometido en la estimación sea como mucho ±0, 5. n = 38383 n = 38416 n = 35500 n = 39416 n = 37996 Se desea estimar la media y la varianza de una distribución normal. Para ello, se toma una muestra de n datos y se calculan su media y varianza muestrales. Calcule el sesgo de estos estimadores de la media y varianza poblacionales, respectivamente. Pregunta 5 Depende de los datos de la muestra. sesgo(b µ = x) 6= 0 y sesgo( σ b2 = s2 ) 6= 0 2 2 sesgo(b µ = x) 6= 0 y sesgo( σ b =s )=0 NDLA 2 2 sesgo(b µ = x) = 0 y sesgo( σ b = s ) 6= 0 Pregunta 6 Se toma una muestra de tres valores x1 , x2 y x3 de una variable aleatoria con función de densidad fX (x) = 1, θ − 0,5 < x < 0,5 + θ, donde θ es un parámetro desconocido. El Error Cuadrático Medio (ECM) del estimador por el método de los momentos de θ es: θ4 /2 Pregunta 7 0,52 /12 θ2 /12 θ2 /36 1/36 Una encuesta sobre la Constitución Europea tuvo en un país los siguientes resultados: A favor En contra Indecisos Abstenciones 810 520 250 120 Calcule un intervalo de conanza al 95 % para la proporción de indecisos. 0,130 ≤ p ≤ 0,230 0,130 ≤ p ≤ 0,164 0,164 ≤ p ≤ 0,190 0,106 ≤ p ≤ 0,214 0,250 ≤ p ≤ 0,520 Sea X una variable aleatoria con función de densidad fX (x) = θ3 x2 e−x /θ , x > 0, θ > 0. Dada una muestra aleatoria simple de tamaño n de X , determinar θ̂M V ,la estimación máximo verosimil de θ. 3 Pregunta 8 θ̂M V = x3 θ̂M V = 1 n P x3i + 1 n P x2i NDLA θ̂M V = 1 n P x3i θ̂M V = s3/2 /n Corrected Para un determinada fuente radiactiva, se han detectado 20 desintegraciones en 3 minutos, calcule el intervalo de conanza del 95 % para la tasa de desintegraciones (en desintegraciones/minuto) Pregunta 9 3.56 - 7.68 3.74 - 9.59 4.74 - 8.58 NDLA 2.33 - 4.89 Pregunta 10 Una empresa fabrica cables cuya resistencia media a la rotura es de 300 kg con desviación típica 24 kg. Se toma una muestra de 64 cables producidos mediante un nuevo método obteniendo una resistencia media de 310kg . Plantee las hipótesis para realizar el contraste para estudiar si efectivamente el nuevo método proporciona mejores resultados que el antiguo. H0 : µ = 300; H1 : µ > 300 NDLA H0 : µ = 310; H1 : µ < 310 H0 : x = 310; H1 : x < 310 H0 : x = 300; H1 : x > 300 Examen de ESTADÍSTICA, GITI, GIQ y GIO 18 de enero de 2017 Problema (60 minutos, 10 puntos) Se tiene una muestra con n = 15 datos correspondientes a los tiempos de vida de un componente eléctrico (en miles de horas): (0.016; 0.027; 0.03; 0.048; 0.055; 0.072; 0.103; 0.123; 0.136; 0.143; 0.189; 0.238; 0.244; 0.274; 0.311) 1) Se pide realizar el diagrama de cajas y explicar las características más relevantes del mismo. (2 puntos) Con n = 15 datos, el Q1 es el que ocupa la posición 4 con los datos ordenados de forma creciente, es decir Q1 = 0;048, y por ello el Q3 = 0;238, el cuarto valor mayor para que Q1 y Q3 tengan posiciones simétricas. Q2 o mediana es 0.123. RI = Q3 Q1 = 0;238 0;048 = 0;19: LS = Q3 + 1;5 RI = 0;523 ! Entonces el bigote superior es el mayor valor muestral: 0.311 LI = Q1 1;5 RI = 0;237 ! Entonces el bigote inferior es el menor valor muestral: 0.016 2) Los tiempos de vida de los componentes eléctricos de la marca A se ditribuyen como una Uniforme en el intervalo [0, 3]. Se pide escribir la expresión de la función de densidad de dicha variable aleatoria a la que se denomina Y . (1 punto) Una distribución uniforme en el intervalo indicado, [0, 3] tiene esta función de densidad: fY (y) = 1=3 si 0 y 3 y 0 en el resto. Se sabe además que los tiempos de vida de componentes eléctricos iguales pero de la marca B tienen un tiempo de vida (en miles de horas, como los de la marca A) con la siguiente función de densidad: Si se tiene la misma cantidad de componentes de las marcas A y B, se pide: 3) Calcular la probabilidad de que un componente elegido al azar dure más de 500 horas. (2 puntos) Sea C: tiempo de vida de un componente es > 500h. Entonces , si mA es: marca A, y de forma análoga mB es: marca B, por el teorema de la probabilidad total: Examen de ESTADÍSTICA, GITI, GIQ y GIO 18 de enero de 2017 pr(C) = pr(C \ mA) + pr(C \ mA) = = pr(CjmA) pr(mA) + pr(CjmB) pr(mB) Calculamos pr(CjmB) = pr(X > 0;5) = 1 pr(X 0;5) = 1 R3 pr(CjmA) = pr(Y > 0;5) = 0;5 13 dy = 5=6 Entonces, como pr(mA) = pr(mB) = 1=2 se tiene que: pr(C) = 56 12 + 78 12 = 41 48 = 0;8541 R 0;5 0 x dx = 7=8 4) Si un componente eléctrico ha durado más de 500 horas, calcula la probabilidad de que sea de la marca B. (2.5 puntos) Por el Teorema de Bayes, y el denominador (probabilidad total) se tiene del apartado anterior. pr(mBjC) = pr(CjmB) pr(mB) pr(C) = 7 1 8 2 5 1 + 78 12 6 2 = 21 41 = 0;5122 5) Si se tienen 10 componentes de la marca B, calcula la probabilidad de que al menos 9 de ellos duren más de 500 horas. (2.5 puntos) Sea W : Número de componentes de la marca B que duran más de 500 horas. Entonces W ! Binomial(n = 10; p = 7=8): Hay que calcular pr(W 9) = pr(W = 9) + pr(W = 10); donde: 10 7 9 1 1 pr(W = 9) = 8 8 9 10 7 10 1 0 pr(W = 10) = 8 10 8 Estadística Modelos univariantes y multivariantes 18 de enero de 2017 ESTADÍSTICA Problema (60 minutos) La empresa NECE, S.L. fabrica planchas de celulosa. Se está realizando un estudio piloto sobre el número de manchas que aparecen en las planchas de celulosa de 4m2 . Estudios anteriores veri…can que por termino medio aparecen 3 manchas por m2 . 1. Calcule la probabilidad de que al observar tres planchas elegidas de manera aleatoria de 4m2 cada una, ninguna de las tres tenga más de 6 manchas.(2 .5 puntos) NECE, S.L. tiene tres fábricas en enclaves distintos. Las producciones de las planchas de celulosa en millones de m2 en cada uno de los enclaves son respectivamente X1 ; X2 y X3 . La distribución conjunta de las tres producciones sigue una normal tridimensional con vector T de medias X = 0:7 0:8 0:9 y matriz de varianzas y covarianzas MX 2 3 2 1 0 MX = 4 1 2 0 5 : 0 0 1 Se considera una producción media para las tres sucursales, W; que se obtiene como el promedio de ellos: W = X1 + X2 + X3 3 2. Calcule la distribución del nivel de fabricación medio W (calculando la media y la varianza). (2 .5 puntos) 3. Calcule la covarianza entre X2 y W:¿Son independientes? (2 .5 puntos) 4. Se calculan dos nuevos índicadores Y1 e Y2 con la producción de los dos primeros enclaves Y1 = X1 + X2 e Y2 = X1 X2 . Calcule y escriba la función de densidad conjunta de estas dos nuevas variables. ¿Cuánto vale el coe…ciente de correlación entre Y1 e Y2 ? (2 .5 puntos) Solución al Problema 1. Calcule la probabilidad de que al observar tres planchas elegidas de manera aleatoria de 4m2 cada una, ninguna de las tres tenga más de 6 manchas.(2 .5 puntos) Sea M la variable aleatoria número de manchas por unidad de observación, así M sigue una distribución de Poisson P ( = 12 manchas por 4m2 ): La probabilidad pedida es: p = P (M1 6 \ M2 6 \ M3 6) = (P (Mi 6))3 La probabilidad de que una plancha de 4m2 tenga como mucho 6 manchas se puede abordar desde la Poisson o haciendo una aproximación a la normal. Estadística (a) P (Mi (b) P (Mi Modelos univariantes y multivariantes 6jMi ! P ( = 12)) = 6jMi ! N ( = 12; 6 X e m=0 = p m 12 12 m! 18 de enero de 2017 = 0:046 12)) = P (Z 6 12 p ) = 0:043 12 La probabilidad pedida es: p = (P (Mi 6))3 = 9; 62110 5 NECE, S.L. tiene tres fábricas en enclaves distintos. Las producciones de las planchas de celulosa en millones de m2 en cada uno de los enclaves son respectivamente X1 ; X2 y X3 . La distribución conjunta de las tres producciones sigue una normal tridimensional T con vector de medias X = 0:7 0:8 0:9 y matriz de varianzas y covarianzas MX 2 2 4 1 MX = 0 3 1 0 2 0 5: 0 1 Se considera una producción media para las tres sucursales, W; que se obtiene como el promedio de ellos: W = X1 + X2 + X3 3 2. Calcule la distribución del nivel de fabricación medio W (calculando la media y la varianza). La variable aleatoria W es combinación lineal de variables aleatorias normales, por lo que seguirá una distribución normal univariante. Se calcula a continuación la esperanza y la varianza de dicha variable. 1 0:7 + 0:8 + 0:9 E[W ] = [E[X1 ] + E[X2 ] + E[X3 ]] = = 0:8 3 3 V ar[W ] = V ar[ X1 + X2 + X3 1 3 1 ] = [V ar[X1 ]+V ar[X2 ]+V ar[X3 ]+2Cov(X1 ; X2 )] = = 3 9 9 3 1 Por lo tanto W ! N (0:8; p ); con función de 3 p 3 fW (w) = p exp[ 2 densidad: 1 w ( 2 0:8 p1 3 )2 ] Modelos univariantes y multivariantes Estadística 18 de enero de 2017 3. Calcule la covarianza entre X2 y W:¿Son independientes? 3 2 1 X1 4 X2 5 = 6 4 0 1 W 3 2 V N ! N (A X ; AMX A T T 3 0 2 X 3 1 0 7 4 5 X2 5 ! V N = AX 1 X3 3 0 1 1 3 ), siendo AMX A la matriz de nueva variable vectorial V N: Así: VN MV N =A 2 1 6 = AMX AT = 4 0 1 3 X 2 1 6 0 =4 1 3 0 1 1 3 32 0 1 1 3 0 2 0 7 54 1 1 0 3 3 0 2 0:7 3 2 0:7 3 0 7 5 4 0:8 5 = 4 0:8 5 ; 1 0:9 0:9 3 32 1 1 0 6 2 0 54 0 1 0 1 3 0 1 1 3 3T 2 0 6 2 6 0 7 5 =6 6 1 1 4 1 3 3 1 2 1 3 1 3 1 3 1 3 3 7 7 7: 7 5 1 y claramente no son independientes. 3 4. Se calculan dos nuevos índicadores Y1 e Y2 con la producción de los dos primeros enclaves Y1 = X1 + X2 e Y2 = X1 X2 . Calcule y escriba la función de densidad conjunta de estas dos nuevas variables. ¿Cuánto vale el coe…ciente de correlación entre Y1 e Y2 ? Por lo que Cov( X2 ,W ) = Y1 Y2 Y = siendo X12 ; X1 X2 =B = 1 1 1 1 X1 X2 ; X1 X2 MX12 el vector de medias y la matriz de varianzas de X12 = respectivamente, así: X12 = 0:7 0:8 y MX12 = 1 1 1 1 0:7 0:8 2 1 1 2 : Por lo tanto: Y MY = B X12 = = BMX12 B T = 1 1 1 1 = 2 1 1:5 0:1 1 2 ; 1 1 1 1 T = 2 0 0 6 : Examen Final de Estadística 18 de enero de 2017 Problema 3 (60 minutos – 10 puntos) Según la normativa legal vigente, para construir una vivienda es necesario realizar previamente un estudio geotécnico del terreno. En este estudio, entre otras variables, se mide el contenido de sulfatos solubles (contenido de SO4 medido en mg/kg) para determinar la agresividad del suelo. En una parcela se realiza un estudio geotécnico tomando seis muestras, obteniendo los resultados siguientes para el contenido de sulfatos solubles (en mg/kg): 1.850 1.950 2.010 2.100 1.960 1.890 Las mediciones anteriores siguen una distribución normal. Para los tres primeros apartados asumir que, según la documentación técnica del aparato medidor, la precisión de las mediciones es de 𝜎𝜎 = 100 fmg/kg. Emplear α = 0.05 en todos los apartados. a) Indicar un intervalo de confianza del contenido de sulfatos solubles (𝜇𝜇). Calcular el número de muestras que serían necesarias para que este intervalo tenga una longitud máxima de 100 mg/kg. b) Se sabe que si el contenido en sulfatos solubles del terreno es mayor que 2.000 mg/kg, es necesario emplear cementos sulforesistentes en la estructura de la vivienda, encareciendo el presupuesto. Contrastar si para la construcción de la casa es necesario el uso de cementos sulforesistentes. Indicar el p-valor obtenido. c) Calcular la probabilidad del error tipo II del contraste del ‘apartado b’ en función del contenido de sulfatos solubles (𝜇𝜇), y evaluarla para los valores de 𝜇𝜇 iguales a 1.800, 2.000, 2.200 mg/kg. d) En base a las observaciones anteriores, el ingeniero que está realizando el estudio geotécnico desea comprobar si efectivamente la varianza de las mediciones es de 𝜎𝜎 2 = 1002 mg2/kg2, o si es superior. Realizar el contraste de hipótesis necesario para determinar si varianza del aparato medidor cumple con las especificaciones técnicas. Examen Final de Estadística 18 de enero de 2017 SOLUCIÓN Apartado a) En este apartado se pide calcular un intervalo de confianza para la media de una distribución normal, con un nivel de confianza del 95%. En el enunciado nos indican la desviación típica poblacional. 𝐼𝐼𝐼𝐼(𝜇𝜇) = 𝑥𝑥̅ ± 𝑧𝑧𝛼𝛼/2 𝜎𝜎 √𝑛𝑛 = [2040, 1880] 𝛼𝛼/2 El número de muestras necesarias para que el intervalo tenga una longitud máxima de 100 es: Apartado b) 2 · �𝑧𝑧𝛼𝛼/2 𝜎𝜎 √𝑛𝑛 � = 100 → 𝑛𝑛 = 15.3 ≈ 16 1.96 En este apartado se pide realizar un contraste de hipótesis unilateral sobre la media, conocida la desviación típica poblacional de la distribución. Si 𝐻𝐻0 es cierto: 𝐻𝐻 : 𝜇𝜇 = 𝜇𝜇0 = 2000 � 0 𝜇𝜇 > 2000 𝐻𝐻1 : 𝑧𝑧0 = 1960 − 2000 2 �100 6 = −0.163 𝛼𝛼 = 0.05 Como se puede observar, el valor z0 < 1.64. Por tanto, no rechazamos la hipótesis nula. Es decir, no sería necesario emplear cementos sulforesistentes en la edificación. 1.64 El p-valor se calcula como P(Z > z0) = 0.564. Es decir, desde el punto de vista gráfico, corresponde con el área que está a la derecha del valor z0. Apartado c: El error del tipo II es la probabilidad de aceptar la hipótesis nula cuando, en realidad, es falsa. 𝑃𝑃(𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝐼𝐼𝐼𝐼) = 𝑃𝑃(𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝐻𝐻0 | 𝐻𝐻0 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓) 𝜎𝜎 𝜎𝜎 � 𝑋𝑋� ~𝑁𝑁 �𝜇𝜇, �� √𝑛𝑛 √𝑛𝑛 𝜎𝜎 𝜇𝜇0 + 𝑧𝑧𝛼𝛼 − 𝜇𝜇 √𝑛𝑛 = 𝑃𝑃 �𝑍𝑍 < � 𝜎𝜎 √𝑛𝑛 = 𝑃𝑃 �𝑋𝑋� < 𝜇𝜇0 + 𝑧𝑧𝛼𝛼 Examen Final de Estadística 18 de enero de 2017 H0 cierto: 𝛼𝛼 = 0.05 H0 falso: 2000 + 1.64 · 100/√6 2000 𝛽𝛽 = P(error II) µ Ahora evaluamos esta probabilidad para diversos valores de p: 𝑃𝑃(𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝐼𝐼𝐼𝐼 | 𝜇𝜇 = 1800) ≈ 1 𝑃𝑃(𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝐼𝐼𝐼𝐼 | 𝑝𝑝 = 2000) = 0.95 𝑃𝑃(𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝐼𝐼𝐼𝐼 | 𝑝𝑝 = 2200) ≈ 0 Apartado d: Hemos de realizar el siguiente contraste unilateral: 𝐻𝐻 : 𝜎𝜎 2 = 10000 � 0 2 𝐻𝐻1 : 𝜎𝜎 > 10000 Sabemos que (𝑛𝑛 − 1)𝑠𝑠̂ 2 2 → 𝜒𝜒𝑛𝑛−1 𝜎𝜎 2 (6 − 1) · 7840 10000 2 De las tablas obtenemos que P( 𝜒𝜒5 < 11.07) = 0.95. 𝜒𝜒02 = Como se cumple que ‘𝜒𝜒02 < 11.07’, se deduce que no hay evidencia estadística para rechazar H0 con un nivel de confianza del 95%. Aceptamos H0. 3 de julio de 2017 Problema (60 minutos, 10 puntos) En el primer cuatrimestre de una carrera universitaria hay 3 asignaturas, correspondientes a cada uno de los 3 departamentos A, B y C. Habitualmente las notas en cada examen de cada asignatura siguen una distribución normal con parámetros conocidos: Asignatura µ σ A 5 1.1 B 6 1.2 C 7 1.3 Se desprecian las probabilidades de que la nota sea negativa o mayor que 10. 1. En una promoción hay 400 alumnos. Suponiendo independencia entre las calificaciones obtenidas por los alumnos y entre las calificaciones obtenidas por un mismo alumno en las tres asignaturas, ¿cuál es la probabilidad de que en cada asignatura hayan aprobado más de la mitad de los alumnos?. Se considera que una asignatura está aprobada cuando la calificación de un alumno es igual o superior a 5. 2. Se ha reducido el programa de la asignatura del Departamento A y se piensa que puede haber influido en la proporción de aprobados. En el último examen han aprobado 300 alumnos de los 400 de la promoción. ¿Existe evidencia estadística para afirmar que la proporción de alumnos aprobados ha aumentado? 3. Un análisis detallado de las calificaciones muestra que en realidad existe correlación entre las notas que obtiene un alumno en las tres asignaturas, siendo el coeficiente de correlación para cada pareja de asignaturas igual a 0 4. ¿Cuál es la probabilidad de que el valor medio de las tres notas de un alumno elegido al azar sea mayor que 5? 4. Se considera ahora que 1/ 3 de los alumnos tiene probabilidades 0.4, 0.5 y 0.6 de aprobar las asignaturas de A, B y C respectivamente; para otro tercio las probabilidades son 0.5, 0.6 y 0.7 y, para el último tercio 0.6, 0.7 y 0.8. ¿Cuál es la probabilidad de que de 100 alumnos elegidos al azar de entre los 400, 30 o más hayan aprobado las tres asignaturas? Nota.- En todo el problema utilice α = 0,05. Todos los apartados valen 2.5 puntos. 3 de julio de 2017 Solución: 1) XA = v.a num. de alumnos q aprueban asignatura de dep A; 5−5 ) = 0,5 1,1 XA → B(n = 400, pA = 0,5) ∼ N(µ = 400 · 0,5, σ2 = 400 · 0,5 · 0,5) ∼ N(200, 100) 200 − 200 P (XA > 200|XA → N(200, 100) = P (Z > √ ) = 0,5. 100 XB = v.a num. de alumnos q aprueban asignatura de dep B ; 5−6 ) = P (Z > −0,833) = La probabilidad de aprobar la asignatura B: pB = P (NB > 5) = P (Z > 1,2 0,7967 XB → B(n = 400, pB = 0,7967) ∼ N(µ = 319,68, σ2 = 64,79). 200 − 319,68 √ P (XB > 200|XB → N(319,68, 64,79) = P (Z > ) = 1. 64,79 La probabilidad de aprobar la asignatura A: pA = P (NA > 5) = P (Z > XC = v.a num. de alumnos q aprueban asignatura de dep C ; La probabilidad de aprobar la asignatura C: pC = P (NC > 5) = P (Z > 5−7 ) = P (Z > −1,54) = 1,3 0,9382 XC → B(n = 400, pC = 0,9382) ∼ N(µ = 375,28, σ2 = 23,19). 200 − 375,28 √ P (XC > 200|XC → N(375,28, 23,19) = P (Z > ) = 1. 23,19 La probabilidad pedida es: P (XA > 200, XB > 200, XC > 200) =independencia= P (XA > 200)P (XB > 200)P (XC > 200) = 0,7967 2) El contraste: H0 : p = 0,5 H1 : p > 0,5 Si H0 cierta: p − 0,5 ∼ N(0, 1) 0,5 ∗ 0,5 400 Z0 = ((300/400) − 0,50)/ 0,05(1 − 0,5)/400 = 10 =⇒ Se rechaza H0, hay evidencia estadística para afirmar que la proporción de aprobados ha aumentado. 3) Sea Y: v.a valor medio de las tres notas de un alumno N 1 5 Y = 1/3 1/3 1/3 N2 , E[Y ] = 1/3 1/3 1/3 6 = 6 N3 7 2 1/3 1, 1 1,1 × 1,22× 0,4 1,1 × 1,3 × 0,4 var[Y ] = 1/3 1/3 1/3 1, 2 1,2 × 1,3 × 0,4 1/3 = 0,8653 1, 32 1/3 5−6 P (Y > 5|Y ∼ N(6, 0,8653)) = P (Z > √ ) = P (Z > −1,07) = 0,8577. 0,8653 3 de julio de 2017 4) La probabilidad de aprobar las 3 asignaturas para un alumno elegido al azar es, aplicando el teorema de la probabilidad total: PT (aprobar) = P (aprobar|primertercio)∗P (primertercio)+P (aprobar|segundotercio)∗P (segundotercio)+ P (aprobar|tercertercio) ∗ P (tercertercio) = 1/3 ∗ 0,4 ∗ 0,5 ∗ 0,6 + 1/3 ∗ 0,5 ∗ 0,6 ∗ 0,7 + 1/3 ∗ 0,6 ∗ 0,7 ∗ 0,8 = 0,222 XT =v.a no de alumnos del total de 100 que han aprobado las 3 asignaturas ∼ B(n = 100, p = 0,222) ∼ N(µ = 100 ∗ 0,222, σ2 = 100 ∗ 0,222(1 − 0,222)) ∼ N(22,2, 17,27) 30 − 22,2 P (XT > 30) = P (Z > √ ) = P (Z > 1,88) = 0,03. 17,27 +1/1/60+ y Examen extraordinario de Estadística GITI, GIQ y GIO y 03-07-2017 Tiempo: 60 minutos. No se permite realizar esquemas, dibujos o anotaciones en este documento, sólo marcar la opción elegida. Para marcar su respuesta, rellene todo el cuadrado de la opción seleccionada. Para corregir, emplee un corrector sin reconstruir el cuadrado original. Las preguntas correctas suman 1 punto. Las preguntas sin respuesta, preguntas incorrectas o preguntas con más de una respuesta suman 0 puntos. 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 ←− Marque su número de matrícula con los dígitos en los re- cuadros (con ceros a la izquierda si es necesario). En el recuadro de aquí abajo escriba apellidos y nombre. Apellidos, Nombre: ............................................................... Pregunta 1 Los usuarios de una biblioteca se dividen en tres grupos: Grupo A: hasta 14 años de edad; Grupo B: entre 14 y 40 años; Grupo C: más de 40 años. El grupo A representa el 35 % de los usuarios, el grupo B el 25 % y el grupo C el 40 %. Además se sabe que el 45 % de los usuarios del grupo A, el 20 % del grupo B y el 60 % del grupo C acceden a la zona de audiovisuales. Si se elige un usuario al azar que está en la zona de audiovisuales ¾cuál es la probabilidad de que sea del grupo C? 0.54 0.19 0.92 0.43 0.65 Pregunta 2 El número de vehículos que llegan a una gasolinera sigue una distribución de Poisson con parámetro λ = 3 vehículos por minuto. Calcular la probabilidad de que en 120 segundos llegue al menos un vehículo. 0.99 0.05 0.85 0.62 0.41 Pregunta 3 En un contenedor disponemos de miles de piezas que pueden ser del calibre A, B o C, con una probabilidad del 50 %, 30 % y 20 % respectivamente. Si se extraen 10 piezas, ¾cuál es la probabilidad de obtener exáctamente cinco piezas del calibre A? 0.83 0.11 0.25 0.95 0.40 Pregunta 4 Sea X una variable aleatoria con función de densidad fX (x) = (1 + θ)xθ , 0 < x < 1. Determínese el estimador de θ por el método de los momentos para la muestra (0.25, 0.6, 0.1, 0.65, 0.5). 0.22 y 0.64 -0.53 0.08 -0.28 y +1/2/59+ y y Pregunta 5 Dada fXY (x, y) = 2x, con 0 < y < x, 0 < x < 1, obtener la distribución condicionada fX|Y (x|y). y 2 /(2x) 2/(1 − y) x/(1 − y) 2x/(1 − y 2 ) y/(2x) Pregunta 6 Se dispone de seis bolas, cuatro de ellas Blancas y dos Negras, que se reparten aleatoriamente en tres urnas U1, U2 y U3 de la siguiente forma: Se coloca al azar una bola en U1, luego dos bolas en U2 y las tres restantes en U3. ¾Cuál es la probabilidad de que en U2 haya una bola de cada color? 2/9 3/5 8/15 1/4 5/11 Pregunta 7 Sea {X1 , X2 , X3 } una muestra aleatoria simple de tamaño 3 de la variable aleatoria X → N (µ = 1, σ 2 = 3). Se dene el siguiente estimador para la esperanza de X , µ̂ = 0.6X1 + 0.2X2 + 0.2X3 . Calcular el error cuadrático medio de este estimador. -5.85 1.32 0.28 3.14 2.11 Pregunta 8 La variable aleatoria X tiene una distribución uniforme en (0,10). Calcular la probabilidad de que Y > 32, sabiendo que Y = 2X . 1/3 1/2 1/5 1/4 3/5 Pregunta 9 Se toma una muestra aleatoria de 100 personas que fallecieron el año pasado, y se observa que tenían una edad promedio de 71.8 años y una desviación típica de 8.9 años. Calcular un intervalo de conanza para la edad media de fallecimiento ( α = 0.05). (47.90, 95.70) (70.05, 73.55) (68.66, 74.94) (60.57, 83.03) (66.03, 77.97) Pregunta 10 El número de visitas que tiene la página web de una empresa se ha modelado como una variable aleatoria de Poisson de parámetro 5 visitas por hora. Recientemente se ha contratado los servicios de una empresa de publicidad para mejorar el número de visitas. Para comprobar la ecacia de la campaña publicitaria se ha tomado una muestra aleatoria simple, resultando 3, 6, 9, 4, 3, 7, 5, 7, 10 visitas en una hora, y se realiza el contraste H0 : λ ≤ 5; H1 : λ > 5. Calcular la probabilidad tipo II cuando λ = 5.5 (α = 0.05). 0.31 y 0.89 0.15 0.68 0.43 y Corrected Examen extraordinario de Estadística GITI, GIQ y GIO 03-07-2017 Tiempo: 60 minutos. No se permite realizar esquemas, dibujos o anotaciones en este documento, sólo marcar la opción elegida. Para marcar su respuesta, rellene todo el cuadrado de la opción seleccionada. Para corregir, emplee un corrector sin reconstruir el cuadrado original. Las preguntas correctas suman 1 punto. Las preguntas sin respuesta, preguntas incorrectas o preguntas con más de una respuesta suman 0 puntos. 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 ←− Marque su número de matrícula con los dígitos en los re- cuadros (con ceros a la izquierda si es necesario). En el recuadro de aquí abajo escriba apellidos y nombre. Apellidos, Nombre: ............................................................... Pregunta 1 Los usuarios de una biblioteca se dividen en tres grupos: Grupo A: hasta 14 años de edad; Grupo B: entre 14 y 40 años; Grupo C: más de 40 años. El grupo A representa el 35 % de los usuarios, el grupo B el 25 % y el grupo C el 40 %. Además se sabe que el 45 % de los usuarios del grupo A, el 20 % del grupo B y el 60 % del grupo C acceden a la zona de audiovisuales. Si se elige un usuario al azar que está en la zona de audiovisuales ¾cuál es la probabilidad de que sea del grupo C? 0.54 0.19 0.92 0.43 0.65 Pregunta 2 El número de vehículos que llegan a una gasolinera sigue una distribución de Poisson con parámetro λ = 3 vehículos por minuto. Calcular la probabilidad de que en 120 segundos llegue al menos un vehículo. 0.99 0.05 0.85 0.62 0.41 Pregunta 3 En un contenedor disponemos de miles de piezas que pueden ser del calibre A, B o C, con una probabilidad del 50 %, 30 % y 20 % respectivamente. Si se extraen 10 piezas, ¾cuál es la probabilidad de obtener exáctamente cinco piezas del calibre A? 0.83 0.11 0.25 0.95 0.40 Pregunta 4 Sea X una variable aleatoria con función de densidad fX (x) = (1 + θ)xθ , 0 < x < 1. Determínese el estimador de θ por el método de los momentos para la muestra (0.25, 0.6, 0.1, 0.65, 0.5). 0.22 0.64 -0.53 0.08 -0.28 Pregunta 5 Dada fXY (x, y) = 2x, con 0 < y < x, 0 < x < 1, obtener la distribución condicionada fX|Y (x|y). y 2 /(2x) 2/(1 − y) x/(1 − y) y/(2x) 2x/(1 − y 2 ) Corrected Pregunta 6 Se dispone de seis bolas, cuatro de ellas Blancas y dos Negras, que se reparten aleatoriamente en tres urnas U1, U2 y U3 de la siguiente forma: Se coloca al azar una bola en U1, luego dos bolas en U2 y las tres restantes en U3. ¾Cuál es la probabilidad de que en U2 haya una bola de cada color? 2/9 3/5 8/15 1/4 5/11 Pregunta 7 Sea {X1 , X2 , X3 } una muestra aleatoria simple de tamaño 3 de la variable aleatoria X → N (µ = 1, σ 2 = 3). Se dene el siguiente estimador para la esperanza de X , µ̂ = 0.6X1 + 0.2X2 + 0.2X3 . Calcular el error cuadrático medio de este estimador. -5.85 1.32 0.28 3.14 2.11 Pregunta 8 La variable aleatoria X tiene una distribución uniforme en (0,10). Calcular la probabilidad de que Y > 32, sabiendo que Y = 2X . 1/3 1/2 1/5 1/4 3/5 Pregunta 9 Se toma una muestra aleatoria de 100 personas que fallecieron el año pasado, y se observa que tenían una edad promedio de 71.8 años y una desviación típica de 8.9 años. Calcular un intervalo de conanza para la edad media de fallecimiento ( α = 0.05). (47.90, 95.70) (70.05, 73.55) (68.66, 74.94) (60.57, 83.03) (66.03, 77.97) Pregunta 10 El número de visitas que tiene la página web de una empresa se ha modelado como una variable aleatoria de Poisson de parámetro 5 visitas por hora. Recientemente se ha contratado los servicios de una empresa de publicidad para mejorar el número de visitas. Para comprobar la ecacia de la campaña publicitaria se ha tomado una muestra aleatoria simple, resultando 3, 6, 9, 4, 3, 7, 5, 7, 10 visitas en una hora, y se realiza el contraste H0 : λ ≤ 5; H1 : λ > 5. Calcular la probabilidad tipo II cuando λ = 5.5 (α = 0.05). 0.31 0.89 0.15 0.68 0.43 Examen extraordinario de estadísti a. 3 de julio de 2017 Solu ión del test 1. Los usuarios de una bibliote a se dividen en tres grupos: Grupo A: hasta 14 años de edad; Grupo B: entre 14 y 40 años; Grupo C: más de 40 años. El grupo A representa el 35% de los usuarios, el grupo B el 25% y el grupo C el 40%. Además se sabe que el 45% de los usuarios del grupo A, el 20% del grupo B y el 60% del grupo C a eden a la zona de audiovisuales. Si se elige un usuario al azar que está en la zona de audiovisuales ¾ uál es la probabilidad de que sea del grupo C? Solu ión Sean las variables aleatorias A, B, C : usuario del grupo A, B o C respe tivamente; AV : usuario a ede a la zona de audiovisuales. La probabilidad que nos piden es P (AV ∩ C) P (AV |C)P (C) = = P (AV ) P (AV |A)P (A) + P (AV |B)P (B) + P (AV |C)P (C) P (C|AV ) = = 0.60 · 0.4 = 0.54 0.45 · 0.35 + 0.20 · 0.25 + 0.60 · 0.4 2. El número de vehí ulos que llegan a una gasolinera sigue una distribu ión de Poisson on parámetro λ = 3 vehí ulos por minuto. Cal ular la probabilidad de que en 120 segundos llegue al menos un vehí ulo. Solu ión X: "número de vehí ulos en 2 minutos", X → Poisson(6) P (X ≥ 1) = 1 − P (X = 0) = 1 − e−6 = 0.99 3. En un ontenedor disponemos de miles de piezas que pueden ser del alibre A, B o C, on una probabilidad del 50%, 30% y 20% respe tivamente. Si se extraen 10 piezas, ¾ uál es la probabilidad de obtener exá tamente in o piezas del alibre A? Solu ión X: "número de piezas del alibre A de un total de 10", X → Binomial(10,0.50) P (X = 5) = 10 0.52 0.52 = 0.25 5 4. Sea X una variable aleatoria on fun ión de densidad fX (x) = (1 + θ)xθ , 0 < x < 1. Determínese el estimador de θ por el método de los momentos para la muestra (0.25, 0.6, 0.1, 0.65, 0.5). Solu ión E(X) = Z 1 x(1 + θ)xθ dx = 0 1 + θ̂ 2 + θ̂ = x̄ ⇒ θ̂ = 1+θ 2+θ 2x̄ − 1 = −0.28 1 − x̄ 1 5. Dada fXY (x, y) = 2x, on 0 < y < x, 0 < x < 1, obtener la distribu ión ondi ionada fX|Y (x|y). Solu ión fY (y) = Z x=1 fXY (x, y)dx = x=y fX|Y (x|y) = Z x=1 2xdx = 1 − y 2 x=y fXY (x, y) 2x = fY (y) 1 − y2 6. Se dispone de seis bolas, uatro de ellas Blan as y dos Negras, que se reparten aleatoriamente en tres urnas U1, U2 y U3 de la siguiente forma: Se olo a al azar una bola en U1, luego dos bolas en U2 y las tres restantes en U3. ¾Cuál es la probabilidad de que en U2 haya una bola de ada olor? Solu ión Sean los su esos: Bi : la bola i-ésima es blan a; Ni : la bola i-ésima es negra. La probabilidad que nos piden es P (B1 ∩ B2 ∩ N3 ) + P (B1 ∩ N2 ∩ B3 ) + P (N1 ∩ B2 ∩ N3 ) + P (N1 ∩ N2 ∩ B3 ) = = 8 4 3 2 4 2 3 2 4 1 2 1 · · + · · + · · + · ·1= 6 5 4 6 5 4 6 5 4 6 5 15 7. Sea {X1 , X2 , X3 } una muestra aleatoria simple de tamaño 3 de la variable aleatoria X → N (µ = 1, σ 2 = 3). Se dene el siguiente estimador para la esperanza de X , µ̂ = 0.6X1 + 0.2X2 + 0.2X3 . Cal ular el error uadráti o medio de este estimador. Solu ión E(µ̂) = E(0.6X1 + 0.2X2 + 0.2X3 ) = 0.6µ + 0.2µ + 0.2µ = µ ⇒ sesgo(µ̂) = 0 var(µ̂) = var(0.6X1 + 0.2X2 + 0.2X3 ) = 0.62 σ 2 + 0.22 σ 2 + 0.22 σ 2 = 0.44σ 2 = 1.32 ECM(µ̂) = sesgo(µ̂)2 + var(µ̂) = 1.32 8. La variable aleatoria X tiene una distribu ión uniforme en (0,10). Cal ular la probabilidad de que Y > 32, sabiendo que Y = 2X . Solu ión P (Y > 32) = P (2X > 25 ) = P (X > 5) = 1/2 9. Se toma una muestra aleatoria de 100 personas que falle ieron el año pasado, y se observa que tenían una edad promedio de 71.8 años y una desvia ión típi a de 8.9 años. Cal ular un intervalo de onanza para la edad media de falle imiento (α = 0.05). Solu ión X: "edad de falle imiento", X̄ → N (µ, σ 2 /n) # Ŝ Ŝ = [70.05, 73.55] µ ∈ x̄ − tn−1 √ , x̄ + tn−1 √ n n " 2 10. El número de visitas que tiene la página web de una empresa se ha modelado omo una variable aleatoria de Poisson de parámetro 5 visitas por hora. Re ientemente se ha ontratado los servi ios de una empresa de publi idad para mejorar el número de visitas. Para omprobar la e a ia de la ampaña publi itaria se ha tomado una muestra aleatoria simple, resultando 3, 6, 9, 4, 3, 7, 5, 7, 10 visitas en una hora, y se realiza el ontraste H0 : λ ≤ 5; H1 : λ > 5. Cal ular la probabilidad tipo II uando λ = 5.5 (α = 0.05). Solu ión X: "número de visitas", X → P oisson(λ), λ̂ → N (λ, λ/n) λ̂ → N (λ, λ/n) ⇒ P ! λ̂ − λ p ≤ 1.96|λ = 5 = 0.95 ⇒ λ̂ = 6.46 λ/n P (error II) = P λ̂ ≤ 6.46|λ̂ → N (5.5, 5.5/9) = 0.89 3 z P (Z ≤ z) Ejemplo. P(Z ≤ 1.96) = 0.9750 N(0,1) Normal Estandar TABLA z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 0 .5000 .5398 .5793 .6179 .6554 .6915 .7257 .7580 .7881 .8159 .8413 .8643 .8849 .9032 .9192 .9332 .9452 .9554 .9641 .9713 .9772 .9821 .9861 .9893 .9918 .9938 .9953 .9965 .9974 .9981 .9987 0,01 .5040 .5438 .5832 .6217 .6591 .6950 .7291 .7611 .7910 .8186 .8438 .8665 .8869 .9049 .9207 .9345 .9463 .9564 .9649 .9719 .9778 .9826 .9864 .9896 .9920 .9940 .9955 .9966 .9975 .9982 .9987 0,02 .5080 .5478 .5871 .6255 .6628 .6985 .7324 .7642 .7939 .8212 .8461 .8686 .8888 .9066 .9222 .9357 .9474 .9573 .9656 .9726 .9783 .9830 .9868 .9898 .9922 .9941 .9956 .9967 .9976 .9982 .9987 0,03 .5120 .5517 .5910 .6293 .6664 .7019 .7357 .7673 .7967 .8238 .8485 .8708 .8907 .9082 .9236 .9370 .9484 .9582 .9664 .9732 .9788 .9834 .9871 .9901 .9925 .9943 .9957 .9968 .9977 .9983 .9988 0,04 .5160 .5557 .5948 .6331 .6700 .7054 .7389 .7704 .7995 .8264 .8508 .8729 .8925 .9099 .9251 .9382 .9495 .9591 .9671 .9738 .9793 .9838 .9875 .9904 .9927 .9945 .9959 .9969 .9977 .9984 .9988 0,05 .5199 .5596 .5987 .6368 .6736 .7088 .7422 .7734 .8023 .8289 .8531 .8749 .8944 .9115 .9265 .9394 .9505 .9599 .9678 .9744 .9798 .9842 .9878 .9906 .9929 .9946 .9960 .9970 .9978 .9984 .9989 0,06 .5239 .5636 .6026 .6406 .6772 .7123 .7454 .7764 .8051 .8315 .8554 .8770 .8962 .9131 .9279 .9406 .9515 .9608 .9686 .9750 .9803 .9846 .9881 .9909 .9931 .9948 .9961 .9971 .9979 .9985 .9989 0,07 .5279 .5675 .6064 .6443 .6808 .7157 .7486 .7794 .8078 .8340 .8577 .8790 .8980 .9147 .9292 .9418 .9525 .9616 .9693 .9756 .9808 .9850 .9884 .9911 .9932 .9949 .9962 .9972 .9979 .9985 .9989 0,08 .5319 .5714 .6103 .6480 .6844 .7190 .7517 .7823 .8106 .8365 .8599 .8810 .8997 .9162 .9306 .9429 .9535 .9625 .9699 .9761 .9812 .9854 .9887 .9913 .9934 .9951 .9963 .9973 .9980 .9986 .9990 0,09 .5359 .5753 .6141 .6517 .6879 .7224 .7549 .7852 .8133 .8389 .8621 .8830 .9015 .9177 .9319 .9441 .9545 .9633 .9706 .9767 .9817 .9857 .9890 .9916 .9936 .9952 .9964 .9974 .9981 .9986 .9990 z 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 0,00 .9990323 .9993128 .9995165 .9996630 .9997673 .9998409 .9998922 .9999276 .9999519 .9999683 0,01 .9990645 .9993363 .9995335 .9996751 .9997759 .9998469 .9998963 .9999305 .9999538 .9999696 0,04 .9991552 .9994023 .9995811 .9997091 .9997999 .9998636 .9999080 .9999385 .9999592 .9999733 0,05 .9991836 .9994229 .9995959 .9997197 .9998073 .9998688 .9999116 .9999409 .9999609 .9999744 0,06 .9992111 .9994429 .9996102 .9997299 .9998145 .9998739 .9999150 .9999433 .9999625 .9999755 0,07 .9992377 .9994622 .9996241 .9997397 .9998215 .9998787 .9999184 .9999456 .9999640 .9999765 σ = np (1 − p) n→∞ p → 1/ 2 µ = np Normal µ,σ λ = np n → ∞, p → 0 σ= λ λ →∞ µ =λ λ Poisson Relación entre Binomial, Poisson y Normal 0,03 .9991259 .9993810 .9995657 .9996982 .9997922 .9998583 .9999042 .9999359 .9999575 .9999721 Binomial n,p 0,02 .9990957 .9993590 .9995499 .9996868 .9997842 .9998527 .9999004 .9999333 .9999557 .9999709 Distribución normal estándar (continuación) 0,08 .9992636 .9994809 .9996375 .9997492 .9998282 .9998834 .9999216 .9999478 .9999655 .9999775 N(0,1) z 0,09 .9992886 .9994990 .9996505 .9997584 .9998346 .9998878 .9999247 .9999499 .9999669 .9999784 P (Z ≤ z) α P(χ9 ≥ 19,02) = 0,025 EJEMPLO ν: grados de libertad (g.l.) χ ν, α Tabla χ2 g.l. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 0,995 ,00004 ,01002 ,0717 0,207 0,412 0,676 0,989 1,344 1,735 2,156 2,603 3,074 3,565 4,075 4,601 5,142 5,697 6,265 6,844 7,434 8,034 8,643 9,260 9,886 10,520 11,160 11,808 12,461 13,121 13,787 20,707 27,991 35,534 43,275 51,172 59,196 67,328 83,852 0,990 ,00016 ,0201 0,115 0,297 0,554 0,872 1,239 1,647 2,088 2,558 3,053 3,571 4,107 4,660 5,229 5,812 6,408 7,015 7,633 8,260 8,897 9,542 10,196 10,856 11,524 12,198 12,878 13,565 14,256 14,953 22,164 29,707 37,485 45,442 53,540 61,754 70,065 86,923 0,975 ,00098 0,051 0,216 0,484 0,831 1,237 1,690 2,180 2,700 3,247 3,816 4,404 5,009 5,629 6,262 6,908 7,564 8,231 8,907 9,591 10,283 10,982 11,689 12,401 13,120 13,844 14,573 15,308 16,047 16,791 24,433 32,357 40,482 48,758 57,153 65,647 74,222 91,573 0,950 ,00393 0,103 0,352 0,711 1,145 1,635 2,167 2,733 3,325 3,940 4,575 5,226 5,892 6,571 7,261 7,962 8,672 9,390 10,117 10,851 11,591 12,338 13,091 13,848 14,611 15,379 16,151 16,928 17,708 18,493 26,509 34,764 43,188 51,739 60,391 69,126 77,929 95,705 α 0,500 0,455 1,386 2,366 3,357 4,351 5,348 6,346 7,344 8,343 9,342 10,341 11,340 12,340 13,339 14,339 15,338 16,338 17,338 18,338 19,337 20,337 21,337 22,337 23,337 24,337 25,336 26,336 27,336 28,336 29,336 39,335 49,335 59,335 69,334 79,334 89,334 99,334 119,334 0,050 3,841 5,991 7,815 9,488 11,07 12,59 14,07 15,51 16,92 18,31 19,68 21,03 22,36 23,68 25,00 26,30 27,59 28,87 30,14 31,41 32,67 33,92 35,17 36,42 37,65 38,89 40,11 41,34 42,56 43,77 55,76 67,50 79,08 90,53 101,88 113,15 124,34 146,57 0,025 5,024 7,378 9,348 11,14 12,83 14,45 16,01 17,53 19,02 20,48 21,92 23,34 24,74 26,12 27,49 28,85 30,19 31,53 32,85 34,17 35,48 36,78 38,08 39,36 40,65 41,92 43,19 44,46 45,72 46,98 59,34 71,42 83,30 95,02 106,63 118,14 129,56 152,21 0,010 6,635 9,210 11,34 13,28 15,09 16,81 18,48 20,09 21,67 23,21 24,73 26,22 27,69 29,14 30,58 32,00 33,41 34,81 36,19 37,57 38,93 40,29 41,64 42,98 44,31 45,64 46,96 48,28 49,59 50,89 63,69 76,15 88,38 100,43 112,33 124,12 135,81 158,95 0,005 7,879 10,60 12,84 14,86 16,75 18,55 20,28 21,95 23,59 25,19 26,76 28,30 29,82 31,32 32,80 34,27 35,72 37,16 38,58 40,00 41,40 42,80 44,18 45,56 46,93 48,29 49,65 50,99 52,34 53,67 66,77 79,49 91,95 104,21 116,32 128,30 140,17 163,65 α P(t9 ≥ 2,262) = 0,025 EJEMPLO ν: grados de libertad (g.l.) tν,α t-Student Tabla g.l 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 infinito 0,20 1,376 1,061 0,978 0,941 0,920 0,906 0,896 0,889 0,883 0,879 0,876 0,873 0,870 0,868 0,866 0,865 0,863 0,862 0,861 0,860 0,859 0,858 0,858 0,857 0,856 0,856 0,855 0,855 0,854 0,854 0,851 0,849 0,848 0,847 0,846 0,846 0,845 0,842 0,20 0,15 1,963 1,386 1,250 1,190 1,156 1,134 1,119 1,108 1,100 1,093 1,088 1,083 1,079 1,076 1,074 1,071 1,069 1,067 1,066 1,064 1,063 1,061 1,060 1,059 1,058 1,058 1,057 1,056 1,055 1,055 1,050 1,047 1,045 1,044 1,043 1,042 1,042 1,036 0,15 0,10 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,303 1,299 1,296 1,294 1,292 1,291 1,290 1,282 0,10 0,05 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,684 1,676 1,671 1,667 1,664 1,662 1,660 1,645 0,05 α 0,025 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,021 2,009 2,000 1,994 1,990 1,987 1,984 1,960 0,025 0,01 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,423 2,403 2,390 2,381 2,374 2,368 2,364 2,327 0,01 0,005 63,656 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,704 2,678 2,660 2,648 2,639 2,632 2,626 2,576 0,005 0,0025 127,321 14,089 7,453 5,598 4,773 4,317 4,029 3,833 3,690 3,581 3,497 3,428 3,372 3,326 3,286 3,252 3,222 3,197 3,174 3,153 3,135 3,119 3,104 3,091 3,078 3,067 3,057 3,047 3,038 3,030 2,971 2,937 2,915 2,899 2,887 2,878 2,871 2,808 0,0025 0,001 318,289 22,328 10,214 7,173 5,894 5,208 4,785 4,501 4,297 4,144 4,025 3,930 3,852 3,787 3,733 3,686 3,646 3,610 3,579 3,552 3,527 3,505 3,485 3,467 3,450 3,435 3,421 3,408 3,396 3,385 3,307 3,261 3,232 3,211 3,195 3,183 3,174 3,091 0,001 0,0005 636,578 31,600 12,924 8,610 6,869 5,959 5,408 5,041 4,781 4,587 4,437 4,318 4,221 4,140 4,073 4,015 3,965 3,922 3,883 3,850 3,819 3,792 3,768 3,745 3,725 3,707 3,689 3,674 3,660 3,646 3,551 3,496 3,460 3,435 3,416 3,402 3,390 3,291 0,0005 α=0.05 1 161,4 18,51 10,13 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,84 4,75 4,67 4,60 4,54 4,49 4,45 4,41 4,38 4,35 4,32 4,30 4,28 4,26 4,24 4,23 4,21 4,20 4,18 4,17 4,08 4,03 4,00 3,98 3,96 3,95 3,94 3,92 3,84 1 2 199,5 19,00 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,98 3,89 3,81 3,74 3,68 3,63 3,59 3,55 3,52 3,49 3,47 3,44 3,42 3,40 3,39 3,37 3,35 3,34 3,33 3,32 3,23 3,18 3,15 3,13 3,11 3,10 3,09 3,07 3,00 2 3 215,7 19,16 9,28 6,59 5,41 4,76 4,35 4,07 3,86 3,71 3,59 3,49 3,41 3,34 3,29 3,24 3,20 3,16 3,13 3,10 3,07 3,05 3,03 3,01 2,99 2,98 2,96 2,95 2,93 2,92 2,84 2,79 2,76 2,74 2,72 2,71 2,70 2,68 2,60 3 4 224,6 19,25 9,12 6,39 5,19 4,53 4,12 3,84 3,63 3,48 3,36 3,26 3,18 3,11 3,06 3,01 2,96 2,93 2,90 2,87 2,84 2,82 2,80 2,78 2,76 2,74 2,73 2,71 2,70 2,69 2,61 2,56 2,53 2,50 2,49 2,47 2,46 2,45 2,37 4 6 234,0 19,33 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,53 2,51 2,49 2,47 2,46 2,45 2,43 2,42 2,34 2,29 2,25 2,23 2,21 2,20 2,19 2,18 2,10 6 7 236,8 19,35 8,89 6,09 4,88 4,21 3,79 3,50 3,29 3,14 3,01 2,91 2,83 2,76 2,71 2,66 2,61 2,58 2,54 2,51 2,49 2,46 2,44 2,42 2,40 2,39 2,37 2,36 2,35 2,33 2,25 2,20 2,17 2,14 2,13 2,11 2,10 2,09 2,01 7 8 238,9 19,37 8,85 6,04 4,82 4,15 3,73 3,44 3,23 3,07 2,95 2,85 2,77 2,70 2,64 2,59 2,55 2,51 2,48 2,45 2,42 2,40 2,37 2,36 2,34 2,32 2,31 2,29 2,28 2,27 2,18 2,13 2,10 2,07 2,06 2,04 2,03 2,02 1,94 8 9 240,5 19,38 8,81 6,00 4,77 4,10 3,68 3,39 3,18 3,02 2,90 2,80 2,71 2,65 2,59 2,54 2,49 2,46 2,42 2,39 2,37 2,34 2,32 2,30 2,28 2,27 2,25 2,24 2,22 2,21 2,12 2,07 2,04 2,02 2,00 1,99 1,97 1,96 1,88 9 10 241,9 19,40 8,79 5,96 4,74 4,06 3,64 3,35 3,14 2,98 2,85 2,75 2,67 2,60 2,54 2,49 2,45 2,41 2,38 2,35 2,32 2,30 2,27 2,25 2,24 2,22 2,20 2,19 2,18 2,16 2,08 2,03 1,99 1,97 1,95 1,94 1,93 1,91 1,83 10 12 243,9 19,41 8,74 5,91 4,68 4,00 3,57 3,28 3,07 2,91 2,79 2,69 2,60 2,53 2,48 2,42 2,38 2,34 2,31 2,28 2,25 2,23 2,20 2,18 2,16 2,15 2,13 2,12 2,10 2,09 2,00 1,95 1,92 1,89 1,88 1,86 1,85 1,83 1,75 12 15 245,9 19,43 8,70 5,86 4,62 3,94 3,51 3,22 3,01 2,85 2,72 2,62 2,53 2,46 2,40 2,35 2,31 2,27 2,23 2,20 2,18 2,15 2,13 2,11 2,09 2,07 2,06 2,04 2,03 2,01 1,92 1,87 1,84 1,81 1,79 1,78 1,77 1,75 1,67 15 20 248,0 19,45 8,66 5,80 4,56 3,87 3,44 3,15 2,94 2,77 2,65 2,54 2,46 2,39 2,33 2,28 2,23 2,19 2,16 2,12 2,10 2,07 2,05 2,03 2,01 1,99 1,97 1,96 1,94 1,93 1,84 1,78 1,75 1,72 1,70 1,69 1,68 1,66 1,57 20 24 249,1 19,45 8,64 5,77 4,53 3,84 3,41 3,12 2,90 2,74 2,61 2,51 2,42 2,35 2,29 2,24 2,19 2,15 2,11 2,08 2,05 2,03 2,01 1,98 1,96 1,95 1,93 1,91 1,90 1,89 1,79 1,74 1,70 1,67 1,65 1,64 1,63 1,61 1,52 24 ⇒ P ( Fν 1 ,ν 2 ≥ Fν 1 ,ν 2 ,α ) = α Grados de libertad del numerador: ν1 5 230,2 19,30 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3,11 3,03 2,96 2,90 2,85 2,81 2,77 2,74 2,71 2,68 2,66 2,64 2,62 2,60 2,59 2,57 2,56 2,55 2,53 2,45 2,40 2,37 2,35 2,33 2,32 2,31 2,29 2,21 5 Fν 1 ,ν 2 ,α Ejemplo : P ( F7,8 ≥ 3.50) = 0.05 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf Tabla F Grados de libertad del denominador: ν2 30 250,1 19,46 8,62 5,75 4,50 3,81 3,38 3,08 2,86 2,70 2,57 2,47 2,38 2,31 2,25 2,19 2,15 2,11 2,07 2,04 2,01 1,98 1,96 1,94 1,92 1,90 1,88 1,87 1,85 1,84 1,74 1,69 1,65 1,62 1,60 1,59 1,57 1,55 1,46 30 40 251,1 19,47 8,59 5,72 4,46 3,77 3,34 3,04 2,83 2,66 2,53 2,43 2,34 2,27 2,20 2,15 2,10 2,06 2,03 1,99 1,96 1,94 1,91 1,89 1,87 1,85 1,84 1,82 1,81 1,79 1,69 1,63 1,59 1,57 1,54 1,53 1,52 1,50 1,39 40 60 252,2 19,48 8,57 5,69 4,43 3,74 3,30 3,01 2,79 2,62 2,49 2,38 2,30 2,22 2,16 2,11 2,06 2,02 1,98 1,95 1,92 1,89 1,86 1,84 1,82 1,80 1,79 1,77 1,75 1,74 1,64 1,58 1,53 1,50 1,48 1,46 1,45 1,43 1,32 60 100 253,0 19,49 8,55 5,66 4,41 3,71 3,27 2,97 2,76 2,59 2,46 2,35 2,26 2,19 2,12 2,07 2,02 1,98 1,94 1,91 1,88 1,85 1,82 1,80 1,78 1,76 1,74 1,73 1,71 1,70 1,59 1,52 1,48 1,45 1,43 1,41 1,39 1,37 1,24 100 120 253,3 19,49 8,55 5,66 4,40 3,70 3,27 2,97 2,75 2,58 2,45 2,34 2,25 2,18 2,11 2,06 2,01 1,97 1,93 1,90 1,87 1,84 1,81 1,79 1,77 1,75 1,73 1,71 1,70 1,68 1,58 1,51 1,47 1,44 1,41 1,39 1,38 1,35 1,22 120 Inf. 254,3 19,50 8,53 5,63 4,37 3,67 3,23 2,93 2,71 2,54 2,40 2,30 2,21 2,13 2,07 2,01 1,96 1,92 1,88 1,84 1,81 1,78 1,76 1,73 1,71 1,69 1,67 1,65 1,64 1,62 1,51 1,44 1,39 1,35 1,32 1,30 1,28 1,25 1,00 Inf. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf 1 647,8 38,51 17,44 12,22 10,01 8,81 8,07 7,57 7,21 6,94 6,72 6,55 6,41 6,30 6,20 6,12 6,04 5,98 5,92 5,87 5,83 5,79 5,75 5,72 5,69 5,66 5,63 5,61 5,59 5,57 5,42 5,34 5,29 5,25 5,22 5,20 5,18 5,15 5,02 1 2 799,5 39,00 16,04 10,65 8,43 7,26 6,54 6,06 5,71 5,46 5,26 5,10 4,97 4,86 4,77 4,69 4,62 4,56 4,51 4,46 4,42 4,38 4,35 4,32 4,29 4,27 4,24 4,22 4,20 4,18 4,05 3,97 3,93 3,89 3,86 3,84 3,83 3,80 3,69 2 3 864,2 39,17 15,44 9,98 7,76 6,60 5,89 5,42 5,08 4,83 4,63 4,47 4,35 4,24 4,15 4,08 4,01 3,95 3,90 3,86 3,82 3,78 3,75 3,72 3,69 3,67 3,65 3,63 3,61 3,59 3,46 3,39 3,34 3,31 3,28 3,26 3,25 3,23 3,12 3 4 899,6 39,25 15,10 9,60 7,39 6,23 5,52 5,05 4,72 4,47 4,28 4,12 4,00 3,89 3,80 3,73 3,66 3,61 3,56 3,51 3,48 3,44 3,41 3,38 3,35 3,33 3,31 3,29 3,27 3,25 3,13 3,05 3,01 2,97 2,95 2,93 2,92 2,89 2,79 4 5 921,8 39,30 14,88 9,36 7,15 5,99 5,29 4,82 4,48 4,24 4,04 3,89 3,77 3,66 3,58 3,50 3,44 3,38 3,33 3,29 3,25 3,22 3,18 3,15 3,13 3,10 3,08 3,06 3,04 3,03 2,90 2,83 2,79 2,75 2,73 2,71 2,70 2,67 2,57 5 ⇒ P ( Fν 1 ,ν 2 ≥ Fν 1 ,ν 2 ,α ) = α 6 937,1 39,33 14,73 9,20 6,98 5,82 5,12 4,65 4,32 4,07 3,88 3,73 3,60 3,50 3,41 3,34 3,28 3,22 3,17 3,13 3,09 3,05 3,02 2,99 2,97 2,94 2,92 2,90 2,88 2,87 2,74 2,67 2,63 2,59 2,57 2,55 2,54 2,52 2,41 6 7 948,2 39,36 14,62 9,07 6,85 5,70 4,99 4,53 4,20 3,95 3,76 3,61 3,48 3,38 3,29 3,22 3,16 3,10 3,05 3,01 2,97 2,93 2,90 2,87 2,85 2,82 2,80 2,78 2,76 2,75 2,62 2,55 2,51 2,47 2,45 2,43 2,42 2,39 2,29 7 8 956,6 39,37 14,54 8,98 6,76 5,60 4,90 4,43 4,10 3,85 3,66 3,51 3,39 3,29 3,20 3,12 3,06 3,01 2,96 2,91 2,87 2,84 2,81 2,78 2,75 2,73 2,71 2,69 2,67 2,65 2,53 2,46 2,41 2,38 2,35 2,34 2,32 2,30 2,19 8 9 963,3 39,39 14,47 8,90 6,68 5,52 4,82 4,36 4,03 3,78 3,59 3,44 3,31 3,21 3,12 3,05 2,98 2,93 2,88 2,84 2,80 2,76 2,73 2,70 2,68 2,65 2,63 2,61 2,59 2,57 2,45 2,38 2,33 2,30 2,28 2,26 2,24 2,22 2,11 9 10 968,6 39,40 14,42 8,84 6,62 5,46 4,76 4,30 3,96 3,72 3,53 3,37 3,25 3,15 3,06 2,99 2,92 2,87 2,82 2,77 2,73 2,70 2,67 2,64 2,61 2,59 2,57 2,55 2,53 2,51 2,39 2,32 2,27 2,24 2,21 2,19 2,18 2,16 2,05 10 12 976,7 39,41 14,34 8,75 6,52 5,37 4,67 4,20 3,87 3,62 3,43 3,28 3,15 3,05 2,96 2,89 2,82 2,77 2,72 2,68 2,64 2,60 2,57 2,54 2,51 2,49 2,47 2,45 2,43 2,41 2,29 2,22 2,17 2,14 2,11 2,09 2,08 2,05 1,94 12 15 984,9 39,43 14,25 8,66 6,43 5,27 4,57 4,10 3,77 3,52 3,33 3,18 3,05 2,95 2,86 2,79 2,72 2,67 2,62 2,57 2,53 2,50 2,47 2,44 2,41 2,39 2,36 2,34 2,32 2,31 2,18 2,11 2,06 2,03 2,00 1,98 1,97 1,94 1,83 15 20 993,1 39,45 14,17 8,56 6,33 5,17 4,47 4,00 3,67 3,42 3,23 3,07 2,95 2,84 2,76 2,68 2,62 2,56 2,51 2,46 2,42 2,39 2,36 2,33 2,30 2,28 2,25 2,23 2,21 2,20 2,07 1,99 1,94 1,91 1,88 1,86 1,85 1,82 1,71 20 24 30 40 60 100 120 Inf. 997,3 1001,4 1005,6 1009,8 1013,2 1014,0 1018,3 39,46 39,46 39,47 39,48 39,49 39,49 39,50 14,12 14,08 14,04 13,99 13,96 13,95 13,90 8,51 8,46 8,41 8,36 8,32 8,31 8,26 6,28 6,23 6,18 6,12 6,08 6,07 6,02 5,12 5,07 5,01 4,96 4,92 4,90 4,85 4,41 4,36 4,31 4,25 4,21 4,20 4,14 3,95 3,89 3,84 3,78 3,74 3,73 3,67 3,61 3,56 3,51 3,45 3,40 3,39 3,33 3,37 3,31 3,26 3,20 3,15 3,14 3,08 3,17 3,12 3,06 3,00 2,96 2,94 2,88 3,02 2,96 2,91 2,85 2,80 2,79 2,72 2,89 2,84 2,78 2,72 2,67 2,66 2,60 2,79 2,73 2,67 2,61 2,56 2,55 2,49 2,70 2,64 2,59 2,52 2,47 2,46 2,40 2,63 2,57 2,51 2,45 2,40 2,38 2,32 2,56 2,50 2,44 2,38 2,33 2,32 2,25 2,50 2,44 2,38 2,32 2,27 2,26 2,19 2,45 2,39 2,33 2,27 2,22 2,20 2,13 2,41 2,35 2,29 2,22 2,17 2,16 2,09 2,37 2,31 2,25 2,18 2,13 2,11 2,04 2,33 2,27 2,21 2,14 2,09 2,08 2,00 2,30 2,24 2,18 2,11 2,06 2,04 1,97 2,27 2,21 2,15 2,08 2,02 2,01 1,94 2,24 2,18 2,12 2,05 2,00 1,98 1,91 2,22 2,16 2,09 2,03 1,97 1,95 1,88 2,19 2,13 2,07 2,00 1,94 1,93 1,85 2,17 2,11 2,05 1,98 1,92 1,91 1,83 2,15 2,09 2,03 1,96 1,90 1,89 1,81 2,14 2,07 2,01 1,94 1,88 1,87 1,79 2,01 1,94 1,88 1,80 1,74 1,72 1,64 1,93 1,87 1,80 1,72 1,66 1,64 1,55 1,88 1,82 1,74 1,67 1,60 1,58 1,48 1,85 1,78 1,71 1,63 1,56 1,54 1,44 1,82 1,75 1,68 1,60 1,53 1,51 1,40 1,80 1,73 1,66 1,58 1,50 1,48 1,37 1,78 1,71 1,64 1,56 1,48 1,46 1,35 1,76 1,69 1,61 1,53 1,45 1,43 1,31 1,64 1,57 1,48 1,39 1,30 1,27 1,00 24 30 40 60 100 120 Inf. Grados de libertad del numerador: ν1 Fν 1 ,ν 2 ,α Ejemplo : P ( F7,8 ≥ 4.53) = 0.025 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf α=0.025 Tabla F Grados de libertad del denominador: ν2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf 1 4052,2 98,50 34,12 21,20 16,26 13,75 12,25 11,26 10,56 10,04 9,65 9,33 9,07 8,86 8,68 8,53 8,40 8,29 8,18 8,10 8,02 7,95 7,88 7,82 7,77 7,72 7,68 7,64 7,60 7,56 7,31 7,17 7,08 7,01 6,96 6,93 6,90 6,85 6,63 1 2 4999,3 99,00 30,82 18,00 13,27 10,92 9,55 8,65 8,02 7,56 7,21 6,93 6,70 6,51 6,36 6,23 6,11 6,01 5,93 5,85 5,78 5,72 5,66 5,61 5,57 5,53 5,49 5,45 5,42 5,39 5,18 5,06 4,98 4,92 4,88 4,85 4,82 4,79 4,61 2 3 5403,5 99,16 29,46 16,69 12,06 9,78 8,45 7,59 6,99 6,55 6,22 5,95 5,74 5,56 5,42 5,29 5,19 5,09 5,01 4,94 4,87 4,82 4,76 4,72 4,68 4,64 4,60 4,57 4,54 4,51 4,31 4,20 4,13 4,07 4,04 4,01 3,98 3,95 3,78 3 4 5624,3 99,25 28,71 15,98 11,39 9,15 7,85 7,01 6,42 5,99 5,67 5,41 5,21 5,04 4,89 4,77 4,67 4,58 4,50 4,43 4,37 4,31 4,26 4,22 4,18 4,14 4,11 4,07 4,04 4,02 3,83 3,72 3,65 3,60 3,56 3,53 3,51 3,48 3,32 4 5 5764,0 99,30 28,24 15,52 10,97 8,75 7,46 6,63 6,06 5,64 5,32 5,06 4,86 4,69 4,56 4,44 4,34 4,25 4,17 4,10 4,04 3,99 3,94 3,90 3,85 3,82 3,78 3,75 3,73 3,70 3,51 3,41 3,34 3,29 3,26 3,23 3,21 3,17 3,02 5 6 5859,0 99,33 27,91 15,21 10,67 8,47 7,19 6,37 5,80 5,39 5,07 4,82 4,62 4,46 4,32 4,20 4,10 4,01 3,94 3,87 3,81 3,76 3,71 3,67 3,63 3,59 3,56 3,53 3,50 3,47 3,29 3,19 3,12 3,07 3,04 3,01 2,99 2,96 2,80 6 7 5928,3 99,36 27,67 14,98 10,46 8,26 6,99 6,18 5,61 5,20 4,89 4,64 4,44 4,28 4,14 4,03 3,93 3,84 3,77 3,70 3,64 3,59 3,54 3,50 3,46 3,42 3,39 3,36 3,33 3,30 3,12 3,02 2,95 2,91 2,87 2,84 2,82 2,79 2,64 7 8 5981,0 99,38 27,49 14,80 10,29 8,10 6,84 6,03 5,47 5,06 4,74 4,50 4,30 4,14 4,00 3,89 3,79 3,71 3,63 3,56 3,51 3,45 3,41 3,36 3,32 3,29 3,26 3,23 3,20 3,17 2,99 2,89 2,82 2,78 2,74 2,72 2,69 2,66 2,51 8 9 6022,4 99,39 27,34 14,66 10,16 7,98 6,72 5,91 5,35 4,94 4,63 4,39 4,19 4,03 3,89 3,78 3,68 3,60 3,52 3,46 3,40 3,35 3,30 3,26 3,22 3,18 3,15 3,12 3,09 3,07 2,89 2,78 2,72 2,67 2,64 2,61 2,59 2,56 2,41 9 10 6055,9 99,40 27,23 14,55 10,05 7,87 6,62 5,81 5,26 4,85 4,54 4,30 4,10 3,94 3,80 3,69 3,59 3,51 3,43 3,37 3,31 3,26 3,21 3,17 3,13 3,09 3,06 3,03 3,00 2,98 2,80 2,70 2,63 2,59 2,55 2,52 2,50 2,47 2,32 10 12 6106,7 99,42 27,05 14,37 9,89 7,72 6,47 5,67 5,11 4,71 4,40 4,16 3,96 3,80 3,67 3,55 3,46 3,37 3,30 3,23 3,17 3,12 3,07 3,03 2,99 2,96 2,93 2,90 2,87 2,84 2,66 2,56 2,50 2,45 2,42 2,39 2,37 2,34 2,18 12 15 6157,0 99,43 26,87 14,20 9,72 7,56 6,31 5,52 4,96 4,56 4,25 4,01 3,82 3,66 3,52 3,41 3,31 3,23 3,15 3,09 3,03 2,98 2,93 2,89 2,85 2,81 2,78 2,75 2,73 2,70 2,52 2,42 2,35 2,31 2,27 2,24 2,22 2,19 2,04 15 20 6208,7 99,45 26,69 14,02 9,55 7,40 6,16 5,36 4,81 4,41 4,10 3,86 3,66 3,51 3,37 3,26 3,16 3,08 3,00 2,94 2,88 2,83 2,78 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,37 2,27 2,20 2,15 2,12 2,09 2,07 2,03 1,88 20 24 6234,3 99,46 26,60 13,93 9,47 7,31 6,07 5,28 4,73 4,33 4,02 3,78 3,59 3,43 3,29 3,18 3,08 3,00 2,92 2,86 2,80 2,75 2,70 2,66 2,62 2,58 2,55 2,52 2,49 2,47 2,29 2,18 2,12 2,07 2,03 2,00 1,98 1,95 1,79 24 ⇒ P ( Fν 1 ,ν 2 ≥ Fν 1 ,ν 2 ,α ) = α Grados de libertad del numerador: ν1 Fν 1 ,ν 2 ,α Ejemplo : P ( F7,8 ≥ 6.18) = 0.01 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf α=0.01 Tabla F Grados de libertad del denominador: ν2 30 6260,4 99,47 26,50 13,84 9,38 7,23 5,99 5,20 4,65 4,25 3,94 3,70 3,51 3,35 3,21 3,10 3,00 2,92 2,84 2,78 2,72 2,67 2,62 2,58 2,54 2,50 2,47 2,44 2,41 2,39 2,20 2,10 2,03 1,98 1,94 1,92 1,89 1,86 1,70 30 40 6286,4 99,48 26,41 13,75 9,29 7,14 5,91 5,12 4,57 4,17 3,86 3,62 3,43 3,27 3,13 3,02 2,92 2,84 2,76 2,69 2,64 2,58 2,54 2,49 2,45 2,42 2,38 2,35 2,33 2,30 2,11 2,01 1,94 1,89 1,85 1,82 1,80 1,76 1,59 40 60 6313,0 99,48 26,32 13,65 9,20 7,06 5,82 5,03 4,48 4,08 3,78 3,54 3,34 3,18 3,05 2,93 2,83 2,75 2,67 2,61 2,55 2,50 2,45 2,40 2,36 2,33 2,29 2,26 2,23 2,21 2,02 1,91 1,84 1,78 1,75 1,72 1,69 1,66 1,47 60 100 6333,9 99,49 26,24 13,58 9,13 6,99 5,75 4,96 4,41 4,01 3,71 3,47 3,27 3,11 2,98 2,86 2,76 2,68 2,60 2,54 2,48 2,42 2,37 2,33 2,29 2,25 2,22 2,19 2,16 2,13 1,94 1,82 1,75 1,70 1,65 1,62 1,60 1,56 1,36 100 120 6339,5 99,49 26,22 13,56 9,11 6,97 5,74 4,95 4,40 4,00 3,69 3,45 3,25 3,09 2,96 2,84 2,75 2,66 2,58 2,52 2,46 2,40 2,35 2,31 2,27 2,23 2,20 2,17 2,14 2,11 1,92 1,80 1,73 1,67 1,63 1,60 1,57 1,53 1,32 120 Inf. 6365,6 99,50 26,13 13,46 9,02 6,88 5,65 4,86 4,31 3,91 3,60 3,36 3,17 3,00 2,87 2,75 2,65 2,57 2,49 2,42 2,36 2,31 2,26 2,21 2,17 2,13 2,10 2,06 2,03 2,01 1,80 1,68 1,60 1,54 1,49 1,46 1,43 1,38 1,00 Inf. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 120 Inf