TECNOLOGICO NACIONAL DE MEXICO INSTITUTO TECNOLOGICO DE OCOTLAN INGENIERIA EN SISTEMAS COMPUTACIONALES PROBABILIDAD Y ESTADISTICA PORTAFOLIO DE EVIDENCIAS PROFESOR: AVALOS OCHOA RAUL ALUMNO: RODRIGUEZ GONZALEZ BENJAMIN FECHA: 05/JULIO/2021 CONTENIDO UNIDAD DOS. FUNDAMENTOS DE PROBABILIDAD 3 2.1. CONJUNTOS Y TÉCNICAS DE CONTEO. 3 2.2. CONCEPTO CLÁSICO Y COMO FRECUENCIA RELATIVA. 5 2.3. ESPACIO MUESTRAL Y EVENTOS. 6 2.4. AXIOMAS Y TEOREMAS. 8 2.5. PROBABILIDAD CLÁSICA: ESPACIO FINITO EQUIPARABLE. 9 2.6. PROBABILIDAD CONDICIONAL E INDEPENDENCIA. 11 2.7. TEOREMA DE BAYES 13 UNIDAD TRES. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS 15 3.1 DEFINICION DE DISTRIBUCION DE VARIABLE ALEATORIA DISCRETA 15 3.2. FUNCIÓN DE PROBABILIDAD Y DE DISTRIBUCIÓN, VALOR ESPERADO, VARIANZA Y DESVIACIÓN ESTÁNDAR. 18 3.3. DISTRIBUCIÓN BINOMIAL. 25 3.4. DISTRIBUCIÓN HIPERGEOMÉTRICA 27 3.4.1 APROXIMACIÓN DE LA HIPERGEOMÉTRICA POR LA BINOMIAL. 30 3.7. DISTRIBUCIÓN DE POISSON. 34 3.9. DISTRIBUCIÓN BINOMIAL NEGATIVA. 36 UNIDAD CUATRO. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS. 40 4.1 DEFINICIÓN DE VARIABLE ALEATORIA CONTINÚA. 40 4.2. FUNCIÓN DE DENSIDAD Y ACUMULATIVA. 41 4.3. VALOR ESPERADO, VARIANZA Y DESVIACIÓN ESTÁNDAR. 44 4.4. DISTRIBUCIÓN UNIFORME (CONTINUA). 45 4.5 DISTRIBUCIÓN EXPONENCIAL. 46 4.6 DISTRIBUCIÓN GAMMA (ERLANG). 47 4.7. DISTRIBUCIÓN NORMAL. 48 4.7.1 APROXIMACIÓN DE LA BINOMIAL A LA NORMAL. 4.8. TEOREMA DE CHEBYSHEV. 52 REFERENCIAS BIBLIOGRAFICAS RODRIGUEZ GONZALEZ BENJAMIN 50 56 2 SISTEMAS “A” UNIDAD DOS. FUNDAMENTOS DE PROBABILIDAD 2.1. CONJUNTOS Y TÉCNICAS DE CONTEO. EL TÉRMINO CONJUNTO JUEGA UN PAPEL FUNDAMENTAL EN EL DESARROLLO DE LAS MATEMÁTICAS MODERNAS; ADEMÁS DE PROPORCIONAR LAS BASES PARA COMPRENDER CON MAYOR CLARIDAD ALGUNOS ASPECTOS DE LA TEORÍA DE LA PROBABILIDAD. SU ORIGEN SE DEBE AL MATEMÁTICO ALEMÁN GEORGE CANTOR (1845 – 1918). PODEMOS DEFINIR DE MANERA INTUITIVA A UN CONJUNTO, COMO UNA COLECCIÓN O LISTADO DE OBJETOS CON CARACTERÍSTICAS BIEN DEFINIDAS QUE LO HACE PERTENECER A UN GRUPO DETERMINADO. PARA QUE EXISTA UN CONJUNTO DEBE BASARSE EN LO SIGUIENTE: o LA COLECCIÓN DE ELEMENTOS DEBE ESTAR BIEN DEFINIDA. o NINGÚN ELEMENTO DEL CONJUNTO SE DEBE CONTAR MÁS DE UNA VEZ, GENERALMENTE, ESTOS ELEMENTOS DEBEN SER DIFERENTES, SI UNO DE ELLOS SE REPITE SE CONTARÁ SÓLO UNA VEZ. o EL ORDEN EN QUE SE ENUMERAN LOS ELEMENTOS QUE CARECEN DE IMPORTANCIA. NOTACIÓN: A LOS CONJUNTOS SE LES REPRESENTA CON LETRAS MAYÚSCULAS A, B, C, Y A LOS ELEMENTOS CON LETRAS MINÚSCULAS A, B, C,, POR EJEMPLO, EL CONJUNTO A CUYOS ELEMENTOS SON LOS NÚMEROS EN EL LANZAMIENTO DE UN DADO. A = {1, 2, 3, 4, 5, 6} RODRIGUEZ GONZALEZ BENJAMIN 3 SISTEMAS “A” EN BASE A LA CANTIDAD DE ELEMENTOS QUE TENGA UN CONJUNTO, ESTOS SE PUEDEN CLASIFICAR EN CONJUNTOS FINITOS E INFINITOS. FINITOS: TIENEN UN NÚMERO CONOCIDO DE ELEMENTOS, ES DECIR, SE ENCUENTRAN DETERMINADOS POR SU LONGITUD O CANTIDAD. EJEMPLO: EL CONJUNTO DE DÍAS DE LA SEMANA. INFINITOS: SON AQUELLOS EN LOS CUALES NO PODEMOS DETERMINAR SU LONGITUD. EJEMPLO: EL CONJUNTO DE LOS NÚMEROS REALES. EXISTEN DOS FORMAS COMUNES DE EXPRESAR UN CONJUNTO Y LA SELECCIÓN DE UNA FORMA PARTICULAR DE EXPRESIÓN DEPENDE DE LA CONVENIENCIA Y DE CIERTAS CIRCUNSTANCIAS SIENDO: EXTENSIÓN: CUANDO SE DESCRIBE A CADA UNO DE LOS ELEMENTOS. A = {A, E, I, O, U} COMPRENSIÓN: CUANDO SE ENUNCIAN LAS PROPIEDADES QUE DEBEN TENER SUS ELEMENTOS. A = {X | X ES UNA VOCAL} PARA DESCRIBIR SI UN ELEMENTO PERTENECE O NO A UN CONJUNTO, SE UTILIZA EL SÍMBOLO DE PERTENENCIA O ES ELEMENTO DE, CON EL SÍMBOLO _, EN CASO CONTRARIO _. A = {1, 2, 3} 2 _ A; 5 _ A EJEMPLO: UN GRUPO DE 10 PERSONAS QUIEREN HACER LIMPIEZA EN EL BARRIO Y SE PREPARAN PARA FORMAR GRUPOS DE 2 MIEMBROS CADA UNO, ¿CUÁNTOS GRUPOS SON POSIBLES? EN ESTE CASO, N = 10 Y R = 2, ASÍ PUES, APLICANDO LA FÓRMULA: 10C2=10! / (10-2)!2! =180 PAREJAS DISTINTAS. RODRIGUEZ GONZALEZ BENJAMIN 4 SISTEMAS “A” 2.2. CONCEPTO CLÁSICO Y COMO FRECUENCIA RELATIVA. UNA FRACCIÓN EN LA QUE EL NUMERADOR ES IGUAL AL NÚMERO DE APARICIONES DEL SUCESO Y EL DENOMINADOR ES IGUAL AL NÚMERO TOTAL DE CASOS EN LOS QUE ES SUCESO PUEDA O NO PUEDA OCURRIR. TAL FRACCIÓN EXPRESA LA PROBABILIDAD DE QUE OCURRA EL SUCESO". EL ENFOQUE CLÁSICO DE LA PROBABILIDAD ESTÁ BASADO EN LA SUPOSICIÓN DE QUE TODOS LOS RESULTADOS DEL EXPERIMENTO SON IGUALMENTE POSIBLES. LA PROBABILIDAD SE CALCULA DE LA SIGUIENTE MANERA: EJEMPLO: EL EXPERIMENTO ES LANZAR UN DADO. ¿CUÁL ES LA PROBABILIDAD DE QUE CAIGA UN DOS HACIA ARRIBA? LAS CARAS EL DADO ESTÁN NUMERADAS DEL 1 AL 6, ENTONCES HAY UNA POSIBILIDAD DE UN TOTAL DE SEIS DE QUE EL NÚMERO 2 QUEDE HACIA ARRIBA: P(cae 2) = 1 = 0.166 6 LA PRINCIPAL DIFICULTAD QUE PRESENTA ESTA INTERPRETACIÓN DE LA PROBABILIDAD ES QUE SE BASA EN SUCESOS EQUIPROBABLES, SIENDO FÁCIL PARA PROBLEMAS SENCILLOS, COMO LOS DE CARTAS, DADOS O URNAS, ES CASI IMPOSIBLE PARA PROBLEMAS MÁS COMPLEJOS. ES LA RELACIÓN O COCIENTE ENTRE LA FRECUENCIA ABSOLUTA Y EL NÚMERO TOTAL DE OBSERVACIONES. ES LA PROPORCIÓN ENTRE LA FRECUENCIA DE UN INTÉRVALO Y EL NÚMERO TOTAL DE DATOS. RODRIGUEZ GONZALEZ BENJAMIN 5 SISTEMAS “A” 2.3. ESPACIO MUESTRAL Y EVENTOS. ES UN CONJUNTO FORMADO POR TODOS LOS POSIBLES RESULTADOS DE UN EXPERIMENTO ALEATORIO. A CADA ELEMENTO DEL ESPACIO MUESTRAL SE CONOCE COMO PUNTO MUESTRAL (ELEMENTO O MIEMBRO DEL ESPACIO MUESTRAL). NOTACIÓN. EL ESPACIO MUESTRAL DE UN EXPERIMENTO SE DENOTA POR MEDIO DE LA LETRA S. EN ALGUNAS REFERENCIAS SE USA LA LETRA GRIEGA MAYÚSCULA OMEGA, PARA REPRESENTAR EL ESPACIO MUESTRAL. UN EVENTO ES UN SUBCONJUNTO DEL ESPACIO MUESTRAL 1. AL LANZAR UNA MONEDA, VIMOS QUE S = {A, S}. ENTONCES EL EVENTO A DE QUE CAIGA “SOL” ES EL SUBCONJUNTO A = {S}. SE CUMPLE QUE A S. 2. AL LANZAR UN DADO, PUEDE DEFINIRSE EL EVENTO B DE QUE OCURRA UNA CARA CON NÚMERO PAR. EN ESTE CASO, B= {2,4,6}. OBSERVEMOS QUE B ES UN SUBCONJUNTO DE S, B S. EJEMPLOS DE ESPACIO MUESTRAL o CUANDO SE LANZA UNA MONEDA PUEDE CAER “ÁGUILA” (A) O “SOL” (S). ASÍ, S = {A, S}. o AL LANZAR UN DADO, PUEDE CAER CUALQUIERA DE SUS SEIS CARAS CON 1, 2, 3, 4, 5 O 6 PUNTOS. EN ESTE CASO, S= {1,2,3,4,5,6}. o SI SE LANZAN TRES MONEDAS AL MISMO TIEMPO PUEDE OCURRIR CUALQUIERA DE 8 RESULTADOS POSIBLES. ASÍ QUE, S= {AAA, SSS, ASS, SSA, SAS, SAA, AAS, ASA}. RODRIGUEZ GONZALEZ BENJAMIN 6 SISTEMAS “A” o AL REGISTRARSE EL SEXO DE LA SIGUIENTE PERSONA QUE NACE PUEDE OCURRIR HOMBRE (H) O MUJER (M). EL ESPACIO MUESTRAL ES S= {H, M}. EN EL EJEMPLO 5 DE EXPERIMENTO, SI EN EL PRIMER LANZAMIENTO CAE SOL, ENTONCES SE LANZA OTRA VEZ LA MONEDA, DANDO LUGAR A LAS SIGUIENTES POSIBILIDADES, SS, SA; PERO SI EN EL PRIMER LANZAMIENTO OCURRE ÁGUILA, SE LANZA UN DADO, DANDO LUGAR A LOS PUNTOS MUESTRALES A1, A2, A3, A4, A5, A6. ENTONCES EL ESPACIO MUESTRAL ES S= {SS, SA, A1, A2, A3, A4, A5, A6} OBSERVE QUE, EN ESTE EJEMPLO DE ESPACIO MUESTRAL, CADA ELEMENTO ES UN PAR ORDENADO; EN EL EJEMPLO 3, UNA TERNA ORDENADA. EN GENERAL, UN PUNTO MUESTRAL PUEDE CONSISTIR DE UN K-TUPLE ORDENADO. A VECES, LOS ESPACIOS MUESTRALES TIENEN UN NÚMERO GRANDE O INFINITO DE ELEMENTOS. EN ESTE CASO ES MEJOR USAR UNA REGLA O DESCRIPCIÓN ANTES QUE ENUMERAR (*) SUS ELEMENTOS. SI LOS RESULTADOS POSIBLES DE UN EXPERIMENTO SON EL CONJUNTO DE INDIVIDUOS EN EL MUNDO CON MÁS DE 1.60 M DE ESTATURA QUE ASISTEN A UNA UNIVERSIDAD, EL ESPACIO MUESTRAL SE ESCRIBE ASÍ: S = {X|X ES UNA PERSONA CON MÁS DE 1.60 M DE ESTATURA QUE ASISTE A UNA UNIVERSIDAD} RODRIGUEZ GONZALEZ BENJAMIN 7 SISTEMAS “A” 2.4. AXIOMAS Y TEOREMAS. AXIOMAS: LA PROBABILIDAD DE QUE OCURRA UN EVENTO A CUALQUIERA SE ENCUENTRA ENTRE CERO Y UNO. 0 £ P(A) ³ 1 LA PROBABILIDAD DE QUE OCURRA EL ESPACIO MUESTRAL D DEBE DE SER 1. P(D) = 1 SI A Y B SON EVENTOS MUTUAMENTE EXCLUYENTES, ENTONCES LA P(AÈB) = P(A) + P(B) GENERALIZANDO: SI SE TIENEN N EVENTOS MUTUAMENTE EXCLUYENTES O EXCLUSIVOS A1, A2, A3, ..., AN, ENTONCES; P(A1ÈA2È.........ÈAN) = P(A1) + P(A2) + .......+ P(AN) TEOREMAS: TEOREMA 1. SI F ES UN EVENTO NULO O VACÍO, ENTONCES LA PROBABILIDAD DE QUE OCURRA F DEBE SER CERO. P(F)=0 DEMOSTRACIÓN: SI SUMAMOS A FUN EVENTO A CUALQUIERA, COMO F Y A SON DOS EVENTOS MUTUAMENTE EXCLUYENTES, ENTONCES P(AFÈ)=P(A) +P(F)=P(A). LQQD RODRIGUEZ GONZALEZ BENJAMIN 8 SISTEMAS “A” 2.5. PROBABILIDAD CLÁSICA: ESPACIO FINITO EQUIPARABLE. SEA D UN ESPACIO MUESTRAL QUE CONTIENE N ELEMENTOS, D = {A1, A2, A3, …, AN}, SI A CADA UNO DE LOS ELEMENTOS DE D LE ASIGNAMOS UNA PROBABILIDAD IGUAL DE OCURRENCIA, PI = 1/N POR TENER N ELEMENTOS D, ENTONCES ESTAMOS TRANSFORMANDO ESTE ESPACIO MUESTRAL EN UN ESPACIO FINITO EQUIPROBABLE, EL QUE DEBE CUMPLIR CON LAS SIGUIENTES CONDICIONES: 1. LAS PROBABILIDADES ASOCIADAS A CADA UNO DE LOS ELEMENTOS DEL ESPACIO MUESTRAL DEBEN SER MAYORES O IGUALES A CERO, PI ³ 0. 2. LA SUMATORIA DE LAS PROBABILIDADES ASOCIADAS A CADA ELEMENTO DEL ESPACIO MUESTRAL DEBE DE SER IGUAL A 1. SPI = 1 EN CASO DE QUE NO SE CUMPLA CON LAS CONDICIONES ANTERIORES, ENTONCES NO SE TRATA DE UN ESPACIO FINITO EQUIPROBABLE. SOLO EN EL CASO DE ESPACIOS FINITOS EQUIPROBABLES, SI DESEAMOS DETERMINAR LA PROBABILIDAD DE QUE OCURRA UN EVENTO A CUALQUIERA, ENTONCES; P(A) = R*1/N = R/N P(A) = MANERAS DE OCURRIR EL EVENTO A/ NÚMERO DE ELEMENTOS DEL ESPACIO MUESTRAL R = MANERAS DE QUE OCURRA EL EVENTO A 1/N = PROBABILIDAD ASOCIADA A CADA UNO DE LOS ELEMENTOS DEL ESPACIO MUESTRAL N = NÚMERO DE ELEMENTOS DEL ESPACIO MUESTRAL EJEMPLO: SE LANZA AL AIRE UNA MONEDA NORMAL (UNA MONEDA PERFECTAMENTE EQUILIBRADA) TRES VECES, DETERMINE LA PROBABILIDAD DE QUE: A. APAREZCAN PUROS SELLOS, B. APAREZCAN DOS ÁGUILAS, C. APAREZCAN POR LO MENOS DOS ÁGUILAS. SOLUCIÓN: PARA CALCULAR LAS PROBABILIDADES DE ESTE PROBLEMA, HAY QUE DEFINIR EL ESPACIO MUESTRAL EN CUESTIÓN; SI REPRESENTAMOS LOS TRES RODRIGUEZ GONZALEZ BENJAMIN 9 SISTEMAS “A” LANZAMIENTOS DE LA MONEDA MEDIANTE UN DIAGRAMA DE ÁRBOL, ENCONTRAREMOS QUE EL ESPACIO MUESTRAL O EL CONJUNTO DE TODOS LOS RESULTADOS POSIBLES ES: D = {AAA, ASS, SAS, SSA, AAS, SAA, ASA, SSS} A = EVENTO DE QUE APAREZCAN PUROS SELLOS = {SSS} P(A) = P (APAREZCAN PUROS SELLOS) = P(SSS) = 1/8 = 0.125 ¿POR QUÉ UN OCTAVO?, SÍ EL ESPACIO MUESTRAL CONSTA DE 8 ELEMENTOS COMO SE HA OBSERVADO, ENTONCES LA PROBABILIDAD ASOCIADA A CADA UNO DE LOS ELEMENTOS DEL ESPACIO MUESTRAL ES DE 1/8, POR SER UN ESPACIO FINITO EQUIPROBABLE YA QUE CADA UNO DE LOS ELEMENTOS MOSTRADOS TIENE LA MISMA PROBABILIDAD DE OCURRENCIA. B = EVENTO DE QUE APAREZCAN DOS ÁGUILAS = {AAS, SAA, ASA} P(B) = P (APAREZCAN DOS ÁGUILAS) = P(AAS, SAA, ASA) = 1/8 + 1/8 + 1/8 = 3/8 = 0.375 C = EVENTO DE QUE APAREZCAN POR LO MENOS DOS ÁGUILAS = {AAS, SAA, ASA, AAA} P(C) = P (AAS, SAA, ASA, AAA) =P (APAREZCAN DOS ÁGUILAS) + P (APAREZCAN TRES ÁGUILAS) P(C) = 4/8 = 1/2 = 0.5 RODRIGUEZ GONZALEZ BENJAMIN 10 SISTEMAS “A” 2.6. PROBABILIDAD CONDICIONAL E INDEPENDENCIA. SEA B UN EVENTO ARBITRARIO DE UN ESPACIO MUESTRAL S CON P(B)>0. LA PROBABILIDAD DE QUE UN EVENTO A SUCEDA UNA VEZ QUE B HAYA SUCEDIDO, O, EN OTRAS PALABRAS, LA PROBABILIDAD CONDICIONAL DE A DADO B, SE DEFINE COMO SIGUE: 𝑃(𝐴|𝐵) = 𝑃(𝐴∩𝐵) 𝑃(𝐵) P(A|B) = NÚMERO DE ELEMENTOS QUE PERTENECEN TANTO A COMO A B / NÚMERO DE ELEMENTOS DE B. COMPRENDIENDO LA PROBABILIDAD CONDICIONAL COMO SE APRECIA EN EL DIAGRAMA DE VENN, P(A|B) EN CIERTO SENTIDO MIDE LA PROBABILIDAD RELATIVA DE A CON RELACIÓN AL ESPACIO REDUCIDO B. 𝑃(𝐴|𝐵) = 𝑃(𝐴∩𝐵) 𝑃(𝐵) EJEMPLO: SUPONGA QUE SE TIRA UN DADO Y DESEAMOS QUE SALGA EL NÚMERO 6. SABEMOS QUE P (6) =1/6. SUPONGA QUE NO SABEMOS QUE NÚMERO SALIÓ, PERO NOS DICEN QUE FUE UN NÚMERO PAR (EVENTO B). ESTA NUEVA INFORMACIÓN REDUCE NUESTRO ESPACIO MUESTRAL Y CAMBIA LA PROBABILIDAD DE HALLAR UN 6. RODRIGUEZ GONZALEZ BENJAMIN 11 SISTEMAS “A” 123456 PROBABILIDAD ORIGINAL DE QUE SALGA 6 = 1/6. PROBABILIDAD DEL ESPACIO MUESTRAL REDUCIDO = 1/3. 𝑃(6 ∩ 𝑃𝐴𝑅) 1⁄6 1 𝑃(6|𝑃𝐴𝑅) = = = ⁄3 1⁄ 𝑃(𝑃𝐴𝑅) 2 NOTA: LA PROBABILIDAD DE LA INTERSECCIÓN DE 6 Y UN PAR ES 1/6 DEBIDO A QUE LA INTERSECCIÓN DE LOS DOS EVENTOS ES SOLAMENTE EL EVENTO 6. OTRAS FORMAS ÚTILES DE PROBABILIDAD CONDICIONAL EXISTEN OTRAS DOS FORMAS ÚTILES DE LA DEFINICIÓN DE PROBABILIDAD CONDICIONAL, QUE SON IGUALES ALGEBRAICAMENTE A LA FÓRMULA ORIGINAL. RODRIGUEZ GONZALEZ BENJAMIN 12 SISTEMAS “A” 2.7. TEOREMA DE BAYES EN LA TEORÍA DE LA PROBABILIDAD EL TEOREMA DE BAYES ES UN RESULTADO ENUNCIADO POR THOMAS BAYES EN 17631 QUE EXPRESA LA PROBABILIDAD CONDICIONAL DE UN EVENTO ALEATORIO A DADO B EN TÉRMINOS DE LA DISTRIBUCIÓN DE PROBABILIDAD CONDICIONAL DEL EVENTO B DADO A Y LA DISTRIBUCIÓN DE PROBABILIDAD MARGINAL DE SÓLO A. EN TÉRMINOS MÁS GENERALES Y MENOS MATEMÁTICOS, EL TEOREMA DE BAYES ES DE ENORME RELEVANCIA PUESTO QUE VINCULA LA PROBABILIDAD DE A DADO B CON LA PROBABILIDAD DE B DADO A. ES DECIR QUE SABIENDO LA PROBABILIDAD DE TENER UN DOLOR DE CABEZA DADO QUE SE TIENE GRIPE, SE PODRÍA SABER (SI SE TIENE ALGÚN DATO MÁS), LA PROBABILIDAD DE TENER GRIPE SI SE TIENE UN DOLOR DE CABEZA, MUESTRA ESTE SENCILLO EJEMPLO LA ALTA RELEVANCIA DEL TEOREMA EN CUESTIÓN PARA LA CIENCIA EN TODAS SUS RAMAS, PUESTO QUE TIENE VINCULACIÓN ÍNTIMA CON LA COMPRENSIÓN DE LA PROBABILIDAD DE ASPECTOS CAUSALES DADOS LOS EFECTOS OBSERVADOS. SEA {A1, A2, Ai, An} UN CONJUNTO DE SUCESOS MUTUAMENTE EXCLUYENTES Y EXHAUSTIVOS, Y TALES QUE LA PROBABILIDAD DE CADA UNO DE ELLOS ES DISTINTA DE CERO (0). SEA B UN SUCESO CUALQUIERA DEL QUE SE CONOCEN LAS PROBABILIDADES CONDICIONALES P(B|\ Ai ENTONCES LA PROBABILIDAD P(Ai|\ B) VIENE DADA POR LA EXPRESIÓN: P(Ai) SON LAS PROBABILIDADES A PRIORI P (B |Ai) ES LA PROBABILIDAD DE B EN LA HIPOTESIS P (Ai | B) SON LAS PROBABILIDADES A POSTERIORI EJEMPLO: UNA EMPRESA TIENE UNA FÁBRICA EN ESTADOS UNIDOS QUE DISPONE DE TRES MÁQUINAS A, B Y C, QUE PRODUCEN ENVASES PARA BOTELLAS DE AGUA. SE SABE QUE LA MÁQUINA A PRODUCE UN 40% DE LA CANTIDAD TOTAL, LA MÁQUINA B UN 30%, Y LA MÁQUINA C UN 30%. TAMBIÉN SE SABE QUE CADA MÁQUINA PRODUCE ENVASES DEFECTUOSOS. DE TAL RODRIGUEZ GONZALEZ BENJAMIN 13 SISTEMAS “A” MANERA QUE LA MÁQUINA A PRODUCE UN 2% DE ENVASES DEFECTUOSOS SOBRE EL TOTAL DE SU PRODUCCIÓN, LA MÁQUINA B UN 3%, Y LA MÁQUINA C UN 5%. DICHO ESTO, SE PLANTEAN DOS CUESTIONES: P(A) = 0,40 P(D/A) = 0,02 P(B) = 0,30 P(D/B) = 0,03 P(C) = 0,30 P(D/C) = 0,05 1. SI UN ENVASE HA SIDO FABRICADO POR LA FÁBRICA DE ESTA EMPRESA EN ESTADOS UNIDOS ¿CUÁL ES LA PROBABILIDAD DE QUE SEA DEFECTUOSO? SE CALCULA LA PROBABILIDAD TOTAL. YA QUE, A PARTIR LOS DIFERENTES SUCESOS, CALCULAMOS LA PROBABILIDAD DE QUE SEA DEFECTUOSO. 𝑃(𝐷) = [𝑃(𝐴)𝑋𝑃(𝐷/𝐴)] + [𝑃(𝐵)𝑋𝑃(𝐷/𝐵)] + [𝑃(𝐶)𝑋𝑃(𝐷/𝐶)] = [0,4𝑋0,02] + [0,3𝑋0,03] + [0,3𝑋0,05] = 0,032 EXPRESADO EN PORCENTAJE, DIRÍAMOS QUE LA PROBABILIDAD DE QUE UN ENVASE FABRICADO POR LA FÁBRICA DE ESTA EMPRESA EN ESTADOS UNIDOS SEA DEFECTUOSO ES DEL 3,2%. 2. SIGUIENDO CON LA PREGUNTA ANTERIOR, SI SE ADQUIERE UN ENVASE Y ESTE ES DEFECTUOSO ¿CUÁLES ES LA PROBABILIDAD DE QUE HAYA SIDO FABRICADO POR LA MÁQUINA A? ¿Y POR LA MÁQUINA B? ¿Y POR LA MÁQUINA C? AQUÍ SE UTILIZA EL TEOREMA DE BAYES. TENEMOS INFORMACIÓN PREVIA, ES DECIR, SABEMOS QUE EL ENVASE ES DEFECTUOSO. CLARO QUE, SABIENDO QUE ES DEFECTUOSO, QUEREMOS SABER CUAL ES LA PROBABILIDAD DE QUE SE HAYA PRODUCIDO POR UNA DE LAS MÁQUINAS. P(𝐴/𝐷) = [𝑃(𝐴)𝑋𝑃(𝐷/𝐴)]/P(𝐷) = [0,40𝑋0,02]/0,032 = 0,25 𝑃(𝐵/𝐷) = [𝑃(𝐵)𝑋𝑃(𝐷/𝐵)]/𝑃(𝐷) = [0,30𝑋0,03]/0,032 = 0,28 𝑃(𝐶/𝐷) = [𝑃(𝐶)𝑋𝑃(𝐷/𝐶)]/𝑃(𝐷) = [0,30𝑋0,05]/0,032 = 0,47 SABIENDO QUE UN ENVASE ES DEFECTUOSO, LA PROBABILIDAD DE QUE HAYA SIDO PRODUCIDO POR LA MÁQUINA A ES DEL 25%, DE QUE HAYA SIDO PRODUCIDO POR LA MÁQUINA B ES DEL 28% Y DE QUE HAYA SIDO PRODUCIDO POR LA MÁQUINA C ES DEL 47%. RODRIGUEZ GONZALEZ BENJAMIN 14 SISTEMAS “A” UNIDAD TRES. DISTRIBUCIONES DE PROBABILIDAD DISCRETAS 3.1 DEFINICION DE DISTRIBUCION DE VARIABLE ALEATORIA DISCRETA EN CUALQUIER EXPERIMENTO, EXISTEN NUMEROSAS CARACTERÍSTICAS QUE PUEDEN SER OBSERVADAS O MEDIDAS, PERO EN LA MAYORÍA DE LOS CASOS UN EXPERIMENTADOR SE ENFOCA EN ALGÚN ASPECTO ESPECÍFICO O ASPECTOS DE UNA MUESTRA. POR EJEMPLO, EN UN ESTUDIO DE PATRONES DE VIAJE ENTRE LOS SUBURBIOS Y LA CIUDAD EN UN ÁREA METROPOLITANA, A CADA INDIVIDUO EN UNA MUESTRA SE LE PODRÍA PREGUNTAR SOBRE LA DISTANCIA QUE RECORRE PARA IR DE SU CASA AL TRABAJO Y VICEVERSA Y EL NÚMERO DE PERSONAS QUE LO HACEN EN EL MISMO VEHÍCULO, PERO NO SOBRE SU COEFICIENTE INTELECTUAL, INGRESO, TAMAÑO DE SU FAMILIA Y OTRAS CARACTERÍSTICAS. POR OTRA PARTE, UN INVESTIGADOR PUEDE PROBAR UNA MUESTRA DE COMPONENTES Y ANOTAR SÓLO EL NÚMERO DE LOS QUE HAN FALLADO DENTRO DE 1000 HORAS, EN LUGAR DE ANOTAR LOS TIEMPOS DE FALLA INDIVIDUALES. EN GENERAL, CADA RESULTADO DE UN EXPERIMENTO PUEDE SER ASOCIADO CON UN NÚMERO ESPECIFICANDO UNA REGLA DE ASOCIACIÓN (P. EJ., EL NÚMERO ENTRE LA MUESTRA DE DIEZ COMPONENTES QUE NO DURAN 1000 HORAS O EL PESO TOTAL DEL EQUIPAJE EN UNA MUESTRA DE 25 PASAJEROS DE AEROLÍNEA). SEMEJANTE REGLA DE ASOCIACIÓN SE LLAMA VARIABLE ALEATORIA, VARIABLE PORQUE DIFERENTES VALORES NUMÉRICOS SON POSIBLES Y ALEATORIA PORQUE EL VALOR OBSERVADO DEPENDE DE CUÁL DE LOS POSIBLES RESULTADOS EXPERIMENTALES RESULTE. PARA UN ESPACIO MUESTRAL DADO S DE ALGÚN EXPERIMENTO, UNA VARIABLE ALEATORIA (VA, ORV, POR SUS SIGLAS EN INGLÉS) ES CUALQUIER REGLA QUE ASOCIA UN NÚMERO CON CADA RESULTADO EN S. EN LENGUAJE MATEMÁTICO, UNA VARIABLE ALEATORIA ES UNA FUNCIÓN CUYO DOMINIO ES EL ESPACIO MUESTRAL Y CUYO RANGO ES EL CONJUNTO DE NÚMEROS REALES. RODRIGUEZ GONZALEZ BENJAMIN 15 SISTEMAS “A” DOS TIPOS DE VARIABLES ALEATORIAS UNA VARIABLE ALEATORIA DISCRETA ES UNA VARIABLE ALEATORIA CUYOS VALORES POSIBLES O CONSTITUYEN UN CONJUNTO FINITO O BIEN PUEDEN SER PUESTOS EN LISTA EN UNA SECUENCIA INFINITA EN LA CUAL EXISTE UN PRIMER ELEMENTO, UN SEGUNDO ELEMENTO, Y ASÍ SUCESIVAMENTE (“CONTABLEMENTE” INFINITA). UNA VARIABLE ALEATORIA ES CONTINUA SI AMBAS DE LAS SIGUIENTES CONDICIONES APLICAN: 1. SU CONJUNTO DE VALORES POSIBLES SE COMPONE DE O TODOS LOS NÚMEROS QUE HAY EN UN SOLO INTERVALO SOBRE LA LÍNEA DE NUMERACIÓN (POSIBLEMENTE DE EXTENSIÓN INFINITA, ES DECIR, DESDE MENOS INFINITO HASTA MÁS INFINITO) O TODOS LOS NÚMEROS EN UNA UNIÓN EXCLUYENTE DE DICHOS INTERVALOS (P. EJ., [0, 10] [20, 30]). 2. NINGÚN VALOR POSIBLE DE LA VARIABLE ALEATORIA TIENE PROBABILIDAD POSITIVA, ESTO ES, P (X C) 0 CON CUALQUIER VALOR POSIBLE DE C. AUNQUE CUALQUIER INTERVALO SOBRE LA LÍNEA DE NUMERACIÓN CONTIENE UN NÚMERO INFINITO DE NÚMEROS, SE PUEDE DEMOSTRAR QUE NO EXISTE NINGUNA FORMA DE CREAR UNA LISTA INFINITA DE TODOS ESTOS VALORES, EXISTEN SÓLO DEMASIADOS DE ELLOS. LA SEGUNDA CONDICIÓN QUE DESCRIBE UNA VARIABLE ALEATORIA CONTINUA ES TAL VEZ CONTRAINTUITIVA, PUESTO QUE PARECERÍA QUE IMPLICA UNA PROBABILIDAD TOTAL DE CERO CON TODOS LOS VALORES POSIBLES. PERO EN EL CAPÍTULO 4 SE VERÁ QUE LOS RODRIGUEZ GONZALEZ BENJAMIN 16 SISTEMAS “A” INTERVALOS DE VALORES TIENEN PROBABILIDAD POSITIVA; LA PROBABILIDAD DE UN INTERVALO SE REDUCIRÁ A CERO A MEDIDA QUE SU ANCHO TIENDA A CERO. EJEMPLO: SE VENDEN 5000 BILLETES PARA UNA RIFA A 1 EURO CADA UNO. SI EL ÚNICO PREMIO DEL SORTEO ES DE 1800 EUROS, CALCULAR EL RESULTADO QUE DEBE ESPERAR UNA PERSONA QUE COMPRA 3 BILLETES. RESOLUCIÓN. CONSIDERAMOS LA VARIABLE ALEATORIA DISCRETA £ = ‘CANTIDAD DE DINERO OBTENIDO EN EL JUEGO’. LOS POSIBLES VALORES DE £ SON DOS: SI SE GANA LA RIFA, SE OBTIENE UN BENEFICIO DE 1800−3 = 1777 EUROS. POR LA LEY DE LAPLACE, LA PROBABILIDAD DE QUE OCURRA ESTE HECHO ES DE 3/5000. SI NO SE GANA LA RIFA, RESULTA UNA PÉRDIDA DE 3 EUROS. NUEVAMENTE POR LA LEY DE LAPLACE, LA PROBABILIDAD DE QUE ESTO OCURRA ES DE 4997/5000. POR LO TANTO, LA DISTRIBUCIÓN DE PROBABILIDAD PARA LA VARIABLE ALEATORIA ξ SERÁ: EL RESULTADO QUE DEBE ESPERAR UNA PERSONA QUE COMPRA 3 BILLETES ES: LO QUE INTERPRETAMOS COMO QUE, EN PROMEDIO, CABE ESPERAR UNA PÉRDIDA DE 1.93 EUROS. RODRIGUEZ GONZALEZ BENJAMIN 17 SISTEMAS “A” 3.2. FUNCIÓN DE PROBABILIDAD Y DE DISTRIBUCIÓN, VALOR ESPERADO, VARIANZA Y DESVIACIÓN ESTÁNDAR. FUNCIÓN DE PROBABILIDAD LA FUNCIÓN DE PROBABILIDAD ES LA PROBABILIDAD DE QUE LA VARIABLE ALEATORIA TOME UN VALOR PARTICULAR: EJEMPLO: PODEMOS OBTENER LAS FRECUENCIAS RELATIVAS CALIFICACIONES DE UN CURSO Y DISPONERLAS EN UNA TABLA: DE LAS ASIGNANDO UN NÚMERO A CADA CALIFICACIÓN, Y SUSTITUYENDO EL SÍMBOLO DE FRECUENCIA RELATIVA POR EL DE PROBABILIDAD: FINALMENTE TENEMOS LA DISTRIBUCIÓN DE PROBABILIDAD DE LA VARIABLE "CALIFICACIÓN ACADÉMICA EN LA ASIGNATURA X". LA DISTRIBUCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA SE DEFINE COMO EL CONJUNTO DE VALORES DE LA VARIABLE ACOMPAÑADOS DE SUS PROBABILIDADES. FUNCION DE DISTRIBUCION: LA FUNCIÓN DE DISTRIBUCIÓN ES LA PROBABILIDAD DE QUE LA VARIABLE TOME VALORES IGUALES O INFERIORES A X: SI AÑADIMOS UNA NUEVA COLUMNA CON LAS PROBABILIDADES ACUMULADAS, TENEMOS LA FUNCIÓN DE DISTRIBUCIÓN DE LA V.A. RODRIGUEZ GONZALEZ BENJAMIN 18 SISTEMAS “A” EJEMPLO: TANTO LA FUNCIÓN DE PROBABILIDAD COMO LA DE DISTRIBUCIÓN PUEDEN SER REPRESENTADAS GRÁFICAMENTE CON EL DIAGRAMA DE BARRAS: FUNCION DE PROBABIIDAD: FUNCION DE DISTRIBUCION: VALOR ESPERADO: SEA X UNA VARIABLE ALEATORIA DISCRETA CON UN CONJUNTO DE VALORES POSIBLES D Y UNA FUNCIÓN MASA DE PROBABILIDAD P(X). EL VALOR ESPERADO O VALOR MEDIO DE X, DENOTADO POR E(X) O X, ES: 𝐸(𝑥) = µ𝑥 = 𝑥 ∈ 𝐷𝑥 ∗ 𝑝(𝑥) CUANDO ESTÁ CLARO A QUE X SE REFIERE EL VALOR ESPERADO, A MENUDO SE UTILIZA µ EN LUGAR DE X. EJEMPLO: CONSIDÉRESE UNA UNIVERSIDAD QUE TIENE 15 000 ESTUDIANTES Y SEA X EL NÚMERO DE CURSOS EN LOS CUALES ESTÁ INSCRITO UN ESTUDIANTE SELECCIONADO AL AZAR. LA FUNCIÓN DE MASA DE PROBABILIDAD DE X SE DETERMINA COMO SIGUE. COMO P (1) 0.01, SE SABE QUE (0.01) * (15000) 150 DE LOS ESTUDIANTES ESTÁN INSCRITOS EN UN CURSO Y ASIMISMO CON LOS DEMÁS VALORES DE X. EL NÚMERO PROMEDIO DE CURSOS POR ESTUDIANTE O EL VALOR PROMEDIO DE X EN LA POBLACIÓN SE OBTIENE AL CALCULAR EL NÚMERO TOTAL DE CURSOS TOMADOS POR TODOS LOS ESTUDIANTES Y AL DIVIDIR ENTRE EL NÚMERO TOTAL DE ESTUDIANTES. COMO CADA UNO DE LOS 150 ESTUDIANTES ESTÁ TOMANDO UN CURSO, ESTOS 150 CONTRIBUYEN CON 150 CURSOS AL TOTAL. ASIMISMO, 450 ESTUDIANTES CONTRIBUYEN CON 2(450) CURSOS, Y ASÍ SUCESIVAMENTE. EL VALOR PROMEDIO DE LA POBLACIÓN DE X ES ENTONCES 1(150) + 2(450) + 3(1950) + ⋯ + 7(300)/15000 = 4.57 COMO 150/15 000 0.01 P (1), 450/15000 0.03 P (2), Y ASÍ SUCESIVAMENTE, UNA EXPRESIÓN ALTERNA PARA (3.7) ES LA EXPRESIÓN (3.8) MUESTRA QUE, PARA CALCULAR EL VALOR PROMEDIO DE LA POBLACIÓN DE RODRIGUEZ GONZALEZ BENJAMIN 19 SISTEMAS “A” X, SÓLO SE NECESITAN LOS VALORES POSIBLES DE X JUNTO CON LAS PROBABILIDADES (PROPORCIONES). EN PARTICULAR, EL TAMAÑO DE LA POBLACIÓN NO VIENE AL CASO EN TANTO LA FUNCIÓN MASA DE PROBABILIDAD ESTÉ DADA POR (3.6). EL VALOR PROMEDIO O MEDIO DE X ES ENTONCES EL PROMEDIO PONDERADO DE LOS POSIBLES VALORES 1, . . ., 7, DONDE LAS PONDERACIONES SON LAS PROBABILIDADES DE ESOS VALORES. VARIANZA: LA VARIANZA ES UNA MEDIDA DE DISPERSIÓN QUE SE UTILIZA PARA REPRESENTAR LA VARIABILIDAD DE UN CONJUNTO DE DATOS RESPECTO DE LA MEDIA ARITMÉTICA DE LOS MISMO. ASÍ, SE CALCULA COMO LA SUMA DE LOS RESIDUOS ELEVADOS AL CUADRADO Y DIVIDIDOS ENTRE EL TOTAL DE OBSERVACIONES. NO OBSTANTE, SE TRATA DE UNA MEDIDA QUE TAMBIÉN PUEDE CALCULARSE COMO LA DESVIACIÓN TÍPICA AL CUADRADO. ¿PARA QUÉ SE USA LA VARIANZA? ES UNA MEDIDA DE DISPERSIÓN AMPLIAMENTE UTILIZADA EN LOS SECTORES DE LA ECONOMÍA Y LAS FINANZAS, INTERPRETÁNDOSE COMO EL RIESGO DE QUE EL RENDIMIENTO DE ALGÚN PROCEDIMIENTO EN CONCRETO SEA DISTINTO DEL RENDIMIENTO ESPERADO DE DICHO PROCEDIMIENTO. LA VARIANZA, JUNTO CON LA DESVIACIÓN ESTÁNDAR -AMBAS MEDIDAS MUY RELACIONADAS ENTRE SÍ- SON LAS MEDIDAS DE DISPERSIÓN DE DATOS POR EXCELENCIA, SOBRE TODO EN EL MUNDO DE LAS FINANZAS. ¿CÓMO SE CALCULA LA VARIANZA? EN PRIMER LUGAR, ES NECESARIO INDICAR QUE LA UNIDAD DE MEDIDA DE LA VARIANZA ES LA MISMA UNIDAD DE MEDIDA DE LOS DATOS UTILIZADOS PARA CALCULARLA. ASÍ, SI LOS DATOS INTRODUCIDOS EN LA FÓRMULA UTILIZAN LOS METROS COMO UNIDAD DE MEDIDA, LA VARIANZA SE EXPRESARÁ TAMBIÉN EN METROS. EN CUALQUIER CASO, SE HA DE TENER EN CUENTA QUE LA VARIANZA ADQUIERE SIEMPRE VALORES IGUALES O MAYORES A 0, SIENDO MATEMÁTICAMENTE IMPOSIBLE QUE ADQUIERA RODRIGUEZ GONZALEZ BENJAMIN 20 SISTEMAS “A” VALORES INFERIORES A 0, PUES LOS DATOS INTRODUCIDOS SE ELEVAN AL CUADRADO. VAMOS A VER LA FÓRMULA UTILIZADA PARA CALCULAR LA VARIANZA: 𝑉𝐴𝑅(𝑋) = (𝑋1– 𝑋’)2 + (𝑋2– 𝑋’)2 + ⋯ + (𝑋𝑁– 𝑋’)/𝑁 DONDE: N REPRESENTA EL NÚMERO TOTAL DE OBSERVACIONES O DE DATOS UTILIZADOS PARA EL CÁLCULO DE LA VARIANZA. X REPRESENTA LOS DATOS UTILIZADOS PARA EL CÁLCULO DE LA VARIANZA. X’ REPRESENTA LA MEDIA ARITMÉTICA CALCULADA CON LOS DATOS UTILIZADOS PARA EL CÁLCULO DE LA VARIANZA. EJEMPLO: SUPONGAMOS QUE TENEMOS 5 PERSONAS DIFERENTES CON DISTINTOS SUELDOS: SANTIAGO: 1.500 EUROS. MIGUEL: 1.200 EUROS. SARA: 1.700 EUROS. LAURA: 1.300 EUROS. MARÍA: 1.800 EUROS. EN PRIMER LUGAR, DEBEMOS CALCULAR LA MEDIA ARITMÉTICA DE TODOS ESTOS DATOS. VAMOS A ELLO: (1.500 + 1.200 + 1.700 + 1.300 + 1.800) / 5 = 1.500 EUROS UNA VEZ CALCULADA LA MEDIA ARITMÉTICA, HEMOS DE APLICAR LA FÓRMULA DE LA VARIANZA. VAMOS A ELLO: 𝑉𝐴𝑅(𝑋) = (1500– 1500)2 + (1200– 1500)2 + (1700– 1500)2 + (1300– 1500)2 + (1800– 1500)2/5 UNA VEZ DESARROLLADA LA ECUACIÓN, EL RESULTADO ES DE 52.000 EUROS AL CUADRADO. DEBEMOS RECORDAR QUE, AL CALCULAR LA VARIANZA, OBTENEMOS LA UNIDAD DE MEDIDA DE LOS DATOS UTILIZADOS ELEVADA AL CUADRADO. ASÍ, PARA PASAR ESTE RESULTADO A EUROS, RODRIGUEZ GONZALEZ BENJAMIN 21 SISTEMAS “A” TENDRÍAMOS QUE REALIZAR EL CÁLCULO DE LA DESVIACIÓN TÍPICA, LA CUAL, EN ESTE CASO, ADQUIERE UN VALOR DE 228 EUROS. ¿QUÉ QUIERE DECIR ESTE RESULTADO? ESTE RESULTADO SE DEBE INTERPRETAR COMO QUE, DE MEDIA, LA DIFERENCIA ENTRE LOS SALARIOS DE LAS 5 PERSONAS CUYOS SALARIOS SE HAN UTILIZADO PARA CALCULAR LA VARIANZA ES DE 228 EUROS. DESVIACION ESTANDAR: LA DESVIACIÓN ESTÁNDAR ES UN ÍNDICE NUMÉRICO DE LA DISPERSIÓN DE UN CONJUNTO DE DATOS (O POBLACIÓN). MIENTRAS MAYOR ES LA DESVIACIÓN ESTÁNDAR, MAYOR ES LA DISPERSIÓN DE LA POBLACIÓN. LA DESVIACIÓN ESTÁNDAR ES UN PROMEDIO DE LAS DESVIACIONES INDIVIDUALES DE CADA OBSERVACIÓN CON RESPECTO A LA MEDIA DE UNA DISTRIBUCIÓN. ASÍ, LA DESVIACIÓN ESTÁNDAR MIDE EL GRADO DE DISPERSIÓN O VARIABILIDAD. EN PRIMER LUGAR, MIDIENDO LA DIFERENCIA ENTRE CADA VALOR DEL CONJUNTO DE DATOS Y LA MEDIA DEL CONJUNTO DE DATOS. LUEGO, SUMANDO TODAS ESTAS DIFERENCIAS INDIVIDUALES PARA DAR EL TOTAL DE TODAS LAS DIFERENCIAS. POR ÚLTIMO, DIVIDIENDO EL RESULTADO POR EL NÚMERO TOTAL DE OBSERVACIONES (NORMALMENTE REPRESENTADO POR LA LETRA “N”) PARA LLEGAR A UN PROMEDIO DE LAS DISTANCIAS ENTRE CADA OBSERVACIÓN INDIVIDUAL Y LA MEDIA. ESTE PROMEDIO DE LAS DISTANCIAS ES LA DESVIACIÓN ESTÁNDAR Y DE ESTA MANERA REPRESENTA DISPERSIÓN. LA DESVIACIÓN ESTÁNDAR ES UN INDICADOR EN EXTREMO VALIOSO CON MUCHAS APLICACIONES. POR EJEMPLO, LOS ESTADÍSTICOS SABEN QUE CUANDO UN CONJUNTO DE DATOS SE DISTRIBUYE DE MANERA “NORMAL”, EL 68% DE LAS OBSERVACIONES DE LA DISTRIBUCIÓN TIENE UN VALOR QUE SE ENCUENTRA A MENOS DE UNA DESVIACIÓN ESTÁNDAR DE LA MEDIA. TAMBIÉN RODRIGUEZ GONZALEZ BENJAMIN 22 SISTEMAS “A” SABEN QUE EL 96% DE TODAS LAS OBSERVACIONES TIENE UN VALOR NO ES MAYOR A LA MEDIA MÁS O MENOS DOS DESVIACIONES ESTÁNDAR (LA FIGURA 18 GRAFICA ESTA INFORMACIÓN). EN GENERAL, SE SUPONE QUE LOS RENDIMIENTOS DE UNA INVERSIÓN SE DISTRIBUYEN DE MANERA NORMAL. LA DISTRIBUCIÓN NORMAL ES AQUELLA CUYA FUNCIÓN DE DENSIDAD DE PROBABILIDAD TOMA LA FORMA CLÁSICA DE CAMPANA. LA DISTRIBUCIÓN NORMAL SE DEBE DESCRIBIR CON SOLO DOS PARÁMETROS: LA MEDIA (QUE DEFINE EL VALOR CENTRAL) Y LA DESVIACIÓN ESTÁNDAR (QUE DESCRIBE EL ANCHO DE LA CAMPANA). LA MEDIA Μ DEFINE LA UBICACIÓN DE LA DISTRIBUCIÓN. LA DESVIACIÓN ESTÁNDAR Σ DEFINE SU ANCHO. A MEDIDA QUE EL PROMEDIO VARÍA, EL CENTRO DE LA DISTRIBUCIÓN SE MUEVE A LO LARGO DEL EJE HORIZONTAL MIENTRAS QUE LA FORMA CAMBIA DE ACUERDO CON LA VARIACIÓN DE LA DESVIACIÓN ESTÁNDAR. LA CURVA SE APLANA CON UNA VOLATILIDAD CRECIENTE MIENTRAS SE VUELVE MÁS DELGADA Y MÁS ALTA A MEDIDA QUE DISMINUYE LA VOLATILIDAD. EJEMPLO: EL GERENTE DE UNA EMPRESA DE ALIMENTOS DESEA SABER QUE TANTO VARÍAN LOS PESOS DE LOS EMPAQUES (EN GRAMOS), DE UNO DE SUS PRODUCTOS; POR LO QUE OPTA POR SELECCIONAR AL AZAR CINCO UNIDADES DE ELLOS PARA PESARLOS. LOS PRODUCTOS TIENEN LOS SIGUIENTES PESOS (490, 500, 510, 515 Y 520) GRAMOS RESPECTIVAMENTE. POR LO QUE SU MEDIA ES: 𝑋= 490 + 500 + 510 + 515 + 520 2535 = = 507 5 5 LA VARIANZA SERIA: 𝑆2 = (490 − 507)2 + (500 − 507)2 + (510 − 507)2 + (515 − 507)2 + (520 − 507)2 (5 − 1) 𝑆2 = (−17)2 + (−7)2 + (3)2 + (8)2 + (13)2 289 + 49 + 9 + 64 + 169 580 = = 4 4 4 = 145 POR LO TANTO, LA DESVIACION ESTANDAR SERIA: 𝑆 = √145 = 12.04 ≈ 12 RODRIGUEZ GONZALEZ BENJAMIN 23 SISTEMAS “A” CON LO QUE CONCLUIRÍAMOS QUE EL PESO PROMEDIO DE LOS EMPAQUES ES DE 507 GRAMOS, CON UNA TENDENCIA A VARIAR POR DEBAJO O POR ENCIMA DE DICHO PESO EN 12 GRAMOS. ESTA INFORMACIÓN LE PERMITE AL GERENTE DETERMINAR CUANTO ES EL PROMEDIO DE PERDIDAS CAUSADO POR EL EXCESO DE PESO EN LOS EMPAQUES Y LE DA LAS BASES PARA TOMAR LOS CORRECTIVOS NECESARIOS EN EL PROCESO DE EMPACADO. RODRIGUEZ GONZALEZ BENJAMIN 24 SISTEMAS “A” 3.3. DISTRIBUCIÓN BINOMIAL. UN EXPERIMENTO PARA EL QUE SE SATISFACEN LAS CONDICIONES 1– 4 SE LLAMA EXPERIMENTO BINOMIAL. EXISTEN MUCHOS EXPERIMENTOS QUE SE AJUSTAN EXACTA O APROXIMADAMENTE A LA SIGUIENTE LISTA DE REQUERIMIENTOS: EL EXPERIMENTO CONSTA DE UNA SECUENCIA DE N EXPERIMENTOS MÁS PEQUEÑOS LLAMADOS ENSAYOS, DONDE N SE FIJA ANTES DEL EXPERIMENTO. CADA ENSAYO PUEDE DAR POR RESULTADO UNO DE LOS MISMOS DOS RESULTADOS POSIBLES (ENSAYOS DICOTÓMICOS), LOS CUALES SE DENOTAN COMO ÉXITO (E) Y FALLA (F). LOS ENSAYOS SON INDEPENDIENTES, DE MODO QUE EL RESULTADO EN CUALQUIER ENSAYO PARTICULAR NO INFLUYE EN EL RESULTADO DE CUALQUIER OTRO ENSAYO. LA PROBABILIDAD DE ÉXITO ES CONSTANTE DE UN ENSAYO A OTRO; ESTA PROBABILIDAD SE DENOTA POR P. RODRIGUEZ GONZALEZ BENJAMIN 25 SISTEMAS “A” EJEMPLO: LA MISMA MONEDA SE LANZA AL AIRE SUCESIVA E INDEPENDIENTEMENTE N VECES. DE MANERA ARBITRARIA SE UTILIZA E PARA DENOTAR EL RESULTADO H (CARAS) Y F PARA DENOTAR EL RESULTADO T (CRUCES). ENTONCES ESTE EXPERIMENTO SATISFACE LAS CONDICIONES 1–4. EL LANZAMIENTO AL AIRE DE UNA TACHUELA N VECES, CON E PUNTA HACIA ARRIBA Y F PUNTA HACIA ABAJO), TAMBIÉN DA POR RESULTADO UN EXPERIMENTO BINOMIAL.MUCHOS EXPERIMENTOS IMPLICAN UNA SECUENCIA DE ENSAYOS INDEPENDIENTES PARA LOS CUALES EXISTEN MÁS DE DOS RESULTADOS POSIBLES EN CUALQUIER ENSAYO. ENTONCES, UN EXPERIMENTO BINOMIAL PUEDE CREARSE DIVIDIENDO LOS POSIBLES RESULTADOS EN DOS GRUPOS. RODRIGUEZ GONZALEZ BENJAMIN 26 SISTEMAS “A” 3.4. DISTRIBUCIÓN HIPERGEOMÉTRICA LAS DISTRIBUCIONES HIPERGEOMÉTRICAS Y BINOMIALES NEGATIVAS ESTÁN RELACIONADAS CON LA DISTRIBUCIÓN BINOMIAL. EN TANTO QUE LA DISTRIBUCIÓN BINOMIAL ES EL MODELO DE PROBABILIDAD APROXIMADA DE MUESTREO SIN REEMPLAZO DE UNA POBLACIÓN DICOTÓMICA FINITA (E–F), LA DISTRIBUCIÓN HIPERGEOMÉTRICA ES EL MODELO DE PROBABILIDAD EXACTA DEL NÚMERO DE ÉXITOS (E) EN LA MUESTRA. LA VARIABLE ALEATORIA BINOMIAL X ES EL NÚMERO DE ÉXITOS CUANDO EL NÚMERO N DE ENSAYOS ES FIJO, MIENTRAS QUE LA DISTRIBUCIÓN BINOMIAL SURGE DE FIJAR EL NÚMERO DE ÉXITOS DESEADOS Y DE PERMITIR QUE EL NÚMERO DE ENSAYOS SEA ALEATORIO. DISTRIBUCIÓN HIPERGEOMÉTRICA LAS SUPOSICIONES QUE CONDUCEN HIPERGEOMÉTRICA SON LAS SIGUIENTES: A LA DISTRIBUCIÓN LA POBLACIÓN O CONJUNTO QUE SE VA A MUESTREAR SE COMPONE DE N INDIVIDUOS, OBJETOS O ELEMENTOS (UNA POBLACIÓN FINITA). CADA INDIVIDUO PUEDE SER CARACTERIZADO COMO ÉXITO (E) O FALLA (F) Y HAY M ÉXITOS EN LA POBLACIÓN. SE SELECCIONA UNA MUESTRA DE N INDIVIDUOS SIN REEMPLAZO DE TAL MODO QUE CADA SUBCONJUNTO DE TAMAÑO N ES IGUALMENTE PROBABLE DE SER SELECCIONADO. LA VARIABLE ALEATORIA DE INTERÉS ES X EL NÚMERO DE ÉXITOS EN LA MUESTRA. LA DISTRIBUCIÓN DE PROBABILIDAD DE X DEPENDE DE LOS PARÁMETROS N, M Y N, ASÍ QUE SE DESEA OBTENER P (X X) H (X; N, M, N). RODRIGUEZ GONZALEZ BENJAMIN 27 SISTEMAS “A” EJEMPLO: 7DURANTE UN PERIODO PARTICULAR UNA OFICINA DE TECNOLOGÍA DE LA INFORMACIÓN DE UNA UNIVERSIDAD RECIBIÓ 20 SOLICITUDES DE SERVICIO DE PROBLEMAS CON IMPRESORAS, DE LAS CUALES 8 ERAN IMPRESORAS LÁSER Y 12 ERAN MODELOS DE INYECCIÓN DE TINTA. SE TIENE QUE SELECCIONAR UNA MUESTRA DE 5 DE ESTAS SOLICITUDES DE SERVICIO COMPLETAMENTE AL AZAR, DE MODO QUE CUALQUIER SUBCONJUNTO DE TAMAÑO 5 TENGA LA MISMA PROBABILIDAD DE SER SELECCIONADO COMO CUALQUIER OTRO SUBCONJUNTO (PIENSE EN ESCRIBIR LOS NÚMEROS 1, 2, . . ., 20 EN 20 PAPELITOS IDÉNTICOS, MEZCLARLOS Y SELECCIONAR 5 DE ELLOS). ¿CUÁL ES ENTONCES LA PROBABILIDAD DE QUE EXACTAMENTE X (X 0, 1, 2, 3, 4 O 5) DE LAS SOLICITUDES DE SERVICIO FUERAN PARA IMPRESORAS DE INYECCIÓN DE TINTA? EN ESTE CASO, EL TAMAÑO DE LA POBLACIÓN ES N 20, EL TAMAÑO DE LA MUESTRA ES N 5 Y EL NÚMERO DE ÉXITOS (INYECCIÓN DE TINTA E) Y LAS FALLAS (F) EN LA POBLACIÓN SON M 12 y N M 8, RESPECTIVAMENTE. CONSIDÉRESE EL VALOR X 2. COMO TODOS LOS RESULTADOS (CADA UNO CONSTA DE 5 SOLICITUDES PARTICULARES) SON IGUALMENTE PROBABLES. P (X 2) h (2; 5, 12, 20) = número de resultados con X2número de posibles resultados EL NÚMERO DE POSIBLES RESULTADOS EN EL EXPERIMENTO ES EL NÚMERO DE FORMAS DE SELECCIONAR 5 DE LOS 20 OBJETOS SIN IMPORTAR EL ORDEN, ES DECIR, (2 5 0). PARA CONTAR EL NÚMERO DE RESULTADOS CON X 2, OBSÉRVESE QUE EXISTEN (1 2 2) FORMAS DE SELECCIONAR 2 DE LAS SOLICITUDES PARA IMPRESORAS DE INYECCIÓN DE TINTA, Y POR CADA FORMA EXISTEN (8 3) FORMAS DE SELECCIONAR LAS 3 SOLICITUDES PARA IMPRESORAS LÁSER A FIN DE COMPLETAR LA MUESTRA. LA REGLA DE PRODUCTO DEL CAPÍTULO 2 DA ENTONCES (1 2 2) (8 3) COMO EL NÚMERO DE RESULTADOS CON X 2, POR LO TANTO: ℎ(2;\5,\12,\20) = 12 8 ( 2 ) (3) 20 ) 5 ( = 77 = 0.238 326 EN GENERAL, SI EL TAMAÑO DE LA MUESTRA N ES MÁS PEQUEÑO QUE EL NÚMERO DE ÉXITOS EN LA POBLACIÓN (M), ENTONCES EL VALOR DE X MÁS GRANDE POSIBLE ES N. SIN EMBARGO, SI M < N (P. EJ., UN TAMAÑO DE MUESTRA DE 25 Y SÓLO HAY 15 ÉXITOS EN LA POBLACIÓN), ENTONCES X RODRIGUEZ GONZALEZ BENJAMIN 28 SISTEMAS “A” PUEDE SER CUANDO MUCHO M. ASIMISMO, SIEMPRE QUE EL NÚMERO DE FALLAS EN LA POBLACIÓN (N - M) SOBREPASE EL TAMAÑO DE LA MUESTRA, EL VALOR MÁS PEQUEÑO DE X ES 0 (PUESTO QUE TODOS LOS INDIVIDUOS MUESTREADOS PODRÍAN ENTONCES SER FALLAS). SIN EMBARGO, SI N - M < N, EL VALOR MÁS PEQUEÑO POSIBLE DE X ES N - (N - M). POR LO TANTO, LOS POSIBLES VALORES DE X SATISFACEN LA RESTRICCIÓN MÁX. (0, N - (N - M)) ≤ X ≤ MÍN. (N, M). UN ARGUMENTO PARALELO AL DEL EJEMPLO PREVIO DA LA FUNCIÓN MASA DE PROBABILIDAD DE X. RODRIGUEZ GONZALEZ BENJAMIN 29 SISTEMAS “A” 3.4.1 APROXIMACIÓN DE LA HIPERGEOMÉTRICA POR LA BINOMIAL. ES UNO DE LOS MODELOS MATEMÁTICOS QUE SE UTILIZA CUANDO LA VARIABLE ALEATORIA DISCRETA ES EL NÚMERO DE ÉXITOS EN UNA MUESTRA COMPUESTA POR N OBSERVACIONES. CADA OBSERVACIÓN SE CLASIFICA EN UNA DE DOS CATEGORÍAS, MUTUAMENTE EXCLUYENTES Y COLECTIVAMENTE EXHAUSTIVOS. A ESTAS CATEGORÍAS SE LE DENOMINA ÉXITO Y FRACASO. ES UN MÉTODO QUE SE UTILIZA CUANDO EL ESPACIO MUESTRAL, QUE MANEJAMOS EN EL PROBLEMA, ES MUCHO MAYOR QUE LA MUESTRA. VARIANZA: MEDIA: CARACTERÍSTICAS UN EXPERIMENTO SIGUE EL MODELO DE LA DISTRIBUCIÓN BINOMIAL SI: o EN CADA PRUEBA DEL EXPERIMENTO SÓLO SON POSIBLES DOS RESULTADOS: EL SUCESO A (ÉXITO) Y SU CONTRARIO SUCESO. o LA PROBABILIDAD DEL SUCESO A ES CONSTANTE, ES DECIR, QUE NO VARÍA DE UNA PRUEBA A OTRA. SE REPRESENTA POR P. o EL RESULTADO OBTENIDO EN CADA PRUEBA ES INDEPENDIENTE DE LOS RESULTADOS OBTENIDOS ANTERIORMENTE. EJEMPLO UN CARGAMENTO DE 100 GRABADORAS CONTIENE 25 DEFECTUOSAS. SI 10 DE ELLAS SON ALEATORIAMENTE ESCOGIDAS PARA REVISIÓN, ¿CUAL ES LA PROBABILIDAD DE QUE 2 ESTÉN DEFECTUOSAS? UTILIZANDO A. LA FORMULA PARA DISTRIBUCIÓN HIPERGEOMÉTRICA B. LA FORMULA PARA LA DISTRIBUCIÓN COMO UNA APROXIMACIÓN MEDIA: VARIANZA: CONCLUSIÓN: RODRIGUEZ GONZALEZ BENJAMIN 30 SISTEMAS “A” OBSÉRVESE QUE LA DIFERENCIA ENTRE LOS DOS VALORES ES DE APENAS 0.010. EN GENERAL, PUEDE MOSTRARSE QUE H (X; N, K, N) SE APROXIMA A B (X; N, P) CON P = K/N CUANDO N SE APROXIMA A INFINITO, Y BUEN MÉTODO PRACTICO CONSISTE EN EMPLEAR LA DISTRIBUCIÓN BINOMIAL COMO APROXIMACIÓN DE LA DISTRIBUCIÓN HIPERGEOMÉTRICA CUANDO N < N/10 ES UNA DISTRIBUCIÓN DISCRETA RELACIONADA CON MUESTREOS ALEATORIOS Y SIN REEMPLAZO. SUPÓNGASE QUE SE TIENE UNA POBLACIÓN DE N ELEMENTOS DE LOS CUALES, D PERTENECEN A LA CATEGORÍA A Y N-D A LA B. LA DISTRIBUCIÓN HIPERGEOMÉTRICA MIDE LA PROBABILIDAD DE OBTENER X ELEMENTOS DE LA CATEGORÍA A EN UNA MUESTRA SIN REEMPLAZO DE N ELEMENTOS DE LA POBLACIÓN ORIGINAL DISTRIBUCIÓN GEOMÉTRICA. LA DISTRIBUCIÓN GEOMÉTRICA ES UN MODELO ADECUADO PARA AQUELLOS PROCESOS EN LOS QUE SE REPITEN PRUEBAS HASTA LA CONSECUCIÓN DEL ÉXITO A RESULTADO DESEADO Y TIENE INTERESANTES APLICACIONES EN LOS MUESTREOS REALIZADOS DE ESTA MANERA. TAMBIÉN IMPLICA LA EXISTENCIA DE UNA DICOTOMÍA DE POSIBLES RESULTADOS Y LA INDEPENDENCIA DE LAS PRUEBAS ENTRE SÍ. PROCESO EXPERIMENTAL DEL QUE SE PUEDE HACER DERIVAR ESTA DISTRIBUCIÓN SE PUEDE HACER DERIVAR DE UN PROCESO EXPERIMENTAL PURO O DE BERNOULLI EN EL QUE TENGAMOS LAS SIGUIENTES CARACTERÍSTICAS: EL PROCESO CONSTA DE UN NÚMERO NO DEFINIDO DE PRUEBAS O EXPERIMENTOS SEPARADOS O SEPARABLES. EL PROCESO CONCLUIRÁ RODRIGUEZ GONZALEZ BENJAMIN 31 SISTEMAS “A” CUANDO SE OBTENGA POR PRIMERA VEZ EL RESULTADO DESEADO (ÉXITO). CADA PRUEBA PUEDE DAR DOS RESULTADOS MUTUAMENTE EXCLUYENTES: A Y NO A LA PROBABILIDAD DE OBTENER UN RESULTADO A EN CADA PRUEBA ES P Y LA DE OBTENER UN RESULTADO NO A ES Q SIENDO (P + Q = 1). LAS PROBABILIDADES P Y Q SON CONSTANTES EN TODAS LAS PRUEBAS, POR TANTO, LAS PRUEBAS, SON INDEPENDIENTES (SI SE TRATA DE UN PROCESO DE "EXTRACCIÓN" ÉSTE SE LLEVARÁ A, CABO CON DEVOLUCIÓN DEL INDIVIDUO EXTRAÍDO). DERIVACIÓN DE LA DISTRIBUCIÓN SI EN ESTAS CIRCUNSTANCIAS ALEATORIZAMOS DE FORMA QUE TOMEMOS COMO VARIABLE ALEATORIA X = EL NÚMERO DE PRUEBAS NECESARIAS PARA OBTENER POR PRIMERA VEZ UN ÉXITO O RESULTADO A, ESTA VARIABLE SE DISTRIBUIRÁ CON UNA DISTRIBUCIÓN GEOMÉTRICA DE PARÁMETRO P. EJEMPLO: SUPONGAMOS QUE QUEREMOS HACER UN ESTUDIO SOBRE LA VARIABLE ALEATORIA REFERENTE AL NÚMERO DE VECES QUE UN JUGADOR NECESITA PARA PODER EFECTUAR LA SALIDA EN EL JUEGO DEL PARCHÍS. HAY QUE RECORDAR QUE, EN ESTE JUEGO, UN JUGADOR NO COMIENZA EL MISMO HASTA OBTENER UN 5 AL LANZAR EL DADO. PODRÍA OCURRIR QUE SOLAMENTE NECESITARA: UNA TIRADA X = 1; CON PROBABILIDAD 1/6 DOS TIRADAS X = 2 CON PROBABILIDAD (5/6) (1/6) TRES TIRADAS X =3 CON PROBABILIDAD (5/6) (5/6) (1/6) ... "K" TIRADAS X = K CON PROBABILIDAD LA VARIABLE PUEDE SEGUIR TOMANDO VALORES INDEFINIDAMENTE PUESTO QUE ES POSIBLE ENCONTRAR A UN JUGADOR CUYA “MALA SUERTE “HAGA QUE NUNCA OBTENGA EL DICHOSO 5. RODRIGUEZ GONZALEZ BENJAMIN 32 SISTEMAS “A” ESTARÍAMOS ANTE EL CASO DE UNA DISTRIBUCIÓN GEOMÉTRICA DE PARÁMETRO 1/6. DISTRIBUCIÓN MULTINOMIAL. LA DISTRIBUCIÓN MULTINOMIAL ES UNA DISTRIBUCIÓN DISCRETA MULTIVARIANTE Y, COMO SU NOMBRE INDICA, ES UNA GENERALIZACIÓN DE LA DISTRIBUCIÓN BINOMIAL CUANDO EL EXPERIMENTO ALEATORIO CONSIDERADO NO TIENE SOLO DOS RESULTADOS POSIBLES, ÉXITO O FRACASO, SINO TRES O MÁS. EJEMPLO: SE SABE QUE LAS BOMBAS DE GASOLINA PARA AUTOS EXISTENTES EN EL MERCADO SE PUEDEN CLASIFICAR EN: 40% DE RENDIMIENTO EXCELENTE (EX) 20% DE RENDIMIENTO BUENO (B) 30% DE RENDIMIENTO REGULAR (R) 10% DE RENDIMIENTO MALO (M) SE SELECCIONA UNA MUESTRA DE N=9 BOMBAS MEDIANTE UN PROCESO ALEATORIO. ¿CUÁL ES LA PROBABILIDAD DE QUE QUEDE CONFORMADA POR: 3EX,3B, ¿1R Y 2M? RODRIGUEZ GONZALEZ BENJAMIN 33 SISTEMAS “A” 3.7. DISTRIBUCIÓN DE POISSON. LAS DISTRIBUCIONES BINOMIALES, HIPERGEOMÉTRICAS Y BINOMIALES NEGATIVAS SE DERIVARON PARTIENDO DE UN EXPERIMENTO COMPUESTO DE ENSAYOS O SORTEOS Y APLICANDO LAS LEYES DE PROBABILIDAD A VARIOS RESULTADOS DEL EXPERIMENTO. NO EXISTE UN EXPERIMENTO SIMPLE EN EL CUAL ESTÉ BASADA LA DISTRIBUCIÓN DE POISSON, AUN CUANDO EN BREVE SE DESCRIBIRÁ CÓMO PUEDE SER OBTENIDA MEDIANTE CIERTAS OPERACIONES RESTRICTIVAS. SE DICE QUE UNA VARIABLE ALEATORIA X TIENE UNA DISTRIBUCIÓN DE POISSON CON PARÁMETRO ƛ (ƛ0) SI LA FUNCIÓN MASA DE PROBABILIDAD DE X ES = 0, 1, 2, … EJEMPLO: SEA X EL NÚMERO DE CRIATURAS DE UN TIPO PARTICULAR CAPTURADAS EN UNA TRAMPA DURANTE UN PERIODO DETERMINADO. SUPONGA QUE X TIENE UNA DISTRIBUCIÓN DE POISSON CON 4.5, ASÍ QUE EN PROMEDIO LAS TRAMPAS CONTENDRÁN 4.5 CRIATURAS [EL ARTÍCULO “DISPERSAL DYNAMICS OF THE BIVALVE GEMMA GEMMA IN A PATCHY ENVIRONMENT (ECOLOGICAL MONOGRAPHS, 1995: 1–20) SUGIERE ESTE MODELO: EL MOLUSCO BIVALVO GEMMA ES UNA PEQUEÑA ALMEJA.] LA PROBABILIDAD DE QUE UNA TRAMPA CONTENGA EXACTAMENTE CINCO CRIATURAS ES RODRIGUEZ GONZALEZ BENJAMIN 34 SISTEMAS “A” LA PROBABILIDAD DE QUE UNA TRAMPA CONTENGA CUANDO MUCHO CINCO CRIATURAS ES APROXIMACIÓN DE LA BINOMIAL POR LA DE POISSON. EN MATEMÁTICAS, ESPECIALMENTE EN TEORÍA DE PROBABILIDAD ES, LA APROXIMACIÓN DE POISSON DE LA DISTRIBUCIÓN BINOMIAL SE PUEDE EMPLEAR, CUANDO HAY UN RESULTADO DIFERENTE SOBRE LA PROBABILIDAD DE QUE OCURRA UNA CANTIDAD DETERMINADA DE ÉXITOS EN UNA SERIE DE EXPERIMENTOS INDEPENDIENTES. ESTA APROXIMACIÓN ES, PARTICULARMENTE, VENTAJOSO EN EL CASO DE QUE LA PROBABILIDAD DE ÉXITO ES PEQUEÑA Y LA CANTIDAD DE EXPERIMENTOS ES BASTANTE GRANDE. PROPOSICION: PARA CUALQUIER NÚMERO NATURAL N SE TIENE UNA SERIE DE N EXPERIMENTOS INDEPENDIENTES CON PROBABILIDAD DE ÉXITO IGUAL A Λ/N EN CADA EXPERIMENTO; LA CONSTANTE Λ ES POSITIVA Y ARBITRARIA. ASUMAMOS QUE MN ES LA CANTIDAD DE ÉXITOS EN LA SERIE N-ÉSIMA. ENTONCES SE CUMPLE: 𝑃(𝛭𝑁 = 𝑀) → 𝐸 − 𝛬 × (¡ 𝛬𝑀 ÷ 𝑀!)𝐶𝑈𝐴𝑁𝐷𝑂 𝑁 → ∞ EJEMPLO: LA PROBABILIDAD DE DAR EN UN BLANCO EN CADA DISPARO ES DE 0.01. HALLAR LA PROBABILIDAD DE QUE SUCEDA, POR LO MENOS, UN ACIERTO EN 400 DISPAROS. SOLUCIÓN SE TIENE P (Μ400 = 0) ≈ E-400(0.019 = E-4 = 0.0183, DE MODO QUE P (Μ400 ≥ 1) = 1 - P (Μ400 = 0) ≈ 0.9817 RODRIGUEZ GONZALEZ BENJAMIN 35 SISTEMAS “A” 3.9. DISTRIBUCIÓN BINOMIAL NEGATIVA. UNA DISTRIBUCIÓN BINOMIAL NEGATIVA DE PARÁMETROS “R” Y “P” SURGE COMO UNA SECUENCIA INFINITA DE INTENTOS DE TIPO BERNOULLI EN LOS QUE: CADA SECUENCIA ES INDEPENDIENTE DE LAS OTRAS. EN CADA INTENTO SOLAMENTE SON POSIBLES DOS RESULTADOS (ÉXITO O FRACASO). LA PROBABILIDAD DE ÉXITO ES CONSTANTE EN CADA SECUENCIA. LOS INTENTOS CONTINÚAN HASTA QUE SE CONSIGAN R ÉXITOS. SI LLAMAMOS X = “NÚMERO DE EXPERIMENTOS REALIZADOS HASTA OBTENER EL R-ÉSIMO ÉXITO”, DIREMOS QUE LA VARIABLE X SIGUE UNA DISTRIBUCIÓN BINOMIAL NEGATIVA DE PARÁMETROS R, P. ES FÁCIL DEDUCIR QUE LA FUNCIÓN DE PROBABILIDAD DE ESTA VARIABLE SERÁ: LA FÓRMULA ANTERIOR NO ES DIFÍCIL DE DEDUCIR. PIENSA QUE PARA ESTA SITUACIÓN ESTAMOS SEGUROS DE QUE EL K-ÉSIMO INTENTO ES UN ÉXITO Y QUE EN LOS K-1 INTENTOS ANTERIORES SE DEBEN REDISTRIBUIR LOS ANTERIORES R-1 ÉXITOS. LA DISTRIBUCIÓN GEOMÉTRICA SERÍA UN CASO PARTICULAR DE BINOMIAL NEGATIVA CUANDO R = 1. LOS PARÁMETROS MEDIA, VARIANZA Y DESVIACIÓN TÍPICA ASOCIADOS A ESTA DISTRIBUCIÓN SERÍAN: RODRIGUEZ GONZALEZ BENJAMIN 36 SISTEMAS “A” EJEMPLO: PARA TRATAR A UN PACIENTE DE UNA AFECCIÓN DE PULMÓN, HAN DE SER OPERADOS EN OPERACIONES INDEPENDIENTES SUS 5 LÓBULOS PULMONARES. LA TÉCNICA A UTILIZAR ES TAL QUE, SI TODO VA BIEN, LO QUE OCURRE CON PROBABILIDAD DE 7/11, EL LÓBULO QUEDA DEFINITIVAMENTE SANO, PERO SI NO ES ASÍ SE DEBERÁ ESPERAR EL TIEMPO SUFICIENTE PARA INTENTARLO POSTERIORMENTE DE NUEVO. SE PRACTICARÁ LA CIRUGÍA HASTA QUE 4 DE SUS 5 LÓBULOS FUNCIONEN CORRECTAMENTE. ¿CUÁL ES EL VALOR DE INTERVENCIONES QUE SE ESPERA QUE DEBA PADECER EL PACIENTE? ¿CUÁL ES LA PROBABILIDAD DE QUE SE NECESITEN 10 INTERVENCIONES? ESTE ES UN EJEMPLO CLARO DE EXPERIMENTO ALEATORIO REGIDO POR UNA LEY BINOMIAL NEGATIVA, YA QUE SE REALIZAN INTERVENCIONES HASTA QUE SE OBTENGAN 4 LÓBULOS SANOS, Y ÉSTE ES EL CRITERIO QUE SE UTILIZA PARA DETENER EL PROCESO. IDENTIFICANDO LOS PARÁMETROS SE TIENE QUE SI X= NÚMERO DE OPERACIONES HASTA OBTENER R=4 CON RESULTADO POSITIVO. RODRIGUEZ GONZALEZ BENJAMIN 37 SISTEMAS “A” 3.10 DISTRIBUCIÓN UNIFORME (DISCRETA) ESTA DISTRIBUCIÓN ES UNA DE LAS MÁS IMPORTANTES DISTRIBUCIONES DE VARIABLE DISCRETA. SUS PRINCIPALES APLICACIONES HACEN REFERENCIA A LA MODELIZACIÓN DE SITUACIONES EN LAS QUE NOS INTERESA DETERMINAR EL NÚMERO DE HECHOS DE CIERTO TIPO QUE SE PUEDEN PRODUCIR EN UN INTERVALO DE TIEMPO O DE ESPACIO, BAJO PRESUPUESTOS DE ALEATORIEDAD Y CIERTAS CIRCUNSTANCIAS RESTRICTIVAS. OTRO DE SUS USOS FRECUENTES ES LA CONSIDERACIÓN LÍMITE DE PROCESOS DICOTÓMICOS REITERADOS UN GRAN NÚMERO DE VECES SI LA PROBABILIDAD DE OBTENER UN ÉXITO ES MUY PEQUEÑA. ESTA DISTRIBUCIÓN SE PUEDE HACER DERIVAR DE UN PROCESO EXPERIMENTAL DE OBSERVACIÓN EN EL QUE TENGAMOS LAS SIGUIENTES CARACTERÍSTICAS SE OBSERVA LA REALIZACIÓN DE HECHOS DE CIERTO TIPO DURANTE UN CIERTO PERIODO DE TIEMPO O A LO LARGO DE UN ESPACIO DE OBSERVACIÓN LOS HECHOS A OBSERVAR TIENEN NATURALEZA ALEATORIA; PUEDEN PRODUCIRSE O NO DE UNA MANERA NO DETERMINÍSTICA. LA PROBABILIDAD DE QUE SE PRODUZCAN UN NÚMERO X DE ÉXITOS EN UN INTERVALO DE AMPLITUD T NO DEPENDE DEL ORIGEN DEL INTERVALO (AUNQUE, SÍ DE SU AMPLITUD) LA PROBABILIDAD DE QUE OCURRA UN HECHO EN UN INTERVALO INFINITÉSIMO ES PRÁCTICAMENTE PROPORCIONAL A LA AMPLITUD DEL INTERVALO. LA PROBABILIDAD DE QUE SE PRODUZCAN 2 O MÁS HECHOS EN UN INTERVALO INFINITÉSIMO ES UN INFINITÉSIMO DE ORDEN SUPERIOR A DOS. EN CONSECUENCIA, EN UN INTERVALO INFINITÉSIMO PODRÁN PRODUCIRSE 0 O 1 HECHO, PERO NUNCA MÁS DE UNO. SI EN ESTAS CIRCUNSTANCIAS ALEATORIZAMOS DE FORMA QUE LA VARIABLE ALEATORIA X SIGNIFIQUE O DESIGNE EL "NÚMERO DE HECHOS QUE SE PRODUCEN EN UN INTERVALO DE TIEMPO O DE ESPACIO", LA VARIABLE X SE DISTRIBUYE CON UNA DISTRIBUCIÓN DE PARÁMETRO L. ASÍ: EL PARÁMETRO DE LA DISTRIBUCIÓN ES, EN PRINCIPIO, EL FACTOR DE PROPORCIONALIDAD PARA LA PROBABILIDAD DE UN HECHO EN UN RODRIGUEZ GONZALEZ BENJAMIN 38 SISTEMAS “A” INTERVALO INFINITÉSIMO. SE LE SUELE DESIGNAR COMO PARÁMETRO DE INTENSIDAD, AUNQUE MÁS TARDE VEREMOS QUE SE CORRESPONDE CON EL NÚMERO MEDIO DE HECHOS QUE CABE ESPERAR QUE SE PRODUZCAN EN UN INTERVALO UNITARIO (MEDIA DE LA DISTRIBUCIÓN); Y QUE TAMBIÉN COINCIDE CON LA VARIANZA DE LA DISTRIBUCIÓN. POR OTRO LADO, ES EVIDENTE QUE SE TRATA DE UN MODELO DISCRETO Y QUE EL CAMPO DE VARIACIÓN DE LA VARIABLE SERÁ EL CONJUNTO DE LOS NÚMERO NATURALES, INCLUIDO EL CERO EJEMPLO: EL TEMARIO PARA UN EXAMEN CONSTA DE 35 TEMAS, DE LOS CUALES SE ELEGIRÁ UNO AL AZAR. SI UN ALUMNO NO HA ESTUDIADO LOS 10 ÚLTIMOS TEMAS ¿CUÁL ES LA PROBABILIDAD DE QUE EL ALUMNO SEPA EL TEMA ELEGIDO PARA EL EXAMEN? HALLAR LA MEDIA Y VARIANZA. SOLUCIÓN: SEA X LA VARIABLE ALEATORIA QUE REPRESENTA EL NÚMERO DE TEMA SELECCIONADO PARA EL EXAMEN, COMO TODOS LOS TEMAS TIENEN LA MISMA PROBABILIDAD DE SER SELECCIONADO, X SIGUE UNA DISTRIBUCIÓN UNIFORME DISCRETA DE 35 ELEMENTOS. - LA PROBABILIDAD DE SALIR EL TEMA 1 X ES 𝑃(𝑋 = 𝑥) = 35 EL ALUMNO APRUEBA EL EXAMEN SI LE TOCA UN TEMA DEL 1 AL 25; ASÍ PUES: LA PROBABILIDAD DE SALIR UN TEMA ESTUDIADO ES: 25 𝑃(𝑋 ≤ 25) = ∑ 𝑖=1 1 25 = ≈ 0.7148 35 35 LA MEDIA Y VARIANZA SON LOS VALORES µ = 1𝑘𝑖 = 1𝑘𝑥¡ = 135𝑖 = 135 = 35 + 12 = 18 RODRIGUEZ GONZALEZ BENJAMIN 39 SISTEMAS “A” σ2 = 1 𝑖 = 1𝑘(𝑥¡ −µ) = 135𝑖 = 135 = (𝑖 − 18)2 = 18 𝑘 UNIDAD CUATRO. DISTRIBUCIONES DE PROBABILIDAD CONTINUAS. 4.1 DEFINICIÓN DE VARIABLE ALEATORIA CONTINÚA. UNA VARIABLE CONTINUA ES UN TIPO DE VARIABLE CUANTITATIVA QUE PUEDE EXPRESAR UNA CANTIDAD INFINITA DE VALORES, SIN IMPORTAR QUE SEA UN VALOR INTERMEDIO. ES DECIR, ES AQUELLA VARIABLE CUYO VALOR PUEDE ENCONTRARSE ENTRE DOS VALORES EXACTOS, GENERALMENTE REPRESENTADOS POR NÚMEROS DECIMALES. ESTA VARIABLE ESTADÍSTICA SE CONTRAPONE A LA VARIABLE DISCRETA, QUE SOLO PUEDE ADQUIRIR COMO VALOR UN CONJUNTO DE NÚMEROS. UNA PERSONA TIENE UN PERRO, 2 CAMAS O 3 HIJOS (VARIABLE DISCRETA), PERO NUNCA TENDRÁ 2 Y MEDIO. EJEMPLOS: PARA ENTENDER MEJOR ESTE CONCEPTO, VEAMOS LOS SIGUIENTES EJEMPLOS DE VARIABLES CONTINUAS: LA LONGITUD DE UNA PIEZA: UN METRO Y MEDIO (1,5); DOS METROS Y CUARTO (2,25): TRES METROS QUINCE (3,15). LA ALTURA DE CINCO AMIGOS: 1.73, 1.82, 1.77, 1.69, 1.75. EL TIEMPO QUE DEMORA UN REPARTIDOR DE COMIDA EN ENTREGAR UN PEDIDO: UNA HORA; UNA HORA Y CUARTO; UNA HORA Y MEDIA; MEDIA HORA. EL PRECIO DE UN PRODUCTO: $23,65; $199,99; $290,60. LA DISTANCIA ENTRE DOS CIUDADES: 235,5 KILÓMETROS, 65 KILÓMETROS. RODRIGUEZ GONZALEZ BENJAMIN 40 SISTEMAS “A” 4.2. FUNCIÓN DE DENSIDAD Y ACUMULATIVA. LA FUNCIÓN DE DISTRIBUCIÓN ACUMULATIVA ES LA FUNCIÓN QUE PARA UN VALOR X, NOS DA LA PROBABILIDAD DE QUE LA VARIABLE ALEATORIA SEA MENOR O IGUAL QUE DICHO VALOR X. A LA FUNCIÓN DE DISTRIBUCIÓN ACUMULATIVA LA DENOMINAMOS F(X). A CONTINUACIÓN, VIENE LA DEFINICIÓN FORMAL: SEA X UNA VARIABLE ALEATORIA CONTINUA CON FUNCIÓN DE DENSIDAD DE PROBABILIDAD F(X). LA FUNCIÓN DE DISTRIBUCIÓN ACUMULATIVA DE X ES LA FUNCIÓN: 𝑥 𝐹(𝑋) = 𝑃(𝑋 ≤ 𝑥) = ∫ b𝑓(𝑡)𝑑𝑡 ∞ DE FORMA GRÁFICA, F(X) ES EL ÁREA BAJO LA CURVA DE DENSIDAD A LA IZQUIERDA DE X. RECORDEMOS QUE CUANDO TRABAJAMOS CON LA FUNCIÓN DE DENSIDAD, ÁREA ES PROBABILIDAD. ADEMÁS, TENEMOS ALGUNAS FÓRMULAS INTERESANTES QUE NOS SERVIRÁN PARA RESOLVER LOS PROBLEMAS. 𝑃(𝑋 > 𝑎) = 1 − 𝐹(𝑎) Ⅎv{𝑃}├(Ⅎv{𝑎} ≤ Ⅎv{𝑋} ≤ Ⅎv{𝑏}┤) = Ⅎb{1} − Ⅎv{𝐹}├(Ⅎv{𝑏}┤) − Ⅎv{𝐹}├(Ⅎv{𝑎}┤); Ⅎv{𝑎} < Ⅎv{𝑏} LA SIGUIENTE FÓRMULA NOS PERMITE PASAR DE LA FUNCIÓN DE DISTRIBUCIÓN ACUMULATIVA A LA FUNCIÓN DE DENSIDAD DE PROBABILIDAD: RODRIGUEZ GONZALEZ BENJAMIN 41 SISTEMAS “A” 𝑓(𝑥) = 𝑑𝐹(𝑥) 𝑑𝑥 RECUERDA TAMBIÉN QUE, AL SER UNA FUNCIÓN ACUMULATIVA, ESTA NO PUEDE SER DECRECIENTE. EJEMPLO: LA VARIABLE ALEATORIA CONTINUA X TIENE LA SIGUIENTE FUNCIÓN DE DENSIDAD: 𝑓(𝑥) = { 0,25; 𝑖 0 ≤ 𝑥 ≤ 4 } 0 ; 𝑛 𝑎𝑠𝑜 𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜 DEFINIR Y GRAFICAR LA FUNCIÓN DE DISTRIBUCIÓN ACUMULATIVA DE X. SOLUCIÓN: INICIAMOS GRAFICANDO LA FUNCIÓN DE DENSIDAD PARA NO METERNOS EN PROBLEMAS. COMO SE VE EN LA GRÁFICA, LA CURVA DE DENSIDAD TIENE 3 TRAMOS BIEN MARCADOS. VAMOS A CALCULAR EL VALOR DE F(X) EN CADA UNO DE LOS TRAMOS EMPLEANDO LA SIGUIENTE FÓRMULA: 𝑥 𝐹(𝑥) = ∫−∞ 𝑓(𝑡)𝑑𝑡 VUELVO A COLOCAR LA COLOCAR LA MISMA FUNCIÓN DE DENSIDAD F(X), PERO ESTA VEZ COMO F(T), ES LO MISMO, NO TE PREOCUPES. 𝑓(𝑡) = { 0,25; 𝑖0≤ 𝑡 ≤ 4 } 0 ; 𝑛 𝑎𝑠𝑜 𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜 PARTIMOS CON EL PRIMER TRAMO: PARTE 1: SI X > 4 𝑥 𝑥 𝑓(𝑥) = ∫ 𝑓(𝑡)𝑑𝑡 = ∫ 0 𝑡 = 0 −∞ −∞ PARTE 2: SI 0 ≤ X ≤ 4 𝑥 𝑥 𝑥 𝑓(𝑥) = ∫ 𝑓(𝑡)𝑑𝑡 = ∫ 𝑓(𝑡)𝑑𝑡 + ∫ 𝑓(𝑡)𝑑𝑡 −∞ −∞ 0 0 𝑥 𝑓(𝑥) = ∫ 0 𝑡 + ∫ 0,25 𝑡 −∞ RODRIGUEZ GONZALEZ BENJAMIN 0 42 SISTEMAS “A” (𝑥) = 0 + 0,25𝑡 𝑣𝑎𝑙𝑢𝑎𝑑𝑜 𝑛 0 = 0,25(𝑥 − 0) = 0,25𝑥 PARTE 3: SI X > 4 FINALMENTE, DEFINIMOS F(X). TERMINAMOS CON LA GRÁFICA DE F(X). RODRIGUEZ GONZALEZ BENJAMIN 43 SISTEMAS “A” 4.3. VALOR ESPERADO, VARIANZA Y DESVIACIÓN ESTÁNDAR. VALOR ESPERADO: SEA X UNA VARIABLE ALEATORIA DISCRETA CON UN CONJUNTO DE VALORES POSIBLES D Y UNA FUNCIÓN MASA DE PROBABILIDAD P(X). EL VALOR ESPERADO O VALOR MEDIO DE X, DENOTADO POR E(X) O X, ES: 𝐸(𝑥) = µ𝑥 = 𝑥 ∈ 𝐷𝑥 ∗ 𝑝(𝑥) CUANDO ESTÁ CLARO A QUE X SE REFIERE EL VALOR ESPERADO, A MENUDO SE UTILIZA µ EN LUGAR DE X. VARIANZA: MEDIDA DEL CUADRADO DE LA DISTANCIA PROMEDIO ENTRE LA MEDIA Y CADA ELEMENTO DE LA POBLACIÓN. SEA X UNA VARIABLE ALEATORIA CONTINUA CON DISTRIBUCIÓN DE PROBABILIDAD F(X) Y MEDIA Μ. LA VARIANZA DE X ES CALCULADA POR MEDIO DE: DESVIACION ESTANDAR: LA DESVIACIÓN ESTÁNDAR O DESVIACIÓN TÍPICA ES UNA MEDIDA QUE OFRECE INFORMACIÓN SOBRE LA DISPERSIÓN MEDIA DE UNA VARIABLE. LA DESVIACIÓN ESTÁNDAR ES SIEMPRE MAYOR O IGUAL QUE CERO. RODRIGUEZ GONZALEZ BENJAMIN 44 SISTEMAS “A” 4.4. DISTRIBUCIÓN UNIFORME (CONTINUA). UNA VARIABLE ALEATORIA TIENE UNA DISTRIBUCIÓN UNIFORME CONTINUA SI LA PROBABILIDAD DE QUE TOME UN VALOR, DENTRO DE UN INTERVALO FINITO [A, B], ES LA MISMA PARA CUALQUIER SUB-INTERVALO DE IGUAL LONGITUD. ESTA DISTRIBUCIÓN ES ANÁLOGA A LA DISTRIBUCIÓN UNIFORME DISCRETA, QUE ASIGNABA A CADA RESULTADO DEL EXPERIMENTO ALEATORIO LA MISMA PROBABILIDAD, PERO EN ESTE CASO LA VARIABLE A CONSIDERAR ES CONTINUA. POR EJEMPLO, EL EXPERIMENTO QUE CONSISTE EN SELECCIONAR UN NÚMERO REAL AL AZAR, ENTRE LOS VALORES A Y B, SIGUE LA DISTRIBUCIÓN UNIFORME. EJEMPLO: UNA COMPAÑÍA QUE BRINDA SERVICIO ELÉCTRICO PROVEE NIVELES DE VOLTAJES UNIFORMEMENTE DISTRIBUIDOS, ENTRE 123.0 V Y 125.0 V. ESTO SIGNIFICA QUE EN LA TOMA DOMÉSTICA ES POSIBLE OBTENER CUALQUIER VALOR DE VOLTAJE QUE PERTENEZCA A DICHO INTERVALO. ENTONCES, SEGÚN LO VISTO ANTERIORMENTE, LA GRÁFICA DE LA FUNCIÓN DE DENSIDAD ES EL RECTÁNGULO EN ROJO: CALCULAR LA PROBABILIDAD DE TENER UN VOLTAJE DENTRO DEL INTERVALO DADO ES MUY FÁCIL, POR EJEMPLO ¿CUÁL ES LA PROBABILIDAD DE QUE LA COMPAÑÍA ENVÍE UN VOLTAJE MENOR A 123?5 V? ESTA PROBABILIDAD SOMBREADO EN AZUL: EQUIVALE AL ÁREA DEL RECTÁNGULO P(X<123.5) = (123.5 −123.0) X 0.5 = 0.25 Y ¿CUÁL ES LA PROBABILIDAD DE QUE EL VOLTAJE ENTREGADO SEA MAYOR QUE 124?0 V? COMO EL ÁREA TOTAL ES IGUAL A 1, LA PROBABILIDAD BUSCADA ES: P (X>124.0 V) = 1 – (1×0.5) = 0.5 TIENE SENTIDO, YA QUE 124.0 ES PRECISAMENTE EL VALOR EN EL CENTRO DEL INTERVALO. RODRIGUEZ GONZALEZ BENJAMIN 45 SISTEMAS “A” 4.5 DISTRIBUCIÓN EXPONENCIAL. LA DISTRIBUCIÓN EXPONENCIAL ES EL EQUIVALENTE CONTINUO DE LA DISTRIBUCIÓN GEOMÉTRICA DISCRETA. ESTA LEY DE DISTRIBUCIÓN DESCRIBE PROCESOS EN LOS QUE: NOS INTERESA SABER EL TIEMPO HASTA QUE OCURRE DETERMINADO EVENTO, SABIENDO QUE, EL TIEMPO QUE PUEDA OCURRIR DESDE CUALQUIER INSTANTE DADO T, HASTA QUE ELLO OCURRA EN UN INSTANTE TF, NO DEPENDE DEL TIEMPO TRANSCURRIDO ANTERIORMENTE EN EL QUE NO HA PASADO NADA. EJEMPLOS DE ESTE TIPO DE DISTRIBUCIONES SON: EL TIEMPO QUE TARDA UNA PARTÍCULA RADIACTIVA EN DESINTEGRARSE. EL CONOCIMIENTO DE LA LEY QUE SIGUE ESTE EVENTO SE UTILIZA EN CIENCIA PARA, POR EJEMPLO, LA DATACIÓN DE FÓSILES O CUALQUIER MATERIA ORGÁNICA MEDIANTE LA TÉCNICA DEL CARBONO 14, C1 EL TIEMPO QUE PUEDE TRANSCURRIR EN UN SERVICIO DE URGENCIAS, PARA LA LLEGADA DE UN PACIENTE. EN UN PROCESO DE POISSON DONDE SE REPITE SUCESIVAMENTE UN EXPERIMENTO A INTERVALOS DE TIEMPO IGUALES, EL TIEMPO QUE TRANSCURRE ENTRE LA OCURRENCIA DE DOS SUCESOS CONSECUTIVOS SIGUE UN MODELO PROBABILÍSTICO EXPONENCIAL. POR EJEMPLO, EL TIEMPO QUE TRANSCURRE ENTRE QUE SUFRIMOS DOS VECES UNA HERIDA IMPORTANTE. CONCRETANDO, SI UNA V.A. CONTINUA X DISTRIBUIDA A LO LARGO DE, ES TAL QUE SU FUNCIÓN DE DENSIDAD ES: SE DICE PARÁMETRO. QUE SIGUE RODRIGUEZ GONZALEZ BENJAMIN UNA 46 DISTRIBUCIÓN EXPONENCIAL DE SISTEMAS “A” 4.6 DISTRIBUCIÓN GAMMA (ERLANG). LA DISTRIBUCIÓN GAMMA, CUANDO A ES UN ENTERO POSITIVO SE CONOCE CON EL NOMBRE DE ERLANG. EXISTE UNA ASOCIACIÓN ENTRE LOS MODELOS DE PROBABILIDAD DE POISSON Y DE ERLANG. SI EL NÚMERO DE EVENTOS ALEATORIOS INDEPENDIENTES QUE OCURREN EN UN LAPSO ESPECÍFICO ES UNA VARIABLE ALEATORIA DE POISSON CON FRECUENCIA CONSTANTE DE OCURRENCIA IGUAL A 1/ Q, ENTONCES, PARA UNA A DADA, EL TIEMPO DE ESPERA HASTA QUE OCURRE EL A-ÉSIMO EVENTO DE POISSON SIGUE UNA DISTRIBUCIÓN DE ERLANG. CUANDO A=1, LA DISTRIBUCIÓN DE ERLANG SE REDUCE A UNA DISTRIBUCIÓN EXPONENCIAL NEGATIVA. NÓTESE QUE LA VARIABLE ALEATORIA DE UNA DISTRIBUCIÓN EXPONENCIAL NEGATIVA PUEDE PENSARSE COMO EL LAPSO QUE TRANSCURRE HASTA EL PRIMER EVENTO DE POISSON. DE ACUERDO CON ESTO, LA VARIABLE ALEATORIA DE ERLANG ES LA SUMA DE VARIABLES ALEATORIAS INDEPENDIENTES DISTRIBUIDAS EXPONENCIALMENTE. OTRO CASO ESPECIAL DEL MODELO DE PROBABILIDAD GAMMA ES LA DISTRIBUCIÓN CHI-CUADRADO. SI SE HACE A= U /2 Y Q=2, SE OBTIENE: DONDE U RECIBE EL NOMBRE DE GRADOS DE LIBERTAD. LA MEDIA Y VARIANZA DE LA DISTRIBUCIÓN CHI-CUADRADO SE OBTIENEN DE LOS DE LA GAMMA. RODRIGUEZ GONZALEZ BENJAMIN 47 SISTEMAS “A” 4.7. DISTRIBUCIÓN NORMAL. EN ESTADÍSTICA Y PROBABILIDAD, UNA DISTRIBUCIÓN NORMAL, TAMBIÉN LLAMADA DISTRIBUCIÓN DE GAUSS, DISTRIBUCIÓN GAUSSIANA O DISTRIBUCIÓN DE LAPLACE-GAUSS, ES LA MÁS IMPORTANTE DE TODAS LAS DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE CONTINUA Y ES LA QUE APARECE CON MÁS FRECUENCIA EN ESTADÍSTICA Y EN LA TEORÍA DE PROBABILIDADES. PERO ¿QUÉ ES EXACTAMENTE? PUES ES UN MODELO TEÓRICO QUE SIRVE PARA APROXIMAR SATISFACTORIAMENTE EL VALOR DE UNA VARIABLE ALEATORIA CONTINUA A UNA SITUACIÓN IDEAL. ¡TE LO EXPLICAMOS MEJOR! LA DISTRIBUCIÓN NORMAL ADAPTA UNA VARIABLE ALEATORIA CONTINUA A UNA FUNCIÓN QUE DEPENDE DE LA MEDIA Y LA DESVIACIÓN TÍPICA. ES DECIR, LA FUNCIÓN Y LA VARIABLE ALEATORIA CONTINUA TENDRÁN LA MISMA REPRESENTACIÓN, PERO CON LIGERAS DIFERENCIAS. ¿TE SUENA EL CONCEPTO DE CAMPANA DE GAUSS? SE LLAMA ASÍ A LA GRÁFICA DE SU FUNCIÓN DE DENSIDAD POR TENER UNA FORMA ACAMPANADA Y ES EL GRÁFICO DE UNA FUNCIÓN GAUSSIANA. ES SIMÉTRICA RESPECTO A UN DETERMINADO PARÁMETRO ESTADÍSTICO. ¿Y POR QUÉ ESTA DISTRIBUCIÓN ES TAN IMPORTANTE? PORQUE CON ELLA PODEMOS MODELAR UNA GRAN CANTIDAD DE FENÓMENOS NATURALES, SOCIALES Y PSICOLÓGICOS. NORMALMENTE, SE DESCONOCEN LOS MECANISMOS DE LA MAYORÍA DE ESTE TIPO DE FENÓMENOS POR SU ENORME CANTIDAD DE VARIABLES INCONTROLABLES. SIN EMBARGO, EL USO DEL MODELO NORMAL PUEDE JUSTIFICARSE ASUMIENDO QUE CADA OBSERVACIÓN SE OBTIENE COMO LA SUMA DE UNAS POCAS CAUSAS INDEPENDIENTES. LA IMPORTANCIA DE LA DISTRIBUCIÓN NORMAL TAMBIÉN RADICA EN SU RELACIÓN CON LA ESTIMACIÓN POR MÍNIMOS CUADRADOS, UNO DE LOS MÉTODOS DE ESTIMACIÓN MÁS SIMPLES Y ANTIGUOS. AQUÍ TIENES ALGUNOS EJEMPLOS DE VARIABLES ASOCIADAS A FENÓMENOS NATURALES QUE SIGUEN EL MODELO DE LA DISTRIBUCIÓN NORMAL: CARACTERES MORFOLÓGICOS DE INDIVIDUOS COMO LA ESTATURA; CARACTERES FISIOLÓGICOS COMO EL EFECTO DE UN FÁRMACO; RODRIGUEZ GONZALEZ BENJAMIN 48 SISTEMAS “A” CARACTERES SOCIOLÓGICOS COMO EL CONSUMO DE CIERTO PRODUCTO POR UN MISMO GRUPO DE INDIVIDUOS; CARACTERES PSICOLÓGICOS COMO EL COCIENTE INTELECTUAL; NIVEL DE RUIDO EN TELECOMUNICACIONES; ERRORES COMETIDOS AL MEDIR CIERTAS MAGNITUDES; RODRIGUEZ GONZALEZ BENJAMIN 49 SISTEMAS “A” 4.7.1 APROXIMACIÓN DE LA BINOMIAL A LA NORMAL. EN ESTE CASO SE ESTARÁN CALCULANDO PROBABILIDADES DE EXPERIMENTOS BINOMIALES DE UNA FORMA MUY APROXIMADA CON LA DISTRIBUCIÓN NORMAL, ESTO PUEDE LLEVARSE A CABO SI N¥® Y P = P(ÉXITO) NO ES MUY CERCANA A 0 Y 1, O CUANDO N ES PEQUEÑO Y P TIENE UN VALOR MUY CERCANO A ½; ESTO ES, DONDE: X = VARIABLE DE TIPO DISCRETO; SOLO TOMA VALORES ENTEROS M = NP = MEDIA DE LA DISTRIBUCIÓN BINOMIAL S = DESVIACIÓN ESTÁNDAR DE LA DISTRIBUCIÓN BINOMIAL CUANDO OCURREN LAS CONDICIONES ANTERIORES, LA GRÁFICA DE LA DISTRIBUCIÓN BINOMIAL, ES MUY PARECIDA A LA DISTRIBUCIÓN NORMAL, POR LO QUE ES ADECUADO CALCULAR PROBABILIDADES CON LA NORMAL EN LUGAR DE CON LA BINOMIAL Y DE UNA FORMA MÁS RÁPIDA. EN RESUMEN, SE UTILIZA LA APROXIMACIÓN NORMAL PARA EVALUAR PROBABILIDADES BINOMIALES SIEMPRE QUE P NO ESTÉ CERCANO A 0 O 1. LA APROXIMACIÓN ES EXCELENTE CUANDO N ES GRANDE Y BASTANTE BUENA PARA VALORES PEQUEÑOS DE N SI P ESTÁ RAZONABLEMENTE CERCANA A ½. UNA POSIBLE GUÍA PARA DETERMINAR CUANDO PUEDE UTILIZARSE LA APROXIMACIÓN NORMAL ES TENER EN CUENTA EL CÁLCULO DE NP Y NQ. SÍ AMBOS, NP Y NQ SON MAYORES O IGUALES A 5, LA APROXIMACIÓN SERÁ BUENA. ANTES DE EMPEZAR A RESOLVER PROBLEMAS CON LA APROXIMACIÓN NORMAL, ES BUENO ACLARAR QUE SE ESTÁN EVALUANDO PROBABILIDADES ASOCIADAS A UNA VARIABLE DISCRETA X, CON UNA DISTRIBUCIÓN QUE EVALÚA VARIABLES DE TIPO CONTINUO COMO ES LA NORMAL, POR LO QUE Z SUFRE UN PEQUEÑO CAMBIO COMO SE MUESTRA A CONTINUACIÓN: RODRIGUEZ GONZALEZ BENJAMIN 50 SISTEMAS “A” ¿POR QUÉ VAMOS A SUMAR O A RESTAR ½ A X? ESTE ES UN FACTOR DE CORRECCIÓN DEBIDO A QUE SE ESTÁ EVALUANDO UNA VARIABLE DISCRETA CON UNA DISTRIBUCIÓN CONTINUA, POR LO QUE HAY QUE DELIMITAR CLARAMENTE DESDE QUE PUNTO SE VA A EVALUAR LA VARIABLE, DICHO DE OTRA FORMA, EN QUE LÍMITE DE LA BARRA (INFERIOR O SUPERIOR) NOS DEBEMOS POSICIONAR PARA DETERMINAR LA PROBABILIDAD REQUERIDA, CADA BARRA DE PROBABILIDAD A EVALUAR TIENE COMO BASE LA UNIDAD, ESE ES EL PORQUÉ DEL ± ½. EJEMPLO: LA PROBABILIDAD DE QUE UN PACIENTE SE RECUPERE DE UNA RARA ENFERMEDAD DE LA SANGRE ES DE 0.4. SI SE SABE QUE 100 PERSONAS HAN CONTRAÍDO ESTA ENFERMEDAD, ¿CUÁL ES LA PROBABILIDAD DE QUE: ¿A) AL MENOS 30 SOBREVIVAN? SOLUCIÓN: A) N = 100 P = P (PACIENTE SE RECUPERE) = 0.40 Q = P (PACIENTE NO SE RECUPERE) = 1 – P = 1 – 0.40 = 0.60 µ = NP = (100) (0.40) = 40 PACIENTES SE RECUPEREN = √𝑛𝑝𝑞 = √100(0.40)(0.60) = 4.899 PACIENTES QUE SE RECUPERAN X = VARIABLE QUE NOS DEFINE EL NÚMERO DE PACIENTES QUE SE RECUPERAN X = 0, 1, 2…,100 PACIENTES QUE SE RECUPERAN RODRIGUEZ GONZALEZ BENJAMIN 51 SISTEMAS “A” 4.8. TEOREMA DE CHEBYSHEV. EL TEOREMA DE CHEBYSHOV (O DESIGUALDAD DE CHEBYSHOV) ES UNO DE LOS RESULTADOS CLÁSICOS MÁS IMPORTANTES DE LA TEORÍA DE LA PROBABILIDAD. PERMITE ESTIMAR LA PROBABILIDAD DE UN EVENTO DESCRITO EN TÉRMINOS DE UNA VARIABLE ALEATORIA X, AL PROVEERNOS DE UNA COTA QUE NO DEPENDE DE LA DISTRIBUCIÓN DE LA VARIABLE ALEATORIA SINO DE LA VARIANZA DE X. EL TEOREMA RECIBE EL NOMBRE EN HONOR AL MATEMÁTICO RUSO PAFNUTY CHEBYSHOV (TAMBIÉN ESCRITO COMO CHEBYCHEV O TCHEBYCHEFF) QUIEN, A PESAR DE NO SER EL PRIMERO EN ENUNCIAR DICHO TEOREMA, FUE EL PRIMERO EN DAR UNA DEMOSTRACIÓN EN EL AÑO 1867. ESTA DESIGUALDAD, O AQUELLAS QUE POR SUS CARACTERÍSTICAS SON LLAMADAS DESIGUALDAD DE CHEBYSHOV, SE USA PRINCIPALMENTE PARA APROXIMAR PROBABILIDADES POR MEDIO DE CÁLCULO DE COTAS. ¿EN QUÉ CONSISTE EL TEOREMA DE CHEBYSHOV? EN EL ESTUDIO DE LA TEORÍA DE LA PROBABILIDAD OCURRE QUE, SI SE CONOCE LA FUNCIÓN DE DISTRIBUCIÓN DE UNA VARIABLE ALEATORIA X, SE PUEDE CALCULAR SU VALOR ESPERADO —O ESPERANZA MATEMÁTICA E(X)— Y SU VARIANZA VAR(X), SIEMPRE Y CUANDO DICHAS CANTIDADES EXISTAN. SIN EMBARGO, EL RECÍPROCO NO ES NECESARIAMENTE CIERTO. ES DECIR, CONOCIENDO E(X) Y VAR(X) NO NECESARIAMENTE SE PUEDE OBTENER LA FUNCIÓN DE DISTRIBUCIÓN DE X, POR LO CUAL CANTIDADES COMO P(|X|>K) PARA ALGÚN K>0, SON MUY DIFÍCILES DE OBTENER. PERO GRACIAS A LA DESIGUALDAD DE CHEBYSHOV ES POSIBLE HACER UNA ESTIMACIÓN DE LA PROBABILIDAD DE LA VARIABLE ALEATORIA. RODRIGUEZ GONZALEZ BENJAMIN 52 SISTEMAS “A” EL TEOREMA DE CHEBYSHOV NOS DICE QUE, SI TENEMOS UNA VARIABLE ALEATORIA X SOBRE UN ESPACIO MUESTRAL S CON UNA FUNCIÓN DE PROBABILIDAD P, Y SI K>0, ENTONCES: EJEMPLO: SUPONGAMOS QUE EL NÚMERO DE PRODUCTOS FABRICADOS EN UNA EMPRESA DURANTE UNA SEMANA ES UNA VARIABLE ALEATORIA CON PROMEDIO DE 50. SI SE SABE QUE LA VARIANZA DE UNA SEMANA DE PRODUCCIÓN ES IGUAL A 25, ENTONCES ¿QUÉ PODEMOS DECIR ACERCA DE LA PROBABILIDAD DE QUE EN ESTA SEMANA LA PRODUCCIÓN DIFIERA EN MÁS DE 10 A LA MEDIA? SOLUCIÓN APLICANDO LA DESIGUALDAD DE CHEBYSHOV TENEMOS QUE: DE ESTO PODEMOS OBTENER QUE LA PROBABILIDAD DE QUE EN LA SEMANA DE PRODUCCIÓN EL NÚMERO DE ARTÍCULOS EXCEDA EN MÁS DE 10 A LA MEDIA ES A LO MÁS 1/4. TEOREMA LÍMITE DE CHEBYSHOV SI X1, X2, …, XN, ES UNA SUCESIÓN DE VARIABLES ALEATORIAS INDEPENDIENTES TAL QUE EXISTE ALGÚN C< INFINITO, TAL QUE VAR(XN) ≤ C PARA TODO N NATURAL, ENTONCES PARA CUALQUIER K>0: DEMOSTRACIÓN COMO LA SUCESIÓN DE VARIANZAS ES UNIFORMEMENTE ACOTADA, TENEMOS QUE VAR (SN)≤ C/N, PARA TODO N NATURAL. PERO SABEMOS QUE: HACIENDO TENDER N HACIA INFINITO, RESULTA LO SIGUIENTE: COMO UNA PROBABILIDAD NO PUEDE EXCEDER EL VALOR DE 1, SE OBTIENE EL RESULTADO DESEADO. COMO CONSECUENCIA DE ESTE TEOREMA PODRÍAMOS MENCIONAR EL CASO PARTICULAR DE BERNOULLI. SI UN EXPERIMENTO SE REPITE N VECES DE FORMA INDEPENDIENTE CON DOS RESULTADOS POSIBLES (FRACASO Y ÉXITO), DONDE P ES LA PROBABILIDAD DE ÉXITO EN CADA EXPERIMENTO Y X ES LA VARIABLE ALEATORIA QUE REPRESENTA EL NÚMERO DE ÉXITOS OBTENIDOS, ENTONCES PARA CADA K>0 SE TIENE QUE: RODRIGUEZ GONZALEZ BENJAMIN 53 SISTEMAS “A” TAMAÑO DE MUESTRA EN TÉRMINOS DE LA VARIANZA, LA DESIGUALDAD DE CHEBYSHOV NOS PERMITE ENCONTRAR UN TAMAÑO DE MUESTRA N QUE ES SUFICIENTE PARA GARANTIZAR QUE LA PROBABILIDAD DE QUE |SN-Μ|>=K OCURRA SEA TAN PEQUEÑA COMO SE DESEE, LO CUAL PERMITE TENER UNA APROXIMACIÓN A LA MEDIA. DE MANERA PRECISA, SEA X1, X2…XN UNA MUESTRA DE VARIABLES ALEATORIAS INDEPENDIENTES DE TAMAÑO N Y SUPONGAMOS QUE E(XI)=Μ Y SU VARIANZA Σ2. ENTONCES, POR LA DESIGUALDAD DE CHEBYSHOV SE TIENE QUE: EJEMPLO SUPÓNGASE QUE X1, X2…XN SON UNA MUESTRA DE VARIABLES ALEATORIAS INDEPENDIENTES CON DISTRIBUCIÓN DE BERNOULLI, DE TAL FORMA QUE TOMAN EL VALOR 1 CON PROBABILIDAD P=0.5. ¿CUÁL DEBE SER EL TAMAÑO DE LA MUESTRA PARA PODER GARANTIZAR QUE LA PROBABILIDAD DE QUE LA DIFERENCIA ENTRE LA MEDIA ARITMÉTICA SN Y SU VALOR ESPERADO (QUE EXCEDA EN MÁS DE 0,1), SEA MENOR O IGUAL QUE 0?,01? SOLUCIÓN TENEMOS QUE E(X)=Μ=P=0,5 Y QUE VAR(X)=Σ2=P(1-P) =0,25. POR LA DESIGUALDAD DE CHEBYSHOV, PARA CUALQUIER K>0 TENEMOS QUE: AHORA, TOMANDO K=0,1 Y Δ=0,01, SE TIENE QUE: RODRIGUEZ GONZALEZ BENJAMIN 54 SISTEMAS “A” DE ESTA MANERA SE CONCLUYE QUE SE NECESITA UN TAMAÑO DE MUESTRA DE AL MENOS 2500 PARA GARANTIZAR QUE LA PROBABILIDAD DEL EVENTO |SN – 0,5|>= 0,1 SEA MENOR QUE 0,01. DESIGUALDADES TIPO CHEBYSHOV EXISTEN DIVERSAS DESIGUALDADES RELACIONADAS CON LA DESIGUALDAD DE CHEBYSHOV. UNA DE LAS MÁS CONOCIDAS ES LA DESIGUALDAD DE MARKOV: EN ESTA EXPRESIÓN X ES UNA VARIABLE ALEATORIA NO NEGATIVA CON K, R>0. LA DESIGUALDAD DE MARKOV PUEDE TOMAR DISTINTAS FORMAS. POR EJEMPLO, SEA Y UNA VARIABLE ALEATORIA NO NEGATIVA (POR LO QUE P(Y>=0) =1) Y SUPONGAMOS QUE E(Y)=Μ EXISTE. SUPONGAMOS TAMBIÉN QUE (E(Y)) R=ΜR EXISTE PARA ALGÚN ENTERO R>1. ENTONCES: OTRA DESIGUALDAD ES LA DE GAUSS, LA CUAL NOS DICE QUE DADA UNA VARIABLE ALEATORIA UNIMODAL X CON MODA EN CERO, ENTONCES PARA K > 0, RODRIGUEZ GONZALEZ BENJAMIN 55 SISTEMAS “A” REFERENCIAS BIBLIOGRAFICAS J. Obando López y N. Arango Londoño, Probabilidad y estadística. Fondo Editorial EIA, 2019. [En Línea] Disponible en: https://elibro.net/es/lc/itocotlan/titulos/125705 DeVore, J. (2005). Probabilidad y Estadística para Ingeniería y Ciencias. México: Thomson Hines, W. y Montgomery, D. (2003). Probabilidad y Estadística para Ingeniería y Administración. México: CECSA Montgomery, D. C. y Runger, G. C. (1998). Probabilidad y Estadística aplicadas a la Ingeniería. México: McGraw Hill RODRIGUEZ GONZALEZ BENJAMIN 56 SISTEMAS “A”