Capítulo 3 Distribuciones de Probabilidades ____________________________________ 7 Objetivos __________________________________________________________________________ 7 Introducción ___________________________________________________________________ 8 Variable aleatoria, v.a. _______________________________________________________________ 8 Distribución de probabilidades ________________________________________________________ 9 Ia Una variable _________________________________________________________________ 10 1 Métodos tabulares y gráficos _______________________________________________________ 10 a Variables cuantitativas discretas _____________________________________________________ 10 Tablas _________________________________________________________________________ 10 Diagramas ______________________________________________________________________ 10 PF ____________________________________________________________________________ 10 CDF ___________________________________________________________________________ 11 b. Variables cuantitativas de escala ____________________________________________________ 15 Diagramas ______________________________________________________________________ 15 PDF ___________________________________________________________________________ 15 Probabilidad de masas ____________________________________________________________ 16 CDF ___________________________________________________________________________ 16 2. Métodos numéricos ______________________________________________________________ 17 Medidas de posición ________________________________________________________________ 17 Modo _________________________________________________________________________ 17 Mediana _______________________________________________________________________ 17 Valor esperado __________________________________________________________________ 17 Medidas de dispersión ______________________________________________________________ 18 Amplitudes _____________________________________________________________________ 18 Desviación Media ________________________________________________________________ 18 Varianza _______________________________________________________________________ 18 Desviación estándar ______________________________________________________________ 19 Propiedades ______________________________________________________________________ 19 Desigualdad de Tchebyscheff _________________________________________________________ 19 Problema resuelto 3.1 Selección de 3 esferas ________________________________________ 20 Problema resuelto 3.2 Dado 1 ____________________________________________________ 20 Problema resuelto 3.3 Dado 2 ____________________________________________________ 22 Problema resuelto 3.4 Clientes de un supermercado __________________________________ 22 Problema resuelto 3.5 Demanda de nafta ___________________________________________ 23 Suceso poco común: criterio con probabilidades _________________________________________ 23 Problema resuelto 3.6 Dados de distintos colores ____________________________________ 24 Ib Funciones de variables aleatorias (una variable) ___________________________________ 25 Eventos equivalentes _____________________________________________________________ 25 Métodos _________________________________________________________________________ 26 1 Caso discreto __________________________________________________________________ 26 Método de la PF _________________________________________________________________ 26 Problema resuelto 3.7 Transformación cuadrática ____________________________________ 26 2 Caso contínuo _________________________________________________________________ 26 Método de la CDF ________________________________________________________________ 26 Problema resuelto 3.8 Transformación cuadrática ____________________________________ 27 Método de la PDF ________________________________________________________________ 28 Problema resuelto 3.9 Transformación lineal ________________________________________ 29 Método de la MGF _______________________________________________________________ 30 Métodos numéricos ________________________________________________________________ 30 Valor esperado de Y ______________________________________________________________ 30 Ic Modelos teóricos de una variable _______________________________________________ 31 SPSS y EXCEL ____________________________________________________________________ 31 1 Capítulo 3 Distribuciones de Probabilidades 1. Modelos discretos _______________________________________________________________ 32 Distribución de Bernoulli, b(y,1,p) _____________________________________________________ 32 Supuestos ______________________________________________________________________ 32 Caracterización __________________________________________________________________ 33 Distribución Binomial, b(y,n,p) ________________________________________________________ 33 Supuestos ______________________________________________________________________ 33 Problema resuelto 3.10 Fiesta numerosa ___________________________________________ 35 Expresiones generales ____________________________________________________________ 37 Caracterización __________________________________________________________________ 37 Proporción muestral ______________________________________________________________ 39 Uso de tablas ___________________________________________________________________ 39 Problema resuelto 3.11 Paquetes de una distribuidora ________________________________ 39 Distribución Hipergeométrica, h(y,N,n,k) _______________________________________________ 40 Supuestos ______________________________________________________________________ 40 Problema resuelto 3.12 Fiesta no numerosa _________________________________________ 41 Expresiones generales ____________________________________________________________ 42 Caracterización __________________________________________________________________ 43 Aproximación de una hipergeométrica _______________________________________________ 44 Distribución geométrica, g(y,p) _______________________________________________________ 44 Supuestos ______________________________________________________________________ 44 Expresiones generales ____________________________________________________________ 45 Caracterización __________________________________________________________________ 45 Pérdida de la memoria ____________________________________________________________ 46 Problema resuelto 3.13 Auditorías con errores _______________________________________ 47 Distribución binomial negativa o de Pascal, bn(y,r,p) ______________________________________ 48 Supuestos ______________________________________________________________________ 48 Expresiones generales ____________________________________________________________ 49 Caracterización __________________________________________________________________ 49 Relaciones entre las CDF Binomial y Pascal ____________________________________________ 50 Pascal y Binomial ________________________________________________________________ 50 Geométrica y Binomial ____________________________________________________________ 51 Problema resuelto 3.14 Gripe H1N1 _______________________________________________ 51 Problema resuelto 3.15 Falla de un motor __________________________________________ 52 Distribuciones multinomial y multihipergeométrica _______________________________________ 53 Distribución de Poisson, p(y,λ) ________________________________________________________ 53 Supuestos ______________________________________________________________________ 53 Caracterización __________________________________________________________________ 56 Problema resuelto 3.16 Preguntas a un consultor _____________________________________ 57 Aproximación de una binomial _____________________________________________________ 59 Uso de tablas ___________________________________________________________________ 59 Problema resuelto 3.17 Errores en un libro __________________________________________ 60 Diseños con tabla de contingencias ____________________________________________________ 60 2. Modelos contínuos _______________________________________________________________ 63 Distribución Uniforme, r(x,a,b) ________________________________________________________ 63 Caracterización __________________________________________________________________ 64 Problema resuelto 3.18 Distribución uniforme _______________________________________ 65 Problema resuelto 3.19 Espera del ómnibus _________________________________________ 65 Distribución Exponencial, e(t,ω) _______________________________________________________ 66 Caracterización __________________________________________________________________ 67 Pérdida de la memoria ____________________________________________________________ 68 Distribución Gamma ________________________________________________________________ 68 Función Gamma _________________________________________________________________ 68 Problema resuelto 3.20 Γ(1/2) ____________________________________________________ 69 Distribución Gamma(x,r,α) _________________________________________________________ 69 Caracterización __________________________________________________________________ 70 2 Jorge Carlos Carrá Introducción – Objetivos Exponencial _____________________________________________________________________ 70 Relaciones entre las CDF de Gamma y Poisson _________________________________________ 71 Gamma y Poisson ________________________________________________________________ 71 Exponencial y Poisson _____________________________________________________________ 72 Problema resuelto 3.21 Distribución exponencial _____________________________________ 73 Problema resuelto 3.22 Reparación de aviones ______________________________________ 75 Distribución Normal, n(z,0,1) _________________________________________________________ 76 Supuestos ______________________________________________________________________ 76 PDF ___________________________________________________________________________ 77 CDF ___________________________________________________________________________ 80 Caracterización __________________________________________________________________ 80 Propiedades ____________________________________________________________________ 82 Uso de tablas ___________________________________________________________________ 82 Problema resuelto 3.23 Distribución normal _________________________________________ 82 Problema resuelto 3.24 Método de Sympson ________________________________________ 83 Problema resuelto 3.25 Coeficiente de inteligencia ___________________________________ 83 Regla empírica __________________________________________________________________ 85 Aproximación de una binomial y de una Poisson _______________________________________ 86 Problema resuelto 3.26 Estudiantes promocionados __________________________________ 87 Distribución t de Student, f(t,ν) _______________________________________________________ 88 Caracterización __________________________________________________________________ 89 Propiedades ____________________________________________________________________ 90 Uso de tablas ___________________________________________________________________ 90 Problema resuelto 3.27 Distribución t de Student ____________________________________ 90 Distribución chi cuadrado, f(χ2, ν) _____________________________________________________ 91 Caracterización __________________________________________________________________ 93 Propiedades ____________________________________________________________________ 93 Uso de tablas ___________________________________________________________________ 95 Problema resuelto 3.28 Distribución χ2 ____________________________________________ 96 Distribución F, f(F,ν1, ν2)_____________________________________________________________ 96 Caracterización __________________________________________________________________ 98 Propiedades ____________________________________________________________________ 98 Uso de tablas __________________________________________________________________ 100 Problema resuelto 3.29 Distribución F _____________________________________________ 100 Problema resuelto 3.30 Propiedad reciproca _______________________________________ 101 Estimador de Densidad Kernel, Kernel Density Estimate, KDE. ____________________________ 101 Distribuciones truncadas ___________________________________________________________ 101 Problema resuelto 3.31 Normal truncada a la izquierda _______________________________ 102 Momentos de orden n _____________________________________________________________ 103 Función generadora de momentos, MGF m(t) __________________________________________ 103 Problema resuelto 3.32 Obtención de MX(t) ________________________________________ 105 Propiedades de la MGF __________________________________________________________ 107 IIa Dos variables ______________________________________________________________ 109 1. Métodos tabulares y gráficos ______________________________________________________ 109 a Variables discretas _______________________________________________________________ 109 PF ___________________________________________________________________________ 109 CDF __________________________________________________________________________ 109 PF marginales __________________________________________________________________ 110 PF condicionales ________________________________________________________________ 110 Independencia _________________________________________________________________ 110 b Variables contínuas ______________________________________________________________ 110 CDF __________________________________________________________________________ 110 PDF __________________________________________________________________________ 110 PDF marginales _________________________________________________________________ 111 PDF condicionales _______________________________________________________________ 111 3 Capítulo 3 Distribuciones de Probabilidades Independencia _________________________________________________________________ 111 2. Métodos numéricos _____________________________________________________________ 111 Medidas de posición _______________________________________________________________ 112 Vector esperanza _______________________________________________________________ 112 Esperanza conjunta _____________________________________________________________ 112 Esperanza condicional ___________________________________________________________ 112 Medidas de dispersión _____________________________________________________________ 112 Vector varianza _________________________________________________________________ 112 Varianza conjunta _______________________________________________________________ 113 Varianza condicional _____________________________________________________________ 113 Medidas de asociación _____________________________________________________________ 113 Covarianza ____________________________________________________________________ 113 Correlación lineal _______________________________________________________________ 113 Matriz Covarianzas, P ____________________________________________________________ 113 Matriz de correlaciones, R ________________________________________________________ 114 Problema resuelto 3.33. Género de los hijos ________________________________________ 114 Problema resuelto 3.34. Demanda diaria __________________________________________ 115 Problema resuelto 3.35. Tiempo de vida de 2 dispositivos electrónicos __________________ 116 IIb Funciones de variables aleatorias (dos variables) _________________________________ 118 Métodos ________________________________________________________________________ 118 1 Caso discreto _________________________________________________________________ 118 Método de la PF ________________________________________________________________ 118 Problema resuelto 3.36 Defectuosos en 2 líneas de producción ________________________ 118 2 Caso contínuo ________________________________________________________________ 119 Método de la CDF _______________________________________________________________ 119 Problema resuelto 3.37 Transformación suma ______________________________________ 120 Método de la PDF _______________________________________________________________ 121 Funciones Y = H ( X1 , X 2 ) importantes ____________________________________________ 122 Problema resuelto 3.38 Transformación suma ______________________________________ 123 Métodos numéricos _______________________________________________________________ 124 Valor esperado de Y _____________________________________________________________ 125 H lineal _______________________________________________________________________ 125 Problema resuelto 3.39 Distribución hipergeométrica ________________________________ 126 IIc Modelos teóricos de dos variables _____________________________________________ 129 1 Modelos discretos _______________________________________________________________ 129 Multinomial, m(yA,yB,yC,n,pA,pB,pC) ___________________________________________________ 129 Supuestos _____________________________________________________________________ 129 Expresiones generales ___________________________________________________________ 129 PDF conjunta ___________________________________________________________________ 130 Relación con la binomial __________________________________________________________ 130 Caracterización _________________________________________________________________ 130 Problema resuelto 3.40 Examen de selección múltiple ________________________________ 131 Distribución Multihipergeométrica ___________________________________________________ 131 PDF conjunta ___________________________________________________________________ 131 Relación con la hipergeométrica ___________________________________________________ 132 Caracterización _________________________________________________________________ 132 Esperanza _____________________________________________________________________ 132 2 Modelos contínuos ______________________________________________________________ 133 Distribución uniforme ______________________________________________________________ 133 PDF conjunta ___________________________________________________________________ 133 Problema resuelto 3.41 Encuentro _______________________________________________ 133 Distribución binormal ______________________________________________________________ 133 nXY(μx, μy, σx, σy, ρ) ______________________________________________________________ 134 PDF conjunta ___________________________________________________________________ 134 4 Jorge Carlos Carrá Introducción – Objetivos PDF marginales _________________________________________________________________ 134 Caracterización _________________________________________________________________ 134 III Confiabilidad, R(t) ___________________________________________________________ 136 Distribución exponencial _________________________________________________________ 139 Distribución Gamma, (t,r,α) _______________________________________________________ 141 Distribución de Weibull, (x,ω,β) ____________________________________________________ 141 Distribución normal _____________________________________________________________ 144 Sistemas ______________________________________________________________________ 146 Problema resuelto 3.42. Ley exponencial de fallas ___________________________________ 147 Problema resuelto 3.43. Frecuencia de fallas variable ________________________________ 148 IV Teoría de los juegos _________________________________________________________ 150 1 Simultáneos con estrategias puras __________________________________________________ 152 a Formas del juego ______________________________________________________________ 152 b Equilibrio de Nash _____________________________________________________________ 154 c Eficiencia y justicia _____________________________________________________________ 158 d Estrategias Minimax y MaxiMin __________________________________________________ 159 e Juegos de suma cero ___________________________________________________________ 162 Problema resuelto 3.45 Sistemas de video _________________________________________ 163 Problema resuelto 3.46 El juego de la contaminación ________________________________ 164 Problema resuelto 3.47 Competición Cournot ______________________________________ 165 2 Simultáneos con estrategias mixtas _________________________________________________ 167 a Formas del juego ______________________________________________________________ 167 b Equilibrio de Nash _____________________________________________________________ 168 c Funciones de mejor respuesta (BRF, Best Response Function) __________________________ 169 Problema resuelto 3.48 Estrategia de juego en el saque ______________________________ 169 Problema resuelto 3.49 Estrategia de juego en el saque ______________________________ 176 d Conjunto convexo de ganancias __________________________________________________ 178 3 Secuenciales ____________________________________________________________________ 179 a Formas del juego ______________________________________________________________ 179 b Subjuego ____________________________________________________________________ 181 c Equilibrios ____________________________________________________________________ 181 d Juegos simultáneos ____________________________________________________________ 184 e Racionalidad secuencial y credibilidad _____________________________________________ 187 Problema resuelto 3.50 Educación parental ________________________________________ 187 f Aplicación: juego de ajedrez _____________________________________________________ 189 4 Teoría de las decisiones económicas_________________________________________________ 189 a Formas de la decisión __________________________________________________________ 190 Problema resuelto 3.51 Mejor inversión ___________________________________________ 191 Problema resuelto 3.52 Acciones y la economía _____________________________________ 192 b Caso particular: una sola acción __________________________________________________ 193 Problema resuelto 3.53 Rifa para juntar fondos _____________________________________ 193 Problema resuelto 3.54 Costo de la prima de seguros ________________________________ 194 Problema resuelto 3.55 Ruleta europea ___________________________________________ 196 Problema resuelto 3.56 Estrategias de ventas _______________________________________ 197 V Simulaciones _______________________________________________________________ 199 1 Simulación de distribuciones _________________________________________________________ 199 Problema resuelto 3.57 Simulación Montecarlo _____________________________________ 201 2 Simulación de juegos _______________________________________________________________ 202 ComLabGames ___________________________________________________________________ 202 a Moderador _____________________________________________________________________ 202 a Design ______________________________________________________________________ 203 b Assignment __________________________________________________________________ 206 c Execution ____________________________________________________________________ 207 e Data ________________________________________________________________________ 208 5 Capítulo 3 Distribuciones de Probabilidades b Jugador (cliente) ________________________________________________________________ 209 Client Play _____________________________________________________________________ 209 Problema resuelto 3.58 El empresario y el capitalista _________________________________ 211 Ensayo: ¿Creer en Dios mejora la existencia? _______________________________________ 215 El peso de la decisión. Blas Pascal ____________________________________________________ 215 Ensayo: Intimidades de un casino ________________________________________________ 217 Introducción _____________________________________________________________________ 217 1. Casinos _______________________________________________________________________ 217 2. Aseguradoras __________________________________________________________________ 222 Problemas ___________________________________________________________________ 224 Ia Una variable ___________________________________________________________________ 224 Ic Modelos teóricos de una variable __________________________________________________ 225 Discretas ______________________________________________________________________ 225 Contínuas _____________________________________________________________________ 228 IV Teoría de los juegos _____________________________________________________________ 231 Problemas con base de datos ________________________________________________________ 234 6 Jorge Carlos Carrá Introducción – Objetivos Capítulo 3 Distribuciones de Probabilidades Objetivos • • • Introducir las distribuciones de probabilidad más comunes en la toma de decisiones. Mostrar cual distribución utilizar y aprender cómo obtener sus valores. Apreciar las limitaciones de cada una de las distribuciones que utilice. 7 Capítulo 3 Distribuciones de Probabilidades Introducción En este capítulo se estudiará la tercera y última de las bases necesarias para afrontar en los capítulos restantes, la inferencia estadística. Como su nombre lo indica, esta tercera base, se apoya en realidad sobre los hombros de las dos anteriores. Este capítulo recorre en gran medida, el esquema del capítulo 1, distribuciones de frecuencias, pero en lugar de tratar muestras, lo haremos con poblaciones. Variable aleatoria, v.a. Las probabilidades se aplican a eventos A, por ejemplo P(A)=0.5, sin embargo, para realizar estudios matemáticos como los del capítulo 1, los eventos deben ser numéricos. De aquí que resulte necesario definir una variable numérica asociada a cada evento, X =X(A). Esta variable se llama aleatoria (v.a.), pues toma cada uno de sus valores (eventos) con una definida probabilidad. La función que relaciona los eventos con la variable numérica aleatoria debe ser biyectiva, es decir para cada evento A le corresponde uno y solo un valor X(A). EL gráfico de la figura 3-1a indica una v.a. posible para el espacio muestral del lanzamiento de 2 monedas, en el cual la v.a. es el número de Caras. El esquema conceptual general es el de la figura 31b. a x=X(A) A p=P(x) x p=P(A) b 8 Jorge Carlos Carrá p Introducción – Distribución de probabilidades Figura 3-1 Variable Aleatoria La expresión p(x) es una simplificación de la notación más precisa: P ( A ) = P ( A : X ( A) = x ) = P ( X = x ) = p ( x ) De aquí en más utilizaremos en general la notación que prescinde de los eventos A, pero el estudiante debe comprender el significado que realmente representa esta notación. En muchos casos, el evento es numérico por sí mismo, como por ejemplo, el número de esferas o mujeres que se extrae de un grupo, la suma de los números de 2 dados, la ganancia monetaria, etc. Cuando esta situación no se presente, los números que se asignan a la v.a son en principio arbitrarios, pero si se relacionan con el evento, mejor. En general se designa una variable aleatoria con letra mayúscula (con dominio sobre los eventos experimentales) y a un valor específico o determinista de ella con letra minúscula (con dominio sobre los números reales), aunque algunas letras configuran la excepción, como por ejemplo: z, t o p̂ . Esta notación se aplicará en este libro para X e Y, en especial cuando la variable aleatoria se encuentre dentro de una función específica para estas variables, tales como: P(X), E(X), V(X) y Cov(X,Y), dando a entender que su dominio es el de los sucesos experimentales. Distribución de probabilidades Es una función que asocia a cada valor de todos los posibles x, su probabilidad p(x). En el capítulo 1 hemos estudiado las distribuciones de frecuencias de muestras y en el capítulo 2 hemos visto que la frecuencia relativa muestral a largo plazo es la probabilidad en una población. Uniendo ambos conocimientos, podemos generalizar todos los conceptos vistos cambiando la frecuencia relativa por probabilidad: Por esta razón, la siguiente sección es en realidad una adaptación de conceptos anteriores. 9 Capítulo 3 Distribuciones de Probabilidades Ia Una variable Comenzamos con los métodos aplicables a una sola variable. Una variable aleatoria es numérica o cuantitativa y, como vimos en el capítulo 1, se divide en: 1. Discretas 2. Continuas o de escala 1 Métodos tabulares y gráficos a Variables cuantitativas discretas Recordemos del capítulo 1 que las variables cuantitativas discretas son las variables que resultan de contar, por lo tanto generalmente se definen como "X = número de…" Tablas Llamamos: • S, al espacio muestral, • E, a cada uno de los eventos del mismo, • X, a la v.a asignada a cada evento, • p = P(X = x) = p(x), a las probabilidades de cada evento. La distribución de probabilidades, se puede definir con una tabla como la de la figura 3-2. S X=x p(x) F(x) E1 x1 p1 p1 E2 x2 p2 p1 + p2 E3 x3 p3 p1 + p2 + p3 … … … … En xn pn 1 Figura 3-2 Tabla de una distribución de probabilidades categórica Diagramas PF El histograma de probabilidades equivalente a la tabla se suele llamar PF (Probability Function) y mostrará un valor de p(x) para cada uno de los valores de discretos de la variable. Para que el área mida una probabilidad, la representación más adecuada es utilizar una flecha para cada x (figura 33). Esta simbología matemática se llama delta de Dirac, δ(x) (ver más adelante) la cual permite expresar correctamente los cálculos. De todas formas se acepta también un rectángulo para cada x, 10 Jorge Carlos Carrá Ia Una variable – a V Variables cuan ntitativas disc cretas ma, no existenn valores paraa la base del aunquee debe interprretarse que, a diferencia dee un histogram mismoo, excepto para el punto meedio. Propiedades p( x) ≥ 0 +∞ ∑ p( x) = 1 −∞ Figura 3-3 Probability Functioon CDF F La ojivva o CDF (Cuumulative Disstribution Funnction), tomarrá el aspecto dde la figura 3--4, mostrandoo una fun nción escalónn F ( x ) con discontinuidad d des o saltos. Cada C escalón incluye el iniicio y excluyee el extrem mo. Con exxcepción del punto p siguiennte, no se utilizará para el escalón e la notación E ( x ) , usual en matem máticas, pues en e estadística significa la Esperanza E de x. x Capíítulo 3 Distrib buciones de Probabilidade P es Figura 3-4 Cumulativee Distribution Function F Matem máticamente: k F ( x) = p ( X ≤ x) = ∑ pi i Propiedades F ( −∞ ) = 0 F ( +∞ ) = 1 Relac ción entre p(x) p y F(x) ) Tal com mo vimos en el capítulo 1 para las variaables numériccas: p( x) = dF ( x) dx x F ( x) = ∫ p( x)dx d −∞ Expre esión mate emática de la p(x) 1 Delta a de Dirac Formallmente la funnción delta de Dirac se defiine a partir dee la función esscalón unitariio E(x), de la siguiennte forma: δ ( x) = dE ( x) en x = 0 dx Generaalizando: δ a = δ ( x − a) = dE ( x − a ) en x = a dx Para innterpretar a essta función, approximemos een forma con ntínua al escallón unitario, con c EΔ(t), un salto de altura unitaria y ancho de longitud Δ, tal como se muestra m en la figura 3.7. 12 Jorge e Carlos Carrrá Ia Una variable – a Variables cuantitativas discretas Figura 3-5 EΔ(t), aproximación contínua al escalón unitario La derivada de EΔ(t) será un pulso de duración Δ, de altura 1/Δ y como su base es Δ, el pulso será por lo tanto de área 1 para todo Δ, como se muestra en la figura 3.8. Figura 3-6 Derivada de EΔ(t) Si Δ tiende a 0, entonces δΔ(t) se vuelve más angosto y alto, pero manteniendo su área unitaria, tendiendo a δ(t). En el límite se puede expresar que el área es 1. ⎧∞ si x = 0 ⎩0 si x ≠ 0 δ ( x) = ⎨ ∫ +∞ −∞ δ ( x)dx = 1 2 Expresión de f(x) Por definición: ⎧∞ si x = a ¨ ⎩0 si x ≠ a δ ( x − a) = ⎨ En general para todos los puntos del espacio muestral, la función densidad es una función definida por tramos de pulsos modulados por pi (tren de pulsos). f ( x) = ∑ piδ ( x − xi ) i Valor de p(x) Supongamos que en un punto arbitrario a, p(x) tiene el valor pa. La probabilidad es el área de la función densidad en ese punto, por lo cual debemos integrar entre 2 valores que solo comprendan a dicho punto: p( x = a) = ∫ a+ a− paδ ( x − a)dx = pa 1 = pa Dado que la delta de Dirac se expresa por una flecha, ésta es la representación más adecuada para la gráfica de la PF. Estrictamente el valor en cada punto es infinito, pero suele expresarse el valor de la probabilidad con flechas de altura proporcional a dicho valor, sobreentendiendo que se está expresando el área. 13 Capítulo 3 Distribuciones de Probabilidades Expresión de F(x) Integrando la función densidad pero ahora entre −∞ y el punto a : F (a) = ∫ a −∞ ( p1δ ( x − x1 ) + ... + paδ ( x − a) ) dx es decir: a F ( a ) = p11 + ... + pa 1 = ∑ pi −∞ Es también una función definida por tramos, en este caso escalonados. Notación La vinculación funcional entre los valores de eje, x y valores acumulados de área por la izquierda, CDF, se puede expresar de 2 formas alternativas: con subíndice o con paréntesis: x(CDF ) = xCDF CDF ( x) = CDFx = P( x < xCDF ) En la unidad 1 usamos en forma indistinta las notaciones de paréntesis y subíndice para CDF, con F = CDF , aunque el subíndice fue más frecuente para los cuantiles ( xF ). Sin embargo, cuando sea necesario precisar la dependencia a otras variables (media, desviación estándar, tamaño de la muestra, tamaño de la población, grados de libertad, etc), es conveniente normalizar la notación y usar la notación de subíndice para la relación anterior dejando el paréntesis para cualquier vinculación restante. Ejemplo: xCDF ( x , s) = x0.80 ( x , s) = x0.80 (100,15) = 112.6 Esta expresión significa el valor del eje x para una CDF= 0.80, con media 100, y desviación estándar 15 (los números de este ejemplo corresponden a una distribución normal que veremos luego). SIG El complementario de la CDF, es decir usando valores acumulados por la derecha, se llama SIG, SIGnificación, nombre proveniente de la inferencia estadística (capítulo 5), o también α1. SIG = α = 1 − CDF Nota En aplicaciones a la confiabilidad se llama también Función Supervivencia, (Survival Function). Notación Nuevamente, la relación entre los valores del eje y del área se puede representan con un paréntesis o con un subíndice. x(α ) = xα α ( x) = α x = P( x > xα ) 1 También se usa α para simbolizar el área de ambas colas, incluyendo la cola inferior. El contexto indicará el significado. Jorge Carlos Carrá 14 Ia Una variable – b. Variables cuantitativas de escala b. Variables cuantitativas de escala Recordemos del capítulo 1 que las variables cuantitativas de escala son las variables que resultan de medir. Diagramas Son la expresión contínua de las relaciones anteriores. PDF PDF significa Probability Density Function. El SPSS llama PDF tanto a las PF de las distribuciones discretas como a las PDF de las continuas, por lo cual seguiremos en general la misma idea. Un ejemplo se muestra en la figura 3-7. Figura 3-7 PDF Propiedades f ( x) ≥ 0 ∫ +∞ −∞ f ( x)dx = 1 Notas 1. La función densidad f(x) no representa la probabilidad de nada. Es el área debajo de ella la que representa una probabilidad. 2. Para el caso contínuo, debe ser P(x = xi) = 0, pues el área es cero en xi. Desde el punto de vista estadístico esto se interpreta pensando que entre infinitos valores, es altamente improbable que se presente exactamente el resultado x = xi. El cálculo de probabilidades de variables contínuas solo tiene sentido si se utilizan intervalos y no puntos. De aquí que las siguientes expresiones son todas idénticas: P ( a ≤ X ≤ b) = P ( a < X ≤ b) = P ( a ≤ X < b) = P ( a < X < b) 15 Capítulo 3 Distribuciones de Probabilidades Probabilidad de masas Resulta útil una analogía que surge de considerar a la función densidad como una densidad lineal de masa en el eje x. Con esta interpretación, la probabilidad sería el área entre la línea f(x) y el eje x. En particular si la f(x) es constante (distribución uniforme) de valor c y la longitud sobre el eje x es L, la constante deberá ser 1/ L . CDF Se muestra en la figura 3-8. Figura 3-8 CDF Propiedades F ( −∞ ) = 0 F ( +∞ ) = 1 Relación entre f(x) y F(x) Tal como adelantamos en el capítulo 1: dF ( x) dx f ( x) = x F ( x) = ∫ f ( x)dx −∞ Más formalmente, por definición de función densidad: x P( X ≤ x) = ∫ f ( x)dx −∞ además por definición de función distribución: P ( X ≤ x) = F ( x) − F ( −∞) = F ( x ) Vinculando ambas expresiones, se tiene la relación buscada. 16 Jorge Carlos Carrá Ia Una variable – 2. Métodos numéricos 2. Métodos numéricos Parámetros y estadísticos Al igual que la pendiente y la ordenada al origen son parámetros que caracterizan a una recta, los métodos numéricos que veremos a continuación proveen parámetros que caracterizan a la distribución de probabilidades. En cambio, las magnitudes de los métodos numéricos aplicados a muestras aleatorias del capítulo 1, se llaman estadísticos Y, definidos como cualquier función aplicada a los n valores de la muestra ( x1 , x2 ,...xn ) , es decir Y = H ( x1 , x2 ,...xn ) . Observar que al ser las X variables aleatorias, los estadísticos Y también lo son. Así por ejemplo, la media x de la unidad 1 es un estadístico, en cambio la media μ que se verá en este capítulo es un parámetro de la distribución. Para obtener la versión para la población, se deberá en: Discretas Reemplazar la frecuencia fx por p Contínuas Reemplazar la sumatoria por la integral y la frecuencia fx por f(x)dx.. Además, dado que las distribuciones de probabilidades corresponden a una población, en el cálculo de la varianza se deberá dividir por n en lugar de n − 1 . Medidas de posición Modo M es el valor de x que le corresponde al máximo de la distribución. Contínua Como es el máximo de la distribución, surgirá de las raíces de: df ( x ) =0 dx Mediana Q2 se obtiene con las mismas expresiones vistas en el capítulo 1. Contínua Q2 será el valor de x que le corresponde a un área del 50% contada desde los extremos. ∫ Q2 −∞ f ( x)dx = 0.5 De forma similar se define cualquier percentil. Valor esperado La media de una variable aleatoria poblacional se llama además, valor esperado, pues es el valor promedio que esperaríamos obtener si las repeticiones se pudieran realizar en forma indefinida. La notación de la media y la desviación estándar para muestras del capítulo 1, se realizó con letras del 17 Capítulo 3 Distribuciones de Probabilidades alfabeto latino. Para las distribuciones de probabilidades de poblaciones, se utilizan en cambio, letras del alfabeto griego. x → μ = E(X ) s → σ = V (X ) Discretas Reemplazando la frecuencia relativa por la probabilidad, se tendrá: μ = ∑ px El valor esperado es entonces un promedio ponderado de los valores de x, donde el peso está dado por la probabilidad de cada x. Contínuas E ( x) = ∫ x f ( x )dx Medidas de dispersión Amplitudes Son idénticas a las ya vistas para las distribuciones de frecuencias. Desviación Media Discretas DM = ∑ p Δ x Contínuas DM = ∫ x − μ f ( x ) dx Varianza Discretas V ( X ) = ∑ pΔ 2x Suma de cuadrados Las expresiones de los SSxx se mantienen, cambiando la frecuencia f por p: SS xx = ∑ px 2 − nμ 2 La varianza será entonces: V ( x) = SS xx = n ∑ px n 2 − μ 2 = E( x2 ) − μ 2 La varianza de una población es la media de los cuadrados menos el cuadrado de la media. Contínuas V ( x) = ∫ ( x − μ ) 2 f ( x)dx Suma de cuadrados 18 Jorge Carlos Carrá Ia Una variable – Propiedades Las expresiones de los SSxx se mantienen, cambiando la frecuencia f por f ( x ) dx : SS xx = ∫ x 2 f ( x) dx − nμ 2 La varianza será entonces: V ( x) = SS xx = E ( x2 ) − μ 2 n Desviación estándar σ = V (X ) Propiedades Se repiten a continuación las propiedades ya estudiadas y demostradas en el capítulo 1. Las demostraciones para variables contínuas son análogas a las de variables discretas, cambiando la sumatoria por la integral. 1 E (c ) = c 1 V (c ) = 0 E ( cX ) = cE ( X ) 2 2 V (cX ) = c 2V ( X ) 3 4 5 E (c ± X ) = c ± E ( X ) E ( X ± Y ) = E ( X ) ± E (Y ) E ( XY ) = E ( X ) E (Y ) − Cov ( XY ) 3 V (c ± X ) = V ( X ) 5 6 7 V ( X ± Y ) = V ( X ) + V (Y ) ± 2Cov ( X , Y ) Cov ( aX , bY ) = abCov ( X , Y ) Cov ( a + X , b + Y ) = Cov ( X , Y ) ∑ ∑ ∑ abCov( X , Y ) 8 Cov( aX , bY ) = Recordemos que en las propiedades 5 si los eventos son independientes, la covarianza es cero. Desigualdad de Tchebyscheff La demostración de esta desigualdad se realizó en el capítulo 1 (página Tchevy1), simplemente ahora la expresaremos en términos de probabilidades: Esto resulta directamente de reconocer que una sumatoria de frecuencias relativas se corresponde con una probabilidad, la cual se expresa en el campo contínuo con una integral: ∑ 2 colas fx = ∫ f ( x)dz = P(| X − μ |> zkσ ) 2 colas en donde la última expresión indica valores de X en las 2 colas: μ − zkσ > X > μ + zkσ . Por lo tanto la desigualdad se expresa: P (| X − μ |> zkσ ) < 1 zk 2 19 Capítulo 3 Distribuciones de Probabilidades Problema resuelto 3.1 Selección de 3 esferas Tres esferas se eligen aleatoriamente de una urna conteniendo 20 esferas numeradas. Si X es el mayor número de las 3 esferas, a) construir la PF, b) ¿cuál es la probabilidad de que solo una de las esferas tenga por lo menos el número 17?, c) hallar F(6). a) Veamos algunos ejemplos: ⎛ 2⎞ ⎛ 3⎞ ⎛ 4⎞ 1⎜ ⎟ 1⎜ ⎟ 1⎜ ⎟ 2 2 2 P ( X = 3) = ⎝ ⎠ = 0.000877 P ( X = 4) = ⎝ ⎠ = 0.00263 P ( X = 5) = ⎝ ⎠ = 0.00526 ⎛ 20 ⎞ ⎛ 20 ⎞ ⎛ 20 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝3⎠ ⎝3⎠ ⎝3⎠ ⎛ 17 ⎞ ⎛18 ⎞ ⎛19 ⎞ 1⎜ ⎟ 1⎜ ⎟ 1⎜ ⎟ 2 2 2 P ( X = 18) = ⎝ ⎠ = 0.119 P( X = 19) = ⎝ ⎠ = 0.134 P ( X = 20) = ⎝ ⎠ = 0.150 ⎛ 20 ⎞ ⎛ 20 ⎞ ⎛ 20 ⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎝3⎠ ⎝3⎠ ⎝3⎠ La distribución es: X 3 4 5 6 7 8 9 10 11 P(X) 0.001 0.003 0.005 0.009 0.013 0.018 0.025 0.032 0.039 X 12 13 14 15 16 17 18 19 20 P(X) 0.048 0.058 0.068 0.080 0.092 0.105 0.119 0.134 0.150 Figura 3-9 b) P ( X ≥ 17) = 0.105 + 0.119 + 0.134 + 0.150 = 0.508 c) F (6) = P ( X ≤ 6) = 0.00087 + 0.00263 + 0.00526 + 0.00877 = 0.03 Notar que la FDP no es P ( X < 6) pues siempre debe incluir al valor. Problema resuelto 3.2 Dado 1 Se arroja un dado. Si se define x = número que sale, a) obtener la distribución de probabilidades, b) hallar el valor esperado y la varianza. a) S X=x p(x) F(x) 1 1/6 1/6 2 1/6 2/6 3 1/6 3/6 Figura 3-10 Tabla 20 Jorge Carlos Carrá 4 1/6 4/6 5 1/6 5/6 6 1/6 1 Ia Una variable – Desigualdad de Tchebyscheff Figura 3-11 PDF Figura 3-12 CDF b) E ( x) = 21 = 3.50 6 V(x)= 2.917 V ( X ) = σ = 1.707 35 = 2.917 12 21 Capítulo 3 Distribuciones de Probabilidades Figura 3-13 Caracterización SPSS En la figura 3-13 se ha colocado la salida del SPSS. Sin embargo debe tenerse en cuenta que el programa realiza el cálculo muestral y por lo tanto divide la varianza por n-1. Para obtener el valor poblacional se debe por lo tanto multiplicar por n-1 y dividir por n. Por lo tanto: 5 V ( x) = 3.5 = 2.917 6 Problema resuelto 3.3 Dado 2 Se arroja un dado 160 veces. Si x es el número que sale, calcular la media y la varianza de: 160 Y =∑X En lugar de realizar 6 cálculos, resulta mucho más práctico aplicar las propiedades de la esperanza y de la varianza y utilizar los resultados del problema anterior. 21 = 560 6 35 V (Y ) = V (∑ X ) = ∑ (V ( X ) = 160V ( X ) = 160 = 466.7 12 E (Y ) = E (∑ X ) = ∑ ( E ( X ) = 160 μ x = 160 Problema resuelto 3.4 Clientes de un supermercado El 20% de los clientes de un supermercado leen los precios antes de comprar un artículo. Si 2 clientes entran, hallar la distribución de probabilidades de x = número de clientes que leen los precios, su media y su varianza. Si llamamos N al evento No leen y L al evento Leen, se tiene: P(N) = 0.8 P(L) = 0.2 Por lo tanto: 22 Jorge Carlos Carrá Ia Una variable – Suceso poco común: criterio con probabilidades S X=x p(x) NN NL LN LL 0 0.8(0.8) 1 0.8(0.2)2 2 0.2(0.2) Figura 3-14 Distribución de x E(x)=0.40 V(x)= 0.32 Problema resuelto 3.5 Demanda de nafta La función densidad de una variable que representa la demanda semanal de nafta de una estación de servicio (en miles de litros) es: ⎧2 x 0 ≤ x ≤ 1 f ( x) = ⎨ ⎩0 en otro lugar Obtener a) la F(x), b) la esperanza y la varianza, c) la P(0.5< X < 0.8). a) x F ( x) = P( X ≤ x) = ∫ 2 xdx = x 2 0 b) 1 E ( X ) = ∫ x (2 x ) dx = 2 / 3 0 V ( X ) = E( X 2 ) − ( E( X )) 2 1 E ( X ) = ∫ x 2 (2 x)dx = 1/ 2 2 0 V ( X ) = 1/ 2 − (2 / 3)2 = 1/18 c) 0.8 P(0.5 < x < 0.8) = 2 ∫ 2 xdx = x 0.5 0.8 0.5 = 0.39 Suceso poco común: criterio con probabilidades La identificación de sucesos poco comunes ya fue presentada en el capítulo 1, en el cual se utilizaron: Criterio del diagrama de caja Este criterio hace uso de los valores extremos a más de 1.5(AIC), página outliers1. Criterio del intervalo z Este criterio solo hace uso de la media y de la desviación estándar de la distribución de probabilidades, página reglaintervalo1. 23 Capítulo 3 Distribuciones de Probabilidades Veamos ahora otro criterio para una identificación más precisa, pues utiliza las colas de la distribución de probabilidades. Criterio con probabilidades Si bajo determinados supuestos, existe una probabilidad extremadamente pequeña de obtener resultados al menos tan extremos como los observados, debemos concluir que el suceso es poco común y por lo tanto los mencionados supuestos probablemente no sean correctos. Ampliaciones 1. La expresión " resultados al menos tan extremos como los observados" es equivalente a decir "resultados dentro de la cola de la distribución" a partir del valor observado2. 2. Esta probabilidad extremadamente pequeña que se sitúa en las colas de la distribución, se llamará valor p en el capítulo 5, constituyendo un aspecto esencial de una prueba de hipótesis. Este valor p se combina con los valores máximos convencionales, llamados comúnmente valores α , usualmente 1% y 5% (página 14). A menos que se indique lo contrario adoptaremos α = 5% . Luego de estudiar la distribución normal (página 76), podremos concluir que los 2 últimos criterios coinciden si la distribución es normal y z = 2. Problema resuelto 3.6 Dados de distintos colores Se lanzan un dado rojo y otro negro. a) Hallar la distribución de x = suma de los 2 números, la media y la desviación estándar. Se observa que las probabilidades son simétricas respecto de la suma 7 y que estos valores siempre suman 14 (en el caso de 3 dados sucede lo mismo y los totales suman 21). ¿Por qué sucede esto? b) ¿Es un suceso poco común que se lance un par de dados y que la suma sea mayor a 11? a) 3 4 5 6 7 8 9 10 11 12 X=x 2 p(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 Figura 3-15 Distribución de x E(X)= 7 σ = 2.42 b) Si, es poco común pues la probabilidad es 2.77%, menor al 5%. Si sucede al azar, es lícito dudar de la confección de los dados. 2 Según el contexto puede interesar la cola derecha, la cola izquierda o ambas colas. Este aspecto se profundizará en el capítulo 5. Jorge Carlos Carrá 24 Ib Funciones de variables aleatorias (una variable) – Suceso poco común: criterio con probabilidades Ib Funciones de variables aleatorias (una variable) Muchas veces se conoce la distribución de probabilidad de una v.a. por ejemplo, X y se desea la distribución de probabilidad de otra variable Y, relacionada con X a través de: Y=H(X). Este es el objetivo de esta sección, para el caso de una variable. Más adelante en la sección IIb, se estudiará el caso de 2 o más variables. Llamaremos: f(x), F(x) y RX a la PDF, CDF y campo de valores de X, respectivamente. g(y, G(y) y RY a la PDF, CDF y campo de valores de Y, respectivamente. Eventos equivalentes Si X es una v.a. definida sobre el espacio muestral S y s es un elemento de S, se tiene que por cada s ∈ S , existe la relación: X ( s ) . Si además Y = H ( X ) , se verificará que y = H [ X ( s )] = Y ( s ) . Si la relación definida por H es inyectiva, los dos conjuntos, RX y RY, definidos por: {s | X (s) ∈ Rx } y {s | Y (s) ∈ RY } son iguales. Por lo tanto: P(Y ∈ RY ) = P( X ∈ Rx ) El esquema visual se presenta en la figura 3-16. H s P(s) X = P(xeRx) Y =. P(yeRy) Figura 3-16 Siendo RX el conjunto de valores de x asociado por la función H al conjunto Y ≤ y . Observar que aunque sea P(Y ∈ RY ) = P(Y ≤ y) = G( y) , P( X ∈ Rx ) no es en general P ( X ≤ x ) = F ( x ) (solo es cierto para una H creciente, como se intuye si se realizan gráficas de H tanto creciente como decreciente). 25 Capítulo 3 Distribuciones de Probabilidades Métodos Se divide el desarrollo, según sea una variable discreta o contínua. 1 Caso discreto Se tiene un solo método. Método de la PF g ( y) = P(Y = y) = P( H ( X ) = y) = P( X = H −1 ( y)) = P( X = x) = f ( x) Dado que la distribución no cambia, solo habrá que agrupar las probabilidades para los valores de y coincidentes. Problema resuelto 3.7 Transformación cuadrática Dada la siguiente PF en X y la transformación Y=H(X), hallar la PF en Y y el valor esperado E(Y). x -1 0 1 p(x) 0.20 0.30 0.50 y = x2 Figura 3-17 Método PF y p(y) 1 0.20 0 0.30 1 0.50 Agrupando valores: y 0 1 p(y) 0.30 0.70 E(Y) = 0.70 2 Caso contínuo Se tienen 3 métodos generales: 1. Método de la CDF 2. Método de la PDF 3. Método de la MGF (Función Generadora de Momentos, página 103) Método de la CDF Se obtiene la CDF, G(y), integrando f(x) en una región de integración RX, pues: G( y) = P(Y ≤ y ) = P( X ∈ RX ) = ∫ f ( x)dx RX 26 Jorge Carlos Carrá Ib Funciones de variables aleatorias (una variable) – Métodos Paso 1 Dominio de las x en función de las y Analítico Encontrar la región de integración RX en función de Y, a partir de Y ≤ y ⇒ X ≤ H −1 ( y ) . Esto implica resolver la inversa de H(x). Numérico Lo anterior se debe hacer en el dominio numérico de las X de la PDF, por lo cual se deberá obtener la correspondencia entre los dominios numéricos de las X (en la PDF) y de las Y (función H). Para esto bastará dibujar la función H(x). Paso 2 integrar f(x) en ese dominio Se obtiene la CDF, G(y), integrando f(x) en región anterior. Se remarca nuevamente que en el caso general, al despejar X, no necesariamente resulta una expresión del tipo P ( X ≤ x ) , en cuyo caso coincidiría con la F(x) (ver método de la PDF). Luego se podrá obtener la PDF, g(y), derivando G(y). Problema resuelto 3.8 Transformación cuadrática Dada la siguiente PDF en X y la transformación Y=H(X), hallar la PDF en Y. ⎧ x +1 −1 ≤ x ≤ 1 ⎪ f ( x) = ⎨ 2 ⎪⎩0 en otro punto y = H ( x) = x 2 Método de la CDF Paso 1 Dominio de las x en función de las y Analítico Implica hallar la inversa de H(x). Y ≤ y⇒ X2 ≤ y⇒− y < X < y Numérico Para obtener el dominio numérico de y, basta dibujar la función H(x) y establecer la correspondencia con el dominio de x de la PDF. De esta forma se obtiene: 0 ≤ y < 1 . Paso 2 Integrar f(x) en ese dominio ( ) G( y ) = P(Y ≤ y ) = P − y < X < y = ∫ y − y f ( x)dx = ∫ y − y x +1 ( x + 1)2 dx = 2 4 y − y Observar que la función H(x) solo aparece en los límites de integración. ( G( y) = ) − (− y +1 4 2 ) y +1 2 4 Finalmente, derivando la G(y) se obtiene la g(y). 27 Capítulo 3 Distribuciones de Probabilidades g ( y) = y +1 1 − y +1 1 1 + = 2 2 y 2 2 y 2 y ⎧ 1 0 ≤ y <1 ⎪ g ( y) = ⎨ 2 y ⎪0 en otro punto ⎩ Observar que las PDF (y CDF) de ambas variables son distintas entre sí. Nota Podría obtenerse una ecuación general válida para toda transformación cuadrática. Sea y = H ( x) = x 2 G( y ) = P(Y ≤ y ) = P( X 2 ≤ y ) = P(− y ≤ X ≤ y ) es decir: G( y) = F ( y ) − F (− y ) Por lo tanto: g ( y ) = G '( y ) = 1 ⎡ f 2 y⎣ ( y ) + f ( − y )⎤⎦ Si y = H ( x) = ax , se deja al alumno demostrar que si se opera en forma similar a este ejemplo, se obtienen: 2 ⎛ G ( y ) = F ⎜⎜ ⎝ 1 ⎡ g ( y) = ⎢f 2 ay ⎣⎢ ⎛ y⎞ y⎞ ⎟⎟ − F ⎜⎜ − ⎟⎟ a⎠ ⎝ a⎠ ⎛ y⎞ ⎜⎜ ⎟⎟ + ⎝ a⎠ ⎛ y ⎞⎤ f ⎜⎜ − ⎟⎟ ⎥ ⎝ a ⎠ ⎥⎦ Método de la PDF Continuamos con el desarrollo del método general anterior, para obtener una expresión más simple, pero válida solo si la función H es monótona (creciente o decreciente), lo cual no sucede en el problema resuelto anterior. −1 Si y = H ( x) entonces x = H ( y) . ( ) Si H es creciente: G ( y ) = P (Y ≤ y ) = P ( H ( X ) ≤ y ) = P X ≤ H −1 ( y ) = F ( x ) ( −1 ) Si H es decreciente: G ( y ) = P (Y ≤ y ) = P ( H ( X ) ≤ y ) = P X ≥ H ( y ) = 1 − F ( x) Estas relaciones pueden apreciarse claramente si se hacen gráficos de una función creciente y una decreciente. Si H es creciente: x G ( y ) = F ( x) = ∫ x f ( x)dx = −∞ ∫ f ( x) x ' dy −∞ En donde se utilizó la relación de contenidos (que se estudia en análisis matemático): dx = x ' dy Si se deriva la última ecuación surge finalmente que: g ( y ) = f ( x) x ' = 28 f ( x) y' Jorge Carlos Carrá Ib Funciones de variables aleatorias (una variable) – Métodos Si H es decreciente, se razona igual, pues al derivar G(y), se anula el término igual a 1. El resultado queda afectado por un signo – pero como x ' es negativo al ser H decreciente, pueden resumirse ambos casos con la expresión general: g ( y ) = f ( x ) | x ' |= f ( x) | y'| Esta relación que permite resolver el problema (solo para H creciente o decreciente) ya fue obtenida informalmente en la unidad 1, página CambioVar1. Como alternativa de demostración se podría derivar la relación G ( y ) = F ( x ) respecto de y: dG ( y ) dF ( x) dF ( x) dx dF ( x) x' = = = dy dy dx dy dy Finalmente observar que desde el punto de vista dimensional, tanto x ' como y ' cancelan la dimensión de f ( x ) y establecen la de g ( y ) . Nota Puede observarse que la diferencia en el desarrollo de ambos métodos se presenta cuando se despeja X de H ( X ) ≤ y dentro de la expresión probabilística. Solo resulta la expresión de F(x), si H es creciente o decreciente. En realidad, podría extenderse el desarrollo del método de la CDF en forma similar al seguido en el método de la PDF, obteniéndose así una expresión algo más compleja. Esto se realizó en el problema resuelto anterior, pero para no sobrecargar la memoria, es preferible integrar en cada caso. Problema resuelto 3.9 Transformación lineal Dada la siguiente PDF en X y la transformación Y=H(X), hallar la PDF en Y. ⎧2x 0 ≤ x ≤ 1 f ( x) = ⎨ en otro punto ⎩0 y = 3x + 1 La función H es monótona, por lo tanto puede aplicarse tanto el método CDF como el PDF. Método de la CDF Paso 1 y −1 ⎞ ⎛ G ( y ) = P (Y ≤ y ) = P (3 X + 1 ≤ y ) = P ⎜ X ≤ ⎟ 3 ⎠ ⎝ Paso 2 G( y) = ∫ ( y −1)/3 0 ⎛ y −1 ⎞ 2 xdx = ⎜ ⎟ ⎝ 3 ⎠ 2 Por lo tanto: g ( y ) = G '( y ) = 2 ( y − 1) 9 29 Capítulo 3 Distribuciones de Probabilidades Método de la PDF ⎛ y −1 ⎞ 1 2 g ( y ) = f ( x) x ' = 2 ⎜ ⎟ = ( y − 1) ⎝ 3 ⎠3 9 Método de la MGF La Función Generadora de Momentos, MGF se desarrollará al final de la sección Ic. Este método se basa en el teorema de unicidad que establece que si dos MGF son idénticas, entonces tienen la misma PDF. Por lo tanto se debe encontrar la MGF de Y y compararla con MGF de funciones conocidas, obteniendo así su G(y). Este método no se utilizará aquí. Métodos numéricos Valor esperado de Y Si la variable X es discreta con función de probabilidad p( x) : ∞ E (Y ) = ∑ H ( x ) p ( x ) −∞ Si la variable X es contínua con función densidad conjunta f ( x ) : ∞ E (Y ) = ∫ H ( x ) f ( x )dx −∞ La demostración de la ecuación anterior es difícil y solo la haremos para el siguiente caso particular. Y estrictamente creciente En este caso: ∞ ∞ −∞ −∞ E (Y ) = ∫ yg ( y )dy = ∫ ∞ yf ( x) dy = ∫ H ( x) f ( x)dx −∞ y' En donde se reemplazaron las expresiones: dy = y ' dx y = H ( x) 30 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Métodos numéricos Ic Modelos teóricos de una variable La mayoría de las veces las distribuciones utilizadas son modelos teóricos generales que ajustan a las distribuciones reales y cuyos valores estandarizados se encuentran en tablas o en programas de computación. Los modelos teóricos constituyen una herramienta que los científicos utilizan para comprender y explorar los procesos que se presentan en el mundo real. Los juguetes que todos usamos cuando niños, son modelos físicos que representan artículos del mundo adulto, con los cuales podemos desarrollar la imaginación, explorar y comprender mejor el mundo en la infancia. En esta sección realizaremos el estudio detallado de algunos modelos matemáticos que se presentan con frecuencia en la realidad. De esta forma se podrán sistematizar los cálculos y análisis, construyendo tablas y elaborando programas y ecuaciones que facilitan sus aplicaciones. Los modelos más importantes se presentan en la figura 3-18. Discretas Bernoulli Binomial Hipergeométrica Geométrica y Binomial Negativa Poisson Multinomial Multihipergeométrica Contínuas Constante Exponencial Gamma Normal t de Student chi cuadrado F de Fisher Figura 3-18 Modelos probabilísticos SPSS y EXCEL En el apéndice B se resumen todos los comandos necesarios para generar CDF, PDF y números aleatorios, con SPSS y EXCEL. SPSS PDF Devuelven la función matemática de la densidad de probabilidades para un determinado valor de x. Recordemos que SPSS llama PDF tanto a las PF de las distribuciones discretas como a las PDF de las continuas. CDF Devuelven la probabilidad acumulativa menor o igual a un determinado valor de x. Inversos Devuelven el valor de x para un valor dado de CDF. 31 Capítulo 3 Distribuciones de Probabilidades Significance Devuelven 1-CDF para un determinado valor de x. Random Numbers Devuelven números aleatorios de varias distribuciones. EXCEL Devuelven la PDF, CDF, el valor de colas o las Inversas, para varios casos. 1. Modelos discretos Con excepción de la distribución Geométrica y la distribución de Poisson, todos ellos se basan en el primer modelo, la distribución de Bernoulli. Distribución de Bernoulli, b(y,1,p) Supuestos También conocido como Proceso de Bernoulli. Se caracteriza por los siguientes 3 supuestos: Supuesto 1 Dicotómica Los eventos tienen dos resultados posibles, a los que llamaremos en forma genérica E (Éxito) y F (Fracaso), siendo uno de ellos la negación del otro. Luego podrán ser reemplazados por otros nombres más apropiados, como por ejemplo, C (Cara) y S (Seca), D (Defectuoso) y N (No defectuoso), etc. Este tipo de variable se denomina en estadística, dicotómica. Llamaremos: P(E) = p P(F) = q Cada uno de estos valores se asume constante al menos durante la duración del estudio. Supuesto 2 Variable Aleatoria Se busca la v.a Y = Número de Éxitos, en este caso solo puede tomar los valores 1 o 0 (cuando sea necesario diferenciarla de la distribución binomial, la llamaremos YB). Supuesto 3 Tamaño Las muestras tienen un tamaño n = 1 Proporción Muestral Es común definir una nueva variable llamada proporción muestral, simbolizada con un acento circunflejo y por esta razón llamada también "p sombrero": pˆ = Número ⋅ de ⋅ Exitos y = n n En la distribución de Bernoulli, ambos valores y y p̂ coinciden, pero no será así en la Binomial o Hipergeométrica. 32 Jorge Carlos Carrá Ic Modelos teóric cos de una va ariable – Distribución Bino omial, b(y,n,p p) PDF Tabla a S YB = yB p(yB) F E 0 0 q 1 1 p F Figura 3-19 Modeelo de Bernoullli Histograma F Figura 3-20 Modeelo de Bernoullli Carracteriz zación E (Y ) = μB = 0 ∗ q + 1∗ p = p V (Y ) = σ 2 B = q(− p)2 + p(q 2 ) = pq(( p + q) = pq Observvar que si p = 0.5, la distribbución es sim métrica, si p > 0.5, es sesgadda a la izquierda y si p < 0.5 0 es sesggada a la dereccha. Estos comportamientoos se mantien nen en la distrribución binom mial. Ejemp plos Extraccción de un ressultado en jueegos de azar, ruleta, dados, cartas, etc. Dis stribu ución Binom mial, b(y,n, b ,p) Sup puestos s La disttribución llam mada Binomiaal surge de la de Bernoulli,, alterando el supuesto 3, es e decir permitiiendo muestraas con n > 1 y agregando uuna nueva pro opiedad relaciionada con essta ampliaciónn. Capítulo 3 Distribuciones de Probabilidades Supuesto 1 Dicotómica Una v.a x tiene solo 2 resultados (dicotómica): E y F, nombres genéricos para Éxito y Fracaso, cuyas probabilidades p y q se mantienen constantes al menos mienras dure el estudio. Supuesto 2 Variable Aleatoria Se busca la v.a: Y = Número de Éxitos en la muestra de n elementos. Podría pensarse que la distribución depende de 2 variables: número de éxitos YE y de fracasos YF en la muestra, en cuyo caso sería una distribución bivariable. Sin embargo como la suma de ambas es conocida, YE + YF = n , dada una variable la otra deja de serlo dado que se puede despejar de esta relación. Esto no ocurre con las distribuciones multinomiales (página 129). Supuesto 3 Tamaño Las muestras tienen un tamaño n > 1. Supuesto 4 Independencia Esta propiedad establece la independencia de los n elementos del espacio muestral. Si por ejemplo llamamos E2 a un E en la extracción 2 y E1 a un E en la extracción 1, la definición de independencia implica: P( E2 | E1 ) = P( E2 ) Esta propiedad no es relevante para la distribución de Bernoulli, pero sí lo es para distribuciones en las cuales se toman muestras de n > 1. Para que exista independencia estadística, es decir que el resultado de cualquier observación sea independiente del resultado de cualquier otra observación, debe ser: MCR o N = ∞ a. muestreo con reemplazo, MCR, para cualquier tamaño (extracción de personas de un grupo) de tal forma que una nueva extracción se realice en las mismas condiciones que las anteriores, o b. población infinita para cualquier muestreo (juego de ruleta). En la práctica, se considera que una población es infinita si: n ≤ 5% N en donde n es el tamaño de la muestra y N es el tamaño de la población. Este criterio se justificará más adelante. En base a lo expuesto, una binomial se puede sintetizar con la notación: b( y, n, p) En la figura 3-21 se resume gráficamente el proceso. Figura 3-21 Se puede apreciar que todos los E se consideran indistinguibles entre sí y lo mismo se aplica a los F. 34 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Binomial, b(y,n,p) Relación con la distribución de Bernoulli Si por ejemplo n = 5 y el resultado fuera: EEEFE entonces y=4 Pero por otro lado, puede observarse que cada uno de los eventos es un modelo de Bernoulli, para los cuales cada variable aleatoria yB (números de E) toma los valores: 11101 Se observa entonces que: y = ∑ yB Suele utilizarse la notación iid para una sucesión de v.a. independientes e idénticamente distribuidas. Problema resuelto 3.10 Fiesta numerosa En una fiesta hay un 40 % de chicas (M) y un 60% de chicos (V). a) ¿Cuál es la probabilidad de que en un grupo de 3 personas elegida al azar haya 2 chicas. b) Construir el histograma con μ y σ. c) Hallar la probabilidad de que en el grupo extraído haya: al menos 2 chicas, más de 2 chicas, 1 chica o menos, al menos 2 varones. d) ¿Es poco común que en una elección al azar de 3 personas, resulten más de 2 mujeres? Observar formulaciones equivalentes de estas preguntas. Así por ejemplo la pregunta a) podría preguntarse así: si se elige un grupo de 3 personas ¿cuál es la probabilidad de que haya una proporción (muestral) de chicas igual a 2/3? Recorrido de las propiedades 1. Propiedad 1 Dicotómica La v.a tiene solo 2 resultados (dicotómica), V y M. P(M) = p = 0.4, P(V) = q = 0.6. 2. Propiedad 2 Variable Aleatoria Se busca la v.a: y = Número de Chicas (M). 3. Propiedad 3 Tamaño Las muestras tienen un tamaño n = 3 > 1 4. Propiedad 4 Independencia El problema da la probabilidad (porcentaje) de M y de V y no las cantidades de cada uno. Se debe interpretar entonces que la fiesta es numerosa en el sentido de que n = 3 es menor que el 5% de N (desconocido), por lo cual, a pesar de que el muestreo es sin repetición (muestreo simultáneo), se puede considerar que la probabilidad en la extracción de un joven no influye significativamente en la probabilidad de la extracción del siguiente. En otras palabras los valores de p y q se mantienen de extracción en extracción. Al tratar la distribución hipergeométrica de este mismo ejemplo, se apreciará la diferencia. a) P(Y = 2) = P(MMV ) = ppqP3 (2) = 0.288 b) 35 Capítulo 3 Distribuciones de Probabilidades Tabla S Y=y p̂ p(y)=p( p̂ ) 3V 2V1M 2M1V 3M 0 0 q3 0.216 1 0.333 3q2p 0.432 2 0.666 3qp2 0.288 3 1 p3 0.064 Figura 3-22 Modelo Binomial Histograma de probabilidades Figura 3-23 PDF Binomial Caracterización c) μ = 0(0.216) + 1(0.432) + 2(0.288) + 3(0.064) = 1.2 V (Y ) = ∑ py 2 − μ 2 = 2.16 − 1.22 = 0.72 σ = 0.848 P (Y ≥ 2) = 0.288 + 0.064 = 0.352 P (Y > 2) = 0.064 P (Y ≤ 1) = 0.216 + 0.432 = 0.648 La probabilidad de que haya al menos 2 varones, es equivalente a que haya a lo sumo 1 chica, es decir 0.648. d) La P(3M) = 6.4% > 5%, por lo tanto no sería un suceso poco común. SPSS Los valores de la PDF se obtienen directamente o por diferencia a partir de los valores CDF. Por ejemplo el valor de la PDF para y = 2, se puede obtener así: 36 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Binomial, b(y,n,p) Directamente PDF.BINOM(2,3,0.4)=0.288 Usando la CDF CDF.BINOM(2,3,0.4)-CDF.BINOM(1,3,0.4)=0.936-0.648=0.288 Expresiones generales PDF Demostración Generalizando las expresiones del problema resuelto anterior: b( y, n, p) = Pn ( y, n − y) p y q n− y y≤n Observar que: Pn ( y , n − y ) = Cny La expresión con combinaciones se interpreta considerando que el valor deseado es el número de y posiciones que se puede extraer de un total de n posiciones. El nombre de binomial, proviene de que cada p(y) es un término del binomio ( p + q) . n b( y, n, p) = Cn0 p 0 q n , Cn1 p1q n−1 ,..., Cnn p n q 0 Esta propiedad puede observarse claramente en la tabla de la figura 3-22. n n La suma de todos los términos es entonces ( p + q) = 1 = 1 . Notas • Si bien la distribución binomial puede obtenerse en forma mecánica de las ecuaciones anteriores, desaconsejo su utilización pues la relación tiempo-beneficio no es mucho más favorable que la construcción a partir de las relaciones probabilísticas tal como se realizó en el problema resuelto 3.10. Por otra parte, dado que no son muchas las distribuciones que permiten utilizar conceptos básicos en su construcción, aprovechemos la oportunidad de aquellas que si los brindan. • Cuando se dice que una v.a. y tiene una distribución determinada, por ejemplo binomial, se está indicando la ecuación que sigue su PDF, en este caso PDF ( y) = Pn ( y, n − y) p y q n− y . Expresión recursiva Si se opera sobre la ecuación de cálculo de la probabilidad binomial, se puede obtener en forma directa que: b( y + 1) = n− y p b( y ) y +1 q expresión que puede ser útil al calcular la distribución completa, pues obtiene el valor siguiente a partir de los valores anteriores. CDF r B(r , n, p) = ∑ b( y, n, p) y =0 Caracterización Media y Varianza En principio existen dos formas de deducir la media y la varianza de la distribución. La primera es aplicar las definiciones de la media y de la varianza a la PDF de la distribución, lo cual implica trabajar con las expresiones factoriales dentro de la sumatoria de los valores esperados y 37 Capítulo 3 Distribuciones de Probabilidades utilizar la propiedad de que ∑ p ( x) = 1 : La otra es vincular la distribución a otra con media y varianza conocidos. Por ser más simple, basaré las demostraciones siguientes en la propiedad que vincula a la Binomial con la de Bernoulli, de la que se conocen la media y la varianza. La relación entre ellas es: Y = ∑ YB Aplicando las conocidas propiedades de la media y de la varianza, ya recorridas anteriormente, resultan: μ = E (Y ) = ∑ E ( yB ) = np μ y = np V (Y ) = V (∑ YB ) = ∑V (YB ) = npq Por consiguiente: σ y = npq Estas expresiones para μ y para σ, resultan esta vez mucho más simples y rápidas que la aplicación de las definiciones generales. Modo Resulta de interés establecer la expresión del modo o valor más probable. Sea y = nE, la cantidad de éxitos para obtener la probabilidad máxima. En este caso debe cumplirse que: Cn nE −1 p nE −1q n−( nE −1) < Cn nE p nE q n−nE > Cn nE +1 p nE +1q n−( nE +1) Es decir: Cn nE p >1 y Cn nE −1 q Cn nE q >1 Cn nE +1 p Reemplazando las expresiones de cálculo de cada una de las combinaciones y simplificando, resultan: ( n − nE + 1) p >1 y nE q ( nE + 1) q >1 n − nE p Reagrupando, se obtiene finalmente: (n + 1) p −1 < nE < (n + 1) p Por lo tanto, el modo se encuentra en el máximo entero comprendido en (n+1)p. En símbolos (la expresión entre corchetes significa parte entera): nE = [(n + 1) p] Si, en particular el valor (n+1)p es entero, entonces existen 2 términos máximos: en (n+1)p y en (n+1)p–1. En este caso la distribución es bimodal. Si llamamos nF al número de fracasos y dado que nE+nF = n, se obtiene por reemplazo: nq − p + 1 > nF > nq − p 38 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Binomial, b(y,n,p) Proporción muestral Con la definición de proporción muestral (p sombrero), resultan: E ( pˆ ) = np =p n μ p̂ = p Esta expresión es intuitiva pues dice que la frecuencia esperada del evento ( E ( pˆ ) es p. Esto representa la primera verificación teórica de que existe una conexión entre la frecuencia esperada del evento y su probabilidad. Volvemos sobre este tema en el capítulo 4 al estudiar la ley de los grandes números. V ( pˆ ) = npq pq = n2 n σ p̂ = pq n Cualquier problema binomial, puede resolverse en forma indistinta con la variable "número de éxitos" o con "proporción de éxitos". En el capítulo de inferencia se presenta con más frecuencia, esta segunda alternativa. Los restantes modelos asociados con la distribución de Bernoulli, toman a la Binomial como referencia, manteniendo su supuesto 3 (tamaño > 1), surgiendo de la modificación de alguno de sus otros 3 supuestos. Las más importantes son: • Si se altera el supuesto 1, permitiendo variables multicotómicas, la distribución se llama Multinomial. • Si se altera el supuesto 2, cambiándolo por el Número de Pruebas hasta obtener el primer Éxito, la distribución se llama Geométrica o Binomial Negativa. • Finalmente si se altera el supuesto 4, cambiándolo por pruebas dependientes, la distribución se llama Hipergeométrica y en particular si se alteran los supuestos 2 y 4, la distribución se llama Hipergeométrica Negativa. Uso de tablas Los valores de la distribución Binomial pueden extraerse de paquetes de software como SPSS o EXCEL cuyas instrucciones se encuentran en el apéndice B. Alternativamente, aunque restringido a los valores más usuales, se puede hacer uso de tablas, tal como se muestra en el problema resuelto siguiente. Estas tablas relacionan valores de eje con probabilidades teniendo en cuenta los 2 parámetros de la distribución. Estas 4 magnitudes que se resumen en la siguiente notación: yCDF (n, p) Problema resuelto 3.11 Paquetes de una distribuidora El 30% de los paquetes de una distribuidora no están llegando a destino. Si se envían 10 paquetes, a) ¿Cuál es la probabilidad de que 3 no lleguen a destino? Observar una formulación equivalente de esta pregunta: Si se envían 10 paquetes ¿cuál es la probabilidad de que la proporción muestral de los que no lleguen a destino sea pˆ = 0.3 ? b) ¿Es poco común que más de 5 paquetes no lleguen a destino? a) Comprobar que se satisfacen las 4 condiciones binomiales. 39 Capíítulo 3 Distrib buciones de Probabilidade P es Se repro oduce en la fig gura 3-24 parte de la tabla Binnomial para n = 10, del Apénndice B. Esta taabla contiene laa CDF ess decir las probbabilidades acu umuladas. En laa columna del margen m izquierrdo se encuentrra el número de d Éxitos. En la columnaa p = 0.3, se enncuentran las accumulaciones en e orden desceendente, a mediida que aumennta el númeero de Éxitos. Así A por ejempllo el valor recuuadrado 0.65 ess la probabilidaad de que se enncuentren 3 o menos paquetes, p en unn envío de 10. Como la preguunta requiere el e valor de la prrobabilidad parra y = 3, deberáá realizarrse la cuenta P3 –P2. F Figura 3-24 Tabla disstribución Bino omial Es decirr: P3 − P2 = 00.65 − 0.383 = 0.267 b) La P(y >5) = 1–0.9953 = 0.047 <5%, ´por lo cuall es un suceso poco común y si sucede al azzar es lícito duddar de la tasa del 30%. SPSS S a) PDF.B BINOM(3,10, ,0.3)=0.267 Alternaativamente: CDF.B BINOM(3,10, ,0.3)-CDF.BINOM(2,10 0,0.3)=0.26 67 b) 1-CDF F.BINOM(5,1 10,0.3)=0.267 Dis stribu ución Hiperrgeom métric ca, h(y y,N,n,,k) Sup puestos s Es unaa modificación n de la Binom mial, en el suppuesto 4. Supue esto 1 Dico otómica Una v.a x tiene soloo 2 resultados (dicotómica)): E y F. Supue esto 2 Variiable Aleattoria Se busca la v.a: y = Número de e Éxitos. Supue esto 3 Tam maño Las muuestras tienen n un tamaño n > 1 Supue esto 4 Dep pendencia Los n elementos e del espacio mueestral son deppendientes. Paara que no exiista independdencia estadísstica, es decir que el resultaado de cualquuier observaciión sea depenndiente del ressultado de cualquier otra obserrvación, la población debe ser finita y el e muestreo deebe ser sin reeemplazo (es 40 Jorge e Carlos Carrrá Ic Modelos teóricos de una variable – Distribución Hipergeométrica, h(y,N,n,k) decir la negación de las condiciones de la binomial), de tal forma que una nueva extracción se realice en condiciones distintas a las anteriores. MSR ∧ N finita En estos casos, en lugar de proporcionar la probabilidad p, se debe dar el número de éxitos k antes de la primera extracción. Recordemos que la población se considera finita si: n > 5% N En base a lo expuesto, una hipergeométrica se puede sintetizar con la notación: h(y,N,n,k) El segundo término corresponde al tamaño de la población. Veremos luego que los 2 últimos, tamaño de la muestra y número de éxitos en la población, se pueden colocar en cualquier orden. Sin embargo el orden expuesto es coherente con el de una binomial b(y,n,p), utilizando el valor absoluto k en lugar del relativo p = k . N Problema resuelto 3.12 Fiesta no numerosa En una fiesta de 10 personas, hay 5 varones V y 5 mujeres M. Si se extraen 3 personas al azar, a) dibujar el histograma de x = números de M, con μ y σ. b) obtener la probabilidad de que sean al menos 2 M, c) hallar la probabilidad de que sean al menos 2 M sabiendo que hay al menos 1M, d) obtener la probabilidad de que sean 2M, si ya se eligió una M, e) hallar la probabilidad de que sean 2M sabiendo que hay al menos 1V, f) si se extrae un grupo de 6 personas, hallar la probabilidad de que haya al menos 5M. g) ¿Cuál es la diferencia si en la fiesta hay 600 chicos y 400 chicas? Observar que se satisfacen las 4 condiciones hipergeométricas. a) Se trata de una h(y,10,3,5). 41 Capítulo 3 Distribuciones de Probabilidades Figura 3-25 PDF Hipergeométrica h( y,10,3,5) = P3 (3) 5 43 5 54 5 45 5 43 + P3 (1, 2) + P3 (2,1) + P3 (3) 10 9 8 10 9 8 10 9 8 10 9 8 h ( y ,10, 3, 5) = 0.0833 + 0.416 + 0.416 + 0.0833 μ = 1.5 σ 2 = 0.0833 ∗ 1.5 2 + 0.416 ∗ 0.5 2 + 0.416 ∗ 0.5 2 + 0.0833 ∗ 1.5 2 = 0.583 σ = 0.763 b) P ( A) = 0.0833 + 0.416 = 0.499 c) P ( B | A) = 0.416 = 0.454 0.915 d) h(1,9, 2, 4) = P ( MV ) = 45 2 = 0.555 98 e) P( B | C ) = 0.416 = 0.454 00.833 + 0.416 + 0.416 f) p5 + p6 = 5 4321 + 0 = 0.004 10 9 8 7 6 g) En este caso la fiesta es numerosa en el sentido de que n = 3 es menor que el 5% de N, es decir 50, por lo cual se puede considerar que la probabilidad en la extracción de un joven no influye significativamente en la probabilidad de la extracción del siguiente. Si por ejemplo se extraen 3 personas, la probabilidad de que haya 2 mujeres es: P (Y = 2) = P ( MMV ) = 400 399 600 P3 (2) = 0.288 1000 999 998 Se observa que los valores de P(M) y de P(V) no difieren mayormente de 0.4 y 0.6. En otras palabras podría aproximarse la hipergeométrica a una binomial con estos valores de p y q: P(Y = 2) = P(MMV ) = ppqP3 (2) = 0.288 Esta similitud en los resultados es aceptable hasta n = 50 (5% N). Por arriba de este valor se considera que las fracciones se alejan apreciablemente del valor original. Por ejemplo la probabilidad de obtener 30 M y 1 V daría para la última M: 371/971 = 0.382, en lugar de 0.4 y para el V: 600/970 = 0.618, en lugar de 0.6. SPSS Ejemplo P(y=3)=PDF.HYPER(3,10,3,5)=0.0833 Alternativamente: P(y=3)=CDF.HYPER(3,10,3,5)-CDF.HYPER(2,10,3,5)=0.0833 Expresiones generales PDF Demostración Observando la figura 3-26 y utilizando el análisis combinatorio, se obtiene la siguiente expresión compacta de la función de probabilidad (pero, nuevamente menos instructiva): 42 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Hipergeométrica, h(y,N,n,k) h ( y , N , n, k ) = Cky C Nn −−yk C Nn y ≤ k n- y ≤ N −k Las desigualdades expresan que el número de Éxitos (o Fracasos) de la muestra debe ser, naturalmente, menor o igual al de la población. Figura 3-26 Comparar esta figura con la respectiva de la distribución binomial y observar las diferencias en los datos proporcionados en ambas poblaciones. La detección de estas diferencias elimina toda duda acerca de qué tipo de distribución se trata. Por otra parte, al resolver una hipergeométrica con las reglas de las probabilidades en lugar de hacerlo con la expresión combinatoria, anteriormente presentada, obliga a calcular las probabilidades sucesivas y por lo tanto informa al usuario acerca de la razonabilidad, o no, de usar una binomial como aproximación. Esta importante información se pierde con la expresión combinatoria. CDF r H (r , N , n, k ) = ∑ h( y, N , n, k ) y =0 Caracterización Si llamamos p0 a la probabilidad de éxitos inicial, es decir: p0 = k n Al igual que en la Binomial, existen dos formas de deducir la media y varianza de la distribución hipergeométrica. Aplicando las definiciones de la media y de la varianza a la PDF de la distribución o vinculando la distribución a otra con media y varianza conocidos. La primera implica trabajar con las expresiones factoriales dentro de la sumatoria de los valores p ( x) = 1 . Este camino requiere algún esfuerzo para esperados y utilizar la propiedad de que ∑ obtener las expresiones finales. La segunda es más simple y se presentará en la página 126 pues se deben utilizar herramientas de las distribuciones multinomiales. En cualquier caso las expresiones finales son: μ = np0 σ 2 = np0 q0 N −n N −1 El factor 43 Capítulo 3 Distribuciones de Probabilidades cpf = N −n <1 N −1 se denomina factor de corrección por población finita y diferencia a las expresiones de σ de la binomial y de la hipergeométrica. Observar que: • La cpf es menor que 1 por lo cual la varianza de la hipergeométrica es menor que la de la Binomial. • La cpf tiende a 1 cuando N tiende a infinito, como corresponde a su nombre y que es 0 cuando n = N, pues la dispersión es cero dado que la distribución solo conserva el término en el cual la selección de la muestra es igual a la población, con probabilidad 1. Como ya se ha dicho, una población se considera finita si n > 5% N . Debe puntualizarse que el muestreo con reemplazo, MCR, equivale a una población infinita y por lo tanto debe considerarse que N tiende a infinito en la ecuación anterior (obteniendo la expresión para una binomial). Proporción muestral Expresiones similares respecto de la proporción muestral, pueden obtenerse, recordando que: pˆ = y n Aplicando las propiedades de la media y de la varianza, se obtienen: μ pˆ = p0 σ p2ˆ = p0 q0 N − n n N −1 Aproximación de una hipergeométrica Como la independencia es la única diferencia entre las distribuciones binomial e hipergeométrica y esta propiedad está asociada al tamaño de la población, puede establecerse que una hipergeométrica se puede aproximar a una binomial si la población puede considerarse infinita, es decir: n<5%N Hipergeométrica Binomial Figura 3-27 Aproximación Hipergeométrica a la Binomial Distribución geométrica, g(y,p) Supuestos Es una modificación de la Binomial, en los supuestos 2 y 3. Supuesto 1 Dicotómica Una v.a x tiene solo 2 resultados (dicotómica): E y F. Supuesto 2 Variable Aleatoria Se busca la v.a: y = Número de Pruebas hasta obtener el primer Éxito. Supuesto 3 Tamaño Las muestras tienen un tamaño n variable que puede ser infinito. 44 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución geométrica, g(y,p) Supuesto 4 Dependencia Los n elementos del espacio muestral son independientes. Expresiones generales Observemos la siguiente tabla de la distribución para los primeros valores de y: S Y=y p(y) E FE FFE 1 p 2 pq 3 pq2 … … … Figura 3-28 Si llamamos x al número de fracasos antes de aparecer el primer éxito, puede observarse que el número de pruebas y, es igual al número de fracasos más 1: y = x +1 A partir de esta relación, obtenida la distribución de y se obtiene la de x. De la tabla se desprenden las siguientes expresiones: PDF Demostración Observando la figura 3-28 se obtiene la siguiente expresión general de la función de probabilidad. g ( y, p) = q y −1 p y ≥1 CDF r G (r , p ) = ∑ g ( y, p ) =P( y ≤ r ) = 1- P( y > r ) y =1 Por otra parte: ⎛ 1 ⎞ r P ( y > r ) = p (q r + r +1 +...) = p ⎜ q r ⎟=q ⎝ 1− q ⎠ Es decir, la cola de una distribución geométrica es siempre q r . Caracterización Media Aplicando la definición de la media a los valores de la figura 3-28, se obtiene: μ = E (Y ) = p(1 + 2q + 3q 2 + ...) = = p[(1 + q + q 2 + ...) + (q + q 2 + ...) + (q 2 + ...) + ...] Cada una de las expresiones entre paréntesis es una sucesión geométrica (de aquí proviene el nombre de la distribución), de razón q. Para proseguir debemos recordar que la suma de una sucesión geométrica de n términos cuyo primer término es a, y cuya razón es q, es: S =a 1 − qn 1− q Tomando el límite de esta suma, cuando n tiende a infinito, si q < 1 , resulta: 45 Capítulo 3 Distribuciones de Probabilidades S= a 1− q Aplicando esta expresión a nuestras sucesiones, se aprecia que los paréntesis finalmente resultan: ⎡1 q q2 ⎤ 1 1 = μ = p ⎢ + + ...⎥ = 1 + q + q 2 + ... = 1− q p ⎣p p p ⎦ Se tiene entonces que: μy = 1 p Una demostración alternativa es a partir de: ∞ E (Y ) = ∑ npq n −1 n =1 Utilizando la identidad: ∞ ∑ nxn−1 = n =1 d ⎛ ∞ n⎞ ∑x dx ⎜⎝ n=1 ⎟⎠ Si x < 1, entonces: d ⎛ ∞ n⎞ d ⎛ x ⎞ 1 x ⎟= ⎜ ∑ ⎟= ⎜ dx ⎝ n =1 ⎠ dx ⎝ 1 − x ⎠ (1 − x )2 Con lo cual se obtiene: ∞ E (Y ) = ∑ npq n −1 = p n =1 1 1 = 2 p (1 − q ) Aplicando la relación y = x + 1 , se obtiene la expresión de la media de x, el número de fracasos antes de aparecer el primer éxito: μx = q p Varianza Se puede demostrar que: V ( y) = q p2 Las varianzas de Y de X son iguales. Pérdida de la memoria Decimos que una v.a. Y no tiene memoria si: P (Y > s + t | Y > s ) = P (Y > t ) Veamos si se cumple para una distribución geométrica. P(Y > s + t | Y > s) = q s +t = q t = P(Y > t ) qs Esta ecuación dice que si se sabe que no se produjo ningún éxito hasta s, la probabilidad del primer éxito no depende de s. 46 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución geométrica, g(y,p) Las v.a. geométricas son las únicas v.a. discretas que no tienen memoria. Luego veremos que en las variables contínuas la misma propiedad la presenta la distribución exponencial (página 68). Problema resuelto 3.13 Auditorías con errores Un contador público ha encontrado que 6 de cada 10 auditorías contienen errores. ¿Cuál es la probabilidad de que: a) la primera contabilidad con errores sea la cuarta compañía revisada, b) la primera contabilidad con errores se produzca a partir de la sexta compañía, c) dibujar la PDF y la CDF, d) ¿Es poco común que la primera contabilidad con errores aparezca a partir de la sexta compañía revisada? a) g (4, 0.6) = 0.4003 (0.600) = 0.0384 b) 1 − G (4, 0.6) = = 1 − 0.600 − 0.4001 (0.600) − 0.400 2 (0.600) − 0.4003 (0.600) − 0.4004 (0.600) = = 1 − 0.98976 = 0.01024 De otra forma: P ( y > 5) = q r = 0.45 = 0.01024 c) PDF Figura 3-29 47 Capítulo 3 Distribuciones de Probabilidades CDF Figura 3-30 d) La P(y > 5) = 0.01024, por lo cual es un suceso poco común y si sucede al azar es lícito dudar de la tasa de compañías con errores. SPSS a) PDF.GEOM(4,0.6)=0.0384 b) 1-CDF.GEOM(4,0.6)=0.01024 Distribución binomial negativa o de Pascal, bn(y,r,p) Supuestos Esta ampliación de la geométrica es una modificación de la Binomial, en los supuestos 2 y3: Supuesto 1 Dicotómica Una v.a x tiene solo 2 resultados (dicotómica): E y F. Supuesto 2 Variable Aleatoria Se busca la v.a: y = Número de Pruebas hasta obtener r Éxitos. Supuesto 3 Tamaño Las muestras tienen un tamaño n variable que puede ser infinito. Supuesto 4 Dependencia Los n elementos del espacio muestral son independientes. Dado que, respecto de la binomial, el Número de Pruebas es ahora la variable y el Número de Éxitos está predeterminado, puede decirse que esta distribución es la opuesta de la binomial, de aquí el nombre. 48 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución binomial negativa o de Pascal, bn(y,r,p) Expresiones generales Observemos la siguiente tabla de la distribución para los primeros valores de y si r =2: S Y=y p(y) EE EFE 2 p2 3 EFFE 2 P2(1,1) p q 4 P3(2,1) p 2 q 2 EFFFE 5 P4(3,1) p 2 q 3 … … … Figura 3-31 Si llamamos x al número de fracasos antes de aparecer el k-esimo éxito, puede observarse que el número de pruebas y, es igual al número de fracasos más el número de éxitos: y = x+r A partir de esta relación, obtenida la distribución de y se obtiene la de x. De la tabla se desprenden las siguientes expresiones: PDF Demostración Observando la figura 3-31 se obtiene la siguiente expresión general de la función de probabilidad. bn( y, r , p ) = Py −1( y − r ,r −1) q y − r p r y≥r Se puede observar que solo cambia el coeficiente respecto de la binomial. Como de costumbre conviene razonar la obtención de la probabilidad con un diagrama de árbol en lugar de recordar esta expresión. CDF a Bn( a, r , p ) = ∑ bn( y, r , p ) y =r Caracterización Se puede ver que una distribución binomial negativa es una suma de k distribuciones geométricas. Si consideramos por ejemplo r = 3, un resultado genérico puede ser: FF…FE ..FF…FE FF…FE X1 X2 X3 Si llamamos: X1 = número de ensayos hasta el primer E, X2 = número de ensayos después del primer E hasta el segundo E, X3 = número de ensayos después del segundo E hasta el tercer E, entonces cada una de estas v.a. es geométrica y la variable Y3 = número de ensayos hasta el tercer E (v.a. binomial negativa), será: Y3 = X1 + X2 + X3 En general: r ybn = ∑ y g 1 De aquí, resultan: 49 Capítulo 3 Distribuciones de Probabilidades Media μy = r p μx = rq p Aplicando la relación y = x + k : Varianza V ( y) = rq p2 Las varianzas de Y de X son iguales. Relaciones entre las CDF Binomial y Pascal Pascal y Binomial Pascal Sea Y el número de pruebas de Bernoulli para obtener k Éxitos E con P ( E ) = p . Binomial Sea X el número de Éxitos E en n pruebas de Bernoulli con P ( E ) = p . a) 1 − CDF .NEGBIN ( n, r , p ) = CDF .BINOM ( r − 1, n, p ) b) CDF .NEGBIN ( n, r , p ) = 1 − CDF .BINOM ( r − 1, n, p ) Demostración a) Si se requieren más de n pruebas para obtener r E, deberá haber a lo sumo ( r − 1 ) E en estas n pruebas. b) Este caso resulta del anterior pasando a los eventos complementarios. Si se requieren a lo sumo n pruebas para obtener r E, deberá haber más de r E en estas n pruebas. Una forma equivalente de expresar estas relaciones es: P (Y > n) = P ( X < r ) P (Y ≤ n) = P ( X ≥ r ) Utilizando la notación con CDF se aprecia el intercambio de parámetros: el valor de n es el mismo en ambas y el de r disminuye en 1 en la binomial. A modo de ejemplo: 1 − CDF .NEGBIN (5, 4, 0.5) = CDF .BINOM (3, 5, 0.5) Las relaciones complementarias se obtienen restando de 1 en ambos lados. Se aprecia que llevan los mismos valores, intercambiando CDF por 1–CDF. CDF .NEGBIN (5, 4, 0.5) = 1 − CDF .BINOM (3,5, 0.5) Se observa entonces que la función acumulativa de una, equivale a la función significación de la otra. 50 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución binomial negativa o de Pascal, bn(y,r,p) Geométrica y Binomial Dado que la distribución geométrica es un caso particular de la de Pascal con r = 1, la relación anterior subsiste reemplazando r por 1. 1 − CDF .NEGBIN ( n,1, p ) = 1 − CDF .GEOM ( n, p ) = CDF .BINOM (0, n, p ) Análogamente: CDF .GEOM ( n, p ) = 1 − CDF .BINOM (0, n, p ) Este teorema puede utilizarse para calcular las CDF de una distribución de Pascal o Geométrica a partir de una Binomial. Problema resuelto 3.14 Gripe H1N1 Los empleados de su empresa son examinados para detectar la presencia del virus de la gripe H1N1. El hospital municipal le solicita que le sean enviados 4 empleados con pruebas positivas para profundizar los exámenes. Si el 45% de los empleados tienen pruebas positivas, a) encuentre la probabilidad de que se tengan que examinar a 10 empleados hasta encontrar 4 con pruebas positivas, b) dibujar la PDF y la CDF de Y = número de pruebas hasta obtener k = 4 E, c) ¿Es poco común que se tengan que examinar a menos de 5 empleados hasta encontrar 4 con pruebas positivas? a) bn(10, 4, 0.45) = P9(6,3) 0.5560.454 = 0.0953 b) PDF Figura 3-32 51 Capítulo 3 Distribuciones de Probabilidades CDF Figura 3-33 c) La P(y < 5) = 0.041 < 5%, ´por lo cual es un suceso poco común y si sucede al azar es lícito dudar de la tasa del 45%. SPSS a) PDF.NEGBIN(10,4,0.45)=0.0953 Problema resuelto 3.15 Falla de un motor La probabilidad de que falle un motor durante cualquier período de una hora es 0.3. Hallar la probabilidad de que funcione bien durante 3 horas (es decir que falle luego de 3 horas). Geométrica g(>3,1,0.3) Sea Y el número de intervalos de una hora hasta la primer falla. P (Y > 3) = 1 − P (Y ≤ 3) = 1 − ⎡⎣ 0.7 + 0.3(0.7) + 0.32 (0.7) ⎤⎦ = 0.027 Binomial bn(<1,3,0.3) Sea X el número de fallas dentro de una hora, en 3 horas. P( X = 0) = 0.33 = 0.027 52 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribuciones multinomial y multihipergeométrica Distribuciones multinomial y multihipergeométrica Por ser modelos multivariables se tratarán en la sección correspondiente en la página 129. Distribución de Poisson, p(y,λ) Supuestos Esta distribución modela una v.a que tiene los siguientes 4 supuestos. Supuesto 1. Variable Aleatoria y Se busca la v.a: Y=Número de casos E en un intervalo determinado (de tiempo, distancia, área, volumen, etc). Este número de casos podría ser, teóricamente infinito. A los efectos de normalizar la notación, usaremos la letra t para denotar al intervalo como si fuera de tiempo. Un ejemplo al cual aplicar cada una de las 4 propiedades podría ser la cantidad de errores cometidos por hoja en un libro. Supuesto 2. Un evento en dt La propiedad dice dos cosas: a) En un intervalo infinitesimal dt puede ocurrir como máximo un solo evento. En otras palabras la probabilidad de que ocurran 2 o más eventos en un intervalo infinitesimal dt es nula. P ( n, dt ) = 0 n > 1 b) la probabilidad de que ocurra un evento en un intervalo infinitesimal dt solo depende del ancho del intervalo. Frecuencia promedio ω ω= Cantidad de casos Intervalo Se asume que ω es constante. Observar que ω se mide en cantidad de eventos sobre la unidad del intervalo. Es importante realizar el cambio de unidades necesario para que el intervalo en el que se estudia y, sea el mismo que para ω. Promedio de eventos λ λ = ωt Observar que λ se mide en cantidad de eventos. Por lo tanto la propiedad 2b se puede expresar como: P (1, dt ) = ω dt Consecuencia Como consecuencia de a y b), la probabilidad de que no ocurra ningún evento en dt será: P(0, dt ) = 1 − ωdt Supuesto 3. n eventos en t Si los intervalos fueran iguales establece que la distribución de probabilidades es la misma en cada uno de ellos, lo cual significa que la probabilidad de que ocurran n Eventos en un intervalo t, 53 Capítulo 3 Distribuciones de Probabilidades depende solo de la extensión del intervalo (no de la posición del mismo)3. En el ejemplo anterior, la cantidad de errores cometidos depende solo del tamaño de la hoja y no de la posición de la misma. Supuesto 4. Independencia El número de casos m en el tiempo s es independiente del número de casos n en el tiempo t. P (( m, s ) | ( n, t )) = P ( m, s ) En el ejemplo, la cantidad de errores cometidos en la hoja 4 es independiente de la cantidad de errores en la hoja 2. Se supondrá la validez de las propiedades anteriores en los problemas de aplicación. En forma expresa serán utilizadas las 4 propiedades en la siguiente demostración de la ecuación de la distribución de Poisson. PDF La PDF de esta distribución es la siguiente: p( y, λ ) = e−λ λ y y≥0 y! Demostración La ingeniosa demostración que sigue es una excelente oportunidad para observar cómo se obtiene la expresión de la PDF de Poisson, utilizando los 4 supuestos anteriores y herramientas estándar de la teoría de las probabilidades y del análisis infinitesimal. Se parte de expresiones del supuesto 4, utilizando además el supuesto 3 al considerar que la probabilidad solo depende de n y del ancho del intervalo t. Por lo tanto las probabilidades de que sucedan 0, 1, …eventos en el intervalo t+dt son: P (0, t + dt ) = P (0, t ) P (0, dt ) P (1, t + dt ) = P (1, t ) P (0, dt ) + P (0, t ) P (1, dt ) P (2, t + dt ) = P (2, t ) P (0, dt ) + P (1, t ) P (1, dt ) + P (0, t ) P (2, dt ) etc. Se reemplazan todas las expresiones que contengan dt por las desarrolladas en el supuesto 2. Reemplazando P(0,dt): P (0, t + dt ) = P (0, t ) − P (0, t )ω dt P (1, t + dt ) = P (1, t ) − P (1, t )ω dt + P (0, t ) P (1, dt ) P (2, t + dt ) = P (2, t ) − P (2, t )ω dt + P (1, t ) P (1, dt ) + P (0, t ) P (2, dt ) Reemplazando P(1,dt) y P(2,dt): P (0, t + dt ) = P (0, t ) − P (0, t )ω dt P (1, t + dt ) = P (1, t ) − P (1, t )ω dt + P (0, t )ω dt P (2, t + dt ) = P (2, t ) − P (2, t )ω dt + P (1, t )ω dt Se forma un cociente incremental pasando el primer miembro del segundo miembro al primer miembro y dividiendo por dt. Se obtienen así las siguientes ecuaciones diferenciales lineales invariantes de primer grado: d ( P (0, t )) + ω P (0, t ) = 0 dt d ( P (1, t )) + P (1, t )ω = P (0, t )ω dt 3 Esta condición es probablemente la más inconveniente para modelar un proceso real por lo cual luego suele preferirse una generalización dando origen a los llamados procesos de Poisson no homogéneos. Jorge Carlos Carrá 54 Ic Modelos teóricos de una variable – Distribución de Poisson, p(y, ) d ( P (2, t )) + P (2, t )ω = P (1, t )ω dt Se puede observar que la expresión general de estas ecuaciones diferenciales es recursiva: yn '+ ω yn = ω yn−1 La primera es una ecuación homogénea y '+ ω y = 0 que se resuelve directamente por el método de αt los coeficientes indeterminados (sustitución de D´Alambert y = e ). Reemplazando en la siguiente se obtiene una ecuación del tipo y '+ ω y = u(t ) = ωe −ωt ecuación se puede resolver por el método de variación de parámetros: y = ϕ y H = ϕ e . Esta −ω t , el cual consigue reducir el término en la variable y, conduciendo a la ecuación: ϕ ' e = u(t ) . Las restantes ecuaciones se resuelven en forma similar por el método de variación de parámetros. Las soluciones de las mismas son, en sucesión: −ωt P(0, t ) = e−ωt P(1, t ) = ωte−ωt (ωt ) 2 −ωt P (2, t ) = e 2 La solución general se obtiene razonando por inducción, resultando: P( y, t ) = e− λ (λ ) y y! En definitiva: p( y, λ ) = e−λ λ y y≥0 y! Observar que esta ecuación depende naturalmente del y deseado y de λ (la expresión en y es una exponencial sobre un factorial), de aquí la notación general p(y,λ), para una distribución de Poisson. Expresión recursiva Si se opera sobre la ecuación de cálculo de la probabilidad de Poisson se puede obtener en forma directa que: e − λ λ y +1 p ( y + 1) λ y + 1! = −λ y = e λ p( y ) y +1 y! Por lo tanto: p ( y + 1) = λ y +1 p( y) expresión que puede ser útil al calcular la distribución completa, pues obtiene el valor siguiente a partir de los valores anteriores. CDF r P(r , λ ) = ∑ p( y, λ ) y =0 55 Capítulo 3 Distribuciones de Probabilidades Verificación PDF p( x) > 0 ∞ ∑ p ( x) = 1 −∞ Esta última propiedad se visualiza fácilmente recordando el desarrollo en serie de una expresión exponencial: eλ = 1 + λ + λ2 2! + λ3 3! ∞ + ... = ∑ 0 λk k! Caracterización Demostraremos analíticamente (la demostración elegida requiere algún conocimiento de series) que: μ =λ V (Y ) = λ Media La tabla de la distribución se muestra en la figura 3-34: 0 e-λ Y=y p(y) 1 λe-λ 2 λ e /2! 2 -λ 3 λ e /3! 3 -λ … ... Figura 3-34 Distribución de Poisson Por lo tanto: ⎛ μ = λ e− λ ⎜1 + ⎝ ⎞ 2λ 3λ 2 + + ... ⎟ = 2! 3! ⎠ Utilizando el desarrollo en serie de e λ , se tiene: μ = λ e − λ eλ Simplificando: μ =λ Varianza V (Y ) = E (Y 2 ) − μ 2 ⎛ 4λ 9λ 2 y 2 λ y −1 ⎞ E (Y 2 ) = λ e− λ ⎜1 + + +.+ ⎟= 2! 3! y! ⎠ ⎝ ∞ y 2λ y −1 = λ e−λ ∑ y! 1 Pero: y2 1 1 = + y ! ( y − 1)! ( y − 2)! Por lo tanto: ∞ y 2λ y −1 ∞ λ y −1 λλ y − 2 = + ∑1 y ! ∑1 ( y − 1)! ∑1 ( y − 2)! = = eλ + λ eλ ∞ Recordar que el factorial de un número negativo (en el segundo sumando aparece −1! ) es infinito. 56 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución de Poisson, p(y, ) En definitiva: E (Y 2 ) = λe−λ eλ (1 + λ ) = λ + λ 2 Reemplazando en la expresión de V(y): V (Y ) = λ + λ 2 − λ 2 Finalmente: V (Y ) = λ Ejemplos de procesos de Poisson Modela distribuciones de número de casos. Verificar que los siguientes ejemplos cumplen las 4 propiedades. • Número de llamadas telefónicas en un intervalo de t. • Número de vehículos que pasan en una autopista en un intervalo de t. • Número de nacimientos en una ciudad en un intervalo de t. • Número de fallas al azar en un componente en un intervalo de t. • Número de rayaduras de un vehículo en una superficie. • etc. Observar además que el número de casos en el intervalo no tiene un límite establecido (confrontar con las otras distribuciones anteriores). Problema resuelto 3.16 Preguntas a un consultor En promedio, 12 personas por hora hacen preguntas a un consultor. a) Hallar la probabilidad de que 3 personas lo hagan en un período de 10 minutos, b) dibujar el histograma de y = número de personas que preguntan cada 10 minutos, con el valor medio y la desviación estándar, c) hallar la probabilidad de que al menos 3 personas lo hagan en un período de 10 minutos, d) ¿Es poco común que más de 5 personas lo hagan en un período de 10 minutos? a) Verificar que el problema cumple las 4 propiedades de una distribución de Poisson. Luego se debe convertir la media al intervalo de 10 minutos. Una forma, es razonar transformando las unidades del intervalo de ω: ω= 12 p 12 p 1h 2p = = 1h 1h 6*10m 10m Luego Alternativamente, se puede utilizar la expresión λ=2 λ = ωt : λ = ωt = 12 ⎛ 1 ⎞ ⎜ h⎟ = 2 1h ⎝ 6 ⎠ En consecuencia: p (3, 2) = e −2 23 = 0.1804 3! b) El histograma se muestra en la figura 3-35 y la PDF en la figura 3-36. 57 Capítulo 3 Distribuciones de Probabilidades Figura 3-35 Figura 3-36 Distribución de Poisson μ =λ =2 V ( y) = λ = 2 σ = 1.41 c) Observando el histograma, P (Y ≥ 3) = 1 − P ( y ≤ 2) = 1 − (0.1353 + 0.2707 + 0.2707) En definitiva: P (Y ≥ 3) = 0.323 d) La P(y > 5) = 0.016 <5%, ´por lo cual es un suceso poco común y si sucede al azar es lícito dudar del promedio de 2 personas cada 10 minutos. 58 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución de Poisson, p(y, ) SPSS Por ejemplo el valor de cola superior para y ≥ 3, se obtiene de la siguiente manera: 1-CDF.POISSON(2,2)=0.323 Aproximación de una binomial Sea una distribución binomial y hagamos tender el tamaño de la muestra n a infinito con μ= np=λ constante. n(n − 1)(n − y + 1) ⎛ λ ⎞ ⎜ ⎟ n→∞ y! ⎝n⎠ lim Pn ( y, n − y) p y q n− y = lim n→∞ y ⎛ λ⎞ ⎜1 − ⎟ ⎝ n⎠ n− y Operando: n n −1 n − y + 1 λ n→∞ n n n y! lim y ⎛ λ⎞ ⎜1 − ⎟ ⎝ n⎠ n ⎛ λ⎞ ⎜1 − ⎟ ⎝ n⎠ −y Recordando que, cuando n tiende a infinito: −n/λ n ⎞ 1 ⎞ ⎛ λ ⎞ ⎛⎛ ⎟ ⎟ ⎜1 − ⎟ = ⎜ ⎜1 + ⎠ ⎝ n ⎠ ⎝ ⎝ −n / λ ⎠ −λ = e−λ Finalmente se obtiene: lim1 n →∞ λ y! y e− λ 1 O sea: e −λ λ y y! expresión del término general de la distribución de Poisson. Observar además que sien si en λ = np, n tiende a infinito, dado que λ es constante, p debe tender a 0, con lo cual queda establecida una indeterminación (en este caso la binomial tomará valores significativos solo para pequeños valores de y). En síntesis, una distribución binomial, tiende a una de Poisson, si n se hace suficientemente grande y p es chica (eventos raros), tal que su valor medio se mantenga constante. En la figura 3-37 se establece uno de los criterios para precisar los términos grande y chico. Otro criterio que da resultados aceptables es: n > 20 y p<0.05 . n>100 y p<0.1 Binomial Poisson Figura 3-37 Aproximación Binomial a Poisson Uso de tablas Si se cuenta con una computadora en la cual se ha instalado SPSS o EXCEL, se podrán obtener los valores de la distribución de Poisson, con las instrucciones que se encuentran en el apéndice B, en las secciones SPSS y EXCEL. Alternativamente, aunque restringido a los valores más usuales, se puede hacer uso de tablas, tal como las que se encuentran también en el apéndice B. Estas tablas 59 Capíítulo 3 Distrib buciones de Probabilidade P es relacio onan valores de d eje con prrobabilidadess y el parámeetro λ. Las 3 magnitudes m see resumen en la siguiennte notación: yCDF (λ ) Prob blema ressuelto 3.117 Errores en un libro Los auttores y editoress trabajan arduaamente para minimizar m el núm mero de errorees en un libro. Si S el número medio de d errores de 0.08 por capítullo, hallar la proobabilidad de que q haya menos de 2 errores en e un capítulo específi fico. Se repro oduce en la fig gura 3-38 parte de la tabla de Poisson, del Apéndice A B. Esta tabla contienne la CDF es decir d las probbabilidades acu umuladas. F Figura 3-38 Tabla disttribución de Po oisson En la prrimer columnaa se encuentra el e valor de λ. E En la fila superiior se encuentrra el número dee casos, y. En cualquier fila se encueentran las acum mulaciones de probabilidades p s de izquierda a derecha, a meedida que aumentta el número dee casos. Así poor ejemplo el vaalor recuadradoo 0.997 es la prrobabilidad de que se encuenttren 1 o menoss casos, para unn valor de λ = 00.08. Por lo tan nto la respuestaa es 99.7%. Dis seños s con tabla t de co onting gencia as Una tabbla de conting gencias condu uce a distintoos modelos dee probabilidadd, según se maantengan o noo fijos loos valores de los l marginalees, X, Y: 1. Maarginales X e Y fijos: distrribución hiperrgeométrica. 2. Unn marginal X (o Y) fijo: X distribucionees binomiales independienttes. 3. Tootal n fijo: disstribución multinomial conn tantas catego orías como ceeldas. 4. Ni marginales ni n total fijo: diistribución dee Poisson. Para ejemplificar veeamos el prim mer caso. 60 Jorge e Carlos Carrrá Ic Modelos teóricos de una variable – Diseños con tabla de contingencias Diseño hipergeométrico: prueba exacta de Fisher Sea la tabla de contingencias 2×2 que se muestra en la figura 3-39a, en la cual los niveles dicotómicos se han denominado genéricamente (E, F) y (0, 1). Asimilemos dicha tabla a la figura 3-26 de la página 43. Consideramos a la fila de totales como una "urna" con n esferas, de las cuales NE son E y NF son F. Observar que esta interpretación parte de mantener los marginales constantes. Se extraen simultáneamente n1 esferas, de las cuales un número a son E y un número b son F, se trata entonces de una distribución hipergeométrica definida por: h(a, N , n1 , N E ) Una interpretación similar podría haber sido realizada para la otra fila o por columnas (figura 3-39 b). E 1 0 F 1 a b n1 c d n0 NE NF N E F 0 a b c d n1 n0 a NE NF N b Figura 3-39 Si se conocen los marginales, basta conocer el valor de una celda para conocer toda la tabla. La distribución completa se genera con el conjunto de tablas que se construyen manteniendo constantes los valores marginales y variando el valor de y = a, desde 0 hasta el máximo del marginal menor (el cual se asigna por simplicidad a la celda a). Este límite se debe a que los totales marginales deben permanecer constantes y por lo tanto si una celda superara el marginal, la otra celda tendría que ser negativa, lo cual no es posible). La cantidad de tablas será el valor del marginal menor + 1 (pues se empieza desde 0). Propiedad 1 La media de esta distribución es: μ = np0 = n1 N E N Puede observarse que este valor no es otro que el valor que debe tener la celda pivote entre los marginales NE y n1 para que esa tabla contenga la condición de independencia entre las variables. Es decir que una de las tablas de la distribución contendrá la independencia, la cual será a su vez la media de la distribución de tablas. Naturalmente cualquiera de los valores de los coeficientes que miden el apartamiento de la independencia, crece a medida que las barras representativas de las tablas se alejan de la media. Esta interpretación se utiliza para generar un test de independencia alternativo al de χ2 para muestras chicas, llamado Fisher's exact test, o test de Fisher–Irwin, que se estudiará en el capítulo 5, página FisherExact5. Propiedad 2 Utilizando la simbología de la tabla de la figura 3-39, calculamos la h(a, N , n1, NE ) con la fórmula de la combinatoria. h(a, N , n1 , N E ) = CN E a CN F b CN N1 = N E ! N F !n1 !n0 ! N !a !b !c !d ! Este valor es, en esta interpretación, la probabilidad (hipergeométrica) de generar cada tabla para cada valor de y = a. 61 Capítulo 3 Distribuciones de Probabilidades Con la ayuda de esta notación, puede observarse la simetría de la expresión, de la cual resulta que es indistinto el orden de los 2 últimos parámetros de la ecuación, es decir: h(a, N , n1 , N E ) = h(a, N , N E , n1 ) La dama inglesa Una de las aplicaciones más famosas de la interpretación anterior es la protagonizada por una dama inglesa presente en una reunión en la que se encontraba el célebre matemático y estadístico Ronald Fisher. La dama era la bióloga Muriel Bristol, quién aseguraba que era capaz de detectar si en una taza de té con leche se había colocado primero la leche o primero el té. Fisher propuso que se realizara una prueba con 8 tazas de té con leche. En 4 de ellas se había colocado primero la leche y en las 4 restantes, primero el té. Esta información fue provista a la dama pero el orden en el que se le presentaron las tazas fue aleatorio. El resultado de la prueba fue el siguiente: Dama dice te leche Total realidad te leche Total 3 1 4 1 3 4 4 4 8 Figura 3-40 La pregunta es: ¿cómo puede detectarse si el resultado se debe a la habilidad de la dama o al producto del azar? Para responderlo debemos llegar al capítulo 5 (página damaFisher5), pero por el momento podemos al menos crear la distribución de todos los resultados posibles. El alumno no tendrá dificultades de obtener los valores hipergeométricos de la h(y,8,4,4) que se muestran en la figura 3-41. Figura 3-41 62 Jorge Carlos Carrá Ic Modelos teóricos de una variable – 2. Modelos contínuos 2. Modelos contínuos Excepto la distribución uniforme y exponencial, el resto de las distribuciones contínuas se resuelven con expresiones que requieren el cálculo diferencial, por lo cual se utilizarán exclusivamente tablas o programas informáticos, para el cálculo de sus valores. Distribución Uniforme, r(x,a,b) También se llama rectangular y es la distribución más simple. PDF Se define como: r ( x, a , b ) = 1 b−a a≤ x≤b siendo: a≤ x≤b Figura 3-42 PDF Distribución rectangular Verificación PDF f ( x) > 0 ∞ ∫ f ( x)dx = 1 −∞ Esta última propiedad se visualiza fácilmente reemplazando la función uniforme en la integral. CDF La expresión de la CDF será: R ( x, a , b ) = ∫ x a 1 dx b−a es decir: 63 Capítulo 3 Distribuciones de Probabilidades x−a ⎡ x ⎤ = R ( x, a , b ) = ⎢ ⎥ ⎣ b − a ⎦a b − a x R ( x, a, b) = x−a b−a Sin embargo resulta en la práctica más conveniente hallar, partir de los datos, la ecuación de la recta correspondiente. Figura 3-43 CDF Distribución rectangular Caracterización Media Aplicando la definición de la media: E( X ) = ∫ b a 1 1 (b 2 − a 2 ) xdx = b−a b−a 2 Por lo tanto: E( X ) = a+b 2 La media es el promedio de los valores extremos, conclusión que pudo obtenerse rápidamente por razones de simetría. Varianza Aplicando la definición de la varianza: V (X ) = ∫ b a 2 1 ⎛ a+b⎞ ⎜x− ⎟ dx b−a⎝ 2 ⎠ Operando: 64 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Uniforme, r(x,a,b) V (X ) = 3 3 1 ⎡⎛ b − a ⎞ ⎛ a − b ⎞ ⎤ − ⎢⎜ ⎟ ⎜ ⎟ ⎥ 3(b − a ) ⎣⎢⎝ 2 ⎠ ⎝ 2 ⎠ ⎦⎥ Por lo tanto: V (X ) = 2(b − a)3 (b − a) 2 = 3(23 )(b − a) 12 V (X ) = (b − a) 2 12 Nota Se deja al estudiante que obtenga la misma ecuación a partir de la expresión alternativa: 1 ⎛ b ⎞ V ( X ) = ⎜ ∫ x2 dx ⎟ − μ 2 a b−a ⎠ ⎝ Ejemplos de distribuciones rectangulares • • Equiprobabilidad Aplicaciones del principio de la teoría de las probabilidades conocido como "de la razón insuficiente" o "de la indiferencia", el cual establece que en condiciones de incertidumbre se asume la equiprobabilidad. Elección de un punto al azar. La distribución uniforme precisa la noción intuitiva de elección de un punto al azar, pues con esto se quiere decir que las coordenadas X de dicho punto están uniformemente distribuidas. Esta distribución origina los Números Aleatorios Uniformes, NAU y los problemas de muestreo aleatorio. Problema resuelto 3.18 Distribución uniforme Dada la distribución r(x,0,1), hallar la CDF (0.8,0,1), la media y la desviación estándar. 0.8 − 0 = 0.8 1− 0 0 +1 μ= = 0.5 2 12 V (X ) = = 0.0833 12 σ = 0.289 R (0.8, 0,1) = SPSS CDF.UNIFORM(0.8,0,1)=0.8 Problema resuelto 3.19 Espera del ómnibus Los ómnibus arriban cada 15 minutos después de la 07:00. Si un pasajero llega a la parada en un tiempo que está uniformemente distribuido entre 07:00 y 07:30, hallar la probabilidad de que tenga que esperar, a) menos de 5 minutos, b) más de 10 minutos. 65 Capítulo 3 Distribuciones de Probabilidades a) Sea X el tiempo en minutos que el pasajero debe esperar después de las 07:00. Para esperar menos de 5 minutos debe arribar entre 07:10 y 07:15 o entre 07:25 y 07:30. Por lo tanto: 15 30 10 25 P ( (10 < X < 15) + ( 25 < X < 30 ) ) = ∫ 1/ 30dx + ∫ 1/ 30dx = 1/ 3 b) Similarmente : 5 20 0 15 P ( ( 0 < X < 5) + (15 < X < 20 ) ) = ∫ 1/ 30dx + ∫ 1/ 30dx = 1/ 3 Distribución Exponencial, e(t,ω) Como es habitual que la variable aleatoria sea el tiempo, utilizaré a la letra t como simbología, en esta distribución (sea o no el intervalo un tiempo). PDF Se define como: e(t , ω ) = ωe−ωt 0 < t < ∞ donde: ω = parámetro. Si la variable aleatoria es el tiempo, ω es la frecuencia de casos. Se define además: β = 1 ω . Si la variable aleatoria es el tiempo, β es el período o también llamado MTBF, Tiempo Medio entre Fallas (Mean Time Between Failures). Figura 3-44 PDF Distribución exponencial 66 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Exponencial, e(t, ) Se observa que es una distribución asimétrica con sesgo positivo. CDF La expresión de la CDF será: t E (t , ω ) = ∫ ωe−ωt dt = 1 − e−ωt 0 Figura 3-45 CDF Distribución exponencial Propiedad de las colas exponenciales De la expresión de la CDF se desprende que: La cola de una distribución exponencial tiene siempre el valor e − ω t . Caracterización El alumno podrá obtener rápidamente con una integración por partes los valores de la media y de la varianza (esta última con la fórmula rápida). Media ∞ E (T ) =∫ ω te −ωt dt = 0 1 ω =β Varianza ∞ E (T 2 ) = ∫ ω t 2 e −ωt = 0 2 ω2 Por lo tanto: V (T ) = 1 ω 2 = β2 Ejemplo de distribución exponencial Modela el tiempo T1 hasta la primera falla, es decir la duración de un determinado elemento. 67 Capítulo 3 Distribuciones de Probabilidades Pérdida de la memoria Las v.a. exponenciales son las únicas v.a. contínuas que no tienen memoria y son el equivalente contínuo de las variables discretas geométricas (página 46). Un fusible o un cojinete de material con gran dureza son buenos ejemplos de elementos para los cuales esta propiedad suele cumplirse, pues no cambian mayormente con el uso y son tan buenos como nuevos. Decimos que una v.a. X no tiene memoria si: P (T > s + t | T > s ) = P (T > t ) Veamos si se cumple para una distribución exponencial. P (T > s + t | T > s ) = e −ω ( t + s ) = e −ωt = P (T > t ) −ω s e En particular para la variable exponencial T1, esta ecuación dice que si se sabe que no se produjo ninguna falla hasta s, la probabilidad a partir de ese tiempo no depende de s. Haciendo intervenir la CDF, resulta: 1 − F (s + t ) = P(T > t ) = 1 − F (t ) 1 − F ( s) Llamando G al complemento de F: G (t ) = 1 − F (t ) : P (T > s + t | T > s ) = G ( s + t ) = G ( s )G (t ) La única función que cumple esta propiedad es la exponencial, por lo cual la inversa de la propiedad anterior también es cierta: si una variable no tiene memoria, es exponencial. Distribución Gamma Primero debemos introducir la función Gamma. Función Gamma Está definida por: ∞ Γ(r ) = ∫ x r −1e − x dx r>0 0 Expresión recursiva Si integramos por partes diferenciando x r −1 , se obtiene: ∞ ∞ Γ(r ) = −e − x x r −1 − ∫ −e − x ( r − 1)x r − 2 dx 0 0 ∞ 0 + ( r − 1) ∫ e − x x r − 2 dx = ( r − 1)Γ(r − 1) 0 Por lo tanto: Γ (r ) = ( r − 1)Γ (r − 1) 68 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Gamma p es entero positivo Γ( r ) = ( r − 1)Γ ( r − 1) = ( r − 1)( r − 2)Γ( r − 2) = ( r − 1)(r − 2)...Γ(1) Como: ∞ Γ(1) = ∫ e − x dx = 1 0 resulta: Γ(r ) = (r − 1)! Por lo tanto la función Gamma es una generalización de la función factorial. Problema resuelto 3.20 Γ(1/2) Demostrar que: Γ (1 / 2) = π ∞ Γ(1/ 2) = ∫ x −1/2 e − x dx 0 Realizando el cambio de variable: x = u / 2 , se obtiene: 2 ∞ ∞ Γ(1/ 2) = 2 ∫ u −1e − u /2udu = 2 ∫ e − u /2 du 0 2 2 0 Se verá en el punto siguiente que (ver distribución normal): 1 2π ∞ ∫e − z 2 /2 dz = 1 −∞ Por lo tanto: ∞ ∫e − z2 / 2 dz = 0 1 2π 2 finalmente: Γ(1/ 2) == 2 2π = π 2 Distribución Gamma(x,r,α) Una X variable aleatoria no negativa sigue una distribución Gamma si su PDF es: ⎧ α (α x)r −1 e−α x ⎪ f ( x, r , α ) = ⎨ Γ ( r ) ⎪0 en otro lado ⎩ x>0 α >0 r>0 Tiene 2 parámetros r y α Al primero se lo llama de forma y al segundo de escala. A veces se suelen llamar α y β, respectivamente. 69 Capítulo 3 Distribuciones de Probabilidades Verificación PDF f ( x) > 0 ∞ ∫ f ( x)dx = 1 −∞ Esta última propiedad se visualiza fácilmente reemplazando la función Gamma en la expresión. En la siguiente figura se representan las PDF de la distribución Gamma para: α = 1, r = 1 y α = 1, r = 2. Figura 3-48 Caracterización Se demuestra analíticamente que: E( X ) = V (X ) = r α r α2 Exponencial Si r = 1, la PDF de la distribución Gamma es: f ( x) = α e−α x Por lo tanto la distribución exponencial es un caso particular de la Gamma con r = 1. Además α de la Gamma se convierte en ω de la exponencial. 70 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Gamma Relaciones entre las CDF de Gamma y Poisson Las siguientes relaciones se verifican si el parámetro r es un entero positivo. Gamma y Poisson Sabemos que la distribución Binomial y la distribución Binomial Negativa o de Pascal forman un conjunto de inversas. Binomial Número de Éxitos r para una muestra n Binomial negativa Tamaño de la muestra n para un número de éxitos r. Además la distribución Geométrica es un caso particular de la Binomial negativa con r = 1: Tamaño de la muestra n hasta el primer éxito. De forma similar, la distribución de Poisson forma un sistema de inversas con la distribución Gamma y la Exponencial es un caso particular de la Gamma con r = 1. Sea r un entero positivo. Sea T el tiempo requerido para observar r ocurrencias. Sea X el número de ocurrencias durante [0, t]. a) 1 − CDF .GAMMA(t , r , α ) = CDF .POISSON ( r − 1, t , α t ) b) CDF .GAMMA(t , r , α ) = 1 − CDF .POISSON ( r − 1, t , α t ) a) Esta relación significa que si se requiere más de un tiempo t para obtener r ocurrencias, deberá haber a lo sumo ( r − 1 ) ocurrencias en [0, t]. b) Este caso resulta del anterior pasando a los eventos complementarios. Si se requiere a lo sumo un tiempo t para obtener r ocurrencias, deberá haber más de r ocurrencias en [0, t]. Con otra notación, resultan: P(T > t ) = P( X < r ) P(T ≤ t ) = P( X ≥ r ) Observar que α de Gamma es ω de Poisson. Utilizando la notación CDF, se aprecia el intercambio de parámetros. Al igual que para la pareja Pascal-Binomial, en la pareja Gamma-Poisson, el valor de t se mantiene y el de r baja en una unidad en la de Poisson. Demostración Sean T una variable aleatoria Gamma y X una variable aleatoria Poisson. Utilizaremos la relación: ∫ ∞ a r e− x x r e− a a r dx = ∑ r! k! k =0 la cual se demuestra integrando sucesivamente por partes la integral: ∫ ∞ a e− x x r dx con: u = xr dv = e − x dx 71 Capítulo 3 Distribuciones de Probabilidades Si X tiene una distribución de Poisson con parámetro λ = ωt , entonces: e−λ λ k k! k =0 r −1 P( X < r ) = ∑ Reemplazando la sumatoria del segundo miembro por la integral anterior, se obtiene: − y r −1 − y r −1 ∞e y ∞e y e−λ λ k =∫ dy = ∫ dy λ ( r − 1)! ωt ( r − 1)! k! k =0 Cambiando la variable: y = ω s , r −1 P( X < r ) = ∑ ∞ P( X < r ) = ∫ ω t e −ω sω s r −1 ds = P( s > t ) (r − 1)! pues el integrando es una PDF, f(t) de tipo Gamma siempre y cuando r sea un entero positivo. En definitiva P (T > t ) = P ( X < r ) para T Gamma y X Poisson. Ejemplos CDF .GAMMA(3, 2, 0.5) = 1 − CDF .POISSON (1,1.5) , en donde 1.5 = 3*0.5 . 1 − CDF .GAMMA(3, 2,1.3) = CDF .POISSON (1,3.9) , en donde 3.9 = 3*1.3 . Exponencial y Poisson La relación anterior entre Gamma y Poisson se convierte entre Exponencial y Poisson, reemplazando r por 1. Por lo tanto resultan las expresiones, con α = ω : 1 − CDF .EXP(t , ω ) = CDF .POISSON (0, ωt ) CDF .EXP (t , ω ) = 1 − CDF .POISSON (0, ωt ) Ejemplo CDF .GAMMA(3,1, 0.5) = CDF .EXP (3, 0.5) = 1 − CDF .POISSON (0,1.5) en donde 1.5 = 3*0.5 Sin embargo explicitaremos una demostración que ampliaremos al tiempo entre ocurrencias. En un proceso de Poisson p(X, λ), denotamos: T1, el intervalo de tiempo hasta el primer evento, es decir para X = 1. T2 el intervalo de tiempo total hasta el segundo evento, es decir para X = 2. S12, el intervalo de tiempo entre el primer evento y el segundo evento. Distribución de T1 Bastará obtener la P(T1 > t ) . Para esto observamos que este evento ocurre si y solo si ninguno de los eventos del proceso de Poisson ocurre en el intervalo [0, t]. CDF = P(T1 ≤ t ) es la probabilidad de falla (al menos una vez) en [0, t] 1 − CDF = P(T1 > t ) es la probabilidad de no falla en [0, t] Por lo tanto: P (T1 > t ) = P ( X < 1) = P ( X = 0) = e−λ λ 0 = e − λ = e −ω t 0! Por consiguiente, recordando la propiedad de las colas exponenciales, T1 tiene una distribución exponencial con media β = 72 1 ω . Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Gamma Conclusión Las variables Número de Casos y Tamaño del Intervalo hasta el primer caso forman un sistema de inversas. La distribución que considera como variable al Número de Casos es Poisson y la que considera como variable al Tamaño del Intervalo hasta el primer caso es Exponencial. Distribución de S12 Bastará obtener la P( S12 > t | T1 = s) . Partimos de la siguiente identidad: P(S12 > t | T1 = s) = P( X = 0 eventos en (s, s + t ) | T1 = s) Por la propiedad de independencia: P( X = 0 eventos en ( s, s + t ) | T1 = s) = P(0 eventos en ( s, s + t )) Finalmente: P(0 eventos en (s, s + t )) = e−λ = e−ωt Por consiguiente S12 es también una variable aleatoria exponencial con media β = 1 ω . Observando las distribuciones de T1 y S12, podemos concluir en general que: La v.a. igual a la distancia T entre 2 casos sucesivos de un proceso de Poisson es exponencial. Problema resuelto 3.21 Distribución exponencial La distribución del tiempo de vida de un elemento de una computadora es exponencial con un MTBF = 560 h. Si llamamos T1 a la v.a. Tiempo antes de la primer falla (es decir la duración), hallar la PDF y la CDF, b) obtener P(T1 ≤ 280) , c) obtener P(T1 > 1120) , d) obtener P(280 < T1 < 1120) . a) PDF e(T1 ,1/ 560) = 1 − t /560 e 560 73 Capítulo 3 Distribuciones de Probabilidades Figura 3-46 CDF E (T1 ,1/ 560) = 1 − e−t /560 Figura 3-47 SPSS PDF.EXP(t,1/560) CDF.EXP(t,1/560) b) 1 Como exponencial P(T1 ≤ 280) = exp(T1 ≤ 280, ω ) = 1 − e−280/560 = 1 − e−0.5 = 0.3935 74 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Gamma Observar que el valor pedido es el complemento de la cola a partir de t = 280. 2 Como Poisson 280 = 0.5 560 P(T1 ≤ 280) = Poisson(Y > 0, λ ) = 1 − P(0,0.5) = 1 − e−0.5 = 0.3935 λ = ωt = c) 1 Como exponencial P(T1 > 1120) = exp(T1 > 1120, ω ) = e−1120/560 = e−2 = 0.1353 Observar que el valor pedido es la cola a partir de t = 1120. 2 Como Poisson 1120 =2 560 P(T1 > 1120) = Poisson(Y < 1, ωt ) = Poisson(0, 2) = e−2 = 0.1353 λ = ωt = d) P(280 < T1 < 1120) = Exp(1120,1/ 560) − Exp(280,1/ 560) = = (1 − e−1120/560 ) − (1 − e−280/560 ) = 0.4712 Problema resuelto 3.22 Reparación de aviones Llega un promedio de 4 aviones a un hangar para su reparación, por cada período de 8 horas. a) Hallar la probabilidad de que la primera llegada no ocurra durante la primera hora, b) hallar la probabilidad de que la primera llegada ocurra dentro de la primera hora. a) λ= 4 = 0.5 8 Exponencial (t, ω) = (>1, 0.5) P(T > 1) = e−λ = e−0.5 = 0.606 Poisson (x, λ) = (<1, 0.5) P ( X = 0) = e−0.5 0.50 =0.606 0! b) Exponencial (t, ω) = (≤1, 0.5) P(T ≤ 1) = 1 − e−λ = 1 − e−0.5 = 0.394 Poisson (x, λ) = (≥1, 0.5) P ( X ≥ 1) = 1 − P ( X = 0) = 1 − 0.606=0.394 75 Capítulo 3 Distribuciones de Probabilidades Distribución Normal, n(z,0,1) Es una distribución tipo campana (ver figura 3-49) con la mayoría de los casos en el medio y los menos en los extremos. Con frecuencia se otorga el crédito de su descubrimiento al alemán Karl Friedrich Gauss o al francés Pierre Laplace, pero aunque no la dibujó, el francés Abraham De Moivre, fue el primero que calculó áreas debajo de esta curva. De Moivre era protestante y por esta razón tuvo que emigrar a Inglaterra en donde entabló amistad con Isaac Newton, de quién se dice que muchas veces contestaba preguntas diciendo: "pregúntele a Monsieur De Moivre, el sabe eso mejor que yo". Sin embargo como era extranjero, nunca logró la fama de los matemáticos británicos, con quienes De Moivre trabajaba y quienes tanto lo respetaban. La distribución Normal es además la distribución estadística más importante pues: • En varias técnicas estadísticas, es la distribución que se adopta como supuesto. • Varias distribuciones derivan de la Normal. • Varias distribuciones tienden a la Normal cuando n es suficientemente grande. En particular lo hacen las distribuciones de los promedios o de las sumas (Teorema Central del Límite, el cual será motivo de estudio en el capítulo 4). En la naturaleza se presentan con frecuencia comportamientos que son promedios o sumas de muchos factores pequeños e independientes entre sí, tal como los errores accidentales en las mediciones, los pesos y alturas de las personas, la hora de llegada de los estudiantes a una escuela, la cantidad de letras que una persona puede recordar al repetir la prueba, etc. Este comportamiento es bastante lógico pues es probable que estos factores ocurran por azar, con valores extremos que tienden a presentarse en forma equilibrada y por lo tanto con tendencia a cancelarse entre sí. Por esto son menos comunes las cantidades muy altas o bajas. Supuestos La demostración de la obtención de la ecuación de la PDF normal realizada por Gauss se basa en 4 supuestos de su teoría de errores. Llamamos: • M a la medición aleatoria, v al valor verdadero (desconocido) y x al error • x = M −v f ( x ) a la función densidad de probabilidades. Supuesto 1 Simetría Los errores de magnitud x y –x son iguales (son simétricos). Los errores no dependen de la orientación θ del sistema de coordenadas. f ( x) = f (− x) Supuesto 2 Promedio El valor más probable v de varias mediciones es el promedio. En otras palabras, Gauss elige entonces al mejor estimador de mínimos cuadrados de los datos (capitulo 1, página LSEMedia1). v=M = ∑M n Supuesto 3 Comportamiento Errores pequeños son más probables que errores grandes. Esto implica: max f ( x ) ⇒ x = 0 y por el supuesto 2, esto debe ocurrir en: v = M lim f ( x ) = 0 n →∞ 76 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1) Supuesto 4 Independencia Los errores son independientes. Entonces es válida la Regla del Producto, RP, para la distribución conjunta de los errores: f ( x) = f ( x1 ) f ( x2 )... f ( xn ) f ( x) = f (M1 − v) f (M 2 − v)... f (M n − v) PDF Nota Suelen denominarse ϕ a la PDF y Φ a la CDF. La expresión matemática para una variable sin estandarizar, es: 1 ⎛ x−μ ⎞ ⎟ σ ⎠ − ⎜ 1 ϕ ( x, μ , σ ) = f ( x , μ , σ ) = e 2⎝ σ 2π 2 σ >0 Observar que el exponente es un polinomio de segundo grado centrado en el vértice con el coeficiente del término cuadrático negativo. Se aprecia en esta ecuación que la distribución solo depende, además de la variable x, de la media μ y la desviación estándar σ. Una vez fijados los mismos, podremos calcular y graficar la ecuación. En este sentido se recomienda al estudiante que obtenga la gráfica de esta función, estudiando la misma (dominio, imagen, asíntotas, puntos de inflexión, máximos y mínimos). Se puede demostrar además que si x tiene una distribución normal y se realiza una transformación de variable a la variable z, la distribución de z, también es normal con media 0 y desviación estándar 1, por lo cual se usa la notación: n(z,0,1). De esta forma se obtiene una expresión que solo es función de z, lo cual permite su cálculo para cualquier combinación de μ y σ. f ( z) = 1 − z 2 /2 e 2π Esta expresión puede escribirse alternativamente como: f ( z) = 1 2π e z 2 La expresión de la función densidad transformada debe verificar la expresión vista en el capítulo 1 (página Escalamientoz1): f ( z ) = σ f ( x) Por lo tanto, reemplazando por ejemplo f(z) en esta relación, se puede despejar f(x), obteniendo la expresión del comienzo de esta sección. 77 Capítulo 3 Distribuciones de Probabilidades Figura 3-49 PDF Distribución Normal Recordemos además que cuando se dice que una v.a. z tiene una distribución determinada, por 1 − z2 /2 ejemplo normal, se está diciendo que PDF ( z ) = . e 2π Demostración Gauss La ingeniosa derivación de Gauss de la PDF de esta distribución utiliza los 4 supuestos anteriores y procedimientos estándar de cálculo. Definamos la función auxiliar: g ( x) = f '( x) f ( x) De acuerdo al supuesto 1, se obtiene: g (− x) = − g ( x) De acuerdo al supuesto 4, la distribución conjunta de los errores debe verificar: f ( x) = f ( x1 ) f ( x2 )... f ( xn ) De acuerdo al supuesto 3, v maximiza f(x) y por el supuesto 2 v = M , es decir: ∂f ( x) = ∂v = − f '( M 1 − M ) f ( M 2 − M )... f ( M n − M ) − 0= − f ( M 1 − M ) f '( M 2 − M )... f ( M n − M ) − ... ... − f ( M 1 − M ) f ( M 2 − M )... f '( M n − M ) Multiplicando y dividiendo por f(x): ⎛ f '( M 1 − M ) f '( M 2 − M ) f '( M n − M ) ⎞ = −⎜ + + ... + ⎟ f (M n − M ) ⎠ ⎝ f (M1 − M ) f (M 2 − M ) Es decir: g ( M 1 − M ) + g ( M 2 − M ) + ... + g ( M n − M ) = 0 78 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1) Como las mediciones M son arbitrarias, siendo M y N números reales arbitrarios, podemos poner: M1 = M M 2 = M 3 = ... = M n = M − nN Por lo tanto: M = M − (n − 1) N Reemplazando en la expresión de las funciones g: g (( n − 1) N ) + ( n − 1) g ( − N ) = 0 o también: g (( n − 1) N ) = ( n − 1) g ( N ) Esta propiedad define una función del tipo4: g ( x ) = kx Por lo tanto: f '( x) = kx f ( x) Integrando: k 2 x +c 2 ln( f ( x )) = Por lo tanto: k f ( x) = Ae 2 x2 Para cumplir el supuesto 3, la exponencial debe ser negativa, por lo cual podemos poner k = −h2 . 2 Laplace Una demostración distinta se debe al matemático francés Pierre Laplace (1810), la cual constituye el Teorema del Limite Central, TLC, que se estudiará en el capítulo 4. Verificación PDF f ( x) > 0 ∞ ∫ f ( x)dx = 1 −∞ Planteando el cuadrado de la integral I y pasando a coordenadas polares se observa que: ∞ I = 2 ∫e − h2 x2 −∞ ∞ dx ∫ e − h2 y 2 −∞ ∞ ∞ dy = ∫ ∫e − h2 ( x2 + y 2 ) 2π ∞ dxdy = −∞ −∞ ∫ ∫e 0 0 − h2 ρ 2 ρ d ρ dθ = 2π 2h 2 de donde: ∞ I= ∫e −∞ − h2 x2 dx = π h Por lo tanto la PDF será: 4 2 ag ( x ) = akx = g ( ax ) . Eso no se verifica para otra función como por ejemplo g ( x) = kx , pues ag ( x) = akx2 ≠ g (ax) = k (ax)2 . 79 Capítulo 3 Distribuciones de Probabilidades f ( x) = h π 2 2 e− h x Luego, al estudiar la caracterización de la función densidad normal, relacionaremos h con la desviación estándar. CDF Para obtener las áreas debajo de la curva anterior se debe integrar. Sin embargo esta integración no tiene una expresión explícita y se debe realizar el cálculo por integración numérica o en series. En el problema resuelto de página 83, se recorrerá la integración numérica. De todas formas, la buena noticia es que no será necesario utilizar estos procedimientos, pues los valores de esta distribución (estandarizada o no), se obtienen en general con algún programa de computación o de tablas. Figura 3-50 CDF Distribución Normal Caracterización Utilizaremos la siguiente relación. ∞ ∫e − h2t 2 π dt = h −∞ Media Para generalizar la función densidad, agregamos un término a dentro del exponente. h E ( x) = π ∞ ∫ xe − h2 ( x − a )2 dx −∞ Realizamos primero el cambio de variable x − a = t : = h π ∞ ∫ (a + t )e − h 2t 2 dt −∞ Utilizando la relación anterior: =a+ 80 h π ∞ ∫ te − h 2t 2 dt −∞ Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1) La segunda integral debe dar 0 pues el integrando es una función impar: g (t ) = − g ( −t ) . Por lo tanto: E ( x) = μ = a Varianza V ( x) = h π ∞ ∫ (x − μ) e 2 − h2 ( x − μ )2 dx −∞ Comenzamos nuevamente por realizar el cambio de variable x − μ = t : V ( x) = h π ∞ ∫t e 2 − h 2t 2 dx −∞ Integramos por partes, llamando: ⎧⎪u = t ⎨ − h 2t 2 ⎪⎩dv = te dx De esta forma se obtiene: h ⎡ t − h 2t 2 e = ⎢− π ⎢⎣ 2h2 ∞ + −∞ 1 2h2 ∞ ∫e −∞ − h 2t 2 ⎤ dt ⎥ ⎦⎥ Aplicando el teorema de L´Hopital a la indeterminación del primer término y utilizando la integral inicial para el segundo término: = h ⎡ 1 π⎤ 1 ⎢0 + 2 ⎥= 2 π ⎣ 2h h ⎦ 2h V ( x) = σ 2 = 1 2h 2 Observar que la varianza y h 2 se relacionan inversamente por lo cual se suele llamar precisión al valor h y que además el 2 aparece como coeficiente de cualquiera de los dos. Por lo tanto hemos encontrado la relación entre h y la varianza: h2 = 1 ⇒h= 2σ 2 1 2σ Reemplazando en la ecuación de Gauss los 2 parámetros encontrados, queda demostrada la ecuación de la función densidad normal. f ( x) = h π e − h 2 ( x − μ )2 1 ⎛ x−μ ⎞ σ ⎟⎠ − ⎜ 1 e 2⎝ = σ 2π 2 Además la relación inicial toma la forma: ∞ ∫e − z 2 /2 dz = 2π −∞ Nota La media y la desviación estándar en la variable z deben ser 0 y 1, cualquiera sea la distribución, como se demostró en el capítulo 1 (página Mediaz1). 81 Capíítulo 3 Distrib buciones de Probabilidade P es Pro opiedad des Puntto de inflexión Resolvviendo la ecuaación f ''( x ) = 0 , se obtienne que los punntos de inflexxión se encuen ntran en x = μ ±σ . Combinación lineal Si X1, ….,Xn son vaariables aleatoorias independdientes distribbuidas normaalmente, entonnces la combin nación lineal de ellas, tamb bién es normaal. Uso o de tab blas Si se cu uenta con unaa computadorra en la cual sse ha instaladoo SPSS o EXCEL, se podrrán obtener loos valoress de las áreas debajo de unna distribuciónn Normal, con n las instrucciiones que se encuentran e enn el apéndice B, en las secciones s SPS SS y EXCEL. Alternativam mente, aunquee restringido a los valores más ussuales, se puedde hacer uso de tablas, tal como las quee también se encuentran e enn el apéndice B. s contínuas reelacionan valores de eje con valores de área, es deccir Todas las tablas de distribucione d las 2 magnitudes m quue se resumen n en la siguiennte notación, en e donde α ess el área de laa cola superioor: zα En cadda problema se sugiere reallizar un diagrama de análissis , colocar eel valor que see obtiene de laa tabla y tener en cuennta, si se neceesitan, los vallores 0.5 de caada una de las 2 mitades de d la curva o 1 de toda laa curva. Prob blema ressuelto 3.223 Distrib bución normal n Se repro oduce en la fig gura 3-51 parte de la tabla Noormal, del Apénndice B. Esta ttabla contiene las l probabilidaades de cola superior para cada c valor de z. z F Figura 3-51 Tabla distribución d Normal (valoress de cola superiior) En la co olumna del maargen izquierdoo se encuentra eel valor de z haasta el primer ddecimal. El seggundo decimal se halla enn la primera fila. De esta form ma el recuadraddo 0.3015 correesponde a la prrobabilidad de cola superior al a valor z = 0.52. 82 Jorge e Carlos Carrrá Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1) Problema resuelto 3.24 Método de Sympson Hemos indicado que en estadística no será necesario utilizar la ecuación matemática de la función densidad de la distribución normal, pues los valores de la misma, se obtienen en general con algún programa de computación o de tablas. Sin embargo es saludable recorrer, al menos una vez, la determinación de los valores que se encuentran en la tabla. Dado que la integración de esta función densidad no tiene una expresión explícita (no hay ninguna primitiva cuya derivada de la función densidad), debe realizarse una integración numérica o la descomposición de la función en series. En este ejemplo he elegido el conocido método numérico de Sympson de aproximación de la curva con segmentos de parábola. Demostraremos que el valor que da la tabla para el área de la cola a partir de z = 0.4, es decir: 0.3446 (ver figura 3-52). Si llamamos S a este valor, se tiene: S = 0.5 − 1 2π 0.4 ∫e − z2 dz 0 Para calcular la integral definida, elijamos 4 intervalos con un ancho de intervalo h = 0.1. A partir de estas elecciones generamos la siguiente tabla: i 0 1 2 3 4 0 0.1 0.2 0.3 0.4 zi 2 e-zi 1 0.995 0.980 0.9559 0.923 Figura 3-52 Aplicando ahora la expresión de Sympson: 0.4 ∫e − z2 dz = 0 h ( E + 4I + 2P) 3 donde: E = suma de los valores extremos = 1.923 I = suma de los valores en posición impar = 1.9509 P = suma de los valores en posición par = 0.980 Por lo tanto: 0.4 ∫e − z2 dz = 0 0.1 (1.923 + 4(1.9509) + 2(0.980)) = 0.3896 3 Finalmente: S = 0.5 − 1 (0.3896) = 0.3446 2π Con lo cual hemos demostrado el valor de la tabla. Problema resuelto 3.25 Coeficiente de inteligencia Suponiendo que el coeficiente de inteligencia CI, se distribuye según una distribución normal con media 100 y desviación estándar 15: a) obtener el porcentaje de personas que tienen un CI entre 90 y 110, b) obtener el porcentaje de personas que tienen un CI mayor que 75, c) obtener el porcentaje de personas que tienen un CI entre 105 y 115. d) hallar el coeficiente de curtosis definido por AIC/AEP (capítulo 1, página curtosis1). e) ¿Es poco común que una persona tenga un CI mayor a 125? a) 83 Capítulo 3 Distribuciones de Probabilidades Transformación a valores z Para entrar a la tabla se debe estandarizar la n(x,100,15) en n(z,0.1). Esta conversión de la variable original x a la estandarizada z se puede realizar dentro o fuera de la ecuación probabilística. Método 1: dentro de la ecuación probabilística ⎛ 90 − 100 x − 100 110 − 100 ⎞ P (90 < x < 110) = P ⎜ < < ⎟= 15 15 ⎝ 15 ⎠ 110 − 100 ⎞ ⎛ 90 − 100 = P⎜ <z< ⎟= 15 ⎝ 15 ⎠ = P ( −0.667 < z < 0.667 ) = 1 − 0.2514 − 0.2514 = 0.497 Diagrama de análisis Figura 3-53 Diagrama de análisis Método 2: fuera de la ecuación probabilística 90 − 100 = −0.667 15 110 − 100 zs = = 0.667 15 zi = Por lo tanto: p = P ( −0.667 < z < 0.667 ) = 0.497 b) Transformación a valores z Proseguiremos con el formato fuera de la ecuación probabilística. z= 75 − 100 = −1.667 15 Diagrama de análisis Figura 3-54 Diagrama de análisis Por lo tanto: p = 1 − 0.0475 = 0.9525 = 95.25% c) Transformación a valores z 105 − 100 = 0.33 15 115 − 100 zs = =1 15 zi = 84 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1) Diagrama de análisis Figura 3-55 Diagrama de análisis Por lo tanto: p = 0.3707 − 0.1587 = 0.212 = 21.2% d) En todos los casos bastará obtener el valor z correspondiente a los siguientes valores de p (o de frecuencia relativa). Figura 3-56 Diagrama de análisis Para: p = 0.90, z = 1.2816 p = 0.10, z = -1.2816 p = 0.75, z = 0.6745 p = 0.25, z = -0.6745 Por lo tanto: AIC = 0.6745 − (−0.6745) = 1.35 AEP = 1.2816 − (−1.2816) = 2.56 AIC Curtosis = = 0.527 AEP e) La P(CI > 125) = 0.047 < 5%, ´por lo cual es un suceso poco común y si sucede al azar, o ha sucedido un evento muy infrecuente o es lícito dudar de los valores dados de la media y de la varianza. SPSS A modo de ejemplos: El porcentaje de personas entre CI = 110 y CI = 90 se obtiene a partir de los valores CDF de la siguiente manera: CDF.NORMAL(110,100,15)-CDF.NORMAL(90,100,15)=0.495 La AIC se obtiene de: IDF.NORMAL(0.75,0,1)-IDF.NORMAL(0.25,0,1)= 1.35 Nota Observar que en las distribuciones contínuas, la expresión PDF devuelve la función densidad y no una probabilidad, como en las distribuciones discretas. Regla empírica Utilizando la tabla o el SPSS, se obtienen los valores de probabilidad que se encuentran debajo de la curva normal para los intervalos -1< z <1, -2< z <2 y -3< z <3. 85 Capíítulo 3 Distrib buciones de Probabilidade P es -1< z <1 -2< z <2 -3< z <3 68% 95% 99% F Figura 3-57 Compaarar estos valo ores con los mínimos m posibbles, aplicanddo el teorema de Tchebysh heff (capítulo 1, página Tchevy1). Aprroximación de e una binomia b al y de e una Poisson Corre ección por continuida c ad, cpc La aprooximación dee una distribucción discreta por una contíínua, mejora ssi se amplía en e media uniddad cada vaalor, de tal foorma que el árrea de los recttángulos se coorresponda m más cercanameente con los de d la curvva normal En la figura f 3-58, see muestra porr ejemplo (utilizando por esta vez la nottación con parréntesis en lugar de subííndices), que:: b ( x = 2) → n (1.5 < x < 2.5) b ( x ≥ 2) → n ( x > 1.5) 1 b ( x > 2) → n ( x > 2.5) b ( x ≤ 2) → n ( x < 2.5) 2 b ( x < 2) → n ( x < 1.5) 1 En igual sentido, si en el eje se en ncuentra la prroporción muuestral, la cuall surge de div vidir cada valoor de x poor n, la cpc reesultará de sum mar o restar el e valor: 0.5 n Si por ejemplo, n = 60: la cpc esttablece que: P ( x ≥ 23) → P ( x > 22.5) P ( pˆ ≥ 23 23 0.5 ) → P ( pˆ > − ) 60 60 60 Para vaalores grandes de n, la cpc no se justificca. 86 Jorge e Carlos Carrrá Ic Modelos teóricos de una variable – Distribución Normal, n(z,0,1) Figura 3-58 CPC 1 Binomial a Normal En el capítulo 4 se verá que cualquiera sea la distribución de una v.a x, la sumatoria de x, sigue una distribución Normal si n, el número de términos de la sumatoria, tiende a infinito. Este teorema puede aplicarse a una binomial, pues esta distribución es en definitiva una sumatoria de una distribución de Bernoulli. Un criterio para realizar que esta aproximación asintótica sea adecuada, es: np ≥ 5 y nq ≥ 5 Algunos autores recomiendan adoptar el valor 15 en lugar del valor 5. Naturalmente bastará que se cumpla para el menor valor de p o q. Si lo desea puede interactuar con el applet: Aproximación de una binomial, que se encuentra en la dirección electrónica de la bibliografía bajo el título Simulaciones. Problema resuelto 3.26 Estudiantes promocionados El 52% de los estudiantes ha promocionado la materia estadística (evento E). Si se seleccionan aleatoriamente a 40 estudiantes, ¿cuál es la probabilidad de que la mayoría haya promocionado la materia estadística? Propiedades binomiales 1. Propiedad 1 Dicotómica Una v.a x tiene solo 2 resultados (dicotómica), E y E' (el apóstrofo significa no E) 2. Propiedad 2 Variable Aleatoria Se busca la v.a: y = Número de alumnos E. P(E) = p = 0.52, P(E') = q = 0.48. 3. Propiedad 3 Tamaño Las muestras tienen un tamaño n = 40 > 1 4. Propiedad 4 Independencia Se supone una población suficientemente grande como para que la probabilidad en la extracción de un joven no influye significativamente en la probabilidad de la extracción del siguiente. Es decir se considera que n < 5%N. Por lo tanto es una binomial b ( y , 40, 0.52) El resultado exacto es: P ( y > 20) = 1 − CDF .BINOM (20, 40, 0.52) = 0.538 Condición de aproximación nq = 40 ∗ 0.48 = 19.2 ≥ 5 Por lo tanto la binomial se puede aproximar con la normal n ( y , 20.8, 3.16) El resultado aproximado (con cpc), es: P ( y > 20.5) = 1 − CDF .NORMAL(20.5, 20.8, 3.16) = 0.538 2 Poisson a Normal Considerando la distribución de Poisson como un límite de la Binomial ( λ = np ) para n tendiendo a infinito (página 59) y sabiendo que además bajo estas condiciones la Binomial tiene a una Normal, concluimos que la distribución de Poisson se aproxima a una Normal, para valores grandes del promedio λ. El criterio práctico para realizar una aproximación adecuada, debe ser consistente con los criterios de 87 Capítulo 3 Distribuciones de Probabilidades las aproximaciones Binomial-Poisson y Binomial-Normal (ver figura siguiente). Se adopta en general: λ > 10 Síntesis Si reunimos estas dos nuevas aproximaciones, con las dos ya vistas, obtenemos el cuadro general que se muestra en la figura 3-59, con los respectivos criterios de validez. Normal np y nq >5 n<5%N Hipergeométrica Binomial λ>10 n>100 y p<0.1 Poisson Figura 3-59 Aproximaciones entre distintas distribuciones Distribución t de Student, f(t,ν) Una distribución muy utilizada en estadística es la desarrollada por el matemático inglés William Gosset, alias Student. Gosset fue contratado por los fabricantes de la cerveza Guinnes en Dublin, para estudiar la forma en que la calidad de la cerveza fuera más estable. Para controlar la economía de la producción, se le impuso la condición de no utilizar grandes muestras. Gosset publicaba con el seudónimo de Student pues la cervecería impedía que sus empleados publicaran artículos que pudieran vulnerar el secreto industrial. Como veremos en el capítulo 4, su descubrimiento es la base del estudio inferencial para pequeñas muestras. PDF ⎛ t2 ⎞ f (t ,ν ) = f (0) ⎜1 + ⎟ ⎝ ν ⎠ ⎛ ν +1 ⎞ −⎜ ⎟ ⎝ 2 ⎠ ν ≥1 En el resto de las distribuciones utilizaremos el símbolo general de una función densidad (f) o de la función distribución (F) para evitar confusiones, pues, excepto para la normal, las distribuciones llevan el mismo nombre que el eje. Verificación PDF f ( x) > 0 ∞ ∫ f ( x)dx = 1 −∞ Esta última propiedad no se demuestra aquí. 88 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución t de Student, f(t, ) Grados de libertad Se aprecia en la ecuación que esta distribución, además de t, depende de otra variable simbolizada con la letra griega nu (ν), llamada grado de libertad. Esta variable estará presente en las 3 distribuciones que restan. Los grados de libertad son la cantidad de valores que son libres de variar, conocidos algunos parámetros de la distribución. Su cálculo se definirá en cada distribución, pero en general es función del tamaño de la muestra. En la figura 3-60 puede apreciarse que es una distribución simétrica y también de forma acampanada. Respecto de la distribución normal es platicúrtica (capítulo 1), es decir presenta más variabilidad. Sin embargo, a medida que aumentan los grados de libertad, la distribución t se aproxima a la normal. Figura 3-60 PDF Distribución t de Student CDF Figura 3-61 CDF Distribución t de Student Caracterización E (t ) = 0 ν ≥ 1 89 Capítulo 3 Distribuciones de Probabilidades V (t ) = ν ν −2 ν >2 Observar que, a diferencia de la distribución normal, la desviación estándar es algo mayor que 1, por lo cual es platicúrtica. Propiedades Suma o resta Si X1, ….,Xn son variables aleatorias independientes distribuidas con t de Student, entonces la combinación lineal de ellas, también se distribuye con t de Student. Relación con la chi-cuadrado En la distribución χ2 se verá que la siguiente variable, sigue una distribución t de Student con ν grados de libertad, la cual será utilizada extensamente en los capítulos siguientes: t (ν ) = x −μ s/ n Se observa que si bien la variable t no depende del grado de libertad, se usa la simbología t(ν) para expresar que la distribución de t si depende de ν (ver la anterior expresión de la PDF). El cálculo del grado de libertad está dado por: ν = n −1 Uso de tablas Si se cuenta con una computadora en la cual se ha instalado SPSS o EXCEL, se podrán obtener los valores de la distribución t de Student, con las instrucciones que se encuentran en el apéndice B, en las secciones SPSS y EXCEL. Alternativamente, aunque restringido a los valores más usuales, se puede hacer uso de tablas, tal como las que se encuentran también en el apéndice B. Se aprecia que, a diferencia de la normal, esta tabla solo devuelve algunos percentiles de cola superior. Estas tablas relacionan las 3 magnitudes: valores de eje, valores de área y grados de libertad, los cuales se resumen en la siguiente notación en donde α es el área de la cola superior: tα (ν ) Puede apreciarse que los valores de la t de Student se aproximan a una normal, aproximación que es satisfactoria para ν mayor que 30 (por lo cual las tablas generalmente terminan en este valor). Se puede verificar que la última fila de la tabla (infinitos grados de libertad) contiene los valores de la normal. Por otra parte, para un determinado valor de una cola, por ejemplo 0.05, los valores de t aumentan al disminuir los grados de libertad. Este comportamiento explica el hecho de hacerse cada vez más platicúrtica, pues al tener colas de igual área cada vez más alejadas, deberá hacerse menos alta en el centro (el área total debe ser siempre 1). Problema resuelto 3.27 Distribución t de Student Se reproduce en la figura 3-62 parte de la tabla t de Student, del Apéndice B. Esta tabla contiene los valores t para determinadas probabilidades de cola superior y de grados de libertad ν. En la columna del margen izquierdo se encuentran los grados de libertad y en la primera fila el valor de probabilidad de cola superior, llamado α. a) Hallar el valor t correspondiente a 6 grados de libertad y un α = 0.0125, b) hallar el coeficiente de curtosis definido por AIC/AEP (capítulo 1, página curtosis1), para 6 grados de libertad, c) hallar la cola superior para un valor t =2.015 y 5 grados de libertad. . 90 Jorge Carlos Carrá Ic Mod delos teóricos s de una varia able – Distrib bución chi cua adrado, f( F Figura 3-62 Taabla de valores t de Student (ccola superior) a) La resp puesta es el valoor recuadrado: 2.9687. b) Dado quue la tabla no es e suficientemeente completa, debe calcularsse con el SPSS S. c) La resp puesta es 0.05. SPSS S a) IDF.T(0.9875,6) )=2.97 b) AIC = IDF.t(0.7 75,6)- IDF.t(0.25,6) )= 0.7176-(-0.7176) = 1.4352 AEP = IDF.t(0.9 90,6)- IDF.t(0.10,6) )= 1.4398-(-1.4398) = 2.8796 Curtosiss = AIC = 0.498 0 AEP Valor menor m que 0.52 27 (correspondiiente a una disttribución mesoocúrtica), comoo era de esperaar al tratarse de una disttribución platiccúrtica. c) 1-CDF F.T(2.015,5 5)=0.0452 El valorr no es exactam mente 0.05 puees el valor de t en la tabla (2.0 015) se encuenntra redondeado o. Dis stribu ución chi cu uadrado, f((χ2, ν) Esta diistribución fue desarrolladaa por Karl Pearson, un mattemático inglés, a veces acclamado comoo el invento or de la ciencia estadística. Inventó adem más el cálculo o del coeficieente de correllación y acuññó los térm minos histogrrama y asimeetría. Fue am migo de Williaam Gosset, peero acérrimo enemigo e de Ronaldd Fisher (ver distribución d F El pacíficoo Gosset, amiigo de ambos,, estaba siemppre intentandoo F). suavizaar los problem mas entre elloos, sin éxito. PDF Es un caso c particulaar de la distrib bución Gamm ma con: α = 1// 2 r =ν / 2 f ( χ 2 ,ν ) = C donde: ( χ 2 )ν / 2−1 e χ 2 /2 ν ≥1 χ2 > 0 Capítulo 3 Distribuciones de Probabilidades C= 1 2 Γ(ν / 2) ν /2 Se aprecia en la ecuación que esta distribución, además de χ2, depende de otra variable simbolizada con la letra griega nu (ν), llamada grado de libertad. Para ν < 2, la distribución tiene al eje y como asíntota vertical y al eje x como asíntota horizontal (figura 3-63). Para ν ≥ 2, la distribución comienza en el origen y es sesgada hacia la derecha (figura 3-63). En cualquier caso el eje no toma valores negativos. A medida que aumentan, los grados de libertad la distribución se hace cada vez más simétrica y si ν > 100, se puede considerar normal. Figura 3-63 PDF Distribución chi cuadrado para ν ≥2 Verificación PDF f ( x) > 0 ∞ ∫ f ( x)dx = 1 −∞ Esta última propiedad resulta como caso particular de la distribución Gamma. 92 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución chi cuadrado, f( CDF Figura 3-64 CDF Distribución chi cuadrado Caracterización Reemplazando los valores particulares de los parámetros de la distribución chi cuadrado en la media y varianza de la distribución Gamma, se obtienen: E( χ 2 ) = ν ν > 1 V ( χ 2 ) = 2ν ν > 1 Propiedades Suma Si X1 y X2 son dos variables chi-cuadrado independientes con ν1 y ν2 grados de libertad, entonces la suma de ambas es también una variable aleatoria chi-cuadrado con ν = ν1 + ν2 grados de libertad. Cociente Se verá en la siguiente distribución. Relación con la distribución Normal Si Z1, ….Zn son variables aleatorias normales independientes, entonces la variable: n χ 2 (ν ) = ∑ zi 2 i =1 tiene una distribución chi cuadrado con ν = n grados de libertad. Observar que este tipo de expresiones son una forma contracta de expresar la ecuación probabilística: ⎛ n ⎞ P( χ 2 (ν ) > χα 2 ) = P ⎜ ∑ zi 2 > a ⎟ = α ⎝ i =1 ⎠ En lugar de la CDF superior podría haberse usado la CDF inferior. Caso particular: transformación cuadrática 93 Capítulo 3 Distribuciones de Probabilidades Si ν = 1, resulta un problema de cálculo de la PDF de la variable w = z 2 , si la PDF de la variable z es normal. Aplicando la relación de PDF para una transformación cuadrática (página 27), resulta: ( ) ( ) 1 ⎡ 1 − s /2 ϕ w + ϕ − w ⎤ = w−1/2 e ⎣ ⎦ 2 w 2π Dado que Γ (1 / 2) = π (página 69), observamos que w = z 2 tiene una distribución chi cuadrado. g ( w) = Por lo tanto: P( χ 2 (1) > χα 2 ) = P( z 2 > a) = α Desarrollando la expresión del segundo miembro: P( z 2 > a ) = P ( − a > z > a ) = α o también: P( z 2 > a) = P(− zα /2 > z > zα /2 ) = α Por lo tanto: P( χ 2 (1) > χ 2α ) = P(− zα /2 > z > zα /2 ) = α Esta relación se resume con la expresión: χα 2 (1) = zα / 2 2 En un lenguaje cercano al de la sintaxis del SPSS: sig .chisq ( x ,1) = sig .norm ( sqrt ( x ), 0,1) donde sqrt ( x) = x . Observar que la variable del eje de la función SIG de la normal es el cuadrado de la correspondiente a la variable de la función SIG de la chi-cuadrado. En la figura siguiente se presenta la gráfica de las PDF de estas funciones (coincidentes). La curva de la normal converge a la de la chi-cuadrado debido al escalamiento de su eje x con 94 Jorge Carlos Carrá x. Ic Modelos teóricos de una variable – Distribución chi cuadrado, f( Figura 3-65 Si en la ecuación de z se usa x , en lugar de μ: n χ 2 (ν ) = ∑ ( x − x )2 σ2 1 = s 2 (n − 1) σ2 con ν = n − 1 grados de libertad. Relación con la distribución t de Student x −μ t= donde se ha usado la relación σ x = σ n z χ2 ν = σx = s2 σ2 x −μ s n que se verá en la unidad 4. Esta expresión es en realidad la definición de una distribución t de Student que será utilizada a partir del capítulo 4, para modelar la distribución de medias en muestras pequeñas. Aproximación a una normal Si ν >100, la distribución χ2 se puede aproximar a una normal (con la media y desviación estándar anteriores). Es por esta razón que las tablas de χ2 usualmente llegan solo a ν = 100. Si χ2 se aproxima a una distribución normal, entonces s 2 = χ 2σ 2 n −1 también, con. ⎛ s 2 (n − 1) ⎞ E(χ 2 ) = E ⎜ ⎟ = n −1 2 ⎝ σ ⎠ de donde: E(s 2 ) = σ 2 Análogamente: ⎛ s 2 (n − 1) ⎞ V (χ 2 ) = V ⎜ ⎟ = 2(n − 1) 2 ⎝ σ ⎠ de donde: V (s 2 ) = 2 σ4 n −1 Uso de tablas Si se cuenta con una computadora en la cual se ha instalado SPSS o EXCEL, se podrán obtener los valores de la distribución χ2, con las instrucciones que se encuentran en el apéndice B, en las secciones SPSS y EXCEL. Alternativamente, aunque restringido a los valores más usuales, se puede hacer uso de tablas, tal como las que se encuentran también en el apéndice B. Estas tablas relacionan las 3 magnitudes: valores de eje, valores de área y grados de libertad, los cuales se resumen en la siguiente notación, en donde α es el área de la cola superior: χ 2α (ν ) 95 Capíítulo 3 Distrib buciones de Probabilidade P es Se apreecia que, debiido a que la distribución d ess asimétrica y por limitacioones de espaccio, solo devuelve algunos peercentiles. El valor máxim mo de ν es 100 0, pues a partir de este valoor, la N distribuución χ2 se approxima a la Normal. Prob blema ressuelto 3.228 Distrib bución χ2 Se repro oduce en la fig gura 3-66 parte de la tabla Chhi-cuadrado, deel Apéndice B. Esta tabla conntiene los valores χ2 para determinadas probabilidadess de cola superrior y de gradoss de libertad ν. En la co olumna del maargen izquierdoo se encuentrann los grados de libertad y en la primera fila el e valor de α de d cola supperior. Así porr ejemplo el vallor recuadradoo 1.64 es el valo or χ2 corresponndiente a 6 grados de libertadd y un α = 0.950. F Figura 3-66 Tabla de valores v chi cuaadrado SPSS S IDF.C CHISQ(0.05, ,6)=1.64 CDF.C CHISQ(1.64, ,6)=0.0503 Nota Para lass distribuciones χ2 y F, SPSS tiene también una sintaxis directa d para devvolver la cola superior: s sig.c chisq(1.64, ,6)=0.946 Dis stribu ución F, f(F F,ν1, ν2) Esta diistribución se debe al estaddístico inglés sir Ronald Fiisher, por la cual lleva su innicial (propueesta por el matemático m n norteamerican no George Sneedecor, con cuyo nombre ttambién se la asocia). Fisher fue contempo oráneo de Wiilliam Gosset (alias Studennt) y de Karl P Pearson. Fue probablement p te el más brillante de los miembros del cerrado ggrupo de estad dísticos británnicos. Influyeeron notableemente en su producción y en el desarroollo de poderrosas herramiientas metodoológicas, sus 14 1 años en n contacto con problemas reales, r en unaa estación expperimental aggrícola en Herrtfordshire, a 50 5 km al norte n de Lond dres. PDF Es un miembro m de la familia de distribuciones d s beta. 96 Jorge e Carlos Carrrá Ic Modelos teóricos de una variable – Distribución F, f(F, f ( F ,ν 1 ,ν 2 ) = CF ν 1 /2 −1 ⎛ ν1 ⎞ ⎜1 + ν F ⎟ 2 ⎝ ⎠ ⎛ ν +ν ⎞ −⎜ 1 2 ⎟ ⎝ 2 ⎠ ν 1 ≥ 1,ν 2 ≥ 1 donde: ν1 Γ(ν 1 +ν 2 ) / 2) ⎛ ν 1 ⎞ 2 C= Γ(ν 1 / 2)Γ(ν 2 / 2) ⎜⎝ ν 2 ⎟⎠ No debe confundirse el símbolo f usado para simbolizar la función densidad, del F usado para simbolizar la variable de la distribución F. Se aprecia en la ecuación que esta distribución, además de F, depende de otras 2 variables simbolizadas con la letra griega nu (ν), llamadas grados de libertad. Además se observa que la dependencia con ambos grados de libertad no es simétrica, por lo cualν1 y ν2 no pueden ser intercambiados (ver propiedad recíproca más adelante) Para ν1 ≤ 2, la distribución tiene al eje y como asíntota vertical y al eje x como asíntota horizontal. Para ν1 ≥ 2, la distribución comienza en el origen y es sesgada hacia la derecha. En cualquier caso el eje de la distribución F no toma valores negativos. Figura 3-67 PDF Distribución F Verificación PDF f ( x) > 0 ∞ ∫ f ( x)dx = 1 −∞ Esta última propiedad no se demuestra aquí. 97 Capítulo 3 Distribuciones de Probabilidades CDF Figura 3-68 CDF Distribución F Caracterización E(F ) = V (F ) = ν2 ν2 − 2 , ν2 > 2 2ν 22 (ν 1 +ν 2 − 2) , ν2 > 4 ν 1 (ν 2 − 2)2 (ν 2 − 4) Propiedades Relación con χ2 F (ν 1 ,ν 2 ) = χ 2 (ν 1 ) / ν 1 χ 2 (ν 2 ) / ν 2 Recordar nuevamente que esta expresión resume una ecuación probabilística del tipo CDF. ⎛ χ 2 (ν ) / ν ⎞ P( F (ν 1 ,ν 2 ) > a) = P ⎜ 2 1 1 > b ⎟ = α ⎝ χ (ν 2 ) / ν 2 ⎠ Esta relación es en realidad la definición de la distribución F que será utilizada en el capítulo 5 y es equivalente a la siguiente, ver página 95: F (ν 1,ν 2 ) = s12 / s22 σ 22 / σ 22 con los grados de libertad de la PDF dados por: ν1 = n1 − 1 ν 2 = n2 − 1 98 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribución F, f(F, Se observa que si bien la variable F puede no depender del grado de libertad, se usa la simbología F(ν1, ν2) para expresar que la distribución de F si depende de (ν1, ν2) (ver la anterior expresión de la PDF). Relación con t de Student F (1,ν ) = t (ν )2 Demostración χ 2 (1) z2 F (1,ν 2 ) = 2 = = χ (ν 2 ) / ν 2 1 n ( x − μ )2 ∑ ν2 1 σ 2 2 (x − μ) 2 2 ⎛ x−μ ⎞ 2 =⎜ ⎟ = t (ν 2 ) ⎝ s ⎠ σ2 s2 σ2 También podría haberse utilizado la relación: t = z χ2 ν . En forma similar al tratamiento visto en χ2, se desarrolla la expresión del segundo miembro: P(t 2 > a) = P(− a > t > a ) = α o también: P( F (1,ν ) > Fα ) = P(−tα /2 < t < tα /2 ) = α Esta relación se resume con la expresión: Fα (1,ν ) = tα /2 2 (ν ) Propiedad reciproca Permite calcular los puntos porcentuales de cola izquierda a partir de una tabla de cola derecha. FI (ν 1 ,ν 2 ) = 1 FS (ν 2 ,ν 1 ) En la figura 3-69, se puede observar el procedimiento. Para hallar el valor FI de cola inferior, se entra con valores invertidos de los grados de libertad y se invierte el valor de F cola superior. Por ejemplo: a = F0.05 (ν 1 ,ν 2 ) = 1 F0.95 (ν 2 ,ν 1 ) Siendo 0.05 y 0.95, valores CDF de la distribución. 99 Capítulo 3 Distribuciones de Probabilidades Figura 3-69 Propiedad reciproca Uso de tablas Si se cuenta con una computadora en la cual se ha instalado SPSS o EXCEL, se podrán obtener los valores de la distribución F, con las instrucciones que se encuentran en el apéndice B, en las secciones SPSS y EXCEL. Alternativamente, aunque restringido a los valores más usuales, se puede hacer uso de tablas, tal como las que se encuentran también en el apéndice B, para determinados valores de ν1 y ν2. Estas tablas relacionan las 4 magnitudes: valores de eje, valores de área y los 2 grados de libertad, los cuales se resumen en la siguiente notación, en donde α es el área de la cola superior: Fα (ν1 ,ν 2 ) Se aprecia que, debido a que la distribución es asimétrica y por limitaciones de espacio, solo devuelve algunos percentiles de cola superior. Afortunadamente, los de cola inferior se obtienen con la propiedad recíproca. Problema resuelto 3.29 Distribución F Se reproduce en la figura 3-70 parte de la tabla F, del Apéndice B. Esta tabla contiene los valores F para determinadas probabilidades de cola superior (α = 0.05 en este encabezamiento) y de grados de libertad ν1 (primera fila) y ν2 (primera columna). Así por ejemplo el valor recuadrado 4.12 es el valor F correspondiente a una cola superior de 0.05, 4 grados de libertad ν1 y 7 grados de libertad ν2. 100 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Distribuciones truncadas Figura 3-70 Tabla de valores F SPSS IDF.F(0.95,4,7)=4.12 CDF.F(4.12,4,7)=0.9499 Nota Para las distribuciones χ2 y F, SPSS tiene también una sintaxis directa para devolver la cola superior: sig.F(4.12,4,7)=0.05 Problema resuelto 3.30 Propiedad reciproca Obtener el valor F del límite superior de una cola inferior CDF = 0.05 con grados de libertad ν1 = 10 y ν2 = 5. Por la propiedad recíproca esto es equivalente al valor inverso del límite de cola superior 0.05 y grados de libertad ν1 = 5 y ν2 = 10. De la tabla que se muestra en la figura 3-70, se extrae el valor F = 3.33. Por lo tanto el valor buscado es: F= 1 = 0.3 3.33 SPSS IDF.F(0.05,10,5)=0.30 Estimador de Densidad Kernel, Kernel Density Estimate, KDE. En el capítulo 1, página kernel1, vimos los gráficos de Estimadores de Densidad Kernel, KDE, construidos con rectángulos. Estos gráficos se corresponden con la elección de una distribución uniforme la cual pesa todos los datos de igual forma, pero podría elegirse otra distribución. Entre ellas podemos citar: triangular, normal o gausiana y la epanechnikov (de tipo parabólico que pesa menos los extremos). En el apéndice A se brinda la sintaxis para obtener varias de ellas con el SPSS. Distribuciones truncadas Se desea convertir una distribución PDF f ( x ) que no es cero a la derecha de un punto x = r en otra que lo sea y se llamará distribución truncada hacia la derecha del punto r (sin considerarlo). La expresión de su CDF se obtiene calculando la probabilidad condicional dada la probabilidad P ( X ≤ r ) (ver figura 3-71), es decir: F (x | x ≤ r) = P ( X ≤ x) x≤r P( X ≤ r ) Por lo tanto su PDF en función de la PDF original, será: 101 Capítulo 3 Distribuciones de Probabilidades ⎧ f ( x) ⎪ f ( x | x ≤ r ) = ⎨ P( X ≤ r ) ⎪0 ⎩ x≤r x>r Figura 3-71 Análogamente, para una distribución truncada a la izquierda: ⎧ f ( x) ⎪ f ( x | x ≥ r ) = ⎨ P( X ≥ r ) ⎪ ⎩0 x≥r x<r Ejemplos Contínua Una PDF exponencial truncada a la izquierda de x = r , será: f (x | x ≥ r) = α e −α x e −α r Discreta Una PDF de Poisson truncada a la derecha de x = r será: P ( X = x) = C e− λ λ x x! con: C= 1 e− λ λ j ∑ j! j =0 r Por lo tanto: P( X = i) = λx x! 1 r ∑ j =0 λj x = 0,1,..., r j! Problema resuelto 3.31 Normal truncada a la izquierda El tiempo de vida de un componente está normalmente distribuido Con media 4 y varianza 4. Dado que esta variable no puede tomar valores negativos y la distribución normal asume valores positivos y negativos, no sería válida para X < 0. Si el valor de la probabilidad para X < 0 es despreciable, el modelo puede ser válido, pero si no lo es, se debe truncar a la PDF. En este caso: 102 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Momentos de orden n ⎛0−4⎞ P ( X < 0) = Φ ⎜ ⎟ = Φ ( −2) = 0.023 ⎝ 2 ⎠ Con este valor, el modelo sin truncar no es muy preciso, por lo tanto debemos truncar a la izquierda de X = 0, resultando: 1 1⎛ x−4⎞ exp − ⎜ ⎟ 2⎝ 2 ⎠ f ( x) = 2 2π Φ (2) 2 Momentos de orden n Los momentos de orden n vistos en el capítulo 1 (página momentosr), se generalizan tanto a variables discretas como contínuas. En las siguientes ecuaciones, la expresión con sumatoria corresponde a variables discretas y la expresión con integral a variables contínuas. Naturales ∞ ∞ −∞ −∞ a1 = E ( X ) = ∑ xp = ∞ ∫ xf ( x)dx = μ a2 = E ( X ) = ∑ x p = 2 2 −∞ ∞ an = E ( X ) = ∑ x p = n n −∞ Centrados ∞ ∫x 2 ∞ −∞ ∞ −∞ −∞ c1 = E ( X − μ ) = ∑ ( x − μ ) p = ∞ ∫ ( x − μ ) f ( x)dx = 0 f ( x)dx c2 = E ( X − μ ) = ∑ ( x − μ ) p = 2 2 −∞ −∞ ∫x ∞ ∞ n f ( x)dx cn = E ( X − μ ) = ∑ ( x − μ ) p = n n −∞ ∞ ∫ (x − μ) 2 f ( x)dx = σ 2 −∞ ∞ ∫ (x − μ) n f ( x)dx −∞ Función generadora de momentos, MGF m(t) Muchas distribuciones de probabilidades distintas tienen la misma media y varianza, pero si dos distribuciones tienen todos los momentos de orden n iguales (capítulo 1, página momentosr y sección anterior), entonces se puede demostrar que ambas distribuciones son idénticas. Se puede definir una función que contiene todos los momentos naturales de una distribución y por esta razón se llama Función Generadora de Momentos o MGF (Moment Generator Function), MX(t). Si la variable es discreta demostraremos que es: ∞ M X (t ) = E (etx ) = ∑ etx p ( x) −∞ Si la variable es contínua demostraremos que es: ∞ M X (t ) = E (etx ) = ∫e tx f ( x)dx −∞ Puede observarse que la MGF es simplemente el valor esperado de e tx . 103 Capítulo 3 Distribuciones de Probabilidades La notación M X (t ) expresa la dependencia con X y prepara la expresión para cuando se consideren 2 o más variables (como regla nemotécnica, del exponente de e tx , el valor t pasa al paréntesis de M y el valor x al subíndice). Demostración Desarrollaremos (Mc Laurin) tanto el primer miembro como el segundo y luego identificaremos ambas resultados. 1 Desarrollo del segundo miembro La expansión en series de e tx (desarrollo de Mc Laurin) es: etx = 1 + tx + (tx) 2 (tx)3 + + ... 2! 3! Realizaremos la demostración para una variable discreta (la de variable contínua es idéntica). ∞ ∞ ⎡ ⎤ (tx) 2 (tx)3 + + ...⎥ p( x) M X (t ) = E (etx ) = ∑ etx p( x) = ∑ ⎢1 + tx + 2! 3! −∞ −∞ ⎣ ⎦ Si los momentos ai son finitos se pueden intercambiar las sumatorias: ∞ ∞ −∞ −∞ = ∑ p( x) + t ∑ xp( x) + t2 ∞ 2 t3 ∞ 3 x p ( x ) + ∑ ∑ x p( x) + ... 2! −∞ 3! −∞ Finalmente: M X (t ) = 1 + ta1 + t2 t3 a2 + a3 + ... 2! 3! 2 Desarrollo del primer miembro El desarrollo de Mc Laurin de la función MX(t) es: M X (t ) = M X (0) + M X '(0)t + M X ''(0) t2 t3 + M X '''(0) + ... 2! 3! Es decir: M X (t ) = 1 + M X '(0)t + M X ''(0) t2 t3 + M X '''(0) + ... 2! 3! 3 Identificación Comparando ambos desarrollos, resulta: a1 = E ( X ) = M X '(0) a2 = E ( X 2 ) = M X ''(0) a3 = E ( X 3 ) = M X '''(0) ... ak = E ( X k ) = M X k (0) Nota Los momentos centrados se pueden obtener de los naturales aplicando la propiedad de transformación lineal que se verá luego. 104 Jorge Carlos Carrá Ic Modelos teóricos de una variable – Función generadora de momentos, MGF m(t) Problema resuelto 3.32 Obtención de MX(t) Hallar la MGF de las siguientes distribuciones: binomial, geométrica, uniforme, gamma, exponencial y normal. a) Binomial n n x ⎛n⎞ ⎛n⎞ M X (t ) = ∑ etx ⎜ ⎟ p x q n − x = ∑ ⎜ ⎟ ( pet ) q n − x x =0 x =0 ⎝ x ⎠ ⎝ x⎠ M X (t ) = ( pet + q ) n Verificar las ecuaciones de la media y de la varianza. Media M X '(t ) = n ( pet + q ) n −1 pet μ = M X '(0) = np Varianza Y = X −μ V ( X ) = E (Y ) 2 Si bien la propiedad de transformación lineal se verá en el punto siguiente, se puede operar constructivamente: M Y (t ) = E (e yt ) = E (e xt − μt ) = e− μt E (e xt ) = e − μt M X (t ) = e− μt ( pet + q ) n Hallando la primera derivada en t y luego la segunda, se obtiene (la expresión pe + q se reemplaza por (.) : t M Y ''(t ) = μ 2 e − μt − μ e − μ t n(.) n −1 et + pet (1− μ ) (1 − μ ) n(.) n −1 + pet (1− μ ) n(n − 1)(.) n − 2 pet Reemplazando t = 0 , q = 1 − p y simplificando, resulta: V (Y ) = M Y ''(0) = npq b) Geométrica n M X (t ) = ∑ etx q x −1 p = x =0 x p n qet ) ( ∑ q x=0 La suma de la serie es una serie geométrica y si restringimos los valores de t tal que por lo tanto: M X (t ) = o < qet < 1 , converge y p qet q 1 − qet M X (t ) = pet 1 − qet c) Poisson ∞ λ et ) ( e− λ λ x −λ M X (t ) = ∑ e =e ∑ x! x! x =0 x =0 y De la expansión en series de e , resulta. ∞ x tx 105 Capítulo 3 Distribuciones de Probabilidades = e − λ eλ e t M X (t ) = e ( ) λ et −1 d) Uniforme b etx dx b−a a M X (t ) = ∫ 1 ebt − e at ) ( t (b − a ) M X (t ) = t≠0 e) Gamma ∞ α −α x tx ∫ e (α x ) e dx = r −1 αr ∞ Γ(r ) ∫0 Haciendo el cambio de variable u = x (α − 1) M X (t ) = Γ( r ) 0 x r −1e − x (α −t ) dx ∞ ⎛ α ⎞ 1 r −1 − u =⎜ ⎟ ∫ u e du ⎝ α − t ⎠ Γ(r ) 0 r ∞ αr ⎛ u ⎞ ⎜ ⎟ ∫ (α − t )Γ(r ) 0 ⎝ α − t ⎠ como la integral es Γ ( r ) , M X (t ) = r −1 e −u du ⎛ α ⎞ M X (t ) = ⎜ ⎟ ⎝α −t ⎠ r f) Exponencial Es un caso especial de la Gamma con r = 1 . M X (t ) = α α −t t <α g) Chi cuadrado Es un caso particular de la distribución Gamma con α = 1/ 2 y r = ν / 2 . Por lo tanto. M X (t ) = (1 − 2t ) −ν / 2 h) Normal 1 N (0,1) ∞ M Z (t ) = tz ∫e −∞ 1 − z2 / 2 1 e dz = 2π 2π ∞ ∫e tz − z 2 / 2 dz −∞ completando cuadrados; = 106 1 2π ∞ ∫e ( − z / 2 −t / 2 ) 2 +t 2 / 2 dz −∞ Jorge Carlos Carrá Ic Modelos teóricos de una variable – Función generadora de momentos, MGF m(t) 2 et /2 = 2π ∞ ∫ 2 2e −u 2 −∞ et / 2 du = 2π 2 π = et 2 /2 M Z (t ) = e t 2 /2 2 N (μ ,σ ) Si bien la propiedad de transformación lineal se verá en el punto siguiente, se puede operar constructivamente: Y = μ +σ Z Por lo tanto: M Y (t ) = E (e yt ) = E (e μt +σ Zt ) = e μt E (eσ Zt ) = e μt M Z (σ t ) = e μt eσ M Y (t ) = e μt eσ 2 2 t /2 2 2 t /2 M Y (t ) = e μt eσ 2 2 t /2 Propiedades de la MGF Unicidad Si una distribución de probabilidades f(x) tiene una MX(t), ésta es única. Este teorema que adoptamos sin demostración, demuestra la afirmación realizada al principio en el sentido de que si dos distribuciones tienen los todos sus momentos iguales, es decir sus MX(t) iguales, entonces ambas distribuciones son idénticas. Esta conclusión será utilizada en el capítulo 4 para demostrar el Teorema Central del Límite, TCL. 1 Variable: Transformación lineal Y = aX + b aX + b t M Y (t ) = E (e( ) )) = ebt E (eatX ) M Y (t ) = ebt M X ( at ) La traslación b aparece como parte del exponente de coeficiente exponencial y el cambio de escala a como parte de la variable dentro del paréntesis. >1 Variables: Suma + independencia Se demuestra para 2 variables pero se extiende a más de 2. Z = X +Y M Z (t ) = E (e Zt ) = E ( e( X +Y )t ) = E ( e Xt eYt ) si además X e Y son independientes, = E (e Xt ) E (eYt ) = M X (t ) + M Y (t ) M Z (t ) = M X (t ) + M Y (t ) >1 Variables: Propiedad reproductiva (algunas distribuciones) Algunas distribuciones poseen la siguiente propiedad: la distribución de la suma es del mismo tipo que la de los sumandos. 107 Capítulo 3 Distribuciones de Probabilidades Poisson independientes ( ) ( ) λ et −1 M X (t ) = e 1 M Y (t ) = e λ2 et −1 Por lo tanto: M Z (t ) = M X (t ) M Y (t ) = e ( ) ( λ1 + λ2 ) et −1 Esta es la MGF de una distribución de Poisson con parámetro Se demuestra para 2 variables pero se extiende a más de 2. λ1 + λ2 . Normal independientes M z (t ) = M X (t ) M Y (t ) = exp( μ1t + σ 12t 2 / 2) exp( μ 2t + σ 2 2t 2 / 2) = exp ( ( μ1 + μ 2 )t + (σ 12 + σ 2 2 )t 2 / 2 ) Esta es la MGF de una distribución normal con media μ1 + μ2 y varianza σ 12 + σ 2 2 . Se demuestra para 2 variables pero se extiende a más de 2. Chi cuadrado independientes M Z (t ) = M X (t ) M Y (t ) = (1 − 2t ) − (ν1 +ν 2 )/ 2 Se demuestra para 2 variables pero se extiende a más de 2. Exponencial independientes Esta distribución no tiene la propiedad reproductiva pero tiene una similar: Si r distribuciones exponenciales tienen el mismo parámetro α, la distribución suma tiene una distribución Gamma con parámetros α y r. Esto es así pues: ⎛ α ⎞ M Z (t ) = ⎜ ⎟ ⎝α −t ⎠ r Corolario Dada la distribución Z anterior, la variable aleatoria W = 2α Z tiene una distribución chi cuadrado con ν = 2r. −2 r /2 ⎛ α ⎞ M W (t ) = M Z (2α t ) = ⎜ ⎟ = (1 − 2α t ) ⎝ α − 2α t ⎠ Esta es una distribución chi cuadrado con ν = 2r grados de libertad. r Este corolario brinda una forma de calcular una distribución Gamma con una distribución chi cuadrado. Así por ejemplo P ( Z ≤ 4) = P (2α Z ≤ 8α ) . Esta última se calcula como una distribución chi cuadrado (dados α y r) de W = 2α z y ν = 2r . Por ejemplo, si r = 3 y α = 4: CDF.GAMMA(1,r,α)=CDF.GAMMA(1,3,4)=CDF.CHISQ(2(1)(4),2(3))=CDF.CHISQ(8,6)=0.762. 108 Jorge Carlos Carrá IIa Dos variables – 1. Métodos tabulares y gráficos IIa Dos variables En esta sección y la siguiente, la variable en estudio es de tipo vectorial, llamado vector aleatorio: G Y = (Y1 , Y2 ,...Yk ) Se tratará esencialmente el caso de 2 variables, pero el tratamiento es extensivo al caso multivariable. 1. Métodos tabulares y gráficos Sean X e Y con funciones de distribución contínuas, F1(x) y F2(y) y funciones densidad, f1(x) y f2(y) (resultará más práctico usar, para la variable independiente, la notación con paréntesis en lugar de subíndices). a Variables discretas Son las expresiones vistas en el capítulo 1 (2 variables), cambiando la frecuencia relativa por la probabilidad p. PF Se define la probabilidad conjunta (llamada también PF, Probability Function o PDF, Probability Density Function) como: p ( x, y ) = P ( X = x, Y = y ) CDF Se define la probabilidad acumulativa conjunta como: F ( x, y ) = P ( X ≤ x, Y ≤ y ) Siendo: a b P ( X ≤ a, Y ≤ b) = ∑∑ p ( x, y ) −∞ −∞ 109 Capítulo 3 Distribuciones de Probabilidades PF marginales p1 ( x) = ∑ p( x, y ) x2 p2 ( y ) = ∑ p( x, y ) x1 PF condicionales p ( x, y ) p2 ( y ) p ( x, y ) p2 ( y | x ) = p1 ( x) p1 ( x | y ) = Independencia X e Y se dicen independientes si: p1 ( x | y) = p1 ( x) p2 ( y | x) = p2 ( y) Combinando las ecuaciones anteriores, se obtiene la condición de independencia: p( x, y) = p1 ( x) p2 ( y) b Variables contínuas Las funciones conjuntas se simbolizarán como F(x,y) y f(x,y), las cuales se definen a continuación, a partir de sus correspondientes categóricas. CDF Como ya adelantamos en el capítulo 1, las expresiones para variables categóricas se generalizan informalmente a variables de escala, cambiando: la frecuencia relativa fx por fdx la frecuencia relativa conjunta fxy por f(x,y)dxdy y las sumatorias por integrales. F ( x, y) = P( X ≤ x, Y ≤ y) = ∫ x ∫ y −∞ −∞ f ( x, y)dxdy PDF La vinculación entre una función PDF y su correspondiente CDF, se obtendrá derivando la expresión de F ( x, y ) , primero con respecto de x y luego respecto de y, recordando la regla de derivación de una función integral (integral definida que depende de su límite superior). f ( x, y ) = 110 ∂∂F ( x, y ) ∂x∂y Jorge Carlos Carrá IIa Dos variables – 2. Métodos numéricos Probabilidad de masas Al igual que para una variable, página 16, resulta útil la analogía que surge de considerar a la función densidad como una densidad superficial de masa en el plano xy. Con esta interpretación la función densidad sería el volumen entre la superficie y el plano xy. En particular si la PDF es constante (distribución uniforme) de valor c y el área en el plano xy es A, la constante deberá ser 1/ A. PDF marginales f1 ( x) = ∫ ∞ −∞ f ( x, y )dy Si se representa la PDF bivariable en 3D (con la función densidad en el eje vertical), se puede visualizar este resultado asimilándolo al caso discreto visto en el capítulo 1, discretizando la gráfica en un diagrama de barras elementales y acumulando las probabilidades de f ( x, y ) (tabla de contingencias con celdas elementales en el plano x-y) a lo largo de líneas paralelas al eje y. Análogamente: f2 ( y) = ∫ ∞ −∞ f ( x, y )dx PDF condicionales f ( x, y ) f2 ( y) f ( x, y ) f 2 ( y | x) = f1 ( x ) f1 ( x | y ) = La visualización de estas fórmulas con una tabla de contingencias se realiza en forma similar al de las PDF marginales. Independencia X e Y se dicen independientes si: f1 ( x | y) = f1 ( x) f 2 ( y | x) = f 2 ( y ) Combinando las ecuaciones anteriores, se obtiene la condición de independencia: f ( x, y) = f1 ( x) f 2 ( y) Esta ecuación es equivalente a: F ( x, y) = F1 ( x) F2 ( y) 2. Métodos numéricos A menos que se exprese específicamente, las expresiones que se enumeran a continuación son genéricas y deberán ser calculadas con la expresión discreta o contínua según corresponda. Adicionalmente, se recuerda que las expresiones para variables cuantitativas discretas son las mismas que para variables cuantitativas contínuas cambiando las sumatorias por integrales y la probabilidad p ( xy ) por f ( xy ) dxdy . 111 Capítulo 3 Distribuciones de Probabilidades Medidas de posición Vector esperanza Como la variable aleatoria es vectorial, la esperanza también. Es el vector esperanza de las distribuciones marginales. ( E ( X ), E (Y )) Este vector, tal como se indicó en el capítulo 1, se corresponde con las coordenadas del centro de gravedad, en este caso, de la nube de puntos. Esperanza conjunta Como ya vimos en el capítulo 1, página E2var1, se puede calcular como: Discretas E ( XY ) = ∑∑ pxy XY x y Contínuas +∞ +∞ E ( XY ) = ∫ ∫ xyf ( x, y)dxdy −∞ −∞ Esperanza condicional Discretas E ( X | y ) = ∑ xi p ( xi | yi ) i La interpretación es directa. Es simplemente la media de la distribución condicional p( xi | yi ) . Observar que E ( X | y ) depende de y, por lo tanto es una variable aleatoria. La notación indica estrictamente hablando, el valor de la variable aleatoria E ( X | Y ) . Contínuas ∞ E ( X | y ) = ∫ xf ( x | y ) dx −∞ Medidas de dispersión Vector varianza Al igual que las de posición, como la variable aleatoria es vectorial, la varianza también los es. Es el vector varianza de las distribuciones marginales. (V ( X ), V (Y )) . Como ya vimos en el capítulo 1, página Steiner1, se puede calcular como: V (X ) = 112 SS xx = N ∑X 2 − Nμ2 N = E( X 2 ) − ( E( X )) 2 Jorge Carlos Carrá IIa Dos variables – Medidas de asociación Varianza conjunta La varianza conjunta es la covarianza y se desarrollará en la próxima sección. Varianza condicional Var (Y | X ) = E ⎡⎣(Y − E (Y | X )) 2 | X ⎤⎦ En otras palabras es la misma definición general de varianza aplicada a la distribución condicional con X conocido (observar que todas las esperanzas son condicionales). Medidas de asociación La extensión de las expresiones del capítulo 1 es análoga a la de las medidas de posición. Covarianza Discretas Cov( XY ) = ∑∑ pxy Δ x Δ y x y Contínuas +∞ +∞ Cov( XY ) = ∫ ∫ΔΔ x y f ( x, y )dxdy −∞ −∞ Como ya vimos en el capítulo 1, página Steiner2var1, se puede calcular como: Cov( X , Y ) = SS xy N = E ( XY ) − E ( X ) E (Y ) Correlación lineal Cov( X , Y ) Sx S y Si se multiplica numerador y denominador por N , se obtiene una expresión en función de los SS: ρ= ρ= SS xy SS xx SS yy Si se aplica a variables de escala, se obtiene el coeficiente de correlación de Pearson, en cambio si las variables son ordinales (por ejemplo tomando los rangos o posiciones ordenadas de una variable de escala, a los que llamaremos RX y RY), se obtiene el coeficiente de correlación de Spearman. Matriz Covarianzas, P Al igual que en la unidad 1, página SSCP1, se presentan todos los resultados de varianzas y covarianzas en el formato de matriz, P, como en la siguiente figura. Varxx Covyx Covxy Varyy 113 Capítulo 3 Distribuciones de Probabilidades Figura 3-72 Matriz de correlaciones, R La matriz de correlación R, contiene las correlaciones: rij = Cov(Yi , Y j ) sii s jj Por lo tanto los elementos de la diagonal principal serán 1 y los restantes se calculan tomando de la matriz de covarianzas, el valor de la celda en cuestión, dividiéndolo por la raíz cuadrada del producto de los 2 valores de la diagonal principal que intersectan la celda en cuestión. Problema resuelto 3.33. Género de los hijos En una comunidad, 15% de las familias no tienen hijos, 20% tienen 1, 35% tienen 2 y 30% tienen 3. Suponer que el nacimiento de varón es independiente de mujer. Una familia es elegida al azar, V es el número de hijos Varones, M es el número de hijos Mujeres. a) Construir la TC de las variables V y M, b) Hallar la probabilidad de que esa familia tenga 1 V sabiendo que tiene 1 M, c) obtener la distribución condicional dada M = 2, d) hallar la E(V|M=2). a) TC p(x,y) V 0 1 2 3 Total 0 0.15 0.10 0.0875 0.0375 0.375 1 0.10 0.175 0.1125 0 0.3875 M 2 0.0875 0.1125 0 0 0.20 3 0.0375 0 0 0 0.0375 Total 0.375 0.3875 0.20 0.0375 1 Figura 3-73 Estos valores surgen de construir el árbol de probabilidades condicionales. P(V = 0, M = 0) = P( No hijos) = 0.15 P(V = 0, M = 1) = P(1H ) P(1M |1H ) = 0.20(0.5) = 0.10 P(V = 0, M = 2) = P(2 H ) P(2M | 2 H ) = 0.35(0.5)(0.5) = 0.0875 P(V = 1, M = 2) = P(3H ) P((2M ,1H ) | 3H ) = 0.30(0.5)2 (0.5) P3(2,1) = 0.1125 El resto del árbol se deja al lector. b) P (1V |1M ) = 0.175 = 0.452 0.3875 c) Es simplemente el perfil columna de M = 2. V E(V|M=2) 0 0.4375 1 0.5625 2 0 Figura 3-74 d) E (V | M = 2) = 0(0.4375) + 1(0.5625) = 0.5625 114 Jorge Carlos Carrá 3 0 Total 1 IIa Dos variables – Medidas de asociación Problema resuelto 3.34. Demanda diaria La siguiente PF representa la demanda diaria de dos determinados productos. a) Construir la distribución para todos los valores de las variables, b) expresar las funciones marginales, c) obtener las medias y varianzas de las marginales y la media conjunta, d) hallara la media condicional de x1 = 3, e) hallar la covarianza, la correlación y decidir si las variables son independientes. f ( x1 , x2 ) = 1 ( x12 − x2 ) x1 = 2,3 x2 = 1, 2 20 a) f(x1,x2) 2 3/20 2/20 5/20 1 2 Total x2 x1 3 8/20 7/20 15/20 Total 11/20 9/20 1 Figura 3-75 b) f x1 = ( 5 / 20, 15 / 20 ) f x2 = (11/ 20, 9 / 20 ) c) E ( x1 ) = 2(5 / 20) + 3(15 / 20) = 2.75 E ( x2 ) = 1(11/ 20) + 2(9 / 20) = 1.45 V ( x1 ) = E ( x12 ) − ( E ( x1 ) ) = 0.187 2 V ( x2 ) = E ( x2 2 ) − ( E ( x2 ) ) = 0.247 2 E ( x1 , x2 ) = 2(1)(3 / 20) + 3(1)(8 / 20) + 2(2)(2 / 20) + 2(3)(7 / 20) = 4 d) ⎛ 8 / 20 ⎞ ⎛ 7 / 20 ⎞ E ( x2 | x1 = 3) = 1⎜ ⎟ + 2⎜ ⎟ = 1.467 ⎝ 15 / 20 ⎠ ⎝ 15 / 20 ⎠ e) Cov( x1 , x2 ) = E ( x1 , x2 ) − E ( x1 ) E ( x2 ) = 4 − (2.75)(1.45) = 0.0125 También podría calcularse en forma análoga a la esperanza E ( x1 , x2 ) , celda por celda reemplazando las variables por sus desviaciones. ρ= Cov( x1 , x2 ) 0.0125 = = 0.058 σ ( x1 )σ ( x2 ) 0.432(0.497) La covarianza no es cero (o equivalentemente, E ( x1 , x2 ) ≠ E ( x1 ) E ( x2 ) ), por lo tanto las variables son dependientes. Observar que se trata de una magnitud poblacional, por lo tanto es un modelo teórico exacto y entonces cualquier valor distinto de 0 (aunque sea pequeño), indica dependencia. 115 Capítulo 3 Distribuciones de Probabilidades Problema resuelto 3.35. Tiempo de vida de 2 dispositivos electrónicos La siguiente función densidad conjunta representa el tiempo de vida de dos dispositivos electrónicos. a) Obtener P(X > 1, Y < 1), b) P(X < Y), c) P(X < a), d) f(x|y), e) E(X|y), f) Cov(x,y) y ρ, g) E(XY), E(X) y E(Y). ⎧2e− x e −2 y 0 < x < ∞, 0 < y < ∞ f ( x, y ) = ⎨ en otro punto ⎩0 a) 1∞ P( X > 1, Y < 1) = ∫ ∫ 2e− x e−2 y dxdy 0 1 1 = ∫ 2e−2 y |-e− x |1∞ dy = e−1 (1 − e−2 ) 0 b) Construir un diagrama para observar la región de integración. P( X < Y ) = ∫∫ 2e − x −2 y e dxdy x< y ∞ y = ∫ ∫ 2e − x e−2 y dxdy 0 0 ∞ = ∫ 2e−2 y (1 − e− y ) dy = 1 − 2 / 3 = 1/ 3 0 c) Construir un diagrama para observar la región de integración. a∞ P( X < a) = ∫ ∫ 2e− x e−2 y dydx 0 0 a = ∫ e− x dx = 1 − e− a 0 d) Para las restantes preguntas es conveniente calcular previamente las distribuciones marginales. ∞ ∞ 0 0 f1 ( x) = ∫ 2e − x e −2 y dy = e− x ∫ 2e −2 y dy =e − x ∞ ∞ 0 0 f 2 ( y ) = ∫ 2e− x e −2 y dx = 2e −2 y ∫ e− x dx =2e −2 y Observar que: f ( x, y ) = f1 ( x) f 2 ( y ) por lo cual las variables son independientes. f1 ( x | y ) = f ( x , y ) 2 e − x e −2 y = = e− x −2 y 2e f2 ( y) lo cual no extraña pues al ser independientes, f ( x | y ) = f ( x ) . e) 116 Jorge Carlos Carrá IIa Dos variables – Medidas de asociación ∞ ∞ ∞ 0 0 0 E ( X | y ) = ∫ xf1 ( x | y ) dx = ∫ xe − x dx = − xe − x − e− x ∞ =1 0 f) Por ser independientes la covarianza debe ser 0 y por lo tanto también la correlación. g) ∞ ∞ 0 0 E ( X ) = ∫ xf1 ( x)dx = ∫ xe dx = − xe −x −x ∞ 0 ∞ x + ∫ e dx = − x e 0 ∞ −x 0 ∞ + ∫ e − x dx = 1 0 Análogamente: ∞ ∞ 0 0 E (Y ) = ∫ yf 2 ( y )dy = ∫ y 2e−2 y dy = 0.5 E(XY) se podrá calcular con su expresión, pero como por independencia la covarianza debe ser 0, Cov ( X , Y ) = E ( X , Y ) − E ( X ) E (Y ) , EXY) deberá ser 0.5. Verificar entonces que: ∞∞ E ( XY ) = ∫ ∫ xy 2e− x e−2 y dxdy = 0.5 0 0 117 Capítulo 3 Distribuciones de Probabilidades IIb Funciones de variables aleatorias (dos variables) El problema es similar al caso de una variable, página 25. Se conoce la distribución de probabilidad conjunta de dos v.a. f ( x1 , x2 ) y se desea la distribución de probabilidad conjunta g ( y1 , y2 ) de otras dos variables Y, relacionadas con X a través de: ⎧Y1 = H1 ( X 1 , X 2 ) ⎨ ⎩Y2 = H 2 ( X 1 , X 2 ) Este es el objetivo de esta sección. Métodos Se presentan los mismos tres métodos vistos en el caso de una variable. Se divide el desarrollo, según sea una variable discreta o contínua. 1 Caso discreto Se tiene un solo método. Método de la PF g ( y1 , y2 ) = P(Y1 = y1 , Y2 = y2 ) = P( X1 = x1 , X 2 = x2 ) = f ( x1 , x2 ) Dado que la distribución no cambia, solo habrá que agrupar las probabilidades para los valores de y coincidentes. Problema resuelto 3.36 Defectuosos en 2 líneas de producción La siguiente es una distribución bidimensional discreta de dos variables independientes, x1 y x2, representando el número de artículos defectuosos en 2 líneas de producción. Obtener la distribución de x1 p(x1) 1 0.2 2 0.6 3 0.2 x2 p(x2) 1 0.5 2 0.2 3 0.3 Figura 3-76 118 Jorge Carlos Carrá y1 = x1 + x2 IIb Funciones de variables aleatorias (dos variables) – Métodos Método de la PF La siguiente tabla muestra la distribución de y1. La obtención de los mismos puede facilitarse dibujando en un sistema de ejes los puntos (x1, x2) y en cada intersección el valor de y1. Así por ejemplo: P( y1 = 3) = P( x1 = 2) P( x2 = 1) + P( x1 = 1) P( x2 = 2) = 0.34 y1 p(y1) 2 0.1 3 0.34 4 0.28 5 0.22 6 0.06 Figura 3-77 2 Caso contínuo Métodos generales: 1. Método de la CDF 2. Método de la PDF 3. Método de la MGF Solo veremos los 2 primeros, válidos para funciones H uno a uno. Método de la CDF Las funciones de transformación son uno a uno y por lo tanto admiten inversa. Además este método se aplicará solo al caso de una sola función de transformación H y por lo tanto al caso en que se desea obtener la FDP de una sola variable. Se obtiene esa CDF, integrando la PDF original en una región de integración RX, pues: G( y1 ) = P(Y1 ≤ y1 ) = P( X 1 , X 2 ∈ RX1 , RX 2 ) = ∫∫ f ( x1 , x2 )dx1dx2 RX Paso 1 Dominio de las x en función de las y Encontrar la región de integración de las X en función de la Y1. Analítico La función de transformación se expresa en general: Y1 = H1 ( X 1 , X 2 ) En el plano ( X 1 , X 2 ) se debe establecer la región Y1 ≤ y1 . Numérico Lo anterior solo se cumplirá en el dominio de las X (con la PDF). Para expresar la PDF de la Y1, es necesario hallar su dominio numérico (con la H). Paso 2 integrar la PDF en ese dominio Para obtener la CDF, G( y1 , y2 ) , se debe resolver la integral de f ( x1 , x2 ) en la región obtenida del paso 1. Luego se podrá obtener la PDF, g ( y1 , y2 ) , derivando G( y1 , y2 ) . 119 Capítulo 3 Distribuciones de Probabilidades Problema resuelto 3.37 Transformación suma Dada la siguiente PDF en X1 , X 2 y la transformación Y1 = H ( X1 , X 2 ) , hallar la PDF en Y1. 0 ≤ x1 ≤ 1 0 ≤ x2 ≤ 1 ⎧1 f ( x1 , x2 ) = ⎨ ⎩0 y1 = x1 + x2 en otro punto Método de la CDF Se debe calcular la integral correspondiente a: G1 ( y1 ) = P(Y1 ≤ y1 ) , G1 ( y1 ) = P (Y1 ≤ y1 ) = P ( X 1 + X 2 ≤ y1 ) = ∫∫ f ( x1 , x2 ) dx1dx2 RX Paso 1 Dominio de las x en función de las y Analítico El dominio de la PDF es el cuadrado unitario que se muestra en la siguiente figura. Los puntos que implican la región RX = x1 + x2 ≤ y1 , se muestran sombreados en la misma figura. La línea de la igualdad tiene pendiente –1. Numérico Vinculando el dominio de f ( x1 , x2 ) con la región x1 + x2 ≤ y1 , se obtiene que y1 puede tomar cualquier valor en el intervalo : 0 ≤ y1 ≤ 2 . Observando ahora la figura siguiente se concluye que la integración cambia según sea 0 ≤ y1 ≤ 1 o 1 ≤ y1 ≤ 2 . Figura 3-78 Paso 2 Integrar la PDF en ese dominio G1 ( y1 ) = ∫∫ f ( x1 , x2 ) dx1dx2 x1 + x2 ≤ y1 Región 0 ≤ y1 ≤ 1 Este caso se presenta en la figura siguiente. Los límites de integración, en el orden x1 y luego de x2, se obtienen (para y1 = constante), de la siguiente forma: • Para x1: límites del segmento horizontal con trazo grueso dibujado sobre el área en cuestión. 120 Jorge Carlos Carrá IIb Funciones de variables aleatorias (dos variables) – Métodos • Para x2: límites de la proyección, (segmento con trazo grueso), del área sobre el eje x2. Figura 3-79 y1 G1 ( y1 ) = ∫ ∫ 0 0 Región y1 − x2 1dx1dx2 = 2 1 y 2 1 ≤ y1 ≤ 2 Este caso corresponde a la figura inicial. Se observa que es preferible integrar el complemento en lugar de la región sombreada. Los límites de integración en el orden x1 y luego x2, se muestran con segmentos de trazo grueso. G ( y1 ) = − 1 ⎡ x2 2 ⎤ = − − + 1 1 (1 ) dx dx y x 1 2 ⎢ ∫ ∫y1 − x2 1 2 2 ⎥⎦ y −1 ⎣ y1 −1 1 1 G ( y1 ) = 1 − 1 y12 + 2 y1 − 1 2 En definitiva: y1 < 0 ⎧0 ⎪ 2 ⎪ y1 0 ≤ y1 ≤ 1 ⎪ 2 G1 ( y1 ) = ⎨ 2 ⎪− y1 + 2 y − 1 1 ≤ y ≤ 2 1 1 ⎪ 2 ⎪ y1 > 2 ⎩1 Se observa que ambos volúmenes podrían haberse obtenido de la geometría elemental (las bases son el área de un triángulo y el área de un cuadrado menos el área de un triángulo, respectivamente). Finalmente: 0 ≤ y1 ≤ 1 ⎧ y1 g1 ( y1 ) = ⎨ ⎩2 − y1 1 ≤ y1 ≤ 2 Método de la PDF Continuando con el desarrollo anterior, pero para dos funciones de transformación H, la cual se expresa en general: 121 Capítulo 3 Distribuciones de Probabilidades ⎧Y1 = H1 ( X 1 , X 2 ) ⎨ ⎩Y2 = H 2 ( X 1 , X 2 ) Resolviendo el sistema (debe ser una relación biunívoca), surgen las funciones M1 y M2. ⎧ X 1 = M 1 (Y1 , Y2 ) ⎨ ⎩ X 2 = M 2 (Y1 , Y2 ) Se obtiene la CDF de la Y, integrando la PDF original en una región de integración RX: G ( y1 , y2 ) = P (Y1 ≤ y1 , Y2 ≤ y2 ) = P ( X 1 , X 2 ∈ RX1 , RX 2 ) = ∫∫ f ( x1 , x2 )dx1dx2 RX Si la relaciones H son biunívocas (uno a uno), se puede utilizar la conocida relación de contenidos que se estudia en análisis matemático (involucra al valor absoluto del jacobiano de la transformación (el cual es un determinante): ⎛ x ,x ⎞ dx1dx2 = J ⎜ 1 2 ⎟ dy1dy2 ⎝ y1 , y2 ⎠ se obtiene: ⎛ x ,x ⎞ G ( y1 , y2 ) = ∫∫ f ( x1 , x2 )dx1dx2 = ∫∫ f ( x1 , x2 ) J ⎜ 1 2 ⎟ y1dy2 ⎝ y1 , y2 ⎠ RX RX Finalmente: ⎛ x ,x ⎞ g ( y1 , y2 ) = f ( x1 , x2 ) J ⎜ 1 2 ⎟ ⎝ y1 , y2 ⎠ Esta ecuación es la equivalente del caso univariable: g ( y ) = f ( x ) x ' Dada la relación uno a uno, se verifica además que: −1 ⎛ x , x ⎞ ⎛ ⎛ y , y ⎞⎞ J ⎜ 1 2 ⎟ = ⎜⎜ J ⎜ 1 2 ⎟ ⎟⎟ = J H −1 ⎝ y1 , y2 ⎠ ⎝ ⎝ x1 , x2 ⎠ ⎠ De esta forma se puede expresar alternativamente: g ( y1 , y2 ) = f ( x1 , x2 ) J H −1 siendo J H el jacobiano de la transformación H. Si solo se plantea una sola relación H1 (como en el método anterior de la CDF), se completa el esquema anterior con una segunda relación ficticia del tipo: Y2 = X1 o Y2 = X 2 resultando, por , ejemplo: ⎧Y1 = H1 ( X 1 , X 2 ) ⎨ ⎩Y2 = X 1 Funciones Y = H ( X1 , X 2 ) importantes Resultan de interés las siguientes transformaciones: 122 Jorge Carlos Carrá IIb Funciones de variables aleatorias (dos variables) – Métodos y1 = x1 ± x2 y1 = x1 x2 y1 = x1 x2 Si se completa la transformación con la ecuación y2 = x2 , verificar que los valores absolutos de los jacobianos resultan: 1, x2 y 1/ x2 , respectivamente. Transformación suma Como la transformación suma tendrá especial importancia en el capítulo 4, Distribuciones Muestrales, veamos los detalles. ⎧ y1 = x1 ± x2 ⎨ ⎩ y2 = x2 JH = 1 1 0 1 =1 g ( y1 , y2 ) = J H −1 f ( x1 , x2 ) = f ( y1 − x2 , x2 ) g1 ( y1 ) = f ( x1 + x2 ) = ∫ ∞ −∞ ∞ f ( y1 , y2 )dy2 = ∫ −∞ f ( y1 − x2 , x2 )dx2 Caso particular: X1, X2 independientes g ( y1 , y2 ) = J g g1 ( y1 ) = ∫ ∞ −∞ −1 f1 ( x1 ) f 2 ( x2 ) = f1 ( y1 − x2 ) f 2 ( x2 ) f ( y1 , y2 )dy2 = ∫ ∞ −∞ f1 ( y1 − x2 ) f 2 ( x2 )dx2 Esta integral se llama en matemáticas, integral de convolución y se representa f1 * f 2 . f1 * f 2 = ∫ ∞ −∞ f1 ( y1 − x2 ) f 2 ( x2 )dx2 Propiedad f1 * f 2 = f 2 * f1 Es decir no interesa donde se coloca la resta. Demostración Basta hacer el cambio de variables: y1 − x2 = z ⇒ x2 = y1 − z, dx2 = −dz , e invertir el intervalo de integración. Problema resuelto 3.38 Transformación suma Resolver el problema resuelto anterior, pero ahora con el método de la PDF. Dada la siguiente PDF en ⎧1 f ( x1 , x2 ) = ⎨ ⎩0 X1 , X 2 y la transformación Y1 = H ( X1 , X 2 ) , hallar la PDF en Y1. 0 ≤ x1 ≤ 1 0 ≤ x2 ≤ 1 en otro punto y1 = x1 + x2 123 Capítulo 3 Distribuciones de Probabilidades Método de la PDF Para aplicar este método completamos la ecuación de transformación con y2 = x1 o y2 = x2 . ⎧y = x + x H ( x1 , x2 ) = ⎨ 1 1 2 ⎩ y2 = x2 La función inversa es: ⎧ x = y1 − y2 H −1 ( y1 , y2 ) = ⎨ 1 ⎩ x2 = y2 Para determinar la región del plano ( y1 , y2 ) en el que se transforma la región del plano ( x1 , x2 ) , la cual es el cuadrado x1 = 0, x2 = 0, x1 = 1, x2 = 1 , observamos que reemplazando en las ecuaciones anteriores, resulta: y2 = 0, y2 = y1 , y2 = y1 − 1, y2 = 1, la cual se ha dibujado en la figura siguiente. Figura 3-80 El jacobiano de la transformación es: JH = 1 1 0 1 =1 su valor absoluto es 1. Por lo tanto: g ( y1 , y2 ) = 1*1 = 1 Para hallar g ( y1 ) , debemos integrar respecto de y2 . Los límites de integración son (observar las rayas de trazo grueso de la figura anterior): ⎧ y1 g ( y , y )dy = y 1 2 2 1 ⎪ ∫0 g1 ( y1 ) = ⎨ 1 ⎪ ∫ g ( y1 , y2 )dy2 = 2 − y1 ⎩ y1 −1 0 ≤ y1 ≤ 1 1 ≤ y1 ≤ 2 Valores que coinciden con el cálculo por el método de la CDF. Métodos numéricos G G Sea el vector aleatorio X = ( X 1 , X 2 ,... X k ) e Y = H ( X ) una función escalar de variable vectorial. 124 Jorge Carlos Carrá IIb Funciones de variables aleatorias (dos variables) – Métodos numéricos Valor esperado de Y G G Si la variable X es discreta con función de probabilidad conjunta p ( x ) : G G E (Y ) = ∑∑ ...∑ H ( x ) p ( x ) x1 x2 xk G G Si la variable X es contínua con función densidad conjunta f ( x ) : G G G E (Y ) = ∫ ∫ ... ∫ H ( x ) f ( x )d ( x ) x1 x2 xk La demostración de la ecuación anterior es difícil y no la haremos aquí. H lineal En particular, sea la función lineal Y = n ∑a X i =1 i donde las ai son constantes. i Valor esperado de Y n E (Y ) = ∑ ai E ( X i ) i =1 Demostración Esta expresión surge de aplicar cualquiera de las expresiones anteriores a Y . Varianza de Y n V (Y ) = ∑ ai2V ( X i ) + 2∑∑ ai a j Cov( X i , X j ) i =1 i< j donde la suma doble se forma para todos los pares (i, j) que resultan de la combinación de n elementos tomados de a 2 (si el alumno conoce el análisis combinatorio reconocerá que esto equivale a i < j). Demostración La demostración surge de aplicar la definición de varianza a la Y definida anteriormente. Para ejemplificar el proceso veamos el caso más simple con Y = aX + bZ . (( aX + bZ − (aμ + bμ ) ) ) = E ( ( ( aX − a μ ) + ( bZ − bμ ) ) ) = E ( ( aΔ + bΔ ) ) V (Y ) = E ( (Y − E (Y )) 2 ) = E 2 x z 2 x z 2 x z = E ( a 2 Δ x 2 + b 2 Δ z 2 + 2abΔ x Δ z ) = a 2 E (Δ x 2 ) + b 2 E (Δ z 2 ) + 2abE ( Δ x Δ z ) = a 2V ( X ) + b2V (Y ) + 2abCov( X , Z ) Esta demostración se extiende al caso de más de 2 variables. 125 Capítulo 3 Distribuciones de Probabilidades Problema resuelto 3.39 Distribución hipergeométrica En este problema deduciremos las expresiones de la media y varianza de una distribución hipergeométrica en forma parecida al camino seguido con la distribución Binomial, vinculándola con la distribución de Bernoulli. Una urna con N esferas tiene r esferas Rojas y N–r esferas Negras. Se muestrean n esferas sin reemplazo (MSR) y se observa Y = número de esferas Rojas. Hallar E(Y) y V(Y). Solución Al igual que en la binomial, si X = número de esferas cada extracción: Y =∑X Características de un MSR Analicemos el siguiente árbol de las 2 primeras extracciones sin reemplazo. (r-1)/(N-1) 1. 1 r/N (N-r)/(N-1) 0. . r/(N-1) 1-r/N 1.. 0 (1-(r-1)/N)/(N-1) 0.. Figura 3-80 De este árbol se extrae. Probabilidad incondicional En forma directa: P ( X 1 = 1) = r N Esto también es cierto para la segunda extracción, pues: P( X 2 = 1) = P( X 1 = 1, X 2 = 1) + P( X 1 = 0, X 2 = 1) = r r −1 N − r r r N −1 r + = = N N −1 N N −1 N N −1 N P ( X 2 = 1) = r N El lector puede verificar que los resultados anteriores son válidos para cualquier extracción, no solo para las 2 primeras. 126 Jorge Carlos Carrá IIb Funciones de variables aleatorias (dos variables) – Métodos numéricos Por lo tanto, si se conforma la tabla de la distribución, en forma similar a la construida para la distribución de Bernoulli, se verifica: r = p0 N r ⎛ r ⎞ V ( X i ) = ⎜1 − ⎟ = p0 q0 N⎝ N⎠ E( X i ) = Probabilidad conjunta P ( X 1 = 1, X 2 = 1) = r r −1 N N −1 El lector puede verificar que los resultados anteriores son válidos para cualquier extracción. Dado que en el cálculo de E ( X i X j ) , solo queda el término con X i = 1, X j = 1 , se verifica: E( X i X j ) = r r −1 N N −1 E(Y) A partir de la definición de la esperanza y del resultado anterior: E (Y ) = E ∑ X = ∑ E ( X ) =np0 q0 V(Y) En la sección anterior se demostró que. V (Y ) = V ∑ X = ∑ V ( X )∑ +2∑∑ Cov( X i X j ) i< j i Esta relación corresponde a variables multivariables y es por esta razón que esta demostración se realiza en esta sección. Se puede observar que en las distribuciones Binomiales, el segundo término es 0 por la independencia entre eventos. Esto no es así en la hipergeométrica, como veremos ahora. Se tiene: V (Y ) = V ∑ X = ∑V ( X ) = np0 q0 Cov ( X i X j ) = E ( X i X j ) − E ( X i ) E ( X j ) Reemplazando: = r ⎛ r ⎞ ⎛ r ⎞ ⎜1 − ⎟ − ⎜ ⎟ N⎝ N⎠ ⎝N⎠ 2 Operando: ⎛ 1 ⎞ Cov( X i X j ) = − p0 q0 ⎜ ⎟ ⎝ N −1 ⎠ Reemplazando ambos resultados en la expresión de V (Y ) , finalmente resulta: ⎛ 1 ⎞ V (Y ) = np0 (1 − q0 ) + 2∑∑ − p0 q0 ⎜ ⎟ ⎝ N −1 ⎠ i< j En la sumatoria doble se deben formar todos los pares (i, j) que resultan de la combinación de n elementos tomados de a 2, es decir ( se requiere análisis combinatorio) n ( n − 1) . Por lo tanto, reemplazando esta 2 relación y expresando todos los valores en función de r, n y N, resulta: V (Y ) = n r ⎛ r ⎞ n(n − 1 r ⎛ r ⎞⎛ 1 ⎞ ⎜1 − ⎟ − 2 ⎜1 − ⎟⎜ ⎟ 2 N ⎝ N ⎠⎝ N − 1 ⎠ N⎝ N⎠ 127 Capítulo 3 Distribuciones de Probabilidades Realizando algunas operaciones algebraicas que se dejan al lector, se obtiene finalmente: V (Y ) = np0 q0 128 N −n N −1 Jorge Carlos Carrá IIc Modelos teóricos de dos variables – 1 Modelos discretos IIc Modelos teóricos de dos variables 1 Modelos discretos Los modelos discretos de mayor interés son los siguientes: Distribución Multinomial y Distribución Multihipergeométrica Multinomial, m(yA,yB,yC,n,pA,pB,pC) Supuestos Es una modificación de la Binomial, en el supuesto 1. Supuesto 1 Multicotómica Una v.a Y tiene k resultados A1, A2, A3, …, Ak. Supuesto 2 Variable Aleatoria Dada una muestra de tamaño n, la variable aleatoria se define como el número de elementos G de cada categoría Ai. En otras palabras se busca el vector aleatorio: Y tal que Y1 + Y2 + ... + Yk = n . Dada esta relación, las variables realmente independientes son k–1. Supuesto 3 Tamaño Como ya se estableció, las muestras tienen un tamaño n > 1. Supuesto 4 Dependencia Los n elementos del espacio muestral son independientes. Expresiones generales Observemos la siguiente tabla de una distribución de n = 5, con una variable tricotómica. Se presentan solo algunos valores y se utilizaron A, B y C en lugar de A1, A2 y A3. S G G Y=y G p( y) ABBBC AAAAB AABBC 1,3,1 4,1,0 2,2,1 … … P5(1,3,1) pA pB3 pC P5(4,1,0) p A4 pB P5(2,2,1) p A2 pB2 pC … Figura 3-81 129 Capítulo 3 Distribuciones de Probabilidades De la misma se desprende la siguiente expresión, la cual es una generalización de la binomial: PDF conjunta Observando la figura 3-81 se obtiene la siguiente expresión general de la función de probabilidad. G m( y A , n, pA , pB , pC ) = Pn ( yA , yB , yC ) pA yA pB yB pC yC siendo: ∑y=n Relación con la binomial Si se toma cualquier agrupación de las variables, por ejemplo Y1 e Y2, puede considerarse una variable dicotómica X con la categoría Y1 e Y2 por un lado y las restantes variables por el otro. Esta variable es entonces Binomial. Caracterización Esperanza Por la relación anterior con la Binomial, cada uno de los componentes del vector Esperanza tiene la forma: E (Yi ) = npi Varianzas Por la relación anterior con la Binomial, cada uno de los componentes del vector Varianza tiene la forma: V (Yi ) = npi qi Covarianzas Consideremos solo a dos variables Yi e Yj: V (Yi + Y j ) = V (Yi ) + V (Y j ) + 2Cov(Yi , Y j ) Por la relación anterior con la Binomial, se tiene: ( ) n( pi + p j ) 1 − ( pi + p j ) = npi qi + np j q j + 2Cov(Yi , Y j ) Despejando la covarianza, resulta: Cov (Yi , Y j ) = − npi p j La covarianza es negativa pues para un fijo n, dado que Y1 + Y2 + ... + Yk = n , un incremento en una variable requiere un decrecimiento en otra. Matriz Covarianzas, P Al igual que en la unidad 1, página SSCP1, se presentan todos los resultados de varianzas y covarianzas en el formato de matriz, P, como en la siguiente figura. np1q1 -n p1p2 … … … … … -n p1pk … -n p1pk … npkqk Figura 3-82 130 Jorge Carlos Carrá IIc Modelos teóricos de dos variables – Distribución Multihipergeométrica Matriz de correlaciones, R Se construye a partir de la matriz de covarianzas como se detalló en la página 114. Problema resuelto 3.40 Examen de selección múltiple En un examen de selección múltiple usted debe elegir entre 3 posibles respuestas, A, B y C. Si la elección se realiza al azar, calcular: a) la probabilidad de que 6 alumnos hayan elegido: yA= 1, yB= 2, yC= 3, b) expresar el vector esperanzas, la matriz de covarianzas P y la de correlaciones R. a) n=6 m(1, 2,3, 6,1/ 3,1/ 3,1/ 3) = P6(1,2,3) (1/ 3)1 (1/ 3)2 (1 / 3)3 = 0.0823 b) 2 2 2 Vector Esperanzas 1.33 –1.33 –1.33 –1.33 1.33 –1.33 –1.33 –1.33 1.33 Matriz Covarianzas 1 –1 –1 –1 1 –1 –1 –1 1 Matriz Correlaciones Figura 3-83 Distribución Multihipergeométrica Es una modificación de la Binomial en los supuestos 1 y 4. Supuesto 1 Multicotómica Una v.a Y tiene k resultados A1, A2, A3, …, Ak. Supuesto 2 Variable Aleatoria Dada una muestra de tamaño n, se busca el número de elementos de cada categoría Ai. G En otras palabras se busca el vector aleatorio: Y tal que Y1 + Y2 + ... + Yk = n . Dada esta relación, las variables realmente independientes son k–1. Supuesto 3 Tamaño Como ya se estableció, las muestras tienen un tamaño n > 1. Supuesto 4 Dependencia Los n elementos del espacio muestral son dependientes (muestreo sin reemplazo o población finita). PDF conjunta Es una combinación de la multinomial y de la hipergeométrica. 131 Capítulo 3 Distribuciones de Probabilidades ⎛ A1 ⎞⎛ A2 ⎞ ⎛ Ak ⎞ ⎜ ⎟⎜ ⎟ ... ⎜ ⎟ y y y G m( y A , N , n, A1 , A2 ... Ak ) = ⎝ 1 ⎠⎝ 2 ⎠ ⎝ k ⎠ ⎛N⎞ ⎜ ⎟ ⎝n⎠ Al igual que para el caso univariable, si N tiende a infinito, la Multihipergeométrica tiende a la Multinomial. Relación con la hipergeométrica Si se toma cualquier agrupación de las variables, por ejemplo Y1 e Y2, puede considerarse una variable dicotómica X con la categoría Y1 e Y2 por un lado y las restantes por el otro. Esta variable es entonces Hipergeométrica. Caracterización Esperanza Por la relación anterior con la Hipergeométrica, cada uno de los componentes del vector Esperanza tiene la forma: E (Yi ) = np0i Varianzas Por la relación anterior con la Hipergeométrica, cada uno de los componentes del vector Varianza tiene la forma: V (Yi ) = np0i q0i Covarianzas Consideremos solo a dos variables Yi e Yj: V (Yi + Y j ) = V (Yi ) + V (Y j ) + 2Cov(Yi , Y j ) Por la relación anterior con la Hipergeométrica, se tiene: ( = n( p0i + p0 j ) 1 − ( p0i + p0 j ) ) NN −− 1n = np q 0i 0i N −n N −n + np0 j q0 j + 2Cov(Yi , Y j ) N −1 N −1 Despejando la covarianza, resulta: Cov(Yi , Y j ) = − np0i p0 j N −n N −1 Matriz Covarianzas, P Al igual que en el caso general, se presentan todos los resultados de varianzas y covarianzas en el formato de matriz, P, como en la siguiente figura. Var11 Cov12 … Cov1k … … … … … … Varkk Cov1k Figura 3-84 132 Jorge Carlos Carrá IIc Modelos teóricos de dos variables – 2 Modelos contínuos Matriz de correlaciones, R La matriz de correlación R se construye a partir de la matriz de covarianzas en forma análoga al caso general, página 114. 2 Modelos contínuos Distribución uniforme PDF conjunta Su PDF conjunta es simplemente: f ( x, y ) = k Problema resuelto 3.41 Encuentro Una pareja decide encontrarse en un cierto lugar. Si cada persona arriba independientemente con una distribución del tiempo uniforme entre 17:00 y 18:00, encontrar la probabilidad de que el primero en llegar tenga que esperar más de 10 minutos. Llamemos X e Y al tiempo pasadas las 17:00 que cada persona tarda en llegar, cada una uniformemente distribuido sobre (0, 60). Las probabilidades son P ( X + 10 < Y ) y P (Y + 10 < X ) . Por la simetría son iguales, por lo tanto: 2 P( X + 10 < Y ) = 2∫ ∫ x +10 < y f ( xy )dxdy = 2∫ ∫ f ( x) f ( y )dxdy x +10 < y Haciendo un gráfico de análisis para definir los intervalos de integración, resulta. 60 y −10 = 2∫ 10 ∫ 0 2 60 2 25 ⎛ 1 ⎞ ⎜ ⎟ dxdy = 2 ∫ ( y − 10 )dy = 60 10 36 ⎝ 60 ⎠ Distribución binormal El modelo contínuo de mayor interés es el de la distribución binormal. G Dado el vector aleatorio Y = ( X , Y ) , se dice que tiene una distribución binormal si su distribución de probabilidades es la que se define a continuación. Es de particular interés presentar la distribución normal conjunta, pues es una condición requerida en algunos procedimientos estadísticos. 133 Capítulo 3 Distribuciones de Probabilidades nXY(μx, μy, σx, σy, ρ) PDF conjunta f xy ( μ x , μ y , σ x , σ y , ρ ) = e −Q /2 2πσ xσ y 1 − ρ 2 donde: Q= = 1 1− ρ 2 ⎡ ( x − μ x )2 ( x − μ x )( y − μ y ) ( y − μ y )2 ⎤ ρ − + 2 ⎢ ⎥ 2 σ xσ y σ y2 ⎥⎦ ⎢⎣ σ x 1 ⎡ z 2 − 2 ρ z x z y + z y 2 ⎤⎦ 2 ⎣ x 1− ρ Esta PDF es función de 5 parámetros, los cuales llevan esos símbolos pues se corresponden con los parámetros que se verán a continuación. PDF marginales Son: N (μ x ,σ x 2 ) y N (μ y ,σ y 2 ) . Caracterización Esperanza El vector aleatorio de las esperanzas es: G E (Y ) = ( E ( X ), E (Y )) = ( μ x , μ y ) Varianzas El vector aleatorio de las varianzas es: G V (Y ) = (V ( X ), V (Y )) = (σ x2 , σ y2 ) Covarianza Cov ( X , Y ) = ρσ xσ y Matriz de covarianzas, P σ x2 ρσ xσ y ρσ xσ y σ y2 Figura 3-85 Observar que el denominador del coeficiente de la PDF es 2π por la raíz cuadrada del determinante de la matriz P. Observar además que si la covarianza es cero, es decir ρ = 0, entonces fxy se puede expresar como: f xy = N ( μ x , σ x 2 ) N ( μ y , σ y 2 ) 134 Jorge Carlos Carrá IIc Modelos teóricos de dos variables – Distribución binormal por lo tanto X e Y son independientes. Recordemos que una covarianza cero, no significa necesariamente independencia. Sin embargo, si la distribución es normal conjunta, entonces la independencia es equivalente a la incorrelación lineal. Matriz de correlaciones, R La matriz de correlación R se construye a partir de la matriz de covarianzas en forma análoga al caso general. 135 Capítulo 3 Distribuciones de Probabilidades III Confiabilidad, R(t) En el capítulo 2 definimos la confiabilidad como la probabilidad de que un sistema funcione. En esta sección ampliaremos el concepto introduciendo la forma de calcular una confiabilidad dependiente de la variable tiempo. Definición Confiabilidad, R(t) (Reliability): mide la probabilidad de que un componente no falle en [0, t] o equivalentemente que dure hasta t. En otras palabras t es lo que antes llamamos T1 = tiempo hasta el primer evento o falla. En notación matemática: R (t )= P (T > t ) donde T es la v.a. duración del componente. Llamaremos f(t) a la PDF de T y F(t) a la CDF. La cola de la distribución f(t) a partir de t = T1, es la confiabilidad. Por lo tanto: R(t ) = P(T > t ) = 1 − F (t )= F (t ) Destaquemos que la F(t) (área de f(t) entre 0 y t) mide la probabilidad de que la primer falla se presente en [0, t]. En cambio su complemento F (t ) , mide la probabilidad de que la primer falla no se presente en [0, t] o equivalentemente que se presente luego de t. En este contexto también suele definirse la falta de confiabilidad (unreliability) o probabilidad de falla en [0,t] como: Q (t ) = 1 − R (t ) = F (t ) Es decir es la CDF F(t). En la siguiente figura se representan gráficamente los sectores de: R(t1 ) : probabilidad de no falla en [0, t1] (pues la primera falla sucede luego de t1). Q(t1 ) : probabilidad de falla en [0, t1] (pues la primera falla sucede antes de t1). Figura 3-86 Conceptualmente, si por ejemplo un componente tiene una confiabilidad de 90% para t1 = 12 horas, entonces si 100 componentes operan 12 horas, aproximadamente 90 no fallarán. 136 Jorge Carlos Carrá III Confiabilidad, R(t) – Distribución binormal Veamos cómo se obtienen 3 funciones de interés en función de la confiabilidad: 1 FDP f(t) en función de R(t) La FDP se obtiene derivando R(t), pues: R '(t ) = − d ( F (t )) − = − f (t ) dt Por lo tanto: f (t ) = − R '(t ) Observar que para obtener R(t) de la expresión anterior se debe integrar a f(t) entre t e infinito. 2 Media E(t) en función de R(t) La media de f(t) será: ∞ E (t ) = ∫ t f (t ) dt 0 Teorema ∞ E (t ) = ∫ R (t ) dt 0 Expresando el límite superior con la letra a: a a E (t ) = ∫ t f (t ) dt = tF (t ) 0 − ∫ F (t ) dt a 0 0 pero: a tF (t ) 0 = aF (a ) = a = ∫ dt , pues F ( a ) = 1 . a 0 por lo tanto: a a a 0 0 0 E (t ) = ∫ dt − ∫ F (t )dt = ∫ 1 − F (t ) dt Naturalmente esta forma de calcular la esperanza en función de la CDF, es válida siempre. Otra demostración ∞ ∞ ⎛ ⎞ = R ( t ) dt ∫0 ∫0 ⎜⎝ ∫t f (s)ds ⎟⎠ dt ∞ Integrando por partes (considerando dv= dt): ∞ ∞ ∞ ∞ ∞ 0 t 0 t 0 ∫ R(t )dt = t ∫ f (s)ds − ∫ −tf (t )dt = t ∫ f (s)ds + ∫ tf (t )dt El segundo sumando es E(t), por lo cual solo queda demostrar que el primero es 0. En t = 0, es evidente que lo es. Para demostrar que lo es para el resto de valores se debe introducir el requisito que E(t) sea finita. Se deja la demostración al lector. 3 Frecuencia de fallas instantánea h(t) en función de R(t) Se llama también función de riesgo (hazard) y por esta razón se simboliza h(t). h(t ) = f (t ) 1 − F (t ) 137 Capítulo 3 Distribuciones de Probabilidades Por la definición de confiabilidad, esta expresión se puede escribir: h (t ) = f (t ) R (t ) Si en la figura siguiente consideramos la probabilidad condicional P(t1 ≤ T ≤ t1 + Δt | T > t1 ) , para un Δt pequeño, observamos que es: P(t1 ≤ T ≤ t1 + Δt | T > t1 ) = Δtf (t ) R(t ) Por lo tanto Δth(t ) representa la probabilidad de fallar en un intervalo pequeño después de t1 dado que sobrevivió hasta t1 o en otras palabras, la frecuencia de fallas h(t) es proporcional a esta probabilidad condicional. Figura 3-87 Como veremos luego, para la distribución exponencial, h (t ) = ω , por lo cual podría utilizarse la notación h (t ) = ω (t ) . Teorema t R (t ) = e ∫ − h ( t ) dt 0 La demostración es directa a partir de: h(t ) = f (t ) − R '(t ) d (ln( R(t )) = =− R(t ) R(t ) dt Integrando entre 0 y t y bajo la suposición que R(0) = 1, es decir que la probabilidad de una falla inicial es 0 (suposición que equivale a F(0) = 0 y que mantendremos de aquí en más), se obtiene la expresión que se quiere demostrar. Si el elemento tiene una h(t) definida por tramos, la integral deberá ser dividida con límites acordes con los tramos. La PDF se obtiene a partir de: t f (t ) = − R '(t ) = h (t )e ∫ − h ( t ) dt 0 Síntesis Las 3 importantes vinculaciones que hemos demostrado se resumen a continuación: 138 Jorge Carlos Carrá III Confiabilidad, R(t) – Distribución binormal f (t ) = − d ( R(t )) dt ∞ E (t ) = ∫ R (t )dt 0 h(t ) = − d (ln( R (t )) dt Si bien se utilizan varias distribuciones como modelos matemáticos de fallas (Weibull, Rayleight, etc), las distribuciones más comunes que siguen los componentes, son la exponencial, la Gamma, la de Weibull y la normal. Distribución exponencial Se utiliza este modelo cuando la tasa de fallas ω se puede suponer constante y el objeto no cambia con el uso (no tiene memoria, ver página 68). En este modelo se distingue, el tiempo de operación a partir de un valor arbitrario t = a , de la edad de operación, partir de t = 0 . R(t) R (t ) = 1 − CDF (t ) En este caso, por la propiedad de las colas de una función exponencial, se tiene: R(t ) = e−ωt En particular si t = MTBF = β, la confiabilidad resulta: R(β ) = e−ω /ω = e−1 = 0.37 valor que puede ser tomado como referencia. Figura 3-88 La confiabilidad disminuye con el tiempo como es habitual. f(t) f (t ) = − R '(t ) =ωe−ωt 139 Capítulo 3 Distribuciones de Probabilidades Figura 3-89 E(t) ∞ ∞ 0 0 E (t ) = ∫ R (t )dt = ∫ e −ωt dt = 1 ω =β Figura 3-90 h(t) h(t ) = f (t ) ωe −ωt = =ω R(t ) e−ωt Observar que para este modelo, la frecuencia de fallas h(t) es una constante, lo cual indica que aunque el ítem se encuentre en uso, la probabilidad de falla no cambia. Dicho de otra forma no interviene el "efecto de uso", lo cual ya adelantamos al estudiar la distribución exponencial en la página 88. Exponencial y Poisson Recordemos, página 71, que si T es el tiempo requerido para observar r ocurrencias y X es el número de ocurrencias durante [0, t], entonces: 140 Jorge Carlos Carrá III Confiabilidad, R(t) – Distribución binormal a) P (T > t ) = P ( X < r ) b) P (T ≤ t ) = P ( X ≥ r ) Además si T tiene una distribución Gamma, entonces X sigue una distribución de Poisson. Utilizando el formato CDF, se verifica: 1 − CDF .GAMMA(t , r , α ) = CDF .POISSON ( r − 1, t , α t ) CDF .GAMMA(t , r , α ) = 1 − CDF .POISSON ( r − 1, t , α t ) En particular si r = 1, la distribución Gamma se convierte en exponencial (con α igual a ω): 1 − CDF .EXP (t , ω ) = CDF .POISSON (0, ωt ) CDF .EXP(t , ω ) = 1 − CDF .POISSON (0, ωt ) Distribución Gamma, (t,r,α) El apartado anterior permite generalizar la distribución exponencial a una distribución Gamma para tratar el tiempo en el que ocurren r fallas (no una), en tanto las mismas aparezcan de acuerdo a un proceso de Poisson. Distribución de Weibull, (x,ω,β) Es otra generalización de la exponencial para la cual h(t) es polinómica de la forma: h(t ) = ωβ t β −1 donde ω y β son constantes positivas. Al variar β (con valores menores o mayores a 1), varía el exponente y se observa que se obtienen curvas de h(t) con tramos decrecientes, DFR (Decreasing Failure Rate) o crecientes, IFR (Increasing Failure Rate), por lo cual se lo llama parámetro de forma. Se puede observar que la exponencial es un caso particular con β = 1. Con β = 3.6 se aproxima a una normal. En esta distribución se llama a ω parámetro de escala, para el cual también suele usarse la letra α. R(t) t R (t ) = e ∫ − h ( t ) dt 0 t =e ∫ − ωβ t β −1dt 0 = e −ωt β R(t ) = e −ωt β En la figura siguiente se muestra la confiabilidad para ω = 1, β = 1 y ω = 1, β = 3. 141 Capítulo 3 Distribuciones de Probabilidades Figura 3-91 f(t) f (t ) = − R '(t ) =ωβ t β −1e−ωt β En la siguiente figura se muestra la PDF para ω = 1, β = 1 y ω = 1, β = 3. Figura 3-92 F(t) A partir de: F (t ) = 1 − R (t ) , F (t ) = 1 − e−ωt 142 β Jorge Carlos Carrá III Confiabilidad, R(t) – Distribución binormal En la siguiente figura se muestra la CDF para ω = 1, β = 1 y ω = 1, β = 3. Figura 3-93 E(t) Se puede demostrar que: ⎛1 ⎞ E (t ) = ω −1/ β Γ ⎜ + 1⎟ ⎝β ⎠ h(t) β f (t ) ωβ t β −1e−ωt = = ωβ t β −1 h(t ) = −ωt β R(t ) e Según el valor de β, se obtienen funciones de falla, constantes, lineales, parabólicas, etc. Cuando β > 1 se obtiene un crecimiento de h(t) con el tiempo, lo cual indica un esperable efecto de uso. Cuando β = 1 , el valor de h(t) es constante (modelo exponencial) lo cual indica que se trata de un modelo aplicable en los casos en que no existe el efecto de uso. Finalmente cuando 0 < β < 1 , h(t) es decreciente, aplicable a casos no comunes en donde h(t) decrece con el tiempo. En la siguiente figura se muestra la h(t) para ω = 1, β = 1 y ω = 1, β = 3. 143 Capítulo 3 Distribuciones de Probabilidades Figura 3-94 Distribución normal La ley normal de fallas es un modelo apropiado cuando la mayor parte de las fallas se producen alrededor de la media μ y cuando la falla tiene memoria (intervienen efectos del uso). Sin embargo, no es el modelo más encontrado. Naturalmente, como T debe ser mayor o igual a 0, debe ser P(T <0) =0 lo cual implica que deben ser truncados los valores de z menores a z = −μ σ por lo cual la distribución es normal truncada a la izquierda (página 101). R(t) R (t ) = 1 − CDF (t ) Valor que deberá ser calculado numéricamente como en cualquier distribución normal, con tablas o programas informáticos. 144 Jorge Carlos Carrá III Confiabilidad, R(t) – Distribución binormal Figura 3-95 La confiabilidad disminuye con el tiempo como es habitual. f(t) f (t ) = n (t , μ , σ ) Figura 3-96 La mayor parte de los artículos fallan alrededor de μ. E(t) Si la distribución normal no fuera truncada sería: ∞ E (t ) = ∫ tf (t ) dt = μ 0 Si μ ≥ 2σ , los valores que se truncan corresponden a z ≤ − 2 , por lo cual la media es muy similar a μ. 145 Capítulo 3 Distribuciones de Probabilidades h(t) h(t ) = f (t ) n(t , μ , σ ) = R (t ) 1 − N (t , μ , σ ) Figura 3-97 La frecuencia de fallas aumenta con el tiempo lo cual indica el habitual efecto de uso. Sistemas 1 Sistemas con componentes en serie o paralelo Los teoremas de confiabilidad equivalente para circuitos serie o paralelo con valores constantes R vistos en el capítulo 2, pueden ahora aplicarse a componentes con confiabilidades dependientes de una variable t, R(t). Elementos en serie Figura 3-98 La confiabilidad equivalente de componentes en serie es el producto de las confiabilidades. R(t ) = RA RB RC En particular si la ley de falla es exponencial: R(t ) = e−(ωA +ωB +ωC )t En este caso, el T del sistema también está distribuido exponencialmente, con una frecuencia de fallas que es la suma de las de los componentes. 146 Jorge Carlos Carrá III Confiabilidad, R(t) – Distribución binormal Elementos en paralelo Figura 3-99 Expresión directa R(t ) = R A + R B + R C − R AR B − R AR C − R B R C + R AR B R C En particular si la ley de falla es exponencial y expresando, por simplicidad un sistema de 2 componentes: R(t ) = e−ωAt + e−ωBt − e−(ωA +ωB )t Se observa que en este caso T no está distribuido exponencialmente. Expresión por complementos El complemento de la confiabilidad equivalente de componentes en paralelo es el producto de los complementos de las confiabilidades. R = 1 − (1 − RA )(1 − RB )(1 − RC ) Cualquier otra combinación con componentes en serie y en paralelo se resuelve reemplazando las partes serie y paralelo por su confiabilidad equivalente. 2 Sistemas con componentes en Stand By Son sistemas en los cuales un componente está inactivo y solo funciona cuando otro falla (stand by). Una llave sensa la falla y cambia al componente en espera que funcionará en lugar del primero. Si llamamos S a la llave que funciona con probabilidad P(S), aplicando la RP de las probabilidades, se tiene (Billinton R. 1992, página 96): Q = Q(sistema | S ) P(S ) + Q(sistema | S ) P(S ) El componente redundante está normalmente inactivo con lo cual se reduce el tiempo de uso. Problema resuelto 3.42. Ley exponencial de fallas Ver el problema resuelto de página ConfiabilidadPR2. El sistema de controles de un modelo de aviones A es de tipo eléctrico y consiste en 3 circuitos en paralelo, A, B y C, para aumentar la redundancia, en serie con un sistema D. Por su lado, otro modelo de aviones B, tiene un sistema similar pero con 2 circuitos eléctricos en paralelo. Además tiene un sistema manual, mecánico de emergencia, C. Considerar que todos los sistemas tienen una ley de falla dad por una distribución exponencial con igual parámetro ω. Hallar la confiabilidad R(t) de cada sistema de control: a) avión A, b) avión B y luego la confiabilidad si ω = 0.0001 y el tiempo de operación es de 1000 horas. Ambos circuitos se muestran en la figura 3-100. 147 Capítulo 3 Distribuciones de Probabilidades Avión B Avión A Figura 3-100 Modelo A RABC (t ) = 1 − (1 − e−ωt )3 R(t ) = e−ωt (1 − (1 − e−ωt )3 ) Modelo B RAB (t ) = 1 − (1 − e−ωt )2 RABD (t ) = e−ωt (1 − (1 − e−ωt )2 ) ′ RABD (t ) = 1 − e−ωt (1 − (1 − e−ωt )2 ) R(t ) = 1 − (1 − e−ωt )(1 − e−ωt (1 − (1 − e−ωt )2 )) La confiabilidad para los valores numéricos establecidos resulta: RA = 0.904 RB = 0.997 Problema resuelto 3.43. Frecuencia de fallas variable La tasa de fallas h(t) de un componente está dada por: 0 ≤ t ≤ t0 ⎧C0 h(t ) ⎨ ⎩C0 +C1 (t - t0 ) t > t0 Obtener la PDF f(t) y la R(t). R(t) 0 ≤ t ≤ t0 t t t 0 0 0 ∫ h(t )dt = ∫ h(t )dt = ∫ C0 dt = C0t t > t0 t0 t t ∫ h(t )dt = ∫ C dt + ∫ C +C (t - t )dt = C t 0 0 0 0 t0 t ∫ h(t )dt = C t + 0 0 1 0 0 0 + C0t − C0t0 + C1 (t - t0 )2 2 C1 (t - t0 ) 2 2 Por lo tanto: t R (t ) = e 148 ∫ − h ( t ) dt 0 Jorge Carlos Carrá III Confiabilidad, R(t) – Distribución binormal ⎧e−C0t ⎪ R(t ) ⎨ −C t − C1 (t -t )2 0 0 2 ⎪⎩e 0 ≤ t ≤ t0 t > t0 f(t) t f (t ) = − R '(t ) = h (t )e ∫ − h ( t ) dt 0 ⎧C e−C0t ⎪ 0 f (t ) ⎨ C − C t − 1 ( t -t ) 2 ⎪⎩C0 +C1 (t - t0 )e 0 2 0 0 ≤ t ≤ t0 t > t0 149 Capítulo 3 Distribuciones de Probabilidades IV Teoría de los juegos La teoría de los juegos provee un modelo para tratar la complejidad relacionada con aprender a pensar e interactuar estratégicamente con otras personas, habilidad imprescindible para poder tomar decisiones inteligentes. La teoría de los juegos interactúa con más de una persona (acciones), con o sin la presencia de estados de la naturaleza (eventos). Por su parte, la teoría de las decisiones económicas que veremos luego involucra a una sola persona interactuando con estados de la naturaleza. Por esta razón, la teoría de los juegos también podría llamarse Teoría de la Decisión Multipersonal. Entre los beneficios de este modelo se encuentra el de proveer un sistema lógico con el cual poder analizar los razonamientos, además de un lenguaje común para poder dialogar y comunicar los resultados. Poder modelar todas las estrategias propias y del competidor, proporciona un mejor entendimiento de los escenarios posibles, con los cuales se puede saber, por adelantado, que conviene hacer y que no. Sin embargo debe decirse que, más que un modelo predictivo, es un modelo de cómo deberían comportarse las personas en las experiencias reales. De cualquier forma debe quedar claro que aquel que conoce la teoría de los juegos, estará en mejores condiciones de competir que el que no la conoce. Los economistas ganadores del Premio Nobel de Economía 2005, Robert J. Aumann y Thomas C. Schelling ganaron este premio por utilizar la teoría de juegos para explicar y facilitar la resolución de conflictos. En los siguientes apartados aplicaremos esta utilización entretenida de las matemáticas y de la estadística, a simples juegos de mesa o deportes, acciones de guerra, comportamiento de mercados competitivos, relaciones empresariales, disputas comerciales, crimen organizado, decisiones políticas, negociaciones salariales o discriminación racial y sexual. El término jugador podrá entonces identificar a personas, empresas, máquinas e incluso animales. Objetivo El objetivo del juego es encontrar una solución que implique la mayor ganancia estable, es decir la mejor posible dada la competencia, que buscará lo mismo que uno. La obtención de la matriz de ganancias para todas las acciones de una situación real determinada, puede ser la parte más difícil para el diseñador del juego y queda fuera del objeto de esta introducción, puesto que solo nos concentraremos en el análisis y resolución de juegos ya diseñados. De todas formas es oportuno aclarar que no se necesita conocer los valores de la matriz de pagos exactamente. Para analizar un juego basta con saber sus magnitudes relativas. Llamaremos: Acciones: alternativas controladas por el usuario. Eventos: alternativas no controladas por el usuario y asociadas con una distribución de probabilidades. Se suelen llamar también Estados de la Naturaleza. Estrategia Es una regla de decisión acerca de que acción elegir en cada instante del juego. 150 Jorge Carlos Carrá IV Teoría de los juegos – Distribución binormal Supuestos • • • Racionalidad Todos los jugadores actúan racionalmente buscando maximizar sus ganancias. Conocimiento Todos los jugadores conocen todas las reglas del juego. Conocimiento común Consiste en una iteración de lo que cada jugador sabe. Un jugador A sabe que otro jugador B es racional: S(R), donde S significa Sabe, R Racional y se sobrentiende que el ordenamiento alterna a los distintos jugadores. Además B sabe que A sabe que B es racional: S(S(R)) Además A sabe que B sabe que A sabe que B es racional: S(S(S(R))) y así sucesivamente hasta el infinito. Clasificación Los juegos pueden clasificarse de acuerdo a distintas consideraciones. 1. Cooperativos y no cooperativos En los juegos cooperativos los jugadores pueden hacer compromisos de cooperación al margen de los equilibrios del juego que veremos luego. En los no cooperativos, no pueden acordar entre ellos. Aquí solo trataremos a los no cooperativos. 2. Información completa o incompleta Se refiere a la información privada que un jugador tiene antes de comenzar el juego. Es incompleta cuando la naturaleza mueve primero y al menos un jugador no la observa. Solo trataremos juegos con información completa. 3. Información perfecta IP o imperfecta II La diferencia esencial se encuentra en la cantidad de información que tiene cada jugador a la hora de decidir (derivada de causas de orden legal, físico o técnico). Un juego es de información perfecta cuando el jugador conoce todo lo que desea antes de realizar su movida. El juego del ajedrez o el tatetí son juegos con información perfecta, en cambio el póker o el truco son con información imperfecta. 4. Simultáneo o secuencial Estos términos se relacionan con el tiempo y se refieren a si las jugadas se realizan en forma simultánea o luego de conocer la jugada del adversario. Naturalmente existen juegos que combinan ambas situaciones. En relación con la clasificación anterior, un juego simultáneo, tiene siempre información imperfecta. En cambio un juego secuencial puede tener cualquier tipo de información, lo cual se aprecia con los ejemplos secuenciales del ajedrez y el póker. Simultáneo ⇒ II IP ⇒ Secuencial La clasificación entre decisiones simultáneas o secuenciales se presenta rutinariamente en la competencia entre empresas. 5. Puro o mixto Se llama juego de estrategias puras, EP cuando éstas son deterministas (el resultado es alguna de las ganancias dadas). Se llama de estrategias mixtas, EM cuando en la elección de las mismas interviene además el azar y por lo tanto la teoría de probabilidades (el resultado es una distribución de probabilidades de las ganancias dadas). Un jugador buscará primero analizar si existen estrategias puras que le permitan establecer por adelantado todo lo que debe hacer. Cuando esto no es posible, lo mejor que puede hacer es ser impredecible, actuando aleatoriamente o en otras palabras, utilizando una estrategia mixta. Esto se observa claramente en juegos como el tenis en el que un jugador que no tiene un juego dominante, combina jugadas para aumentar su imprevisibilidad. 6. Suma cero o suma variable Un juego se llama de suma cero o también estrictamente competitivo, cuando la ganancia de 151 Capítulo 3 Distribuciones de Probabilidades uno es igual a la pérdida del otro, para todas las estrategias. En realidad la suma de ambas no requiere ser 0, sino un valor siempre constante k (por ejemplo 100 en porcentajes), por lo cual sería más correcto llamarlos de suma constante. De todas formas siempre es posible convertir las ganancias de un juego de suma constante en uno de suma cero, o viceversa, utilizando una simple transformación lineal de variables. Si las sumas de ganancias no es constante, se llaman de suma variable o de suma no cero y son los juegos más habituales. Los juegos de suma no cero de n jugadores se pueden convertir siempre en juegos de suma cero de n +1 jugadores, al adicionar un jugador no influyente llamado en inglés “dummy player”, el cual recibe la ganancia neta del juego, pero no puede interferir con el desarrollo del mismo. 7. Número de jugadores Los juegos pueden ser de 2 jugadores (2-personal) y de más de 2 jugadores (n-personal). Solo trataremos juegos de 2 jugadores. 8. Número de acciones El mínimo número de acciones para cada jugador es naturalmente 2. Si un juego es de 2 jugadores y cada uno solo tiene 3 acciones posibles se llama juego de 2 jugadores 3 × 3. 9. Número de repeticiones Juego de una sola ronda o estático: cada jugador juega una sola vez. Juego repetido: Cada jugador se encuentra varias veces con el otro, en el mismo juego. En este caso se presentan muchas formas en que esto puede hacerse: con repetición finita o infinita, con ganancias sumadas, promediadas, solo la última, etc. Dado que se tienen en cuenta los resultados de las jugadas anteriores, los jugadores pueden evaluar las acciones pasadas y determinar si deberían repetirla o cambiarlas. Utilidad La ganancia no tiene por qué ser solo monetaria, podrían ser tiempos, distancias, probabilidades, etc. Por otra parte, es conveniente resaltar que no todas las personas reaccionan de igual forma ante el riesgo. Así por ejemplo, una E(G) > 0, incluirá necesariamente eventos con pérdida y ganancia de dinero. Aunque la probabilidad de una pérdida sea baja, especialmente si el valor monetario de ésta pérdida es muy importante, una persona puede decidir no participar (y por lo tanto quedarse sin ganancias o pérdidas), debido a sus importantes consecuencias económicas. En cambio otra persona puede ser más proclive al riesgo y aceptar el juego sabiendo que puede hacerse más rica con rapidez, aceptando el riesgo de corto plazo. El análisis de estas posturas se puede resumir en 3 grandes grupos. Los evitadores de riesgos, los buscadores de riesgos y los indiferentes al riesgo. Esto se llama Teoría de la Utilidad. Se desarrolla una curva de utilidad para la persona, para luego convertir las sumas de dinero en utilidades, realizando el cálculo de la esperanza con estas últimas. Esta conversión no será tratada aquí. Dividiré esta sección en 4 partes: 1. Simultáneos con estrategias puras 2. Simultáneos con estrategias mixtas 3. Secuenciales 4. Teoría de las decisiones económicas 1 Simultáneos con estrategias puras a Formas del juego Se puede representar a un juego con 2 formatos: tabla y árbol. Forma normal o estratégica Todo juego debe incluir las ganancias (en general utilidades) para determinar cuánto gana o pierde cada jugador. Estas ganancias se pueden resumir en una tabla llamada tabla del juego o bimatriz de 152 Jorge Carlos Carrá IV Teoría de los juegos – 1 Simultáneos con estrategias puras ganancias. En cada fila o columna se encuentran las acciones posibles de cada uno de ellos. En cada celda se cruzan 2 acciones Acción A × Acción B. En ellas se ubican los resultados o ganancias de ambos jugadores. Convencionalmente se utiliza una bimatriz colocando primero la ganancia del jugador colocado en filas (A en la figura siguiente). Si el juego es de suma cero, el otro tendrá los mismos valores cambiados de signo (suma 0) o los valores complementarios (suma constante), por lo cual se sobreentienden y no se colocan. Acciones B b1 a1 GA11,GB11 b2 GA12,GB12 a2 GA21,GB21 GA22,GB22 Acciones A Figura 3-101 Tabla del juego puro Simetría Un juego es simétrico si la matriz de ganancias tiene simetría respecto de la diagonal principal (de izquierda a derecha y de arriba hacia abajo) atendiendo a los índices de posición de cada celda. La siguiente matriz de juego es simétrica. a1 Acciones B b1 b2 4,4 –3,5 Acciones A a2 5,–3 –6,–6 Figura 3-102 Tabla del juego puro Una celda es simétrica si ambos valores de ganancia son iguales. Por lo tanto los resultados a1b1 y a2b2 del juego de la figura anterior son simétricos. Forma extensiva Un árbol del juego es la expresión de la tabla en forma de árbol y se lo llama forma extensiva del juego. Recodemos que un árbol es un grafo, conjunto de nodos (puntos) unidos por ramas (rectas), tal que en cada nodo solo entra una rama. Repasar los conceptos de nodo inicial, nodos finales, rama, camino y estrella, vistos en el capítulo 2. En esta aplicación, a los nodos de decisión de cada jugador se los llama nodos de acciones y a los nodos de acción de la naturaleza, nodos de eventos. Se debería agregar además una columna adicional que contiene los valores de la variable G (equivalente a la matriz de ganancias). Sin embargo, el formato usual en teoría de juegos, es colocar en los nodos a los jugadores, en las ramas a las acciones y en los nodos finales a las ganancias de cada camino, en el orden en el que están los jugadores reales en el árbol, como indica la siguiente figura. La naturaleza no tiene ganancias, solo los jugadores reales las tienen. En el caso de estrategias mixtas y en los nodos de eventos de la naturaleza, se incluirán en las ramas también a las probabilidades. 153 Capítulo 3 Distribuciones de Probabilidades | | b1 | |B | | b2 | | | | b1. | | |B. | b2. | | a1 A a2 GA11,GB11 GA12,GB12 GA21,GB21 GA22,GB22 Figura 3-103 Árbol del juego puro Conjunto de información Una forma de diferenciar un juego simultáneo de uno secuencial es colocando una línea vertical (si el árbol se dibuja horizontal) al final de las acciones de cada jugador (ver figura). De esta forma se recuerda que el siguiente jugador no conoce lo que hizo el anterior (está impedido de "verlo" por este límite). Una forma alternativa es agrupando con un óvalo a los nodos que tienen información imperfecta, lo cual indica que no se sabe cuál de ellos se presentará en el juego (en la figura anterior los nodos B). Este conjunto de nodos se llama conjunto de información. Observar que: • El número de acciones de cada nodo en un conjunto de información debe ser idéntico para todos, de otra forma el jugador podría distinguir entre estos nodos. • Los conjuntos de información de los juegos con información perfecta, solo contienen un nodo, en tanto que los juegos con información imperfecta, contienen más de uno. b Equilibrio de Nash El concepto de equilibrio de Nash se aplica a la forma normal no a la forma extensiva. Estrategias dominantes En los juegos de 2 acciones es conveniente utilizar flechas para indicar el sentido de las ganancias dominantes, tal como se indica en la figura 3-104a. Las flechas verticales se refieren a las ganancias de A dentro de cada acción de B (recordar que es el primer valor dentro del paréntesis). Así por ejemplo la flecha vertical de la izquierda indica que dentro de b1 la ganancia de A con la acción a2 (2) es mayor que la de la acción a1 (1). Análogamente, la flecha horizontal superior hacia la izquierda indica que dentro de a1 la ganancia de B con la acción b1 (4) es mayor que la de la acción b2 (3). B B b1 a1 1,4 b2 3,3 a2 2,2 4,4 A b1 a1 1,4 b2 3,3 a2 1,2 4,4 A a 154 b Jorge Carlos Carrá IV Teoría de los juegos – 1 Simultáneos con estrategias puras Figura 3-104 En los juegos con estrategias puras, las acciones dominantes fuertes son las acciones que tienen ganancias dominantes para todas las elecciones. En la figura anterior la acción a2 es dominante fuerte pues todas las flechas verticales se dirigen a ella. Eso no sucede con las acciones de B, quien no tiene ninguna acción dominante (las flechas horizontales no tienen igual sentido). En particular, si un valor de salida es igual al de llegada, se representa por una flecha doble y si en este caso existe dominancia, se llama débil. En la figura siguiente la acción a2 es dominante débil. En los juegos con más de 2 acciones, más cómodo que las flechas, es el marcado de las ganancias dominantes en cada fila o columna, con un recuadro o asterisco. Lo mismo sucede con la representación en forma de árbol. Equilibrio de Nash La estrategia dominante se refiere a las filas o columnas, en cambio el equilibrio se refiere a los resultados o celdas (cruce de 2 estrategias llamada también, estrategia conjunta). La siguiente definición del equilibrio es debida al matemático norteamericano John Nash, quién recibió el premio Nobel de economía de 1994 por sus aportaciones a la teoría de los juegos, en especial la que se deriva de su tesis doctoral de 1951: Juegos no cooperativos. Observar que fue elaborada 43 años antes del premio5. Dos estrategias cruzadas conforman un equilibrio de Nash si ningún jugador tiene incentivos para cambiar la suya unilateralmente y por lo tanto lo mejor que puede hacer es quedarse en la estrategia elegida. Un equilibrio de Nash para estrategias puras se detecta cuando 2 flechas (o 2 marcas) se encuentran en una celda, pues en este caso cada jugador está utilizando la mejor estrategia dadas las estrategias de los demás. Cadena de conjeturas El análisis de juegos siempre se comienza pensando nuestra acción, la reacción racional del otro jugador, nuestra nueva reacción racional, …. De este análisis surge nuestra mejor estrategia en consecuencia. La palabra "pensando" es conducente en este párrafo pues al ser un juego simultáneo, todo este proceso solo tiene lugar en la mente de cada jugador. Apreciar que la reacción del otro se asociará con un perfil fila o columna. Observar el juego de la figura 3-104b. • Acción: el jugador B elige por ejemplo b1. • Reacción: el jugador A elegiría la acción dominante en ganancias a2, dado b1 (dentro del perfil b1). • Reacción: el jugador B elegiría la acción dominante en ganancias b2, dado a2. • Reacción: el jugador A seguiría eligiendo a2, con lo cual las acciones a2, b2, conforman un equilibrio estable. Formalmente se tienen las siguientes correspondencias6: RA (b1 ) = a2 RB (a2 ) = b2 RA (b2 ) = a2 5 Su vida fue llevada al cine en la película: "Una mente brillante", protagonizada por Russell Crowe. Este film narra sus dificultades para relacionarse con las personas, su esquizofrenia paranoide y sus delirios de persecución, todos los cuales finalmente pudo controlar. 6 Estas relaciones no son funciones pues podrían existir valores iguales y por lo tanto expresiones del tipo: RA (b1 ) = a2 , a3 , sin un valor único. Los economistas las llaman correspondencias. 155 Capítulo 3 Distribuciones de Probabilidades En síntesis, si el jugador B elige b2, entonces el jugador A elegirá a2, pues no tiene incentivos para cambiarla y tener mayores ganancias (y viceversa). El equilibrio se detecta comenzando desde cualquier acción de cualquier jugador. En la figura siguiente se aprecia este equilibrio con un diagrama de relaciones como el que se utiliza en matemáticas. Si B elige b2, A elige a2, y B se queda en b2, lo cual indica un punto de equilibrio estable. RB RA b1 a2 b2 RA. Figura 3-106 El valor de la ganancia en el equilibrio, se llama Valor del juego, en este ejemplo (4, 4). Los equilibrios pueden naturalmente también obtenerse tildando en la forma extensiva, como se muestra en la figura siguiente (con un * dentro de A y con un ' dentro de B). El equilibrio se detecta ahora cuando las 2 marcas se encuentran en el mismo nodo final. | | b1 | |B | | b2 | | | | b1. | | |B. | b2. | | a1 A a2 1,4* 3,3 2',2 4',4* Figura 3-107 Equilibrio de Nash Se deja al lector concluir que el juego de la figura 3-107 tiene 2 equilibrios de Nash. En general un juego puede tener 0, 1 o más equilibrios de Nash. Un equilibrio no produce necesariamente el mejor resultado posible para cada jugador individual, pero es una situación que conforma a todos ante la amenaza de resultados peores. Más adelante veremos cómo obtener (si existen) los equilibrios de Nash para estrategias mixtas. Teorema de Nash (Nash, 1951) Cualquier juego de n jugadores (de suma variable o constante), tiene al menos un equilibrio de Nash (puro o mixto). 156 Jorge Carlos Carrá IV Teoría de los juegos – 1 Simultáneos con estrategias puras Condiciones necesarias y suficientes para una solución Condición necesaria Un equilibrio de Nash es una condición necesaria (pero no suficiente) para ser solución del juego, esto es: Solución ⇒ Equilibrio Esto implica que una situación que no es un equilibrio, no puede ser solución. Pero un equilibrio podría presentarse con ambas estrategias no dominantes, dominantes o dominadas. Condición suficiente Una condición suficiente para una solución del juego en estrategias puras, es que el equilibrio de Nash sea con ambas estrategias dominantes. Equilibrio con estrategias dominantes ⇒ Solución Esto se comprende pues sería ilógico que una estrategia dominada sea solución. Conocimiento común Cuando las estrategias son dominantes, podemos visualizar una aplicación directa de la cadena de razonamientos llamada conocimiento común. Sea el juego de la siguiente figura. B b1 a1 1,4 b2 3,3 a2 3,3 4,2 A Figura 3-108 La racionalidad de A lo conduce a jugar la estrategia dominante a2 y la racionalidad de B, a jugar la estrategia dominante b1, por lo cual ambos pueden predecir el equilibrio. Utilizando el concepto de conocimiento común (página 151): • • • R: B es racional y elige b1. S(R): A sabe que B es racional y elige b1 => A elige a2 S(S(R)): B sabe que A elige a2 (B sabe que A sabe que B es racional y elige b1) = > B elige b1. En general son pocos los juegos que tienen este tipo de equilibrios (un ejemplo es el dilema del prisionero, en la sección problemas del final del capítulo). A diferencia de los equilibrios con estrategias no dominantes, estos equilibrios no dependen de las estrategias del otro. Como consecuencia, si un juego tiene estrategias dominantes no importa quién es el primero. Por lo tanto nos encontramos con un juego en el que con igual información, se presentan 2 formas extensivas equivalentes, cada una de ellas con los órdenes invertidos. Juego de suma cero Si en particular un juego es de suma cero, el máximo (mínimo) de una fila o columna de un jugador será el mínimo (máximo) del otro. En la siguiente figura se presenta un juego de suma 10. Se han colocado por esta vez también las ganancias de B, aunque sabemos que en estos juegos solo se colocan las de A (jugador de filas), pues las del otro se sobrentienden. En la figura se ha incluido una columna y una fila adicionales con los valores de ganancias máximas (expresadas en valores de A), las cuales facilitan la comprensión del siguiente análisis, que cada jugador pensaría antes de hacer su juego. 157 Capítulo 3 Distribuciones de Probabilidades • • • • Acción: A por ejemplo elige a1. Reacción: B elegiría la acción dominante en ganancias, b1, (coincidirá con el mínimo de A). Reacción: A elegiría la acción dominante en ganancias (máximo valor de esa columna), a2. Reacción: B elegiría la acción dominante en ganancias (máximo valor de esa fila), b1, (coincidirá con el mínimo de A). Observar que en este caso existe un equilibrio de Nash, la celda (a2, b1), pues B elige b1 y A se queda en a2, lo cual indica un punto de equilibrio estable. B b1 a1 1,9 b2 3,7 a2 2,8 4,6 A Figura 3-109 Como en los juegos de suma cero no se incluyen las ganancias de B, se debe tener en cuenta que las flechas de B resultan invertidas respecto de las ganancias de A. B a1 b1 1 b2 3 a2 2 4 A Figura 3-110 c Eficiencia y justicia Eficiencia Este concepto (como el equilibrio) se refiere a los resultados (celdas) y no a las estrategias (filas o columnas). Comparación local (uno a uno) Un resultado es Pareto Dominante o Dominante en Ganancias sobre otro, si las ganancias son al menos iguales a la del otro y una es estrictamente mayor. Si todas son estrictamente mayores, el resultado es estrictamente Pareto Dominante. Comparación global (todas las celdas) Un resultado es Pareto Eficiente si no es Pareto dominado por ningún otro. Si esto no ocurre, se dice que es Pareto Ineficiente. Un equilibrio no necesariamente coincidirá con un resultado Pareto Dominante o Pareto Eficiente, pudiendo existir un resultado Pareto Dominante o Eficiente que no es un punto de equilibrio. Como es un desequilibrio no puede subsistir y sus ganancias, aunque altas, son efímeras, por lo cual no debe ser considerado. Justicia Un resultado es justo si cada jugador gana lo mismo, es decir si es simétrico. Este concepto normalmente se encuentra en conflicto con el concepto de eficiencia, en el sentido de que eficiencia y justicia no puedan satisfacerse a la vez. Este conflicto aparece frecuentemente en economía, por lo cual no debe sorprender que lo haga en juegos de economía. 158 Jorge Carlos Carrá IV Teoría de los juegos – 1 Simultáneos con estrategias puras Juegos de coordinación Es habitual que 2 equilibrios (puros o mixtos) contrapongan características deseables, como por ejemplo: • Dos equilibrios eficientes (tienen iguales ganancias totales). Esto sucede siempre en los juegos de suma cero con 2 jugadores que presentan varios equilibrios puros. • Un equilibrio es eficiente y el otro es dominante. • Un equilibrio es eficiente y el otro es justo. En estos casos, con varias soluciones posibles, el juego se llama juego de coordinación. Si los jugadores desearan una estrategia común, deberán coordinar entre ellos dado que el que mueve primero tendrá una ventaja, pues induciría al otro a adoptar el mismo equilibrio. d Estrategias Minimax y MaxiMin MiniMax y Maximin Son definiciones aplicables a cualquier matriz (pertenezca o no a un juego). MiniMax Se halla el máximo de cada fila o columna y luego el mínimo de ese vector. MaxiMin Se halla el mínimo de cada fila o columna y luego el máximo de ese vector. A modo de ejemplo, en la figura siguiente se colocaron en los márgenes de la tabla, los máximos o mínimos de cada fila o columna con los subíndices R por Row (fila) y C por Column (columna). Luego se colocó un * o un ' para marcar los MiniMax y MaxiMin. MinC MaxR 1' 6 0 6 2 0 3* 3* 3 2 4 4 1' 0 0 MaxC 1 6 2 0 3 2* 3 6 MinR 0 0 3 0 4' 2* 4' Figura 3-111 Aplicación a la forma normal de un juego A modo de ejemplo aplicaremos los conceptos de MiniMax o MaxiMin a la bimatriz de un juego. a1 Acciones B b1 b2 –3',5 4,4 MaxR 5 Acciones A MaxC a2 5,–3* 5 –6,–6 –3' –3* Figura 3-112 Minimax Estrategia MiniMax (con la matriz del adversario) Supongamos que nos enfocamos en las estrategias de A. • Acción: A elige una acción cualquiera (fila). • Reacción: la estrategia usual de B es elegir la dominancia de sus ganancias en esa fila, Max(B) (máximo dentro de ese perfil fila). 159 Capítulo 3 Distribuciones de Probabilidades Consecuencia Si A prevé que B tenga la estrategia de dominancia en sus ganancias, elegiría de entrada la fila que contenga el mínimo de esos máximos (la solución menos mala), esto es el Mini(Max(B))7, al que llamaremos simplemente MiniMax de B. B luego elegiría la celda de ese MiniMax. ¿Podrá B terminar eligiendo el Mini(Max(A))? Esto ocurre algunas veces y será desarrollado en la siguiente sección. En la figura anterior se colocaron en la columna marginal los máximos que puede elegir B a cada acción de A (máximos de fila = MaxRow) y en la fila marginal los máximos que puede elegir A para cada acción de B (máximos de columna = MaxColumn). Se colocó una marca * al lado de cada ganancia para resaltar el MiniMax de fila y un tilde ' para el MiniMax de columna. Columna : MiniMaxR = −3 Fila : MiniMaxC = −3 Observar que la intersección de ambas acciones no se encuentra en la misma celda. Estrategia MaxiMin (con la matriz propia) • • Acción: A elige una acción cualquiera (fila). Reacción: en lugar de maximizar sus ganancias, B podría optar por elegir como estrategia mínimizar las ganancias de A, Min(A) (la cual es una acción algo paranoica). En este caso le convendrá a A calcular previamente el máximo de esos mínimos, lo cual lo conduce a la estrategia llamada Maxi(Min(A))8, es decir el MaxiMin de A. Ambas estrategias se llaman estrategias conservadoras o de seguridad y por lo tanto son contrarias a la expresión de mercado: mayor riesgo, mayor beneficio: No es aplicable, por ejemplo, en la apertura de un mercado si una empresa busca captar mayor participación, en donde se debería pretender bastante más que una estrategia mínima de seguridad para explotar las debilidades del adversario. El valor numérico del MiniMax (o del MaxiMin) se llama nivel de seguridad. Equilibrio MiniMax o MaxiMin Sucede cuando el par de estrategias (acciones elegidas) de ambos jugadores se interceptan en la misma celda. Equilibrio MiniMax -MiniMax Se presenta cuando ambos usan la estrategia MiniMax (por lo tanto utilizan la bimatriz) y se cumple que: MiniMaxR ≡ MiniMaxC En los juegos de suma no cero, no tiene porque existir o coincidir con el equilibrio de Nash (que siempre existe). Equilibrio MaxiMin -MaxiMin En forma totalmente análoga se puede analizar si existe equilibrio cuando los jugadores deciden minimizar las ganancias del otro en lugar de maximizar las suyas (por lo tanto usan la bimatriz). 7 El anidamiento indica las estrategias de cada jugador, en este caso: A(B). El anidamiento indica las estrategias de cada jugador, en este caso nuevamente: A(B). Jorge Carlos Carrá 160 8 IV Teoría de los juegos – 1 Simultáneos con estrategias puras Equilibrio MaxiMin -MiniMax Si un jugador, por ejemplo B, utiliza la estrategia MaxiMin y el otro A, la estrategia MiniMax, ambos jugadores utilizarán una sola matriz para el análisis, en este ejemplo solo la matriz de B. Punto de silla Es una propiedad que tienen algunas matrices, por la cual el mínimo de fila coincide con el máximo de columna. Por esta razón, a este punto se lo llama punto de silla, dada la semejanza con la silla de montar en la cual existe un punto que cruza el mínimo en una dirección (curva cóncava hacia arriba) con el máximo en la dirección perpendicular (curva cóncava hacia abajo). Este punto, si existe, no tiene que ser necesariamente único. En la figura siguiente la celda sombreada contiene el máximo de su columna y el mínimo de su fila. MaxC 0 4 9 9 1 2*' 0 2' 7 3 0 7 MinR 0 2* 0 Figura 3-113 Punto de silla Se puede demostrar el siguiente teorema: La condición necesaria y suficiente para un equilibrio MaxiMin–MiniMax, es que esa celda sea un punto de silla. Observar que el punto de silla requiere que sea la misma matriz para ambos jugadores, por lo cual el equilibrio debe ser MaxiMin–MiniMax. En la figura siguiente, la celda inferior izquierda es un punto de silla, pues el 2 es el máximo de su columna y el mínimo de su fila. Si suponemos ahora que esta matriz representa la ganancia de A de un juego, el punto de silla sería el punto de equilibrio de las estrategias MaxiMin–MiniMax, pues A elegiría la acción a2 del MaxiMinR y B la acción b1 del MiniMaxC9. La estabilidad del punto de equilibrio se percibe razonando así: • Acción: si por ejemplo A eligiera a1. • Reacción: B elegiría b1. • Reacción: A elegiría a2. • Reacción: B elegiría b1. Observando las 3 últimas reacciones, se aprecia la estabilidad del la estrategia a2-b1. G(A) a1 Acciones B MinR b1 b2 3 1 1 Acciones A MaxC a2 2*' 2' 4 4 2* Figura 3-114 Punto de silla 9 Esto también ocurrirá si esta matriz fuera de un juego de suma constante (por ejemplo igual a 10). 161 Capítulo 3 Distribuciones de Probabilidades e Juegos de suma cero MiniMax = MaxiMin En estos juegos se verifica que el MaxiMin de una matriz es siempre igual al MiniMax de la otra. Equilibrio Como es un juego de suma cero se podrían utilizar siempre los valores de las ganancias de un solo jugador en el análisis y por lo tanto una sola matriz. Si por ejemplo se utilizan solo las de A, se tiene: • • • Acción: A elige una acción. Reacción: B elegiría el mínimo de esa fila Min(A) (coincidirá con el máximo de la fila de su matriz). Reacción: A concluirá que su solución menos mala será el máximo posible de estos valores, es decir el MaxiMin de A. Se llega a la misma estrategia utilizando la matriz de ganancias de B. Sin embargo, estas estrategias no necesariamente coincidirán en la misma celda. Teorema MiniMax (Von Neumann, 1928) Cualquier juego de 2 jugadores de suma constante, tiene exactamente un equilibrio MiniMaxMaxiMin (puro o mixto). Obviamente que si el equilibrio fuera puro sería un punto de silla. Se aprecia que este teorema un caso particular del teorema de Nash, aplicable a cualquier juego. En un juego de suma constante, el equilibrio de Nash coincide con el equilibrio MiniMax. Esta analogía solo es válida para juegos de 2 jugadores. Ejemplo En la figura 3-115 se presenta un juego de suma constante 10, con las matrices de A y de B. B G(A) b1 a1 1 b2 3' MinR a2 MaxC b1 a1 9 1 A B G(B) b2 7' MaxR 9 A 4 4 2* 3' 2* a2 MinC 6 6 a 8* 7' 8* b Figura 3-115 Observando la columna marginal de ambas figuras a y b, se obtienen los siguientes valores, el primero calculado con las ganancias de A y el segundo con las ganancias de B. Corresponden a la acción a2. MaxiMinR = 2 ≡ MiniMaxR = 8 En forma análoga, observando la fila marginal, se obtienen los siguientes valores, el primero calculado con las ganancias de B y el segundo con las ganancias de A. Corresponden a la acción b2. MaxiMinC = 7 ≡ MiniMaxC = 3 162 Jorge Carlos Carrá IV Teoría de los juegos – 1 Simultáneos con estrategias puras Observar que esta matriz no posee un equilibrio MiniMax en estrategias puras. En la sección siguiente se estudiará como calcular el equilibrio en estrategias mixtas. Problema resuelto 3.45 Sistemas de video Una empresa debe decidir entre adoptar la tecnología de un sistema de video VHS o la de Beta. Ambos son igualmente buenos, pero una vez adoptada una tecnología, no podrá trabajar con la que utilice la otra. La matriz de pagos se muestra en la siguiente figura. Obtener las estrategias MiniMax, los equilibrios puros de Nash, la eficiencia; los valores del juego e interpretar la situación. B Beta Beta 1,1 VHS 0,0 VHS 0,0 1,1 A Figura 3-116 Solución Colocando los máximos de columna y de fila y las flechas, resulta la siguiente tabla: B Beta Beta 1',1* MaxR VHS 0,0 1* A VHS MaxC 0,0 1' 1',1* 1' 1* Figura 3-117 Equilibrio MiniMax-MiniMax Columna : MiniMax ( para A) = 1 Fila : MiniMax( para B ) = 1 Se encuentran 2 celdas en las que coinciden los MiniMax. Equilibrio de Nash Con las flechas se aprecia que ninguna acción es dominante. Los equilibrios MiniMax coinciden aquí con los 2 equilibrios de Nash, en los cuales las empresas elegirían el mismo sistema. Valores del juego Los valores del juego son 1, 1 para ambos jugadores en ambos equilibrios. Eficiencia Como los equilibrios no son dominantes y la eficiencia es igual para ambos, nos encontramos en un juego de coordinación, en el que ambas empresas deberían coordinar una única estrategia. 163 Capítulo 3 Distribuciones de Probabilidades Problema resuelto 3.46 El juego de la contaminación Una empresa preferiría contaminar a instalar un caro sistema para controlar la contaminación. La siguiente tabla muestra los beneficios para todos los cruces. Obtener las estrategias MiniMax, los equilibrios puros de Nash, la eficiencia, los valores del juego e interpretar la situación. B Poca contaminación Mucha contaminación Poca contaminación 100,100 –30,120 Mucha contaminación 120,–30 100,100 A Figura 3-118 Solución Colocando los máximos de columna, de fila y las flechas, resulta la siguiente tabla: B Poca contaminación Poca contaminación Mucha contaminación MaxR 100,100* –30,120 100* 120,–30 100',100* 100* 120 100' A Mucha contaminación MaxC Figura 3-119 Equilibrio MiniMax-MiniMax Estrategias MiniMax Columna : MiniMaxR = 100 Fila : MiniMaxC = 100 La estrategia conjunta Mucha Contaminación – Mucha Contaminación es un equilibrio MiniMax-MiniMax. Equilibrio de Nash Es la celda en que ambas empresas eligen Mucha contaminación. La acción Mucha contaminación es dominante para la empresa A. Cuando un jugador A tiene una estrategia dominante y el otro B no, B debe suponer que A la va a elegir y por lo tanto elegirá la mejor jugada dado este supuesto. En este caso, B elegiría Mucha contaminación. Valor del juego El valor del juego del equilibrio de Nash es 100 para ambos jugadores. 164 Jorge Carlos Carrá IV Teoría de los juegos – 1 Simultáneos con estrategias puras Eficiencia El equilibrio de Nash no es eficiente pues no domina al resto de las ganancias. Observar que el equilibrio de Nash es en este caso antisocial. El mercado no siempre conduce al resultado deseable. El estado puede resolver este problema con exenciones impositivas para imponer un equilibrio en la celda superior izquierda. Problema resuelto 3.47 Competición Cournot10 Un juego simultáneo en el que dos firmas compiten en cantidades, se llama modelo de competencia de Cournot, debido al economista francés Agustín Cournot, quien lo estudió por primera vez en 1838, apareciendo en el último capítulo de su libro, Recherches sur les príncipes mathématiques de la Theorie des richesses. Cuando la competencia simultánea es en precios, se llama competencia de Bertrand, cuando la competencia es secuencial en cantidades se llama de Stackelberg y cuando es secuencial en precios se llama Liderazgo en precios. Sea un duopolio11 conformado por 2 chocolaterías A y B que desean maximizar sus beneficios y cuyas cantidades de unidades enviadas al mercado llamaremos qA y qB. La ley de la oferta y la demanda establece que los precios y las cantidades se relacionan en forma inversa. Asumiremos que el precio de mercado P se determina por la demanda, en función de la siguiente ecuación lineal: P = a − b( q A + qB ) si a > b( q A + qB ) P=0 en caso contrario Observar que P es función de la cantidad que producen ambas empresas, debido a lo cual aparece entre ellas una relación estratégica. Supongamos que a = 130, b = 1 y el costo C = 10$ para ambas firmas. Además consideremos por simplicidad que solo existen 3 posibles cantidades qi, 30, 40 y 60. a) Construir la matriz de pagos. b) Obtener los equilibrios puros de Nash, los valores del juego y la eficiencia. Interpretar. Solución a) Resolviendo P para cada valor de los cruces, se obtiene la siguiente tabla de ganancias. Recordemos que en los paréntesis, convencionalmente se colocan primero las ganancias del jugador colocado en filas, es decir A. Por ejemplo, si A elige q1=30 y B elige q2=60, se tiene: P = 130 − (30 + 60) = 40$ Por lo tanto, • La ganancia para A es: ( P − c)q1 = (40 − 10)30 = 900$ . • La ganancia para B es: ( P − c)q2 = (40 − 10)60 = 1800$ . 10 Ejemplo tomado de Gardner, 1995, Games for Business and economics, pag 136. Un oligopolio es una industria formada por n empresas con capacidad para modificar los precios en función de su producción. En particular si n = 2 se llama duopolio. Lo contrario se llama competencia perfecta. 11 165 Capítulo 3 Distribuciones de Probabilidades qB1=30 qA1=30 1800,1800 B qB2=40 1500,2000 qB3=60 900,1800 A qA2=40 2000,1500 1600,1600 800,1200 1200,800 0,0 qA3=60 1800,900 Figura 3-120 b) Eliminación de estrategias fuertemente dominadas Se observa que en este problema, las acciones 3 para ambas fábricas son estrategias fuertemente dominadas. Estas acciones pueden eliminarse del análisis pues nunca serán elegidas. Se obtiene así la tabla reducida siguiente. B qB1=30 qA1=30 1800,1800 qB2=40 1500,2000 qA2=40 2000,1500 1600,1600 A Figura 3-121 Repitiendo la reducción de estrategias fuertemente dominadas, se eliminarían las acciones 1 de cada fábrica, resultando como equilibrio de Nash, la estrategia de elegir la acción 2 para ambas empresas. Cada empresa producirá 40 unidades y por lo tanto el precio de mercado será: P = 130$ − 2(40)$ = 50$ 40$ por arriba de los costos (10$), lo cual produce unos beneficios totales de 1600$. Nota Por la condición de suficiencia antes vista (página 157), al eliminar estrategias débilmente dominadas, se pierden los equilibrios de Nash que pudieran existir en estas estrategias. Un método alternativo es el siguiente. Celda por celda Colocar las flechas verticales y horizontales indicando el sentido de las ganancias. La tabla resulta: B qB1=30 qA1=30 1800,1800 qB2=40 1500,2000 qA2=40 2000,1500 1600,1600 A Figura 3-122 Si existe una celda en la que concurren todas las flechas, será la estrategia común para ambos jugadores, en este caso la celda (1600,1600). Este es entonces el equilibrio de Nash de esta competición y 1600 es el valor del juego. Ambas fábricas elegirían las producciones de 40 unidades pues es la mejor estrategia dada la estrategia del otro. Eficiencia Observar que la solución es ineficiente pues existe una situación (1800,1800) con ganancia s mayores para los jugadores, pero que no es un equilibrio. 166 Jorge Carlos Carrá IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas 2 Simultáneos con estrategias mixtas El equilibrio de estrategias mixtas implica volverse impredecible. Esto es deseable en el caso de que no exista un equilibrio de estrategias dominantes, pues evitará conductas sistemáticas que puedan ser aprovechadas por el otro jugador. Esta conducta es la que se observa por ejemplo en los jugadores de póker que desean tener algún tipo de éxito. Una estrategia mixta es una distribución de probabilidades sobre el conjunto de estrategias. Por lo tanto: p1a1 + p2 a2 + ... pn an = 1 La selección de cualquiera de las acciones es un evento aleatorio para el jugador. Como resultado, cada jugador aleatoriza su decisión, algunas veces elige la acción a1, otras veces la a2, etc. En este sentido, su estrategia resulta una mezcla aleatoria de las estrategias puras. a Formas del juego Forma normal Además de la tabla de ganancias, se debe incluir la tabla de contingencias con las probabilidades de cada acción. Llamamos: pA = probabilidad de que A juegue la acción a1. pB = probabilidad de que B juegue la ación b1. Dado que las acciones son independientes entre sí, resulta entonces el esquema que se muestra en la siguiente figura, con la tabla de contingencias y la de ganancias en una sola tabla. Acciones B b1 b2 T a1 GA11, GB11 GA12, GB12 pApB pA pA(1–pB) Acciones A a2 GA21, GA21 GA22, GB22 (1- pA)pB (1–pA)(1–pB) 1- pA T pB 1–pB 1 Figura 3-123 Tabla del juego mixto Forma extensiva Un árbol del juego sería simplemente el árbol de probabilidades condicionales correspondiente a la tabla anterior (recordando que los eventos son independientes), adaptado al formato habitual en la teoría de juegos. 167 Capítulo 3 Distribuciones de Probabilidades pA a1 A (1-pA) a2 | | pB b1 | | |B | | (1-pB) b2 | | | pB b1. | | |B. | | (1-pB) b2. | GA11, GB11 pApB. GA12, GB12 pA(1-pB) GA21, GB21 (1-pA)pB GA22, GB22 (1-pA)(1-pB) Figura 3-124 b Equilibrio de Nash El equilibrio de Nash de estrategias mixtas se materializa con la obtención adecuada de los valores de pA y pB necesarios para que cada jugador maximice sus respectivas ganancias. Esta estrategia también es llamada estrategia óptima. Si un juego verifica la condición suficiente de solución de un equilibrio puro con estrategias dominantes (página 157), no existirá un equilibrio en estrategias mixtas y por lo tanto finaliza el análisis. Esto se comprende pues sería ilógico que se le asignara una probabilidad a la estrategia dominada. De todas formas, si se resolviera por el enfoque de estrategias mixtas, se obtendría un valor de probabilidad mayor que 1 o menor que 0, lo cual indica esta situación al modelador. Esto se podrá apreciar desde el punto de vista gráfico en el siguiente problema resuelto. La esperanza obtenida es el valor del juego y será favorable a alguno de ellos o 0. En este último caso se dice que el juego de 2 jugadores 2 × 2 de suma cero, es neutro. Sin embargo, el valor del juego es en este caso un valor al cual tenderá la ganancia del promedio de muchos juegos. Si el número de repeticiones no es muy alto, la suerte podrá aumentar o disminuir la ganancia. Existen 3 métodos de resolución. A continuación los describiré conceptualmente y dejaré los detalles para el próximo problema resuelto. 1 Método de maximización Consiste aplicar el análisis infinitesimal a la expresión general de la ganancia conjunta del juego, para obtener el valor máximo de la misma. Por lo tanto primero deberá derivarse la misma respecto de sus variables pA y pB y luego igualar esta expresión a 0. La resolución proveerá los valores de pA y pB. Notar que al derivar respecto de una probabilidad se considera a la otra como si fuera constante. Esto solo es verdad en el equilibrio. 2 Método de igualación de ganancias Este método se basa en la igualación de ganancias esperadas. En un juego de n×m se llega a un sistema superdeterminado (más ecuaciones que incógnitas).Los dos métodos principales de resolución de estos sistemas son el de mínimos cuadrados ya visto en la 168 Jorge Carlos Carrá IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas regresión (capítulo 1) y la programación lineal12. Sin embargo, podremos resolver los siguientes dos casos particulares sin usar ninguna de estas técnicas: • Juegos n×n En estos casos se llega a un sistema determinado, el cual se resuelve como es habitual. • Juegos 2×n El sistema es superdeterminado pero al ser 2 el número de filas o columna), se puede resolver en forma gráfica en el plano. Ambas situaciones se presentan en el siguiente problema resuelto. 3 Método de Williams Es el resultado de la aplicación de la geometría a 2 triángulos semejantes que se encuentran en la solución gráfica del método de igualación de ganancias de un juego 2×2. c Funciones de mejor respuesta (BRF, Best Response Function) Son las gráficas de una probabilidad pA en función de la otra pB. Se construirán luego en un problema resuelto. Problema resuelto 3.48 Estrategia de juego en el saque Un jugador de tenis sabe que cuando espera el saque, no debe decidirse a cubrir un determinado lado de la cancha hasta el último momento pues de lo contrario el sacador puede aprovecharse y tirar la pelota en sentido contrario. Si bien las decisiones son simultáneas, predecir la jugada del contrario tiene muchas ventajas. Supongamos que los jugadores Del Potro, S (Sacador) y Federer, R (Receptor) tienen una matriz de ganancias como la de la figura siguiente. Estas probabilidades pueden ser calculadas de las estadísticas correspondientes a los partidos previos entre ambos. Indican por ejemplo que si R prevé correctamente el saque derecho, tiene éxito el 90% de las veces. Apreciar que este es un problema de suma cero pero el procedimiento es totalmente general. Luego en los problemas finales se pedirá resolver por ejemplo el juego del gallina, de suma no cero. Del Potro Sacador Derecho Revés Derecho 90% 20% Federer Receptor Revés 30% 60% Figura 3-125 Obtener los equilibrios de Nash (puros y mixtos) e interpretarlos. Compararlos con los equilibrios MiniMax. ¿Son los equilibrios eficientes? Solución Primero se debe analizar la existencia o no de estrategias puras dominantes (fila o columna con valores sistemáticamente superiores a la otra). De la siguiente tabla se concluye que en este caso no existen estrategias puras dominantes para las ganancias de ninguno de los jugadores. Además, por ser un juego de suma cero, los equilibrios de Nash coinciden con los equilibrios MiniMax. 12 El objetivo de esta técnica es optimizar (en general maximizar), una ecuación W = f(X,Y,Z,…, con inecuaciones de vínculo (desigualdades en lugar de igualdades). Se llama lineal pues todas las ecuaciones e inecuaciones son lineales. Scheid, F. 1972, pag 368. 169 Capítulo 3 Distribuciones de Probabilidades Federer Receptor Del Potro Sacador Derecho Revés Derecho 90% 20% Revés 30% 60% Figura 3-126 1 Método de maximización El paso siguiente es analizar las estrategias mixtas, debido a lo cual, en la siguiente tabla se muestran las probabilidades pR y pS de que el receptor prevea un saque derecho o que el sacador realice un saque derecho. El método de maximización consiste en obtener los valores de pR y pS de la distribución conjunta. Si se expresa en forma tabular, se obtiene la tabla de la siguiente figura. Del Potro Sacador 1 Derecho 2 Revés T 20% 1 Derecho 90% pR (1- pS) pR pR pS Federer 60% 2 Revés 30% Receptor (1- pR) pS (1- pR)(1- pS) 1- pR T pS 1- pS 1 Figura 3-127 La expresión de la ganancia conjunta del receptor es: GR = pR ((90 pS + 20(1 − pS )) + (1 − pR )(30 pS + 60(1 − pS )) = = pR (70 pS + 20) + (1 − pR )(−30 pS + 60) = = pR (100 pS − 40) + 60 − 30 pS Diferenciando con respecto de pR, se obtiene: 100 pS − 40 = 0 ⇒ pS = 0.40 GR = 48% Observar que si el sacador utiliza este valor de pS, no interesa cual sea el valor de pR que elija el receptor, pues en la ecuación de GR se anula el término que contiene a pR. Una breve reflexión indicará que esto siempre ocurrirá (en un juego de 2 jugadores 2×2), dado el formato con el que resulta la ecuación. Análogamente para la ganancia del sacador (utilizando en la matriz de ganancias, las complementarias de las anteriores), resulta: GS = pS ((10 pR + 70(1 − pR )) + (1 − pS )(80 pR + 40(1 − pR )) = = pS (−60 pR + 70) + (1 − pS )(40 pR + 40) = = pS (−100 pR + 30) + 40 + 40 pR Diferenciando con respecto de pS, se obtiene: −100 pR + 30 = 0 ⇒ pR = 0.30 GS = 52% Nuevamente observar que si el receptor utiliza este valor de maximización de ganancias, no interesa cual sea el valor de pS que elija el sacador, pues en la ecuación de GS se anula el término que contiene a pS. Es decir que la 170 Jorge Carlos Carrá IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas maximización de la ganancia conjunta en un juego de 2 jugadores 2×2, equivale a la obtención de un pR tal que esa ganancia sea independiente de pS. De esta forma se minimiza la habilidad del oponente de reconocer comportamientos sistemáticos en nuestras propias elecciones y nada de lo que haga afectará el resultado. Para que estos resultados tengan validez, deben ser aplicados en forma totalmente aleatoria (por ejemplo mirando la posición del minutero de un reloj, asignando sectores o cuadrantes al tiro derecho y al revés). De todas formas recordar que las ganancias tenderán a los valores esperados del juego, solo si el número de repeticiones es suficientemente grande. Las ganancias del equilibrio mixto son (48, 52), por lo tanto la estrategia es Pareto Ineficiente pues sus ganancias no son iguales o mayores que las de cualquier otro resultado. Además, esta solución no domina a ninguna de las estrategias de la matriz del juego (la bimatriz se muestra en la figura siguiente). Claramente, si existieran estrategias puras y mixtas, debería elegirse aquella que domine en ganancias. La matriz de ganancias con las probabilidades encontradas se muestra en la figura siguiente. Así por ejemplo se extrae que si ambos jugadores utilizan sus estrategias mixtas, la probabilidad de que el Sacador lo haga con el revés y el Receptor reciba también con el revés es del 42%, con las cuales el Receptor tendrá una probabilidad de éxito del 60% (ganancia de 60). Del Potro Sacador 1 Derecho 2 Revés T 1 Derecho (90,10) (20,80) 0.12 0.18 0.3 Federer 2 Revés (30,70) (60,40) Receptor 0.28 0.42 0.7 T 0.4 0.6 1 Figura 3-128 2 Método de la igualación de ganancias Utilizando el concepto deducido en el método anterior, la maximización de ganancias conduce a que cada jugador obtenga siempre la misma ganancia esperada con independencia de la acción del otro jugador13 .Esto implica igualar las esperanzas dentro de cada perfil (luego se ampliará el concepto para cualquier juego de 2 jugadores, no solo de 2×2). Para igualar los pagos se ha agregado a la tabla una columna y fila marginal, que contienen las expresiones de las esperanzas dentro de cada perfil. Observar que para obtener estas ecuaciones, se deben utilizar las ganancias de la distribución que corresponda. Del Potro Sacador 1 Derecho 2 Revés T (20,80) 1 Derecho (90,10) 70pS+20 pR pR (1-pS) pR pS 2 Revés (30,70) (60,40) Federer -30pS+60 (1-pR) pS (1-pR)(1-pS) 1-pR Receptor T pS 1-pS 1 -60pR+70 40pR+40 Figura 3-129 13 Además de ser los perfiles fila (columna) iguales entre sí por tratarse de eventos independientes. 171 Capítulo 3 Distribuciones de Probabilidades Analíticamente ER1 = 70 pS + 20 ER 2 = −30 pS + 60 Observar que si el sacador S eligiera pS =1, es decir siempre juega Derecho, la esperanza de S, si solo juega Derecho, daría ER1 = 90, el cual naturalmente coincide con el valor de la celda superior izquierda. Análogamente se puede analizar el valor pS = 0 y la otra ecuación. Igualando las esperanzas, se llega a un sistema de 2 ecuaciones con 2 incógnitas, al que procedemos a resolver. 70 pS + 20 = −30 pS + 60 ⇒ pS = 0.40 Del Potro debe sacar el 40% de los tiros de derecha y el 60% de revés. Análogamente: ES1 = −60 pR + 70 ES 2 = 40 pR + 40 −60 pR + 70 = 40 pR + 40 ⇒ pR = 0.30 Federer debe posicionarse para recibir el 30% de los tiros de derecha y el 70% de revés. El valor del juego para cada jugador se obtiene reemplazando el valor obtenido en cualquiera de los miembros de la igualdad. GR = 48% GS = 52% Se obtienen así los mismos valores que con el método anterior. Diagrama de árbol Contiene los valores condicionales, los conjuntos y las ganancias. Notar que las ganancias se colocan en el orden en el que se construye el árbol. 0.40 Derecho . Del Potro 0.60 Revés | 0.30 Recibe | Derecho (10,90) | | |Federer | 0.70 Recibe (70,30) | Revés | | 0.30 Recibe | Derecho. (80,20) | | Federer. | | | | 0.70. Recibe (40,60) Revés. Figura 3-130 172 Jorge Carlos Carrá 0.12 0.28 0.18 0.42 IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas Comprobar que los valores del juego para cada jugador, dada cualquier acción del otro, se pueden obtener también del diagrama de árbol. Así por ejemplo: GFederer|Derecho = 0.3(90) + 0.7(30) = 48% . Gráficamente Estas ecuaciones pueden resolverse en forma gráfica, dibujando las esperanzas ER1 y ER2 en un solo diagrama. Figura 3-131 En la figura anterior puede verse que la combinación 40:60 del sacador es la mejor que tiene el servicio pues es la única que no puede ser aprovechada por el receptor. Si el sacador S eligiera cualquier otra estrategia, por ejemplo 30%, el receptor R contestará con la estrategia ER2 anticipando al revés, lo cual le proporcionaría un porcentaje de éxito de 51%, superior al 48%. En el límite, si S eligiera pS = 0%, es decir sacando siempre de revés, R tendría una ganancia de 60%, tal como indica la matriz de pagos. Lo mismo sucede si por ejemplo S eligiera el 50%, pues R contestaría eligiendo la estrategia ER1, anticipando a la derecha, con un porcentaje de éxito de 55%, superior al 48%. Es por esto que el punto 40:60 es ciertamente un punto de equilibrio, en el sentido de que cualquier alejamiento de él, nos retorna al mismo. Matemáticamente: pS < 0.4 ⇒ pR = 0 pS = 0.4 ⇒ ∀pR pS > 0.4 ⇒ pR = 1 Observar además que este razonamiento se corresponde con una estrategia MiniMax del Sacador, pues: • Acción: S elige una estrategia. • Reacción: R elige la dominancia de sus ganancias. Dado que las rectas corresponden a las ganancias del receptor, los valores máximos que elegiría racionalmente el Receptor, se encuentran en la poligonal superior. Debido a esto, el Sacador reaccionaría con el mínimo de esos valores, es decir el vértice inferior de esa poligonal. Razonando en forma análoga, en la figura siguiente puede verse que la combinación 30:70 del receptor es la mejor que tiene, pues es la única que no puede ser aprovechada por el sacador. Cualquier otra, si se aprovecha por el sacador, le proporciona un porcentaje superior al 52%. 173 Capítulo 3 Distribuciones de Probabilidades Figura 3-132 Matemáticamente: pR < 0.3 ⇒ pS = 1 pR = 0.3 ⇒ ∀pS pR > 0.3 ⇒ pS = 0 Notas 1. Pueden dibujarse ambas rectas a partir de los 2 valores extremos (ver figuras anteriores), valores que pueden leerse directamente en la bimatriz, en una posición cuyo patrón podrá el lector fácilmente encontrar y recordar. 2. La grafica de estas rectas puede anticipar la existencia o no de solución real, es decir con la intersección de las mismas dentro del intervalo [0, 1]. Si la intersección se presenta fuera de este intervalo, o no existe, entonces podrá decirse que no se presenta un equilibrio en estrategias mixtas. Juegos 2×n El MiniMax para un juego de 2×2, consiste en la igualdad de esperanzas, pero esto ya no es cierto para un juego de 2×n. Si por ejemplo fuera un juego de 2×3, se tendrían 3 rectas E1, E2 y E3, como se muestra en la figura siguiente. 174 Jorge Carlos Carrá IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas Figura 3-133 En este caso, el equilibrio no consiste en igualar las 3 esperanzas entre sí, sino en encontrar el vértice inferior del polígono delimitado por los ejes y la parte superior de las rectas, pues para cualquier otro valor, el oponente contestará con una estrategia que le produce mayor ganancia. En la figura, este vértice inferior corresponde a la igualación de E1 con E2. Observar que si se calculara el valor p correspondiente a la igualación entre E2 y E3, el oponente B contestará con la estrategia E1, pues le produce una mayor ganancia y por lo tanto no sería la estrategia óptima. Este es un problema típico de programación lineal pero, como puede apreciarse, se resuelve perfectamente graficando las rectas y hallando la intersección que corresponda al vértice más bajo de la poligonal superior. Juegos n×n En este caso simplemente deberá resolverse el sistema determinado de n ecuaciones con n incógnitas, en forma similar al del sistema de 2 ecuaciones con 2 incógnitas correspondiente a este ejemplo. 3 Método de Williams Método solo válido para un juego 2×2. Comparando los 2 triángulos semejantes que se observan a cada lado de la recta vertical que pasa por la intersección de las rectas inclinadas, se deducen las siguientes relaciones, de donde se extraen los valores de pR y pS. Para la probabilidad del Receptor (primer gráfico): pS 60 − 20 = 1 − pS 90 − 30 ⇒ pS = 0.40 Para la probabilidad del Sacador (segundo gráfico): pR 70 − 40 = 1 − pR 80 − 10 ⇒ pR = 0.30 La forma más directa para obtener estas relaciones es hacer una figura de análisis, graficando a mano alzada las rectas del diagrama respectivo. 175 Capítulo 3 Distribuciones de Probabilidades Problema resuelto 3.49 Estrategia de juego en el saque Para el problema anterior, obtener las funciones de mejor respuesta. Función de mejor respuesta (BRF, Best Response Function) La siguiente figura de pR en función de pS, muestra en forma gráfica las relaciones encontradas: pS < 0.4 ⇒ pR = 0 pS = 0.4 ⇒ ∀pR pS > 0.4 ⇒ pR = 1 Figura 3-134 Función de mejor respuesta (BRF, Best Response Function) La siguiente figura de pS en función de pR, muestra gráficamente las relaciones: pR < 0.3 ⇒ pS = 1 pR = 0.3 ⇒ ∀pS pR > 0.3 ⇒ pS = 0 176 Jorge Carlos Carrá IV Teoría de los juegos – 2 Simultáneos con estrategias mixtas Figura 3-135 En la figura siguiente se muestra la combinación de las funciones de mejor respuesta, BRF. Los equilibrios de Nash son las intersecciones de ambos, en este caso solo el equilibrio mixto. Figura 3-136 Notas 1. Un juego que tiene un equilibro de estrategias puras, puede ser interpretado como un caso particular del de estrategias mixtas con p = 0 o p = 1 . Si por ejemplo las funciones de mejor respuesta, BRF, fueran como las de la siguiente figura, se tendrían 3 equilibrios, el mixto en (0.30, 0.40) y los 2 puros en las intersecciones (0, 0) y (1, 1). 2. Si se construyen las BRF para un juego 2×2 que contenga una sola estrategia pura, es decir con algunas de las soluciones: (pA, pB) = (0, 0), (0, 1), (1, 0) o (1, 1), 177 Capítulo 3 Distribuciones de Probabilidades se observará que las rectas solo se pueden cortar en los vértices del cuadrado delineado en la figura anterior, por lo cual no existirá la posibilidad de un equilibrio en estrategias mixtas. Figura 3-137 Del análisis gráfico precedente puede apreciarse que los juegos presentan en general un número impar de equilibrios. d Conjunto convexo de ganancias Conjunto convexo Un conjunto es convexo si al contener 2 puntos, también contiene la recta que los une. Es decir, A es convexo: Si x, y ∈ A ⇒ ax + by ∈ A Conjunto convexo de ganancias Dado un juego de 2 oponentes A y B, graficamos en un sistema de ejes G(A), G(B), los puntos de cada celda de la bimatriz. El conjunto convexo de ganancias es el menor conjunto convexo que contiene a dichos puntos. Por lo tanto será el contorno de esos puntos. Sea por ejemplo la bimatriz de un juego, de la siguiente figura. Se marcaron con un * los resultados dominantes de columna y con un ' los dominantes de fila. Se aprecia por lo tanto que la estrategia a2, b3 es un equilibrio puro de Nash y que además es Pareto eficiente. b1 A B b2 b3 a1 2*,-1 -1,2' 1,0 a2 1,1' 3*,0 2*,1' Figura 3-138 El conjunto convexo de ganancias se muestra en la figura 3-139. 178 Jorge Carlos Carrá IV Teoría de los juegos – 3 Secuenciales Figura 3-139 Cualquier punto del interior de este conjunto podría ser una estrategia conjunta entre ambos jugadores, sea pura (un punto ya existente en la bimatriz) o mixta (un punto cualquiera no perteneciente a la bimatriz). Esta estrategia podría incluso provenir de un acuerdo cooperativo entre los jugadores, aunque no coincida con un resultado de la teoría. 3 Secuenciales Los juegos secuenciales se presentan a menudo. Ejemplos habituales son por ejemplo: • un comprador hace una oferta y el vendedor debe decidir si acepta o no, • un político debe decidir si realiza una costosa campaña, observando la decisión de su oponente. Al igual que los juegos simultáneos, los secuenciales pueden representarse en forma normal o en forma extensiva. a Formas del juego Forma extensiva En la forma extensiva, es decir con un diagrama de árbol, se encuentra implícito el orden del juego, por lo cual es más adecuada para los juegos secuenciales. 179 Capítulo 3 Distribuciones de Probabilidades b1 a1 G(b1|a1) B b2 G(b2|a1) A b3 a2 G(b3|a2) B. b4 G(b4|a2) Figura 3-140 Observar en la figura que se colocaron distintas acciones de B en cada estrella. Esto se hizo así pues en un juego secuencial no es imprescindible que las acciones de un jugador en las distintas estrellas sean las mismas. Forma normal La representación normal de un juego secuencial requiere modificar las acciones del jugador B que sigue al primero A, pues dado que modelan un juego sucesivo, cada acción de B debe contemplar la reacción para cada una de las acciones que A previamente ha decidido. Juego simultáneo Tomando como ejemplo el juego 2×2 de la figura anterior, las acciones de B son solo 2, (b1 y b2) y la tabla de ganancias es de 2×2. Juego secuencial Tomando el mismo ejemplo, las acciones del segundo jugador B, deben ser 4: (b1|a1 o b3|a2), (b1|a1 o b4|a2, (b2|a1 o b3|a2), (b2|a1 o b4|a2). La tabla de ganancias será de 2×4, como se muestra en la figura 3-141. De esta forma, cualquier acción que elija B, contiene la respuesta a la acción que elija A, exactamente como si se actuara en forma sucesiva. B A a1 a2 b1|a1 o b3|a2 G(b1|a1) G(b3|a2) b1|a1 o b4|a2 G(b1|a1) G(b4|a2) b2|a1 o b3|a2 G(b2|a1) G(b3|a2) b2|a1 o b4|a2 G(b2|a1) G(b4|a1) Figura 3-141 Por razones de simplicidad podría sobreentenderse la condicionalidad y entonces la tabla quedaría como en la figura siguiente (la primera acción de B es |a1 y la segunda es |a2). 180 Jorge Carlos Carrá IV Teoría de los juegos – 3 Secuenciales B A a1 a2 b1b3 G(b1|a1) G(b3|a2) b1b4 G(b1|a1) G(b4|a2) b2b3 G(b2|a1) G(b3|a2) b2b4 G(b2|a1) G(b4|a1) Figura 3-142 Se aprecia así que las columnas están formadas por las combinaciones de cada una de las acciones de B de una estrella con cada una de las otras estrellas. Por ejemplo: • en un juego de 2×3, B tendrá 3*3 = 9 acciones. • en un juego de 3×2, B tendrá 2*2*2 = 8 acciones. • en un juego de m×n, B tendrá n m acciones. b Subjuego Es una parte de un juego, que al ser separado, constituye por sí mismo un juego independiente. Debe cumplir las siguientes propiedades: 1. Comenzar en un solo nodo. 2. Contener todos los sucesores de ese nodo en el árbol. 3. Contener todos los nodos de los conjuntos de información que incluya el subjuego. Todo juego con información perfecta, IP, tiene subjuegos. Un juego con información imperfecta, II, no puede tener más subjuegos que el mismo pues debe comprender en forma completa al conjunto de información. Sin embargo, los juegos pueden contener ambas modalidades, con subjuegos con IP y subjuegos con II. Se resuelven cada uno de los subjuegos y luego se colocan los resultados en el juego general. c Equilibrios Forma extensiva Condición suficiente La condición suficiente para resolver un juego en forma extensiva es la siguiente: Un equilibrio es perfecto en subjuegos si cada jugador lo hace en forma óptima (ganancia dominante) en cada subjuego. Todas las estrategias que no satisfacen esta condición, se llaman imperfectas. Inducción hacia atrás El procedimiento para construir un equilibrio perfecto en subjuegos es el principio de inducción hacia atrás, basado en el conocimiento común (página 151). Se busca la mejor estrategia mirando hacia adelante y razonando hacia atrás. • • R El último jugador actuará racionalmente => se comienza hallando la ganancia dominante de cada uno los subjuegos finales (se elige esa rama de cada una de las estrellas finales, marcándola por ejemplo con una flecha). S(R) El penúltimo jugador sabe que el último jugador actuará racionalmente => se retrocede en el árbol hallando la ganancia dominante de cada subjuego mayor que anida a los 181 Capítulo 3 Distribuciones de Probabilidades últimos (nuevamente se elige y se marca con una flecha a una rama de cada estrella penúltima, lo cual descartará a las estrellas finales existentes no elegidas). Se sigue con el conocimiento común hasta llegar al principio del juego. El camino continuo de ramas con flechas que resulta, se llama Trayectoria o Sendero del equilibrio. Esta solución es un equilibrio perfecto en subjuegos pues es dominante en todos los subjuegos La inducción hacia atrás no puede ser usada en juegos simultáneos pues existen nodos desde los cuales no se puede observar todo lo que ha pasado (conjuntos de información con más de un nodo), los cuales impiden aplicar este principio. En estos juegos debe utilizarse la solución del equilibrio de Nash, antes estudiado para estos juegos. Teorema de Nash En realidad se trata de un caso particular del teorema ya visto (página 156), para juegos secuenciales. Los juegos finitos de información perfecta, tienen al menos un equilibrio perfecto en subjuegos. Esto es simplemente la consecuencia de que la inducción hacia atrás necesariamente termina después de una serie de pasos. Si existiera algún empate entre 2 acciones, se deberían realizar 2 diagramas, uno por cada una de las elecciones. Observar entonces que, a diferencia de los juegos simultáneos, en los juegos secuenciales siempre existe un equilibrio en estrategias puras. Ejemplo En el ejemplo del siguiente árbol, se han marcado con una flecha las ramas que en cada estrella tienen las mayores ganancias, comenzado desde el final. Recordemos que las ganancias se colocan al final del árbol, en el orden de los jugadores. Así por ejemplo, en la estrella (subjuego), ubicada en la parte superior derecha del árbol, las ganancias del jugador C son 3 para la rama superior y 1 para la inferior, por lo cual se resaltó la superior c1. Análogamente para la estrella que se encuentra por debajo se resaltó la rama superior, pues 5 es mayor que 1. El siguiente paso es analizar las estrellas penúltimas. Siguiendo con el ejemplo, se resaltó la rama superior b1 pues 3 es mayor que 2. Se continúa con este proceso hasta llegar al inicio del árbol. El sendero del equilibrio será, por lo tanto, el conformado por las ramas superiores y el equilibrio se conforma con las ganancias (4, 3, 3). Notar que el jugador A obtiene una ganancia de 4 aunque existe una ganancia mayor de 5, la cual no es alcanzada por la racionalidad de los otros jugadores. El estudiante puede averiguar si en este juego el orden importa, colocando a los jugadores en por ejemplo, el orden BAC y resolviendo nuevamente el equilibrio (las ganancias no cambian de valor, solo de ubicación). 182 Jorge Carlos Carrá IV Teoría de los juegos – 3 Secuenciales c1 C b1 B a1 4,3,3 b2 4,4,1 c2 c1. 4,2,5 c2. 5,5,1 c1.. 1,4,4 c2.. 1,5,2 c1... 3,3,4 C. A b1. C.. a2 B. b2. C... c2... 1,2,5 Figura 3-143 Forma normal En la forma normal equivalente aparecen tanto los equilibrios perfectos como los imperfectos. Esta particularidad se analizará con un ejemplo en el siguiente problema resuelto. Estrategias dominadas y la inducción hacia atrás La eliminación de ramas de la inducción hacia atrás de la forma normal es equivalente a la eliminación de estrategias dominadas de la forma normal. Esto se cumple siempre, pero debe tenerse una precaución por la existencia de estrategias débilmente dominadas, debiendo seguirse, por las dudas, el mismo orden de eliminación de ramas de la inducción hacia atrás, para obtener igual resultado. A modo de ejemplo, en la siguiente figura se presenta un ejemplo en el cual el equilibrio de Nash (100, 100) se pierde si se eliminan las estrategias débilmente dominadas correspondientes a su fila o columna. (1, 1) (100; 0) (0, 100) (100, 100) Figura 3-144 En la figura que sigue, si se eliminan las estrategias dominadas en un orden distinto, se obtienen diferentes resultados. Si la columna dominada se elimina primero, queda la columna derecha. Si la fila dominada se elimina primero, queda la fila inferior. (0, 0) (0; 1) (1, 0) (0, 0) Figura 3-145 183 Capítulo 3 Distribuciones de Probabilidades d Juegos simultáneos Simultáneo en forma extensiva Sabemos resolver los juegos simultáneos buscando los equilibrios con su forma normal. Pero ¿es esto equivalente a la resolución con la inducción hacia atrás con la forma extensiva? La respuesta es no. Veamos porque. Recordemos que el equilibrio en la forma normal se basa en colocar flechas según las dominancias de ganancias dentro de cada acción (fila o columna) independientemente de la elección del otro (son simultáneos). Por su parte, la inducción hacia atrás, excepto para el último jugador, las flechas se colocan dentro de las estrategias ya elegidas por los anteriores. b1 B b2 | | |C | | | | C. | | c1 3,3 4,1 c2 c1. 2,5 c2. 5,1 Figura 3-146 A modo de ejemplo, en el juego de la figura anterior las flechas de C corresponden a dentro de b1 o dentro de b2. Luego de C se coloca la flecha de B. Dado que en este caso la acción c1 fue dominante en ambas estrellas, la flecha de B es el resultado de las ganancias dominantes dentro de c1. En este caso existe coincidencia con el procedimiento de la forma normal, lo cual puede corroborarse con el diseño del juego en forma normal que se muestra en la siguiente figura, del cual resulta un equilibrio de Nash para el par b1c1. C c1 b1 3, 3 c2 4, 1 b2 2, 5 5, 1 B Figura 3-147 Pero veamos ahora la siguiente figura en la cual se intercambiaron las ganancias de la mitad inferior. La flecha de B debe ser ahora dentro de la estrategia c1c2, la cual deja de ser una acción pura de C (en la tabla 2×2 de la forma normal se correspondería con dentro de diagonal en lugar de dentro de fila o columna). 184 Jorge Carlos Carrá IV Teoría de los juegos – 3 Secuenciales | | |C | | | | C. | | b1 B b2 3,3 c1 4,1 c2 c1. 5,1 c2. 2,5 Figura 3-148 Este ejemplo muestra que, salvo para el caso particular de estrategias dominantes en ambos jugadores, en un juego simultáneo la inducción hacia atrás no puede aplicarse. Secuencial con partes simultáneas A modo de ejemplo, observar la forma normal del siguiente juego dado en la forma extensiva. Forma extensiva a1 a2 A | | |B | | | | | | B. | a3 b1 G11 b2 G12 b1. G21 b2. G22 b1.. B.. b2.. G31 G32 Figura 3-149 Forma normal La parte simultánea puede reemplazarse por su solución de equilibrio. Ejemplo Consideremos las siguientes ganancias. 185 Capítulo 3 Distribuciones de Probabilidades | | |B | | | | | | B. | a1 a2 A a3 b1 3,2 b2 0,1 b1. 1,5 b2. -1,3 b1.. B.. b2.. 4,6 3,5 Figura 3-150 Si se resuelve el equilibro de Nash del subjuego simultáneo se obtiene (verificarlo) el equilibrio a1, b1, resultando, por lo tanto el siguiente juego. 3,2 a1 A b1 a3 B.. b2.. 4,6 3,5 Figura 3-151a La forma normal equivalente es la siguiente. B b1b1 b1b2 a1 3, 2 3, 2 A a3 4, 6 3, 5 Figura 3-151b Volviendo a la forma extensiva y resolviendo ahora por inducción hacia atrás, resulta finalmente el camino de equilibrio a3 b1. 186 Jorge Carlos Carrá IV Teoría de los juegos – 3 Secuenciales a1 a2 A | | |B | | | | | | B. | a3 b1 b2 3,2 0,1 b1. 1,5 b2. -1,3 b1.. B.. b2.. 4,6 3,5 Figura 3-152 e Racionalidad secuencial y credibilidad Los equilibrios imperfectos conformados por caminos del árbol que contienen flechas no elegidas en una etapa posterior, presentan dos características. Racionalidad secuencial Los caminos de equilibrios imperfectos no serían elegidos por un jugador racional pues no obedecen a una dominancia en ganancias. Esta propiedad de la inducción hacia atrás se llama Racionalidad Secuencial, pues implica que cada jugador actuará en forma racional en todo punto del juego. Credibilidad Se llaman movidas estratégicas a las acciones realizadas afuera del juego, que lo transforman. Dos de estas acciones son las promesas y amenazas (según el carácter de la acción), cuyo cumplimiento generalmente tiene un coste para el jugador que la efectúa. En el caso de que un jugador prometa elegir un equilibrio imperfecto, es decir una estrategia que contradiga su dominancia en ganancias, realiza lo que se llama una amenaza (o promesa) no creíble y es por esto que un problema de credibilidad siempre acompaña a estas acciones. Por el contrario, una amenaza (o promesa) resulta creíble si para el jugador que la realiza es dominante en ganancias. La promesa es un ritual en los políticos en campaña, quienes realizan promesas que luego no pueden cumplir por los costos que les acarrea, perdiendo credibilidad. Las estrategias imperfectas no son dominantes en ganancias en algún momento del juego, por lo cual presentan un problema de credibilidad. Problema resuelto 3.50 Educación parental Considerar un juego entre un padre y su hijo. El hijo puede elegir entre ser Bueno (B) o Malo (M). El padre puede Castigar (C) o No castigar (N). Consideremos como referencia a la ganancia del hijo BN como 0. Además el hijo tiene una ganancia de 1 siendo M y se le resta –2 si es castigado C. Por lo tanto la ganancia del hijo si MN es 1, si MC es 1–2 = –1 y si BC es 0 – 2 = –2. Por su parte las ganancias del padre que no castiga suben –2 si el hijo se comporta M y 0 si se comporta B. 187 Capítulo 3 Distribuciones de Probabilidades Además el padre que castiga obtiene –1. Por lo tanto, la ganancia del padre si BN es 0, si BC es 0–1=–1, si MN es –2 y si MC es –3. Si el hijo juega primero y el padre reacciona observando su comportamiento, a) dibujar la forma extensiva (el árbol del juego) y encontrar el camino del equilibrio, b) dibujar la forma normal y encontrar los equilibrios de Nash. Solución a) Representación extensiva de un juego secuencial 1 Hijo B 2 M 3 Padre. Padre C C. N 0,0 -2,-1 N. -1,-3 1,-2 Figura 3-153 Aplicando la inducción hacia atrás, se encuentra que el equilibrio del juego es M, NN, el óptimo para el Hijo es Malo, por lo que el Padre elige No castigar. Se podría argumentar que no es necesario agregar que en el nodo 2, el Padre elegiría N (primera N de la estrategia M, NN) pues ese nodo no es alcanzado nunca si el Hijo elige el nodo 3. Sin embargo, este razonamiento es incorrecto pues el equilibrio resulta de pensar todas las alternativas. Si el Hijo llegara al nodo 2, el Padre elegiría N y si llegara al nodo 3, el Padre elegiría N. Como entre estas 2 estrategias del Padre, la dominancia en ganancias para el Hijo es el nodo 3 (1 es mayor que 0), el Hijo elegiría este nodo. b) Representación normal de un juego secuencial El Padre tiene 4 estrategias, pues debe contemplar lo que hará el Hijo. Hijo Bueno Malo CC –2, –1 *–1, –3 Padre CN NC –2, –1 *0, 0' *1, –2' –1, –3 NN 0, 0' *1, –2' Figura 3-154 Las 4 estrategias del Padre, son: • CC. Castigar si es Bueno o Castigar si es Malo (Castigar siempre). • CN. Castigar si es Bueno o No castigar si es Malo. • NC. No castigar si es Bueno o Castigar si es Malo. • NN. No castigar si es Bueno o No castigar si es Malo (No castigar siempre). Se marcaron con * las ganancias dominantes del Hijo dentro de las estrategias del Padre y con ' las de Padre dentro de las estrategias del hijo. Los equilibrios de Nash son los sombreados (pues contienen 2 marcas en una misma celda), a saber: 188 Jorge Carlos Carrá IV Teoría de los juegos – 4 Teoría de las decisiones económicas 1. (M, NN) El Padre decide jugar: No castigar si es Bueno o No castigar si es Malo y el óptimo para el Hijo es Malo. Por lo tanto el Padre elige No castigar. 2. (M, CN) El Padre decide jugar: Castigar si es Bueno o No castigar si es Malo y el óptimo para el Hijo es Malo. Por lo tanto el Padre elige No castigar. 3. (B, NC) El Padre decide jugar: No castigar si es Bueno o Castigar si es Malo y el óptimo para el Hijo es Bueno. Por lo tanto el Padre elige No castigar. El equilibrio de Nash 1 es coincidente con el equilibrio perfecto obtenido con la forma extensiva. Los dos equilibrios de Nash restantes son equilibrios imperfectos, más fáciles de detectar en la forma normal y que presentan las siguientes características derivadas de la dominancia en ganancias. Por último los equilibrios (M, NN) y (M, CN) son equivalentes pues producen las mismas ganancias. Observar que si se eliminan las estrategias débilmente dominadas de la forma normal (columnas CC, CN y NC y luego la fila Bueno), se obtiene la celda del equilibrio de Nash (M, NN), igual a las del equilibrio perfecto de la inducción hacia atrás de la forma extensiva. Racionalidad secuencial Estos equilibrios imperfectos contradicen la propiedad de la Inducción hacia atrás, llamada Racionalidad Secuencial, por la cual cada jugador actúa en forma racional en todo punto del juego. Así por ejemplo, en el equilibrio (B, NC) el Hijo es Bueno y el Padre elige No castigar (el cual, por otra parte, aparece como el más consistente), se elimina en la forma extensiva pues si el Hijo es racional nunca elegiría el nodo 2, dada la racionalidad del Padre. Credibilidad Estos equilibrios imperfectos contienen una promesa no creíble, pues contradicen la dominancia en ganancias de algún jugador. f Aplicación: juego de ajedrez Veamos someramente el procedimiento para analizar por computadora el juego secuencial de ajedrez. Los computadores no pueden pensar pero el programa contiene un diagrama de árbol con las jugadas más comunes (digamos 20) que pueden hacerse en cada situación. Las ganancias se establecen de acuerdo a la importancia de cada pieza. La computadora decide su movimiento aplicando el principio de inducción hacia atrás. Si por ejemplo fueran 20 alternativas por cada jugada y el programa analizara un árbol de 5 jugadas sucesivas, se tendrían 205 = 32000000 posibilidades para analizar en los 3 minutos asignados a cada jugada. Si bien no es posible para el computador tener almacenado el árbol completo pues se estiman en alrededor de 101050 jugadas de ajedrez, estos programas pueden ganarle actualmente a cualquier oponente (incluidos los campeones de ajedrez). En esta introducción he presentado los conceptos básicos de la teoría de los juegos. A partir de aquí el lector que lo desee puede profundizar en la abundante bibliografía existente, agregando nuevos conceptos como, subastas, negociaciones, arbitrajes, votaciones, etc. 4 Teoría de las decisiones económicas Es un caso particular de la Teoría de los Juegos en la cual solo interviene un jugador contra la naturaleza. Trata de establecer algún criterio que permita a una persona elegir una de varias alternativas económicas que se presenten en condiciones de incertidumbre. 189 Capítulo 3 Distribuciones de Probabilidades a Formas de la decisión a Forma extensiva Es el formato habitual dado que intervienen eventos aleatorios de estados de la naturaleza. Con el objeto de favorecer el cómputo de las ganancias dominantes, en la teoría de decisiones económicas suele complementarse el árbol expresando los nodos de los eventos con un círculo y el nodo del jugador con un rectángulo. Dentro del círculo se coloca el valor esperado de las ganancias correspondientes a ese nodo y dentro del cuadrado la ganancia dominante, es decir el valor máximo de las esperanzas de las acciones que se derivan de ese cuadrado. Se deja la decisión de utilizar o no esta notación a juicio del lector. En la figura siguiente, G1 y G2 expresan los valores esperados de las respectivas estrellas, es decir: G1 = G11* p11 + G12 * p12 G 2 = G 21* p 21 + G 22 * p 22 G11 p11 a1 G1 A p12 G dominante a2 G12 G21 p21 G2 p22 G22 Figura 3-155 Árbol de decisiones b Forma normal La tabla de decisiones es una tabla de doble entrada con las acciones controlables por el usuario en la primera columna y los eventos de la naturaleza incontrolables o aleatorios en la primera fila. En realidad son 2 tablas en una. La que contiene las ganancias y la que contiene las probabilidades. Esta última es en realidad una tabla de contingencias (con frecuencias relativas) que cruza las variables Acciones y Eventos. Naturaleza Acciones a1 a2 a3 e1 G11, p11 G21, p21 G31, p31 Figura 3-156 Tabla de decisiones 190 Jorge Carlos Carrá e2 G12, p12 G22, p22 G32, p32 IV Teoría de los juegos – 4 Teoría de las decisiones económicas Problema resuelto 3.51 Mejor inversión Un operador desea invertir 100$ ¿Cuál de las 3 siguientes es la mejor inversión? a1: acciones A cuya probabilidad de aumentar en un año a 110$ es 0.85 y la de decrecer a 95$ es 0.15, a2: acciones B cuya probabilidad de aumentar en un año a 140$ es 0.67 y la de decrecer a 40$ es 0.33, a3: plazo fijo al 5% anual. Árbol de decisiones Invertir 10 0.15 -5 7.75.. a1 7.75 0.85 a2 0.67 7 40 0.33 -60 a3 7.75. 1 No Invertir 5 5. 0 Figura 3-157 Árbol de decisiones Como ya sabemos, la construcción del árbol se realiza de izquierda a derecha pero el llenado de los valores numéricos de las ganancias se hace aplicando el principio de inducción hacia atrás (página 181), de derecha a izquierda. Observar que se ha remarcado con flechas el camino del equilibrio y que se han colocado además las ganancias esperadas o dominantes en cada nodo, según corrsponda. Tabla de decisiones Se muestra en la figura 3-158. El primer valor de cada celda es la ganancia para cada evento y el segundo la probabilidad de cada evento. Acciones a1 a2 a3 E1 10, 0.85 40, 0.67 5, 1 E2 -5, 0.15 -60, 0.33 0, 0 E(G) 7.75 7 5 Figura 3-158 Distribución de x=G Las ganancias de cada alternativa son: a1 a2 a3 E (G ) = 7.75$ E (G ) = 7$ E (G ) = 5$ Por lo tanto, si se adopta el criterio de maximizar este valor, deberá elegirse la alternativa a1. 191 Capítulo 3 Distribuciones de Probabilidades Aplicación del teorema de Bayes Las probabilidades incluidas en el árbol de decisiones pueden actualizarse mediante la aplicación del teorema de Bayes, estudiado en el capítulo 2, originando un árbol de probabilidades anexo al árbol de decisiones. Problema resuelto 3.52 Acciones y la economía Antes de tomar una decisión, el operador del problema resuelto anterior desea evaluar el comportamiento de las acciones según las condiciones de la economía. Tomando como base a la experiencia, sabe que: • cuando las acciones A suben, el 90% del tiempo ha habido prosperidad económica • cuando las acciones A bajan, el 60% del tiempo ha habido recesión económica • cuando las acciones B suben ,el 95% del tiempo ha habido prosperidad económica • cuando las acciones B bajan, el 50% del tiempo ha habido recesión económica En el momento de la inversión, la situación era de prosperidad. Revisar las probabilidades a priori del ejemplo 3.5, a la luz de la nueva información. Acciones B Acciones A 0.90 P 0.95 0.765 Sube 0.85 . 0.6365 0.05 R 0.0335 Sube 0.10 R 0.40 0.15 P P. 0.67 0.085 0.06 . 0.50 0.33 Baja 0.60 R. 0.09 P. 0.165 R. 0.165. Baja 0.50. Figura 3-159 Árboles de probabilidades condicionales Por consiguiente, utilizando el teorema de Bayes para calcular las probabilidades a posteriori de la nueva evidencia, llamando S al evento Sube y B al evento Baja, resultan: Para la acción A: 0.765 = 0.928 0.765 + 0.06 P ( B | P ) = 0.206 P(S | P) = Para la acción B: 0.6365 = 0.794 0.6365 + 0.165 P ( B | P ) = 0.072 P(S | P) = Las probabilidades de la inversión a plazo fijo, no cambian. Las ganancias actualizadas de cada alternativa, resultan ahora: 192 Jorge Carlos Carrá IV Teoría de los juegos – 4 Teoría de las decisiones económicas a1 a2 a3 E (G ) = 8.25$ E (G ) = 27.4$ E (G ) = 5$ Por lo tanto, decisión óptima es ahora invertir en la acción B. b Caso particular: una sola acción Un caso particular del anterior se presenta cuando existe una sola acción voluntaria elegida y controlada por el usuario: la de participar, la cual contiene varios eventos aleatorios. En realidad, en forma implícita, esta acción siempre se contrasta con la acción de no participar, pero esta acción no tiene eventos y su E(G) = 0. En este contexto, el árbol de decisiones es un caso particular del caso anterior y se muestra en la figura 3-160. p1 a1: participar E(G) p2 A E(G) a2: no participar G1 G2 0 Figura 3-160 Árbol de decisiones La decisión se corresponde con el siguiente criterio. Criterio del signo del valor esperado • • • Si E(G) > 0 => decisión favorable (a la larga conduce a la fortuna) Si E(G) < 0 => decisión desfavorable (a la larga conduce a la ruina) Si E(G) = 0 => decisión neutra. Problema resuelto 3.53 Rifa para juntar fondos a) Determinar el valor C, que debe tener una rifa para juntar fondos de 1000 números y con un premio de 200$, si se desea que sea equilibrada. b) ¿Cuál es el valor esperado si C = 1$? c) ¿Cual deberá ser el premio si C = 1$ y la rifa es neutra? a) Tabla de decisiones Como alternativa de presentación se han colocado las probabilidades en una fila separada de las ganancias. 193 Capítulo 3 Distribuciones de Probabilidades Eventos Pierde Gana S G=g p(g) -C 999/1000 200-C 1/1000 Figura 3-161 Distribución de x=G Árbol de decisiones G 999/1000 -C E(G) 1/1000 200-C Figura 3-162 Árbol de x=G Operando para un juego neutro: E (G ) = Por lo tanto: −999C + 200 − C =0 1000 C = 0.20$ b) Reemplazando el valor de C en la ecuación de E(G), resulta E(G) = -0.80$ c) Reemplazando en E(G) = 0, el valor de C y el número 200 por una variable P (premio), resulta P = 1000$. Problema resuelto 3.54 Costo de la prima de seguros a) Determinar la prima anual C para un seguro de daños de un auto de 10000$. La póliza cubre siniestros que por experiencias previas ocurren 1 de cada 200. Basar el cálculo en E(G)=0, es decir sin ganar ni perder. Luego se agregarán las utilidades y los gastos administrativos. b) Comparar las siguientes acciones: a1: situación anteriormente descripta. a2: persona que no compra el seguro. a) Tabla de decisiones S G=g p(g) Eventos No Siniestro Siniestro -C 199/200 10000-C 1/200 Figura 3-163 Distribución de x=G 194 Jorge Carlos Carrá IV Teoría de los juegos – 4 Teoría de las decisiones económicas Árbol de decisiones G 10000-C 1/200 E(G) 199/200 -C Figura 3-164 Árbol de x=G Operando para un juego neutro: E (G ) = − C + Por lo tanto: 10000 =0 200 C = 50$ b) Tabla de decisiones S a1 a2 p(g) Eventos No Siniestro Siniestro -50 0 199/200 9950 -10000 1/200 Figura 3-165 Distribución de x=G Árbol de decisiones G 199/200 -50. 1/200 9950 199/200. 0.. 0. 0 -50 1/200. -10000 Figura 3-166 El E(G) de a1 es 0 y el de a2 es -50$. Por lo tanto si se adopta el criterio de maximizar este valor, se deberá elegir la acción a1, es decir contratar el seguro. 195 Capíítulo 3 Distrib buciones de Probabilidade P es Prob blema ressuelto 3.555 Ruletaa europea Una rulleta europea (siin doble 0), tieene números deel 1 al 36 (18 ro ojos, 18 negross y el 0 de coloor verde). El casino paga p 36$ por cada c pleno y paara el resto de llas jugadas en forma proporcional (por ejem mplo en cada columnna hay 12 plenoos y por lo tanto se pagará 36/12, es decir 3$$). Hallar la E((G) si se apuessta 1$ a: a) al número o 17 (pleno), b)) calle, c) negro o (color). Ver figura f 3-167. d) d ¿Cuánto debería pagar la banca para que el juego seea neutro? F Figura 3-167 Ruleta a) S G=g p(g) Eventos no saale el 17 saale el 17 -1 36/37 35 1/37 F Figura 3-168 Distribución de probabilidaades de G E (G ) = − 1 36 1 1 + 35 =− = −0.027$$ 37 37 37 b) S G=g p(g) Evento os no saale la calle sale la calle -1 334/37 11 3/37 F Figura 3-169 Distribución de probabilidaades de G E (G ) = − 1 34 3 1 + 11 = − = −0.027$ 37 37 7 37 c) 196 Jorge e Carlos Carrrá IV Teoría de los juegos – 4 Teoría de las decisiones económicas S G=g p(g) Eventos colorado o cero -1 19/37 negro 1 18/37 Figura 3-170 Distribución de probabilidades de G E (G ) = − 1 19 18 1 +1 = − = −0.027$ 37 37 37 d) Sale C No sale -1 1/37 . 36/37 Figura 3-171 Distribución de probabilidades de G Por lo tanto: E (G ) = Despejando resulta: 1 36 C+ ( −1) = 0 37 37 C = 36$ A partir de este valor, puede concluirse que la Posibilidad de Pago, PP, definida en el capítulo 2 (página PP2), resulta: PP = G 36 = = 36 A 1 En síntesis y generalizando, si el juego es neutro, las posibilidades de pago resultan ser iguales a las posibilidades en contra de ganar, en este caso, 36:1. Naturalmente, los casinos fijan las posibilidades de pago en un valor inferior, en este caso 35:1 (una ganancia del jugador de 35$ por cada 1$ colocado en un pleno, equivale a un monto total de 36$). Problema resuelto 3.56 Estrategias de ventas Un comercio A vende una mercadería a 280$. Otro comercio B la vende a 300$ pero regala una rifa de 1000 números con un premio único de 10000$. ¿Dónde conviene comprar? Calculemos la distribución de la ganancia de comprar en B, respecto de comprar en A. S G=g p(g) Eventos no gana -20 999/1000 gana 10000-20 1/1000 Figura 3-172 Distribución de probabilidades de G De aquí que la ganancia de comprar en B respecto de A, resulta: E (G ) = − 10$ Por lo tanto conviene comprar en A. 197 Capítulo 3 Distribuciones de Probabilidades 198 Jorge Carlos Carrá V Simulaciones – 4 Teoría de las decisiones económicas V Simulaciones 1 Simulación de distribuciones En el capítulo 2, sección simulaciones, hemos utilizado la serie de frecuencias acumuladas de una distribución particular en estudio para recodificar números aleatorios uniformes a esa distribución. En esta última sección del capítulo 3, justificaremos esa construcción. También hemos adelantado que bajo el nombre de Método Monte Carlo o Simulación Monte Carlo, SMC, (ver figura 3-173), se agrupan una serie de procedimientos que reproducen por muestreo aleatorio, distribuciones poblacionales arbitrarias F(x)14 de variables aleatorias x, normalmente con la intervención de la computadora. Estas características que son parte esencial de un algoritmo por SMC. Llamaremos NAF a los Números Aleatorios de cualquier distribución F(x). Si por ejemplo la F(x) en estudio es normal, se generarán NAN, si es exponencial, NAE, etc. Figura 3-173 Simulación Montecarlo SMC Los paquetes de software que contienen técnicas estadísticas disponen en general de números aleatorios que generan varios de los modelos vistos en este capítulo (ver resumen para SPSS y EXCEL en el apéndice B). El procedimiento que veremos a continuación es válido para la generación aleatoria de cualquier distribución, sea o no uno de los modelos vistos y se inicia con un generador de Números Aleatorios Uniformes, NAU15. En este caso, al esquema anterior se le agrega este generador, como se muestra en la figura 3-174. 14 15 Simbolizamos con F(x) a la probabilidad acumulativa P(X < x). Una utilización de los mismos fue realizada en el capítulo 2, página NAU2. 199 Capítulo 3 Distribuciones de Probabilidades Figura 3-174 SMC con NAU Recordemos del capítulo 2, que existen 3 pasos en la obtención de una simulación: 1 Población Definida con su distribución de probabilidades y por lo tanto es conocida su F(x). 2 Muestra: Método de la CDF inversa Uno de los métodos de generación de NAF de cualquier distribución, se llama de la CDF inversa, ya utilizado intuitivamente en el capítulo 2, aún sin conocer su nombre. Propiedad de las CDF Sea una función cualquiera F(x). Se cumple siempre que: G( y) = P ( F ( X ) ≤ y ) = P ( X ≤ F −1 ( y) ) = P( X ≤ x) . En el ejemplo de la figura 3-175, izquierda es: G(0.52) = P( F ( X ) ≤ 0.52) = P( X ≤ F −1 (0.52) = P( X ≤ 6.02) Pero hasta ahora no conocemos su valor. Si además la F(x) es la CDF de x, podemos conocer la función G ( y ) pues el penúltimo miembro es: G ( y ) = P ( X ≤ F −1 ( y ) ) = F ( F −1 ( y ) ) = y Por lo tanto se trata de una CDF G ( y ) igual a una recta a 45° (ver figura 3-175, centro). Su PDF, g ( y ) es entonces una distribución uniforme comprendida entre 0 y 1, y por lo tanto igual a 1 (ver figura 3-175, derecha). La CDF de una CDF es una distribución uniforme comprendida entre 0 y 1. Figura 3-175 Método CDF inversa Esta propiedad se utiliza para generar un muestreo aleatorio de una x, conocida su CDF, F ( x ) , procediendo de forma inversa al desarrollo anterior (ver nuevamente la figura): 1. y Se genera un NAU y. Supongamos que éste valor es y = 0.52. −1 2. y = F ( x) ⇒ x = F ( y) Analíticamente Igualamos la ecuación de F(x) a este número y despejamos la x. Gráficamente Lo buscamos en el eje de ordenadas de la CDF a simular (si admitimos que la distribución es 200 Jorge Carlos Carrá V Simulaciones – 4 Teoría de las decisiones económicas discreta, podríamos tomar el siguiente mayor es decir: 0,80). Bajamos al eje x, de donde extraemos el valor final de la simulación de x = 6.02. Nota Si los elementos a muestrear son objetos, los NAU deben ser enteros, por lo cual se deberá multiplicar a los anteriores NAU entre 0 y 1 por el tamaño de la muestra, n y obtener así NAU entre 0 y n. 3 Repetición Se repite el procedimiento para obtener varias muestras que luego se podrán aplicar al proceso en estudio. En los programas informáticos, tal como el SPSS, existen en forma directa números aleatorios de la mayoría de las distribuciones teóricas vistas en este capítulo (ver resumen en el apéndice B), pero el método anterior de SMC permite resolver cualquier tipo de distribución y por lo tanto encarar, aunque sea en forma aproximada, problemas que por su complejidad no podrían ser estudiados por los alumnos. Por otra parte, y dada la fructífera relación modelo-experiencia inherente al método, se recomienda su utilización, aún en los casos en los que la resolución matemática del problema sea sencilla. Problema resuelto 3.57 Simulación Montecarlo Dada la siguiente distribución arbitraria de x, a) simular un muestreo aleatorio para hallar la P(x = 2) en 40 extracciones. b) Confrontar luego con el valor teórico: b(2,40,0.34). 0 1 2 3 x P(x) 0.20 0.25 0.34 0.21 Figura 3-176 P(x) a) 1 Población Se conforma la siguiente tabla, en la que se definen los intervalos, para ubicar los NAU, por ejemplo entre 0 y 100. 0 1 2 3 x u= F(x) 0-19 20-44 45-78 79-99 Figura 3-177 CDF inversa El lector observará que este proceso de codificación de valores ya fue utilizado en el capítulo 2. 2 Muestra Se generan NAU entre 0 y 100 3 Repetición Repitiendo el paso 2 se conforma una tabla como la siguiente, en donde se tildan las veces que este valor se encuentra entre 45 y 78. Se deja al lector el llenado de esta tabla, usando el generador que prefiera (tabla, calculadora, SPSS, urna con 100 papeles, etc). nE sale 2 no sale 2 201 Capítulo 3 Distribuciones de Probabilidades Figura 3-178 P(x = 2) b) Confrontar el valor anterior con: b2 (40,0.34) = 0.118 = 11.8% 2 Simulación de juegos ComLabGames No hay mejor manera para entender las estrategias de un juego que jugar con otros. Para esta función se han creado algunos programas informáticos. ComLabGames (Computational Laboratory Games) es un software libre implementado en Java, creado por Robert Miller, Marko Gorbelnik y Vesna Prasnikar de la universidad Carnegie Mellon, Graduate School of Industrial Administration. Permite correr y analizar los resultados de juegos entre computadoras conectadas por Internet o dentro de una red. Una PC (server) actúa como moderadora, en donde el moderador diseña el juego y en las restantes PC (clientes) están los jugadores, quienes pueden actuar simultáneamente o secuencialmente. Pero además de poder simular escenarios y testear hipótesis acerca del comportamiento humano, esta simulación, al igual que la simulación Monte Carlo, podrá crear datos experimentales para luego analizarlos estadísticamente. Para dar al juego un incentivo que semeje a la realidad y motivar a los participantes a probar la eficacia (o no) de aprender la teoría de estrategia de juegos, se suele ofrecer como incentivo una ganancia proporcional a la obtenida por cada estudiante al final del juego, la cual puede extraerse de un pago inicial requerido a cada participante. Se dividirá esta sección en 2 partes: a. Moderador b. Cliente a Moderador El creador del juego se llama moderador y es el que define el juego. Desde la página con el nombre de este software descargar y ejecutar el archivo ComLabGame, versión 0.4: clg_standalone.jar. Se abre la siguiente ventana, con la pestaña Design (Diseño) pre-seleccionada. Observar que figura el nombre Server en la parte superior para indicar que se trata de la computadora del moderador. 202 Jorge Carlos Carrá V Simulaciones – a Moderador Figura 3-179 Se aprecia que las pestañas siguen la secuencia normal de un proceso de investigación: 1. Design: diseño del juego. 2. Assignment: asignación de parámetros específicos del juego, tales como número de repeticiones, duración, etc. 3. Execution: análisis del juego. 4. Data: resultados de la simulación. La última ventana Client Play es utilizada por el jugador y no por el moderador. a Design Los elementos de diseño se muestran en los botones de la columna izquierda. Para incorporarlos al modelo se los debe arrastrar hacia el espacio de trabajo y soltar. Los 3 primeros se refieren a subastas, tipo de juego que no será analizado en esta introducción. Los 2 siguientes se usan para elegir el tipo de diseño: tabla (Matrix) o árbol (Tree entry). Los 3 últimos se utilizan para crear los jugadores (Players) y los estados de la naturaleza (Nature) que modela un jugador especial con decisiones aleatorias. Las Ganancias (Payoff) se aplican específicamente al caso de un diseño por árbol, con las ganancias en los nodos terminales. Con un doble clic en los elementos arrastrados se les cambia el nombre. Con un doble clic derecho se abre una ventana de edición. 203 Capítulo 3 Distribuciones de Probabilidades HTML El programa acepta algunos comandos de código HTML para editar los nombres. En particular si se desea que el nombre aparezca en varias líneas, colocar una barra invertida \ al comienzo de la nueva línea. Borrar Para borrar un elemento, seleccionarlo (a varios con el botón Ctrl) y presionar el botón Remove de la barra de herramientas. Duplicar Con el botón Duplicate se puede duplicar cualquier parte del diseño, previamente seleccionada. Player Arrastrando un elemento Player (Jugador) al espacio de trabajo, lo incorpora al juego. Cambiarle el nombre con un doble clic sobre el icono. Automáticamente cambiará el color. Si se desea otro color, editar con un clic derecho, seleccionándolo de la ventana de edición. Matrix (forma normal) Diseño de un juego simultáneo. Arrastrar tantos elementos Player, como jugadores existan en el juego y Nature, en el caso de que existan estados aleatorios de la naturaleza. Arrastrar Matrix (matriz) para crear la tabla del juego. Hacer un doble clic derecho sobre Matrix. Se abre la ventana de la siguiente figura para editar la tabla del juego. Se observará que los nombres de los jugadores aparecen en la parte inferior dentro del panel Others y todos los elementos Nature en el panel Nature. Figura 3-180 204 Jorge Carlos Carrá V Simulaciones – a Moderador • • Show player's values only Esta opción se usa para determinar si los jugadores solo pueden mirar sus ganancias o también las de los restantes jugadores. Simultaneous move Esta opción determina si el juego es simultáneo o sucesivo. Número de filas y columnas Si se desean agregar filas o columnas arrastrar el icono superior Insert Column a las filas o columnas y soltar. Si se desea borrar alguna fila o columna, arrastrar el icono Remove column y soltar en la que se desea borrar. Asignar el nombre a las acciones con un doble clic en los encabezamientos. El orden entre las acciones puede modificarse arrastrando el encabezamiento a la posición deseada. Seleccionar jugadores fila y jugadores columna Hacer clic derecho sobre las filas o columnas y seleccionar el jugador de la lista. Alternativamente arrastrar el icono del jugador del panel inferior y soltarlo en filas o columnas. Si se arrastra un tercer jugador, se anida en la tabla. Luego de asignar los jugadores, sus iconos pasan del panel inferior Others al panel Payoffs (Ganancias). Se puede arrastrar un jugador no seleccionado directamente de Others al Payoffs. Este jugador no interviene en las decisiones pero tendrá asignadas ganancias. Si un jugador permanece en Others será solo observador del juego. Introducir las ganancias Clic en cada celda y escribir la ganancia de cada jugador. En lugar de un valor numérico se puede escribir una función, eligiéndola de un editor de funciones que se abre al hace un clic derecho sobre la celda. Si por ejemplo se desea que la ganancia sea un valor aleatorio entre 10 y 20, se colocaría Uniform(10,20). Guardar el modelo con File > Save. Los archivos tendrán la extensión .mgd. Para volver a abrirlos, ejecutar el programa y luego File > Open. Tree Entry (forma extensiva) Diseño de un juego secuencial. Arrastrar el nodo inicial Tree Entry (Entrada del árbol) al espacio de trabajo para iniciar el árbol del juego. Editar el nombre con un doble clic sobre él. Para conectar sucesivos elementos al árbol (entrada del árbol, jugadores, estados de la naturaleza y ganancias al nodo final), se tienen 2 formas: • Cuando ambos elementos ya se encuentran en el espacio de trabajo, se selecciona el que va a recibir la conexión y se arrastra el símbolo + inferior al elemento a conectar. • Con el botón Standard layout de la parte inferior de la ventana seleccionado, se selecciona previamente el icono al cual va a ser conectado y se arrastra el nuevo elemento del panel izquierdo. En particular y dado que un elemento arrastrado al espacio de trabajo queda seleccionado, se conectará automáticamente con el próximo elemento que se arrastre. 205 Capítulo 3 Distribuciones de Probabilidades Figura 3-181 El cuadro intermedio que aparece en cada rama se utiliza para colocar el nombre de la acción, con un doble clic. En el caso particular de Nature, es imprescindible colocar la probabilidad correspondiente (en forma absoluta o relativa, pues el programa siempre divide por la suma de los valores colocados). Si se desea poner un nombre a la acción, debe estar separado de la probabilidad por un espacio. En base a estas probabilidades el software utiliza un mecanismo aleatorio para seleccionar las ramas conectadas a Nature. Simulación de decisiones económicas Observar que un juego con Nature y con un solo jugador, equivale a la situación ya vista en la sección Teoría de las decisiones económicas (página 189). Simultaneidad Si parte del árbol implica simultaneidad (página 153), hacer clic en el icono de uno de los nodos y arrastrar el símbolo + superior al otro nodo. Se observará que quedarán conectados con una línea punteada para indicar el conjunto de información. Repetir para todos los nodos involucrados. En este caso cualquiera de los 2 jugadores puede elegir su acción pero el movimiento de uno no es observado por el otro hasta después de completar ambos sus movimientos. Comparar con un diseño secuencial, en el cual cada jugador solo podrá mover cuando le llegue el turno. Introducir las ganancias La tabla de ganancias que se coloca en el nodo final, contendrá todos los jugadores que intervienen en el diseño. Con un doble clic, colocar el valor numérico o función (ver párrafo anterior) en el panel Number del jugador deseado. Con Label > Append, se puede colocar una etiqueta particular para la ganancia de ese nodo. b Assignment • • • 206 Number of subjects Se puede configurar para un mayor número de participantes que el requerido por el juego, para poder repetir el juego para otras personas. Number of rounds No olvidar elegir aquí el número de corridas de la sesión. Probability to continue Se puede indicar una probabilidad de que el juego continue luego de la última corrida, con el objeto de que el número de corridas sea aleatorio. Jorge Carlos Carrá V Simulaciones – a Moderador c Execution Posibilita probar y ejecutar el juego. La dirección y puerto de la computadora del moderador se muestra en la parte superior. Estos datos deben ser informados a los jugadores para que puedan conectarse al juego (ver Client play, más adelante). Si el moderador desea correr varios juegos desde la misma PC (abriendo distintas sesiones del software), debe cambiar la puerta de cada uno de ellos. El nombre del juego aparece al pie de la pantalla. Definir el ítem de comienzo En el espacio de trabajo, hacer clic en el elemento de comienzo, Matrix o Tree Entry y luego en el botón Toggle start de la barra de herramientas. El icono del elemento toma un color rojo claro para indicar que el juego comenzará por él. Pruebas Test session(s) El moderador puede probar el juego antes de conducir el experimento, lo cual le permite visualizar la ventana que verá cada uno de los jugadores (clientes), probar el juego y corregir posibles errores. Forma normal En la figura siguiente se observa una de estas ventanas (tiene el nombre Client). En este ejemplo se simuló con un clic del mouse que B eligió b2 y A eligió a1. Ninguno de los jugadores ve la elección del otro hasta que ambos confirmen sus elecciones con Continue. Luego se muestra en la celda elegida, un 1 en rojo (en general se verá la frecuencia acumulada absoluta de elecciones para esa celda). Figura 3-182 Forma extensiva En la figura siguiente se observa la ventana que vería el jugador. Las ramas que cada jugador puede seleccionar se destacan al pasar el mouse por ellas y se eligen con un clic del mouse en el nombre de la acción. En este ejemplo se muestra un juego secuencial, por lo cual luego de que el primer jugador 207 Capítulo 3 Distribuciones de Probabilidades en el árbol elige su acción, se muestra la misma en la ventana de los restantes jugadores. En el ejemplo de la figura siguiente se simuló que A eligió Entra y luego de verla, B eligió Sale, por lo cual se muestra en la celda inferior de las ganancias de este camino, un 1 en rojo y los totales en la raíz del árbol. Figura 3-183 Two session(s) Prueba dos sesiones corriendo a la vez, duplicando el número de jugadores. Trace Windows Muestra informaciones relativas a la prueba. Start sessións Para correr el juego, el moderador presiona Start sessions y en la barra de estado se observa Started. Stop sessions Detiene el experimento. En la barra de estado se observa Waiting. e Data Los datos son almacenados en un archivo en la computadora del moderador, dentro de una carpeta llamada log que se crea dentro de la carpeta en donde se encuentra el archivo del juego. Después de ejecutado el juego ir a Data > Open log. Abrir la carpeta log. Dentro de los iconos que aparecen en la ventana, arrastrar los deseados al panel Viewer. 208 Jorge Carlos Carrá V Simulaciones – b Jugador (cliente) Con el icono Matrix de color rojo, se muestran entre otros, el número de sesión, el tiempo que demandó la decisión, el nombre del jugador, el número de celda y las ganancias que recibió cada jugador. Con el icono Matrix de color turquesa se muestra información que el sujeto eligió. Para ordenar los valores en forma ascendente, hacer clic en el encabezamiento de la columna deseada. Con un nuevo clic se ordena en forma descendente. Con la selección adecuada de elementos a la izquierda, se puede parcializar la vista de los datos. b Jugador (cliente) Los clientes pueden entrar al juego luego de haber sido iniciado por el moderador (ver pestaña Execution, página 208). Cada jugador en su PC debe ejecutar el archivo clg_standalone.jar e ir a la pestaña Client Play (podría ser ejecutado en la misma PC del moderador abriendo otra sesión del programa). Client Play Tal como se indica en la siguiente figura, se deben ingresar: • Server datos que provee el moderador, por ejemplo: 192.168.1.47:6789. Notar que luego del IP se colocan dos puntos y el puerto del servidor (9789). Si el jugador usa un navegador en lugar del programa, debe colocar http:// antes de la dirección. • Username puede ser cualquier nombre. • Password no es necesario. 209 Capítulo 3 Distribuciones de Probabilidades Figura 3-184 Presionar el botón Login para conectarse al juego. Se muestra una ventana similar a la de la prueba realizada en la sección anterior, tanto en la PC del jugador como en la del moderador. Asignación de roles Cada cliente es asignado a un jugador en forma aleatoria, luego de lo cual cada jugador deberá comenzar a jugar eligiendo con el mouse una de las acciones (las de los otros jugadores están desactivadas), en función del rol que se le haya asignado. Presionar el botón Continue, luego de cada selección para confirmarla. En la ventana Execution del moderador, los nombres de los jugadores pasan de color rojo a verde. Datos Al finalizar el juego se muestra un resumen en la PC del moderador. Pasar los 2 iconos Matrix al panel Viewer, con lo cual se muestran todos los datos de las corridas, tal como se indica en la siguiente figura. Se puede parcializar la información según la selección que se realice con los botones de la izquierda. Si se presiona el botón Statistics, se muestran las medidas de posición (media, mediana y modo) y de dispersión (varianza, mínimo y máximo) de la distribución de ganancias correspondiente a las selecciones realizadas en el panel de la izquierda. Presionando Export table, se puede exportar la tabla como un archivo de texto delimitado por tabulación (tsv, tab separated value), el cual se puede abrir con Excel. Figura 3-185 La simulación de un juego con jugadores reales provee datos experimentales. En el capítulo 5 nos servirán para probar hipótesis acerca de la cercanía o no de las experiencias con las predicciones teóricas. 210 Jorge Carlos Carrá V Simulaciones – b Jugador (cliente) Problema resuelto 3.58 El empresario y el capitalista Un empresario decide si buscar o no un inversor para un proyecto. En la siguiente figura se muestran las posibles 4 posibles acciones. 1 El empresario ignora la idea y continúa su trabajo, 2 El empresario decide buscar un inversor y el inversor acepta con una probabilidad de falla q. 3 El empresario decide buscar un inversor y el inversor acepta con una probabilidad de éxito p. 4 El empresario decide buscar un inversor y el inversor no acepta. a) Asignar libremente p y q y obtener teóricamente el camino del equilibrio Diseñar el juego con ComLabGame y realizar experimentos (juegos) con jugadores sin conocimientos teóricos acerca de la teoría de juegos. Estos datos experimentales luego podrán ser utilizados para analizar inferencias en el capítulo 5. En particular extraer datos para probar luego las siguientes hipótesis. b) La muestra está de acuerdo con las predicciones teóricas respecto de por ejemplo una selección al azar de los nodos (o cualquier .otra opción). c) Los resultados dependen del tipo de diseño, secuencial o simultáneo (el juego simultáneo no se refiere a la forma normal equivalente del juego secuencial, sino a un diseño distinto de tipo simultáneo). Figura 3-186 Solución a) Supongamos que p = 0.50. En este caso y tal como hemos visto en la sección, Teoría de las decisiones económicas en condiciones de incertidumbre, la contribución de los estados de la naturaleza se reemplaza por la esperanza matemática: E (empresario) = 0.5(10) + 0.5(100) = 55 E (Capitalista ) = 0.5( −15) + 0.5(20) = 2.5 El camino del equilibrio, resulta entonces como se muestra en la siguiente figura, en la cual se incluye la codificación de nodos realizada por ComLabGame en la figura 3-187. 211 Capítulo 3 Distribuciones de Probabilidades Empresario Ignorar la idea Busca Inversor Capitalista 10,0 Nodo1 Invierte No invierte 55,2.5 -5,0 Nodos 2 y 3 Nodo 4 Figura 3-187 El equilibrio perfecto de dominancia en ganancias conduce, con estas ganancias, al equilibrio: Empresario: Busca Inversor –Capitalista. Invierte. b) Para la toma de datos de esta prueba se requiere realizar varias experiencias (al menos 20 repeticiones) para obtener la frecuencia de resultados que conducen a los nodos que predice la teoría, es decir a los nodos 2 y 3. Luego se realizará el análisis comparando este valor con una elección al azar de los nodos (considerando los nodos 2 y 3 como uno solo), utilizando por ejemplo una prueba de la bondad del ajuste (capítulo 1). Se calculará entonces el valor χ2. Sean por ejemplo 20 juegos, con los resultados observados que se muestran en siguiente figura. Frec observada Frec esperada Nodos 1 3 Nodo 1 6.67 Nodo2 5 Nodo2 6.67 Nodos 3y 4 12 Nodos 3 y 4 6.67 Total 20 Total 20 Figura 3-188 (3 − 6.67) 2 (5 − 6.67) 2 (12 − 6.67)2 χ2 = + + = 6.69 6.67 6.67 6.67 C= 6.69 = 0.50 6.69 + 20 No puede anticiparse ninguna conclusión hasta completar la prueba estadística en el capítulo 5. c) Para esta prueba se requiere crear otro modelo en el cual otro juego se realice en forma Estratégica o Normal (tabla). En este caso se tienen 2 jugadores; Empresario y Capitalista con las ganancias mostradas en la figura 3-189. Observar que ambas celdas inferiores de la forma Normal tendrán igual valor pues si el Empresario Ignora la idea, no interesa la acción del inversor. Se puede apreciar que en este diseño el resultado Empresario Busca Inversor – Capitalista Invierte, es un equilibrio de Nash y que el resultado Empresario Ignora la idea – Capitalista No Invierte, es otro equilibrio de Nash. 212 Jorge Carlos Carrá V Simulaciones – b Jugador (cliente) Para la toma de datos se debe realizar ahora la experiencia con esta tabla, con igual cantidad de repeticiones que la forma extensiva. Se obtendrán así las frecuencias en cada celda. Figura 3-189 El análisis se realizará con una prueba chi-cuadrado de la bondad del ajuste, con los valores de frecuencias de ambas experiencias y los valores esperados en caso de independencia entre la forma Extensiva y la forma Normal. Por lo tanto, se deberá preparar una tabla con el formato que se muestra en la figura 3-190, en la cual se muestra un ejemplo ficticio de 25 juegos. Observados Forma Extensiva Forma Normal Total Nodo 1 Celda Inf Izq 15 2 17 Nodos 2 y 3 Celda Sup Der 6 20 26 Nodo 4 Celda Sup Izq 4 3 7 Total 25 25 50 Figura 3-190 Comparar esta tabla con la de valores esperados en el caso de que exista independencia y calcular el valor χ2. Esperados Forma Extensiva Forma Normal Total Nodo 1 Celda Inf Izq 8.5 8.5 17 Nodos 2 y 3 Celda Sup Der 13 13 26 Nodo 4 Celda Sup Izq 3.5 3.5 7 Total 25 25 50 Figura 3-191 (15 − 8.5) 2 (6 − 13) 2 χ2 = + + ... = 17.622 8.5 13 C= 17.622 = 0.510 17.622 + 50 213 Capítulo 3 Distribuciones de Probabilidades Si este valor fuera cercano a 0, la forma de presentación sería independiente del resultado, lo cual indicaría que estos no varían significativamente en las 2 presentaciones. En este caso no puede anticiparse la conclusión hasta completar la prueba estadística en el capítulo 5. Aplicaciones Buscar en Internet o en la biblioteca documentación concerniente a teoría de juegos o economía, y elegir algunos juegos de 2 jugadores. En la sección problemas del final del capítulo, se incluyen algunos. Resolverlos teóricamente (incluso con varias matrices de ganancias) y luego crearlos con ComLabGame, para experimentar las estrategias utilizadas por 2 oponentes. Es conveniente ofrecer algún tipo de incentivo a los jugadores, aunque sea mínimo, para aumentar el interés. Con los resultados obtenidos se podrán realizar interesantes pruebas estadísticas en el capítulo 5. Acompañar los datos indicando cuáles fueron las estrategias utilizadas por los jugadores, si buscaron o no los equilibrios del juego, si tenían o no una base teórica, si realizaron o no coordinaciones fuera del juego o si se detectaron errores a corregir. 214 Jorge Carlos Carrá Ensayo: ¿Creer en Dios mejora la existencia? – El peso de la decisión. Blas Pascal Ensayo: ¿Creer en Dios mejora la existencia? En el capítulo 2 hemos presentado un ensayo acerca de la existencia de Dios. En este ensayo veremos un enfoque histórico para responder a otra pregunta relacionada pero distinta16. ¿Quién tiene el mejor modo de existencia, el que cree en Dios o el que no? El enfoque se basa en la interrelación conjunta de utilidades y probabilidades. El peso de la decisión. Blas Pascal ¿Es más conveniente creer en Dios? El filósofo francés Blas Pascal (1623-1662), planteó en el siglo XVII, en su libro "Pensamientos" (Pascal, B. 1996), un análisis basado en probabilidades y utilidades, que luego sería conocido como la Apuesta de Pascal. La historia cuenta que Pascal se convierte en un ferviente religioso, como consecuencia de haberse salvado milagrosamente de morir ahogado, cuando los caballos del coche en el que viajaba, cruzaron desbocados un puente. Pascal plantea que en el caso de creer en la existencia de Dios, la decisión es más favorable hacia los creyentes. Veamos su razonamiento a la luz de las 4 alternativas que se muestran en el árbol de decisiones de la figura 3E-1. Si se cree que Dios existe, dice Pascal, el creyente recibirá la felicidad eterna (ganancia infinita) y en cambio para el resto de las alternativas, las ganancias serán finitas (sean positivas o negativas). De esta forma, no importa cuán pequeña sea la probabilidad de la existencia de Dios pues la esperanza matemática de este camino del árbol siempre será mayor que la de los demás. Veamos el detalle. Un rectángulo simboliza un nodo de decisiones controladas por la persona. Un círculo significa un nodo de eventos no controlables por la persona, pero de los cuales se conocen las probabilidades p de cada uno. Al final de cada una de estas ramas se encuentran las ganancias o utilidades que proporciona cada evento. De acuerdo a la teoría de las probabilidades, el valor esperado para el creyente y el ateo son, respectivamente: G ( creyente ) = ∞ ∗ p1 + a ∗ p 2 = ∞ G ( ateo ) = b ∗ p 3 + c ∗ p 4 = finito Estos valores se colocan en cada uno de los círculos, como ganancias de esas ramificaciones. En los nodos de decisión se decide finalmente cual es la decisión más conveniente, eligiendo naturalmente la acción que maximiza las ganancias. En este caso es la que le corresponde a ganancia infinita, por cuya razón se ha colocado una doble raya en la rama eliminada. En conclusión, según Pascal, sin importar el valor de las probabilidades acerca de la existencia de Dios, la esperanza es mayor si optamos por creer en él. 16 A pesar de que en algunos textos también se la enuncia incorrectamente también como ¿Dios existe? 215 Capítulo 3 Distribuciones de Probabilidades Ganancia p1 Existe Infinito.. creyente Infinito. p2 Infinito ateo p3 No existe a Existe. b No Existe. c Finito p4 Figura 3E-1 Árbol de decisiones Para finalizar el razonamiento de Pascal, deben mencionarse algunas críticas matemáticas al mismo. Entre ellas se encuentran las siguientes dos. La primera es que debe exceptuarse el valor de p1 igual a cero, pues produce un resultado indeterminado (0 por ∞ ), el cual no es infinito. La segunda crítica es planteada por quienes no ven en la noción de infinito, un valor legítimo. El argumento es que si se reemplaza ∞ por un valor muy grande pero finito, siempre se podrá asignar a p1 el valor inverso, lo cual producirá una ganancia finita, comprometiendo, de esta forma, el argumento de Pascal. Al igual que para el ensayo sobre la existencia de Dios (página Dios1), el lector podrá sumar su interpretación y opinión personal a la discusión que seguirá generando la respuesta de Pascal. 216 Jorge Carlos Carrá Ensayo: Intimidades de un casino – Introducción Ensayo: Intimidades de un casino Introducción Sabemos que la teoría de las probabilidades tiene amplia aplicación tanto en Casinos como en Compañías de Seguros. Utilizando la distribución binomial veremos aquí una consecuencia que resultará sin duda sorprendente y que resulta aplicable en ambas actividades. 1. Casinos Conocemos del capítulo 3 que en una ruleta la esperanza matemática de la ganancia a la larga, por cada peso apostado es la misma independientemente del tipo de apuesta. Veremos en cambio ahora una extensión de la teoría matemática en condiciones de incertidumbre, para establecer algún criterio que nos permita elegir una de las dos siguientes alternativas: ¿Cuál es la mejor acción: realizar pocas apuestas grandes o muchas apuestas chicas? Para responder a esta pregunta demostraré previamente que la probabilidad de salir ganando (por lo menos 0 $) en un número dado de jugadas, presenta las siguientes tendencias: • para un determinado tipo de apuestas, decrece a medida que el número de jugadas aumenta. • para un determinado número de jugadas, aumenta al elegir los mayores pagos (y por lo tanto las menores probabilidades). Por lo tanto la respuesta a la pregunta será: lo mejor es realizar pocas jugadas de altos pagos. Observaremos experimentalmente el comportamiento anterior simulando con el SPSS un gran número de apuestas en distintos juegos, por ejemplo: docena, mayores, calle, etc. 217 Capíítulo 3 Distrib buciones de Probabilidade P es F Figura 3E-2 Ruleta En unaa ruleta, la disstribución de la l variable X: número de aciertos a en n jugadas es una binomial b ( x, n, p ) . Vinculación entre e XyG En un casino c europeeo B, un jugaddor A juega n veces 1$. Paara obtener laa relación entrre X y G, comencemos por razzonar los valoores de G parra: 1) pleno, 2) 2 docena. Pleno o Por cad da 1$ que se juegue, j la ruleeta siempre paga p un montoo M (incluyenndo la apuestaa): M = 36$ pleno Por lo tanto para obtener la ganan ncia G del jueego, se debe restar r 1$ a la cuenta anterio or. Si se juuega a pleno, si no sale, se pierde 1$ (G G = –1$) y si sale, s paga 36/1 = 36$, resu ultando una G = 35$. S X G F E 0 ––1 1 35 F Figura 3E-3 Ganancia dde pleno en unaa jugada Para esstablecer la reelación para n jugadas, se pprocede en foorma similar. Si denotamoss a las pérdidaas con unn asterisco, ressulta: 218 Jorge e Carlos Carrrá Ensayo: Intimidades de un casino – 1. Casinos S X G E F XA 35 XA X'A – X'A Figura 3E-4 Ganancia de pleno en n jugadas Es decir: G = 35 X A − X A′ Como: 2 = X A + X A′ Se obtiene: G = 36 X A − 2 Docena Si se juega a docena, si no sale, se pierde 1$ (G = –1$) y si sale, paga 36/12 = 3$, resultando una G = 2$. Las tablas son las de las figuras 3E-5 y 3E-6. S X G F E 0 –1 1 2 Figura 3E-5 Ganancia de Docena en una jugada S X G E F XA 2 XA X'A - X'A Figura 3E-6 Ganancia de Docena en n jugadas Hallar, a) E(GA) a la larga, b) la probabilidad de que A salga ganando o empatando al término de las n veces, c) el número de éxitos necesario para salir ganando o empatando. Es decir: G = 2 X A′ − X A′ Como: 2 = X A + X A′ Se obtiene: G = 36 X A − 2 Si se hace intervenir la ecuación de pagos M, enunciada al principio, puede observarse que estas ecuaciones responde a la siguiente ecuación general, válida para todas las jugadas: G = M ∗ XA −n La cantidad de éxitos XA necesarios para salir por lo menos a la par, es decir ganando o empatando, se obtendrá haciendo G = 0. Si llamamos a este valor de X, X0, se tiene entonces: X0 = n M Elección de la mejor acción El número de éxitos que se deben obtener para estar a la par, es: 219 Capítulo 3 Distribuciones de Probabilidades . X0 = n M Analizando la gráfica 3E-7 se concluye que la probabilidad de ganar por lo menos 0 $ deberá ser 1 − CDF .BINOM ( x 0 , n, p ) . CDF.BINOM(x0,n,p) P(ganar o empatar) x0 x 0 G Figura 3E-7 Histograma Combinando las dos expresiones anteriores se obtiene una fórmula para calcular la probabilidad de salir ganando del casino para cualquier juego y para cualquier valor de n. Por ejemplo para los juegos Pleno, Cuadro y Color, resultará: Pleno: n 1 − CDF.BINOM ( − 0.01, n,1 / 37) 36 Cuadro: n 1 − CDF.BINOM ( − 0.01, n,4 / 37) 9 Color: n 1 − CDF .BINOM ( − 0.01, n,18 / 37) 2 Nota Para que cuando x0 coincida con un valor entero, la ganancia 0 se compute correctamente a la probabilidad de salir ganando, restemos un valor pequeño, por ejemplo 0.01 a dicho valor x0). Para la simulación solo basta generar los valores de n. Esto se realiza fácilmente con EXCEL hasta un límite de 65536 (es decir 216) y luego se pasa a una columna de SPSS con copiar y pegar. Llamaremos n a dicha columna. Si se generan las 3 variables anteriores, se observarán las 2 tendencias enunciadas al principio de esta actividad y además ciclos bien definidos de 36, 9 y 2 elementos. ¿Cómo se explican estos ciclos? (si no se le ocurre nada, seguir leyendo). 220 Jorge Carlos Carrá Ensayo: Intimidades de un casino – 1. Casinos Probabilidad de ganar 0 ó más .6 .5 .4 .3 .2 PLENO .1 CUADRO COLOR 0.0 9 92 62 1 7 6 59 0 5 3 56 9 3 9 52 8 1 6 49 6 9 3 46 5 7 0 43 4 5 7 39 3 3 4 36 2 1 1 33 0 9 8 29 9 7 4 26 5 18 23 7 3 8 19 6 1 5 16 4 9 2 13 7 3 99 5 2 66 3 1 33 1 Número de apuestas Figura 3E-8 Probabilidad de ganar en función del número de apuestas Las tendencias se aprecian nítidamente generando gráficos como los que se muestran. En la figura 3E-8, se muestra la tendencia general al aumentar n, en tanto que en la figura 3E-9 se amplifica la escala para observar los ciclos. Observar como la probabilidad de salir ganando del casino converge a cero con el número de jugadas y lo hace más rápidamente para los juegos con menores pagos. Probabilidad de ganar 0 ó más .8 .6 .4 .2 PLENO CUADRO COLOR 0.0 1 301 151 601 451 901 1201 1501 1801 2101 2401 2701 751 1051 1351 1651 1951 2251 2551 2851 Número de apuestas Figura 3E-9 Probabilidad de ganar en función del número de apuestas (amplificado) Para obtenerlos se utilizará el ya conocido menú Graphs. Si se desea representar a todas las variables en un mismo gráfico como se muestra en las figuras, utilizar Graphs > Sequence…> colocar todas las variables en el cuadro Variables y la variable n en el cuadro Time Axis Labels. Los gráficos que representan a una variable categórica tienen en SPSS un límite de 3000 niveles por lo cual, para ver los ciclos del segundo gráfico, limitar los casos a n < 3001 (con Select Cases) y para ver la tendencia del primer gráfico para los 65536 valores de n, seleccionar solo un valor de cada ciclo con Data > Select Cases…> If condition is satisfied > If > buscar la función módulo o teclear mod(n,36)=1 (esto elimina por ejemplo, los ciclos de 36 valores. ¿Por qué?). Repetir la simulación anterior para otros juegos distintos a los ejemplificados, y también computando la probabilidad de salir ganando (no empatando), es decir sin restar ningún valor a x0 . 221 Capítulo 3 Distribuciones de Probabilidades Sugerencia para explicar los ciclos Crear la variable x0 y analizar el siguiente comportamiento. La probabilidad de salir ganando, crece Probabilidad de ganar 0 ó más en los tramos comprendidos entre valores enteros de x0 y decrece en forma brusca exactamente en dichos valores, pues al término de la CDF se le agrega el salto correspondiente a la barra de probabilidades de x0 . Además de observarlo en la planilla de datos, esto se puede ver nítidamente limitando los casos a por ejemplo 100, como se indica en el diagrama 3E-10, correspondiente a la apuesta cuadro. En otras palabras estos ciclos se originan por las discontinuidades de una distribución discreta, pero lo que interesa realmente es la tendencia general, la cual, como se observa en la figura 3E-9, es decreciente con el número de jugadas. .7 .6 .5 .4 .3 .2 .1 0.0 1.00 10.00 19.00 28.00 37.00 46.00 55.00 64.00 73.00 82.00 91.00 Número de apuestas Figura 3E-10 Probabilidad de ganar en función del número de apuestas Esta actividad ayudará a comprender los efectos de la ventaja que tiene un Casino en la esperanza matemática (ciertamente muy moderada) y porque no es negocio para el Casino que se juegue poco. Todos los Casinos buscan atraer a muchos jugadores (que equivale a jugar muchas veces para el Casino). El negocio redondo sería tener una ciudad atractiva, con sorteos gratis, incluso con hoteles y restaurantes baratos, para atraer siempre a una gran cantidad de jugadores. 2. Aseguradoras Estas compañías también utilizan la teoría de las probabilidades en su gestión. Por razones similares a los Casinos es conveniente para ellas asociarse en lugar de operar cada una por su cuenta, pues de esta forma disminuyen el riesgo de perder. Por lo mismo, aparece la figura de las reaseguradotas, es decir sociedades que aseguran a las aseguradoras. En la punta de la pirámide se encuentra el Lloyd de Londres, quien al distribuir el riesgo lo minimiza. 222 Jorge Carlos Carrá Ensayo: Intimidades de un casino – 2. Aseguradoras 223 Capítulo 3 Distribuciones de Probabilidades Problemas Ia Una variable 1. Inglés y francés En un conjunto de 330 estudiantes argentinos, 200 hablan inglés, 90 hablan francés y 70 no hablan ni inglés ni francés. Se elige un estudiante al azar, a) hallar la distribución de probabilidades de x: número de idiomas extranjeros que habla, b) Si se elige 1 estudiante ¿cuál es la probabilidad de que hable un solo idioma extranjero, c) Si se eligen 2 estudiantes, ¿cuál es la probabilidad de que el primero hable un solo idioma extranjero y el segundo por lo menos uno? Realizar primero el cálculo exacto y luego suponiendo que los eventos son independientes. R: a) μ = 0.88, σ = 0.53, b) 0.697, c) 0.549. 2. Tanques de agua con impurezas Se examinan tanques de agua en la búsqueda de 2 impurezas A y B. Se encontró que el 20% no revelaban impurezas, 40% tenían la A y el 50% la B. Hallar, a) la distribución de probabilidades de X: el número de impurezas encontradas si se elige un tanque al azar, b) si se eligen 2 tanques independientes, cual es la probabilidad de que el primero tenga 1 impureza y el segundo por lo menos 1, c) si se elige un tanque del que se sabe que tiene por lo menos 1 impureza, hallar la probabilidad de que tenga una sola. R: a) µ=0.9, σ=0.54, b) 0.56, c) 0.875. 3. Válvulas de agua En el circuito de la figura, A B y C son válvulas de agua que se abren con una probabilidad p=0.8. a) Hallar el histograma de probabilidad de X: el número de ramas abiertas luego de haber enviado la señal. b) ¿Cuál es la probabilidad de que una rama este abierta sabiendo que por lo menos una lo está? c) Calcular la confiabilidad del sistema. R: a) µ=1.44, σ=0.62, b) 0.448. c) 0.928. 4. Lanzamiento de una moneda Se lanza una moneda hasta que aparezcan 1 cara o 5 secas. Si X es el número de lanzamientos, a) hallar µ y σ de la distribución, b) ¿cuál es la probabilidad de que salgan no más de 2 secas? R: a) µ=1.94, σ=1.19, b) 0.875. 224 Jorge Carlos Carrá Problemas – Ic Modelos teóricos de una variable Ic Modelos teóricos de una variable Discretas 5. Equipos y la probabilidad de ganar El equipo A tiene 2/3 de probabilidad de ganar cuando juega. Si A juega 4 partidos, hallar: a) la distribución de probabilidades, µ y σ de X: resultados (número de partidos ganados) de A, b) la probabilidad de que A gane 2 partidos, c) de que gane un partido por lo menos, d) de que gane más de la mitad de los partidos, e) ¿Es poco común que A gane menos de 1 partido? f) Si Y = 2X+4, hallar la distribución de probabilidades de Y, su esperanza y su varianza. Resolver manualmente y con el SPSS. R: a) 8/3; 0.943, b) 8/27, c) 80/81, d) 16/27, f) SPSS. 6. Equipos de radar Siete equipos de radar están disponibles para detectar cualquier avión. Cada equipo tiene una probabilidad p = 3/4 de detección. Sea X el número de radares detectores. a) Dibujar el histograma con µ y σ, b) si un avión entra en el área, cuál es la probabilidad de que no sea detectado y cuál de que sea detectado por 2 radares por lo menos, c) cuantos radares debe haber para que la probabilidad de detección de por lo menos 1 de ellos sea 15/16, d) cuál es la probabilidad de que uno de los equipos detecte 3 aviones antes de fallar e) ¿Es poco común que un avión sea detectado por menos de 2 aviones? f) Si Y = 2-X, hallar la distribución de probabilidades de Y, su esperanza y su varianza. Resolver manualmente y con el SPSS. R: a) 5.25, 1.14, b) 0.006%, 99.8%, c) 2, d) 10.54%, f) SPSS. 7. Examen de selección múltiple Hallar la probabilidad de que un estudiante en un examen de selección múltiple, conteste correctamente y al azar, a) 12 o más de un total de 20, si tiene 2 respuestas posibles, b) al menos 10 de un total de 15, si tiene 5 respuestas posibles, c) ¿Es poco común que conteste más de 15 de un total de 20, si tiene 2 respuestas posibles? Resolver manualmente y con el SPSS. R: a) 0.2511, b) 0. 8. Vuelos sobre registrados Una compañía aérea tiene aviones pequeños con capacidad para 18 personas y tiene la política de registrar hasta 20 personas pues la experiencia anterior indica que el 80% de los pasajeros registrados realmente toman el vuelo. a) Calcular la probabilidad de que, habiendo registrado 20 pasajeros, no haya asientos disponibles. b) Si consideramos como un valor inusualmente bajo cuando la probabilidad sea menor al 5%, ¿será esta sobreventa un problema real para los pasajeros? Resolver manualmente y con el SPSS. R: 0.069, b) si. 9. Cara reticente Dado que se ha lanzado 5 veces una moneda normal sin obtener una cara, ¿cuál es la probabilidad de que se tenga que lanzar al menos dos veces para obtener la primera cara? R: 0.5. 10. Computadoras de un avión Un avión tiene 3 computadoras pero solo una de ellas se encuentra en servicio. Las otras son de reserva en caso de falla. Durante una hora de operación, la probabilidad de falla es 0.0005 (el número de ensayos y equivale en este problema al número de horas). a) ¿Cuál es el tiempo promedio de falla de las 3 computadoras? b) ¿Cuál es la probabilidad de que las 3 fallen en un vuelo de 5 horas (es decir: P ( y ≤ 5) = P ( y = 3) + P ( y = 4) + P ( y = 5) )? c) ¿Es poco común que las 3 fallen en un vuelo de 5 horas? Resolver manualmente y con el SPSS. R: a) 6000 horas, b) 1.25E-9. 225 Capítulo 3 Distribuciones de Probabilidades 11. Muestreo de aceptación Un producto se embarca en lotes de 20. Se muestrean 5 artículos de cada lote y se rechaza el lote si se encuentra más de 1 defectuoso. Si un lote contiene 4 defectuosos, a) ¿cuál es la probabilidad de ser rechazado?, b) si X es el número de defectuosos encontrados en el lote, hallar el µ y σ de la distribución. Resolver manualmente y con el SPSS. R: a) 0.248, b) µ=1, σ=0.7947. 12. Acciones preferentes y ordinarias Un inversionista desea comprar 3 acciones. Tiene 5 alternativas de las cuales 2 son preferentes y 3 ordinarias. Si toma la decisión al azar, hallar: a) el histograma para X: el número de acciones preferentes que comprará, b) µ y V(X), c) la probabilidad de que x caiga a no más de dos σ de µ, d) ¿Es poco común que compre menos de 2 acciones ordinarias? R: b) µ=1.2, V(X) = 0.36, c) 1. Resolver manualmente y con el SPSS. 13. Elección de trabajadores Un capataz de una fábrica tiene 3 hombres y 3 mujeres trabajando para él. Desea elegir 2 trabajadores al azar. a) Hallar el histograma de probabilidad de X: el número de mujeres en su selección. b) ¿Es poco común que elija menos de 1 mujer? Resolver manualmente y con el SPSS. R: µ=1, σ=0.63. 14. Soldadura defectuosa La probabilidad de que se haga una soldadura defectuosa en una conexión dada es 10-4. Hallar: a) el número de soldaduras en un sistema si la probabilidad de que no se presenten defectos en dicho sistema es 6.7363.10-3, b) el número esperado de uniones defectuosas. R: a)5 104., b) 5. 15. Test para detectar una enfermedad Un médico aplica un test a una muestra de 10 personas para detectar una enfermedad que afecta al 10% de los trabajadores de una fábrica. Se sabe que el test acierta un 80% a un individuo enfermo y un 75% a un individuo sano. a) Hallar la probabilidad de que a 4 personas de las 10, el test les dé positivo (predice enfermedad), b) Si hay 4 personas que el test les da positivo, cual es la probabilidad de que entre éstas exactamente 2 estén sanas, c) hallar la probabilidad de que el test se equivoque en 2 personas de las 10, d) calcular la probabilidad de que el test acierte a por lo menos 8 personas de las 10. R: a) 0.2047, b) 0.2246, c) 0.285, d) 0.5407. Resolver manualmente y con el SPSS. 16. Suspensión de clases como medida de protesta De los 800 alumnos de una facultad, 560 están en contra de la suspensión de clases como medida de protesta resuelta por el gremio. Veinticinco estudiantes son elegidos al azar, sin reposición. a) Hallar la probabilidad de que menos de 5 estén a favor de la medida de fuerza. b) ¿Es poco común que menos de 4 estén a favor de la medida de fuerza? Resolver manualmente y con el SPSS. R: 9%. 17. Envío de artículos Una empresa debe enviarle a un cliente 5 artículos y posee en existencia 12. De estos 12 artículos, 3 son del tipo A, 2 del tipo B y el resto del tipo C. ¿Cuál es la probabilidad de que el cliente reciba exactamente 2 del tipo A, 1 del tipo B y 2 del tipo C? R: 0.159. 18. Técnica de captura- marcación- recaptura Muchas veces se estima el tamaño de la población de animales utilizando la técnica de captura- marcación- recaptura. Utilizando este procedimiento para estimar el tamaño de la población de truchas de un lago se capturan 10 truchas, se las marca y luego se las devuelve al lago. Posteriormente se toman muestras al azar de 2 truchas y se anota el número X de animales marcados. Si se ha determinado por este proceso que la frecuencia relativa de X=1 es 0.05, ¿cuántas truchas se estima que haya en el lago? R: 390. 226 Jorge Carlos Carrá Problemas – Ic Modelos teóricos de una variable 19. Número de fallas En un servidor web, el número de fallas que un requerimiento puede generar es de 1 por cada 100 requerimientos y el servidor procesa 500 requerimientos por hora. Hallar manualmente y con el SPSS, la probabilidad de que se presenten: a) 7 fallas en 1.5 horas b) al menos 3 fallas en media hora c) ¿Es poco común que se presenten menos de 2 fallas en media hora? R: a) 0.1465, b) 0.456. 20. Errores de inventario En un supermercado el número promedio de errores de un cierto empleado es 2.3. a) Si se consideran 3 períodos consecutivos, ¿cuál es la probabilidad de que el número de errores se aleje de la media en, a lo sumo, una desviación estándar? Un programa de incentivos para disminuir la cantidad de errores consiste en: 1) si comete menos de 5 errores, su sueldo no se verá afectado por descuentos, 2) si comete por lo menos 5 pero menos de 10 errores, su sueldo tendrá un descuento del 5%, 3) si comete por lo menos 10 errores, su sueldo tendrá un descuento del 10%. b) Calcular el descuento esperado por período de inventario. R: a) 0.778, b) 0.42%. 21. Seguros por enfermedad La probabilidad de que una persona de entre 20 y 30 años muera de cierta enfermedad durante un período de un año es de 0.00001. a) Si una compañía de seguros tiene 100000 personas de este grupo, ¿cuál es la probabilidad de que deba pagar más de 4 seguros por esta enfermedad? b) Si la póliza de seguros es de $ 200000, ¿cuál debe ser la prima anual si la compañía desea tener un beneficio de $ 10? R: a) 0.00366, b) $ 12. 22. Páginas con avisos comerciales Forme un grupo de estudiantes que cuenten las páginas con avisos comerciales en una revista. Luego deben crear la distribución de frecuencias en una columna del SPSS, comparar esta distribución real con una binomial b ( y , n , p ) (forma de la CDF y parámetros). Calcular en forma manual y con la computadora, para ambas distribuciones: a) la probabilidad de que la proporción muestral de páginas con avisos comerciales se encuentre a menos de 0.09 de la media, b) el percentil 59 de la distribución binomial de la proporción de páginas con avisos comerciales, c) la proporción de páginas con avisos comerciales a partir de la cual sería un suceso poco común. 23. Lanzamiento de una moneda Cada estudiante debe lanzar 10 monedas, anotar el número de caras y repetir el experimento 30 veces. Luego debe crear una distribución de frecuencias en una columna del SPSS y comparar esta distribución real con una binomial b ( y , n , p ) (forma de la CDF y parámetros). Con ambas distribuciones: a) calcular la probabilidad de que la proporción de veces que sale cara, sea mayor a 0.60, b) hallar la AIC, c) ¿es poco común que el número de caras sea mayor a 28? 24. Búsquedas en Google Realizar 20 búsquedas de un tópico cualquiera y registrar el número de errores que se presentan debido a páginas que no se conectan. Repetir para otras 30 búsquedas. Colocar los resultados en una columna de 30 filas del SPSS y comparar esta distribución real con una binomial b ( y , n , p ) o con una p ( y , λ ) (forma de la CDF y parámetros). Con ambas distribuciones: a) hallar la probabilidad de recibir menos de 1 error, b) hallar el percentil 50. ¿Que hubiera sucedido con las diferencias si la muestra hubiera sido de 500? ¿Puede ser usada la distribución de Poisson para aproximar esta distribución observada? 227 Capítulo 3 Distribuciones de Probabilidades Contínuas 25. Distribución definida con una PDF constante Si X es una variable aleatoria distribuida con la siguiente función densidad: ⎧k , si − 2 < x < 2 f ( x) = ⎨ ⎩0 en otros puntos a) Obtener la media y la varianza, b) hallar la CDF, c) hallar la AIC, d) ¿cuál es la probabilidad de que X sea mayor que 1 sabiendo que es positiva? e) dibujar la CDF y el diagrama de caja, encolumnados con la PDF. R: a) 0, 0.333, b) (x+2)/4, c) 2, d) 0.5. 26. Distribución definida con una PDF Triangular Un error X se distribuye de acuerdo a la PDF que se muestra en la figura. a) Hallar la probabilidad de que el error respecto de 10 sea superior a ± 0.5% (es decir de que X se encuentre a mas de 0.05 de µ), b) la PDF analítica con la media y la varianza, c) la CDF, d) la AIC, e) dibujar la CDF y el diagrama de caja, encolumnados con la PDF. R: a) 0.25, 9.9 < x < 10 ⎧100 x − 990 ⎩−100 x + 1010 10 < x < 10.1 b) f ( x) = ⎨ μ = 10, σ2 = 0.001667. 2 ⎪⎧50x -990x+4900.5 2 ⎪⎩-50x +1010x-5099.5 c) F ( x) = ⎨ 9.9 < x < 10 10 < x < 10.1 d) 10.0293-9.9707= 0.0586 27. Distribución definida con una PDF cuadrática Dada la siguiente función: f ( x) = ax 2 (1 − x) 0 < x <1 a) Hallar a para que sea una PDF, b) obtener la CDF, la media y la varianza. Dibujar encolumnadas la PDF y la CDF, c) hallar la moda, d) hallar la mediana. R: a) 12, b) 4 x 3 − 3 x 4 , μ = 0.60, σ2 = 0.04, c) 0.667, d) 0.615. 28. Distribución definida con una PDF por tramos La densidad de probabilidades del tiempo de duración (en horas) de un determinado producto se puede suponer representada por la f(x) que toma los valores siguientes: ⎧a, si 1 < x < 2 ⎪3a si 2 ≤ x < 4 ⎪ f ( x) = ⎨ ⎪1, si x = 5 ó x = 6 ⎪⎩0, para los demás valores de x Hallar: a) p( X ≤ 1.5) b) la CDF, la media, la desviación estándar y graficarla encolumnada con la PDF. c) la amplitud intercuartílica y el diagrama de caja, 228 Jorge Carlos Carrá Problemas – Ic Modelos teóricos de una variable d) Si un producto ha tenido una duración comprendida entre 1.3 y 2.4 horas, hallar la probabilidad de que haya superado 2 horas, e) Se seleccionan 10 productos en forma independiente. Calcular la probabilidad de que por lo menos 9 tengan una duración superior a 3 horas. R: a) 0.0714, b) 1 ⎧1 ⎪⎪ 7 x − 7 , F ( x) = ⎨ ⎪3 x − 5 ⎪⎩ 7 7 si 1 < x < 2 si 2 ≤ x < 4 μ = 2.785, σ = 0.757 c) AIC = 1.167, Q2 = 2.833, d) 0.631,e) 2.99 10-3. 29. Distribución definida con una CDF cuadrática Dada la siguiente función: F ( x) = 30. 31. 32. 33. 34. 35. x2 4 0< x<2 a) Determinar si cumple las propiedades de una función de distribución, b) Hallar los cuartiles y dibujar el diagrama de caja, c) hallar el percentil 80., d) hallar la PDF, la media y la varianza. e) graficar la PDF y la CDF en forma encolumnada. R: a) si, b) 1.414, 1, 1.732, c) 1.789, d) x/2, μ = 4/3, σ2 = 2/3. Cantidad de chocolate La cantidad de chocolate utilizada por una fábrica en un día se puede modelar con una distribución exponencial con media β = 300 kg. a) Hallar la probabilidad de que la fábrica utilice más de 300 kg en un día determinado. b) El gerente le pide que calcule qué cantidad de chocolate tendría que almacenar para que la probabilidad de agotar la existencia sea poco común. Resolver manualmente y con el SPSS. R: a) 0.368, b) 898 kg. Dado el valor del eje de una normal, hallar la probabilidad Si X es una variable aleatoria distribuida normalmente con µX=0 y σx=1, hallar manualmente y con el SPSS: a) P(0<x<1.42), b) P(-0.73<x<0), c) P(-1.37<x<2.01), d) P(0.65<x<1.26), e) P(-1.79<x<-0.54), f) P(x>1.13), g) P(-0.5<x<0.5). R: a) 0.422, b) 0.2673, c) 0.892, d) 0.154, e) 0.258, f) 0.13, g) 0.383. Dada la probabilidad de una normal, hallar el valor del eje Sabiendo que Z está distribuida normalmente con µZ=0 y σZ=1, determinar su valor, manualmente y con el SPSS, si: a) A0 z = 0.377, b) CDF=0.377, c) A−1.5 z = 0.0217, d) A−∞ z = 0.8621. R: a) ±1.16, b) –0.31, c) –1.35, -1.69, d) 1.09. Admisión de un colegio Los resultados de admisión de un colegio tienen una distribución normal con µ=7.5 y σ=1. a) ¿Qué fracción de resultados se encuentra entre 8 y 9? b) Hallar la puntuación máxima del 10% inferior de la clase. Resolver manualmente y con el SPSS. R: a) 24.17%, b) 6.22. Error con distribución normal En una medición se comete un error e que se distribuye normalmente con µ=0 y σ=2. Determinar la probabilidad de que en 5 mediciones independientes todas resulten con error superior a 0.5 (en ambos sentidos). R: 0.333 Dígitos al azar Hallar la probabilidad de que entre 10000 dígitos al azar con reposición, el dígito 3 aparezca 950 veces a lo sumo. Resolver manualmente y con el SPSS. R: 4.75%. 229 Capítulo 3 Distribuciones de Probabilidades 36. Un persona, su padre y su abuelo ¿Cuál es la probabilidad de que una persona, su padre y su abuelo paterno tengan el mismo cumpleaños? b) En una ciudad de 2000000 de habitantes, cuantos habrá término medio con esta característica. c) ¿Cuál es la probabilidad de que haya menos de 10 habitantes con dicha característica? d) ¿Cuál de que haya más de 5 con dicha característica? R: a) 7.5 10-6, b) 15, c) 7.78%, d) 99.5%. 37. Dos máquinas independientes E n un proceso de fabricación de una pieza mecánica intervienen 2 máquinas: la A taladra y la B corta en trozos. Ambas son independientes. El diámetro del taladro de A en mm sigue una n(23; 0.5), y el grosor producido por B, una n(11.5; 0.4). a) ¿Qué porcentaje de las piezas tienen un diámetro entre 22.5 mm y 24 mm? b) ¿Qué porcentaje tiene un grosor entre 10.5 mm y 11.7 mm? c) Si solo son aceptadas las piezas que cumplen a) y b), ¿qué porcentaje de piezas será aceptado? R: a) 81,8%, b) 68,53%, c) 56%. 38. Lanzamiento numeroso de una moneda Una moneda se lanza 400 veces. Calcular la probabilidad de que a) el número de caras difiera de 200 en más de 10, b) el número de caras se encuentre en el intervalo 200 ±20. c) Si el número de caras resultó menor que 212, cual es la probabilidad de que hayan salido más de 203. d) En que intervalo se encuentra el 77% de los resultados (número de caras) alrededor del valor medio. e) Se realizan 2 pruebas. Cuál es la probabilidad de que en la primera salgan menos de 194 caras y en la segunda menos de 190 secas. Resolver manualmente y con el SPSS. R: a) 31.7%, b) 95.4%, c) 30%, d) 200±12, e) 4.3%. 39. Suma de los dígitos de un dado Se tira un dado 60 veces. Hallar la probabilidad de que la suma de todos los dígitos sea menor que 200. R: 0.2358 40. Probabilidad de salir ganando del casino Con una ruleta americana (con 0 y 00), se realizan 64 apuestas de 1$ a colorado. a)¿Cuál es la probabilidad de salir ganando del casino?, (pensar en el número mínimo de éxitos que aseguran esto), b) ¿cuál es la probabilidad de ganar exactamente 20$?, c) ¿cuál es la probabilidad de perder al menos 10$?, d) si se realizan 10000 jugadas, ¿cuál es la probabilidad de salir al menos a la par?, e) si se juega a pleno 1$ en 500 jugadas, ¿cuál es la probabilidad de ganar al menos 40$?. R: a) 0.295, b) 0.0014, c) 0.242, d) ~0, e) 0.337. 41. Lavado automático Los automóviles llegan un lavado automático en promedio 20 cada hora. Hallar manualmente y con el SPSS: a) la probabilidad exacta de que en cualquier período dado de media hora lleguen menos de 4 automóviles. b) la probabilidad aproximada de que en cualquier período dado de 30 minutos lleguen menos de 4 automóviles (usar la cpc). R: a) 0.010, b) 0.019. 42. Persona que entra a un shopping y compra. Los dueños de un shopping saben que una de cada cuatro personas que entra, compra algo. Si se selecciona una muestra de 5 personas, hallar la probabilidad de que a) 2 o más realicen alguna compra b) a lo sumo 4 realicen alguna compra Si se selecciona una muestra de 90 personas, hallar la probabilidad aproximada de que, c) menos de 15 realicen alguna compra d) al menos 20 realicen alguna compra R: a) 0.367, b) 0.999, c) 0.025, d) 0.767 230 Jorge Carlos Carrá Problemas – IV Teoría de los juegos 43. Entrega de la Tesis De acuerdo a estudios anteriores, el 5% de los alumnos de estadística no presentan la tesis. Se toma una muestra aleatoria de 20 alumnos, hallar las siguientes probabilidades en forma exacta y con todas las formas de aproximación válidas: a) no más de 2 no presenten la tesis, b) cuanto menos 18, presenten la tesis, c) 3 no presenten la tesis. d) dibujar el histograma de probabilidades R: a) 0.925, 0.919, b) 0.925, 0.919, c) 0.059, 0.0613. IV Teoría de los juegos 44. Problemas Resueltos Obtener los equilibrios en estrategias mixtas de todos los problemas resueltos de la sección: "Simultáneos con estrategias puras", los cuales comienzan en la página 163. R: Sistemas de video: 0.5, 0.5, El juego de la contaminación: no tiene equilibrios en estrategias mixtas, Competencia Cournot: no tiene equilibrios en estrategias mixtas. 45. El dilema del prisionero Dos prisioneros, A y B, que efectivamente cometieron un delito, son interrogados por separado. Cada uno tiene 2 acciones posibles: Delatar, C o No Delatar, N. Si los 2 niegan, la sentencia es solo 1 año por evidencias menores. Si solo uno delata, se le libera, pero al otro se le sentencia con la condena máxima establecida por el código que es de 15 años. Si ambos delatan se les rebaja la condena y son sentenciados a 10 años de prisión. a) Confeccionar la matriz de ganancias (años de prisión) y verificar que en este juego simétrico, cada uno tiene una estrategia dominante y que existe un solo equilibrio de Nash dominante. ¿Cuál es el valor del juego? ¿Cuál es el dilema? ¿Subsiste si el juego se repite? ¿El equilibrio es Pareto eficiente? b) Convertir el problema simultáneo en secuencial y verificar que, al tener estrategias dominantes, no importa quién es el primero. c) Para un posterior análisis, genere datos experimentales creando una simulación con el programa ComLabGame y confronte a 2 jugadores. Repita el juego y exporte los principales datos de la experiencia a un archivo EXCEL. 46. Aplicación del dilema del prisionero Documentarse en el dilema del prisionero para involucrar los conceptos de cooperación y confianza (es una situación muy común en el combate del crimen). Luego adaptar el juego a por lo menos 2 situaciones en las que se presente una dicotomía entre el incentivo individual para no cooperar y el incentivo social para cooperar. Ejemplos: guerra de precios de 2 empresas duopólicas (Coca y Pepsi), hacer o no publicidad (existe un ejemplo testigo con las empresas tabacaleras y la publicidad en TV), conducir siempre por la izquierda o respetar la norma, pagar impuestos o no, divorcio amigable o con juicio, licitaciones, negociaciones políticas, quiebra de bancos por retiros en masa, consumo de agua de red, tragedia de los comunes, carrera armamentista, etc. 47. El juego del gallina Dos adolescentes conducen cada uno un auto en sentidos contrarios, siendo inminente un choque. Cada uno puede decidir Continuar o Virar hacia un lado. Si ambos continúan, ambos mueren lo cual se representará con una ganancia de –3. Si ambos viran, se salvan (ganancia 1) pero pierden prestigio. Si solo uno de los dos continúa se cubre de gloria (ganancia 2), pero el que vira tiene una ganancia de 0. a) Obtener los equilibrios de Nash (puros y mixtos), el valor del juego y la probabilidad de que ambos adolescentes se salven. ¿Son los equilibrios Pareto eficientes? ¿Existen estrategias dominantes débiles o fuertes? b) Convertir el problema simultáneo en secuencial y analizar si importa quién es el primero. c) Para un posterior análisis, genere datos experimentales creando una simulación con el programa ComLabGame y confronte a 2 jugadores sin base teórica. Repita el juego y 231 Capítulo 3 Distribuciones de Probabilidades exporte los principales datos de la experiencia a un archivo EXCEL. R: a) dos equilibrios de Nash de estrategias puras no dominantes y un equilibrio de Nash de estrategias mixtas con p(continuar) = 0.25. La probabilidad de que se salven es: 0.9375. 48. Juego de entrada al mercado Dos empresas A y B deben decidir si abrir un restaurant en un shopping. Las estrategias son Entrar, E y No entrar, N. Si las 2 empresas deciden N, la ganancia será 0 para ambas. Si un decide E y la otra N, la firma que entra gana 30000$. Si ambas deciden E, ambas pierden 10000$ pues no ha suficiente demanda para ambas. a) Obtener los equilibrios de Nash (puros y mixtos) y el valor del juego. ¿Son los equilibrios Pareto eficientes? Construir las formas normal y extensiva del juego. b) Repetir el análisis si la matriz de pagos cambia de tal forma que B gane 400000$ si entra sola. c) Para un posterior análisis, genere datos experimentales creando una simulación con el programa ComLabGame y confronte a 2 jugadores sin base teórica. Repita el juego y exporte los principales datos de la experiencia a un archivo EXCEL. Este problema será continuado en el capítulo 5. R. a) ambas deben utilizar una estrategia mixta de 0.75 para Entrar. Valor del juego = 0. b) La probabilidad para Entrar de A cambia de 0.75 a 0.80. El valor del juego no cambia. 49. Los generales juegan a la guerra Dos generales Smith y Gonzalez deciden jugar un juego de guerra. El general Smith puede atacar por Tierra o por Mar. El general Gonzalez puede defender por Tierra o por Mar. Ambos acuerdan la siguiente matriz de pagos (los valores representan las ganancias del general Smith). a) Obtener los equilibrios de Nash (puros y mixtos) y el valor del juego. ¿Son los equilibrios Pareto eficientes? Construir las formas normal y extensiva del juego. b) Para un posterior análisis, genere datos experimentales creando una simulación con el programa ComLabGame y confronte a 2 jugadores sin base teórica. Repita el juego y exporte los principales datos de la experiencia a un archivo EXCEL. General Gonzalez Tierra Mar Tierra –25$ 75$ General Smith Mar 90$ –50$ R: a) Estrategia mixta con pSmith = 0.583, pGonzalez = 0.521. Valor del juego = 22.92$. 50. Roca, papel, tijera Dos amigos Juana y Juan realizan este conocido juego en forma simultánea mostrando los dedos. Roca rompe Tijera, Tijera corta Papel y Papel envuelve Roca. Si Juana gana, obtiene 1$ de Juan y viceversa. Construir la tabla de pagos y el árbol del juego. a) Obtener los equilibrios de Nash (puros y mixtos) y el valor del juego (deberá resolver un sistema de ecuaciones de 4×4). ¿Son los equilibrios Pareto eficientes? b) Para un posterior análisis, genere datos experimentales creando una simulación con el programa ComLabGame y confronte a 2 jugadores. Repita el juego y exporte los principales datos de la experiencia a un archivo EXCEL. R: a) probabilidades = 0.33, G = 0. 51. Monedas y ases En un juego usted elige cara o seca y su compañero elige uno de 4 ases. Dependiendo de si él elige: Oro, Copa, Espada o Bastos, si usted elige Cara, recibe un pago de 15$, 4$, –5$ y 1$, y si selecciona Seca, recibe un pago de –10$, –2$, 1$ y –5$. a) ¿Está de acuerdo con jugar? Deberá obtener el valor del juego para las estrategias puras o mixtas que posea (utilice el método gráfico para resolver la igualdad de ganancias). b) Si aceptó el juego y luego de 4 repeticiones ganó 5$, ¿Qué concluiría? R: a) estrategia mixta p = (0.5, 0.5). Valor del juego: –2$. b) o tuvo mucha suerte o su compañero es un ignorante. 232 Jorge Carlos Carrá Problemas – IV Teoría de los juegos 52. Campaña publicitaria Dos senadores compiten por la reelección. El senador A mueve primero y debe decidir si invierte en una costosa campaña publicitaria. El senador B mueve después y debe decidir si entra o no en el juego. B sabe que le será más fácil ganar si A no realiza una campaña publicitaria. Modelar las 4 ganancias de cada uno con los valores 1, 2, 3 y 4. Si en el orden A (Campaña, No campaña) y B (Entra, No entra), se utilizan las siguientes ganancias en los nodos finales: (1,1), (3,3), (2,4) y (4,2), a) ¿Cuál es el equilibrio del juego?, b) hallar el equilibrio si se mantienen las ganancias pero B mueve primero. ¿Importa quién mueve primero? ¿Por qué? c) rediseñar las ganancias de tal forma que el orden no importe y calcular el equilibrio. R: a) (3,3), b) (4,2). 53. Póliza de seguro Hallar la prima anual (de equilibrio) de una póliza de seguro contra incendio de $ 20000 en una zona que por experiencia anterior puede tener pérdida total con p=0.001 y pérdida del cincuenta por ciento con p=0.01. Ignorar todas las otras pérdidas parciales. R: $ 120. 54. Empresa petrolera Una empresa petrolera va a realizar 10 exploraciones. La probabilidad de una exploración exitosa es 0.1. El conjunto tiene un costo fijo de $ 20000. Además cada exploración exitosa cuesta $ 30000 y las fallidas $ 15000. Hallar el costo esperado para las 10 exploraciones. R: $ 185000. 55. Bonos de inversión Usted debe aconsejar a un cliente que tiene $1000 para invertir, el cual está interesado en 2 bonos con riesgos. Los bonos A tienen un rendimiento anual del 6.5%, pero tienen una tasa de incumplimiento del 1% (se pierden los $1000). Los bonos B tienen un rendimiento anual del 8.6%, con una tasa de incumplimiento del 2%. ¿Cuál de los bonos aconsejaría? R: B. 56. Envases defectuosos Una empresa provee envases para distintas industrias. El control de calidad de la misma realiza un muestreo mensual de 350 envases para detectar la cantidad de fallas, cuyo último resultado se indica en la tabla siguiente. Por cada envase la empresa cobre 6$. El costo de cada uno es de 3$, pero si debe ser corregido se incrementa en 1.20$, independientemente de las fallas que tenga. Los envases que tienen hasta 2 fallas se corrigen y los que tienen 3 o más se descartan. Calcular la ganancia esperada mensual por envase. 1 2 3 4 Número de fallas por envase 0 86 112 83 47 22 Cantidad de envases R: 1.150$. 57. Instrumentos de laboratorio Todas las mañanas debe ajustarse un sistema de instrumentos en 2 laboratorios A y B de la misma empresa, en forma independiente. Cada puesta a punto requiere una serie de ensayos que no superan a 3, cuyas probabilidades se dan en la siguiente tabla. Cada ensayo cuesta 3$. a) ¿Cuál es el laboratorio con mayores gastos diarios y cuál es el de gastos más irregulares. b) Si U es el número total de ensayos en le empresa, calcular la esperanza y varianza del gasto total G. Laboratorio A 1 2 3 X 0.2 0.6 0.2 P(X) Laboratorio B 1 2 3 Y P(Y) 0.5 0.2 0.3 R: a) A, B, b) 11.40$, 10.44$. 233 Capítulo 3 Distribuciones de Probabilidades 58. Apuestas simples y dobles Un jugador a cara o seca tiene un capital de 3 $. Apuesta 1 $ siempre a cara (apuesta simple). Hallar el valor esperado de la ganancia si a) juega 2 veces, b) juega 3 veces. Luego decide usar la técnica de la apuesta doble, es decir duplica la apuesta (2 $) si pierde, en tanto tenga capital suficiente, c) repetir a), d) repetir b). ¿Qué diferencia se observa en los histogramas? Justificarlas. R: a) 0 $, b) 0 $, c) 0 $, d) 0 $. 59. Casino de ruleta europea y el equilibrio En un casino de ruleta europea, establecer cuál de los siguientes juegos, conduce a: la fortuna, la ruina o es equilibrado. Suponer que en cada uno se apuesta 1 $. a) Apostar al número tres, (pleno), b) apostar a una línea, c) apostar a la primer docena, d) jugar a pleno dos veces con apuesta simple, e) jugar tres veces a pleno con apuesta doble. R: a) E(G)=-0.027, b) E(G)=-0.027, c) E(G)=-0.027, d) E(G)= - 0.054, e) E(G)= - 0.108. 60. Dados y el equilibrio Establecer cuál de los siguientes juegos, conduce a: la fortuna, la ruina o es equilibrado, suponiendo que en cada uno se apuesta 1 $. a) Apostar a obtener por lo menos un 6 en 4 tiros de un dado, b) apostar a obtener por lo menos un doble 6 en 24 tiros de dos dados, (ídem anterior). R: a) E(G)=0.035, b) E(G)=-0.01718. Problemas con base de datos Todos los archivos que se mencionan en los problemas, se encuentran en la dirección (acceso restringido a alumnos): http://www.aprehender.net/JCC/viewtopic.php?f=52&t=267 61. Telefonistas en la mira Abrir el archivo Llamadas.sav. La empresa en la que usted trabaja atiende pedidos por teléfono, para lo cual cuenta con un grupo de telefonistas. El gerente desea bajar los costos y le pide que estudie optimizar el número de telefonistas. Como primera medida necesita datos para analizar, por lo que solicita que le confeccionen un registro del número de llamadas que se reciben de los clientes, agrupados por hora desde las 8 de la mañana hasta las 4 de la tarde. Estos datos se obtienen durante el transcurso de 22 días y le son entregados en el archivo Llamadas.sav Supondremos en principio que el número de llamadas por hora sigue una distribución normal lo cual será validado en el capítulo 7. Las inquietudes del gerente son las siguientes: a) ¿Qué cantidad de telefonistas por hora recomendaría para estar 98 % seguro de que cada uno de ellos solo tenga que atender 8 clientes por hora? Sugerencia: calcular primero el número de llamadas por hora asociado al 98 % (percentil 98). b) El gerente observa que los datos parecen indicar algunas horas pico, por lo cual le solicita evaluar una solución menos costosa que utilice por ejemplo distinta cantidad de telefonistas en cada hora. Repetir entonces la pregunta anterior pero ahora analizando la cantidad requerida de telefonistas por cada una de las horas entre las 8 de la mañana y las 4 de la tarde. ¿Cuántas horas de telefonistas se ahorraría el gerente? Sugerencia: Usar Split File para dividir los datos por hora. Para calcular los percentiles 98 de las nueve distribuciones en un solo paso, colocar en dos columnas de la vista de datos los valores de μ y σ para cada una de las 9 horas pedidas (tomándolos del visor con: Frequencies > Pivoting Trays > pasar Statistics a Layer > seleccionar las medias y luego las desviaciones estándar). Luego colocar el nombre de estas dos variables generadas, en la fórmula de cálculo del percentil (IDF.Normal). R: a) 6 telefonistas por hora, b) cantidad de telefonistas por hora entre las 8 de la mañana y 234 Jorge Carlos Carrá Problemas – Problemas con base de datos las 4 de la tarde. 4-6-5-6-5-6-7-7-4. Se ahorra 4 horas de telefonistas por día (por ejemplo reasignándolos en otras funciones) y puede mejorar la deficiencia que se observa en la solución a) a las 2 de la tarde y a las 3 de la tarde. 235