Estadística I Distribuciones bivariadas MARTES 16 A 19 / PROF. BURDISSO Distribuciones bivariadas de probabilidad • Hasta ahora estudiamos las posibles distribuciones de probabilidad de una única v.a. • Pero muchas de las aplicaciones que enfrentamos en economía, finanzas, etc. se vinculan con la relación de dos o más variables aleatorias. • Pensemos en las empresas de servicio de traslado de pasajeros tipo Uber, Cabify, etc. Supongamos que una de estas empresas está pensando en aumentar las tarifas. Existe incertidumbre en esta situación respecto de lo que piensan hacer sus competidores y de la demanda del público. Es decir, estaríamos frente a la situación de dos variables: los cambios en los precios de sus competidores (v.a. 𝑋) y los cambios en la demanda del servicio (v.a. 𝑌). Este es un problema relevante para estas empresas donde hay más de una v.a. y además en este caso, una dependencia entre las mismas. • Ya vimos el comportamiento de las probabilidades bivariadas (conjunta, condicional y marginal). Consideremos ahora el estudio de v.as. que pueden estar relacionadas. ESTADÍSTICA I / PROF. BURDISSO 2 Función de probabilidad conjunta • La función de probabilidad conjunta de dos variables aleatorias 𝑋 𝑒 𝑌 se expresa como 𝑃 𝑥, 𝑦 ≡ 𝑃 𝑋 = 𝑥, 𝑌 = 𝑦 y representa la probabilidad de que la v.a. 𝑋 tome el valor 𝑥 y la v.a. 𝑌 toma el valor 𝑦. • Al igual que en el caso univariado se cumple que: • 0 ≤ 𝑃 𝑥, 𝑦 ≤ 1 • σ𝑥 σ𝑦 𝑃 𝑥, 𝑦 = 1 • Ejemplo: Consideremos una familia con tres hijos. Y las siguientes variables aleatorias. Sea 𝑋 el número de mujeres en una familia con tres hijos y sea 𝑌 el número de rachas. ESTADÍSTICA I / PROF. BURDISSO 3 Función de probabilidad conjunta 𝑃 𝑀𝑢𝑗𝑒𝑟 = 0.48 𝑃 𝑉𝑎𝑟ó𝑛 = 0.52 p( x, y) P( X = x, Y = y) ESTADÍSTICA I / PROF. BURDISSO 4 Función de distribución acumulada y la probabilidad marginal • La función de distribución acumulada de una distribución bivariada es análoga a la vista para una variable. Se llama 𝐹 𝑥, 𝑦 ≡ P 𝑋 ≤ 𝑥, 𝑌 ≤ 𝑦 . • Al igual que la 𝐹 𝑥 , la 𝐹 𝑥, 𝑦 es monótona no decreciente y la imagen es el 0,1 . • Probabilidad marginal de 𝑋, 𝑃𝑥 𝑥 = 𝑃 𝑋 = 𝑥 = σ𝑦 𝑃 𝑥, 𝑦 = σ𝑦 𝑃 𝑥, 𝑌 = 𝑦 • Probabilidad marginal de 𝑌, 𝑃𝑦 𝑦 = 𝑃 𝑌 = 𝑦 = σ𝑥 𝑃 𝑥, 𝑦 = σ𝑥 𝑃 𝑋 = 𝑥, 𝑦 ESTADÍSTICA I / PROF. BURDISSO 5 Probabilidad marginal • Recordemos nuestro ejemplo de una familia con tres hijos. Y consideremos ahora las siguientes dos variables aleatorias. Sea X el número de mujeres en tres hijos y sea Y el número de rachas P( X = x) = p( x) = P( x, Y = y) y P(Y = y ) = p( y ) = P( X = x, y ) x ESTADÍSTICA I / PROF. BURDISSO 6 Probabilidad condicional • Sean 𝑋 𝑒 𝑌 dos v.as. discretas con distribución de probabilidad conjunta 𝑃(𝑥, 𝑦). La probabilidad condicional se define como: • La probabilidad condicional de 𝑋 dado 𝑌: 𝑃(𝑥, 𝑦) 𝑃𝑥/𝑦 𝑋/𝑌 = 𝑃 𝑋 = 𝑥/𝑌 = 𝑦 = 𝑃𝑦 (𝑦) • La probabilidad condicional de 𝑌 dado 𝑋: 𝑃(𝑥, 𝑦) 𝑃𝑦/𝑥 𝑌/𝑋 = 𝑃 𝑌 = 𝑦/𝑋 = 𝑥 = 𝑃𝑋 (𝑥) • ¿Cuál es la 𝑃 𝑌 = 3/𝑋 = 2 ?, ¿Cuál es la 𝑃 𝑌 = 3/𝑋 ≤ 2 ? y ¿cuál es la 𝑃(𝑋 = 3/𝑌 = 1) ? ESTADÍSTICA I / PROF. BURDISSO 7 Independencia • Sean 𝑋 𝑒 𝑌 dos v.as. discretas con distribución de probabilidad conjunta 𝑃 𝑥, 𝑦 , son independientes si y sólo si su distribución de probabilidad conjunta es el producto de las marginales para todos los valores de 𝑥 𝑒 𝑦 . 𝑃 𝑥, 𝑦 = 𝑃 𝑋 = 𝑥, 𝑌 = 𝑦 = 𝑃 𝑋 = 𝑥 𝑃 𝑌 = 𝑦 = 𝑃𝑥 𝑥 𝑃𝑦 𝑦 • Por lo tanto, se tiene que, si 𝑋 𝑒 𝑌 son independientes, entonces • 𝑃𝑥/𝑦 𝑋/𝑌 = 𝑃 𝑋 = 𝑥/𝑌 = 𝑦 𝑃𝑥 𝑥 𝑃𝑦 𝑦 𝑃(𝑥,𝑦) = = 𝑃𝑦 (𝑦) 𝑃𝑦 𝑦 = 𝑃𝑥 𝑥 • 𝑃𝑦/𝑥 𝑌/𝑋 = 𝑃 𝑌 = 𝑦/𝑋 = 𝑥 𝑃𝑥 𝑥 𝑃𝑦 𝑦 𝑃(𝑥,𝑦) = = 𝑃𝑥 (𝑥) 𝑃𝑥 𝑥 = 𝑃𝑦 𝑦 ESTADÍSTICA I / PROF. BURDISSO 8 Esperanzas bivariadas • ¿Cómo se calcula la esperanza y varianza de una función de dos variables aleatorias discretas? • Sean 𝑋 𝑒 𝑌 dos v.as. discretas que tienen una distribución de probabilidad conjunta 𝑃 𝑥, 𝑦 . La esperanza de la función 𝑔 𝑋, 𝑌 se define como: 𝐸 𝑔 𝑋, 𝑌 = σ𝑥 σ𝑦 𝑔 𝑥, 𝑦 𝑃 𝑥, 𝑦 • En particular si 𝑔 𝑋, 𝑌 = 𝑋𝑌 → 𝐸 𝑔 𝑋, 𝑌 = 𝐸 𝑋𝑌 = σ𝑥 σ𝑦 𝑥𝑦𝑃 𝑥, 𝑦 • Calculemos la 𝐸 𝑋𝑌 para nuestro ejemplo. ESTADÍSTICA I / PROF. BURDISSO 9 Covarianza y correlación • Recordemos lo visto en estadística descriptiva cuando disponíamos de una muestra y dos variables. • El método gráfico estudiado son los llamados diagramas de puntos o scatterplots, donde cada punto es un par ordenado de la muestra 𝑥, 𝑦 . • La medida cuantitativa resumen del diagrama de puntos, la llamamos covarianza muestral y coeficiente de correlación muestral. • Antes de describir la covarianza poblacional para dos variables aleatorias, repasemos algunos de los ejemplos vistos en estadística descriptiva para recordar la intuición detrás de esta medida llamada covarianza. ESTADÍSTICA I / PROF. BURDISSO 10 Estadística descriptiva: dos variables ESTADÍSTICA I / PROF. BURDISSO 11 Medida de asociación entre dos variables ESTADÍSTICA I / PROF. BURDISSO 12 Estadística descriptiva - Covarianza muestral • Suponga que se dispone de una muestra de tamaño para la que se observan dos variables, 𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 𝑒 𝑦1 , 𝑦2 , 𝑦3 , … , 𝑦𝑛 • La covarianza de la muestra o covarianza muestral se define como σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 𝑆𝑥𝑦 = 𝑛−1 • Al igual que la varianza, la interpretación de la covarianza tiene muchas limitaciones (inconvenientes con las unidades de medida en las que están expresadas las variables). • En excel =covarianza.m(lista de números var1, lista de números var2) ESTADÍSTICA I / PROF. BURDISSO 13 Covarianza muestral. Intuición ESTADÍSTICA I / PROF. BURDISSO 14 Covarianza muestral. Intuición ESTADÍSTICA I / PROF. BURDISSO 15 Covarianza muestral. Tres tipos de relaciones https://www.lanacion.com.ar/politica/el-vertigo-de-dar-un-salto-al-vacio-nid22082023/ PASO 2023. El voto y su relación con la edad del votante. Betta LAB ESTADÍSTICA I / PROF. BURDISSO 16 Covarianza muestral • La covarianza puede clasificar tres tipos de relaciones entre dos variables. • Relaciones con tendencia positiva • Relaciones con tendencia negativa • No hay relación porque no hay tendencia covariancia muestral positiva covariancia muestral negativa covarianza muestral cercana a 0 • Sin embargo, nada se puede decir de la intensidad de esta relación porque el problema de la covarianza es que depende de las unidades de medida de las variables de interés. • Recordemos que la covarianza es un cálculo intermedio de algo bastante más informativo, llamado coeficiente de correlación muestral. ESTADÍSTICA I / PROF. BURDISSO 17 Coeficiente de correlación muestral • El coeficiente de correlación muestral es la solución al problema que enfrenta la covarianza, ya que lo independiza de las unidades de las variables. • El coeficiente de correlación muestral está libre de unidades. 𝑠𝑥𝑦 𝑟𝑥𝑦 = = 𝑠𝑥 𝑠𝑦 σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 2 𝑛 1 𝑥𝑖 − 𝑥ҧ = 𝑛 2 𝑛 − 1 𝑠𝑥 σ𝑖=1 𝑦𝑖 − 𝑦ത 𝑖=1 𝑦𝑖 − 𝑦ത 𝑠𝑦 • En excel =coef.de.correl(lista de números var1, lista de números var2) ESTADÍSTICA I / PROF. BURDISSO 18 Coeficiente de correlación muestral 𝑠𝑥𝑦 𝑟𝑥𝑦 = = 𝑠𝑥 𝑠𝑦 𝑛 𝑛 σ𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 1 = 𝑛 𝑛 2 2 𝑛−1 σ𝑖=1 𝑥𝑖 − 𝑥ҧ σ𝑖=1 𝑦𝑖 − 𝑦ത 𝑖=1 A 𝑥𝑖 − 𝑥ҧ 𝑠𝑥 𝑦𝑖 − 𝑦ത 𝑠𝑦 B • ¿Cuánto vale el coeficiente de correlación muestral en el gráfico A? • ¿Cuánto vale el coeficiente de correlación muestral en el gráfico B? ESTADÍSTICA I / PROF. BURDISSO 19 Covarianza poblacional de dos variables aleatorias • Sean 𝑋 𝑒 𝑌 dos v.as. Sean E 𝑋 = 𝜇𝑋 𝑦 𝐸 𝑌 = 𝜇𝑌 . Se define la covarianza de 𝑋 𝑐𝑜𝑛 𝑌 y se anota como 𝑐𝑜𝑣 𝑋, 𝑌 = 𝐸 𝑋 − 𝜇𝑋 𝑌 − 𝜇𝑌 • 𝑐𝑜𝑣 𝑋, 𝑌 = 𝑐𝑜𝑣 𝑌, 𝑋 • Puede probarse que 𝑐𝑜𝑣 𝑋, 𝑌 = 𝐸 𝑋𝑌 − 𝐸 𝑋 𝐸 𝑌 . Veámoslo. • Notar que la 𝑐𝑜𝑣 𝑋, 𝑋 = 𝑣𝑎𝑟(𝑋) • ¿Qué ocurre con la 𝑐𝑜𝑣 𝑋, 𝑌 si 𝑋 𝑒 𝑌 son independientes? ESTADÍSTICA I / PROF. BURDISSO 20 Covarianza nula no implica independencia de 𝑋 𝑒 𝑌 • Por lo tanto, si 𝑋 𝑒 𝑌 son independientes entonces la 𝑐𝑜𝑣 𝑋, 𝑌 = 0 • Si la 𝑐𝑜𝑣 𝑋, 𝑌 = 0 𝑛𝑜 𝑛𝑒𝑐𝑒𝑠𝑎𝑟𝑖𝑎𝑚𝑒𝑛𝑡𝑒 𝑋 𝑒 𝑌 𝑠𝑜𝑛 𝑣. 𝑎𝑠. 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠. • Veamos un contraejemplo. Hallemos la covarianza para la distribución de probabilidad bivariada de la siguiente tabla. ESTADÍSTICA I / PROF. BURDISSO 21 Varianza de una combinación lineal de v.as. • De especial interés es la 𝑔(𝑋,𝑌)=𝑎𝑋+𝑏𝑌+c donde 𝑎, 𝑏 𝑦 𝑐 son constantes y 𝑎≠0,𝑏≠0 entonces la • 𝐸 𝑔 𝑋, 𝑌 = 𝐸 𝑎𝑋 + 𝑏𝑌 + 𝑐 = 𝑎𝐸 𝑋 + 𝑏𝐸 𝑌 + 𝑐 • Probémoslo • Y la Var(𝑔(𝑋, 𝑌)) = 𝑉𝑎𝑟(𝑎𝑋 + 𝑏𝑌 + 𝑐) = 𝑎2 𝑉𝑎𝑟(𝑋) + 𝑏2 𝑉𝑎𝑟(𝑌) + 2𝑎𝑏𝐶𝑜𝑣(𝑋, 𝑌) • Probémoslo • Considere 𝑔(𝑋,𝑌)=𝑋+𝑌. Determine la expresión de la Var 𝑔 𝑋, 𝑌 • Considere g(𝑋,𝑌)=𝑋-𝑌. Determine la expresión de la Var 𝑔 𝑋, 𝑌 • Sean 𝑋 𝑒 𝑌 v.as. Independientes. ¿Cuál es la expresión de la varianza para 𝑔(𝑋,𝑌)=𝑋+𝑌? ¿Y si 𝑔(𝑋,𝑌)=𝑋-𝑌? ESTADÍSTICA I / PROF. BURDISSO 22 Propiedades de la covarianza • Sean 𝑎, 𝑏 constantes cualesquiera, entonces • 𝐶𝑜𝑣 𝑋 + 𝑎, 𝑌 = 𝑐𝑜𝑣(𝑋, 𝑌) • 𝐶𝑜𝑣 𝑋 + 𝑎, 𝑌 + 𝑏 = 𝑐𝑜𝑣(𝑋, 𝑌) • 𝐶𝑜𝑣 𝑎𝑋, 𝑌 = 𝑎𝑐𝑜𝑣(𝑋, 𝑌) • 𝐶𝑜𝑣 𝑎𝑋, 𝑏𝑌 = 𝑎𝑏𝑐𝑜𝑣(𝑋, 𝑌) ESTADÍSTICA I / PROF. BURDISSO 23 Covarianza y correlación • La covarianza es una medida de la variabilidad conjunta o grado de asociación lineal que existe entre dos v.as. • La covarianza sólo evalúa la posibilidad de que exista una relación lineal entre las v. as. • Limitación de la covarianza: no está libre de unidades, y cambios en la unidad de medida en una o ambas v.as. afectan el valor de la covarianza. La magnitud de la covarianza carece de valor. • Sólo tiene valor el signo de la covarianza, que indica el sentido de la asociación. Una covarianza positiva (negativa) indica una relación positiva (negativa) entre las variables. • La covarianza nada dice sobre la intensidad de esta relación. Por esa razón, la covarianza por sí sola no tiene especial interés. ESTADÍSTICA I / PROF. BURDISSO 24 Coeficiente de Correlación lineal • El coeficiente de correlación lineal es la solución a las limitaciones de la covarianza. • El coeficiente de correlación lineal es una medida libre de unidades (adimensional). • El coeficiente de correlación lineal indica el signo y la intensidad de la relación entre 𝑋 𝑒 𝑌. • Sean 𝑋 𝑒 𝑌 v. as. con distribución conjunta de probabilidades. El coeficiente de correlación entre 𝑋 𝑒 𝑌 o simplemente la correlación entre 𝑋 𝑒 𝑌 está dada por 𝑐𝑜𝑣 𝑋, 𝑌 𝜌𝑋,𝑌 = 𝑐𝑜𝑟𝑟 𝑋, 𝑌 = 𝜎𝑥 𝜎𝑌 • donde 𝜎𝑥 y 𝜎𝑦 son los desvíos estándar de 𝑋 𝑒 𝑌 respectivamente. ESTADÍSTICA I / PROF. BURDISSO 25 Correlación entre 𝑋 𝑒 𝑌 • La correlación es una medida estandarizada. • −1 ≤ 𝜌𝑋𝑌 ≤ 1 • 𝜌𝑋𝑌 > 0 indica una dependencia lineal positiva entre 𝑋 𝑒 𝑌. Valores grandes (pequeños) de 𝑋 se encuentran asociados con valores grandes (pequeños) de 𝑌. Si 𝜌𝑋𝑌 = 1 entonces la asociación lineal positiva es perfecta. • 𝜌𝑋𝑌 < 0 indica una dependencia lineal negativa entre 𝑋 𝑒 𝑌. Valores grandes (pequeños) de 𝑋 se encuentran asociados con valores pequeños (grandes) de 𝑌. Si 𝜌𝑋𝑌 = −1 entonces la asociación lineal negativa es perfecta. • Si 𝜌𝑋𝑌 = 0 entonces no existe relación lineal entre las v.as. 𝑋 𝑒 𝑌 • 𝜌𝑋𝑌 = 0 sí y sólo sí 𝑐𝑜𝑣 𝑋, 𝑌 = 0 • Si v.as. 𝑋 𝑒 𝑌 son independientes entonces 𝜌𝑋𝑌 = 0 • 𝜌𝑋𝑌 = 0 no necesariamente las v.as. 𝑋 𝑒 𝑌 son independientes. ESTADÍSTICA I / PROF. BURDISSO 26 Diferentes grados de asociación lineal ESTADÍSTICA I / PROF. BURDISSO 27 Covarianza y correlación • Ejercicio: hallar el coeficiente de correlación lineal para el ejemplo de la familia con tres infantes. • Notar que la 𝑉𝑎𝑟(𝑎𝑋 + 𝑏𝑌 + 𝑐) = 𝑎2 𝑉𝑎𝑟(𝑋) + 𝑏2 𝑉𝑎𝑟(𝑌) + 2𝑎𝑏𝐶𝑜𝑣(𝑋, 𝑌) puede reescribirse en términos del coeficiente de correlación. 𝑉𝑎𝑟(𝑎𝑋 + 𝑏𝑌 + 𝑐) = 𝑎2 𝑉𝑎𝑟(𝑋) + 𝑏 2 𝑉𝑎𝑟(𝑌) + 2𝑎𝑏𝜌𝑋𝑌 𝜎𝑥 𝜎𝑌 ESTADÍSTICA I / PROF. BURDISSO 28 Ejemplo • Un constructor no conoce con certeza los gastos de material y mano de obra de cierto proyecto, pero cree que los gastos de materiales siguen una v.a. con media $200.000 y desvío estándar $20.000. El costo de la mano de obra asciende a $6.000 diarios y el número de días para realizar el proyecto puede representarse mediante una v.a. con media 20 y desvío 3 días. • Suponiendo que los gastos de material y mano de obra son independientes, ¿Cuál es la media y desvío del gasto total? • Si el coeficiente de correlación entre los gastos de material y mano de obra es 0.4, ¿Cuál es la media y desvío del gasto total? ESTADÍSTICA I / PROF. BURDISSO 29 Aplicación: La teoría de portafolios • La Teoría de portafolios/carteras tratan de resolver el problema de elegir las mejores combinaciones de activos financieros dentro del universo inversor. • La cartera óptima consiste en la integración de activos de bajo riesgo y activos riesgosos mediante la diversificación de la cartera, con el objetivo de reducir la volatilidad. • Sea la v.a. 𝑋 el precio de un activo A y la v.a. 𝑌 el precio de un activo B. El valor de mercado de la cartera 𝑊 conformada por la combinación lineal de los activos A y B está dado por 𝑊 = 𝑎𝑋 + 𝑏𝑌 , donde a es la cantidad de acciones del activo A y b la cantidad de acciones del activo B. • El rendimiento esperado de W es, 𝐸 𝑊 = 𝐸 𝑎𝑋 + 𝑏𝑌 = 𝑎𝐸 𝑋 + 𝑏𝐸 𝑌 • La varianza de W es 𝑉𝑎𝑟 𝑊 = 𝑉𝑎𝑟(𝑎𝑋 + 𝑏𝑌) = 𝑎2 𝑉𝑎𝑟(𝑋) + 𝑏2𝑉𝑎𝑟(𝑌) + 2𝑎𝑏𝜌𝑋𝑌 𝜎𝑥 𝜎𝑌 ESTADÍSTICA I / PROF. BURDISSO 30 Ejercicio • Usted es analista de inversión y se le pide que analice una cartera de inversión recién adquirida, para determinar el valor medio y la variabilidad de su retorno. La cartera consta de dos activos: acciones de Pampa Energía y acciones de Mirgor. El análisis de la historia pasada indica que las acciones de Pampa Energía tienen un rendimiento anual promedio del 20% y un desvío del 5%. Un análisis similar para Mirgor indica que el retorno anual tiene una media de 15% y un desvío de 3%. Los mejores datos de los que se dispone indican que los retornos de las acciones tienen una correlación de +0,5. Se invierten U$5.000 en Pampa Energía y U$10.000 en Mirgor. • a) Calcule el retorno anual esperado de la cartera y su desvío. Exprese las unidades de ambas medidas. • b) Suponga que la correlación entre los retornos de las acciones fuera en realidad de -0,5. ¿Cuáles son ahora la media y el desvío del retorno de la cartera? ESTADÍSTICA I / PROF. BURDISSO 31 Correlación perfecta ESTADÍSTICA I / PROF. BURDISSO 32 Correlación muy fuerte ESTADÍSTICA I / PROF. BURDISSO 33 Correlación fuerte ESTADÍSTICA I / PROF. BURDISSO 34 Correlación débil ESTADÍSTICA I / PROF. BURDISSO 35 Correlación muy débil ESTADÍSTICA I / PROF. BURDISSO 36 Correlación prácticamente nula ESTADÍSTICA I / PROF. BURDISSO 37 Correlación nula ESTADÍSTICA I / PROF. BURDISSO 38 Distribución de probabilidad multinomial • Vamos a estudiar una v.a.discreta de mayor dimensión, que puede ser pensada como una generalización de la binomial. • Consideremos un experimento 𝜀, el espacio muestral asociado 𝑆 y sean 𝐴1 , 𝐴2 , … 𝐴𝑘 eventos mutuamente excluyentes del espacio muestral (=𝑖𝑘ڂ1 𝐴𝑖 = 𝑆 y 𝐴𝑖 ∅ = 𝑗𝐴 ځpara todo 𝑖 ≠ 𝑗), de modo que cuando realizo el experimento 𝜀 sólo uno de los sucesos 𝐴𝑖 ocurre. • Realizamos n repeticiones independientes de 𝜀. • Sea P 𝐴𝑖 = 𝑝𝑖 la probabilidad de que 𝐴𝑖 ocurra permanece constante en cada ensayo. Se tiene entonces un vector 𝑝 = 𝑝1 , 𝑝2 , … , 𝑝𝑘 • La σ𝑘𝑖=1 𝑝𝑖 = 1 • Sea 𝑋𝑖 : "# 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝐴𝑖 𝑜𝑐𝑢𝑟𝑟𝑒 𝑒𝑛 𝑛 𝑒𝑛𝑠𝑎𝑦𝑜𝑠“, 𝑋 = 𝑋1 , 𝑋2 , … , 𝑋𝑘 ESTADÍSTICA I / PROF. BURDISSO 39 Distribución de probabilidad multinomial • De acuerdo con las últimas PASO 2023 a nivel nacional, un 30% votó por la Libertad Avanza (LLA), un 29% por Juntos por el Cambio (JxC), un 28% por Unión por la Patria (UP) y un 13% por los partidos restantes (porcentajes aproximados). ¿Cuál es la probabilidad de que, en una muestra al azar de 20 votantes, 8 hayan votado por la LLA, 5 por JxC, y 5 por UP? ESTADÍSTICA I / PROF. BURDISSO 40 Distribución de probabilidad multinomial • Supuestos de la multinomial • Sea 𝐴1 , 𝐴2 , … 𝐴𝑘 eventos del espacio muestral tal que=𝑖𝑘ڂ1 𝐴𝑖 = 𝑆 y 𝐴𝑖 ∅ = 𝑗𝐴 ځ para todo 𝑖 ≠ 𝑗. • Se tienen n ensayos independientes. • Cada ensayo tiene k resultados posibles. • Sea P 𝐴𝑖 = 𝑝𝑖 la probabilidad de que 𝐴𝑖 ocurra es la misma en cada ensayo. • La σ𝑘𝑖=1 𝑝𝑖 = 1 • Sea 𝑋𝑖 : "# 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝐴𝑖 𝑜𝑐𝑢𝑟𝑟𝑒 𝑒𝑛 𝑛 𝑒𝑛𝑠𝑎𝑦𝑜𝑠“, 𝑋 = 𝑋1 , 𝑋2 , … , 𝑋𝑘 𝑛! 𝑛 𝑛 𝑛 = 𝑝1 1 𝑝2 2 … 𝑝𝑘 𝑘 𝑛1 !𝑛2 !…𝑛𝑘 ! • Entonces 𝑃 𝑋1 = 𝑛1, 𝑋2 = 𝑛2, … , 𝑋𝑘 = 𝑛𝑘 donde 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = 𝑛 ESTADÍSTICA I / PROF. BURDISSO 41 Distribución de probabilidad multinomial • Suponga que se carga un dado de forma tal que los números 1,2,3,4,5,6 tienen distintas probabilidades de ocurrir cuando se lanza el dado. Sea 𝑝1 = 0.11, 𝑝2 = 0.30, 𝑝3 = 0.22, 𝑝4 = 0.05, 𝑝5 = 0.25, 𝑝6 = 0.07. Se lanza el dado 40 veces. Sea 𝑋1 = # 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑒𝑛 𝑙𝑜𝑠 𝑞𝑢𝑒 𝑎𝑝𝑎𝑟𝑒𝑐𝑒 𝑢𝑛 𝑛ú𝑚𝑒𝑟𝑜 𝑝𝑎𝑟 𝑦 𝑋2 = # 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝑎𝑝𝑎𝑟𝑒𝑐𝑒 𝑒𝑙 1 𝑜 𝑒𝑙 3 • ¿Cuál es la probabilidad de obtener 20 números pares y que 𝑋2 sea igual a 15? ESTADÍSTICA I / PROF. BURDISSO 42 Relación entre la distribución multinomial y la binomial • Recordemos que en el caso de la multinomial cada ensayo tiene k resultados posibles • ¿Qué ocurre si k=2? • La multinomial se reduce a la binomial. La v.a. 𝑋 = (𝑋1 , 𝑋2 ) tiene una distribución multinomial con parámetros 𝑛 𝑦 𝑝 = (𝑝1 , 𝑝2 ) • Entonces 𝑋2 = 𝑛 − 𝑋1 y 𝑝2=1- 𝑝1 • Por lo tanto, el vector 𝑋 se reduce a la v.a. 𝑋1 , que depende de 𝑛 y 𝑝1 • Y como 𝑋1 : "# 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝐴1 𝑜𝑐𝑢𝑟𝑟𝑒 𝑒𝑛 𝑛 𝑒𝑛𝑠𝑎𝑦𝑜𝑠“, entonces 𝑋1 ~𝐵 𝑛, 𝑝1 • En general, para cualquier valor de 𝑘 𝑘 = 2,3, … se tiene que para cada 𝑋𝑖 : "# 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝐴𝑖 𝑜𝑐𝑢𝑟𝑟𝑒 𝑒𝑛 𝑛 𝑒𝑛𝑠𝑎𝑦𝑜𝑠“ su distribución marginal es 𝑋𝑖 ~𝐵 𝑛, 𝑝𝑖 ESTADÍSTICA I / PROF. BURDISSO 43 Relación entre la distribución multinomial y la binomial • 𝑋 = 𝑋1 , 𝑋2 , … , 𝑋𝑘 tiene distribución multinomial con parámetro 𝑝 = 𝑝1 , 𝑝2, … , 𝑝𝑘 • Cada 𝑋𝑖 ~𝐵 𝑛, 𝑝𝑖 . Entonces 𝐸(𝑋𝑖 ) = 𝑛𝑝𝑖 y 𝑉𝑎𝑟(𝑋𝑖 ) = 𝑛𝑝𝑖 (1 − 𝑝𝑖 ) • Tener presente que las 𝑋𝑖 ~𝐵 𝑛, 𝑝𝑖 no son independientes entre sí. ESTADÍSTICA I / PROF. BURDISSO 44