Subido por Raul Fernandez

Distribuciones bivariadas 2024

Anuncio
Estadística I
Distribuciones bivariadas
MARTES 16 A 19 / PROF. BURDISSO
Distribuciones bivariadas de probabilidad
• Hasta ahora estudiamos las posibles distribuciones de probabilidad de una única v.a.
• Pero muchas de las aplicaciones que enfrentamos en economía, finanzas, etc. se
vinculan con la relación de dos o más variables aleatorias.
• Pensemos en las empresas de servicio de traslado de pasajeros tipo Uber, Cabify,
etc. Supongamos que una de estas empresas está pensando en aumentar las
tarifas. Existe incertidumbre en esta situación respecto de lo que piensan hacer sus
competidores y de la demanda del público. Es decir, estaríamos frente a la situación
de dos variables: los cambios en los precios de sus competidores (v.a. 𝑋) y los
cambios en la demanda del servicio (v.a. 𝑌). Este es un problema relevante para
estas empresas donde hay más de una v.a. y además en este caso, una dependencia
entre las mismas.
• Ya vimos el comportamiento de las probabilidades bivariadas (conjunta, condicional y
marginal). Consideremos ahora el estudio de v.as. que pueden estar relacionadas.
ESTADÍSTICA I / PROF. BURDISSO
2
Función de probabilidad conjunta
• La función de probabilidad conjunta de dos variables aleatorias 𝑋 𝑒 𝑌 se expresa
como 𝑃 𝑥, 𝑦 ≡ 𝑃 𝑋 = 𝑥, 𝑌 = 𝑦 y representa la probabilidad de que la v.a. 𝑋 tome el
valor 𝑥 y la v.a. 𝑌 toma el valor 𝑦.
• Al igual que en el caso univariado se cumple que:
• 0 ≤ 𝑃 𝑥, 𝑦 ≤ 1
• σ𝑥 σ𝑦 𝑃 𝑥, 𝑦 = 1
• Ejemplo: Consideremos una familia con tres hijos. Y las siguientes variables
aleatorias. Sea 𝑋 el número de mujeres en una familia con tres hijos y sea 𝑌 el
número de rachas.
ESTADÍSTICA I / PROF. BURDISSO
3
Función de probabilidad conjunta
𝑃 𝑀𝑢𝑗𝑒𝑟 = 0.48
𝑃 𝑉𝑎𝑟ó𝑛 = 0.52
p( x, y)  P( X = x, Y = y)
ESTADÍSTICA I / PROF. BURDISSO
4
Función de distribución acumulada y la probabilidad marginal
• La función de distribución acumulada de una distribución bivariada es análoga a la
vista para una variable. Se llama 𝐹 𝑥, 𝑦 ≡ P 𝑋 ≤ 𝑥, 𝑌 ≤ 𝑦 .
• Al igual que la 𝐹 𝑥 , la 𝐹 𝑥, 𝑦 es monótona no decreciente y la imagen es el 0,1 .
• Probabilidad marginal de 𝑋, 𝑃𝑥 𝑥 = 𝑃 𝑋 = 𝑥 = σ𝑦 𝑃 𝑥, 𝑦 = σ𝑦 𝑃 𝑥, 𝑌 = 𝑦
• Probabilidad marginal de 𝑌, 𝑃𝑦 𝑦 = 𝑃 𝑌 = 𝑦 = σ𝑥 𝑃 𝑥, 𝑦 = σ𝑥 𝑃 𝑋 = 𝑥, 𝑦
ESTADÍSTICA I / PROF. BURDISSO
5
Probabilidad marginal
• Recordemos nuestro ejemplo de una familia con tres hijos. Y consideremos ahora las
siguientes dos variables aleatorias. Sea X el número de mujeres en tres hijos y sea Y
el número de rachas
P( X = x) = p( x) =  P( x, Y = y)
y
P(Y = y ) = p( y ) =  P( X = x, y )
x
ESTADÍSTICA I / PROF. BURDISSO
6
Probabilidad condicional
• Sean 𝑋 𝑒 𝑌 dos v.as. discretas con distribución de probabilidad conjunta 𝑃(𝑥, 𝑦). La
probabilidad condicional se define como:
• La probabilidad condicional de 𝑋 dado 𝑌:
𝑃(𝑥, 𝑦)
𝑃𝑥/𝑦 𝑋/𝑌 = 𝑃 𝑋 = 𝑥/𝑌 = 𝑦 =
𝑃𝑦 (𝑦)
• La probabilidad condicional de 𝑌 dado 𝑋:
𝑃(𝑥, 𝑦)
𝑃𝑦/𝑥 𝑌/𝑋 = 𝑃 𝑌 = 𝑦/𝑋 = 𝑥 =
𝑃𝑋 (𝑥)
• ¿Cuál es la 𝑃 𝑌 = 3/𝑋 = 2 ?, ¿Cuál es la 𝑃 𝑌 = 3/𝑋 ≤ 2 ? y ¿cuál es la 𝑃(𝑋 =
3/𝑌 = 1) ?
ESTADÍSTICA I / PROF. BURDISSO
7
Independencia
• Sean 𝑋 𝑒 𝑌 dos v.as. discretas con distribución de probabilidad conjunta 𝑃 𝑥, 𝑦 ,
son independientes si y sólo si su distribución de probabilidad conjunta es el
producto de las marginales para todos los valores de 𝑥 𝑒 𝑦 .
𝑃 𝑥, 𝑦 = 𝑃 𝑋 = 𝑥, 𝑌 = 𝑦 = 𝑃 𝑋 = 𝑥 𝑃 𝑌 = 𝑦 = 𝑃𝑥 𝑥 𝑃𝑦 𝑦
• Por lo tanto, se tiene que, si 𝑋 𝑒 𝑌 son independientes, entonces
• 𝑃𝑥/𝑦 𝑋/𝑌 = 𝑃 𝑋 = 𝑥/𝑌 = 𝑦
𝑃𝑥 𝑥 𝑃𝑦 𝑦
𝑃(𝑥,𝑦)
=
=
𝑃𝑦 (𝑦)
𝑃𝑦 𝑦
= 𝑃𝑥 𝑥
• 𝑃𝑦/𝑥 𝑌/𝑋 = 𝑃 𝑌 = 𝑦/𝑋 = 𝑥
𝑃𝑥 𝑥 𝑃𝑦 𝑦
𝑃(𝑥,𝑦)
=
=
𝑃𝑥 (𝑥)
𝑃𝑥 𝑥
= 𝑃𝑦 𝑦
ESTADÍSTICA I / PROF. BURDISSO
8
Esperanzas bivariadas
• ¿Cómo se calcula la esperanza y varianza de una función de dos variables aleatorias
discretas?
• Sean 𝑋 𝑒 𝑌 dos v.as. discretas que tienen una distribución de probabilidad conjunta
𝑃 𝑥, 𝑦 . La esperanza de la función 𝑔 𝑋, 𝑌 se define como:
𝐸 𝑔 𝑋, 𝑌
= σ𝑥 σ𝑦 𝑔 𝑥, 𝑦 𝑃 𝑥, 𝑦
• En particular si 𝑔 𝑋, 𝑌 = 𝑋𝑌 → 𝐸 𝑔 𝑋, 𝑌
= 𝐸 𝑋𝑌 = σ𝑥 σ𝑦 𝑥𝑦𝑃 𝑥, 𝑦
• Calculemos la 𝐸 𝑋𝑌 para nuestro ejemplo.
ESTADÍSTICA I / PROF. BURDISSO
9
Covarianza y correlación
• Recordemos lo visto en estadística descriptiva cuando disponíamos de una muestra y
dos variables.
• El método gráfico estudiado son los llamados diagramas de puntos o scatterplots,
donde cada punto es un par ordenado de la muestra 𝑥, 𝑦 .
• La medida cuantitativa resumen del diagrama de puntos, la llamamos covarianza
muestral y coeficiente de correlación muestral.
• Antes de describir la covarianza poblacional para dos variables aleatorias, repasemos
algunos de los ejemplos vistos en estadística descriptiva para recordar la intuición
detrás de esta medida llamada covarianza.
ESTADÍSTICA I / PROF. BURDISSO
10
Estadística descriptiva: dos variables
ESTADÍSTICA I / PROF. BURDISSO
11
Medida de asociación entre dos variables
ESTADÍSTICA I / PROF. BURDISSO
12
Estadística descriptiva - Covarianza muestral
• Suponga que se dispone de una muestra de tamaño para la que se observan dos
variables, 𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 𝑒 𝑦1 , 𝑦2 , 𝑦3 , … , 𝑦𝑛
• La covarianza de la muestra o covarianza muestral se define como
σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
𝑆𝑥𝑦 =
𝑛−1
• Al igual que la varianza, la interpretación de la covarianza tiene muchas limitaciones
(inconvenientes con las unidades de medida en las que están expresadas las
variables).
• En excel =covarianza.m(lista de números var1, lista de números var2)
ESTADÍSTICA I / PROF. BURDISSO
13
Covarianza muestral. Intuición
ESTADÍSTICA I / PROF. BURDISSO
14
Covarianza muestral. Intuición
ESTADÍSTICA I / PROF. BURDISSO
15
Covarianza muestral. Tres tipos de relaciones
https://www.lanacion.com.ar/politica/el-vertigo-de-dar-un-salto-al-vacio-nid22082023/
PASO 2023. El voto y su relación con la edad del votante. Betta LAB
ESTADÍSTICA I / PROF. BURDISSO
16
Covarianza muestral
• La covarianza puede clasificar tres tipos de relaciones entre dos variables.
• Relaciones con tendencia positiva
• Relaciones con tendencia negativa
• No hay relación porque no hay tendencia
covariancia muestral positiva
covariancia muestral negativa
covarianza muestral cercana a 0
• Sin embargo, nada se puede decir de la intensidad de esta relación porque el
problema de la covarianza es que depende de las unidades de medida de las
variables de interés.
• Recordemos que la covarianza es un cálculo intermedio de algo bastante más
informativo, llamado coeficiente de correlación muestral.
ESTADÍSTICA I / PROF. BURDISSO
17
Coeficiente de correlación muestral
• El coeficiente de correlación muestral es la solución al problema que enfrenta la
covarianza, ya que lo independiza de las unidades de las variables.
• El coeficiente de correlación muestral está libre de unidades.
𝑠𝑥𝑦
𝑟𝑥𝑦 =
=
𝑠𝑥 𝑠𝑦
σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 2
𝑛
1
𝑥𝑖 − 𝑥ҧ
=
෍
𝑛
2
𝑛
−
1
𝑠𝑥
σ𝑖=1 𝑦𝑖 − 𝑦ത
𝑖=1
𝑦𝑖 − 𝑦ത
𝑠𝑦
• En excel =coef.de.correl(lista de números var1, lista de números var2)
ESTADÍSTICA I / PROF. BURDISSO
18
Coeficiente de correlación muestral
𝑠𝑥𝑦
𝑟𝑥𝑦 =
=
𝑠𝑥 𝑠𝑦
𝑛
𝑛
σ𝑖=1 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
1
=
෍
𝑛
𝑛
2
2
𝑛−1
σ𝑖=1 𝑥𝑖 − 𝑥ҧ
σ𝑖=1 𝑦𝑖 − 𝑦ത
𝑖=1
A
𝑥𝑖 − 𝑥ҧ
𝑠𝑥
𝑦𝑖 − 𝑦ത
𝑠𝑦
B
• ¿Cuánto vale el coeficiente de correlación muestral en el gráfico A?
• ¿Cuánto vale el coeficiente de correlación muestral en el gráfico B?
ESTADÍSTICA I / PROF. BURDISSO
19
Covarianza poblacional de dos variables aleatorias
• Sean 𝑋 𝑒 𝑌 dos v.as. Sean E 𝑋 = 𝜇𝑋 𝑦 𝐸 𝑌 = 𝜇𝑌 . Se define la covarianza de
𝑋 𝑐𝑜𝑛 𝑌 y se anota como
𝑐𝑜𝑣 𝑋, 𝑌 = 𝐸 𝑋 − 𝜇𝑋 𝑌 − 𝜇𝑌
• 𝑐𝑜𝑣 𝑋, 𝑌 = 𝑐𝑜𝑣 𝑌, 𝑋
• Puede probarse que 𝑐𝑜𝑣 𝑋, 𝑌 = 𝐸 𝑋𝑌 − 𝐸 𝑋 𝐸 𝑌 . Veámoslo.
• Notar que la 𝑐𝑜𝑣 𝑋, 𝑋 = 𝑣𝑎𝑟(𝑋)
• ¿Qué ocurre con la 𝑐𝑜𝑣 𝑋, 𝑌 si 𝑋 𝑒 𝑌 son independientes?
ESTADÍSTICA I / PROF. BURDISSO
20
Covarianza nula no implica independencia de 𝑋 𝑒 𝑌
• Por lo tanto, si 𝑋 𝑒 𝑌 son independientes entonces la 𝑐𝑜𝑣 𝑋, 𝑌 = 0
• Si la 𝑐𝑜𝑣 𝑋, 𝑌 = 0 𝑛𝑜 𝑛𝑒𝑐𝑒𝑠𝑎𝑟𝑖𝑎𝑚𝑒𝑛𝑡𝑒 𝑋 𝑒 𝑌 𝑠𝑜𝑛 𝑣. 𝑎𝑠. 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠.
• Veamos un contraejemplo. Hallemos la covarianza para la distribución de
probabilidad bivariada de la siguiente tabla.
ESTADÍSTICA I / PROF. BURDISSO
21
Varianza de una combinación lineal de v.as.
• De especial interés es la 𝑔(𝑋,𝑌)=𝑎𝑋+𝑏𝑌+c donde 𝑎, 𝑏 𝑦 𝑐 son constantes y 𝑎≠0,𝑏≠0
entonces la
• 𝐸 𝑔 𝑋, 𝑌 = 𝐸 𝑎𝑋 + 𝑏𝑌 + 𝑐 = 𝑎𝐸 𝑋 + 𝑏𝐸 𝑌 + 𝑐
• Probémoslo
• Y la Var(𝑔(𝑋, 𝑌)) = 𝑉𝑎𝑟(𝑎𝑋 + 𝑏𝑌 + 𝑐) = 𝑎2 𝑉𝑎𝑟(𝑋) + 𝑏2 𝑉𝑎𝑟(𝑌) + 2𝑎𝑏𝐶𝑜𝑣(𝑋, 𝑌)
• Probémoslo
• Considere 𝑔(𝑋,𝑌)=𝑋+𝑌. Determine la expresión de la Var 𝑔 𝑋, 𝑌
• Considere g(𝑋,𝑌)=𝑋-𝑌. Determine la expresión de la Var 𝑔 𝑋, 𝑌
• Sean 𝑋 𝑒 𝑌 v.as. Independientes. ¿Cuál es la expresión de la varianza para
𝑔(𝑋,𝑌)=𝑋+𝑌? ¿Y si 𝑔(𝑋,𝑌)=𝑋-𝑌?
ESTADÍSTICA I / PROF. BURDISSO
22
Propiedades de la covarianza
• Sean 𝑎, 𝑏 constantes cualesquiera, entonces
• 𝐶𝑜𝑣 𝑋 + 𝑎, 𝑌 = 𝑐𝑜𝑣(𝑋, 𝑌)
• 𝐶𝑜𝑣 𝑋 + 𝑎, 𝑌 + 𝑏 = 𝑐𝑜𝑣(𝑋, 𝑌)
• 𝐶𝑜𝑣 𝑎𝑋, 𝑌 = 𝑎𝑐𝑜𝑣(𝑋, 𝑌)
• 𝐶𝑜𝑣 𝑎𝑋, 𝑏𝑌 = 𝑎𝑏𝑐𝑜𝑣(𝑋, 𝑌)
ESTADÍSTICA I / PROF. BURDISSO
23
Covarianza y correlación
• La covarianza es una medida de la variabilidad conjunta o grado de asociación lineal
que existe entre dos v.as.
• La covarianza sólo evalúa la posibilidad de que exista una relación lineal entre las v.
as.
• Limitación de la covarianza: no está libre de unidades, y cambios en la unidad de
medida en una o ambas v.as. afectan el valor de la covarianza. La magnitud de la
covarianza carece de valor.
• Sólo tiene valor el signo de la covarianza, que indica el sentido de la asociación. Una
covarianza positiva (negativa) indica una relación positiva (negativa) entre las
variables.
• La covarianza nada dice sobre la intensidad de esta relación. Por esa razón, la
covarianza por sí sola no tiene especial interés.
ESTADÍSTICA I / PROF. BURDISSO
24
Coeficiente de Correlación lineal
• El coeficiente de correlación lineal es la solución a las limitaciones de la covarianza.
• El coeficiente de correlación lineal es una medida libre de unidades (adimensional).
• El coeficiente de correlación lineal indica el signo y la intensidad de la relación entre
𝑋 𝑒 𝑌.
• Sean 𝑋 𝑒 𝑌 v. as. con distribución conjunta de probabilidades. El coeficiente de
correlación entre 𝑋 𝑒 𝑌 o simplemente la correlación entre 𝑋 𝑒 𝑌 está dada por
𝑐𝑜𝑣 𝑋, 𝑌
𝜌𝑋,𝑌 = 𝑐𝑜𝑟𝑟 𝑋, 𝑌 =
𝜎𝑥 𝜎𝑌
• donde 𝜎𝑥 y 𝜎𝑦 son los desvíos estándar de 𝑋 𝑒 𝑌 respectivamente.
ESTADÍSTICA I / PROF. BURDISSO
25
Correlación entre 𝑋 𝑒 𝑌
• La correlación es una medida estandarizada.
• −1 ≤ 𝜌𝑋𝑌 ≤ 1
• 𝜌𝑋𝑌 > 0 indica una dependencia lineal positiva entre 𝑋 𝑒 𝑌. Valores grandes
(pequeños) de 𝑋 se encuentran asociados con valores grandes (pequeños) de 𝑌. Si
𝜌𝑋𝑌 = 1 entonces la asociación lineal positiva es perfecta.
• 𝜌𝑋𝑌 < 0 indica una dependencia lineal negativa entre 𝑋 𝑒 𝑌. Valores grandes
(pequeños) de 𝑋 se encuentran asociados con valores pequeños (grandes) de 𝑌. Si
𝜌𝑋𝑌 = −1 entonces la asociación lineal negativa es perfecta.
• Si 𝜌𝑋𝑌 = 0 entonces no existe relación lineal entre las v.as. 𝑋 𝑒 𝑌
• 𝜌𝑋𝑌 = 0 sí y sólo sí 𝑐𝑜𝑣 𝑋, 𝑌 = 0
• Si v.as. 𝑋 𝑒 𝑌 son independientes entonces 𝜌𝑋𝑌 = 0
• 𝜌𝑋𝑌 = 0 no necesariamente las v.as. 𝑋 𝑒 𝑌 son independientes.
ESTADÍSTICA I / PROF. BURDISSO
26
Diferentes grados de asociación lineal
ESTADÍSTICA I / PROF. BURDISSO
27
Covarianza y correlación
• Ejercicio: hallar el coeficiente de correlación lineal para el ejemplo de la familia con
tres infantes.
• Notar que la 𝑉𝑎𝑟(𝑎𝑋 + 𝑏𝑌 + 𝑐) = 𝑎2 𝑉𝑎𝑟(𝑋) + 𝑏2 𝑉𝑎𝑟(𝑌) + 2𝑎𝑏𝐶𝑜𝑣(𝑋, 𝑌) puede
reescribirse en términos del coeficiente de correlación.
𝑉𝑎𝑟(𝑎𝑋 + 𝑏𝑌 + 𝑐) = 𝑎2 𝑉𝑎𝑟(𝑋) + 𝑏 2 𝑉𝑎𝑟(𝑌) + 2𝑎𝑏𝜌𝑋𝑌 𝜎𝑥 𝜎𝑌
ESTADÍSTICA I / PROF. BURDISSO
28
Ejemplo
• Un constructor no conoce con certeza los gastos de material y mano de obra de
cierto proyecto, pero cree que los gastos de materiales siguen una v.a. con media
$200.000 y desvío estándar $20.000. El costo de la mano de obra asciende a
$6.000 diarios y el número de días para realizar el proyecto puede representarse
mediante una v.a. con media 20 y desvío 3 días.
• Suponiendo que los gastos de material y mano de obra son independientes,
¿Cuál es la media y desvío del gasto total?
• Si el coeficiente de correlación entre los gastos de material y mano de obra es
0.4, ¿Cuál es la media y desvío del gasto total?
ESTADÍSTICA I / PROF. BURDISSO
29
Aplicación: La teoría de portafolios
• La Teoría de portafolios/carteras tratan de resolver el problema de elegir las mejores
combinaciones de activos financieros dentro del universo inversor.
• La cartera óptima consiste en la integración de activos de bajo riesgo y activos
riesgosos mediante la diversificación de la cartera, con el objetivo de reducir la
volatilidad.
• Sea la v.a. 𝑋 el precio de un activo A y la v.a. 𝑌 el precio de un activo B. El valor de
mercado de la cartera 𝑊 conformada por la combinación lineal de los activos A y B
está dado por 𝑊 = 𝑎𝑋 + 𝑏𝑌 , donde a es la cantidad de acciones del activo A y b la
cantidad de acciones del activo B.
• El rendimiento esperado de W es, 𝐸 𝑊 = 𝐸 𝑎𝑋 + 𝑏𝑌 = 𝑎𝐸 𝑋 + 𝑏𝐸 𝑌
• La varianza de W es 𝑉𝑎𝑟 𝑊 = 𝑉𝑎𝑟(𝑎𝑋 + 𝑏𝑌) = 𝑎2 𝑉𝑎𝑟(𝑋) + 𝑏2𝑉𝑎𝑟(𝑌) + 2𝑎𝑏𝜌𝑋𝑌 𝜎𝑥 𝜎𝑌
ESTADÍSTICA I / PROF. BURDISSO
30
Ejercicio
• Usted es analista de inversión y se le pide que analice una cartera de inversión recién
adquirida, para determinar el valor medio y la variabilidad de su retorno. La cartera
consta de dos activos: acciones de Pampa Energía y acciones de Mirgor. El análisis
de la historia pasada indica que las acciones de Pampa Energía tienen un
rendimiento anual promedio del 20% y un desvío del 5%. Un análisis similar para
Mirgor indica que el retorno anual tiene una media de 15% y un desvío de 3%. Los
mejores datos de los que se dispone indican que los retornos de las acciones tienen
una correlación de +0,5. Se invierten U$5.000 en Pampa Energía y U$10.000 en
Mirgor.
• a) Calcule el retorno anual esperado de la cartera y su desvío. Exprese las unidades
de ambas medidas.
• b) Suponga que la correlación entre los retornos de las acciones fuera en realidad de
-0,5. ¿Cuáles son ahora la media y el desvío del retorno de la cartera?
ESTADÍSTICA I / PROF. BURDISSO
31
Correlación perfecta
ESTADÍSTICA I / PROF. BURDISSO
32
Correlación muy fuerte
ESTADÍSTICA I / PROF. BURDISSO
33
Correlación fuerte
ESTADÍSTICA I / PROF. BURDISSO
34
Correlación débil
ESTADÍSTICA I / PROF. BURDISSO
35
Correlación muy débil
ESTADÍSTICA I / PROF. BURDISSO
36
Correlación prácticamente nula
ESTADÍSTICA I / PROF. BURDISSO
37
Correlación nula
ESTADÍSTICA I / PROF. BURDISSO
38
Distribución de probabilidad multinomial
• Vamos a estudiar una v.a.discreta de mayor dimensión, que puede ser pensada como
una generalización de la binomial.
• Consideremos un experimento 𝜀, el espacio muestral asociado 𝑆 y sean 𝐴1 , 𝐴2 , … 𝐴𝑘
eventos mutuamente excluyentes del espacio muestral (‫=𝑖𝑘ڂ‬1 𝐴𝑖 = 𝑆 y 𝐴𝑖 ‫ ∅ = 𝑗𝐴 ځ‬para
todo 𝑖 ≠ 𝑗), de modo que cuando realizo el experimento 𝜀 sólo uno de los sucesos 𝐴𝑖
ocurre.
• Realizamos n repeticiones independientes de 𝜀.
• Sea P 𝐴𝑖 = 𝑝𝑖 la probabilidad de que 𝐴𝑖 ocurra permanece constante en cada ensayo.
Se tiene entonces un vector 𝑝 = 𝑝1 , 𝑝2 , … , 𝑝𝑘
• La σ𝑘𝑖=1 𝑝𝑖 = 1
• Sea 𝑋𝑖 : "# 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝐴𝑖 𝑜𝑐𝑢𝑟𝑟𝑒 𝑒𝑛 𝑛 𝑒𝑛𝑠𝑎𝑦𝑜𝑠“, 𝑋 = 𝑋1 , 𝑋2 , … , 𝑋𝑘
ESTADÍSTICA I / PROF. BURDISSO
39
Distribución de probabilidad multinomial
• De acuerdo con las últimas PASO 2023 a nivel nacional, un 30% votó por la Libertad
Avanza (LLA), un 29% por Juntos por el Cambio (JxC), un 28% por Unión por la Patria
(UP) y un 13% por los partidos restantes (porcentajes aproximados). ¿Cuál es la
probabilidad de que, en una muestra al azar de 20 votantes, 8 hayan votado por la
LLA, 5 por JxC, y 5 por UP?
ESTADÍSTICA I / PROF. BURDISSO
40
Distribución de probabilidad multinomial
• Supuestos de la multinomial
• Sea 𝐴1 , 𝐴2 , … 𝐴𝑘 eventos del espacio muestral tal que‫=𝑖𝑘ڂ‬1 𝐴𝑖 = 𝑆 y 𝐴𝑖 ‫∅ = 𝑗𝐴 ځ‬
para todo 𝑖 ≠ 𝑗.
• Se tienen n ensayos independientes.
• Cada ensayo tiene k resultados posibles.
• Sea P 𝐴𝑖 = 𝑝𝑖 la probabilidad de que 𝐴𝑖 ocurra es la misma en cada ensayo.
• La σ𝑘𝑖=1 𝑝𝑖 = 1
• Sea 𝑋𝑖 : "# 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝐴𝑖 𝑜𝑐𝑢𝑟𝑟𝑒 𝑒𝑛 𝑛 𝑒𝑛𝑠𝑎𝑦𝑜𝑠“, 𝑋 = 𝑋1 , 𝑋2 , … , 𝑋𝑘
𝑛!
𝑛
𝑛
𝑛
=
𝑝1 1 𝑝2 2 … 𝑝𝑘 𝑘
𝑛1 !𝑛2 !…𝑛𝑘 !
• Entonces 𝑃 𝑋1 = 𝑛1, 𝑋2 = 𝑛2, … , 𝑋𝑘 = 𝑛𝑘
donde 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = 𝑛
ESTADÍSTICA I / PROF. BURDISSO
41
Distribución de probabilidad multinomial
• Suponga que se carga un dado de forma tal que los números 1,2,3,4,5,6 tienen
distintas probabilidades de ocurrir cuando se lanza el dado. Sea 𝑝1 = 0.11, 𝑝2 =
0.30, 𝑝3 = 0.22, 𝑝4 = 0.05, 𝑝5 = 0.25, 𝑝6 = 0.07. Se lanza el dado 40 veces. Sea
𝑋1 = # 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑒𝑛 𝑙𝑜𝑠 𝑞𝑢𝑒 𝑎𝑝𝑎𝑟𝑒𝑐𝑒 𝑢𝑛 𝑛ú𝑚𝑒𝑟𝑜 𝑝𝑎𝑟 𝑦
𝑋2 = # 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝑎𝑝𝑎𝑟𝑒𝑐𝑒 𝑒𝑙 1 𝑜 𝑒𝑙 3
• ¿Cuál es la probabilidad de obtener 20 números pares y que 𝑋2 sea igual a 15?
ESTADÍSTICA I / PROF. BURDISSO
42
Relación entre la distribución multinomial y la binomial
• Recordemos que en el caso de la multinomial cada ensayo tiene k resultados
posibles
• ¿Qué ocurre si k=2?
• La multinomial se reduce a la binomial. La v.a. 𝑋 = (𝑋1 , 𝑋2 ) tiene una distribución
multinomial con parámetros 𝑛 𝑦 𝑝 = (𝑝1 , 𝑝2 )
• Entonces 𝑋2 = 𝑛 − 𝑋1 y 𝑝2=1- 𝑝1
• Por lo tanto, el vector 𝑋 se reduce a la v.a. 𝑋1 , que depende de 𝑛 y 𝑝1
• Y como 𝑋1 : "# 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝐴1 𝑜𝑐𝑢𝑟𝑟𝑒 𝑒𝑛 𝑛 𝑒𝑛𝑠𝑎𝑦𝑜𝑠“, entonces 𝑋1 ~𝐵 𝑛, 𝑝1
• En general, para cualquier valor de 𝑘 𝑘 = 2,3, … se tiene que para cada
𝑋𝑖 : "# 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝐴𝑖 𝑜𝑐𝑢𝑟𝑟𝑒 𝑒𝑛 𝑛 𝑒𝑛𝑠𝑎𝑦𝑜𝑠“ su distribución marginal es
𝑋𝑖 ~𝐵 𝑛, 𝑝𝑖
ESTADÍSTICA I / PROF. BURDISSO
43
Relación entre la distribución multinomial y la binomial
• 𝑋 = 𝑋1 , 𝑋2 , … , 𝑋𝑘 tiene distribución multinomial con parámetro 𝑝 = 𝑝1 , 𝑝2, … , 𝑝𝑘
• Cada 𝑋𝑖 ~𝐵 𝑛, 𝑝𝑖 . Entonces 𝐸(𝑋𝑖 ) = 𝑛𝑝𝑖 y 𝑉𝑎𝑟(𝑋𝑖 ) = 𝑛𝑝𝑖 (1 − 𝑝𝑖 )
• Tener presente que las 𝑋𝑖 ~𝐵 𝑛, 𝑝𝑖 no son independientes entre sí.
ESTADÍSTICA I / PROF. BURDISSO
44
Descargar