Distribución normal matricial

Anuncio
Distribución normal matricial
Felipe Osorio
http://www.ies.ucv.cl/fosorio
Instituto de Estadı́stica
Pontificia Universidad Católica de Valparaı́so
Marzo 27, 2015
1 / 14
Conceptos Preliminares
Definición 1 (Distribución normal univariada)
Z tiene una distribución normal con media cero y varianza uno si su función de
densidad es de la forma
f (z) = (2π)−1/2 exp − 12 z 2 , z ∈ R,
en cuyo caso escribimos Z ∼ N (0, 1).
Por otro lado, si
d
Y = µ + σZ,
entonces Y ∼
µ ∈ R, σ 2 ≥ 0,
N (µ, σ 2 )1 .
Además, si Y ∼ N (µ, σ 2 ), entonces su función caracterı́stica adopta la forma
ϕ(t) = exp itµ − 21 σ 2 t2 , t ∈ R.
1 Cuando σ 2 = 0 tenemos una distribución degenerada en µ
2 / 14
Conceptos Preliminares
Definición 1 (Distribución normal univariada)
Z tiene una distribución normal con media cero y varianza uno si su función de
densidad es de la forma
f (z) = (2π)−1/2 exp − 12 z 2 , z ∈ R,
en cuyo caso escribimos Z ∼ N (0, 1).
Por otro lado, si
d
Y = µ + σZ,
entonces Y ∼
µ ∈ R, σ 2 ≥ 0,
N (µ, σ 2 )1 .
Además, si Y ∼ N (µ, σ 2 ), entonces su función caracterı́stica adopta la forma
ϕ(t) = exp itµ − 12 σ 2 t2 , t ∈ R.
1 Cuando σ 2 = 0 tenemos una distribución degenerada en µ
2 / 14
Conceptos Preliminares
Definición 1 (Distribución normal univariada)
Z tiene una distribución normal con media cero y varianza uno si su función de
densidad es de la forma
f (z) = (2π)−1/2 exp − 12 z 2 , z ∈ R,
en cuyo caso escribimos Z ∼ N (0, 1).
Por otro lado, si
d
Y = µ + σZ,
entonces Y ∼
µ ∈ R, σ 2 ≥ 0,
N (µ, σ 2 )1 .
Además, si Y ∼ N (µ, σ 2 ), entonces su función caracterı́stica adopta la forma
ϕ(t) = exp itµ − 12 σ 2 t2 , t ∈ R.
1 Cuando σ 2 = 0 tenemos una distribución degenerada en µ
2 / 14
Distribución normal multivariada
Definición 2 (Distribución normal multivariada)
Sea X vector aleatorio p-dimensional. Se dice que X tiene distribución normal con
vector de medias µ ∈ Rp y matriz de covarianza Cov(X) = Σ ≥ 0 sólo si,
2
Y = t> X ∼ N (µY , σY
),
para todo t ∈ Rp ,
y anotamos X ∼ Np (µ, Σ).
Resultado 1 (Función caracterı́stica)
Si X ∼ Np (µ, Σ), entonces la función caracterı́stica de X es dada por
ϕX (t) = exp(it> µ − 21 t> Σt).
3 / 14
Distribución normal multivariada
Definición 2 (Distribución normal multivariada)
Sea X vector aleatorio p-dimensional. Se dice que X tiene distribución normal con
vector de medias µ ∈ Rp y matriz de covarianza Cov(X) = Σ ≥ 0 sólo si,
2
Y = t> X ∼ N (µY , σY
),
para todo t ∈ Rp ,
y anotamos X ∼ Np (µ, Σ).
Resultado 1 (Función caracterı́stica)
Si X ∼ Np (µ, Σ), entonces la función caracterı́stica de X es dada por
ϕX (t) = exp(it> µ − 21 t> Σt).
3 / 14
Distribución normal multivariada
Resultado 2 (Transformación afı́n)
Suponga que X ∼ Np (µ, Σ) y considere la transformación afı́n Y = AX + b donde
A ∈ Rm×p con rg(A) = m. Entonces
Y ∼ Nm (Aµ + b, AΣA> ).
Resultado 3 (Momentos)
Si X ∼ Np (µ, Σ), entonces
E(X) = µ,
Cov(X) = Σ.
4 / 14
Distribución normal multivariada
Resultado 2 (Transformación afı́n)
Suponga que X ∼ Np (µ, Σ) y considere la transformación afı́n Y = AX + b donde
A ∈ Rm×p con rg(A) = m. Entonces
Y ∼ Nm (Aµ + b, AΣA> ).
Resultado 3 (Momentos)
Si X ∼ Np (µ, Σ), entonces
E(X) = µ,
Cov(X) = Σ.
4 / 14
Distribución normal multivariada
Resultado 3 (Distribución marginal)
Si X ∼ Np (µ, Σ), entonces la distribución marginal de cualquier subconjunto de
k (< p) componentes de X es normal k-variada.
Resultado 4 (Independencia)
Si X ∼ Np (µ, Σ) y X, µ y Σ son particionadas como:
X1
µ1
Σ11
X=
,
µ=
,
Σ=
X2
µ2
Σ21
Σ12
Σ22
,
Entonces los vectores X 1 y X 2 son independientes sólo si Σ12 = 0 (= Σ>
21 ).
5 / 14
Distribución normal multivariada
Resultado 3 (Distribución marginal)
Si X ∼ Np (µ, Σ), entonces la distribución marginal de cualquier subconjunto de
k (< p) componentes de X es normal k-variada.
Resultado 4 (Independencia)
Si X ∼ Np (µ, Σ) y X, µ y Σ son particionadas como:
X1
µ1
Σ11
X=
,
µ=
,
Σ=
X2
µ2
Σ21
Σ12
Σ22
,
Entonces los vectores X 1 y X 2 son independientes sólo si Σ12 = 0 (= Σ>
21 ).
5 / 14
Distribución normal multivariada
Resultado 5 (Función de densidad)
Si X ∼ Np (µ, Σ) y Σ es definida positiva, entonces la densidad de X asume la forma
fX (x) = |2πΣ|−1/2 exp{− 12 (x − µ)> Σ−1 (x − µ)},
x ∈ Rp .
Observación:
La variable aleatoria2
(X − µ)> Σ−1 (X − µ) = Z > Z =
p
X
Zi2 ∼ χ2p .
i=1
2 D = {(X − µ)> Σ−1 (X − µ)}1/2 se conoce como distancia de Mahalanobis de X a µ
6 / 14
Distribución normal multivariada
Resultado 5 (Función de densidad)
Si X ∼ Np (µ, Σ) y Σ es definida positiva, entonces la densidad de X asume la forma
fX (x) = |2πΣ|−1/2 exp{− 12 (x − µ)> Σ−1 (x − µ)},
x ∈ Rp .
Observación:
La variable aleatoria2
(X − µ)> Σ−1 (X − µ) = Z > Z =
p
X
Zi2 ∼ χ2p .
i=1
2 D = {(X − µ)> Σ−1 (X − µ)}1/2 se conoce como distancia de Mahalanobis de X a µ
6 / 14
Distribución normal multivariada
El siguiente resultado provee un método útil para evaluar el supuesto de normalidad
multivariada
Resultado 6 (Transformación Wilson-Hilferty)
Si X ∼ Np (µ, Σ), entonces
Z=
D2
p
1/3
− 1−
q
2
9p
2
9p
,
tiene una distribución aproximadamente normal estándar.
Este resultado permite construir un gráfico cuantil-cuantil que es muy fácil de
interpretar.
7 / 14
QQ-plot datos de AFP
Transformed distances Q−Q plot
4
●
●
●
●
●
●●
●
●
●●●
●
●
●●
0
●
●●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●●
●●●●●●
●
●●
●●●
● ● ●●
−2
Sample Quantiles
2
●●
●
●
●
−2
−1
0
1
2
Theoretical Quantiles
8 / 14
Densidad normal bivariada3
rho = 0.0
rho = 0.4
0.2
z
0.3
0.2
z
0.3
0.1
0.0
2
0.1
0.0
2
0
0
0
2
y
y
2
−2
x
0
−2
−2
x
−2
3
rho = 0.8
2
0.3
0.2
1
z
0.06
0.1
0.0
2
0
x
−2
0.1
−2
y
2
−2
0.02
−3
0
−1
0
0.14
−3
−2
−1
0
1
2
3
3 X ∼ N (0, Σ), con vech Σ = (1, ρ, 1)> .
2
9 / 14
Distribución normal multivariada
Resultado 7 (Distribución condicional)
Sea X ∼ Np (µ, Σ) y considere la siguiente partición:
X1
µ1
Σ11
X=
,
µ=
,
Σ=
X2
µ2
Σ21
Σ12
Σ22
,
Entonces
(X 1 |X 2 = x2 ) ∼ Nk (µ1·2 , Σ11·2 ),
x1 ∈ Rk ,
donde
µ1·2 = µ1 + Σ12 Σ−
22 (x2 − µ2 ),
Σ11·2 = Σ11 − Σ12 Σ−
22 Σ21 ,
4
con Σ−
22 una matriz que satisface
Σ22 Σ−
22 Σ22 = Σ22 .
4 Σ− es una inversa generalizada de Σ .
22
22
10 / 14
Distribución normal matricial
Definición 3 (Distribución normal matricial)
Sea X matriz aleatoria n × p. Entonces X ∼ Nn,p (M , Ω, Σ) si su función de
densidad está dada por
n
o
f (X) = (2π)−np/2 |Σ|−n/2 |Ω|−p/2 exp − 21 tr Ω−1 (X − M )Σ−1 (X − M )>
donde M ∈ Rn×p , Ω > 0 y Σ > 0 son matrices n × n y p × p, respectivamente.
11 / 14
Propiedades
Lema 1
Sea X matriz aleatoria n × p. Entonces X ∼ Nn,p (M , Ω, Σ) sólo si
vec(X > ) ∼ Nnp (vec(M > ), Ω ⊗ Σ).
Lema 2
Si X ∼ Nn,p (M , Ω, Σ), entonces la función caracterı́stica de X es dada por:
ϕX (T ) = exp i tr M > T − 12 tr T > ΣT Ω .
12 / 14
Propiedades (continuación)
Lema 3
Sea X ∼ Nn,p (M , Ω, Σ) y A ∈ Rm×n , B ∈ Rp×q y C ∈ Rm×q . Entonces
AXB + C ∼ Nm,q (AM B + C, AΩA> , B > ΣB)
Es posible notar que
(X − M )Σ−1/2 ∼ Nn,p (0, Ω, I p ),
Ω−1/2 (X − M ) ∼ Nn,p (0, I n , Σ),
Ω−1/2 (X − M )Σ−1/2 ∼ Nn,p (0, I n , I p ).
13 / 14
Propiedades (continuación)
Lema 4
Sea X ∼ Nn,p (M , Ω, Σ). Entonces
tr Ω−1 (X − M )Σ−1 (X − M )> = (vec(X − M )> )> (Ω ⊗ Σ)−1 vec(X − M )>
= (vec(X − M ))> (Σ ⊗ Ω)−1 vec(X − M )
∼ χ2np .
14 / 14
Descargar