Formas cuadráticas aleatorias normales

Anuncio
Capı́tulo 3
Formas cuadráticas aleatorias normales
3.1.
Introducción
Sea X un vector aleatorio p-dimensional y A una matriz no aleatoria. En muchas situaciones
aparece de forma natural la forma cuadrática X0 AX, por lo que el estudio de cómo se distribuye esta
nueva variable aleatoria unidimensional ha sido profundamente abordado.
Si bien hay algunos pocos resultados genéricos independientes de la distribución del vector aleatorio X, es en el caso en que X ; Np [µ; Σ] para el cual hay desarrollada toda una amplia teorı́a.
En el caso normal, la teorı́a de formas cuadráticas está asociada a la distribución χ2 descentrada,
por lo que haremos una breve descripción de la misma.
Hay que comentar que todo este desarrollo se puede generalizar al caso matricial, o sea, a matrices aleatorias con distribución normal matricial. En tal caso la distribución asociada es la Wishart
descentrada.
A la hora de tratar con la distribución χ2 hay que tener en cuenta que su densidad viene expresada
en términos de series de funciones que reciben el nombre de funciones hipergeométrica generalizadas
que pasamos a describir de forma breve.
3.2.
Definición de función hipergeométrica generalizada. Algunas
funciones hipergeométricas de interés
A continuación vamos a definir, en general, la forma que adopta una función hipergeométrica
generalizada. Estas funciones fueron tratadas originariamente por Gauss y aparecen de forma natural
tanto ligadas a las distribuciones de formas cuadráticas (distribuciones χ2 ) como a las distribuciones
de los coeficientes de correlación lineal de Pearson, distribución que fue obtenida por Hotelling
Definición 3.2.1. Se llama función hipergeométrica generalizada de órdenes p y q a una función
complejo-valuada definida por la serie
p Fq (a1 , . . . , ap ; b1 , . . . , bq ; z) =
∞
X
(a1 )k · · · (ap )k z k
(b1 )k · · · (bq )k k!
k=0
donde los coeficientes ai y bj son, en general, complejos y donde la expresión del tipo (ai )k (conocida
como coeficiente hipergeométrico) viene dada por
(a)k =
Γ (a + k)
= a(a + 1)(a + 2) . . . (a + k − 1)
Γ (a)
33
34
Francisco de Ası́s Torres Ruiz
Comentario 3.2.1. A partir de la anterior definición podemos comentar:
1. Ningún coeficiente bj puede ser negativo o nulo.
2. Si todos los parámetros ai son nulos o entero negativos, la serie degenera en un polinomio.
3. La serie converge ∀z ∈ C si p ≤ q.
4. La serie converge en el disco abierto unidad (| z |< 1) y diverge fuera de él si p = q + 1.
5. La serie diverge ∀z 6= 0 si p > q + 1.
Veamos a continuación ciertos resultados asociados a algunas funciones hipergeométricas de interés:
Si p = q = 0 entonces
1 F0 (a; z)
0 F0 (z)
= ez .
= (1 − z)−a .
n
Z π
Γ
2
ez cos(θ) senn−2 θdθ =
1
n−1
0
Γ
Γ
2
2
0 F1
z2
n
;
2 4
=
∞
X
k=0
z2
k
4
n
k!
2
Si p < q, Re(a) > 0 y Re(z) > 0 o bien p = q, Re(a) > 0 y Re(z) > Re(k), entonces
Z +∞
k
−zt a−1
−a
e t
p Fq (a1 , . . . , ap ; b1 , . . . , bq ; kt)dt = Γ(a)z
p+1 Fq a1 , . . . , ap ; b1 , . . . , bq ;
z
−∞
Si | z |< 1 y Re(c) > Re(a) > 0, entonces
Z 1
Γ(c)
ta−1 (1 − t)c−a−1 (1 − tz)−b dt =
Γ(a)Γ(c − a) 0
3.3.
2 F1 (a, b; c; z)
Las distribuciones χ2 y F de Snedecor descentradas
Definición 3.3.1. Sea X ; Np [µ; Ip ] y consideremos la variable aleatoria Z = X0 X. Se dice entonces
que Z sigue la distribución χ2 descentrada con p grados de libertad y parámetro de descentralización
δ = µ0 µ y la notaremos por χ2p (δ).
Tras esta definición, el siguiente teorema proporciona la forma funcional de la densidad de la ley
χ2p (δ).
Teorema 3.3.1. Si X ; Np [µ; Ip ], entonces Z = X0 X tiene por densidad
δ
p δz
1
− z2 p2 −1
;
e
z
, z>0
f (z) = e− 2 0 F1
p
2 4 22 Γ p
2
donde δ = µ0 µ.
Comentario 3.3.1. Veamos algunas cuestiones adicionales sobre esta distribución:
1. Si µ = 0 entonces δ = 0, obteniéndose la distribución χ2 centrada.
p
itδ
2. La función caracterı́stica de la distribución χ2p (δ) es ΦZ (t) = (1 − 2it)− 2 e 1−2it .
Análisis Multivariante. Licenciado en C.C. y T.T. Estadı́sticas. 2o curso.
Francisco de Ası́s Torres Ruiz
35
3. E[Z] = n + δ y Var[Z] = 2p + 4δ.
4. Si Z1 ; χ2p1 (δ1 ) y Z2 ; χ2p2 (δ2 ) y son independientes, entonces Z1 + Z2 ; χ2p1 +p2 (δ1 + δ2 ).
Z1 /p1
. Se
Z2 /p2
dice entonces que F sigue la distribución F descentrada con p1 y p2 grados de libertad y parámetro
de descentralización δ y la notaremos por Fp1 ;p2 (δ).
Definición 3.3.2. Sean Z1 ; χ2p1 (δ) y Z2 ; χ2p2 independientes y consideremos F =
El siguiente teorema proporciona la forma funcional de la densidad de la ley anterior:
Teorema 3.3.2. En las condiciones de la definición anterior, F tiene por densidad
g(f ) = e
3.4.
− 2δ
1 F1
p1 +
2
p1
p2 p1 2p2 δf
; ;
2 1 + pp12 f
!
2
Γ p1 +p
2
Γ p21 Γ p22
p1
−1
2
f
1+
p1
p1
p2
p1
p2 f
2
p1 +p2
, f >0
2
Distribución de formas cuadráticas aleatorias normales
A continuación vamos a exponer un resumen sobre los elementos básicos de la teorı́a de las
distribuciones de formas cuadráticas aleatorias normales.
Para ello partiremos de un vector normal X ; Np [µ; Σ] y nos planteamos, en general, la distribución de X0 AX, donde A será una matriz p × p no aleatoria y sobre la que habrá que imponer algunas
restricciones como veremos.
El resultado más inmediato es bien conocido: Si Σ = Ip , entonces X0 X ; χ2p (δ) con δ = µ0 µ.
El primer paso que daremos será la generalización inmediata de ese resultado:
Teorema 3.4.1. Sea X ; Np [µ; Σ] con Σ > 0. Entonces
1. (X − µ)0 Σ−1 (X − µ) ; χ2p .
2. X0 Σ−1 X ; χ2p (δ), donde δ = µ0 Σ−1 µ.
Generalizamos la situación al caso en el que la matriz A no es la inversa de la matriz de covarianzas
de X.
Teorema 3.4.2. Sea X ; Np [µ; Σ] y Ap×p una matriz no aleatoria de rango k (k ≤ p). Entonces:
1. Si Σ = Ip , X0 AX ; χ2k (δ) si y sólo si A es idempotente, en cuyo caso δ = µ0 Aµ.
2. Si Σ 6= Ip , X0 AX ; χ2k (δ) si y sólo si AΣ es idempotente, en cuyo caso δ = µ0 Aµ.
Además de los resultados anteriores podemos considerar otros aún más generales y que se enmarcan dentro del tratamiento de la distribución de formas cuadráticas normales a partir de la
metodologı́a general de la función caracterı́stica.
La situación genérica que se plantea es la siguiente: sea el polinomio y = X0 AX + 2b0 X + c con
las caracterı́sticas
1. X ; Np [µ; Σ].
2. Ap×p es una matriz simétrica de rango r ≤ p.
3. bp×1 es un vector no aleatorio.
Análisis Multivariante. Licenciado en C.C. y T.T. Estadı́sticas. 2o curso.
36
Francisco de Ası́s Torres Ruiz
4. c es una constante.
El siguiente teorema proporciona condiciones necesarias y suficientes para que el polinomio anterior se distribuya según una ley chi-cuadrado.
Teorema 3.4.3. Sea X ; Np [0; Ip ]. En las condiciones anteriores, y ; χ2r (δ) si y sólo si A es
idempotente, b = Ab y δ = c = b0 b = b0 Ab.
El anterior resultado puede generalizarse en el siguiente sentido
Teorema 3.4.4. Sea X ; Np [µ; Σ] con Σ > 0. En las condiciones anteriores, y ; χ2r (δ) si y sólo si
r = rg(ΣAΣ) = tr(AΣ), ΣAΣAΣ = ΣAΣ, Σ(b + Aµ) = ΣAΣ(b + Aµ) y δ = c + 2b0 µ + µ0 Aµ =
(b + Aµ)0 Σ(b + Aµ).
3.5.
Independencia de formas cuadráticas. Teorema de Cochran
En muchas aplicaciones en las que están involucradas formas cuadráticas normales, es importante
determinar condiciones bajo las cuales las distribuciones asociadas sean independientes.
El siguiente teorema resume alguno de los principales resultados sobre esta cuestión:
Teorema 3.5.1. Se verifican las siguientes cuestiones:
1. Sean X ; Np [µ; Ip ] y B1 , . . . , Bk matrices no aleatorias semidefinidas positivas. Entonces
X0 B1 X, . . . , X0 Bk X son conjuntamente independientes si y sólo si Bi Bj = 0, ∀i 6= j.
2. Sean X ; Np [µ; Ip ] y B1 , . . . , Bk matrices no aleatorias con rg(Bi ) = ni . Entonces X0 Bi X ;
χ2ni (δi ), i = 1, . . . , k y son conjuntamente independientes si se verifican dos de las tres condiciones siguientes (puesto que dos de ellas implican la tercera)
* Cada Bi es idempotente.
k
X
*
Bi es idempotente.
i=1
* Bi Bj = 0, ∀i 6= j
siendo δi = µ0 Bi µ.
3. Sean X ; Np [µ; Ip ] y B1 , . . . , Bk matrices no aleatorias con rg(Bi ) = ni . Consideremos X0 X =
k
X
X0 Bi X. Entonces X0 Bi X ; χ2ni (δi ), i = 1, . . . , k y son conjuntamente independientes si y
i=1
sólo si cada Bi es idempotente y Bi Bj = 0, ∀i 6= j, siendo δi = µ0 Bi µ.
4. Sean X ; Np [µ; Σ] e yi = X0 Ai X + 2b0i X + ci , i = 1, 2, con Ai dos matrices no aleatorias.
Entonces y1 e y2 son independientes si y sólo si A1 A2 = 0, b01 b2 = 0, A1 b2 = 0 y A2 b1 = 0.
Enunciamos ahora el resultado sobre independencia de formas cuadráticas más conocido y ampliamente utilizado, por ejemplo, en la Teorı́a de Modelos Lineales:
Teorema 3.5.2. (Teorema de Cochran). Sea X ; Np [µ; Σ] con Σ > 0. Sea
X0 Σ−1 X
=
k
X
i=1
donde las matrices Ai son no aleatorias de rango pi , i = 1, . . . , k. Entonces
X0 Ai X ; χ2pi (µ0 Ai µ) y son independientes si y sólo si
k
X
i=1
Análisis Multivariante. Licenciado en C.C. y T.T. Estadı́sticas. 2o curso.
pi = p
X0 Ai X,
Francisco de Ası́s Torres Ruiz
siendo, en tal caso,
k
X
37
µ0 Ai µ = µ0 Σ−1 µ.
i=1
Para finalizar, comentamos un resultado importante que trata sobre la independencia de formas
cuadráticas y lineales normales.
Teorema 3.5.3. Sea X ; Np [µ; Σ] y sean A y B dos matrices no aleatorias. Entonces BX e X0 AX
son independientes si BA = 0.
Análisis Multivariante. Licenciado en C.C. y T.T. Estadı́sticas. 2o curso.
38
Francisco de Ası́s Torres Ruiz
Análisis Multivariante. Licenciado en C.C. y T.T. Estadı́sticas. 2o curso.
Descargar