Formas cuadráticas aleatorias normales

Capı́tulo 3 Formas cuadráticas aleatorias normales 3.1. Introducción Sea X un vector aleatorio p-dimensional y A una matriz no aleatoria. En muchas situaciones aparece de forma natural la forma cuadrática X0 AX, por lo que el estudio de cómo se distribuye esta nueva variable aleatoria unidimensional ha sido profundamente abordado. Si bien hay algunos pocos resultados genéricos independientes de la distribución del vector aleatorio X, es en el caso en que X ; Np [µ; Σ] para el cual hay desarrollada toda una amplia teorı́a. En el caso normal, la teorı́a de formas cuadráticas está asociada a la distribución χ2 descentrada, por lo que haremos una breve descripción de la misma. Hay que comentar que todo este desarrollo se puede generalizar al caso matricial, o sea, a matrices aleatorias con distribución normal matricial. En tal caso la distribución asociada es la Wishart descentrada. A la hora de tratar con la distribución χ2 hay que tener en cuenta que su densidad viene expresada en términos de series de funciones que reciben el nombre de funciones hipergeométrica generalizadas que pasamos a describir de forma breve. 3.2. Definición de función hipergeométrica generalizada. Algunas funciones hipergeométricas de interés A continuación vamos a definir, en general, la forma que adopta una función hipergeométrica generalizada. Estas funciones fueron tratadas originariamente por Gauss y aparecen de forma natural tanto ligadas a las distribuciones de formas cuadráticas (distribuciones χ2 ) como a las distribuciones de los coeficientes de correlación lineal de Pearson, distribución que fue obtenida por Hotelling Definición 3.2.1. Se llama función hipergeométrica generalizada de órdenes p y q a una función complejo-valuada definida por la serie p Fq (a1 , . . . , ap ; b1 , . . . , bq ; z) = ∞ X (a1 )k · · · (ap )k z k (b1 )k · · · (bq )k k! k=0 donde los coeficientes ai y bj son, en general, complejos y donde la expresión del tipo (ai )k (conocida como coeficiente hipergeométrico) viene dada por (a)k = Γ (a + k) = a(a + 1)(a + 2) . . . (a + k − 1) Γ (a) 33 34 Francisco de Ası́s Torres Ruiz Comentario 3.2.1. A partir de la anterior definición podemos comentar: 1. Ningún coeficiente bj puede ser negativo o nulo. 2. Si todos los parámetros ai son nulos o entero negativos, la serie degenera en un polinomio. 3. La serie converge ∀z ∈ C si p ≤ q. 4. La serie converge en el disco abierto unidad (| z |< 1) y diverge fuera de él si p = q + 1. 5. La serie diverge ∀z 6= 0 si p > q + 1. Veamos a continuación ciertos resultados asociados a algunas funciones hipergeométricas de interés: Si p = q = 0 entonces 1 F0 (a; z) 0 F0 (z) = ez . = (1 − z)−a . n Z π Γ 2 ez cos(θ) senn−2 θdθ = 1 n−1 0 Γ Γ 2 2 0 F1 z2 n ; 2 4 = ∞ X k=0 z2 k 4 n k! 2 Si p < q, Re(a) > 0 y Re(z) > 0 o bien p = q, Re(a) > 0 y Re(z) > Re(k), entonces Z +∞ k −zt a−1 −a e t p Fq (a1 , . . . , ap ; b1 , . . . , bq ; kt)dt = Γ(a)z p+1 Fq a1 , . . . , ap ; b1 , . . . , bq ; z −∞ Si | z |< 1 y Re(c) > Re(a) > 0, entonces Z 1 Γ(c) ta−1 (1 − t)c−a−1 (1 − tz)−b dt = Γ(a)Γ(c − a) 0 3.3. 2 F1 (a, b; c; z) Las distribuciones χ2 y F de Snedecor descentradas Definición 3.3.1. Sea X ; Np [µ; Ip ] y consideremos la variable aleatoria Z = X0 X. Se dice entonces que Z sigue la distribución χ2 descentrada con p grados de libertad y parámetro de descentralización δ = µ0 µ y la notaremos por χ2p (δ). Tras esta definición, el siguiente teorema proporciona la forma funcional de la densidad de la ley χ2p (δ). Teorema 3.3.1. Si X ; Np [µ; Ip ], entonces Z = X0 X tiene por densidad δ p δz 1 − z2 p2 −1 ; e z , z>0 f (z) = e− 2 0 F1 p 2 4 22 Γ p 2 donde δ = µ0 µ. Comentario 3.3.1. Veamos algunas cuestiones adicionales sobre esta distribución: 1. Si µ = 0 entonces δ = 0, obteniéndose la distribución χ2 centrada. p itδ 2. La función caracterı́stica de la distribución χ2p (δ) es ΦZ (t) = (1 − 2it)− 2 e 1−2it . Análisis Multivariante. Licenciado en C.C. y T.T. Estadı́sticas. 2o curso. Francisco de Ası́s Torres Ruiz 35 3. E[Z] = n + δ y Var[Z] = 2p + 4δ. 4. Si Z1 ; χ2p1 (δ1 ) y Z2 ; χ2p2 (δ2 ) y son independientes, entonces Z1 + Z2 ; χ2p1 +p2 (δ1 + δ2 ). Z1 /p1 . Se Z2 /p2 dice entonces que F sigue la distribución F descentrada con p1 y p2 grados de libertad y parámetro de descentralización δ y la notaremos por Fp1 ;p2 (δ). Definición 3.3.2. Sean Z1 ; χ2p1 (δ) y Z2 ; χ2p2 independientes y consideremos F = El siguiente teorema proporciona la forma funcional de la densidad de la ley anterior: Teorema 3.3.2. En las condiciones de la definición anterior, F tiene por densidad g(f ) = e 3.4. − 2δ 1 F1 p1 + 2 p1 p2 p1 2p2 δf ; ; 2 1 + pp12 f ! 2 Γ p1 +p 2 Γ p21 Γ p22 p1 −1 2 f 1+ p1 p1 p2 p1 p2 f 2 p1 +p2 , f >0 2 Distribución de formas cuadráticas aleatorias normales A continuación vamos a exponer un resumen sobre los elementos básicos de la teorı́a de las distribuciones de formas cuadráticas aleatorias normales. Para ello partiremos de un vector normal X ; Np [µ; Σ] y nos planteamos, en general, la distribución de X0 AX, donde A será una matriz p × p no aleatoria y sobre la que habrá que imponer algunas restricciones como veremos. El resultado más inmediato es bien conocido: Si Σ = Ip , entonces X0 X ; χ2p (δ) con δ = µ0 µ. El primer paso que daremos será la generalización inmediata de ese resultado: Teorema 3.4.1. Sea X ; Np [µ; Σ] con Σ > 0. Entonces 1. (X − µ)0 Σ−1 (X − µ) ; χ2p . 2. X0 Σ−1 X ; χ2p (δ), donde δ = µ0 Σ−1 µ. Generalizamos la situación al caso en el que la matriz A no es la inversa de la matriz de covarianzas de X. Teorema 3.4.2. Sea X ; Np [µ; Σ] y Ap×p una matriz no aleatoria de rango k (k ≤ p). Entonces: 1. Si Σ = Ip , X0 AX ; χ2k (δ) si y sólo si A es idempotente, en cuyo caso δ = µ0 Aµ. 2. Si Σ 6= Ip , X0 AX ; χ2k (δ) si y sólo si AΣ es idempotente, en cuyo caso δ = µ0 Aµ. Además de los resultados anteriores podemos considerar otros aún más generales y que se enmarcan dentro del tratamiento de la distribución de formas cuadráticas normales a partir de la metodologı́a general de la función caracterı́stica. La situación genérica que se plantea es la siguiente: sea el polinomio y = X0 AX + 2b0 X + c con las caracterı́sticas 1. X ; Np [µ; Σ]. 2. Ap×p es una matriz simétrica de rango r ≤ p. 3. bp×1 es un vector no aleatorio. Análisis Multivariante. Licenciado en C.C. y T.T. Estadı́sticas. 2o curso. 36 Francisco de Ası́s Torres Ruiz 4. c es una constante. El siguiente teorema proporciona condiciones necesarias y suficientes para que el polinomio anterior se distribuya según una ley chi-cuadrado. Teorema 3.4.3. Sea X ; Np [0; Ip ]. En las condiciones anteriores, y ; χ2r (δ) si y sólo si A es idempotente, b = Ab y δ = c = b0 b = b0 Ab. El anterior resultado puede generalizarse en el siguiente sentido Teorema 3.4.4. Sea X ; Np [µ; Σ] con Σ > 0. En las condiciones anteriores, y ; χ2r (δ) si y sólo si r = rg(ΣAΣ) = tr(AΣ), ΣAΣAΣ = ΣAΣ, Σ(b + Aµ) = ΣAΣ(b + Aµ) y δ = c + 2b0 µ + µ0 Aµ = (b + Aµ)0 Σ(b + Aµ). 3.5. Independencia de formas cuadráticas. Teorema de Cochran En muchas aplicaciones en las que están involucradas formas cuadráticas normales, es importante determinar condiciones bajo las cuales las distribuciones asociadas sean independientes. El siguiente teorema resume alguno de los principales resultados sobre esta cuestión: Teorema 3.5.1. Se verifican las siguientes cuestiones: 1. Sean X ; Np [µ; Ip ] y B1 , . . . , Bk matrices no aleatorias semidefinidas positivas. Entonces X0 B1 X, . . . , X0 Bk X son conjuntamente independientes si y sólo si Bi Bj = 0, ∀i 6= j. 2. Sean X ; Np [µ; Ip ] y B1 , . . . , Bk matrices no aleatorias con rg(Bi ) = ni . Entonces X0 Bi X ; χ2ni (δi ), i = 1, . . . , k y son conjuntamente independientes si se verifican dos de las tres condiciones siguientes (puesto que dos de ellas implican la tercera) * Cada Bi es idempotente. k X * Bi es idempotente. i=1 * Bi Bj = 0, ∀i 6= j siendo δi = µ0 Bi µ. 3. Sean X ; Np [µ; Ip ] y B1 , . . . , Bk matrices no aleatorias con rg(Bi ) = ni . Consideremos X0 X = k X X0 Bi X. Entonces X0 Bi X ; χ2ni (δi ), i = 1, . . . , k y son conjuntamente independientes si y i=1 sólo si cada Bi es idempotente y Bi Bj = 0, ∀i 6= j, siendo δi = µ0 Bi µ. 4. Sean X ; Np [µ; Σ] e yi = X0 Ai X + 2b0i X + ci , i = 1, 2, con Ai dos matrices no aleatorias. Entonces y1 e y2 son independientes si y sólo si A1 A2 = 0, b01 b2 = 0, A1 b2 = 0 y A2 b1 = 0. Enunciamos ahora el resultado sobre independencia de formas cuadráticas más conocido y ampliamente utilizado, por ejemplo, en la Teorı́a de Modelos Lineales: Teorema 3.5.2. (Teorema de Cochran). Sea X ; Np [µ; Σ] con Σ > 0. Sea X0 Σ−1 X = k X i=1 donde las matrices Ai son no aleatorias de rango pi , i = 1, . . . , k. Entonces X0 Ai X ; χ2pi (µ0 Ai µ) y son independientes si y sólo si k X i=1 Análisis Multivariante. Licenciado en C.C. y T.T. Estadı́sticas. 2o curso. pi = p X0 Ai X, Francisco de Ası́s Torres Ruiz siendo, en tal caso, k X 37 µ0 Ai µ = µ0 Σ−1 µ. i=1 Para finalizar, comentamos un resultado importante que trata sobre la independencia de formas cuadráticas y lineales normales. Teorema 3.5.3. Sea X ; Np [µ; Σ] y sean A y B dos matrices no aleatorias. Entonces BX e X0 AX son independientes si BA = 0. Análisis Multivariante. Licenciado en C.C. y T.T. Estadı́sticas. 2o curso. 38 Francisco de Ası́s Torres Ruiz Análisis Multivariante. Licenciado en C.C. y T.T. Estadı́sticas. 2o curso.

Formas cuadráticas aleatorias normales

Documentos relacionados

Productos

Apoyo

Formas cuadráticas aleatorias normales

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib