Índice general 3. Formas cuadráticas aleatorias normales 3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Definición de función hipergeométrica generalizada. Algunas cas de interés . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3. Las distribuciones χ2 y F de Snedecor descentradas . . . . . 3.4. Distribución de formas cuadráticas aleatorias normales . . . 3.5. Independencia de formas cuadráticas. Teorema de Cochran 1 . . . . . . . . . . . . . . . funciones hipergeométri. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 3 4 5 5 2 Análisis Multivariante. Grado en Estadı́stica. Tercer curso. Francisco de Ası́s Torres Ruiz Capı́tulo 3 Formas cuadráticas aleatorias normales 3.1. Introducción Sea X un vector aleatorio p-dimensional y A una matriz no aleatoria. En muchas situaciones aparece de forma natural la forma cuadrática X0 AX, por lo que el estudio de cómo se distribuye esta nueva variable aleatoria unidimensional ha sido profundamente abordado. Si bien hay algunos pocos resultados genéricos independientes de la distribución del vector aleatorio X, es en el caso en que X ; Np [µ; Σ] para el cual hay desarrollada toda una amplia teorı́a. En el caso normal, la teorı́a de formas cuadráticas está asociada a la distribución χ2 descentrada, por lo que haremos una breve descripción de la misma. Hay que comentar que todo este desarrollo se puede generalizar al caso matricial, o sea, a matrices aleatorias con distribución normal matricial. En tal caso la distribución asociada es la Wishart descentrada. A la hora de tratar con la distribución χ2 hay que tener en cuenta que su densidad viene expresada en términos de series de funciones que reciben el nombre de funciones hipergeométrica generalizadas que pasamos a describir de forma breve. 3.2. Definición de función hipergeométrica generalizada. Algunas funciones hipergeométricas de interés A continuación vamos a definir, en general, la forma que adopta una función hipergeométrica generalizada. Estas funciones fueron tratadas originariamente por Gauss y aparecen de forma natural tanto ligadas a las distribuciones de formas cuadráticas (distribuciones χ2 ) como a las distribuciones de los coeficientes de correlación lineal de Pearson, distribución que fue obtenida por Hotelling Definición 3.2.1. Se llama función hipergeométrica generalizada de órdenes p y q a una función complejo-valuada definida por la serie p Fq (a1 , . . . , ap ; b1 , . . . , bq ; z) = ∞ X (a1 )k · · · (ap )k z k (b1 )k · · · (bq )k k! k=0 donde los coeficientes ai y bj son, en general, complejos y donde la expresión del tipo (ai )k (conocida como coeficiente hipergeométrico) viene dada por (a)k = Γ (a + k) = a(a + 1)(a + 2) . . . (a + k − 1) Γ (a) 3 4 Francisco de Ası́s Torres Ruiz Comentario 3.2.1. A partir de la anterior definición podemos comentar: 1. Ningún coeficiente bj puede ser negativo o nulo. 2. Si todos los parámetros ai son nulos o entero negativos, la serie degenera en un polinomio. 3. La serie converge ∀z ∈ C si p ≤ q. 4. La serie converge en el disco abierto unidad (| z |< 1) y diverge fuera de él si p = q + 1. 5. La serie diverge ∀z 6= 0 si p > q + 1. = ez . 6. 0 F0 (z) 7. 1 F0 (a; z) 3.3. = (1 − z)−a . Las distribuciones χ2 y F de Snedecor descentradas Definición 3.3.1. Sea X ; Np [µ; Ip ] y consideremos la variable aleatoria Z = X0 X. Se dice entonces que Z sigue la distribución χ2 descentrada con p grados de libertad y parámetro de descentralización δ = µ0 µ y la notaremos por χ2p (δ). Tras esta definición, el siguiente teorema proporciona la forma funcional de la densidad de la ley χ2p (δ). Teorema 3.3.1. Si X ; Np [µ; Ip ], entonces Z = X0 X tiene por densidad z p 1 p δz − 2δ f (z) = e ; e− 2 z 2 −1 , z > 0 p 0 F1 p 2 4 22 Γ 2 donde δ = µ0 µ. Comentario 3.3.1. Veamos algunas cuestiones adicionales sobre esta distribución: 1. Si µ = 0 entonces δ = 0, obteniéndose la distribución χ2 centrada. p itδ 2. La función caracterı́stica de la distribución χ2p (δ) es ΦZ (t) = (1 − 2it)− 2 e 1−2it . 3. E[Z] = p + δ y Var[Z] = 2p + 4δ. 4. Si Z1 ; χ2p1 (δ1 ) y Z2 ; χ2p2 (δ2 ) y son independientes, entonces Z1 + Z2 ; χ2p1 +p2 (δ1 + δ2 ). Z1 /p1 . Se Z2 /p2 dice entonces que F sigue la distribución F descentrada con p1 y p2 grados de libertad y parámetro de descentralización δ y la notaremos por Fp1 ;p2 (δ). Definición 3.3.2. Sean Z1 ; χ2p1 (δ) y Z2 ; χ2p2 independientes y consideremos F = El siguiente teorema proporciona la forma funcional de la densidad de la ley anterior: Teorema 3.3.2. En las condiciones de la definición anterior, F tiene por densidad g(f ) = e − 2δ 1 F1 p1 + 2 p1 p2 p1 2p2 δf ; ; 2 1 + pp12 f ! 2 Γ p1 +p 2 Γ p21 Γ p22 Análisis Multivariante. Grado en Estadı́stica. Tercer curso. p1 −1 2 f 1+ p1 p1 p2 f p1 p2 2 p1 +p2 2 , f >0 Francisco de Ası́s Torres Ruiz 3.4. 5 Distribución de formas cuadráticas aleatorias normales A continuación vamos a exponer un resumen sobre los elementos básicos de la teorı́a de las distribuciones de formas cuadráticas aleatorias normales. Para ello partiremos de un vector normal X ; Np [µ; Σ] y nos planteamos, en general, la distribución de X0 AX, donde A será una matriz p × p no aleatoria y sobre la que habrá que imponer algunas restricciones como veremos. El resultado más inmediato es bien conocido: Si Σ = Ip , entonces X0 X ; χ2p (δ) con δ = µ0 µ. El primer paso que daremos será la generalización inmediata de ese resultado: Teorema 3.4.1. Sea X ; Np [µ; Σ] con Σ > 0. Entonces 1. (X − µ)0 Σ−1 (X − µ) ; χ2p . 2. X0 Σ−1 X ; χ2p (δ), donde δ = µ0 Σ−1 µ. Generalizamos la situación al caso en el que la matriz A no es la inversa de la matriz de covarianzas de X. Teorema 3.4.2. Sea X ; Np [µ; Σ] y Ap×p una matriz no aleatoria de rango k (k ≤ p). Entonces: 1. Si Σ = Ip , X0 AX ; χ2k (δ) si y sólo si A es idempotente, en cuyo caso δ = µ0 Aµ. 2. Si Σ 6= Ip , X0 AX ; χ2k (δ) si y sólo si AΣ es idempotente, en cuyo caso δ = µ0 Aµ. 3.5. Independencia de formas cuadráticas. Teorema de Cochran En muchas aplicaciones en las que están involucradas formas cuadráticas normales, es importante determinar condiciones bajo las cuales las distribuciones asociadas sean independientes. El siguiente teorema resume alguno de los principales resultados sobre esta cuestión: Teorema 3.5.1. Se verifican las siguientes cuestiones: 1. Sean X ; Np [µ; Ip ] y B1 , . . . , Bk matrices no aleatorias semidefinidas positivas. Entonces X0 B1 X, . . . , X0 Bk X son conjuntamente independientes si y sólo si Bi Bj = 0, ∀i 6= j. 2. Sean X ; Np [µ; Ip ] y B1 , . . . , Bk matrices no aleatorias con rg(Bi ) = ni . Entonces X0 Bi X ; χ2ni (δi ), i = 1, . . . , k y son conjuntamente independientes si se verifican dos de las tres condiciones siguientes (puesto que dos de ellas implican la tercera) * Cada Bi es idempotente. * k X Bi es idempotente. i=1 * Bi Bj = 0, ∀i 6= j siendo δi = µ0 Bi µ. 3. Sean X ; Np [µ; Ip ] y B1 , . . . , Bk matrices no aleatorias con rg(Bi ) = ni . Consideremos X0 X = k X X0 Bi X. Entonces X0 Bi X ; χ2ni (δi ), i = 1, . . . , k y son conjuntamente independientes si y i=1 sólo si cada Bi es idempotente y Bi Bj = 0, ∀i 6= j, siendo δi = µ0 Bi µ. Análisis Multivariante. Grado en Estadı́stica. Tercer curso. 6 Francisco de Ası́s Torres Ruiz Enunciamos ahora el resultado sobre independencia de formas cuadráticas más conocido y ampliamente utilizado, por ejemplo, en la Teorı́a de Modelos Lineales: Teorema 3.5.2. (Teorema de Cochran). Sea X ; Np [µ; Σ] con Σ > 0. Sea X0 Σ−1 X = k X X0 Ai X, i=1 donde las matrices Ai son no aleatorias de rango pi , i = 1, . . . , k. Entonces 0 X Ai X ; χ2pi (µ0 Ai µ) y son independientes si y sólo si k X pi = p i=1 siendo, en tal caso, k X µ0 Ai µ = µ0 Σ−1 µ. i=1 Para finalizar, comentamos un resultado importante que trata sobre la independencia de formas cuadráticas y lineales normales. Teorema 3.5.3. Sea X ; Np [µ; Σ] y sean A y B dos matrices no aleatorias. Entonces BX e X0 AX son independientes si BA = 0. Análisis Multivariante. Grado en Estadı́stica. Tercer curso.