Trabajo Opcional Trabajos Curso 2012-2013 1 Cumulantes 1. Cumulantes unidimensionales Definición 1.1. Sea X una variable aleatoria unidimensional con función caracterı́stica φX y supongamos que todos sus momentos existen. Puesto que φX (0) = 1, en un entorno de cero podemos considerar su logaritmo y desarrollarlo en serie de potencias. A la función resultante se le denomina función generatriz de cumulantes de X. KX (t) = log (φX (t)) = ∞ X κv v=0 (it)v ; κ0 = 0 , j = 1, . . . , p. v! A κv se le llama el cumulante de orden v de X. Comentario 1.1. Otras definiciones asociadas a los cumulantes son Sesgo de X: γ1j = κj3 · 3 (κj2 ) 2 Curtosis de X: γ2j = κj4 (κj2 )2 · Los cumulantes están relacionados con los momentos. En efecto, si µm = E [X m ] (momentos que suponemos existen para m = 0, 1 . . . ,), se puede verificar la siguiente ley de recurrencia µm = m−1 X h=0 m−1 µh κm−h , h m = 1, 2, . . . Ejercicio: Verificar la relación anterior. Para ello se deben seguir los siguientes pasos: • Demostrar por inducción que la derivada n−ésima de KX es: n) KX (t) = ∞ X κv+n iv+n v=0 tv v! 0 (t). Derivar a conti• Puesto que log(φX (t)) = KX (t), derivando se tiene φ0X (t) = φX (t)KX nuación en ambos miembros m − 1 veces para comprobar que m) φX (t) = m−1 ∞ X m − 1 h) X m − 1 h) tv m−h) φX (t)KX (t) = φX (t) κv+m−h iv+m−h h h v! m−1 X h=0 h=0 v=0 Indicación: Al hacer la derivada m − 1 del segundo miembro hay que tener en cuenta la Fórmula de Leibnitz para la derivada del producto de dos funciones: n X n h) n) (f (x)g(x)) = f (x)g n−h) (x) h h=0 Análisis Multivariante. 3o Grado en Estadı́stica Trabajo Opcional Trabajos Curso 2012-2013 2 m) • Aplicar que im µm = φX (0) para concluir. Como consecuencia comprobar • κ1 = E[X] = µ1 • κ2 = Var[X] • κ3 = µ3 − 3µ1 µ2 + 2(µ1 )3 • κ4 = µ4 − 4µ3 µ1 − 3(µ2 )2 + 12(µ1 )2 µ2 − 6(µ1 )4 Si X ; N1 [µ; σ 2 ], comprobar que: • Los cumulantes de orden superior a dos valen cero. • Los coeficientes de sesgo y curtosis valen cero. 2. Cumulantes bidimensionales El concepto de cumulante se puede extender al caso de distribuciones bidimensionales. En efecto, sea el vector aleatorio bidimensional X = (X1 , X2 )0 con función caracterı́stica φX (t1 , t2 ). Seguimos suponiendo que existen todos los momentos para X. Al igual que antes podemos considerar el logaritmo de la función caracterı́stica y desarrollarlo en serie de potencias, dando lugar a la función generatriz de cumulantes bidimensionales ∞ X ∞ X KX (t1 , t2 ) = log (φX (t1 , t2 )) = κr1 ,r2 ir1 +r2 r1 =0 r2 =0 tr11 tr22 r1 !r2 ! A los elementos κr1 ,r2 se les llama cumulantes de órdenes r1 y r2 correspondientes al vector X. Razonando de forma análoga al caso unidimensional se puede encontrar una relación entre cumu l m = X X , se verifica lantes y momentos. En efecto, si µ1,2 E 1 2 l,m µ1,2 l,m l−1 X m X l − 1 m 1,2 1,2 = µ κ v1 v2 v1 ,v2 l−v1 ,m−v2 v1 =0 v2 =0 Ejercicio: Verificar la relación anterior. Para ello se deben seguir los siguientes pasos: • Tener en cuenta que ∞ X ∞ r1 r2 X ∂ l KX l,m r1 +r2 +l t1 t2 κ i (t , t ) = 1 2 r1 +l,r2 r1 !r2 ! ∂tl1 r =0 r =0 1 2 (según se ha visto en el primer apartado del ejercicio anterior). Aplicando lo mismo se tendrá ∞ X ∞ r1 r2 X ∂ l+m KX l,m r1 +r2 +l+m t1 t2 (t , t ) = κ i 1 2 r1 +l,r2 +m l r1 !r2 ! ∂tm 1 ∂t2 r =0 r =0 1 Análisis Multivariante. 3o Grado en Estadı́stica 2 Trabajo Opcional Trabajos Curso 2012-2013 3 • Considerar KX (t1 , t2 ) = log (φX (t1 , t2 )), de donde ∂φX ∂KX = φX ∂t1 ∂t1 (conviene aligerar la notación y no ponemos los argumentos de las funciones). • Supuesto que l + m > 0 y que l > 0 (caso contrario serı́a m > 0 y se intercambiarı́an los papeles en lo que sigue), derivar l − 1 veces respecto a t1 , y m veces respecto a t2 , para obtener m l−1 X l − 1 X m ∂ v1 +v2 φX ∂ l+m−v1 −v2 KX ∂ l+m φX = = l 1 2 v1 v2 ∂tv22 ∂tv11 ∂tm−v ∂tm ∂tl−v 2 ∂t1 1 2 v =0 v =0 1 2 l−1 X m ∞ ∞ r1 r2 X l − 1 m ∂ v1 +v2 φX X X 1,2 r1 +r2 +l+m−v1 −v2 t1 t2 = κ i r1 +l−v1 ,r2 +m−v2 v1 v2 ∂tv22 ∂tv11 r1 !r2 ! v1 =0 v2 =0 r1 =0 r2 =0 • Aplicar que il+m µ1,2 l,m = ∂ l+m φX (0, 0) para concluir. l ∂tm 2 ∂t1 Como consecuencia comprobar 1,2 1,2 1,2 • µ1,2 1,1 = κ1,1 + µ0,1 κ1,0 1,2 Nota: Hay que tener en cuenta (¡Comprobarlo!) que κ1,2 h,0 y κ0,k son, respectivamente, los cumulantes de orden h y k de X1 y X2 . • κ1,2 1,1 = Cov[X1 , X2 ] 3. Cumulantes multididimensionales Finalmente, todo lo anterior puede extenderse al caso multidimensional.Para ello sea X un vector aleatorio p-dimensional con función caracterı́stica φX y supongamos que existen todos los momentos. Al igual que antes se define la función generatriz de cumulantes como el logaritmo de la función caracterı́stica. Puesto que φX (0) = 1 podemos desarrollar dicha función en serie de potencias en un entorno del cero: KX (t) = log (φX (t)) = ∞ X ∞ X r1 =0 r2 =0 ··· ∞ X rp =0 κr1,2,...,p i 1 ,r2 ,...,rp Pp q=1 rq p r Y tqq rq ! q=1 A los elementos κ1,2,...,p r1 ,r2 ,...,rp se les llama cumulantes de órdenes r1 , r2 , . . . , rp correspondientes a X, y siguiendo un razonamiento análogo al caso bidimensional se hpuede encontrari una relación entre j cumulantes y momentos. En concreto, si notamos µj1,2,...,p = E X1j1 X2j2 · · · Xpp , se verifica 1 ,j2 ,...,jp µ1,2,...,p j1 ,j2 ,...,jp = j1 X v1 =0 ··· jX h −1 vh =0 p jp X jh − 1 Y jm 1,2,...,p µv1 ,v2 ,...,vp κj1,2,...,p ··· 1 −v1 ,j2 −v2 ,...,jp −vp vh v m m=1 vp =0 Análisis Multivariante. 3o Grado en Estadı́stica m6=h Trabajo Opcional Trabajos Curso 2012-2013 4 La verificación de esta igualdad se realiza de forma totalmente análoga a la anterior, con la salvedad de que ahora hay más parciales involucradas en el cálculo. En concreto, derivando jl veces respecto de cada argumento tl , se tiene Pp ∂ Qp l=1 jl jl l=1 ∂tl KX (t) = ∞ X ∞ X r1 =0 r2 =0 ··· ∞ X Pp i κr1,2,...,p 1 +j1 ,r2 +j2 ,...,rp +jp l=1 (rl +jl ) rp =0 p r Y tqq rq ! q=1 P Supongamos ahora que pl=1 jl > 0 y que jh > 0 (siempre habrá un ı́ndice h tal que jh > 0). Partimos de KX (t) = log (φX (t)) y derivamos en ambos miembros primero respecto de th . ∂φX ∂KX = φX ∂th ∂th Ahora derivamos dicha expresión jh − 1 veces respecto de th y de forma sucesiva jl veces respecto de tl , l = 1, . . . , p (l 6= h). Con todo ello obtenemos Pp ∂ Qp l=1 jl jl l=1 ∂tl φX (t) = = j1 X ··· jX h −1 v1 =0 vh =0 j1 X jX h −1 v1 =0 ··· vh =0 Pp p Pp jp X ∂ l=1 (jl −vl ) jh − 1 Y jm ∂ l=1 vl Qp ··· K (t) vl φX (t) Qp (j −v ) X vh vm ∂t l l l=1 ∂tl m=1 vp =0 l=1 m6=h l p Pp jp X jh − 1 Y jm ∂ l=1 vl Qp ··· vl φX (t) vh vm l=1 ∂tl m=1 vp =0 m6=h p r Pp Y tqq 1,2,...,p (rl +jl −vl ) l=1 × ··· κr1 +j1 −v1 ,r2 +j2 −v2 ,...,rp +jp −vp i r ! r1 =0 rp =0 q=1 q ∞ X ∞ X A partir de esta expresión, y evaluando en t = 0 tenemos el resultado sin más que tener en cuenta que Pp ∂ Qp l=1 vl vl φX (0) l=1 ∂tl =i Pp l=1 vl 1,2,...,p µj1 ,j2 ,...,jp Nota: Este desarrollo no es obligatorio hacerlo, pero sı́ es recomendable al menos intentarlo. Nota: A partir de ahora ilustraremos los resultados para la clase elı́ptica de distribuciones. Por lo tanto conviene leer las definiciones y resultados sobre dichas distribuciones del Trabajo B, si bien no hay que hacer ningún ejercicio. Análisis Multivariante. 3o Grado en Estadı́stica Trabajo Opcional Trabajos Curso 2012-2013 5 Ejercicio: Si X ∈ Ep (η; V) entonces, si existen los momentos de orden cuatro, se verifica: 1. Las marginales tienen sesgo cero, osea, γ1j = 0, j = 1, . . . , p y curtosis γ2j = 3 ψ 00 (0) − (ψ 0 (0))2 = 3κ (ψ 0 (0))2 A κ se le llama curtosis del vector aleatorio X y ψ es la función que aparece en la expresión de la función caracterı́stica de X. 2. Los cumulantes κj4 vienen determinados por los elementos de la matriz de covarianzas y por κ. Indicación: t La función caracterı́stica de X es de la forma φ(u) = eiu η ψ(ut Vu), con ψ una cierta función. Por lo tanto la función caracterı́stica de la marginal Xj será φXj (uj ) = eiuj ηj ψ(u2j vjj ). que escribimos en la forma φXj (uj ) = f1 (uj )f2 (uj ). Calcular las primeras cuatro derivadas de φXj y deducir que φ0Xj (0) = iηj φ00Xj (0) = 2vjj ψ 0 (0) − ηj2 0 3 φ000 Xj (0) = 6iηj vjj ψ (0) − iηj iv) 2 ψ 00 (0) − 12η 2 v ψ 0 (0) + η 4 φXj (0) = 12vjj j jj j donde ηj es la componente j-ésima de η. De ahı́, y llamando µkj = E[Xjk ], obtner las expresiones de µkj , k = 1, 2, 3, 4, j = 1, . . . , p. Concluir sin más que sustituir las expresiones anteriores en las proporcionadas para los cumulantes en el caso unidimensional. 4. Cálculo de algunos cumulantes. Aplicación al cálculo de momentos de tercer y cuarto orden A partir de la expresión anterior vamos a proceder a calcular dos importantes cumulantes que serán muy útiles a la hora de obtener los momentos de tercer y cuarto orden para cualquier vector aleatorio. Ilustraremos este desarrollo con el caso elı́ptico. Ejercicio: Obtener las siguientes relaciones: h,l,m h,l,m m hl l hm lm h m hl l hm h lm h l m κh,l,m 1,1,1 = µ1,1,1 − µ1 κ11 − µ1 κ11 − µ11 µ1 = µ1,1,1 − µ1 κ11 − µ1 κ11 − µ1 κ11 − µ1 µ1 µ1 h,l,m,k k hlm m hlk l hmk mk hl lk hm lm hk lmk h κh,l,m,k 1,1,1,1 = µ1,1,1,1 − µ1 κ111 − µ1 κ111 − µ1 κ111 − µ11 κ11 − µ11 κ11 − µ11 κ11 − µ111 µ1 k hlm m hlk l hmk h lmk m k hl l k hm l m hk k h lm = µh,l,m,k 1,1,1,1 − µ1 κ111 − µ1 κ111 − µ1 κ111 − µ1 κ111 − µ1 µ1 κ11 − µ1 µ1 κ11 − µ1 µ1 κ11 − µ1 µ1 κ11 lk h l mk hl mk hm lk hk lm h l m k − µh1 µm 1 κ11 − µ1 µ1 κ11 − κ11 κ11 − κ11 κ11 − κ11 κ11 − µ1 µ1 µ1 µ1 Análisis Multivariante. 3o Grado en Estadı́stica Trabajo Opcional Trabajos Curso 2012-2013 6 Indicación: Basta con usar la relación entre cumulantes y momentos dada en el caso multidimensional y tener en cuenta que se tratan de cumulantes marginales, esto es: 1,...,h,...,l,...,m,...,p µh,l,m 1,1,1 = µ0,...,1,...,1,...,1,...,0 1,...,h,...,l,...,m,...,k,...,p µh,l,m,k 1,1,1,1 = µ0,...,1,...,1,...,1,...,1,...,0 A continuación aplicaremos estos cálculos para obtener los momentos de tercer y cuarto orden en cualquier población p-dimensional con media η. Para ello se parte del hecho de que h i h l m hlm E (Xh − µ1 )(Xl − µ1 )(Xm − µ1 ) = κ111 y h i h l m k hlmk hl mk hm lk hk lm E (Xh − µ1 )(Xl − µ1 )(Xm − µ1 )(Xk − µ1 ) = κ1111 + κ11 κ11 + κ11 κ11 + +κ11 κ11 Nota: Estos dos resultados no es obligatorio obtnerlos, si bien es recomendable al menos intentarlo. Por ejemplo, la primera expresión se obtiene sólo operando en la esperanza y usando las relaciones entre cumulantes y monentos ya deducidas y lss indicadas al inicio de esta sección. Ası́ h i h i h i h l m l m h l m E (Xh − µ1 )(Xl − µ1 )(Xm − µ1 ) = E Xh (Xl − µ1 )(Xm − µ1 ) − µ1 E (Xl − µ1 )(Xm − µ1 ) l m h lm = E [Xh Xl (Xm − µm 1 )] − µ1 E [Xh (Xm − µ1 )] − µ1 κ11 l hm h lm = E [Xh Xl Xm ] − µm 1 E [Xh Xl ] − µ1 κ11 − µ1 κ11 m hl l hm h lm = µhlm 111 − µ1 µ11 − µ1 κ11 − µ1 κ11 m hl l hm h lm h l m = µhlm 111 − µ1 κ11 − µ1 κ11 − µ1 κ11 − µ1 µ1 µ1 de donde se deduce el resultado sin más que usar la primera relación que se pidió en el ejercicio anterior. Siguiendo un razonamiento análogo (aunque más extenso obviamente) y usando las relaciones ya comentadas, junto con la obtenida anteiormente, se puede comprobar la segunda de las expresiones. Una vez obtenidas estas expresiones, válidas para cualquier población, con independencia de la distribución, Vamos a ilustrarlas mediante el empleo de la clase elı́ptica de distribuciones Ep (η; V). En concreto se verifica E (Xh − µh1 )(Xl − µl1 )(Xm − µm 1 ) =0 k E (Xh − µh1 )(Xl − µl1 )(Xm − µm 1 )(Xk − µ1 ) = (1 + κ) [σhl σmk + σhm σlk + σlm σhk ] y en particular, para la ley normal Np [µ; Σ] se tendrá: E (Xh − µh1 )(Xl − µl1 )(Xm − µm 1 ) =0 k E (Xh − µh1 )(Xl − µl1 )(Xm − µm 1 )(Xk − µ1 ) = σhl σmk + σhm σlk + σlm σhk Análisis Multivariante. 3o Grado en Estadı́stica Trabajo Opcional Trabajos Curso 2012-2013 7 Indicaciones: A continuación esquematizamos los pasos que hay que dar para la obtención del resultado. t Puesto que φX (u) = eiu η ψ(u0 Vu) se tiene KX (u) = iut η + log(ψ(ut Vu)), y desarrollando la p X p X t forma cuadrática t Vt = ti tj vij , entonces i=1 j=1 p X ∂(tt Vt) = 2tl vll + 2 ti vli = fl (t) = fl , ∂tl i=1 l = 1, . . . , p i6=l ∂ 2 (tt Vt) = 2vlk , ∂tk ∂tl l, k = 1, . . . , p a partir de donde podemos escribir (prescindimos en las funciones de las dependencias del argumento) ∂KX ψ 0 fh = iµh1 + ∂th ψ ∂ 2 KX 1 = 2 fh fl (ψψ 00 − (ψ 0 )2 ) + 2ψψ 0 vhl ∂tl ∂th ψ ∂ 3 KX 1 = 3 fm fh fl ψ 000 ψ 2 − 3ψ 00 ψ 0 ψ + 2(ψ 0 )3 + ∂tm ∂tl ∂th ψ +2ψ ψ 00 ψ − (ψ 0 )2 [vhl fm + vhm fl + vlm fh ] h i ∂ 4 KX 1 h = 4 fm fh fl fk ψ iv) ψ 3 − 4ψ 000 ψ 0 ψ 2 − 3(ψ 00 )2 ψ 2 + 12ψ 00 (ψ 0 )2 ψ − 6(ψ 0 )4 + ∂tk ∂tm ∂tl ∂th ψ +2ψ ψ 000 ψ 2 − 3ψ 00 ψ 0 ψ + 2(ψ 0 )3 [vmk fh fl + vhk fm fl + vlk fm fh + vhl fk fm + vhm fk fl + vlm fk fh ] + +4ψ 2 ψ 00 ψ − (ψ 0 )2 [vhl vmk + vhm vlk + vlm vhk ] A partir de estos cálculos (y teniendo en cuenta que ψ(0) = 1, ¡comprobarlo!) se deduce: κh1 = µh1 κhl 11 = −2vhl ψ 0 (0) = σhl κhlm 111 =0 κhlmk = 4 ψ 00 (0) − (ψ 0 (0))2 [vhl vmk + vhm vlk + vlm vhk ] = 1111 = 4κ(ψ 0 (0))2 [vhl vmk + vhm vlk + vlm vhk ] = = κ [σhl σmk + σhm σlk + σlm σhk ] de donde se tiene el resultado según las relaciones anteriores. Análisis Multivariante. 3o Grado en Estadı́stica