Notas sobre propagación de incertidumbres y la elipse de error mayo de 2015 Sebastián Orihuela Estas notas tienen como objeto explicar el desarrollo de algunas fórmulas relacionadas con la elipse de error en el plano. 1. Propagación de incertidumbres Siendo x 1 , x 2 variables aleatorias estadísticamente independientes, a, b valores constantes, la varianza de la suma ax 1 + bx 2 se expande como Var (ax 1 + bx 2 ) = a 2 Var (x 1 ) + b 2 Var (x 2 ) + 2ab Cov (x 1 , x 2 ) . (1) Sea y = f (x 1 , x 2 ) una función analítica, el desarrollo por Taylor truncado en la primer derivada centrado en el punto (u 0 , v 0 ) resulta ¯ ¯ ¯ ∂ f ¯¯ ∂ f ¯¯ f (x 1 , x 2 ) = f (x 1 , x 2 )¯0 + − u + (x (x 2 − v 0 ) , ) 1 0 ∂x 1 ¯0 ∂x 2 ¯0 ¯ donde f ¯0 significa evaluado en (u 0 , v 0 ). Con el siguiente cambio de variables: δx 1 = x 1 − u 0 , δx 2 = x 2 − v 0 , ¯ δy = f (x 1 , x 2 ) − f (x 1 , x 2 )¯0 , donde los valores δ pueden ser considerados como residuos o valores muy pequeños, obtengo el desarrollo por Taylor de δy, ¯ ¯ ∂ f ¯¯ ∂ f ¯¯ δx 1 + δx 2 . δy = ∂x 1 ¯0 ∂x 2 ¯0 (2) Aplicando la ley de propagación de varianzas (1) en (2), ¡ ¢ Var δy = µ ¯ ¶ ¯ ¶ ¯ ¯ µ ∂ f ¯¯ 2 ∂ f ¯¯ 2 ∂ f ¯¯ ∂ f ¯¯ Var + Var + 2 Cov (x 1 , x 2 ) . (δx (δx ) ) 1 2 ∂x 1 ¯0 ∂x 2 ¯0 ∂x 1 ¯0 ∂x 2 ¯0 Si las variables aleatorias x 1 , x 2 se distribuyen en forma normal, puedo asumir que Var (δx 1 ) = Var (x 1 ) = σ2x1 , Var (δx 2 ) = Var (x 2 ) = σ2x2 , ¡ ¢ ¡ ¢ Var δy = Var y = σ2y , y por lo tanto σ2y = µ ∂f ∂x 1 ¶2 ∂f ∂x 2 σ2x1 + µ ∂f ∂x 2 ¶Ã ¶2 σ2x2 + 2 ∂f ∂f σx ,x , ∂x 1 ∂x 2 1 2 en forma matricial ∂f ∂x 1 ∂f . ∂x 2 σ2y = µ ∂f ∂x 1 σ2x1 σx1 ,x2 1 σx1 ,x2 σ2x2 ! En general, para cualquier número de variables σ2y = n µ ∂ f ¶2 n−1 n X X X ∂f ∂f σxi ,x j . σ2xi + 2 i =1 ∂x i i =1 j =i +1 ∂x i ∂x j (3) Expresada como producto de matrices σ2x1 ¶ σ x1 ,x2 .. . σx1 ,xn σ2y = µ ∂f ∂x 1 ∂f ∂f ··· ∂x 2 ∂x n σx1 ,x2 σ2x2 .. . σx2 ,xn ··· σx1 ,xn ··· .. . σx2 ,xn .. . ··· σ2xn ∂f ∂x 1 ∂f ∂x 2 .. . , ∂f ∂x n σ2y = DΣx DT , (4) donde D es la matriz jacobiana y Σx la matriz de varianza covarianza de las observaciones. Si consideramos ahora dos variables correlacionadas y 1 , y 2 , obtenidas a través de observaciones indirectas la propagación de varianzas y covarianza se calcula como σ2x1 ∂ f1 ∂ f1 ··· σx1 ,x2 ∂x 2 ∂x n .. ∂ f2 ∂ f2 . ··· ∂x 2 ∂x n σx1 ,xn ∂ f1 ∂x 1 = ∂ f2 ∂x 1 à σ2y 1 σ y 1 ,y 2 σ y 1 ,y 2 σ2y 2 ! σx1 ,xn σ2x2 .. . ··· ··· .. . σx2 ,xn .. . σx2 ,xn ··· σ2xn σx1 ,x2 ∂ f1 ∂x 1 ∂ f1 ∂x 2 .. . ∂ f2 ∂x 1 ∂ f2 ∂x 2 .. . ∂ f1 ∂x n ∂ f2 ∂x n Σ y = DΣx DT , , (5) donde Σ y es la matriz de varianza covarianza de las incógnitas. ¡ ¢ ¡ ¢ Por ejemplo, siendo las funciones X x, y y Y x, y y conociendo los valores σ2x , σ2y y σx,y , la propagación de la incertidumbre resulta à σX 2 σ X ,Y σ2Y σ X ,Y ¶2 2 ∂Y = ∂x ¶2 σ X ,Y µ ∂X ∂y ∂Y ∂y ∂X ∂x = ∂Y ∂x ∂X ∂x σX 2 = σY ! ∂X ∂y ¶2 ∂Y + ∂y ¶2 σ2x + µ σ2x σx,y σx,y σy 2 à σy 2 + 2 ! ∂X ∂x ∂X ∂y ∂Y ∂x ∂Y ∂y ∂X ∂X σx,y , ∂x ∂y ∂Y ∂Y σx,y , ∂x ∂y µ ¶ ∂X ∂Y 2 ∂X ∂Y ∂X ∂Y ∂X ∂Y = σx + σy 2 + + σx,y . ∂x ∂x ∂y ∂y ∂x ∂y ∂y ∂x µ σ2x µ σy + 2 2 , Puede darse el caso y 1 = f 1 (x 1 , x 2 ) , y 2 = f 2 (x 1 , x 2 ) en el que y 1 , y 2 resulten correlacionadas, pero x 1 , x 2 tengan covarianza nula. Por ejemplo el acimut y la distancia a un punto observados con una estación total: P d α PE los valores de varianza y covarianza propagados al punto P están dados por ∂x à 2 ∂α σd ∂y 0 ∂α ∂x ∂d = ∂y ∂d à σx 2 σx,y σx,y σ2y ! σx 2 = µ ∂x ∂d ¶2 σy 2 = µ ∂y ∂d ¶2 σx,y = ∂x ∂d ∂x ∂α ! 0 σα 2 σ2d + µ ∂x ∂α ¶2 σ2d + µ ∂y ∂α ¶2 ∂y ∂d , ∂y ∂α σα 2 , σα 2 , ∂x ∂y 2 ∂x ∂y σ + σα 2 . ∂d ∂d d ∂α ∂α 2. Elipse de error sobre el plano La elipse de error indica una región donde está ubicado un punto con coordenadas planas asociada a un cierto nivel de confianza. Asumiendo la normalidad de las variables, la elipse de error estándar indica con una probabilidad del 39 %, aproximadamente, la posición del punto. El semieje mayor representa el desvío estándar máximo, el semieje menor el mínimo y la orientación de la elipse la correlación entre las variables. La función de dos variables aleatorias correladas con distribución normal conjunta sigue la distribución normal bivariada. El dibujo en dos dimensiones es similar a una campana y la proyección en los planos perpendiculares al plano XY dibujan la función de densidad de la distribución normal en una dimensión. La función de densidad de la distribución normal bivariada está dada por f x, y = ¡ 1 p ¢ 2πσx σ y 1 − ρ2 exp ½ −1 ·µ ¡ ¢ 2 1 − ρ2 x − µx σx ¶2 + µ y − µy ¶2 σy x − µx y − µ y − 2ρ · σx σy µ ¶¸¾ , (6) donde ρ es el coeficiente de correlación. Si deseamos construir únicamente la elipse, podemos asumir que la función de densidad está centrada en el origen, µx = µ y = 0, f x, y = ¡ ¢ 1 p 2πσx σ y 1 − ρ2 exp ½ −1 ¡ ¢ 2 1 − ρ2 3 ·µ x σx ¶2 y + σy µ ¶2 x y − 2ρ · σx σ y µ ¶¸¾ (7) Figura 1: Función de densidad de la distribución normal bivariada. ¡ ¢ Cada plano que corta f x, y a una altura determinada, por ejemplo h, dibuja una elipse que tiene dimensiones diferentes según la altura, pero igual orientación y proporción de los semiejes. Si tomamos un altura ¡ ¢ cualquiera, h = f x, y y separamos la parte de la ecuación que depende de x, y a la derecha y los valores constantes a la izquierda, h= 1 p 2πσx σ y 1 − ρ2 exp ½ −1 ¡ ¢ 2 1 − ρ2 ·µ x σx ¶2 + µ y σy ¶2 − 2ρ µ x y · σx σ y ¶¸¾ , ¶ µ ¶2 µ ¶¸¾ x 2 y x y + − 2ρ · , σx σy σx σ y 2 1 − ρ2 ·µ ¶−2 ¸ µ ¶2 µ ¶2 µ ¶ q ¢ ¡ x y x y = · , k = 1 − ρ 2 ln 2πσx σ y h 1 − ρ 2 + − 2ρ σx σy σx σ y 2πσx σ y h q 1 − ρ 2 = exp ½ ¡ −1 ·µ ¢ (8) cada valor de k determina una elipse de error igual en proporción pero con diferente escala. 2.1. Elipse de error asociada a un nivel de confianza ¡ ¢ Cuando k = 1 − ρ 2 se obtiene la elipse de error estándar. De acuerdo a lo expresado en (8) se cumple la siguiente relación para la elipse estándar: ¡ ¢ k = 1 − ρ 2 ln ·µ ¶−2 ¸ q ¡ ¢ = 1 − ρ2 , 2πσx σ y h 1 − ρ 2 4 ¡ ¢ ·µ ¶−2 ¸ q 1 − ρ2 ¡ ¢ ln 2πσx σ y h 1 − ρ 2 = 1. 1 − ρ2 Si llamamos 2 c = ln ·µ 2πσx σ y h q 1 − ρ2 ¶−2 ¸ , la constante c es el factor de escala asociado a un nivel de confianza que multiplica los semiejes de la elipse tomando como referencia la elipse estándar, ¡ ¢ 1 − ρ2 c 2 = µ x σx ¶2 y + σy µ ¶2 ¶ x y . − 2ρ · σx σ y µ Si únicamente interesa conocer el valor c, puedo asumir que las variables x, y tienen correlación ρ = 0 y por lo tanto c2 = µ x σx ¶2 + µ y σy ¶2 . (9) Consideramos ahora una variable u tal que u = c2 = µ x σx ¶2 + µ y σy ¶2 , (10) al ser una combinación lineal de variables normales al cuadrado con varianza igual a la unidad, u tiene ¡ ¢ una distribución χ2 con p = 2 grados de libertad, donde p son las dimensiones del espacio. Un punto x, y cualquiera se encuentra dentro de la elipse con probabilidad Pr (0 < u) = 1 − α si 0< µ x σx ¶2 + µ y σy ¶2 < u = c 2. El valor u está relacionado a la función de densidad de χ2 como ˆu 1 1 − α = Pr (0 < u) = p ¡ p ¢ 22 Γ 2 x ¡p 2 −1 ¢ x e− 2 dx, 0 u = χ21−α,p , c= q χ21−α,p . (11) 2 Note que cuando p = 1, u está relacionado con la distribución normal estándar siendo u = z 1−α . Cuando p = 2, el factor de escala c se puede calcular en forma directa. Partiendo de la función de densidad de χ2 , Pr (0 < u) = 1 Pr (0 < u) = 2 1 2Γ (1) ˆu 0 ˆu u u 0 e− 2 dx, 0 u u e− 2 dx = 1 − e− 2 . Dado un nivel de confianza 1 − α, podemos armar la ecuación exponencial que permite calcular u, u 1 − α = 1 − e− 2 , 5 (12) x0 y θ σ 0x σ 0y y0 σy σx x Figura 2: Elipse de error estándar. Note que los puntos definidos por los desvíos estándar σx y σ y caen por fuera de la elipse de error. u α = e− 2 , teniendo en cuenta (9) y (10), c= p −2 ln α (13) Por ejemplo, para un nivel de confianza del 95 %, α=0.05, c= p −2 ln 0.05, c = 2.4477 ≈ 2.5, siendo 2.5 el factor de escala que, aplicado a los semiejes de la elipse estándar, genera la elipse de error con una confianza del 95 %. 2.2. Cálculo de los semiejes de la elipse de error estándar En las secciones anteriores se describió la propagación de incertidumbres al calcular las coordenadas de un punto utilizando como datos observaciones. La propagación de incertidumbres da una cierta matriz de varianza covarianza de la cual obtenemos los datos para calcular los parámetros de la elipse de error estándar, Σ y = DΣx DT . ¡ ¢ En la Figura 2 el sistema de referencia asociado a un vector x 0 , y 0 de la elipse, es la rotación del vector ¡ ¢ x, y de tal forma que la covarianza entre x 0 e y 0 sea nula y x 0 esté asociado al semieje mayor de la elipse, à x0 y0 ! à = cos θ sen θ − sen θ cos θ 6 !à x y ! . Si calculamos la propagación de las incertidumbres en la fórmula anterior, los parámetros de la elipse de error se expresan como Σ0y = RΣ y RT , (14) donde R es la matriz de rotación que depende de la orientación de la elipse y Σ0y es la matriz diagonal que contiene los semiejes mayor y menor de la elipse, es decir à 2 σ0 x 0 0 σ0 y ! 2 à = cos θ sen θ − sen θ cos θ !à σ2x σx,y σx,y σ2y !à cos θ sen θ − sen θ cos θ ! . (15) La orientación θ en principio es desconocida, pero puede ser calculada resolviendo el producto de matrices, o bien sabiendo que la matriz Σ y es diagonalizable, mediante los valores y vectores propios de Σ y . Se describirán los dos métodos para encontrar los parámetros de la elipse de error estándar. 2.2.1. Cálculo de los parámetros de la elipse mediante autovalores y autovectores La matriz Σ y admite un polinomio característico cuyas raíces son los valores propios. Llamando λ a los autovalores de la matriz Σ y , el polinomio característico p (λ) se calcula como ¡ ¢ p (λ) = det Σ y − λI = 0, à det σ2x − λ σx,y ! σx,y σ2y − λ ´ ¡ ¢³ = σ2x − λ σ2y − λ − σ2x,y , p (λ) = σ2x · σ2y + λ2 − λσ2x − λσ2y − σ2x,y , ³ ´ ³ ´ λ2 − σ2x + σ2y λ + σ2x · σ2y − σ2x,y = 0. Resolviendo la ecuación de segundo grado, obtengo los autovalores λ1 y λ2 λ1 = ´ 1 1³ 2 σx + σ2y + 2 2 q¡ σ2x + σ2y ¢2 ¡ ¢ − 4 σ2x · σ2y − σ2x,y , (16) λ2 = ´ 1 1³ 2 σx + σ2y − 2 2 q¡ σ2x + σ2y ¢2 ¡ ¢ − 4 σ2x · σ2y − σ2x,y . (17) Al ser los valores propios los elementos de la diagonal de Σ0y , 0 σx2 = λ1 , 0 σ y2 = λ2 . Conociendo los valores propios, puedo calcular los vectores propios mediante el teorema de CayleyHamilton. Cada matriz cuadrada satisface su propio polinomio característico y por lo tanto (A − λ1 I) (A − λ2 I) · · · (A − λn I) = 0, luego, los vectores columna de (A − λ2 I )· · · (A − λn I ) son vectores propios de λ1 , los vectores columna de (A − λ1 I )(A − λ3 I )· · · (A − λn I ) son vectores propios de λ2 , etc. Nuestro caso es muy simple ya que debemos calcular los vectores propios de una matriz de 2 × 2: ¡ ¢¡ ¢ Σ y − λ1 I Σ y − λ2 I = 0, 7 à σ2x − λ1 σx,y !à σx,y σ2y − λ1 σ2x − λ2 σx,y σx,y σ2y − λ2 ! = 0, donde la primer columna de la matriz derecha es el vector propio de λ1 à σ2x − λ2 ! , σx,y (18) y la primer columna de la matriz izquierda es el vector propio de λ2 à σ2x − λ1 σx,y ! . (19) Conociendo el autovector asociado a λ1 , podemos calcular la orientación del semieje σ0x : cos θ σ2x − λ2 = , sen θ σx,y σx,y sen θ = tan θ = 2 , cos θ σx − λ2 o bien ¡ ¢ θ = arg σ2x − λ2 , σx,y , en Excel: ¡ ¢ θ = atan2 σ2x − λ2 , σx,y , y en Matlab: ¡ ¢ θ = atan2 σx,y , σ2x − λ2 . Resumen · ¸ ´ q¡ ¡ 2 2 ¢ ¢ 1 ³ 2 2 2 2 2 2 σx + σ y + σx = σx + σ y − 4 σx · σ y − σx,y . 2 ¸ · ´ q¡ ¡ ¢ ¢2 0 1 ³ 2 σx + σ2y − σ2x + σ2y − 4 σ2x · σ2y − σ2x,y . σ y2 = 2 ³ ´ 0 θ = arg σ2x − σ y2 , σx,y . 02 2.2.2. Cálculo de los parámetros de la elipse mediante las matrices de rotación Desarrollando la propagación de la incertidumbre en la rotación del sistema de coordenadas, Σ0x = RΣx RT , 8 (20) à 2 σ0 x 0 0 σ0 y 2 ! à = à = cos θ sen θ − sen θ cos θ !à σ2x σx,y σx,y σ2y σ2x cos θ + σx,y sen θ !à cos θ sen θ − sen θ cos θ σx,y cos θ + σ2y sen θ −σ2x sen θ + σx,y cos θ ! !à −σx,y sen θ + σ2y cos θ , cos θ sen θ − sen θ cos θ ! , ´ ¡ ¢ ³ σx,y cos2 θ − sen2 θ + σ2y − σ2x sen θ cos θ . σ2x sen2 θ − 2σx,y cos θ sen θ + σ2y cos2 θ σ2x cos2 θ + 2σx,y sen θ cos θ + σ2y sen2 θ ´ = ¡ ¢ ³ σx,y cos2 θ − sen2 θ + σ2y − σ2x sen θ cos θ Igualando los elementos de las partes izquierda y derecha, 2 σ0 x = σ2x cos2 θ + 2σx,y sen θ cos θ + σ2y sen2 θ, 2 σ0 y = σ2y cos2 θ − 2σx,y sen θ cos θ + σ2x sen2 θ, ³ ´ ¡ ¢ 0 = σ2y − σ2x sen θ cos θ + σx,y cos2 θ − sen2 θ . (21) A diferencia de la sección anterior, primero calculamos el valor de la orientación de la elipse θ resolviendo la tercera ecuación de (21). Sabiendo que sen θ cos θ = sen (2θ) , 2 cos2 θ − sen2 θ = cos (2θ) , y reemplazando estas identidades en la tercera ecuación de (21), ³ ´ sen (2θ) 0 = σ2y − σ2x + σx,y cos (2θ) , 2 ³ ´ tan (2θ) 0 = σ2y − σ2x + σx,y , 2 tan (2θ) = 2σx,y σ2x − σ2y . (22) Conociendo θ en función de los elementos de la matriz de varianza covarianza, desarrollamos la primer ecuación de (21). Siendo sen2 θ = 1 − cos (2θ) , 2 cos2 θ = 1 + cos (2θ) , 2 reemplazando en (21) 2 σ0 x = σ2x 1 + cos (2θ) 1 − cos (2θ) sen (2θ) , + 2σx,y + σ2y 2 2 2 ´ 1 1 sen (2θ) cos (2θ) ³ 2 2 σ0 x = σ2x + σ2y + 2σx,y + σx − σ2y , 2 2 2 2 · ´¸ 1 2 1 2 cos (2θ) sen (2θ) ³ 2 02 2 σ x = σx + σ y + 2σx,y + σx − σ y . 2 2 2 cos (2θ) De acuerdo con (22) podemos hacer las siguientes sustituciones: 2σx,y sen (2θ) = tan (2θ) = 2 , cos (2θ) σx − σ2y 2θ = arctan 9 2σx,y σ2x − σ2y , luego 2 2σ0 x à = σ2x Teniendo en cuenta que + σ2y + cos arctan 2σx,y σ2x − σ2y !" 2σx,y 2σx,y σ2x − σ2y # ³ ´ 2 2 + σx − σ y . 1 , cos arctan α = p 1 + α2 à ! " à !2 #−1/2 2σx,y 2σx,y cos arctan 2 = 1+ 2 , σx − σ2y σx − σ2y luego 2 2σ0 x " = σ2x + σ2y + 1+ à 2σx,y !2 #−1/2 " 2σx,y σ2x − σ2y 2σx,y σ2x − σ2y # ³ ´ 2 2 , + σx − σ y ³ −1/2 ´2 ³ ´2 σ2x − σ2y + 4σ2x,y 4σ2x,y + σ2x − σ2y 2 2σ0 x = σ2x + σ2y + , ¡ 2 ¢ 2 2 2 2 σ − σ σx − σ y x y ³ ´2 4σ2x,y + σ2x − σ2y 2 , 2σ0 x = σ2x + σ2y + q¡ ¢2 σ2x − σ2y + 4σ2x,y 2 2σ0 x = σ2x + σ2y + q ¡ ¢2 4σ2x,y + σ2x − σ2y . Utilizando la misma técnica, desarrollamos la segunda ecuación de (21) obteniendo 2 2σ0 y = σ2x + σ2y − q ¡ ¢2 4σ2x,y + σ2x − σ2y . Resumen µ ¶ q ¡ ¢2 1 2 σx + σ2y + 4σ2x,y + σ2x − σ2y . 2 µ ¶ q ¡ 2 ¢ 02 1 2 2 2 2 2 σ + σ y − 4σx,y + σx − σ y . σy = 2 x ³ ´ 1 θ = arg σ2x − σ2y , 2σx,y . 2 0 σx2 = (23) 2.3. Elipse de confianza La elipse de error asociada a un nivel de confianza es útil para saber si el error propagado en el cálculo de las coordenadas de un punto se encuentra dentro de una tolerancia establecida. La tolerancia, por lo general, se indica como un círculo cuyo radio se obtiene con la incertidumbre máxima permitida T y está relacionada a un cierto cierto nivel de confianza 1 − α. El criterio de precisión se cumple o no de acuerdo a si el semieje mayor de la elipse de error, escalado según lo expuesto en la sección 2.1, p. 6, es menor al radio T . Es decir, dado un cierto valor T en una medida lineal, la precisión obtenida en el trabajo está dentro de 10 tolerancia únicamente si 0 T < c · σx , siendo c la escala calculada con el nivel de confianza 1 − α de acuerdo a la fórmula (13). c ·σ0 c ·σ0 x y x y σ 0x σy σ 0x σy x x (a) La elipse de error está dentro de la tolerancia. (b) La elipse de error no está dentro de la tolerancia. Figura 3: Elipse asociada a un nivel de confianza y la tolerancia permitida. 2.4. Cálculo de la matriz de varianza covarianza a partir de los parámetros de la elipse de error Invirtiendo la rotación de (14) podemos calcular las varianzas y covarianzas asociadas al punto conociendo los parámetros de la elipse, Σ y = RT Σ0y R. Expandiendo (24) à ! à σ2x σx,y cos θ = 2 σx,y σy sen θ à = − sen θ 2 σ0 x cos θ 2 σ0 x senθ 2 !à cos θ 2 σ0 x 0 0 σ0 y 2 −σ0 y sen θ 2 σ0 y cos θ 2 σ0 x cos2 θ + σ0 y sen2 θ ´ = ³ 2 2 σ0 x − σ0 y cos θ sen θ 2 !à !à (24) cos θ sen θ − sen θ cos θ cos θ sen θ − sen θ cos θ ! , ! , ´ ³ 2 2 σ0 x − σ0 y cos θ sen θ . 2 2 σ0 y cos2 θ + σ0 x sen2 θ Igualando los elementos de las partes izquierda y derecha: 11 2 2 2 2 σ2x = σ0 x cos2 θ + σ0 y sen2 θ. σ2y = σ0 y cos2 θ + σ0 x sen2 θ. ³ ´ 2 2 σx,y = σ0 x − σ0 y cos θ sen θ. (25) 2.5. Recapitulación sobre el cálculo de los semiejes de la elipse de error estándar Como se ha visto, existen varios caminos para calcular los parámetros de la elipse de error. Si observamos las ecuaciones (16) y (17), se pueden expresar en forma más compacta como λ1 = q ´ 1³ tr Σ y + tr2 Σ y − 4 det Σ y , 2 λ2 = q ´ 1³ tr Σ y − tr2 Σ y − 4 det Σ y . 2 Llamaremos la parte discriminante de la ecuación como ∆λ = tr2 Σ y − 4 det Σ y . Tomamos ahora la tercera ecuación de (25): cos θ sen θ = σx,y σ0 2x − σ0 2y , donde el denominador es equivalente a la expresión 1 p λ1 − λ2 = 2 ∆λ , 2 recordando que cos θ sen θ = luego 1 sen (2θ) , 2 2σx,y sen (2θ) = p . ∆λ Resumen q p ∆λ = tr2 Σ y − 4 det Σ y . p ´ 1³ tr Σ y + ∆λ . 2 p ´ 02 1³ σ y = tr Σ y − ∆λ . 2 ³ p ´ 1 θ = arcsen 2σx,y / ∆λ . 2 0 σx2 = 12 (26) Otra forma compacta Comparando las fórmulas (18), (19) y (23), tenemos que tan θ = σx,y σ2x − λ2 tan (π/2 + θ) = , σx,y σ2x − λ1 , luego, podemos calcular los parámetros de la elipse de error estándar como θ= ³ ´ 1 arg σ2x − σ2y , 2σx,y , 2 si σx,y 6=0 0 σx2 = σ2x + σx,y tan θ, 0 σ y2 = σ2x − σx,y cot θ. (27) si σx,y =0 ³ ´ 0 σx2 = máx σ2x , σ2y , ³ ´ 0 σ y2 = mı́n σ2x , σ2y . Mediante la descomposición en valores singulares La descomposición en valores singulares de una matriz A es una factorización que genera una matriz diagonal y dos matrices ortogonales que representan los valores propios y vectores propios de A. Siguiendo la convención de funciones de Matlab, la factorización en valores singulares de Σ y se escribe como ¡ ¢ [U, S, V] = svd Σ y , donde S es la matriz diagonal de autovalores y U la matriz ortogonal de autovectores. La estructura de las matrices resultantes es diferente a lo expresado en (15), pero las siguientes fórmulas explícitas para matrices de 2 × 2 proporciona los parámetros de la elipse de error estándar: 0 σx2 = S (1, 1) . 0 σ y2 = S (2, 2) . θ = arctan (28) U (2, 1) . U (1, 1) 2.6. Elipse de error relativa a dos puntos Si consideramos una red topográfica o geodésica, es usual trabajar con vectores y es útil conocer la incertidumbre relativa a pares de puntos. Cuando tomamos un vector, la diferencia de coordenadas compensa en parte la incertidumbre relativa de ambos puntos si existe correlación positiva entre las coordenadas de los puntos 1 y 2. Esto es usual cuando se realizan levantamientos de redes geodésicas utilizando receptores 13 P1 P2 (a) Elipse de error relativa a P 1 y P 2 asumiendo que los puntos tienen correlación igual a cero. P1 P2 (b) Elipse de error relativa a P 1 y P 2 donde los puntos tienen correlación positiva entre sí. Figura 4: Elipse de error relativa a dos puntos. GPS en modo diferencial. En un sistema geocéntrico el vector tiene tres componentes, ∆X , ∆Y , ∆Z que deben ser transformados a un sistema local topocéntrico para separar la parte horizontal de la vertical. Asumimos que tenemos las coordenadas horizontales y los valores de incertidumbre de dos puntos P 1 y P 2 , la propagación del error de P 1 y P 2 al vector ∆1,2 describe la precisión relativa de los puntos y permite construir la elipse de error estándar asociada a ∆1,2 . Para calcular los parámetros de la elipse de error relativa seguimos lo descrito en Strang y Borre (1997, pp. 341–342). Los puntos P 1 y P 2 sobre el plano cartesiano definen el vector ∆x = x 2 − x 1 , ∆y = y 2 − y 1 , que puede ser expresado como el siguiente producto de matrices à ∆x ! à = ∆y −1 0 0 1 −1 0 x ! 1 0 y1 1 x2 y2 . (29) Aplicando la fórmula de propagación de errores (5) en (29) la matriz de varianza covarianza del vector ∆1,2 se escribe como Σ∆1,2 = h −I I i " Σ1 Σ1,2 ΣT1,2 Σ2 14 #" −I I # , (30) en forma explícita à Σ∆1,2 = σ2∆x σ∆x,∆y σ∆x,∆y σ2∆y ! à = −1 0 0 1 −1 0 σ2x1 ! 0 σx1 ,y 1 1 σx1 ,x2 σx1 ,y 2 −1 σx1 ,y 1 σx1 ,x2 σx1 ,y 2 σ2y 1 σ y 1 ,x2 σ y 1 ,y 2 0 σx2 ,y 2 1 2 σy2 0 σ y 1 ,x2 σ2x2 σ y 1 ,y 2 σx2 ,y 2 0 −1 , 0 1 de donde los valores de varianza y covarianza de ∆1,2 se calculan como σ2∆x = σ2x2 + σ2x1 − 2σx1 ,x2 . σ2∆y = σ2y 2 + σ2y 1 − 2σ y 1 ,y 2 . (31) σ∆x,∆y = σx1 ,y 1 + σx2 ,y 2 − σx1 ,y 2 − σx2 ,y 1 . Siguiendo lo desarrollado para la fórmula (23), los parámetros de la elipse de error relativa tienen la forma à ! r ³ ´2 1 2 2 2 2 2 σ + σ∆y + 4σ∆x,∆y + σ∆x − σ∆y σ∆x = . 2 ∆x à ! r ³ ´2 02 1 2 2 2 2 2 σ + σ∆y − 4σ∆x,∆y + σ∆x − σ∆y σ∆y = . 2 ∆x ³ ´ 1 θ = arg σ2∆x − σ2∆y , 2σ∆x,∆y . 2 02 (32) Según lo visto en (27), los parámetros también pueden ser escritos en forma compacta como θ= ³ ´ 1 arg σ2∆x − σ2∆y , 2σ∆x,∆y , 2 si σ∆x,∆y 6=0 0 2 σ∆x = σ2∆x + σ∆x,∆y tan θ, 0 2 σ∆y = σ2∆x − σ∆x,∆y cot θ. (33) si σ∆x,∆y =0 ³ ´ 02 σ∆x = máx σ2∆x , σ2∆y , ³ ´ 02 σ∆y = mı́n σ2∆x , σ2∆y . Dos elipses de error relativas están ilustradas en las Figuras 4a y 4b, note la diferencia de tamaño al variar la correlación entre P 1 y P 2 . La interpretación geométrica de la elipse de error relativa es diferente 15 x 0 y x 0 y 0 y 0 y σy σy x y y σx σ0 σx σ0 θ σ0 x σ0 θ x x (a) Elipse de error estándar y puntos determinados por σx y σ y . (b) Elipse y curva de error. Los puntos determinados por σx y σ y se encuentran sobre la curva de error o función soporte. Figura 5: Elipse de error y su función soporte. que la absoluta ya que no refleja la incertidumbre de una coordenada. Como veremos en la siguiente sección, la información relevante de la elipse de error relativa de una alineación formada por dos puntos, son los desvíos estándar de la distancia y la orientación relativa entre P 1 y P 2 . 2.7. La curva de error En la Figura 2 los valores σx y σ y exceden el radio de la elipse de error estándar en dirección a los ejes x e y. Como se puede observar en la Figura 5a, esto es aún más evidente cuando la orientación de la elipse θ es cercana a 45° y los semiejes menor y mayor son muy diferentes entre sí. Hasta aquí vimos a la elipse como una región de incertidumbre donde se encuentra un punto con un cierto nivel de confianza. Si deseamos conocer cuál es el desvío estándar en una dirección en particular, el mismo estará definido por la curva de error. Para encontrar la curva de error consideremos que en el centro de la elipse se encuentra el punto P 0 asociado a los valores de incertidumbre σx , σ y , σx,y y otro punto sin error, P ω , el cual se moverá alrededor de P 0 determinando con el eje x un cierto ángulo ω. Al variar ω, los puntos P 0 , P ω determinan una distancia d ω que está afectada por la incertidumbre propagada por P 0 la cual es independiente de d ω . Partiendo de la fórmula de distancia, dω = q ¡ ¢2 (x ω − x 0 )2 + y ω − y 0 , aplicando la fórmula de propagación de errores (4) σ2dω = σ2dω = (−1)2 µ xω − x0 dω ¶2 µ ∂d ω ∂x 0 ¶2 σ2x + σ2x + (−1)2 µ µ ∂d ω ∂y 0 ¶2 yω − y0 dω σ2y + 2 ¶2 ∂d ω ∂d ω σx,y , ∂x 0 ∂y 0 σ2y + 2 (−1)2 µ xω − x0 dω La posición de P ω es desconocida, pero siempre se cumple que cos ω = xω − x0 , dω sen ω = 16 yω − y0 , dω ¶µ ¶ yω − y0 σx,y . dω l · σα σl P1 P2 Figura 6: Elipse de error relativa con su función soporte. luego σdω = r ω = q cos2 ωσ2x + sen2 ωσ2y + 2 cos ω sen ωσx,y , (34) Tomando como fijo el punto P 0 , al variar el ángulo ω, r ω dibujará la curva de error que se conoce también como curva soporte de la elipse o curva pedal. Expresada en coordenadas polares x = r ω cos ω, y = r ω sen ω, (35) donde r ω depende de los valores constantes σx , σ y , σx,y y de ω, que varía entre (−π, π] . El dibujo de la curva se encuentra en la Figura 5b, los puntos definidos por σx y σ y forman parte de la curva de error. 2.8. La curva de error de la elipse relativa La función soporte de la elipse relativa en dirección al vector formado por los puntos P 1 y P 2 , determina la incertidumbre relativa en distancia. La función soporte, de la misma elipse, calculada a 90° de la dirección del vector, determina la incertidumbre del acimut relativo a los puntos. En la Figura 6 están ilustradas las incertidumbre relativas con los valores σl y l ·σα respectivamente. Siendo ω0 al ángulo que forma el vector con el eje x y teniendo en cuenta (34), los valores de desvío relativos se pueden calcular en forma directa, q ¡ ¢2 (x 2 − x 1 )2 + y 2 − y 1 , y2 − y1 , ω0 = arctan x2 − x1 q σl = cos2 ω0 σ2∆x + sen2 ω0 σ2∆y + 2 cos ω0 sen ω0 σ∆x,∆y , q l · σα = sen2 ω0 σ2∆x + cos2 ω0 σ2∆y − 2 cos ω0 sen ω0 σ∆x,∆y . l= (36) 2.9. Recapitulación sobre la elipse de error asociada a un nivel de confianza En la sección 2.1 calculamos un cierto factor de escala que, aplicado a los semiejes de la elipse de error, nos permite obtener la región de incertidumbre de la posición de un punto con un cierto nivel de confianza. 17 Conociendo los parámetros de incertidumbre poblacionales este valor de escala está relacionado a la distribución χ2 con dos grados de libertad representados por las dimensiones del espacio donde se encuentra la elipse. Hasta aquí trabajamos asumiendo que las variables se distribuyen en forma normal y se conocen los valores de varianza poblacional σ2 . Sin embargo esta es una suposición optimista ya que no conocemos los parámetros de dispersión poblacionales a menos que los grados de libertad de nuestro sistema sea un número grande. El factor de escala de una elipse de error calculada con las varianzas estimadas, está asociado a una distribución que permita modelar muestras pequeñas. En los problemas de ajuste por mínimos cuadrados se puede estimar la varianza por unidad de peso y la varianza de las incógnitas. Resolveremos un problema de tipo Ax = u + v, donde v es el vector de residuos, u el vector de términos independientes y A la matriz de diseño. Siguiendo los pasos bien conocidos para calcular el vector x, P = σ20 Σ−1 x , M = AT PA, x = M−1 AT Pu, v = Ax − u, σ̂20 = vT Pv , r donde σ20 es la varianza por unidad de peso a priori que podemos considerar igual a 1, Σx la matriz de varianza covarianza de las observaciones, σ̂20 la varianza de referencia a posteriori y r = n − rg A los grados de libertad siendo n la cantidad de filas de A. La varianza σ̂20 es un estimador insesgado de σ20 y la varianza de las incógnitas se puede calcular como Σ y = σ̂20 M−1 , luego Σ−1 y = M σ̂20 . Multiplicamos a izquierda y derecha por el vector x − µ, ¡ ¢T ¡ ¢ ¡ ¢T M ¡ ¢ x − µ Σ−1 x−µ , y x−µ = x−µ 2 σ̂0 (37) resultando la expresión de la elipse de error. Asumimos que la correlación entre las variables resulta nula y ³ ´T que µ = 0 0 estableciendo la equivalencia con la elipse (9). Ahora la parte izquierda de la ecuación ³ ´ ¡ ¢ (37) tiene la forma x 2 /σ2x + y 2 /σ2y y la parte derecha x 2 / σ̂20 s x2 + y 2 / σ̂20 s 2y donde s 2 es la varianza propa- gada. Multiplicamos el numerador por p/p siendo p la cantidad de parámetros o dimensiones del espacio y expandimos la fórmula del denominador, c 2 = xT Σ−1 y x= p · xT Mx/p vT Pv/r . (38) El término vT Pv tiene distribución χ2 con r grados de libertad (Leick, 2004, pp. 131–135) y el término xT Mx = x 2 /s x2 + y 2 /s 2y sigue una distribución χ2 con p = 2 grados de libertad como fue mencionado en la sección 2.1. La expresión (38) es el cociente de dos variables con distribución χ2 divididas por sus respecti- vos grados de libertad, por lo que sigue una distribución F de Snedecor con p y r grados de libertad. Luego, 18 puedo establecer la probabilidad de que un punto se encuentre dentro de la elipse del siguiente modo: 0< xT Σ−1 y x p c2 = F 1−α,p,r , p < (39) de donde el factor de escala asociado a un nivel de confianza 1 − α se calcula como c= q p · F 1−α,p,r . (40) 2 Cuando p = 1, el valor F 1−α,p,r está relacionado con la distribución t de Student siendo F 1−α,1,r = t 1−α,r . La función de densidad de la distribución F tiene la siguiente forma: ¡ ¢ f x, p, r = ³ p ´p/2 1 B p/2, r /2 ¡ r ¢ ³ p ´−(p/2+r /2) x (p/2−1) 1 + x . r En el caso que p = 2 el valor c puede ser calculado en forma directa. Partimos de la superficie de la función de densidad asociada a un nivel de confianza 1 − α, ˆs Pr (x < s) = 1 − α = f x, p, r = ¡ 0 ¢ ˆs µ 0 2s 1−α = 1− +1 r µ 2 1+ x r ¶−r /2 ¶−(1+r /2) dx, , 2s + 1, r ¢ r¡ = α−2/r − 1 , 2 α−2/r = s = F 1−α,p,r reemplazando en (40), c= q ¡ ¢ r α−2/r − 1 . (41) El valor de r es determinante en el escalado de la elipse y puede dar valores «pesimistas». Por ejemplo, si tomamos un grado de libertad y una confianza del 95 % c= p 0.05−2 − 1 = 19.97, que es un valor muy superior a c ≈ 2.5 obtenido en la sección 2.1 con el mismo nivel de confianza. En la práctica se suele utilizar el criterio seguido en 2.1 tomando como referencia la distribución χ2 . En muchos casos, cuando se exige una cierta tolerancia en la precisión de coordenadas obtenidas, se asume que el factor 2.5 corresponde a la escala de la elipse de error para el 95 % de confianza. Sin embargo, en trabajos donde la precisión es crítica, puede ser preferible tomar como referencia el factor de escala calculado en función de la distribución F de Snedecor. 3. Propagación de pesos Se la varianza por unidad de peso n X σ20 = i =1 p i (x i − x̄)2 n −1 19 , el peso de una medida se expresa como px = Teniendo en cuenta que σ2x = σ20 σ2x σ20 px . , σx1 ,x2 = ρ 1,2 σx1 σx2 , σ0 σ0 ·q , σx1 ,x2 = ρ 1,2 q p x1 p x2 y reemplazando los valores de varianza y covarianza en (3), σ20 py = n−1 n n µ ∂ f ¶2 σ2 X X X σ2 ∂f ∂f 0 +2 ρi , j q 0 p xi i =1 j =i +1 ∂x i ∂x j i =1 ∂x i p p xi . (42) xj En general Px = σ20 Σ−1 x , ¡ −1 T ¢−1 . P y = DPx D Referencias D OMINGO P RECIADO, Ana M. (1997). Apuntes de ajuste de observaciones. EUIT Topográfica. L EICK, Alfred (2004). GPS Satellite Surveying. Wiley, 3º edición. S TRANG, Gilbert, y Kai B ORRE (1997). Linear Algebra, Geodesy and GPS. Wellesley-Cambridge. 20 (43)