U ni versi dad Na cional de Cuy o Fa cul ta d de Inge nie r ía I n g e ni e r í a C i vil HIDROLOGIA I UNIDAD 9: ESTADÍSTICA APLICADA A LA HIDROLOGÍA Ing. Carlos D. SEGERER Ing. Esp. Rubén VILLODAS 2007 ÍNDICE DE TEMAS UNIDAD 9: ESTADÍSTICA APLICADA A LA HIDROLOGÍA ................................................................................ 9-1 TEMA 9.a: CONCEPTOS GENERALES .......................................................................................................... 9-1 9.a.1. IMPORTANCIA EN HIDROLOGÍA.................................................................................................. 9-1 9.a.2. CORRELACIÓN Y REGRESIÓN.................................................................................................... 9-2 9.a.2.i. Conceptos Generales ................................................................................................................ 9-2 9.a.2.ii. Regresión y Correlación Lineal.................................................................................................. 9-2 TEMA 9.b: TRATAMIENTO PROBABILÍSTICO DE LA INFORMACIÓN HIDROLÓGICA............................... 9-6 9.b.1. FUNCIONES DE FRECUENCIA Y PROBABILIDAD ..................................................................... 9-7 9.b.2. ANÁLISIS DE FRECUENCIA........................................................................................................ 9-14 9.b.3. TIEMPO DE RECURRENCIA O PERÍODO DE RETORNO ........................................................ 9-14 9.b.4. SERIES DE INFORMACIÓN HIDROLÓGICA .............................................................................. 9-16 TEMA 9.c: MÉTODOS ESTADÍSTICOS PARA ESTIMAR VALORES EXTREMOS ..................................... 9-19 9.c.1. PLANTEAMIENTO ........................................................................................................................ 9-19 9.c.2. DATOS A UTILIZAR...................................................................................................................... 9-19 9.c.3. LEYES DE DISTRIBUCIÓN DE VALORES EXTREMOS ............................................................ 9-20 9.c.3.i. Distribución de Gumbel............................................................................................................ 9-20 9.c.3.ii. Distribución Log-Pearson III..................................................................................................... 9-21 9.c.4. DETERMINACION DEL HIDROGRAMA DE LA CRECIDA DE DISEÑO. ................................... 9-21 9.c.5. GRÁFICAS DE PROBABILIDAD .................................................................................................. 9-22 9.c.5.i. Papel de Probabilidad .............................................................................................................. 9-22 9.c.5.ii. Posiciones de Graficación........................................................................................................ 9-23 ÍNDICE DE FIGURAS Figura 70. Situación Relativa de Rectas de Regresión......................................................................................... 9-2 Figura 71. Subconjuntos del Espacio Muestral (EM) ............................................................................................ 9-6 Figura 72. Diagramas de Registros Anuales y su Correspondiente Histograma de Frecuencias ........................ 9-8 Figura 73. Función de Frecuencia Relativa (Muestra) .......................................................................................... 9-9 Figura 74. Función de Frecuencia Acumulada (Muestra) ..................................................................................... 9-9 Figura 75. Función de Distribución de Probabilidad (Población) .......................................................................... 9-9 Figura 76. Función de Densidad de Probabilidad (Población) ............................................................................ 9-10 Figura 77. Funciones de Frecuencias y Probabilidad ......................................................................................... 9-11 Figura 78. Función de Densidad de Probabilidad Normal................................................................................... 9-12 Figura 79. Función de Densidad de Probabilidad Lognormal ............................................................................. 9-13 Figura 80. Función de Densidad de Probabilidad Gamma ................................................................................. 9-13 Figura 81. Intérvalos de Recurrencia “t” para Q ≥ 300 m³/s................................................................................ 9-15 Figura 82. Serie de Duración Completa – 74 años - 26 654 valores .................................................................. 9-16 Figura 83. Serie de Duración Parcial – 74 años - 652 valores mayores a 90 m³/s............................................. 9-17 Figura 84. Serie de Excedencia Anual – 74 años - 74 valores mayores a 134 m³/s .......................................... 9-17 Figura 85. Serie de Valores Extremos Anual – 74 años – 74 valores, los máximos de cada año...................... 9-18 Figura 86. Determinación del Hidrograma de una Crecida de Recurrencia Tr ................................................... 9-22 ÍNDICE DE CUADROS Cuadro 13: Rango Aplicabilidad del Coeficiente de Correlación ............................................................................ 9-5 Cuadro 14: Dimensiones y Rangos de la Funciones de Frecuencia y Probabilidad ............................................ 9-12 Unidad 9 9-1 UNIDAD 9: ESTADÍSTICA APLICADA A LA HIDROLOGÍA TEMA 9.a: CONCEPTOS GENERALES En el campo de la investigación científica es común la inquietud por intentar expresar la evolución de un determinado fenómeno mediante una serie de medidas, que la traduzcan al lenguaje de los números. Al transcurrir el tiempo, el investigador tropieza con la dificultad de encontrarse en posesión de una gran cantidad de datos que, perdida su actualidad, serán de muy poco provecho si no son sometidos a un tratamiento adecuado. La estadística se constituye entonces en una herramienta indispensable para efectuar este tratamiento, a fin de obtener la máxima utilidad en las aplicaciones prácticas a partir de los registros de diverso tipo de que se dispone (en especial caudales y precipitaciones). Son numerosas las definiciones de Estadística, no correspondiendo aquí presentar su nómina ni elegir una que resulte idónea. Sí en cambio, conviene distinguir dos ramas que han evolucionado en forma separada: a) Estadística Descriptiva Es la que intenta obtener toda la información posible de los datos recogidos, mediante su adecuado ordenamiento. Son producto de ella las clasificaciones de datos en forma de tablas, procesamiento y archivo mediante programas de computación, etc. b) Estadística Matemática Pretende ir más lejos, basándose en comparaciones del fenómeno con modelos probabilísticos teóricos, a fin de obtener una información que no resulta evidente con el simple ordenamiento de los datos. En este campo se ha desarrollado una teoría matemática, a veces muy compleja, basada en la Teoría de Probabilidades, de la que la Estadística Matemática puede considerarse como una aplicación práctica. 9.a.1. IMPORTANCIA EN HIDROLOGÍA Los dos conceptos expuestos en el apartado anterior son de importante aplicación en el campo de la Hidrología, sobre todo la de superficie, por corresponder a ella los ciclos más rápidos de circulación del agua. La mayoría de las causas que actúan en los ciclos hidrológicos superficiales son de carácter meteorológico y la propia Meteorología se desarrolla fundamentalmente a través de la Estadística, ya que es muy difícil llegar a un estudio matemático y preciso de los problemas físicos que condicionan los fenómenos hidrológicos. Sin embargo, como los caudales de los ríos y sus cauces constituyen un complejo, menos complicado y amplio, que la atmósfera, es más fácil y viable estudiar estadísticamente los ríos a través de sus estaciones de aforo, al menos en los cursos principales. Por tanto, la Meteorología y su estadística aplicada se utilizan para extrapolar donde los aforos no pueden alcanzar, por tratarse de ríos pequeños para los que no puede pretenderse que cada uno tenga su propia estación de aforo, o para ampliar la extensión de las series, puesto que normalmente es más antigua la estadística meteorológica que la de aforos. La recopilación de datos hidrológicos, y su ordenamiento estadístico, tienen como fin práctico su aplicación para dimensionar, con el mayor acierto posible, las obras que han de utilizar los recursos hídricos (embalses, presas, captaciones, obras de conducción, centrales hidroeléctricas, etc.) y prever el régimen de explotación, de manera que se obtenga el mayor beneficio posible de las instalaciones construidas. Se supone siempre que, en el futuro, el régimen hidrológico de un río tendrá cierta relación con el pasado y se procura obtener, del conocimiento de la estadística de caudales, referencias para prever dentro de ciertos márgenes de seguridad, el régimen de caudales que pueda presentare en el futuro. Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-2 9.a.2. CORRELACIÓN Y REGRESIÓN 9.a.2.i. Conceptos Generales En la mayor parte de los estudios estadísticos se presenta el problema de predecir los valores que puede tomar una determinada variable. El planteo del método de solución puede realizarse de varias formas. En ocasiones se trata de completar, o de ampliar, una serie de datos de la “variable problema” a partir de series de datos de una, o más, variables que estén relacionadas con aquélla de alguna manera. En otras palabras, se trata simplemente de conseguir un cierto conocimiento sobre los factores que influyen en el valor de la “variable problema”, con el fin de poder realizar hipótesis adecuadas sobre sus valores desconocidos. Estos dos aspectos son tratados por la correlación y la regresión, respectivamente. Es importante destacar el hecho de que la aplicación de ambos métodos no proporciona por sí misma ninguna información del tipo causa-efecto, ya que los resultados expresan únicamente relaciones numéricas entre las variables estudiadas. Sin embargo, a partir de estas relaciones se puede llegar a conclusiones de aquél tipo, por lo que la finalidad primordial de estos métodos es averiguar los grupos de variables que pueden estudiarse conjuntamente y hallarse interrelacionadas. La diferencia entre regresión y correlación puede aclararse mediante las siguientes consideraciones: 9 un problema de regresión considera la distribución de frecuencias de una variable (dependiente), cuando ésta u otras variables (independientes) se suponen conocidas. 9 un problema de correlación, por su parte, considera la variación conjunta de dos variables sin que se apliquen restricciones a ninguna de ellas. Por tanto, la correlación obtiene el grado de afinidad entre dos variables, representado numéricamente por el coeficiente de correlación “ρ”, mientras que la regresión obtiene una ecuación “ y = f(x ) ” que permite calcular valores de la variable dependiente “y” a partir de la independiente “x”. 9.a.2.ii. Regresión y Correlación Lineal Es la teoría que estudia la relación lineal que existe entre dos variables, despreciando toda posible influencia de otras variables distintas. Planteamiento Teórico Dado un conjunto de pares de valores correspondientes a dos variables “x” e “y”, la ley más sencilla de regresión o correlación entre ambas es la lineal: Figura 70. Situación Relativa de Rectas de Regresión 22.00 17.60 x sobre y ortogonal 13.20 y y sobre x 8.80 4.40 0.00 0 Universidad Nacional de Cuyo 4.4 8.8 x 13.2 Facultad de Ingeniería 17.6 22 Cátedra: Hidrología I Unidad 9 9-3 y =a+m*x /176/ La recta debe ser tal que el momento de segundo orden de la masa de puntos del plano “xy”, con respecto a la misma, sea mínimo, es decir que debe serlo la suma de los cuadrados de las distancias de tales puntos a la recta. Esta condición permitirá determinar los parámetros “m” y “n” de la ecuación de la recta, con sólo obtener las derivadas parciales de dicha suma respecto ambos parámetros e igualarlas a cero. Ahora bien, pueden considerase tres casos: i. que se midan las distancias de los puntos a la recta paralelamente al eje de las “y” (regresión lineal de “y” sobre “x”) ii. paralelamente al eje de las “x” (regresión lineal de “x” sobre “y”) iii. o perpendicularmente a la propia recta (regresión ortogonal) Los momentos de inercia mínimos serán respectivamente Iy , Ix , e I0 . De estos casos se tratará únicamente el tercero, por ser el de mayor aplicación práctica, prescindiendo de las demostraciones matemáticas inherentes, por la complejidad que las mismas presentan. Parámetros a Utilizar Valor Medio El valor medio o esperanza matemática de una variable aleatoria es el centro de gravedad de la masa de distribución. En la correlación lineal, los valores medios de las variables “x” e “y”, están dadas por: n ∑ xi i =1 x= /177/ n n ; y= ∑ yi i =1 n Varianza y Covarianza La varianza se define como el momento de inercia de la masa de distribución, siendo la covarianza el momento centrífugo. La varianza en “x” e “y” será: n /178/ y la covarianza: σ 2x = ∑ (xi − x ) n 2 i =1 n ; σ 2y = ∑ (yi − y ) 2 i =1 n n /179/ σ xy = ∑ (xi − x ) * (yi − y ) i =1 n Desviación Típica La desviación típica o desviación standard o desvío medio cuadrático, se lo define como la raíz cuadrada positiva de la varianza: Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-4 n n 2 ∑ (xi − x ) σ x = + σ 2x = ; σ y = + σ 2y = i =1 n ∑ (yi − y ) 2 i =1 n /180/ En general, a mayor varianza, o mayor desviación standard, corresponde mayor dispersión de la variable en la respectiva distribución. Correlación y Regresión Ortogonal Para obtener la ecuación de la recta respecto a la cual la suma de las distancias de cada punto de coordenadas x i e y i sea mínima, se aplica el Método de los Mínimos Cuadrados, llegándose a una ecuación de segundo grado, la que permite obtener dos raíces que verifican la relación λ 2 > λ1 > 0 . La ecuación de segundo grado es: ( ) ( ) ± [− (σ ) λ2 − σ 2x + σ 2y * λ + σ 2x * σ 2y − σ 2xy = 0 λ1,2 (σ = 2 x + σ 2y 2 x + σ 2y )] 2 ( − 4 * σ 2x * σ 2y − σ 2xy ) 2 λ 2 > λ1 > 0 /181/ Para determinar el coeficiente angular de la recta se aplica: σ xy m= λ 2 − σ 2y /182/ En consecuencia la ecuación de la recta de regresión ortogonal resulta: y − y = m * (x − x ) = σ xy λ 2 − σ 2y * (x − x ) /183/ A partir de esta ecuación puede derivarse la ecuación de la recta en la forma /176/, que resulta más práctica para su aplicación posterior: y= σ xy λ2 − a=y− /184/ σ 2y * (x − x ) + y = y − σ xy λ2 − σ 2y *x ; m= σ xy λ2 − σ 2y *x+ σ xy λ 2 − σ 2y *x σ xy λ 2 − σ 2y y =a+m*x Coeficiente de Correlación Al efectuar el desarrollo de las regresiones lineales de “y” sobre “x” y de “x” sobre “y”, los coeficientes angulares de las rectas resultantes (a los que se denomina coeficientes de regresión), están dados respectivamente por: /185/ ρ yx = σ xy σ 2x ; ρ xy = σ xy σ 2y A la media geométrica de ambos coeficientes de regresión se la denomina Coeficiente de Correlación de las dos variables y se lo representa por “ ρ ” o “r”. Su expresión es: Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-5 r = ρ = ρ yx * ρ xy = σ xy σ 2x /186/ Sus valores están comprendidos en el intervalo (-1, +1). * σ xy σ2y = σ xy σ2x * σ2y Además, cuanto más se aproxime ρ a la unidad, menor será el valor de los momentos de inercia Ix e Iy . En particular, para ρ = 1, resulta Ix = Iy = 0 , lo que significa que toda la masa se encuentra sobre una recta, en la que se han confundido también las rectas de regresión. El Coeficiente de Correlación se utiliza para determinar el grado de dependencia lineal que existe entre las dos variables, y mide, en cierto modo, la bondad del ajuste de los puntos a una recta. En la utilización práctica de las rectas de regresión para generar valores no registrados o comletar series de datos históricos, si se designa por “n” al número de años (o de datos) registrados en la sección o región a estudiar y “N” al correspondiente a la sección o región base, la extrapolación podrá ser valedera, o no, según los valores correspondientes de “ρ”, de acuerdo al siguiente criterio: Cuadro 13: Rango Aplicabilidad del Coeficiente de Correlación n/N Coeficiente de Correlación Excelente Bueno Sin significado 20/30 0.99 0.85 <0.70 15/30 0.99 0.87 <0.77 10/30 0.99 0.90 <0.85 5/30 0.99 0.95 <0.90 Banda Característica Suponiendo que la distribución de frecuencias de las desviaciones del conjunto de los puntos respecto a la recta de regresión ortogonal fuese normal, el 95% de los puntos de la nube estaría ubicado en el interior de una banda obtenida trazando sendas paralelas a la recta de regresión a una distancia 2 * λ1 . De esta forma, aunque la hipótesis de distribución normal no es muy rigurosa, el trazado de la banda en el gráfico de correlación brinda una idea de la calidad de ésta y permite estimar, en una primera aproximación, los valores no ajustados. Otros Tipos de Correlación En algunos casos de correlaciones entre caudales de diversas cuencas, o entre caudales y precipitaciones, la correlación lineal no brinda suficiente precisión, resultando necesario recurrir a alguna ley de correlación con más parámetros, tal como por ejemplo la parabólica. Por ejemplo para determinar la curva de gastos de una estación de aforo (caudales-alturas), no se podría emplear una recta. En estas circunstancias, la ley de regresión podría expresarse en la forma: /187/ y = a + b * x + k * x2 + j * x3 + K La determinación de los coeficientes “a”, “b”, “c”, etc. se debe hacer de modo que mínimo respecto a ellos. ∑ (yi − y ) 2 sea un Es también posible, sin aumentar el número de parámetros, buscar leyes no lineales que se adapten mejor que las leyes de regresión lineal a la relación entre los parámetros observados, tales como por ejemplo la logarítmica, doble logarítmica, exponencial, etc. Es posible transformar muchas de estas leyes en lineales, mediante un cambio de variable, y después, operar gráfica, o numéricamente, como si se tratase de una recurrencia lineal. Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-6 Correlaciones Gráficas Consisten en representar directamente la nube de puntos referida a un sistema de ejes, en escala natural, semilogarítmica o logarítmica; y determinar luego, en forma gráfica y a estima, la curva que representa la tendencia media de la nube de puntos. Aparte de constituir un método en sí, representa un auxiliar inestimable de las correlaciones analíticas, al permitir visualizar la tendencia y orientar la elección de la función que permita lograr el ajuste más adecuado. Las correlaciones gráficas son también de suma utilidad para el caso de tener que representar relaciones entre tres variables. TEMA 9.b:TRATAMIENTO PROBABILÍSTICO DE LA INFORMACIÓN HIDROLÓGICA Consideraremos que la variable aleatoria “X” es una variable descripta por una “distribución de probabilidad” y ésta determina la posibilidad de que una observación “x” de la variable “X”, caiga en un rango preestablecido de “X”. Por ejemplo, si “X” es la “precipitación anual” en un lugar determinado, entonces la “distribución de probabilidad de X” determina la posibilidad de que la precipitación anual observada en una año dado, “ xi ”, caiga en un rango definido, tal como “menos de 200 mm”, o “entre 200 y 250 mm” y sucesivamente. Un conjunto de observaciones x1, x 2 , x 3 ,K, x n de la variable aleatoria “X” se denomina una muestra. Se supone que las muestras son sacadas de una hipotética población infinita que posee propiedades estadísticas constantes, mientras que las propiedades de una muestra pueden variar de una muestra a otra. El conjunto de todas las muestras posibles que pueden extraerse de una población se conoce como el espacio muestral “EM”, y un evento es un subconjunto del espacio muestral: Figura 71. Subconjuntos del Espacio Muestral (EM) Por ejemplo, el espacio muestral para la precipitación anual es teóricamente el rango desde cero hasta infinito positivo (a pesar que los límites prácticos inferior y superior son más cercanos) y un evento A puede ser la ocurrencia de una precipitación anual menor que una cierta cantidad, tal como 200 mm. La probabilidad de un evento, P(A ) , es la posibilidad de que éste ocurra cuando se hace una observación de la variable aleatoria. Las probabilidades de eventos pueden estimarse. Si una muestra de “n” observaciones, tiene “ n A ” n valores en el rango de evento “A”, entonces la “frecuencia relativa” de A es A . A medida que el n tamaño de la muestra aumenta, la frecuencia relativa se convierte progresivamente en una mejor estimación de la probabilidad del evento, es decir: P(A ) = lim n→∞ nA n /188/ Tales probabilidades se conocen como probabilidades objetivas o posteriores, debido a que dependen concretamente de las observaciones de la variable aleatoria. Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-7 Cuando se estima la posibilidad de que un evento futuro ocurrirá con base al juicio personal y la experiencia, las estimaciones pertinentes se conocen como probabilidades subjetivas o a priori. Las probabilidades de eventos obedecen a ciertos principios, a saber: a) Probabilidad Total Si el espacio muestral EM está completamente dividido en m eventos o áreas no traslapadas A 1, A 2 , A 3 ,K, A m entonces: P(A 1 ) + P(A 2 ) + P(A 3 ) + K + P(A m ) = P(EM) = 1 /189/ b) Complementariedad Como consecuencia de lo anterior, si A es el complemento de A, es decir que A = EM − A , entonces: P(A ) = 1 − P(A ) /190/ c) Probabilidad Condicional Supóngase que existen dos eventos “A” y “B” tal como se muestra en la Figura 71: A evento que la precipitación de este año fuera menor de 200 mm B evento de que la precipitación del próximo año fuese menor de 200 mm A IB evento de que tanto A como B ocurran, es decir, dos años sucesivos con precipitación anual menor de 200 mm P(B A ) es la probabilidad condicional de que ocurra B dado que ya ha ocurrido A Entonces la probabilidad conjunta P(A I B ) es: P(A I B ) = P(A ) * P(B A ) /191/ ⇒ P(B A ) = P(A I B ) P(A ) Si la ocurrencia de B no depende de la ocurrencia de A, se dice que los eventos son independientes y: /192/ P(B A ) = P(B ) ; P(A I B ) = P(A ) * P(B ) Si para el ejemplo anteriormente citado, los eventos de precipitación son independientes de un año a otro, entonces la probabilidad de que la precipitación sea menor de 200 mm en dos años consecutivos es simplemente el cuadrado de la probabilidad de que la precipitación anual en un solo año sea menor de tal valor. El concepto de eventos u observaciones independientes es fundamental para la interpretación estadística correcta de secuencias de información hidrológica, porque en tales casos dicha, información puede ser analizada sin tener en cuenta su orden de ocurrencia. Si observaciones sucesivas están correlacionadas, es decir que no son independientes, los métodos estadísticos requeridos son más complejos, debido a que la probabilidad conjunta P(A I B ) ≠ P(A ) * P(B ) . Las probabilidades estimadas utilizando información de muestra, son aproximadas, debido a que dependen de valores específicos de las observaciones en una muestra de tamaño limitado. Una alternativa, para superar este inconveniente es ajustar una función de distribución de probabilidad a la información y luego determinar las probabilidades de los eventos utilizando esta función de distribución. 9.b.1.FUNCIONES DE FRECUENCIA Y PROBABILIDAD Si las observaciones de una muestra están idénticamente distribuidas (cada valor de la muestra extraído de la misma distribución de probabilidad), éstas pueden ordenarse para formar un “histograma de frecuencia”, Figura 72, según los siguientes pasos: Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-8 i) el rango factible de la variable aleatoria se divide en intervalos discretos ii) se cuenta el número de observaciones que cae en cada uno de los intervalos iii) se dibuja como un gráfico de barras El ancho Δx del intervalo utilizado para construir el histograma de frecuencia se escoge tan pequeño como sea posible y de manera tal que caigan suficientes observaciones dentro de cada uno de los intervalos a fin que el histograma tenga una variación razonablemente suave en el rango de la información. Figura 72. Diagramas de Registros Anuales y su Correspondiente Histograma de Frecuencias 500-525 450-475 Precipitación [ mm ] 400-425 350-375 300-325 250-275 200-225 150-175 100-125 50-75 0 04-05 00-01 96-97 92-93 88-89 84-85 80-81 76-77 72-73 68-69 64-65 0-25 60-61 Precipitación [ mm ] Precipitación Anual - La Consulta (San Carlos) 550 525 500 475 450 425 400 375 350 325 300 275 250 225 200 175 150 125 100 75 50 25 0 1 2 3 4 5 6 Cantidad de Datos Años Si el número de observaciones “ ni ” en el intervalo “i”, que cubre el rango [x i − Δx , x i ] , se divide por el número total de observaciones “n”, el resultado se conoce como la Función de Frecuencia Relativa “ fm (x ) ” (Figura 73) y es igual a: fm (x ) = ni n /193/ Recordando la /188/, se verifica que la ecuación anterior es una estimación del valor de P(x i − Δx ≤ X ≤ x i ) , o sea, la probabilidad de que la variable aleatoria X caiga en el intervalo [x i − Δx , x i ] . El subíndice “m” indica que la función se calcula utilizando información de la muestra. La suma de los valores de las frecuencias relativas hasta un punto dado es la Función de Frecuencia Acumulada “ Fm (x ) ” (Figura 74) definida como: Fm (x ) = i i n ∑ ( ) ∑ nj fm x j = j=1 j=1 /194/ Esta expresión constituye una estimación de P(X ≤ x i ) , o sea la probabilidad acumulada de x i . Las funciones de frecuencia relativa y de frecuencia acumulada han sido definidas para una muestra; las funciones correspondientes para la “población” se aproximan como límites a medida que n → ∞ y Δx → 0 . Por su parte, la Función de Frecuencia Acumulada se convierte, cuando corresponde a la población y no a la muestra, en la Función de Distribución de Probabilidad “ F(x ) ” (Figura 75) dada por: F(x ) = lim Fm (x ) /195/ Universidad Nacional de Cuyo n→∞ Δx →0 Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-9 Figura 73. Función de Frecuencia Relativa (Muestra) 14% 12% 10% 8% fm(x) 6% 4% 2% 525-550 500-525 475-500 450-475 425-450 400-425 375-400 350-375 325-350 300-325 275-300 250-275 225-250 200-225 175-200 150-175 125-150 100-125 50-75 75-100 0-25 25-50 0% Precipitación [ mm ] Figura 74. Función de Frecuencia Acumulada (Muestra) 100% 90% 80% 70% 60% Fm(x) 50% 40% 30% 20% 10% 525-550 500-525 475-500 450-475 425-450 400-425 375-400 350-375 325-350 300-325 275-300 250-275 225-250 200-225 175-200 150-175 125-150 75-100 100-125 50-75 25-50 0-25 0% Precipitación [ mm ] Figura 75. Función de Distribución de Probabilidad (Población) 100% 90% 80% 70% 60% F(x) 50% 40% 30% 20% 10% 0% 0 25 50 75 100 100 125 150 175 200 200 225 250 275 300 300 325 350 375 400 400 425 450 475 500 500 525 550 Precipitación [ mm ] Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-10 En el límite, la función de frecuencia relativa dividida por el intervalo de longitud Δx se convierte en la Función de Densidad de Probabilidad “ f (x ) ”, expresada con la siguiente fórmula: f (x ) = lim /196/ n→∞ Δx → 0 fm (x ) Δx Es obvio que la derivada de la curva de Función de Distribución de Probabilidad, es la Función de Densidad de Probabilidad: dF(x ) f (x ) = lim m n→∞ dx Δx Δx → 0 f (x ) = /197/ Figura 76. Función de Densidad de Probabilidad (Población) 14% 12% 10% 8% f(x) 6% 4% 2% 550 500 525 500 475 450 400 425 400 375 300 350 325 300 275 250 200 225 200 175 150 100 125 100 75 50 0 25 0% Precipitación [ mm ] Para un valor dado de x, F(x ) es la probabilidad acumulada P(X ≤ x ) , y puede expresarse como la integral de la Función de Densidad de Probabilidad en el rango [X ≤ x ] , usando una variable de integración auxiliar “u”: F(x ) = P(X ≤ x ) = /198/ ∫− ∞ f (u) * du x Desde el punto de vista de ajuste de la información de la muestra a una distribución teórica, las cuatro funciones: 9 Frecuencia Relativa fm (x ) para la muestra 9 Frecuencia Acumulada Fm (x ) para la muestra, 9 Distribución de Probabilidad F(x ) para la población 9 Densidad de Probabilidad f (x ) para la población Estas pueden ordenarse en un ciclo: Comenzando por la parte superior izquierda, tenemos: a) la Función de Frecuencia Relativa se calcula utilizando los datos de la muestra divididos en intervalos b) los valores acumulados permiten formar la Función de Frecuencia Acumuladas Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-11 c) La Función de Distribución de Probabilidad es el limite teórico de la Función de Frecuencia Acumulada a medida que el tamaño de la muestra se vuelve infinitamente grande y el intervalo de la información infinitamente pequeño d) La Función de Densidad de Probabilidad es el valor de la pendiente de la función de distribución para un valor específico de x Figura 77. Funciones de Frecuencias y Probabilidad5 El ciclo puede cerrarse calculando un valor teórico de la Función de Frecuencia Relativa, denominado la Función de Probabilidad Incrementada “ p(x i ) “, como: 5 Extraído de Ven Te Chow. Los subíndices “s” corresponden a los “m” de éste apunte, para las “muestras”. Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-12 p(x i ) = P(x i − Δx ≤ X ≤ x ) p(x i ) = ∫ xi p(x i ) = ∫ xi x i − Δx −∞ f (x ) * dx f (x ) * dx − ∫ x i − Δx −∞ f (x ) * dx = p(x i ) = F(x i ) − F(x i − Δx ) p(x i ) = F(x i ) − F(x i−1 ) /199/ La comparación entre p(x i ) y la función de frecuencia relativa observada fm (x ) para cada x i puede utilizarse como una medida del grado de ajuste de la distribución a la información. Los rangos de variación y dimensiones de las cuatro funciones son: Cuadro 14: Dimensiones y Rangos de la Funciones de Frecuencia y Probabilidad Función Aplicable a Dimensión Rango de Variación Frecuencia Relativa fm (x ) la muestra Adimensional [0,1] Frecuencia Acumulada Fm (x ) la muestra Adimensional [0,1] Distribución de Probabilidad F(x ) la población Adimensional [0,1] Densidad de Probabilidad f (x ) la población X −1 [0,∞] Una de las más conocidas unciones de densidad de probabilidad es la Distribución Normal o Campana de Gauss, que se define como: f (x ) = /200/ donde: σyμ 1 2* π *σ *e − (x −μ )2 2* σ 2 son parámetros de cálculo La precipitación anual, calculada como la suma de los efectos de muchos eventos independientes, tiende a seguir una distribución normal. Figura 78. Función de Densidad de Probabilidad Normal Tiene limitaciones importantes, como que varía en un rango continuo [− ∞, ∞ ] , mientras que la mayoría de las variables hidrológicas son no negativas; y que es simétrica con respecto a la media, mientras que la información hidrológica tiende a ser asimétrica. Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-13 Otras funciones de Densidad de Probabilidad aplicables a las variables hidrológicas son: Distribución Lognormal Si la variable “ Y = log(X ) ” está normalmente distribuida, entonces se dice que X está distribuida en forma lognormal. Figura 79. Función de Densidad de Probabilidad Lognormal Esta función es útil cuando se quiere representar variables hidrológicas asimétricas. Tiene la ventaja, sobre la normal, en que está limitada a valores positivos de X y la transformación a logaritmos tiende a reducir la asimetría positiva, común en las variables hidrológicas. Distribución Exponencial Es una distribución que tiene un único parámetro λ. Se utiliza para describir el tiempo entre la ocurrencia de dos eventos de variables aleatorias, como por ejemplo, precipitaciones, entradas de contaminantes a un río, etc., y en este caso, λ sería la tasa media de ocurrencia de los eventos. Tiene la desventaja de que requiere que la ocurrencia de cada evento sea completamente independiente de sus vecinos y de que no está definida para X=0. La función de densidad de probabilidad es: f (x ) = λ * e − λ * x → x > 0 /201/ Distribución Gamma Es una distribución de 2 parámetros, uno de forma β y otro de escala λ. Tiene una forma que varía suavemente y se usa para describir variables hidrológicas asimétricas, sin usar logaritmos. Figura 80. Función de Densidad de Probabilidad Gamma Tiene límite inferior igual a 0, lo cual es una desventaja cuando se usa para analizar variables que tienen un límite superior mayor a 0. La función de densidad de probabilidad es: Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-14 f (x ) = /202/ λβ * x β−1 * e − λ * x →x>0 Γ(β ) Distribución Pearson Tipo III Es una distribución gamma de 3 parámetros (λ,β,ε), siendo éste último el límite inferior. Se usa para describir la probabilidad de avenidas máximas anuales. Es una distribución muy flexible, que puede asumir diferentes formas a medida que los parámetros varían. La función de densidad de probabilidad es: f (x ) = /203/ λβ * (x − ε ) * e − λ *(x −ε ) →x≥ε Γ(β ) β −1 9.b.2.ANÁLISIS DE FRECUENCIA Los sistemas hidrológicos son afectados en ocasiones por eventos extremos, tales como tormentas severas, crecidas y sequías. La magnitud de un evento extremo está inversamente relacionada con su frecuencia de ocurrencia, es decir, eventos muy severos ocurren con menor frecuencia, que eventos más moderados. El objetivo del análisis de frecuencia de información hidrológica es, relacionar la magnitud de los eventos extremos con su frecuencia de ocurrencia, mediante el uso de “Funciones de Distribución de Probabilidad”. Los requisitos que debe cumplir la información hidrológica (eventos extremos) es que: 9 debe ser independiente 9 está idénticamente distribuida (por ejemplo, precipitación diaria máxima anual) 9 el sistema hidrológico que la produce (por ejemplo, un sistema de tormenta) sea aleatorio, independiente del espacio y del tiempo La información hidrológica empleada debe ser seleccionada cuidadosamente, de manera tal que se satisfagan las suposiciones de independencia y de distribución idéntica. En la práctica, esto se lleva a cabo usualmente seleccionando el máximo anual de la variable bajo análisis (por ejemplo, el caudal máximo anual, que puede corresponder al flujo pico instantáneo máximo o al medio diario máximo, que se haya producido en cualquier momento o en cualquier día durante el aforo) con la expectativa de que observaciones sucesivas de esta variable de un año a otro sean independientes. Los resultados del análisis de frecuencia de los caudales de crecida pueden utilizarse para muchos propósitos en ingeniería: 9 diseño de presas, puentes, cauces evacuadores y estructuras de control de crecidas 9 determinar el beneficio económico de proyectos de atenuación de crecidas 9 delimitar planicies de inundación y determinar el efecto de ocupaciones o construcciones en las mismas 9.b.3.TIEMPO DE RECURRENCIA O PERÍODO DE RETORNO Se dice que la variable aleatoria “X” es un evento extremo, cuando es mayor o igual a un cierto valor umbral “ x T ”. El intervalo de recurrencia “t” es el tiempo entre ocurrencia de eventos X ≥ x T . El período de retorno “Tr” de un evento X ≥ x T , es el valor esperado de t, “ E(t ) ”, o el intervalo de recurrencia “promedio” entre eventos extremos, es decir, que igualan o exceden una magnitud especificada ( X ≥ x T ). Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-15 Figura 81. Intérvalos de Recurrencia “t” para Q ≥ 300 m³/s 550 500 450 400 Caudal [m3/s] 350 300 250 200 150 100 50 0 1905 1915 1925 1935 1945 1955 Años 1965 1975 1985 1995 Este valor promedio debe realizarse sobre un número de ocurrencias suficientemente grande. Para relacionar la probabilidad p = P(X ≥ x T ) de ocurrencia del evento X ≥ x T en cualquier observación, con el período de retorno, efectuando el siguiente razonamiento: para cada observación existen dos resultados posibles: ¾ Éxito X ≥ xT probabilidad = p ¾ Falla X < xT probabilidad = 1-p Debido a que las observaciones son independientes, la probabilidad de un intervalo de recurrencia de duración “t” es el producto de las probabilidades de (t − 1) fallas seguidas por un éxito, es decir “ (1 − p)t −1 * p ” y el valor esperado para “t” estará dado por: Tr = E(t ) = ∞ ∑ t * (1 − p) t −1 *p t =1 /204/ que desarrollando en serie de potencia y simplificando es igual a: Tr = E(t ) = p = 1 p [1 − (1 − p)] /205/ Es decir que la probabilidad de ocurrencia de un evento en cualquier observación de la variable es la inversa del período de retorno: /206/ Universidad Nacional de Cuyo P (X ≥ x T ) = p = 2 1 Tr Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-16 Si se desea determinar cual es la probabilidad de que un evento con período de retorno de Tr años ocurra al menos una vez en N años, primero se debe calcular su complemento, o sea, la situación en la que ningún evento con un periodo de recurrencia TR años ocurra en N años. Para ello debemos calcular la probabilidad de ocurrencia de una secuencia de N “fallas” sucesivas, es decir: N P(X < x T ) = (1 − p ) /207/ De esta manera, la probabilidad de que un evento de un período de retorno TR años ocurra 1 vez en N años sería: P(X ≥ x T ) = 1 − (1 − p ) N 1⎞ ⎛ P (X ≥ x T ) = 1 − ⎜ 1 − ⎟ ⎝ Tr ⎠ /208/ N 9.b.4.SERIES DE INFORMACIÓN HIDROLÓGICA La información hidrológica se puede organizar en series de diferentes características. Las series más utilizadas son: 9 Serie de duración completa, que está compuesta por la totalidad de la información disponible de un determinado parámetro Figura 82. Serie de Duración Completa – 74 años - 26 654 valores 210 Caudal Medio Diario [m3/s] 180 150 120 90 60 30 01/07/04 01/07/01 01/07/98 01/07/95 01/07/92 01/07/89 01/07/86 01/07/83 01/07/80 01/07/77 01/07/74 01/07/71 01/07/68 01/07/65 01/07/62 01/07/59 01/07/56 01/07/53 01/07/50 01/07/47 01/07/44 01/07/41 01/07/38 01/07/35 01/07/32 0 9 Serie de duración parcial, que es una serie de datos seleccionados de manera tal que la magnitud de cada uno de ellos sea mayor que un valor base predefinido 9 Serie de excedencia anual, constituida por una serie de duración parcial en la que el valor base se selecciona de forma tal que el número de valores de la serie sea igual al número de años del registro disponible. Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Universidad Nacional de Cuyo Facultad de Ingeniería 90 60 30 0 01/07/95 01/07/92 01/07/89 01/07/86 01/07/83 01/07/80 01/07/77 01/07/74 01/07/71 01/07/68 01/07/65 01/07/62 01/07/59 01/07/56 01/07/53 01/07/50 01/07/47 01/07/44 01/07/41 01/07/38 01/07/35 01/07/32 01/07/04 120 01/07/2004 150 01/07/01 180 01/07/2001 210 01/07/98 Figura 84. Serie de Excedencia Anual – 74 años - 74 valores mayores a 134 m³/s 01/07/1998 01/07/1995 01/07/1992 01/07/1989 01/07/1986 01/07/1983 01/07/1980 01/07/1977 01/07/1974 01/07/1971 01/07/1968 01/07/1965 01/07/1962 01/07/1959 01/07/1956 01/07/1953 01/07/1950 01/07/1947 01/07/1944 01/07/1941 01/07/1938 01/07/1935 01/07/1932 Caudal Medio Diario [m3/s] Caudal Medio Diario [m3/s] Unidad 9 9-17 Figura 83. Serie de Duración Parcial – 74 años - 652 valores mayores a 90 m³/s 210 180 150 120 90 60 30 0 Cátedra: Hidrología I Unidad 9 9-18 9 Serie de valores extremos, que es aquella que se constituye con los valores máximos, o mínimos, producidos en cada uno de los intervalos de tiempo de igual longitud en que se haya dividido el registro. 9 Serie anual, es una serie de valores extremos en la que la longitud del intervalo de tiempo considerada es de un año. Es la serie de valores extremos más frecuentemente utilizada, y puede ser a su vez: serie anual máxima, cuando está conformada por los valores máximos anuales y serie anual mínima, cuando se seleccionan para constituirla los valores mínimos anuales. Figura 85. Serie de Valores Extremos Anual – 74 años – 74 valores, los máximos de cada año 210 Caudales Máximos Medios Diarios [m3/s] 180 150 120 90 60 30 2001-2002 1996-1997 1991-1992 1986-1987 1981-1982 1976-1977 1971-1972 1966-1967 1961-1962 1956-1957 1951-1952 1946-1947 1941-1942 1936-1937 1931-1932 0 Cabe observar la diferencia que resulta de trabajar con “valores extremos máximos anuales” o con “valores de excedencia anual” de la información disponible. En una serie de excedencia anual generalmente aparecen la totalidad de los valores altos y máximos anuales, dado que en varios años el segundo valor máximo (y eventualmente otros) puede tener una magnitud mayor que la de algunos máximos de otros años. Sin embargo, en la serie de máximos anuales, estos segundos valores máximos se excluyen, y en consecuencia no se tienen en cuenta a los efectos del análisis. A pesar que la serie de excedencia anual es útil para algunos propósitos, está limitada por el hecho de que puede ser difícil verificar que todas las observaciones sean independientes; la ocurrencia de una gran crecida bien podría estar relacionada con condiciones de suelo saturado consecuencia de otra gran crecida que hubiese ocurrido un corto tiempo antes. Por lo general, a los fines prácticos, usualmente es mejor utilizar series de máximos anuales para los análisis hidrológicos pertinentes. En cualquier caso, a medida que el período de retorno del evento considerado sea mayor, los resultados de las dos metodologías se tornan muy similares, debido a que la posibilidad de que estos dos eventos ocurran en un mismo año es muy pequeña. Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-19 El período de retorno, TrE de magnitudes de eventos deducido a partir de una serie de excedencia anual está relacionado con el correspondiente período de retorno Tr deducido de una serie máxima anual, según Ven Te Chow, por: TrE = 1 ⎛ Tr ⎞ ln⎜ ⎟ ⎝ Tr − 1 ⎠ /209/ Esta expresión demuestra que las diferencias son prácticamente despreciables para Tr mayores de 10 años. La limitación que tienen las series parciales es que no estamos seguros de que todos los eventos sean independientes. TEMA 9.c: MÉTODOS ESTADÍSTICOS PARA ESTIMAR VALORES EXTREMOS 9.c.1. PLANTEAMIENTO Estos métodos consisten en estimar los valores de las crecidas máximas que pueden producirse en un río a partir de una serie de caudales máximos conocidos, extrapolando en dicha serie mediante el empleo de una curva de frecuencia para diferentes probabilidades. El problema se centra en utilizar al máximo los registros de caudales de que se dispone en la estación para la cual se busca evaluar la más fuerte crecida a temer; habrá necesidad así de emplear principalmente las técnicas estadísticas de análisis de crecidas, las que permitirán resolver el problema que representa calcular la probabilidad de que un caudal, superior a un valor dado, sobrevenga al menos una vez durante un determinado período de tiempo (un siglo o un milenio, por ejemplo). Igual razonamiento es extensivo a la cuantificación de precipitaciones máximas en función de los valores de los registros disponibles. El caudal de la crecida anual, definido como el mayor caudal del año, puede ser efectivamente considerado como una variable aleatoria continua e ilimitada, de la cual puede proponerse estudiar la distribución estadística. Estando esta distribución ajustada a alguna de las leyes teóricas conocidas de probabilidad, que se analizarán en el apartado 9.c.3, de manera que interprete, tan fielmente como sea posible, las observaciones disponibles, se admite que esa misma ley es válida, tanto dentro como fuera del período de observación, permitiendo por lo tanto, calcular el caudal que tiene una probabilidad dada de ocurrencia, aunque ésta sea muy pequeña (como el de la crecida milenaria o decamilenaria, por ejemplo). 9.c.2. DATOS A UTILIZAR El estudio estadístico de crecidas puede orientarse de dos maneras: 9 si se desea conocer sólo la posibilidad de que se alcance un cierto caudal en un período de tiempo dado. Se trabaja con una serie anual máxima, de acuerdo con el concepto definido para la misma en el apartado 9.b.4, tomando en consideración el máximo caudal instantáneo de cada año hidrológico, o en su defecto, de carecerse de tal valor, el máximo caudal medio diario de cada año. 9 si interesa también la duración de los caudales de crecidas que sobrepasen uno determinado. Corresponde emplear una serie de duración parcial. Los datos disponibles de crecidas para ajustar una ley de distribución de caudales máximos anuales, son en general relativamente escasos (desde principios de siglo los más largos en nuestra región) y muchas veces significativamente menor, debiéndose en base a los mismos, en algunos estudios como por ejemplo la determinación de la capacidad de un aliviadero, estimar caudales de crecidas probables para períodos mucho más largos, en ocasiones de hasta 1.000 ó 10.000 años. Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-20 En estos casos, en que se extrapola la ley de distribución a lapsos de tiempo mucho más extensos que aquél para el cual se dispone de datos, pueden resultar errores considerables en uno u otro sentido, lo que se confirma observando que, por lo general, los datos extremos de que se tiene noticia, presentan muy frecuentemente una gran dispersión, alejándose de la curva de distribución que se intenta ajustar. Debe tenerse siempre presente que la extrapolación de los valores de las crecidas para elevados tiempos de recurrencia, a partir de datos de 25 a 50 años, no tiene ningún fundamento científico, sino sólo matemático, por lo que los valores estimados para tales casos deben tomarse con grandes reservas y, si es posible, comprobar, por medio de investigaciones históricas, si las crecidas ocurridas en tiempos lejanos fueron del mismo orden de magnitud que las obtenidas por extrapolación con las leyes de frecuencia empleadas. Un factor muy importante a considerar es que los resultados son función de los datos “contenidos en la serie de registros”, serie que se va enriqueciendo con nuevos valores a medida que pasa el tiempo. De allí que en ocasiones, al actualizar cálculos efectuados un cierto tiempo atrás, se obtienen, al incorporar a la serie los nuevos registros, caudales sensiblemente diferentes para iguales tiempos de recurrencia, lo que puede llegar a cuestionar el nivel de seguridad primitivamente asignado a una obra dada. Otro aspecto de incidencia es que los datos de partida son generalmente caudales máximos medios diarios y no caudales máximos instantáneos, dado que normalmente existen series aceptablemente extensas de datos con valores medios diarios, en parte de la serie, y con datos medios diarios e instantáneos, en el resto. En este caso se puede intentar una correlación entre valores medios diarios e instantáneos y, en caso de obtenerse un ajuste aceptable, calcular, mediante regresión, la serie completa de valores instantáneos. 9.c.3. LEYES DE DISTRIBUCIÓN DE VALORES EXTREMOS Los valores extremos son valores máximos o mínimos seleccionados de conjuntos de datos. Por ejemplo, el caudal máximo anual en un lugar dado es el mayor caudal registrado durante un año hidrológico y todos los valores contenidos en el registro histórico conforman un conjunto de valores extremos que se pueden analizar estadísticamente. Se ha demostrado que las distribuciones de valores extremos seleccionados de conjuntos de muestras de cualquier distribución de probabilidad, cuando el número de valores extremos seleccionados es grande, convergen en una de las tres formas que toman las distribuciones de valores extremos, denominadas Tipo I, II y III. Las propiedades de las tres formas limitantes fueron desarrolladas principalmente por Gumbel (1941) para la distribución de Valor Extremo Tipo I (EVI, por sus siglas en inglés), por Frechet (1927) para la EVII y por Weibull (1939) para la EVIII. Estas leyes se hallan expresadas en función de las características estadísticas de la muestra hidrológica (media, desviación típica, etc.). En los apartados siguientes se reseñan las leyes de distribución más empleadas. 9.c.3.i. Distribución de Gumbel Expresa que la probabilidad de ocurrencia de un valor ”X”, menor que un valor dado “x”, está dada por (recordar la expresión /198/): /210/ P(X < x ) = F(x ) = e − e − a* ( x − x0 ) Los coeficientes “ x 0 ” y “a” están relacionados con la media “ x ” y la desviación típica “ σ ” por las relaciones: /211/ 1 0.577 = 0.78 * σ y x 0 = x − a a Luego la probabilidad de obtener un valor mayor que “x” es: /212/ Universidad Nacional de Cuyo P(X ≥ x ) = 1 − F(x ) Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-21 Donde: x es la magnitud del evento extremo de probabilidad P(X ≥ x ) x es el promedio aritmético de los valores de la serie n es el número de años del registro σ es la desviación standard de la serie y se calcula con la siguiente expresión: n ∑ (xi − x ) i =1 σ= /213/ 9.c.3.ii. 2 n −1 Distribución Log-Pearson III Esta distribución se basa en convertir los valores x i de la serie de registros a logaritmos, calculando: a) el valor medio: n log(x ) = /214/ ∑ log(xi ) i =1 n b) la desviación estándar: n σlog(x ) = /215/ ∑ [log(xi ) − log(x )] i =1 2 n −1 c) El coeficiente de asimetría: n /216/ S= n * ∑ [log(x i ) − log(x )] 3 i =1 (n − 1) * (n − 2) * (σlog(x ) )3 Luego el valor de “x” para una probabilidad dada, se calcula por medio de la expresión: /217/ log(x ) = log(x ) + K T * σlog(x ) Para esta expresión, el valor de K T se halla tabulado en función de S y del tiempo de recurrencia para el cual se desea determinar “x”. 9.c.4. DETERMINACION DEL HIDROGRAMA DE LA CRECIDA DE DISEÑO. Mediante la aplicación de alguna de las expresiones indicadas en el apartado anterior, puede calcularse el caudal estimado correspondiente a una crecida de un tiempo de recurrencia preestablecido (punto E de la Figura 86). En el dimensionado de determinadas obras hidráulicas (aliviaderos de presas, por ejemplo), ese valor aislado no resulta suficiente, debiéndose conocer además la configuración del hidrograma resultante para toda la crecida. A estos fines debe partirse del hidrograma más desfavorable contenido en la serie de registros con la que se cuenta, entendiendo por tal, no excluyentemente, al que corresponde al mayor caudal pico, sino que debe tomarse en consideración también su tiempo de base y el volumen aportado por la crecida. Una vez seleccionado este hidrograma (ADC de la Figura 86), se efectúa la separación del flujo base aplicando alguno de los métodos desarrollados al efecto. Por lo general, el caudal máximo de este hidrograma, punto D, será inferior al representado por E, punto por el cual deberá pasar el hidrograma de la crecida de tiempo de recurrencia Tr. Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-22 Para ello puede establecerse la relación de proporcionalidad p = EB DB , multiplicando luego todas las ordenadas genéricas FG por dicho valor, obteniéndose así los segmentos FH (siempre tomados a partir de las rectas separadoras del flujo base), cuyos extremos superiores, puntos H, serán puntos de paso del hidrograma buscado, el que se extenderá desde A hasta C, pasando por E. Figura 86. Determinación del Hidrograma de una Crecida de Recurrencia Tr 55 E 50 45 40 Caudal [m3/s] 35 H D 30 25 G 20 15 10 F A 5 C B 0 0 30 60 90 120 150 180 210 240 270 Tiempo [min] En caso que el caudal máximo haya sido calculado con valores de caudales máximos medios diarios, y exista en el río en estudio una diferencia no despreciable con los máximos instantáneos, deberá calcularse la relación media más probable entre ambos y ubicar el punto E según el valor correspondiente al caudal máximo instantáneo de la crecida de proyecto. Otra alternativa sería la de generar directamente, mediante correlación y regresión, la serie de caudales máximos instantáneos y trabajar directamente con ella. 9.c.5. GRÁFICAS DE PROBABILIDAD 9.c.5.i. Papel de Probabilidad Como una verificación de que la distribución de probabilidad se ajusta al conjunto de datos hidrológicos a los cuales se la pretende aplicar, los mismos pueden graficarse en un papel de probabilidad diseñado especialmente para la distribución. En este tipo de papeles las ordenadas representan el valor de “x” en una cierta escala (en los estudios de ingeniería hidrológica generalmente caudales o precipitaciones), mientras que las abscisas corresponden a la probabilidad o el período de retorno. Las escalas de representación para ambos ejes están diseñadas de manera tal que los valores que vayan a ser graficados aparezcan próximos a una línea recta, o sea que linealicen la función de distribución. De esta forma, trazando la recta compensadora de los puntos representados en la gráfica, puede procederse fácilmente a realizar estimaciones que requieran procesos de comparación, interpolación o extrapolación. En este último caso, sin embargo, el efecto de los errores que pueden producirse se multiplica rápidamente, posibilidad que debe ser muy tenida en cuenta al aplicar para fines de diseño y dimensionado de obras los resultados obtenidos. Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9.c.5.ii. 9-23 Posiciones de Graficación Una posición de graficación se refiere al valor de la probabilidad asignada a cada uno de los datos que van a graficarse. Para su determinación se han propuesto numerosos métodos, la mayoría de los cuales son empíricos. Si “n” es el número total de valores que van a ser graficados y “m” la posición de un valor en una lista ordenada por magnitud descendente, la probabilidad de excedencia del m-ésimo valor mayor, x m , es, para “n” grande: /218/ P( X ≥ x m ) = m n Sin embargo, esta fórmula simple (conocida como la fórmula de California y que data de 1923) produce una probabilidad del 100% en el caso de m = n, que puede ser difícil de graficar en una escala de probabilidad. Como un ajuste, la ecuación anterior puede modificarse a: /219/ P( X ≥ x m ) = m −1 n Aún cuando esta expresión no produce una probabilidad del 100%, sí produce una probabilidad cero para m = 1, lo que también puede ser difícil de graficar en un papel de probabilidad. Las dos ecuaciones anteriores representan los límites dentro de los cuales deberían localizarse las posiciones de graficación apropiadas. Un término medio entre ellas es la ecuación propuesta por primera vez en 1930 por Hazen: /220/ m − 0 .5 n 2 * m −1 P( X ≥ x m ) = 2*n P( X ≥ x m ) = La ecuación de Weibull (1939) es un término medio con una mejor justificación estadística. Si los “n” valores están uniformemente distribuidos entre el 0 y el 100% de probabilidad, entonces deben existir n + 1 intervalos: n − 1 entre los puntos correspondientes a los datos y 2 en los extremos. Este sistema simple de graficación se expresa mediante la referida ecuación, según la cual: /221/ P( X ≥ x m ) = m n +1 Ésta indica un período de retorno un año mayor que el período de retorno del registro del valor máximo. Otra ecuación intermedia, conocida como la de Chegodayev (1955), ampliamente utilizada en Rusia y los países de Europa Oriental es: /222/ P( X ≥ x m ) = m − 0.3 n + 0.4 La mayoría de las fórmulas de posición de graficación están representadas por la siguiente expresión general: /223/ P( X ≥ x m ) = m−b n + 1− 2 * b Por ejemplo, para la fórmula de Hazen es b = 0,5; para la de Chegodayev, b = 0,3 y para la de Weibull, b = 0. También son de aplicación frecuente las fórmulas propuestas por Blom (1958) en la que b = ⅜; la de Tukey (1962) con b = ⅓ y la de Gringorten (1963) con b =0,44. La elección del valor de b se halla relacionada con el tipo de distribución empleada y la magnitud de los tiempos de recurrencia con los cuales se trabaja, tratando de buscar siempre el mejor ajuste. Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I Unidad 9 9-24 Una vez que la serie de datos ha sido identificada y ordenada las posiciones de graficación calculadas, puede elaborarse un gráfico de la magnitud en estudio “x” vs Probabilid [P(X ≥ x ) ó P(X < x ) ó Tr ] para verificar el ajuste de la distribución. Alternativamente resulta conveniente efectuar la línea ajustada resultante con la información de la muestra. Universidad Nacional de Cuyo Facultad de Ingeniería Cátedra: Hidrología I