Subido por Estudiante Ingenieria

HIDROLOGIA I UNIDAD 9 ESTADISTICA APLICA

Anuncio
U ni versi dad Na cional de Cuy o
Fa cul ta d de Inge nie r ía
I n g e ni e r í a C i vil
HIDROLOGIA I
UNIDAD 9: ESTADÍSTICA APLICADA A LA HIDROLOGÍA
Ing. Carlos D. SEGERER
Ing. Esp. Rubén VILLODAS
2007
ÍNDICE DE TEMAS
UNIDAD 9: ESTADÍSTICA APLICADA A LA HIDROLOGÍA ................................................................................ 9-1
TEMA 9.a: CONCEPTOS GENERALES .......................................................................................................... 9-1
9.a.1.
IMPORTANCIA EN HIDROLOGÍA.................................................................................................. 9-1
9.a.2.
CORRELACIÓN Y REGRESIÓN.................................................................................................... 9-2
9.a.2.i. Conceptos Generales ................................................................................................................ 9-2
9.a.2.ii. Regresión y Correlación Lineal.................................................................................................. 9-2
TEMA 9.b: TRATAMIENTO PROBABILÍSTICO DE LA INFORMACIÓN HIDROLÓGICA............................... 9-6
9.b.1.
FUNCIONES DE FRECUENCIA Y PROBABILIDAD ..................................................................... 9-7
9.b.2.
ANÁLISIS DE FRECUENCIA........................................................................................................ 9-14
9.b.3.
TIEMPO DE RECURRENCIA O PERÍODO DE RETORNO ........................................................ 9-14
9.b.4.
SERIES DE INFORMACIÓN HIDROLÓGICA .............................................................................. 9-16
TEMA 9.c: MÉTODOS ESTADÍSTICOS PARA ESTIMAR VALORES EXTREMOS ..................................... 9-19
9.c.1.
PLANTEAMIENTO ........................................................................................................................ 9-19
9.c.2.
DATOS A UTILIZAR...................................................................................................................... 9-19
9.c.3.
LEYES DE DISTRIBUCIÓN DE VALORES EXTREMOS ............................................................ 9-20
9.c.3.i. Distribución de Gumbel............................................................................................................ 9-20
9.c.3.ii. Distribución Log-Pearson III..................................................................................................... 9-21
9.c.4.
DETERMINACION DEL HIDROGRAMA DE LA CRECIDA DE DISEÑO. ................................... 9-21
9.c.5.
GRÁFICAS DE PROBABILIDAD .................................................................................................. 9-22
9.c.5.i. Papel de Probabilidad .............................................................................................................. 9-22
9.c.5.ii. Posiciones de Graficación........................................................................................................ 9-23
ÍNDICE DE FIGURAS
Figura 70. Situación Relativa de Rectas de Regresión......................................................................................... 9-2
Figura 71. Subconjuntos del Espacio Muestral (EM) ............................................................................................ 9-6
Figura 72. Diagramas de Registros Anuales y su Correspondiente Histograma de Frecuencias ........................ 9-8
Figura 73. Función de Frecuencia Relativa (Muestra) .......................................................................................... 9-9
Figura 74. Función de Frecuencia Acumulada (Muestra) ..................................................................................... 9-9
Figura 75. Función de Distribución de Probabilidad (Población) .......................................................................... 9-9
Figura 76. Función de Densidad de Probabilidad (Población) ............................................................................ 9-10
Figura 77. Funciones de Frecuencias y Probabilidad ......................................................................................... 9-11
Figura 78. Función de Densidad de Probabilidad Normal................................................................................... 9-12
Figura 79. Función de Densidad de Probabilidad Lognormal ............................................................................. 9-13
Figura 80. Función de Densidad de Probabilidad Gamma ................................................................................. 9-13
Figura 81. Intérvalos de Recurrencia “t” para Q ≥ 300 m³/s................................................................................ 9-15
Figura 82. Serie de Duración Completa – 74 años - 26 654 valores .................................................................. 9-16
Figura 83. Serie de Duración Parcial – 74 años - 652 valores mayores a 90 m³/s............................................. 9-17
Figura 84. Serie de Excedencia Anual – 74 años - 74 valores mayores a 134 m³/s .......................................... 9-17
Figura 85. Serie de Valores Extremos Anual – 74 años – 74 valores, los máximos de cada año...................... 9-18
Figura 86. Determinación del Hidrograma de una Crecida de Recurrencia Tr ................................................... 9-22
ÍNDICE DE CUADROS
Cuadro 13: Rango Aplicabilidad del Coeficiente de Correlación ............................................................................ 9-5
Cuadro 14: Dimensiones y Rangos de la Funciones de Frecuencia y Probabilidad ............................................ 9-12
Unidad 9
9-1
UNIDAD 9: ESTADÍSTICA APLICADA A LA HIDROLOGÍA
TEMA 9.a: CONCEPTOS GENERALES
En el campo de la investigación científica es común la inquietud por intentar expresar la evolución de un
determinado fenómeno mediante una serie de medidas, que la traduzcan al lenguaje de los números.
Al transcurrir el tiempo, el investigador tropieza con la dificultad de encontrarse en posesión de una gran
cantidad de datos que, perdida su actualidad, serán de muy poco provecho si no son sometidos a un
tratamiento adecuado.
La estadística se constituye entonces en una herramienta indispensable para efectuar este tratamiento,
a fin de obtener la máxima utilidad en las aplicaciones prácticas a partir de los registros de diverso tipo
de que se dispone (en especial caudales y precipitaciones).
Son numerosas las definiciones de Estadística, no correspondiendo aquí presentar su nómina ni elegir
una que resulte idónea. Sí en cambio, conviene distinguir dos ramas que han evolucionado en forma
separada:
a)
Estadística Descriptiva
Es la que intenta obtener toda la información posible de los datos recogidos, mediante su
adecuado ordenamiento. Son producto de ella las clasificaciones de datos en forma de
tablas, procesamiento y archivo mediante programas de computación, etc.
b)
Estadística Matemática
Pretende ir más lejos, basándose en comparaciones del fenómeno con modelos
probabilísticos teóricos, a fin de obtener una información que no resulta evidente con el
simple ordenamiento de los datos. En este campo se ha desarrollado una teoría
matemática, a veces muy compleja, basada en la Teoría de Probabilidades, de la que la
Estadística Matemática puede considerarse como una aplicación práctica.
9.a.1. IMPORTANCIA EN HIDROLOGÍA
Los dos conceptos expuestos en el apartado anterior son de importante aplicación en el campo de la
Hidrología, sobre todo la de superficie, por corresponder a ella los ciclos más rápidos de circulación del
agua.
La mayoría de las causas que actúan en los ciclos hidrológicos superficiales son de carácter
meteorológico y la propia Meteorología se desarrolla fundamentalmente a través de la Estadística, ya
que es muy difícil llegar a un estudio matemático y preciso de los problemas físicos que condicionan los
fenómenos hidrológicos.
Sin embargo, como los caudales de los ríos y sus cauces constituyen un complejo, menos complicado y
amplio, que la atmósfera, es más fácil y viable estudiar estadísticamente los ríos a través de sus
estaciones de aforo, al menos en los cursos principales.
Por tanto, la Meteorología y su estadística aplicada se utilizan para extrapolar donde los aforos no
pueden alcanzar, por tratarse de ríos pequeños para los que no puede pretenderse que cada uno tenga
su propia estación de aforo, o para ampliar la extensión de las series, puesto que normalmente es más
antigua la estadística meteorológica que la de aforos.
La recopilación de datos hidrológicos, y su ordenamiento estadístico, tienen como fin práctico su
aplicación para dimensionar, con el mayor acierto posible, las obras que han de utilizar los recursos
hídricos (embalses, presas, captaciones, obras de conducción, centrales hidroeléctricas, etc.) y prever
el régimen de explotación, de manera que se obtenga el mayor beneficio posible de las instalaciones
construidas.
Se supone siempre que, en el futuro, el régimen hidrológico de un río tendrá cierta relación con el
pasado y se procura obtener, del conocimiento de la estadística de caudales, referencias para prever
dentro de ciertos márgenes de seguridad, el régimen de caudales que pueda presentare en el futuro.
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-2
9.a.2. CORRELACIÓN Y REGRESIÓN
9.a.2.i.
Conceptos Generales
En la mayor parte de los estudios estadísticos se presenta el problema de predecir los valores que
puede tomar una determinada variable. El planteo del método de solución puede realizarse de varias
formas.
En ocasiones se trata de completar, o de ampliar, una serie de datos de la “variable problema” a partir
de series de datos de una, o más, variables que estén relacionadas con aquélla de alguna manera.
En otras palabras, se trata simplemente de conseguir un cierto conocimiento sobre los factores que
influyen en el valor de la “variable problema”, con el fin de poder realizar hipótesis adecuadas sobre sus
valores desconocidos.
Estos dos aspectos son tratados por la correlación y la regresión, respectivamente.
Es importante destacar el hecho de que la aplicación de ambos métodos no proporciona por sí misma
ninguna información del tipo causa-efecto, ya que los resultados expresan únicamente relaciones
numéricas entre las variables estudiadas.
Sin embargo, a partir de estas relaciones se puede llegar a conclusiones de aquél tipo, por lo que la
finalidad primordial de estos métodos es averiguar los grupos de variables que pueden estudiarse
conjuntamente y hallarse interrelacionadas.
La diferencia entre regresión y correlación puede aclararse mediante las siguientes consideraciones:
9 un problema de regresión considera la distribución de frecuencias de una variable (dependiente),
cuando ésta u otras variables (independientes) se suponen conocidas.
9 un problema de correlación, por su parte, considera la variación conjunta de dos variables sin
que se apliquen restricciones a ninguna de ellas.
Por tanto, la correlación obtiene el grado de afinidad entre dos variables, representado numéricamente
por el coeficiente de correlación “ρ”, mientras que la regresión obtiene una ecuación “ y = f(x ) ” que
permite calcular valores de la variable dependiente “y” a partir de la independiente “x”.
9.a.2.ii.
Regresión y Correlación Lineal
Es la teoría que estudia la relación lineal que existe entre dos variables, despreciando toda posible
influencia de otras variables distintas.
Planteamiento Teórico
Dado un conjunto de pares de valores correspondientes a dos variables “x” e “y”, la ley más sencilla de
regresión o correlación entre ambas es la lineal:
Figura 70. Situación Relativa de Rectas de Regresión
22.00
17.60
x sobre y
ortogonal
13.20
y
y sobre x
8.80
4.40
0.00
0
Universidad Nacional de Cuyo
4.4
8.8
x
13.2
Facultad de Ingeniería
17.6
22
Cátedra: Hidrología I
Unidad 9
9-3
y =a+m*x
/176/
La recta debe ser tal que el momento de segundo orden de la masa de puntos del plano “xy”, con
respecto a la misma, sea mínimo, es decir que debe serlo la suma de los cuadrados de las distancias de
tales puntos a la recta.
Esta condición permitirá determinar los parámetros “m” y “n” de la ecuación de la recta, con sólo obtener
las derivadas parciales de dicha suma respecto ambos parámetros e igualarlas a cero.
Ahora bien, pueden considerase tres casos:
i.
que se midan las distancias de los puntos a la recta
paralelamente al eje de las “y” (regresión lineal de “y”
sobre “x”)
ii.
paralelamente al eje de las “x” (regresión lineal de “x”
sobre “y”)
iii. o perpendicularmente a la propia recta (regresión
ortogonal)
Los momentos de inercia mínimos serán respectivamente Iy , Ix , e I0 .
De estos casos se tratará únicamente el tercero, por ser el de mayor aplicación práctica, prescindiendo
de las demostraciones matemáticas inherentes, por la complejidad que las mismas presentan.
Parámetros a Utilizar
Valor Medio
El valor medio o esperanza matemática de una variable aleatoria es el centro de gravedad de la masa
de distribución.
En la correlación lineal, los valores medios de las variables “x” e “y”, están dadas por:
n
∑ xi
i =1
x=
/177/
n
n
; y=
∑ yi
i =1
n
Varianza y Covarianza
La varianza se define como el momento de inercia de la masa de distribución, siendo la covarianza el
momento centrífugo.
La varianza en “x” e “y” será:
n
/178/
y la covarianza:
σ 2x =
∑ (xi − x )
n
2
i =1
n
; σ 2y =
∑ (yi − y )
2
i =1
n
n
/179/
σ xy =
∑ (xi − x ) * (yi − y )
i =1
n
Desviación Típica
La desviación típica o desviación standard o desvío medio cuadrático, se lo define como la raíz
cuadrada positiva de la varianza:
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-4
n
n
2
∑ (xi − x )
σ x = + σ 2x =
; σ y = + σ 2y =
i =1
n
∑ (yi − y )
2
i =1
n
/180/
En general, a mayor varianza, o mayor desviación standard, corresponde mayor dispersión de la
variable en la respectiva distribución.
Correlación y Regresión Ortogonal
Para obtener la ecuación de la recta respecto a la cual la suma de las distancias de cada punto de
coordenadas x i e y i sea mínima, se aplica el Método de los Mínimos Cuadrados, llegándose a una
ecuación de segundo grado, la que permite obtener dos raíces que verifican la relación λ 2 > λ1 > 0 .
La ecuación de segundo grado es:
(
)
(
) ± [− (σ
)
λ2 − σ 2x + σ 2y * λ + σ 2x * σ 2y − σ 2xy = 0
λ1,2
(σ
=
2
x
+ σ 2y
2
x
+ σ 2y
)]
2
(
− 4 * σ 2x * σ 2y − σ 2xy
)
2
λ 2 > λ1 > 0
/181/
Para determinar el coeficiente angular de la recta se aplica:
σ xy
m=
λ 2 − σ 2y
/182/
En consecuencia la ecuación de la recta de regresión ortogonal resulta:
y − y = m * (x − x ) =
σ xy
λ 2 − σ 2y
* (x − x )
/183/
A partir de esta ecuación puede derivarse la ecuación de la recta en la forma /176/, que resulta más
práctica para su aplicación posterior:
y=
σ xy
λ2 −
a=y−
/184/
σ 2y
* (x − x ) + y = y −
σ xy
λ2 −
σ 2y
*x ; m=
σ xy
λ2 −
σ 2y
*x+
σ xy
λ 2 − σ 2y
*x
σ xy
λ 2 − σ 2y
y =a+m*x
Coeficiente de Correlación
Al efectuar el desarrollo de las regresiones lineales de “y” sobre “x” y de “x” sobre “y”, los coeficientes
angulares de las rectas resultantes (a los que se denomina coeficientes de regresión), están dados
respectivamente por:
/185/
ρ yx =
σ xy
σ 2x
; ρ xy =
σ xy
σ 2y
A la media geométrica de ambos coeficientes de regresión se la denomina Coeficiente de Correlación
de las dos variables y se lo representa por “ ρ ” o “r”.
Su expresión es:
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-5
r = ρ = ρ yx * ρ xy =
σ xy
σ 2x
/186/
Sus valores están comprendidos en el intervalo (-1, +1).
*
σ xy
σ2y
=
σ xy
σ2x * σ2y
Además, cuanto más se aproxime ρ a la unidad, menor será el valor de los momentos de inercia Ix e
Iy . En particular, para ρ = 1, resulta Ix = Iy = 0 , lo que significa que toda la masa se encuentra sobre
una recta, en la que se han confundido también las rectas de regresión.
El Coeficiente de Correlación se utiliza para determinar el grado de dependencia lineal que existe entre
las dos variables, y mide, en cierto modo, la bondad del ajuste de los puntos a una recta.
En la utilización práctica de las rectas de regresión para generar valores no registrados o comletar
series de datos históricos, si se designa por “n” al número de años (o de datos) registrados en la
sección o región a estudiar y “N” al correspondiente a la sección o región base, la extrapolación podrá
ser valedera, o no, según los valores correspondientes de “ρ”, de acuerdo al siguiente criterio:
Cuadro 13: Rango Aplicabilidad del Coeficiente de Correlación
n/N
Coeficiente de Correlación
Excelente
Bueno
Sin significado
20/30
0.99
0.85
<0.70
15/30
0.99
0.87
<0.77
10/30
0.99
0.90
<0.85
5/30
0.99
0.95
<0.90
Banda Característica
Suponiendo que la distribución de frecuencias de las desviaciones del conjunto de los puntos respecto a
la recta de regresión ortogonal fuese normal, el 95% de los puntos de la nube estaría ubicado en el
interior de una banda obtenida trazando sendas paralelas a la recta de regresión a una distancia
2 * λ1 .
De esta forma, aunque la hipótesis de distribución normal no es muy rigurosa, el trazado de la banda en
el gráfico de correlación brinda una idea de la calidad de ésta y permite estimar, en una primera
aproximación, los valores no ajustados.
Otros Tipos de Correlación
En algunos casos de correlaciones entre caudales de diversas cuencas, o entre caudales y
precipitaciones, la correlación lineal no brinda suficiente precisión, resultando necesario recurrir a
alguna ley de correlación con más parámetros, tal como por ejemplo la parabólica.
Por ejemplo para determinar la curva de gastos de una estación de aforo (caudales-alturas), no se
podría emplear una recta. En estas circunstancias, la ley de regresión podría expresarse en la forma:
/187/
y = a + b * x + k * x2 + j * x3 + K
La determinación de los coeficientes “a”, “b”, “c”, etc. se debe hacer de modo que
mínimo respecto a ellos.
∑ (yi − y )
2
sea un
Es también posible, sin aumentar el número de parámetros, buscar leyes no lineales que se adapten
mejor que las leyes de regresión lineal a la relación entre los parámetros observados, tales como por
ejemplo la logarítmica, doble logarítmica, exponencial, etc.
Es posible transformar muchas de estas leyes en lineales, mediante un cambio de variable, y después,
operar gráfica, o numéricamente, como si se tratase de una recurrencia lineal.
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-6
Correlaciones Gráficas
Consisten en representar directamente la nube de puntos referida a un sistema de ejes, en escala
natural, semilogarítmica o logarítmica; y determinar luego, en forma gráfica y a estima, la curva que
representa la tendencia media de la nube de puntos. Aparte de constituir un método en sí, representa
un auxiliar inestimable de las correlaciones analíticas, al permitir visualizar la tendencia y orientar la
elección de la función que permita lograr el ajuste más adecuado. Las correlaciones gráficas son
también de suma utilidad para el caso de tener que representar relaciones entre tres variables.
TEMA 9.b:TRATAMIENTO PROBABILÍSTICO DE LA INFORMACIÓN HIDROLÓGICA
Consideraremos que la variable aleatoria “X” es una variable descripta por una “distribución de
probabilidad” y ésta determina la posibilidad de que una observación “x” de la variable “X”, caiga en un
rango preestablecido de “X”.
Por ejemplo, si “X” es la “precipitación anual” en un lugar determinado, entonces la “distribución de
probabilidad de X” determina la posibilidad de que la precipitación anual observada en una año dado,
“ xi ”, caiga en un rango definido, tal como “menos de 200 mm”, o “entre 200 y 250 mm” y
sucesivamente.
Un conjunto de observaciones x1, x 2 , x 3 ,K, x n de la variable aleatoria “X” se denomina una muestra.
Se supone que las muestras son sacadas de una hipotética población infinita que posee propiedades
estadísticas constantes, mientras que las propiedades de una muestra pueden variar de una muestra a
otra.
El conjunto de todas las muestras posibles que pueden extraerse de una población se conoce como el
espacio muestral “EM”, y un evento es un subconjunto del espacio muestral:
Figura 71. Subconjuntos del Espacio Muestral (EM)
Por ejemplo, el espacio muestral para la precipitación anual es teóricamente el rango desde cero hasta
infinito positivo (a pesar que los límites prácticos inferior y superior son más cercanos) y un evento A
puede ser la ocurrencia de una precipitación anual menor que una cierta cantidad, tal como 200 mm.
La probabilidad de un evento, P(A ) , es la posibilidad de que éste ocurra cuando se hace una
observación de la variable aleatoria.
Las probabilidades de eventos pueden estimarse. Si una muestra de “n” observaciones, tiene “ n A ”
n
valores en el rango de evento “A”, entonces la “frecuencia relativa” de A es A . A medida que el
n
tamaño de la muestra aumenta, la frecuencia relativa se convierte progresivamente en una mejor
estimación de la probabilidad del evento, es decir:
P(A ) = lim
n→∞
nA
n
/188/
Tales probabilidades se conocen como probabilidades objetivas o posteriores, debido a que dependen
concretamente de las observaciones de la variable aleatoria.
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-7
Cuando se estima la posibilidad de que un evento futuro ocurrirá con base al juicio personal y la
experiencia, las estimaciones pertinentes se conocen como probabilidades subjetivas o a priori.
Las probabilidades de eventos obedecen a ciertos principios, a saber:
a) Probabilidad Total
Si el espacio muestral EM está completamente dividido en m eventos o áreas no
traslapadas A 1, A 2 , A 3 ,K, A m entonces:
P(A 1 ) + P(A 2 ) + P(A 3 ) + K + P(A m ) = P(EM) = 1
/189/
b) Complementariedad
Como consecuencia de lo anterior, si A es el complemento de A, es decir que A = EM − A ,
entonces:
P(A ) = 1 − P(A )
/190/
c) Probabilidad Condicional
Supóngase que existen dos eventos “A” y “B” tal como se muestra en la Figura 71:
A
evento que la precipitación de este año fuera menor de 200 mm
B
evento de que la precipitación del próximo año fuese menor de 200 mm
A IB
evento de que tanto A como B ocurran, es decir, dos años sucesivos con
precipitación anual menor de 200 mm
P(B A )
es la probabilidad condicional de que ocurra B dado que ya ha ocurrido A
Entonces la probabilidad conjunta P(A I B ) es:
P(A I B ) = P(A ) * P(B A )
/191/
⇒
P(B A ) =
P(A I B )
P(A )
Si la ocurrencia de B no depende de la ocurrencia de A, se dice que los eventos son
independientes y:
/192/
P(B A ) = P(B ) ; P(A I B ) = P(A ) * P(B )
Si para el ejemplo anteriormente citado, los eventos de precipitación son independientes de un año a
otro, entonces la probabilidad de que la precipitación sea menor de 200 mm en dos años consecutivos
es simplemente el cuadrado de la probabilidad de que la precipitación anual en un solo año sea menor
de tal valor.
El concepto de eventos u observaciones independientes es fundamental para la interpretación
estadística correcta de secuencias de información hidrológica, porque en tales casos dicha, información
puede ser analizada sin tener en cuenta su orden de ocurrencia.
Si observaciones sucesivas están correlacionadas, es decir que no son independientes, los métodos
estadísticos requeridos son más complejos, debido a que la probabilidad conjunta
P(A I B ) ≠ P(A ) * P(B ) .
Las probabilidades estimadas utilizando información de muestra, son aproximadas, debido a que
dependen de valores específicos de las observaciones en una muestra de tamaño limitado. Una
alternativa, para superar este inconveniente es ajustar una función de distribución de probabilidad a la
información y luego determinar las probabilidades de los eventos utilizando esta función de distribución.
9.b.1.FUNCIONES DE FRECUENCIA Y PROBABILIDAD
Si las observaciones de una muestra están idénticamente distribuidas (cada valor de la muestra
extraído de la misma distribución de probabilidad), éstas pueden ordenarse para formar un “histograma
de frecuencia”, Figura 72, según los siguientes pasos:
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-8
i)
el rango factible de la variable aleatoria se divide en intervalos discretos
ii)
se cuenta el número de observaciones que cae en cada uno de los intervalos
iii)
se dibuja como un gráfico de barras
El ancho Δx del intervalo utilizado para construir el histograma de frecuencia se escoge tan pequeño
como sea posible y de manera tal que caigan suficientes observaciones dentro de cada uno de los
intervalos a fin que el histograma tenga una variación razonablemente suave en el rango de la
información.
Figura 72. Diagramas de Registros Anuales y su Correspondiente Histograma de Frecuencias
500-525
450-475
Precipitación [ mm ]
400-425
350-375
300-325
250-275
200-225
150-175
100-125
50-75
0
04-05
00-01
96-97
92-93
88-89
84-85
80-81
76-77
72-73
68-69
64-65
0-25
60-61
Precipitación [ mm ]
Precipitación Anual - La Consulta (San Carlos)
550
525
500
475
450
425
400
375
350
325
300
275
250
225
200
175
150
125
100
75
50
25
0
1
2
3
4
5
6
Cantidad de Datos
Años
Si el número de observaciones “ ni ” en el intervalo “i”, que cubre el rango [x i − Δx , x i ] , se divide por el
número total de observaciones “n”, el resultado se conoce como la Función de Frecuencia Relativa
“ fm (x ) ” (Figura 73) y es igual a:
fm (x ) =
ni
n
/193/
Recordando la /188/, se verifica que la ecuación anterior es una estimación del valor de
P(x i − Δx ≤ X ≤ x i ) , o sea, la probabilidad de que la variable aleatoria X caiga en el intervalo
[x i − Δx , x i ] .
El subíndice “m” indica que la función se calcula utilizando información de la muestra.
La suma de los valores de las frecuencias relativas hasta un punto dado es la Función de Frecuencia
Acumulada “ Fm (x ) ” (Figura 74) definida como:
Fm (x ) =
i
i
n
∑ ( ) ∑ nj
fm x j =
j=1
j=1
/194/
Esta expresión constituye una estimación de P(X ≤ x i ) , o sea la probabilidad acumulada de x i .
Las funciones de frecuencia relativa y de frecuencia acumulada han sido definidas para una muestra;
las funciones correspondientes para la “población” se aproximan como límites a medida que
n → ∞ y Δx → 0 .
Por su parte, la Función de Frecuencia Acumulada se convierte, cuando corresponde a la población y
no a la muestra, en la Función de Distribución de Probabilidad “ F(x ) ” (Figura 75) dada por:
F(x ) = lim Fm (x )
/195/
Universidad Nacional de Cuyo
n→∞
Δx →0
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-9
Figura 73. Función de Frecuencia Relativa (Muestra)
14%
12%
10%
8%
fm(x)
6%
4%
2%
525-550
500-525
475-500
450-475
425-450
400-425
375-400
350-375
325-350
300-325
275-300
250-275
225-250
200-225
175-200
150-175
125-150
100-125
50-75
75-100
0-25
25-50
0%
Precipitación [ mm ]
Figura 74. Función de Frecuencia Acumulada (Muestra)
100%
90%
80%
70%
60%
Fm(x)
50%
40%
30%
20%
10%
525-550
500-525
475-500
450-475
425-450
400-425
375-400
350-375
325-350
300-325
275-300
250-275
225-250
200-225
175-200
150-175
125-150
75-100
100-125
50-75
25-50
0-25
0%
Precipitación [ mm ]
Figura 75. Función de Distribución de Probabilidad (Población)
100%
90%
80%
70%
60%
F(x)
50%
40%
30%
20%
10%
0%
0
25
50
75
100
100 125
150
175
200
200 225
250
275
300
300 325
350
375
400
400
425
450
475
500
500
525
550
Precipitación [ mm ]
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-10
En el límite, la función de frecuencia relativa dividida por el intervalo de longitud Δx se convierte en la
Función de Densidad de Probabilidad “ f (x ) ”, expresada con la siguiente fórmula:
f (x ) = lim
/196/
n→∞
Δx → 0
fm (x )
Δx
Es obvio que la derivada de la curva de Función de Distribución de Probabilidad, es la Función de
Densidad de Probabilidad:
dF(x )
f (x )
= lim m
n→∞
dx
Δx
Δx → 0
f (x ) =
/197/
Figura 76. Función de Densidad de Probabilidad (Población)
14%
12%
10%
8%
f(x)
6%
4%
2%
550
500
525
500
475
450
400
425
400
375
300
350
325
300
275
250
200
225
200
175
150
100
125
100
75
50
0
25
0%
Precipitación [ mm ]
Para un valor dado de x, F(x ) es la probabilidad acumulada P(X ≤ x ) , y puede expresarse como la
integral de la Función de Densidad de Probabilidad en el rango [X ≤ x ] , usando una variable de
integración auxiliar “u”:
F(x ) = P(X ≤ x ) =
/198/
∫− ∞ f (u) * du
x
Desde el punto de vista de ajuste de la información de la muestra a una distribución teórica, las cuatro
funciones:
9 Frecuencia Relativa
fm (x )
para la muestra
9 Frecuencia Acumulada
Fm (x )
para la muestra,
9 Distribución de Probabilidad
F(x )
para la población
9 Densidad de Probabilidad
f (x )
para la población
Estas pueden ordenarse en un ciclo:
Comenzando por la parte superior izquierda, tenemos:
a) la Función de Frecuencia Relativa se calcula utilizando los datos de la muestra divididos en
intervalos
b) los valores acumulados permiten formar la Función de Frecuencia Acumuladas
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-11
c) La Función de Distribución de Probabilidad es el limite teórico de la Función de Frecuencia
Acumulada a medida que el tamaño de la muestra se vuelve infinitamente grande y el intervalo
de la información infinitamente pequeño
d) La Función de Densidad de Probabilidad es el valor de la pendiente de la función de distribución
para un valor específico de x
Figura 77. Funciones de Frecuencias y Probabilidad5
El ciclo puede cerrarse calculando un valor teórico de la Función de Frecuencia Relativa, denominado la
Función de Probabilidad Incrementada “ p(x i ) “, como:
5
Extraído de Ven Te Chow. Los subíndices “s” corresponden a los “m” de éste apunte, para las “muestras”.
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-12
p(x i ) = P(x i − Δx ≤ X ≤ x )
p(x i ) =
∫
xi
p(x i ) =
∫
xi
x i − Δx
−∞
f (x ) * dx
f (x ) * dx −
∫
x i − Δx
−∞
f (x ) * dx =
p(x i ) = F(x i ) − F(x i − Δx )
p(x i ) = F(x i ) − F(x i−1 )
/199/
La comparación entre p(x i ) y la función de frecuencia relativa observada fm (x ) para cada x i puede
utilizarse como una medida del grado de ajuste de la distribución a la información.
Los rangos de variación y dimensiones de las cuatro funciones son:
Cuadro 14: Dimensiones y Rangos de la Funciones de Frecuencia y Probabilidad
Función
Aplicable a
Dimensión
Rango de Variación
Frecuencia Relativa
fm (x )
la muestra
Adimensional
[0,1]
Frecuencia Acumulada
Fm (x )
la muestra
Adimensional
[0,1]
Distribución de Probabilidad
F(x )
la población
Adimensional
[0,1]
Densidad de Probabilidad
f (x )
la población
X
−1
[0,∞]
Una de las más conocidas unciones de densidad de probabilidad es la Distribución Normal o
Campana de Gauss, que se define como:
f (x ) =
/200/
donde:
σyμ
1
2* π *σ
*e
−
(x −μ )2
2* σ 2
son parámetros de cálculo
La precipitación anual, calculada como la suma de los efectos de muchos eventos independientes,
tiende a seguir una distribución normal.
Figura 78. Función de Densidad de Probabilidad Normal
Tiene limitaciones importantes, como que varía en un rango continuo [− ∞, ∞ ] , mientras que la mayoría
de las variables hidrológicas son no negativas; y que es simétrica con respecto a la media, mientras que
la información hidrológica tiende a ser asimétrica.
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-13
Otras funciones de Densidad de Probabilidad aplicables a las variables hidrológicas son:
Distribución Lognormal
Si la variable “ Y = log(X ) ” está normalmente distribuida, entonces se dice que X está distribuida en forma
lognormal.
Figura 79. Función de Densidad de Probabilidad Lognormal
Esta función es útil cuando se quiere representar variables hidrológicas asimétricas. Tiene la ventaja,
sobre la normal, en que está limitada a valores positivos de X y la transformación a logaritmos tiende a
reducir la asimetría positiva, común en las variables hidrológicas.
Distribución Exponencial
Es una distribución que tiene un único parámetro λ. Se utiliza para describir el tiempo entre la ocurrencia
de dos eventos de variables aleatorias, como por ejemplo, precipitaciones, entradas de contaminantes a
un río, etc., y en este caso, λ sería la tasa media de ocurrencia de los eventos.
Tiene la desventaja de que requiere que la ocurrencia de cada evento sea completamente
independiente de sus vecinos y de que no está definida para X=0.
La función de densidad de probabilidad es:
f (x ) = λ * e − λ * x → x > 0
/201/
Distribución Gamma
Es una distribución de 2 parámetros, uno de forma β y otro de escala λ. Tiene una forma que varía
suavemente y se usa para describir variables hidrológicas asimétricas, sin usar logaritmos.
Figura 80. Función de Densidad de Probabilidad Gamma
Tiene límite inferior igual a 0, lo cual es una desventaja cuando se usa para analizar variables que
tienen un límite superior mayor a 0.
La función de densidad de probabilidad es:
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-14
f (x ) =
/202/
λβ * x β−1 * e − λ * x
→x>0
Γ(β )
Distribución Pearson Tipo III
Es una distribución gamma de 3 parámetros (λ,β,ε), siendo éste último el límite inferior. Se usa para
describir la probabilidad de avenidas máximas anuales. Es una distribución muy flexible, que puede
asumir diferentes formas a medida que los parámetros varían.
La función de densidad de probabilidad es:
f (x ) =
/203/
λβ * (x − ε ) * e − λ *(x −ε )
→x≥ε
Γ(β )
β −1
9.b.2.ANÁLISIS DE FRECUENCIA
Los sistemas hidrológicos son afectados en ocasiones por eventos extremos, tales como tormentas
severas, crecidas y sequías. La magnitud de un evento extremo está inversamente relacionada con su
frecuencia de ocurrencia, es decir, eventos muy severos ocurren con menor frecuencia, que eventos
más moderados.
El objetivo del análisis de frecuencia de información hidrológica es, relacionar la magnitud de los
eventos extremos con su frecuencia de ocurrencia, mediante el uso de “Funciones de Distribución de
Probabilidad”.
Los requisitos que debe cumplir la información hidrológica (eventos extremos) es que:
9 debe ser independiente
9 está idénticamente distribuida (por ejemplo, precipitación diaria máxima anual)
9 el sistema hidrológico que la produce (por ejemplo, un sistema de tormenta) sea aleatorio,
independiente del espacio y del tiempo
La información hidrológica empleada debe ser seleccionada cuidadosamente, de manera tal que se
satisfagan las suposiciones de independencia y de distribución idéntica.
En la práctica, esto se lleva a cabo usualmente seleccionando el máximo anual de la variable bajo
análisis (por ejemplo, el caudal máximo anual, que puede corresponder al flujo pico instantáneo máximo
o al medio diario máximo, que se haya producido en cualquier momento o en cualquier día durante el
aforo) con la expectativa de que observaciones sucesivas de esta variable de un año a otro sean
independientes.
Los resultados del análisis de frecuencia de los caudales de crecida pueden utilizarse para muchos
propósitos en ingeniería:
9 diseño de presas, puentes, cauces evacuadores y estructuras de control
de crecidas
9 determinar el beneficio económico de proyectos de atenuación de crecidas
9 delimitar planicies de inundación y determinar el efecto de ocupaciones o
construcciones en las mismas
9.b.3.TIEMPO DE RECURRENCIA O PERÍODO DE RETORNO
Se dice que la variable aleatoria “X” es un evento extremo, cuando es mayor o igual a un cierto valor
umbral “ x T ”.
El intervalo de recurrencia “t” es el tiempo entre ocurrencia de eventos X ≥ x T .
El período de retorno “Tr” de un evento X ≥ x T , es el valor esperado de t, “ E(t ) ”, o el intervalo de
recurrencia “promedio” entre eventos extremos, es decir, que igualan o exceden una magnitud
especificada ( X ≥ x T ).
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-15
Figura 81. Intérvalos de Recurrencia “t” para Q ≥ 300 m³/s
550
500
450
400
Caudal [m3/s]
350
300
250
200
150
100
50
0
1905
1915
1925
1935
1945
1955
Años
1965
1975
1985
1995
Este valor promedio debe realizarse sobre un número de ocurrencias suficientemente grande.
Para relacionar la probabilidad p = P(X ≥ x T ) de ocurrencia del evento X ≥ x T en cualquier observación,
con el período de retorno, efectuando el siguiente razonamiento: para cada observación existen dos
resultados posibles:
¾
Éxito
X ≥ xT
probabilidad = p
¾
Falla
X < xT
probabilidad = 1-p
Debido a que las observaciones son independientes, la probabilidad de un intervalo de recurrencia de
duración “t” es el producto de las probabilidades de (t − 1) fallas seguidas por un éxito, es decir
“ (1 − p)t −1 * p ” y el valor esperado para “t” estará dado por:
Tr = E(t ) =
∞
∑ t * (1 − p)
t −1
*p
t =1
/204/
que desarrollando en serie de potencia y simplificando es igual a:
Tr = E(t ) =
p
=
1
p
[1 − (1 − p)]
/205/
Es decir que la probabilidad de ocurrencia de un evento en cualquier observación de la variable es la
inversa del período de retorno:
/206/
Universidad Nacional de Cuyo
P (X ≥ x T ) = p =
2
1
Tr
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-16
Si se desea determinar cual es la probabilidad de que un evento con período de retorno de Tr años
ocurra al menos una vez en N años, primero se debe calcular su complemento, o sea, la situación en la
que ningún evento con un periodo de recurrencia TR años ocurra en N años.
Para ello debemos calcular la probabilidad de ocurrencia de una secuencia de N “fallas” sucesivas, es
decir:
N
P(X < x T ) = (1 − p )
/207/
De esta manera, la probabilidad de que un evento de un período de retorno TR años ocurra 1 vez en N
años sería:
P(X ≥ x T ) = 1 − (1 − p )
N
1⎞
⎛
P (X ≥ x T ) = 1 − ⎜ 1 − ⎟
⎝ Tr ⎠
/208/
N
9.b.4.SERIES DE INFORMACIÓN HIDROLÓGICA
La información hidrológica se puede organizar en series de diferentes características. Las series más
utilizadas son:
9 Serie de duración completa, que está compuesta por la totalidad de la información
disponible de un determinado parámetro
Figura 82. Serie de Duración Completa – 74 años - 26 654 valores
210
Caudal Medio Diario [m3/s]
180
150
120
90
60
30
01/07/04
01/07/01
01/07/98
01/07/95
01/07/92
01/07/89
01/07/86
01/07/83
01/07/80
01/07/77
01/07/74
01/07/71
01/07/68
01/07/65
01/07/62
01/07/59
01/07/56
01/07/53
01/07/50
01/07/47
01/07/44
01/07/41
01/07/38
01/07/35
01/07/32
0
9 Serie de duración parcial, que es una serie de datos seleccionados de manera tal que
la magnitud de cada uno de ellos sea mayor que un valor base predefinido
9 Serie de excedencia anual, constituida por una serie de duración parcial en la que el
valor base se selecciona de forma tal que el número de valores de la serie sea igual al
número de años del registro disponible.
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Universidad Nacional de Cuyo
Facultad de Ingeniería
90
60
30
0
01/07/95
01/07/92
01/07/89
01/07/86
01/07/83
01/07/80
01/07/77
01/07/74
01/07/71
01/07/68
01/07/65
01/07/62
01/07/59
01/07/56
01/07/53
01/07/50
01/07/47
01/07/44
01/07/41
01/07/38
01/07/35
01/07/32
01/07/04
120
01/07/2004
150
01/07/01
180
01/07/2001
210
01/07/98
Figura 84. Serie de Excedencia Anual – 74 años - 74 valores mayores a 134 m³/s
01/07/1998
01/07/1995
01/07/1992
01/07/1989
01/07/1986
01/07/1983
01/07/1980
01/07/1977
01/07/1974
01/07/1971
01/07/1968
01/07/1965
01/07/1962
01/07/1959
01/07/1956
01/07/1953
01/07/1950
01/07/1947
01/07/1944
01/07/1941
01/07/1938
01/07/1935
01/07/1932
Caudal Medio Diario [m3/s]
Caudal Medio Diario [m3/s]
Unidad 9
9-17
Figura 83. Serie de Duración Parcial – 74 años - 652 valores mayores a 90 m³/s
210
180
150
120
90
60
30
0
Cátedra: Hidrología I
Unidad 9
9-18
9 Serie de valores extremos, que es aquella que se constituye con los valores máximos,
o mínimos, producidos en cada uno de los intervalos de tiempo de igual longitud en
que se haya dividido el registro.
9 Serie anual, es una serie de valores extremos en la que la longitud del intervalo de
tiempo considerada es de un año. Es la serie de valores extremos más
frecuentemente utilizada, y puede ser a su vez: serie anual máxima, cuando está
conformada por los valores máximos anuales y serie anual mínima, cuando se
seleccionan para constituirla los valores mínimos anuales.
Figura 85. Serie de Valores Extremos Anual – 74 años – 74 valores, los máximos de cada año
210
Caudales Máximos Medios Diarios [m3/s]
180
150
120
90
60
30
2001-2002
1996-1997
1991-1992
1986-1987
1981-1982
1976-1977
1971-1972
1966-1967
1961-1962
1956-1957
1951-1952
1946-1947
1941-1942
1936-1937
1931-1932
0
Cabe observar la diferencia que resulta de trabajar con “valores extremos máximos anuales” o con
“valores de excedencia anual” de la información disponible.
En una serie de excedencia anual generalmente aparecen la totalidad de los valores altos y máximos
anuales, dado que en varios años el segundo valor máximo (y eventualmente otros) puede tener una
magnitud mayor que la de algunos máximos de otros años.
Sin embargo, en la serie de máximos anuales, estos segundos valores máximos se excluyen, y en
consecuencia no se tienen en cuenta a los efectos del análisis.
A pesar que la serie de excedencia anual es útil para algunos propósitos, está limitada por el hecho de
que puede ser difícil verificar que todas las observaciones sean independientes; la ocurrencia de una
gran crecida bien podría estar relacionada con condiciones de suelo saturado consecuencia de otra
gran crecida que hubiese ocurrido un corto tiempo antes.
Por lo general, a los fines prácticos, usualmente es mejor utilizar series de máximos anuales para los
análisis hidrológicos pertinentes.
En cualquier caso, a medida que el período de retorno del evento considerado sea mayor, los
resultados de las dos metodologías se tornan muy similares, debido a que la posibilidad de que estos
dos eventos ocurran en un mismo año es muy pequeña.
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-19
El período de retorno, TrE de magnitudes de eventos deducido a partir de una serie de excedencia
anual está relacionado con el correspondiente período de retorno Tr deducido de una serie máxima
anual, según Ven Te Chow, por:
TrE =
1
⎛ Tr ⎞
ln⎜
⎟
⎝ Tr − 1 ⎠
/209/
Esta expresión demuestra que las diferencias son prácticamente despreciables para Tr mayores de 10
años.
La limitación que tienen las series parciales es que no estamos seguros de que todos los eventos sean
independientes.
TEMA 9.c: MÉTODOS ESTADÍSTICOS PARA ESTIMAR VALORES EXTREMOS
9.c.1. PLANTEAMIENTO
Estos métodos consisten en estimar los valores de las crecidas máximas que pueden producirse en un
río a partir de una serie de caudales máximos conocidos, extrapolando en dicha serie mediante el
empleo de una curva de frecuencia para diferentes probabilidades.
El problema se centra en utilizar al máximo los registros de caudales de que se dispone en la estación
para la cual se busca evaluar la más fuerte crecida a temer; habrá necesidad así de emplear
principalmente las técnicas estadísticas de análisis de crecidas, las que permitirán resolver el problema
que representa calcular la probabilidad de que un caudal, superior a un valor dado, sobrevenga al
menos una vez durante un determinado período de tiempo (un siglo o un milenio, por ejemplo). Igual
razonamiento es extensivo a la cuantificación de precipitaciones máximas en función de los valores de
los registros disponibles.
El caudal de la crecida anual, definido como el mayor caudal del año, puede ser efectivamente
considerado como una variable aleatoria continua e ilimitada, de la cual puede proponerse estudiar la
distribución estadística.
Estando esta distribución ajustada a alguna de las leyes teóricas conocidas de probabilidad, que se
analizarán en el apartado 9.c.3, de manera que interprete, tan fielmente como sea posible, las
observaciones disponibles, se admite que esa misma ley es válida, tanto dentro como fuera del período
de observación, permitiendo por lo tanto, calcular el caudal que tiene una probabilidad dada de
ocurrencia, aunque ésta sea muy pequeña (como el de la crecida milenaria o decamilenaria, por
ejemplo).
9.c.2. DATOS A UTILIZAR
El estudio estadístico de crecidas puede orientarse de dos maneras:
9 si se desea conocer sólo la posibilidad de que se alcance un cierto caudal en un período de
tiempo dado.
Se trabaja con una serie anual máxima, de acuerdo con el concepto definido para la misma en el
apartado 9.b.4, tomando en consideración el máximo caudal instantáneo de cada año
hidrológico, o en su defecto, de carecerse de tal valor, el máximo caudal medio diario de cada
año.
9 si interesa también la duración de los caudales de crecidas que sobrepasen uno determinado.
Corresponde emplear una serie de duración parcial.
Los datos disponibles de crecidas para ajustar una ley de distribución de caudales máximos anuales,
son en general relativamente escasos (desde principios de siglo los más largos en nuestra región) y
muchas veces significativamente menor, debiéndose en base a los mismos, en algunos estudios como
por ejemplo la determinación de la capacidad de un aliviadero, estimar caudales de crecidas probables
para períodos mucho más largos, en ocasiones de hasta 1.000 ó 10.000 años.
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-20
En estos casos, en que se extrapola la ley de distribución a lapsos de tiempo mucho más extensos que
aquél para el cual se dispone de datos, pueden resultar errores considerables en uno u otro sentido, lo
que se confirma observando que, por lo general, los datos extremos de que se tiene noticia, presentan
muy frecuentemente una gran dispersión, alejándose de la curva de distribución que se intenta ajustar.
Debe tenerse siempre presente que la extrapolación de los valores de las crecidas para elevados
tiempos de recurrencia, a partir de datos de 25 a 50 años, no tiene ningún fundamento científico, sino
sólo matemático, por lo que los valores estimados para tales casos deben tomarse con grandes
reservas y, si es posible, comprobar, por medio de investigaciones históricas, si las crecidas ocurridas
en tiempos lejanos fueron del mismo orden de magnitud que las obtenidas por extrapolación con las
leyes de frecuencia empleadas.
Un factor muy importante a considerar es que los resultados son función de los datos “contenidos en la
serie de registros”, serie que se va enriqueciendo con nuevos valores a medida que pasa el tiempo. De
allí que en ocasiones, al actualizar cálculos efectuados un cierto tiempo atrás, se obtienen, al incorporar
a la serie los nuevos registros, caudales sensiblemente diferentes para iguales tiempos de recurrencia,
lo que puede llegar a cuestionar el nivel de seguridad primitivamente asignado a una obra dada.
Otro aspecto de incidencia es que los datos de partida son generalmente caudales máximos medios
diarios y no caudales máximos instantáneos, dado que normalmente existen series aceptablemente
extensas de datos con valores medios diarios, en parte de la serie, y con datos medios diarios e
instantáneos, en el resto. En este caso se puede intentar una correlación entre valores medios diarios e
instantáneos y, en caso de obtenerse un ajuste aceptable, calcular, mediante regresión, la serie
completa de valores instantáneos.
9.c.3. LEYES DE DISTRIBUCIÓN DE VALORES EXTREMOS
Los valores extremos son valores máximos o mínimos seleccionados de conjuntos de datos. Por
ejemplo, el caudal máximo anual en un lugar dado es el mayor caudal registrado durante un año
hidrológico y todos los valores contenidos en el registro histórico conforman un conjunto de valores
extremos que se pueden analizar estadísticamente.
Se ha demostrado que las distribuciones de valores extremos seleccionados de conjuntos de muestras
de cualquier distribución de probabilidad, cuando el número de valores extremos seleccionados es
grande, convergen en una de las tres formas que toman las distribuciones de valores extremos,
denominadas Tipo I, II y III.
Las propiedades de las tres formas limitantes fueron desarrolladas principalmente por Gumbel (1941)
para la distribución de Valor Extremo Tipo I (EVI, por sus siglas en inglés), por Frechet (1927) para la
EVII y por Weibull (1939) para la EVIII.
Estas leyes se hallan expresadas en función de las características estadísticas de la muestra
hidrológica (media, desviación típica, etc.). En los apartados siguientes se reseñan las leyes de
distribución más empleadas.
9.c.3.i.
Distribución de Gumbel
Expresa que la probabilidad de ocurrencia de un valor ”X”, menor que un valor dado “x”, está dada por
(recordar la expresión /198/):
/210/
P(X < x ) = F(x ) = e − e
− a* ( x − x0 )
Los coeficientes “ x 0 ” y “a” están relacionados con la media “ x ” y la desviación típica “ σ ” por las
relaciones:
/211/
1
0.577
= 0.78 * σ y x 0 = x −
a
a
Luego la probabilidad de obtener un valor mayor que “x” es:
/212/
Universidad Nacional de Cuyo
P(X ≥ x ) = 1 − F(x )
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-21
Donde:
x
es la magnitud del evento extremo de probabilidad P(X ≥ x )
x
es el promedio aritmético de los valores de la serie
n
es el número de años del registro
σ
es la desviación standard de la serie y se calcula con la siguiente expresión:
n
∑ (xi − x )
i =1
σ=
/213/
9.c.3.ii.
2
n −1
Distribución Log-Pearson III
Esta distribución se basa en convertir los valores x i de la serie de registros a logaritmos, calculando:
a) el valor medio:
n
log(x ) =
/214/
∑ log(xi )
i =1
n
b) la desviación estándar:
n
σlog(x ) =
/215/
∑ [log(xi ) − log(x )]
i =1
2
n −1
c) El coeficiente de asimetría:
n
/216/
S=
n * ∑ [log(x i ) − log(x )]
3
i =1
(n − 1) * (n − 2) * (σlog(x ) )3
Luego el valor de “x” para una probabilidad dada, se calcula por medio de la expresión:
/217/
log(x ) = log(x ) + K T * σlog(x )
Para esta expresión, el valor de K T se halla tabulado en función de S y del tiempo de recurrencia para
el cual se desea determinar “x”.
9.c.4. DETERMINACION DEL HIDROGRAMA DE LA CRECIDA DE DISEÑO.
Mediante la aplicación de alguna de las expresiones indicadas en el apartado anterior, puede calcularse
el caudal estimado correspondiente a una crecida de un tiempo de recurrencia preestablecido (punto E
de la Figura 86). En el dimensionado de determinadas obras hidráulicas (aliviaderos de presas, por
ejemplo), ese valor aislado no resulta suficiente, debiéndose conocer además la configuración del
hidrograma resultante para toda la crecida.
A estos fines debe partirse del hidrograma más desfavorable contenido en la serie de registros con la
que se cuenta, entendiendo por tal, no excluyentemente, al que corresponde al mayor caudal pico, sino
que debe tomarse en consideración también su tiempo de base y el volumen aportado por la crecida.
Una vez seleccionado este hidrograma (ADC de la Figura 86), se efectúa la separación del flujo base
aplicando alguno de los métodos desarrollados al efecto. Por lo general, el caudal máximo de este
hidrograma, punto D, será inferior al representado por E, punto por el cual deberá pasar el hidrograma
de la crecida de tiempo de recurrencia Tr.
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-22
Para ello puede establecerse la relación de proporcionalidad p = EB DB , multiplicando luego todas las
ordenadas genéricas FG por dicho valor, obteniéndose así los segmentos FH (siempre tomados a
partir de las rectas separadoras del flujo base), cuyos extremos superiores, puntos H, serán puntos de
paso del hidrograma buscado, el que se extenderá desde A hasta C, pasando por E.
Figura 86. Determinación del Hidrograma de una Crecida de Recurrencia Tr
55
E
50
45
40
Caudal [m3/s]
35
H
D
30
25
G
20
15
10
F
A
5
C
B
0
0
30
60
90
120
150
180
210
240
270
Tiempo [min]
En caso que el caudal máximo haya sido calculado con valores de caudales máximos medios diarios, y
exista en el río en estudio una diferencia no despreciable con los máximos instantáneos, deberá
calcularse la relación media más probable entre ambos y ubicar el punto E según el valor
correspondiente al caudal máximo instantáneo de la crecida de proyecto.
Otra alternativa sería la de generar directamente, mediante correlación y regresión, la serie de caudales
máximos instantáneos y trabajar directamente con ella.
9.c.5. GRÁFICAS DE PROBABILIDAD
9.c.5.i.
Papel de Probabilidad
Como una verificación de que la distribución de probabilidad se ajusta al conjunto de datos hidrológicos
a los cuales se la pretende aplicar, los mismos pueden graficarse en un papel de probabilidad diseñado
especialmente para la distribución.
En este tipo de papeles las ordenadas representan el valor de “x” en una cierta escala (en los estudios
de ingeniería hidrológica generalmente caudales o precipitaciones), mientras que las abscisas
corresponden a la probabilidad o el período de retorno.
Las escalas de representación para ambos ejes están diseñadas de manera tal que los valores que
vayan a ser graficados aparezcan próximos a una línea recta, o sea que linealicen la función de
distribución.
De esta forma, trazando la recta compensadora de los puntos representados en la gráfica, puede
procederse fácilmente a realizar estimaciones que requieran procesos de comparación, interpolación o
extrapolación.
En este último caso, sin embargo, el efecto de los errores que pueden producirse se multiplica
rápidamente, posibilidad que debe ser muy tenida en cuenta al aplicar para fines de diseño y
dimensionado de obras los resultados obtenidos.
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9.c.5.ii.
9-23
Posiciones de Graficación
Una posición de graficación se refiere al valor de la probabilidad asignada a cada uno de los datos que
van a graficarse. Para su determinación se han propuesto numerosos métodos, la mayoría de los cuales
son empíricos.
Si “n” es el número total de valores que van a ser graficados y “m” la posición de un valor en una lista
ordenada por magnitud descendente, la probabilidad de excedencia del m-ésimo valor mayor, x m , es,
para “n” grande:
/218/
P( X ≥ x m ) =
m
n
Sin embargo, esta fórmula simple (conocida como la fórmula de California y que data de 1923) produce
una probabilidad del 100% en el caso de m = n, que puede ser difícil de graficar en una escala de
probabilidad.
Como un ajuste, la ecuación anterior puede modificarse a:
/219/
P( X ≥ x m ) =
m −1
n
Aún cuando esta expresión no produce una probabilidad del 100%, sí produce una probabilidad cero
para m = 1, lo que también puede ser difícil de graficar en un papel de probabilidad.
Las dos ecuaciones anteriores representan los límites dentro de los cuales deberían localizarse las
posiciones de graficación apropiadas.
Un término medio entre ellas es la ecuación propuesta por primera vez en 1930 por Hazen:
/220/
m − 0 .5
n
2 * m −1
P( X ≥ x m ) =
2*n
P( X ≥ x m ) =
La ecuación de Weibull (1939) es un término medio con una mejor justificación estadística. Si los “n”
valores están uniformemente distribuidos entre el 0 y el 100% de probabilidad, entonces deben existir
n + 1 intervalos: n − 1 entre los puntos correspondientes a los datos y 2 en los extremos. Este sistema
simple de graficación se expresa mediante la referida ecuación, según la cual:
/221/
P( X ≥ x m ) =
m
n +1
Ésta indica un período de retorno un año mayor que el período de retorno del registro del valor máximo.
Otra ecuación intermedia, conocida como la de Chegodayev (1955), ampliamente utilizada en Rusia y
los países de Europa Oriental es:
/222/
P( X ≥ x m ) =
m − 0.3
n + 0.4
La mayoría de las fórmulas de posición de graficación están representadas por la siguiente expresión
general:
/223/
P( X ≥ x m ) =
m−b
n + 1− 2 * b
Por ejemplo, para la fórmula de Hazen es b = 0,5; para la de Chegodayev, b = 0,3 y para la de Weibull,
b = 0. También son de aplicación frecuente las fórmulas propuestas por Blom (1958) en la que b = ⅜; la
de Tukey (1962) con b = ⅓ y la de Gringorten (1963) con b =0,44.
La elección del valor de b se halla relacionada con el tipo de distribución empleada y la magnitud de los
tiempos de recurrencia con los cuales se trabaja, tratando de buscar siempre el mejor ajuste.
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Unidad 9
9-24
Una vez que la serie de datos ha sido identificada y ordenada las posiciones de graficación calculadas,
puede elaborarse un gráfico de la magnitud en estudio “x” vs Probabilid [P(X ≥ x ) ó P(X < x ) ó Tr ]
para verificar el ajuste de la distribución.
Alternativamente resulta conveniente efectuar la línea ajustada resultante con la información de la
muestra.
Universidad Nacional de Cuyo
Facultad de Ingeniería
Cátedra: Hidrología I
Descargar