Trabajos preliminares para el empleo de la optimización

Trabajos preliminares para el empleo de la optimización multiobjetivo en la comparación de performances de dos modelos hidrológicos para distintos escenarios de pronóstico Facundo J. Alonso(1), Nicolás Le Moine(2), Ludovic Oudin(2), Pierre Ribstein(2), Juan Carlos Bertoni(1) (1) Facultad de Cs. Ex. Fís. y Nat. de la “Universidad Nacional de Córdoba”, Argentina. (2)Laboratorio Sisyphe 7619, “Université Pierre et Marie Curie”, París, Francia. E-mail: [email protected] RESUMEN: Existe en la actualidad un gran número de modelos hidrológicos empleados para realizar el pronóstico de caudales a tiempo real en una cuenca hidrográfica. La mayor parte de dichos modelos han sido desarrollados bajo la premisa de que la información de lluvia y caudales observados es transmitida ininterrumpidamente. Ahora bien, si durante el proceso de pronóstico se produce una falla en el sistema de transmisión de caudales observados al centro de procesamiento de datos, el modelo comienza a trabajar como un simple modelo de simulación, perdiendo todas las ventajas que le atribuían los procesos algorítmicos implicados en el pronóstico. Este trabajo presenta las primeras tareas llevadas a cabo para evaluar la performance de la modelización matemática en distintos escenarios de previsión. Con este propósito se emplean dos modelos matemáticos hidrológicos de transformación lluvia-caudal, denominados “GR” e “IPH2”, de amplia difusión en Francia y Brasil respectivamente. Para la evaluación comparativa de dichos modelos, se prevé la utilización de dos algoritmos genéticos de optimización multi-objetivo, donde el criterio de performance estará representado por el coeficiente de persistencia. El bien probado algoritmo “MOCOM-UA”, será contrastado con la eficacia del moderno “CaRaMEL” para deducir de la Región de Pareto, las características de eficacia y robustez de los modelos probados frente a los distintos escenarios. Los datos son obtenidos de cuencas francesas, españolas y argentinas, con distintas series de paso de tiempo diario y horario. INTRODUCCIÓN Desde los tiempos más remotos de los cuales se tenga alguna evidencia histórica, las poblaciones del mundo presentan una marcada tendencia al asentamiento sobre las márgenes de los cursos de agua dulce. Esto es completamente razonable si consideramos que el agua es un recurso indispensable para una buena parte de las actividades humanas, como son el consumo, la limpieza, la fabricación, el cultivo, etc. La conciencia de planificación urbana no siempre ha acompañado estos cambios, teniendo por consecuencia, en algunos casos, la invasión del lecho histórico del río, y en la misma medida un incremento del grado de vulnerabilidad frente a recurrentes crecidas de los niveles de agua del río. En síntesis, las inundaciones urbanas son un fenómeno cada vez más frecuente en varias regiones del planeta, de las cuales, en nuestro país tenemos algunos ejemplos. Si bien no siempre es posible evitar que se produzca la crecida, existen métodos para reducir, al menos parcialmente, el desastre que acompaña al fenómeno, fundamentalmente en términos de seguridad de las personas. Entre estos métodos, se encuentran los Sistemas de Pronóstico de Crecidas, cuya complejidad puede ser muy variable en función de los componentes que lo integren. Normalmente los sistemas de pronóstico de crecidas están vinculados a una red de alerta frente a inundaciones que pone en movimiento el personal de Defensa Civil, que se ocupará de evacuar las zonas con alta probabilidad de inundación y con marcada vulnerabilidad frente a la llegada del agua. En este más o menos complejo sistema de previsión aparecen como herramientas claves los modelos hidrológicos de pronóstico de crecidas. Es decir, aquellas estructuras matemáticas capaces de utilizar la información disponible de lluvia y caudal para estimar con algún grado de probabilidad, cuál será el caudal (o nivel) de agua que llegará a una sección determinada de interés, con algún horizonte de tiempo de anticipación. El grado de precisión con que un modelo hidrológico es capaz de estimar estos valores depende de algunos factores, como la calidad del modelo mismo para realizar el pronóstico, pero fundamentalmente los datos disponibles. La mayor parte de dichos modelos han sido desarrollados bajo la premisa de que la información de lluvia y caudales observados es transmitida ininterrumpidamente. Ahora bien, si durante el proceso de pronóstico se produce una falla en el sistema de transmisión de caudales observados al centro de procesamiento de datos, el modelo comienza a trabajar como un simple modelo de simulación, perdiendo todas las ventajas que le atribuían los procesos algorítmicos implicados en el pronóstico. Este trabajo constituye los primeros pasos en el análisis de las consecuencias que puede acarrear a la capacidad del modelo en la predicción de caudales la ausencia de la información transmitida a tiempo real. La propuesta de trabajo incluye el empleo de una metodología de optimización multi-objetivo capaz de generar la Región de Pareto optimizando los parámetros para un modelo hidrológico frente a dos condiciones distintas: 1) considerar el modelo funcionando como un simple modelo de simulación, asumiendo que se ha perdido durante el pronóstico la transmisión de datos de caudal en la sección de aforo medidos en tiempo real, y 2) el modelo trabajando con la disponibilidad de la información referida. Como metodología de optimización se ha propuesto el empleo de dos algoritmos multi-objetivo, denominados MOCOM-UA (Yapo et al., 1998) y CaRaMEL (Le Moine, 2009), y como modelos hidrológicos, los modelos IPH2 (Tucci et al., 1981) y Génie Rural Prévision horario (Berthet, 2010). El propósito de esta publicación es presentar el estado de avance en la línea de trabajo descripta previamente y mostrar algunos resultados preliminares. Con el fin referido, se ha escrito un programa computacional en lenguaje Fortran 90/95 que ejecuta la optimización mediante el algoritmo MOCOM-UA de ambos modelos hidrológicos GRP e IPH2, con la salvedad de que este último aún no se encuentra en su versión final del modo previsión. Actualmente se está trabajando además en compatibilizar al programa referido, un segundo programa computacional escrito en lenguaje SciLab, con el cual se ejecuta el algoritmo CaRaMEL. Por esta razón, a continuación se presenta solamente una descripción completa del modelo GRP y del algoritmo de optimización MOCOM-UA, de los cuales se muestran al final algunos resultados preliminares. Una descripción completa del modelo IPH2 puede encontrarse en Alonso (2008), y del algoritmo CaRaMEL en Le Moine (2009). EL PRONÓSTICO HIDROLÓGICO Conforme es descripto en Bertoni (2004), la previsión de caudales en un determinado lugar puede ser realizada a corto plazo (tiempo real) o a largo plazo. La previsión de corto plazo se denomina pronóstico en tiempo real e implica la predicción de la magnitud de la crecida cuando la precipitación es conocida o prevista. Entonces, se emplea un modelo matemático-hidrológico que calcula el caudal (o el nivel) del río en base a la precipitación conocida o prevista. El pronóstico de crecidas se realiza por lo general con pocas horas o días de antecedencia, dependiendo del tiempo que requiere el agua, después de precipitada, para escurrir por la cuenca hidrográfica hasta la sección del río donde se desea la información. Un sistema de alerta de pronóstico en tiempo real envuelve los siguientes aspectos: 1) sistema de colecta y transmisión de informaciones; 2) sistema de procesamiento de informaciones; 3) modelo de previsión de caudales y niveles; 4) procedimientos para la transferencia de informaciones para la Defensa Civil y la sociedad; y 5) planificación de las situaciones de emergencia a través de la Defensa Civil. Los tres primeros ítems implican el establecimiento de procedimientos técnicos específicos. Normalmente estas actividades son desarrolladas por entidades que operan la red de alerta provincial o federal. Los dos ítems siguientes implican la transferencia de los niveles para la población. Como lo apunta adecuadamente Berthet (2010), los modelos hidrológicos usados para realizar simulación son concebidos con distinto criterio que aquellos empleados en previsión. La simulación se interesa de la misma manera por los datos asociados a todos los pasos de tiempo pasados, y no utilizan más datos que aquellos que sean causales de caudal. Mientras que la previsión se concentra en un pequeño número de pasos de tiempo próximos al instante de previsión, y permite el empleo de todo dato pasado explicativo, aún cuando no sea causal del caudal que se desea predecir en la sección de interés. Berthet (2010) indica además que un modelo de estas características, debe imperativamente tener buena performance, es decir proveer las previsiones posibles. En este sentido sería deseable que el modelo sea: 1. Robusto: debe funcionar a partir de datos comúnmente medidos por el servicio operativo, pero también ser adaptable a situaciones deficientes (carencia de datos o mala estimación por ejemplo). 2. Simple de emplear: un modelo que exige el control de numerosos datos y de numerosos datos y operaciones de parte del usuario, es inutilizable frente a una situación de crisis o urgencia. 3. Capaz de proveer una representación del funcionamiento de la cuenca hidrográfica comprensible por el hidrólogo: este último podrá entonces construir su experiencia del modelo, acrecentar su conocimiento en el mismo, anticipar una parte de sus errores. 4. No específico a un sitio en particular sino capaz de adaptarse a diferentes cuencas hidrográficas. DESCRIPCIÓN DEL MODELO HIDROLÓGICO GÉNIE RURAL PRÉVISION (GRP) Como puede leerse en Perrin et al. (2007), el “CEMAGREF” (centro de investigación de Francia, actualmente “IRSTEA”) comenzó a desarrollar a comienzos de los años 1980 los modelos hidrológicos Génie Rural (GR) capaces de realizar la vinculación entre la lámina de agua caída en la cuenca hidrográfica y el caudal correspondiente producido en su sección de concentración. Más allá de su aspecto práctico, estos modelos han planteado los interrogantes esenciales respecto del modo de representar la transformación de la lluvia en caudal a la escala de cuenca hidrográfica. Desde aquel punto de partida, en que fue planteada una estructura original del modelo, hasta el presente, el mismo ha presentado una secuencia de versiones asociadas a ciertas variaciones en su estructura relativas principalmente al paso de tiempo de la serie empleada en la simulación. Estas versiones arribaron actualmente a los modelos GR1A con paso de tiempo anual (Mouelhi, 2003), GR2M con paso de tiempo mensual (Mouelhi et al., 2006b), GR4J con paso de tiempo diario (Perrin et al., 2003), y GR4H con paso de tiempo horario (Mathevet, 2005). Adicionalmente Tangara (2005) propuso el modelo GRP que representa un salto en la cadena evolutiva de los modelos hidrológicos Génie Rural al campo de la previsión hidrológica, empleándolo con series de datos diarios. Posteriormente Berthet (2010) y Lilas et al. (2012) emplearon el modelo GRP con series de datos horarios. Cada una de las versiones referidas ha sido puesta a punto bajo el respaldo de un gran número de cuencas de distintas partes del mundo. Por ej. en Perrin (2000) y en Tangara (2005) se emplearon respectivamente 429 y 188 cuencas de Francia, Estados Unidos, Australia, Costa de Marfil y Brasil. Sin embargo, uno de los criterios asumidos fue la simplicidad de las estructuras alcanzadas para los modelos, por esta razón las versiones posteriores al modelo GR4J (Perrin, 2000) sólo presenta pequeñas diferencias respecto de este. Así Tangara (2005) incorporó a la estructura del modelo, un componente que tiene en cuenta la actualización de algunas variables de estado sobre la base de los caudales observados, mientras que Berthet (2010) y Lilas et al. (2012) ajustaron ciertos parámetros fijos del modelo para adaptarlo al procesamiento de datos horarios en pronóstico hidrológico. En este trabajo se utilizó un modelo combinado de las versiones anteriores, capaz de trabajar en simulación o previsión, según sea preferido por el usuario, y de procesar información con paso de tiempo diario y horario, según sea la naturaleza de los datos empleados. Por las razones antes expuestas, a continuación se describe la estructura del modelo GR4J, como es presentado en Perrin (2007), y luego se precisan aquellas modificaciones necesarias para ser adaptado al proceso de pronóstico hidrológico y para permitir el procesamiento de información de distintos pasos de tiempo. En la Figura 1 se presenta un esquema de la estructura del modelo, donde Pk es la lluvia diaria del día k y E la evapotranspiración potencial promedio para el mismo día calendario. Neutralización La primera operación es la neutralización de Pk por E para determinar una lluvia neta Pn y una evapotranspiración neta En calculada por: Si Pk ≥ E, entonces Pn = Pk – E y En = 0 Si Pk < E, entonces Pn = 0 y En = E – Pk Figura 1.- Esquema de la estructura del modelo GR4J con el proceso de actualización Función de producción En el caso en el cual Pn es distinto de cero, una parte Ps de Pn alimenta al reservorio de producción y es calculado por la ecuación (1), donde X1 (mm) es la capacidad máxima del reservorio de producción y Sk el contenido del reservorio de producción al comienzo del día k. 𝐏𝐏𝐬𝐬 = 𝐒𝐒 𝟐𝟐 𝐏𝐏 𝐗𝐗 𝟏𝟏 �𝟏𝟏−�𝐗𝐗𝐤𝐤 � � 𝐭𝐭𝐭𝐭𝐭𝐭𝐭𝐭�𝐗𝐗𝐧𝐧 � 𝟏𝟏 𝐒𝐒 𝐏𝐏 𝟏𝟏+�𝐗𝐗𝐤𝐤 � 𝐭𝐭𝐭𝐭𝐭𝐭𝐭𝐭�𝐗𝐗𝐧𝐧 � 𝟏𝟏 𝟏𝟏 𝟏𝟏 (1) En el caso contrario, cuando En es distinto de cero, una cantidad de evaporación Es es retirada del reservorio de producción, la cual está dada por: 𝐄𝐄𝐬𝐬 = 𝐒𝐒 𝐄𝐄 𝐒𝐒𝐤𝐤 �𝟐𝟐−𝐗𝐗𝐤𝐤 � 𝐭𝐭𝐭𝐭𝐭𝐭𝐭𝐭�𝐗𝐗𝐧𝐧 � 𝟏𝟏 𝟏𝟏 𝐒𝐒 𝐄𝐄 𝟏𝟏+�𝟏𝟏−𝐗𝐗𝐤𝐤 � 𝐭𝐭𝐭𝐭𝐭𝐭𝐭𝐭�𝐗𝐗𝐧𝐧 � 𝟏𝟏 𝟏𝟏 (2) El contenido del reservorio que resulta de esas operaciones está dado por: 𝐒𝐒 ′ = 𝐒𝐒𝐤𝐤 + 𝐏𝐏𝐬𝐬 − 𝐄𝐄𝐬𝐬 (3) Percolación Una salida por percolación Perc del reservorio de producción es calculada entonces por la ecuación (4). Por lo tanto, el contenido del reservorio se vuelve la ecuación (5), y la cantidad de agua Pr que alcanza finalmente la parte de tránsito del modelo está dada por la ecuación (6). 𝐏𝐏𝐏𝐏𝐏𝐏𝐏𝐏 = 𝐒𝐒′ �𝟏𝟏 − �𝟏𝟏 + � 𝟏𝟏 − 𝟒𝟒 𝐒𝐒′ 𝟒𝟒 𝟒𝟒 𝟗𝟗 𝐗𝐗 𝟏𝟏 𝐒𝐒𝐤𝐤+𝟏𝟏 = 𝐒𝐒 ′ − 𝐏𝐏𝐏𝐏𝐏𝐏𝐏𝐏 � � � 𝐏𝐏𝐫𝐫 = 𝐏𝐏𝐏𝐏𝐏𝐏𝐏𝐏 + (𝐏𝐏𝐧𝐧 − 𝐏𝐏𝐬𝐬 ) Hidrogramas unitarios (4) (5) (6) Pr es dividido en dos componentes de escurrimiento, 90% distribuido por un hidrograma unitario HU1 y un reservorio de tránsito, y 10% por un hidrograma unitario HU2. HU1 y HU2 dependen del mismo parámetro X4, tiempo base del HU1 expresado en días. Las ordenadas de los hidrogramas son calculadas a partir de las curvas S registradas respectivamente como SH1 y SH2, que corresponden a las funciones acumuladas del hidrograma. SH1 es definida en función del tiempo por: Para t ≤ 0, 𝐒𝐒𝐒𝐒𝐒𝐒(𝐭𝐭) = 𝟎𝟎 (7) 𝐭𝐭 Para 0 < t < X4, 𝐒𝐒𝐒𝐒𝐒𝐒(𝐭𝐭) = � � 𝐗𝐗 𝟒𝟒 Para t ≥ X4, 𝐒𝐒𝐒𝐒𝐒𝐒(𝐭𝐭) = 𝟏𝟏 𝟓𝟓� 𝟐𝟐 (8) (9) SH2 es definida de manera similar por: Para t ≤ 0, 𝐒𝐒𝐒𝐒𝐒𝐒(𝐭𝐭) = 𝟎𝟎 ( 10 ) 𝟏𝟏 𝐭𝐭 Para 0 < t < X4, 𝐒𝐒𝐒𝐒𝐒𝐒(𝐭𝐭) = � � 𝟐𝟐 𝐗𝐗 𝟒𝟒 𝟓𝟓� 𝟐𝟐 𝟏𝟏 ( 11 ) 𝐭𝐭 Para X4 < t < 2X4, 𝐒𝐒𝐒𝐒𝐒𝐒(𝐭𝐭) = 𝟏𝟏 − � � Para t ≥ 2X4, 𝐒𝐒𝐒𝐒𝐒𝐒(𝐭𝐭) = 𝟏𝟏 𝟐𝟐 𝐗𝐗 𝟒𝟒 𝟓𝟓� 𝟐𝟐 ( 12 ) ( 13 ) Las ordenadas de HU1 y HU2 son entonces calculadas por: 𝐔𝐔𝐔𝐔𝐔𝐔(𝐣𝐣) = 𝐒𝐒𝐒𝐒𝐒𝐒(𝐣𝐣) − 𝐒𝐒𝐒𝐒𝐒𝐒(𝐣𝐣 − 𝟏𝟏) 𝐔𝐔𝐔𝐔𝐔𝐔(𝐣𝐣) = 𝐒𝐒𝐒𝐒𝐒𝐒(𝐣𝐣) − 𝐒𝐒𝐒𝐒𝐒𝐒(𝐣𝐣 − 𝟏𝟏) ( 14 ) ( 15 ) Donde j es un entero. A cada paso de tiempo k, las salidas Q9 y Q1 de los dos hidrogramas corresponden a la convolución de las lluvias anteriores por la metodología de repartición dada por el hidrograma discretizado y son calculadas por: 𝐐𝐐𝐐𝐐(𝐤𝐤) = 𝟎𝟎, 𝟗𝟗 ∑𝐥𝐥𝐣𝐣=𝟏𝟏 𝐔𝐔𝐔𝐔𝐔𝐔 (𝐣𝐣). 𝐏𝐏𝐏𝐏(𝐤𝐤 − 𝐣𝐣 + 𝟏𝟏) ( 16 ) 𝐐𝐐𝐐𝐐(𝐤𝐤) = 𝟎𝟎, 𝟏𝟏 ∑𝐦𝐦 𝐣𝐣=𝟏𝟏 𝐔𝐔𝐔𝐔𝐔𝐔 (𝐣𝐣). 𝐏𝐏𝐏𝐏(𝐤𝐤 − 𝐣𝐣 + 𝟏𝟏) ( 17 ) Donde l = int(X 4 ) + 1 y m = int(2. X4 ) + 1, con int(.) representando la parte entera. Función de Intercambio con el exterior no atmosférico Un intercambio subterráneo en agua es calculado por: 𝐑𝐑 𝐤𝐤 𝟕𝟕� 𝟐𝟐 𝐅𝐅 = 𝐗𝐗 𝟐𝟐 . � � 𝐗𝐗 𝟑𝟑 ( 18 ) Donde Rk es el nivel en el reservorio al comienzo del paso de tiempo, X3 la capacidad a un día del reservorio y X2 el coeficiente de intercambio en agua que puede ser positivo en el caso de aportes, negativos en el caso de pérdidas hacia las napas profundas, o nulo. En efecto, la interpretación física de esta función de intercambio no es directa. Reservorio de tránsito El nivel en el reservorio de tránsito es modificado agregando la salida Q9 del hidrograma HU1 y F, según la ecuación (19). El mismo se vacía posteriormente mediante una salida Qr dada por la ecuación (20), y el nivel del reservorio se vuelve entonces la ecuación (21). 𝐑𝐑′ = 𝐦𝐦𝐦𝐦𝐦𝐦(𝟎𝟎; 𝐑𝐑 𝐤𝐤 + 𝐐𝐐𝐐𝐐(𝐤𝐤) + 𝐅𝐅) 𝟏𝟏 − 𝐑𝐑′ 𝟒𝟒 𝟒𝟒 𝐐𝐐𝐫𝐫 = 𝐑𝐑′ �𝟏𝟏 − �𝟏𝟏 + � � � � 𝐗𝐗 𝟑𝟑 𝐑𝐑 𝐤𝐤+𝟏𝟏 = 𝐑𝐑′ − 𝐐𝐐𝐫𝐫 Escurrimiento total ( 19 ) ( 20 ) ( 21 ) La salida Q1 del hidrograma HU2 es sometida al mismo intercambio para dar la componente de caudal Qd: 𝐐𝐐𝐝𝐝 = 𝐦𝐦𝐦𝐦𝐦𝐦(𝟎𝟎; 𝐐𝐐𝐐𝐐(𝐤𝐤) + 𝐅𝐅) ( 22 ) 𝐐𝐐𝐤𝐤 = 𝐐𝐐𝐫𝐫 + 𝐐𝐐𝐝𝐝 ( 23 ) El caudal total Q es entonces dado por: Parámetros De la presentación anterior, se deduce que el modelo GR4J tiene cuatro parámetros a calibrar, que son: - X1: capacidad del reservorio de producción (mm) - X2: coeficiente de intercambio subterráneo (mm) - X3: capacidad a un día del reservorio de tránsito (mm) - X4: tiempo base del hidrograma unitario HU1 (Dt, ej. en días) Estructura de actualización Continuando con la ejemplificación a paso de tiempo diario, seguidamente se presenta, según Tangara (2005), el componente de la estructura del modelo hidrológico que tiene en cuenta el proceso de actualización para el pronóstico de caudal. El algoritmo utilizado está esquematizado en la Figura 2, y representa el día de hoy (subíndice 1) en el cual se lleva a cabo la operación de previsión, y el día de mañana en el cual el caudal es pronosticado (subíndice 2). a) Sean P1 y E1 la lluvia y la evapotranspiración potencial observados para hoy. Estas entradas harán evolucionar el nivel del reservorio de suelo S para alcanzar el nivel S1, simulado por el modelo, para el comienzo del día de hoy. Este nivel S1 del reservorio de suelo evoluciona al curso del día para tender hacia el nivel S1 al final del día de hoy, dejando una lluvia neta PR1 como salida del reservorio de suelo S. Esta lluvia neta PR1 es retardada por el hidrograma unitario (HU) que entrega una lluvia PH1 en su salida, que finalmente se agrega al nivel del reservorio de transferencia R. Este nivel R1 del reservorio de transferencia R evoluciona al curso del día para tender hacia el nivel R1 al final del día de hoy, liberando un caudal Q1 simulado, para el día de hoy. b) En realidad, el caudal observado para el día de hoy es O1, es distinto al caudal Q1 calculado por el modelo para este mismo día. c) Entonces, se reajusta el nivel R1 del reservorio de transferencia R hasta alcanzar el nivel R1’ que debería tener, como el nivel de hoy, para entregar el caudal Q1’ igual al caudal O1 observado ese mismo día, y producir el nivel R2’ al final del día. d) El proceso precedente se repite de la misma manera para los días siguiente hasta el final de las observaciones, considerando a cada etapa de nuevas estimaciones como las nuevas condiciones iniciales del modelo. Figura 2.- Esquema del proceso de actualización del modelo GRP DESCRIPCIÓN DEL ALGORITMO DE OPTIMIZACIÓN MULTI-OBJETIVO MOCOM-UA El algoritmo MOCOM-UA (Yapo et al., 1998) es un método de optimización multi-objetivo, basado en la Técnica de los Algoritmos Genéticos. Básicamente consiste en encontrar la Región de Pareto entre dos o más criterios de optimización de un modelo matemático. A continuación se presenta una descripción sucinta del método, asumiendo como criterio de optimización la minimización cuantitativa de dos o más funciones objetivo. Generación de la población inicial Se establece el rango de validez de los parámetros del modelo matemático, que definen un hipercubo de validez de los parámetros. Luego, se genera aleatoriamente una población de puntos con distribución probabilística uniforme en su interior. Clasificación y ordenamiento de los individuos de la población Para realizar la clasificación se evalúa cada una de las FO para cada uno de los puntos de la población. Luego de la evaluación resultarán puntos que tienen menor (o sea, mejor) valor que otros en todas las funciones objetivos tomadas como criterio de optimización, en cuyo caso no cabe duda que estos puntos son mejores que los otros. Pero el problema se plantea cuando se observa que hay puntos que tienen menor valor que otro en algunas FO, pero mayor en otras FO. No puede establecerse un orden de prioridad si hay puntos mejores que otros con el criterio de una de las FO, pero peores con el criterio de la otra. Por ejemplo, supóngase que se tiene dos FO, denominadas FO1 y FO2. Si un punto A tiene menor valor de FO1 que otro B, pero mayor valor de FO2, entonces no puede decirse que A es mejor que B, ni tampoco que B es mejor que A. Entonces surgen los conceptos de puntos Dominados y puntos No Dominados. Son puntos Dominados aquellos tales que existe otro punto que es mejor que ellos en todas las FO. Y por consiguiente, los restantes puntos son No Dominados. Entonces, se eligen todos los puntos no dominados de la población y se dice que forman el Nivel 1. Una vez que se retiran de la población esos puntos no dominados, habrá ahora, otros puntos que son dominados, y otros no dominados. Entonces se retiran los nuevos puntos no dominados y se dice que pertenecen al Nivel 2. Una vez retirados estos puntos no dominados, se toman los restantes y se identifican los nuevos puntos no dominados, y así sucesivamente, hasta que resulte un conjunto de puntos tal que todos ellos son no dominados. De acuerdo al esquema de jerarquización antes explicado, resultará una serie de niveles, y en cada nivel habrá un conjunto de puntos. Entonces se dice que los puntos del nivel 1, son todos mejores que los puntos del nivel 2, y estos mejores que los del nivel 3, y así sucesivamente. Pero no hay manera de identificar cuál de los puntos del nivel 1 es el mejor. Puede suponerse que todos los puntos de un mismo nivel tienen la misma jerarquía. El ranking de este modo logrado se denomina Ranking de Pareto. Construcción de complejos Una vez que los puntos de la población se han jerarquizado en niveles, se les atribuye peso a cada uno de los puntos. Todos los puntos de un mismo nivel tendrán el mismo peso, pero mayor peso que los puntos de niveles inferiores. Luego se eligen tantos complejos como puntos tiene el último nivel. Por ejemplo, supongamos que luego de la jerarquización, se obtengan "n" niveles, y que en el nivel octavo (el último) hayan quedado "q" puntos de la población. Entonces, deben elegirse 25 complejos de la población, tales que, cada complejo debe tener uno de los puntos del último nivel y el resto de los puntos del complejo se eligen de la población aleatoriamente, pero dándole mayor probabilidad de ser elegido a los que tienen mayor peso, o sea, a los mejores. Evolución independiente de cada complejo Una vez que la muestra ha sido separada en "q" complejos, se da a cada complejo la oportunidad de evolucionar en forma independiente mediante una búsqueda local de acuerdo al algoritmo de Nelder y Mead, que se explica seguidamente. Se repite para cada complejo varias veces el algoritmo de Nelder y Mead, siendo el criterio de aceptación o rechazo de un punto que sea no dominado. Por ejemplo, cuando se genera el punto de reflexión, se verifica que no haya ningún punto que tenga menor valor en ambas FO; si es así, entonces se acepta el punto, puesto que es no dominado. Una vez que cada complejo ha evolucionado independientemente, se arma nuevamente la población con todos los complejos cambiados, y se vuelve a ordenar por jerarquía los puntos, para poder nuevamente elegir los complejos que serán vueltos a evolucionar. Así se continúa sucesivamente hasta que no sea posible encontrar puntos dominados. Es decir que todos los puntos de la población se encuentren en el nivel 1 del ranking de Pareto. Como consecuencia, el resultado final de este algoritmo no es un punto óptimo, como lo era el SCE, sino una población óptima de puntos que forma la región de Pareto. Algoritmo de Nelder y Mead Es un método de búsqueda local que se lleva a cabo dirigiendo la evolución de un conjunto de individuos hacia el óptimo local. Una vez que el complejo ha sido seleccionado del modo que se explicó previamente, será sometido a este algoritmo siguiendo los pasos que se explican a continuación. Cálculo del centro de gravedad. Se identifica el peor punto de los "q" individuos del complejo (que es el punto que se tomó del último nivel de la población, como se explicó previamente) y se calcula el centro de gravedad de los (q-1) mejores puntos, mediante la expresión: 1 q −1 g= ∑uj | q − 1 j =1 ( 24 ) Donde uj es el vector posición del individuo j-ésimo, y g es el vector de coordenadas del centro de gravedad de los q-1 mejores puntos. Cálculo del punto de reflexión. Si trazamos un segmento que parta del peor punto del complejo, que pase por el centro de gravedad de los (q-1) mejores puntos, y luego se prolongue más allá del centro de gravedad una distancia igual a la distancia que lo separa del peor punto, obtendremos un punto “r” equidistante al centro de gravedad con el peor punto. Ese punto así obtenido, se denomina punto de reflexión, y su vector de coordenadas de ubicación puede calcularse como: r = 2 g − uq ( 25 ) Evaluación del punto de reflexión. Se calcula el valor de sus dos FO y se compara con los valores de las FO del peor punto. Si es no dominado, el punto r reemplaza al peor, caso contrario, sigue en el paso siguiente. Cálculo del punto de contracción. Como se dijo en el paso anterior, si r fuese peor que el peor punto del complejo, se calculan las coordenadas de un nuevo punto “c” denominado punto de contracción, y sus coordenadas son calculadas de acuerdo con la ecuación: c= (g + u ) q ( 26 ) 2 Este punto está ubicado sobre el segmento que une el centro de gravedad de los (q-1) mejores puntos y el peor punto, equidistante a ambos. Evaluación del punto de contracción. Si el punto c es no dominado, reemplazará al peor punto, en caso contrario, es definido el menor hipercubo que contiene todos los puntos del complejo, y se genera aleatoriamente en su interior un nuevo punto (z). EL CRITERIO DE PERSISTENCIA En los modelos hidrológicos de simulación normalmente se emplea el criterio de Nash-Sutcliffe (ecuación 27) para medir la calidad de un ajuste. Este coeficiente normaliza respecto de la media de caudales calculados. n R = 1− 2 F = 1− F02 ∑ (Q − Qcalc ,i ) ∑ (Q − Qobs ) i =1 n i =1 obs ,i obs ,i 2 ( 27 ) 2 Sin embargo, este coeficiente no es buen indicador para un modelo aplicado al pronóstico porque en pronóstico la medida comparativa que establece la escala de referencia no es el caudal promedio (o la diferencia promedio de caudales) de todo el hidrograma, sino que nos interesa específicamente el tramo de hidrograma en el paso en que estamos pronosticando. En la Figura 3, em y er indican el error del cálculo de caudal y la diferencia entre un valor de caudal y el correspondiente a un tiempo L de diferencia, respectivamente. Q Hidrogr. Observado m1 r2 Hidrogr. Pronosticado m1 r1 m1 L to L to+L L to+2L to+3L t Figura 3.- Descripción de las variables que intervienen en el Coeficiente de Persistencia Se define el “coeficiente de persistencia” como un criterio más racional de evaluación de la calidad del ajuste en un proceso de pronóstico hidrológico, como se muestra en la ecuación 28. 𝐏𝐏𝐏𝐏 = 𝟏𝟏 − ∑ 𝛆𝛆𝟐𝟐𝐦𝐦 ∑ 𝛆𝛆𝟐𝟐𝐫𝐫 ( 28 ) La dimensión er indica la medida de referencia con la cual se adimensionaliza el error de pronóstico. PROPUESTA METODOLÓGICA La calidad de un modelo de pronóstico hidrológico a tiempo real está manifestada principalmente por el grado de precisión en la predicción de los valores de caudal (y nivel) en una determinada sección de interés de un río, con un cierto horizonte de previsión. Ahora bien, dicho proceso está fuertemente ligado a los datos de caudales observados a tiempo real en la sección de aforo. La falta de dichos valores puede originar una caída abrupta de la precisión del pronóstico. Por esa razón, puede tomarse también como otra manera de medir la calidad del modelo de previsión, la capacidad de continuar trabajando con un pronóstico aceptable durante el evento extremo, aún cuando carezca de los valores de caudal medidos a tiempo real. En consecuencia, se propone el estudio de la respuesta del modelo frente a distintos escenarios de previsión. Por un lado, se pretende encontrar el juego de valores de los parámetros que optimiza el modelo empleado frente al escenario de disponibilidad de los datos de caudal, medidos a tiempo real, y por otro lado se pretende encontrar el que minimiza el error cometido en la previsión asumiendo que se pierde la información referida por cualquier motivo. Debido a que el juego de valores de parámetros que optimiza uno de los escenarios referidos no tiene porqué coincidir (y normalmente no coincide) con aquel que optimiza el otro escenario propuesto, se emplea una metodología capaz de encontrar ambos juegos de parámetros y un conjunto de juegos de parámetros que representen soluciones de compromiso intermedias entre las dos condiciones extremas planteadas, obteniendo de este modo la Región de Pareto. El criterio empleado para evaluar el grado de performance del pronóstico es el coeficiente de persistencia. RESULTADOS PRELIMINARES Y COMENTARIOS A los fines de poner a prueba la metodología, se llevó a cabo una optimización con dos objetivos, representados por el criterio de persistencia en ambos escenarios extremos (con y sin datos de actualización), y se encontró la Región de Pareto. La cuenca empleada fue “Le Gardon de St-Jean” (en Corbès, Francia), con una serie de 84.000 datos de lluvia y caudal con paso de tiempo horario. La cuenca referida posee un área de unos 263 km2. Se adoptó un horizonte de previsión de 4 horas. Para la aplicación del algoritmo MOCOM-UA se adoptó una población aleatoria inicial de 150 individuos, y 20 individuos para cada complejo. Conforme el proceso de optimización, la población fue subdividida en complejos 1743 veces, y fueron necesarias 31765 llamadas del modelo hidrológico Génie Rural, en sus modo simulación y previsión por cada llamada. En la Figura 4 se presenta la evolución de la población cada 100 subdivisiones en complejos de la población, y se observa cómo en la última subdivisión es alcanzada la Región de Pareto. Es importante destacar para la adecuada observación de los resultados, que el coeficiente de persistencia puede variar entre un valor de uno, con ajuste perfecto, a menos infinito. Si analizamos la curva envolvente representada por la Región de Pareto, notaremos que se ha alcanzado finalmente dos soluciones extremas: la que optimiza el coeficiente de persistencia (PC) para el modelo en modo simulación, y el que lo optimiza en modo previsión (con datos de caudal a tiempo real). En el primer caso se ha obtenido 0.32, y para el segundo 0.95 aproximadamente. 1 0.95 PC en modo Previsión 0.9 0.85 0.8 0.75 0.7 Subdiv: 100 Subdiv: 200 Subdiv: 300 Subdiv: 400 Subdiv: 500 Subdiv: 600 0.6 Subdiv: 700 Subdiv: 800 Subdiv: 900 Subdiv: 1000 Subdiv: 1100 Subdiv: 1200 0.55 Subdiv: 1300 Subdiv: 1400 Subdiv: 1500 Subdiv: 1600 Subdiv: 1700 Subdiv: 1743 0.65 0.5 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 PC en modo Simulación Figura 4.- Evolución de la población de soluciones optimizada hasta la Región de Pareto De estos valores se deduce en primer lugar que el ajuste, aún con el mejor juego de valores de los parámetros, no es bueno para el caso en que no se disponga de los datos de actualización, mientras que en el otro caso el mejor ajuste fue muy bueno. Otro aspecto que puede destacarse es que el peor valor alcanzado por la población en la Región de Pareto para la condición en previsión es del orden de 0.6, es decir todavía mejor que la mejor condición del modelo en modo simulación. De allí se deduce rápidamente la importancia de los datos de caudal a tiempo real. Sin embargo, si recorremos la curva de Pareto de izquierda a derecha, notamos que al principio su gradiente es suave, con lo cual, se puede permitir un mejoramiento considerable del modelo en modo simulación sin perder calidad el pronóstico del mismo en modo previsión. En palabras numéricas, esto indica que se puede permitir un juego de valores de parámetros que ajusten considerablemente (o tan bien como sea posible) el modelo para que trabaje como si no se dispusiera de datos de caudal a tiempo real, y aún así no se estará sacrificando demasiada calidad en la previsión en el caso de que sí se disponga de esos datos. Por último, puede hacerse algún comentario respecto del algoritmo de optimización relativo a que puede notarse que en las primeras iteraciones el método alcanzó una población con valores muy semejantes a la región de Pareto, aún cuando fue necesario un gran número de iteraciones para llegar finalmente a una población no dominada en su totalidad. Esto indica que de requerir un ajuste de urgencia, puede aplicarse una solución intermedia del proceso de búsqueda de la región óptima mediante un corte prematuro de la ejecución de la búsqueda, para lo cual la herramienta informática debe estar diseñada. REFERENCIAS Alonso, F.J. (2008). Calibración Automática de un Modelo Hidrológico basada en Algoritmos Genéticos, aplicación a dos cuencas típicas argentinas. Tesis de Maestría en Ciencias de la Ingeniería, Mención en Recursos Hídridos. Universidad Nacional de Córdoba. Berthet, L. (2010). Prévision des crues au pas de temps horaire: pour une meilleure assimilation de l’information de débit dans un modèle hydrologique. PhD Thesis de l’Institut des Sciences et Industries du Vivant et de l’Environnement AgroParisTech. Bertoni, J.C. (2004). Curso sobre Gestión de Inundaciones en Áreas Urbanas. Programa de Capacitación para Gestores y Tomadores de Decisión Públicos en el Campo de los Recursos Hídricos. Global Water Partnership, South America - Asociación Mundial del Agua. Le Moine, N. (2009). Description de l’algorithme développé pour le calage automatique du modele CEQUEAU. Rapport intermédiaire n2. Edf-R&D-UPMC. Lilas, D., Perrin C., Andréassian V. (2012). Comparaison et évaluation de trois modèles de prévisions des crues sur le bassin de la Sarre. SCHAPI Service Central d'Hydrométéorologie et d'Appui à la Prévision des Inondations. Mathevet, T. (2005). Quels modèles pluie-debit globaux au pas de temps horaire ? Développements empiriques et comparaison de modèles sur un large échantillon de bassins versants. Thèse de Doctorat, à l'Ecole Nationale du Génie Rural, des Eaux et Forêts, 463 pp. Mouelhi, S. (2003). Vers une chaîne cohérente de modèles pluie-débit conceptuels globaux aux pas de temps pluriannuel, annuel, mensuel et journalier. Thèse de Doctorat, ENGREF, Cemagref Antony, France, 323 pp. Mouelhi, S., Michel, C., Perrin, Ch., Andréassian, V. (2006). Stepwise development of a two-parameter monthly water balance model. Journal of Hydrology 318 (2006) 200–214. Perrin, C. (2000). Vers une amélioration d'un modèle global pluie-débit au travers d'une approche comparative. Thèse de Doctorat, INPG (Grenoble) / Cemagref (Antony), 530 pp. Perrin, Ch., Michel, C., Andréassian, V. (2003). Improvement of a parsimonious model for streamflow simulation. Journal of Hydrology 279 (2003) 275–289. Perrin, Ch., Michel, C., Andréassian, V. (2007). Modèles hydrologiques du Génie Rural (GR). Rapport de Cemagref, UR Hydrosystèmes et Bioprocédés. Tangara, M. (2005). Nouvelle méthode de prévision de crue utilisant un modèle pluie-débit global. Thèse de Doctorat, Ecole pratique des hautes études de Paris - Sciences de la Vie et de la Terre, Paris, 374 pp. Tucci, C.E.M., Ordonez, J.S., Simões, M.L. (1981). Modelo Matemático Precipitaşão-Vazão IPH II Alguns Resultados. Anais IV Simpósio Brasileiro de Recursos Hídricos. ABRH Fortaleza. Yapo, P.O., Gupta, H. V. and Sorooshian, S. (1998). Multi-objective global optimization for hydrologic models. Journal of Hydrology. Vol. 204. Pags. 83-97.

Trabajos preliminares para el empleo de la optimización

Documentos relacionados

Productos

Apoyo

Trabajos preliminares para el empleo de la optimización

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib