La predicción por ensambles Agradecimientos: este material se basa en el módulo de “Explicación del pronóstico por ensambles” tomado del Programa COMET (www.comet.ucar.edu www.comet.ucar.edu)) Laboratorio de Previsión del Tiempo I cuatrimestre 2011 Dra. Silvina Solman La predicción por ensambles Los pronosticadores siempre han entendido el valor de examinar múltiples Pronósticos Numéricos para poder producir un pronóstico más confiable. – Comparando diferentes pronósticos (globales, regionales, o pronósticos producidos por diferentes centros de pronóstico, por ejemplo, GFS, NOGAPS, GEM, ECMWF). – Comparando diferentes corridas del mismo modelo, para entender de qué manera observaciones adicionales pueden cambiar el pronóstico. Productos del pronóstico por ensambles: La predicción por ensambles es la técnica que permite integrar la información basada en múltiples realizaciones de un modelo de pronóstico. diagrama espagueti Utiliza varios métodos estadísticos y gráficos para combinar múltiples realizaciones (corridas de un Modelo de Pronóstico) basadas en diferentes Condiciones Iniciales o en diferentes configuraciones del modelo para incluir información acerca del nivel de incertidumbre y del pronóstico más probable. Puntos principales Explicar los fundamentos de la Predicción por ensambles y el significado del concepto de caos. Describir los métodos que se utilizan para generar los miembros del ensamble en un sistema de predicción por ensambles. Comprender los conceptos y métodos estadísticos básicos que se aplican para el desarrollo de productos de pronóstico por ensambles. Reconocer e interpretar la variedad de productos de la predicción por ensambles Interpretar los productos de verificación de ensambles. Porqué utilizar ensambles? Los Servicios Meteorológicos tienden a proporcionar pronósticos meteorológicos en términos probabilísticos. La predicción probabilística reflejará, aún en el corto plazo, lo que sabemos y lo que no sabemos acerca del comportamiento de la atmósfera y nuestra capacidad de modelarla con exactitud para fines de pronóstico del tiempo. Los Pronósticos por Ensamble están diseñados para capturar la probabilidad de los eventos del tiempo y el rango de incertidumbre inherente al pronóstico. Qué es lo que podemos capturar cuando utilizamos un pronóstico por ensambles? Pronóstico a 12 hs Pronóstico control Pronóstico a 84 hs Pronóstico con CI perturbadas Las perturbaciones iniciales son bastante pequeñas, del orden de 10 a 20 metros en la mayoría de los lugares. Conforme el plazo del pronóstico se incrementa, se nota que las diferencias entre los ciclos de ejecución de control y perturbado (sombreado) aumentan con respecto a las numerosas características que se hallan en el estado inicial. Ventajas del sistema de predicción por conjuntos sobre el PNT individual Característica Pronóstico individual Sistema de pronóstico por conjuntos Incertidumbre en las condiciones iniciales El Sistema de Asimilación de Datos está diseñado para minimizar los errores en las CI. La incertidumbre se toma en cuenta implícitamente a través del peso relativo de cada dato proveniente de las observaciones y el campo preliminar. Aunque los errores en las CI se pueden evaluar mediante las observaciones de los satélites y otras fuentes, no es posible estimar explícitamente su impacto subsiguiente en el pronóstico numérico del tiempo. La incertidumbre en las CI se puede tomar en cuenta determinando los errores potenciales más importantes (es decir, los que crecen rápidamente) para el pronóstico subsiguiente del modelo y reducirlos a una perturbación razonable en las CI Ventajas del sistema de predicción por conjuntos sobre el PNT individual Característica Pronóstico individual Sistema de pronóstico por conjuntos Predecibilidad No se puede evaluar a Se puede evaluar por la atmosférica partir de un pronóstico razón de aumento en la individual. Se puede deducir de manera incompleta a partir del grado de coherencia entre ciclos de ejecución consecutivos del modelo. dispersión de los pronósticos de los miembros del conjunto. El tamaño del conjunto y el uso de perturbaciones adecuadas en las CI son importantes para obtener una dispersión adecuada del conjunto y una medida de la predecibilidad Ventajas del sistema de predicción por conjuntos sobre el PNT individual Característica Pronóstico individual Sistema de pronóstico por conjuntos Incertidumbre de la dinámica del modelo Sólo permite usar un único método numérico. Se pueden usar varios métodos numéricos, por ejemplo, espectral, puntos de retícula, puntos de retícula con diferentes configuraciones. Incertidumbre de la física del modelo Sólo se puede usar un conjunto de parametrizaciones físicas. Se pueden usar múltiples combinaciones de parametrizaciones físicas. A qué se deben, esencialmente, las diferencias entre las distintas realizaciones de los PNT en un conjunto de pronósticos? A la naturaleza caótica de la atmósfera. Sin embargo, atmósfera sigue ciertos patrones, lo cual significa que tiene algunos modos de variabilidad preferidos: predecibilidad. La atmósfera exhibe una "dependencia sensible a las condiciones iniciales", lo cual significa que las pequeñas diferencias en el estado inicial de la atmósfera pueden dar como resultado final grandes diferencias en el pronóstico Lorenz, 1963 Algunas limitaciones del PNT a tener en cuenta Nunca podremos diseñar un modelo de PNT que refleje cada detalle del comportamiento de la atmósfera con una resolución infinitamente alta. Aún si pudiéramos crear un modelo de PNT "perfecto", su pronóstico podría eventualmente estar equivocado debido a los errores en las CI, aunque la degradación podría tardar más tiempo en ocurrir. Que la sensibilidad de la atmósfera dependa de las CI significa que las CI del modelo también necesitarían ser "perfectas" para que hubiera esperanza de producir un pronóstico perfecto. La realidad es que nuestros sistemas de observación y asimilación nunca nos proporcionarán CI perfectas. Podemos, sin embargo, aplicar al proceso de pronóstico nuestro conocimiento de que la atmósfera es caótica y altamente sensible a las condiciones iniciales. Cuál es la alternativa? Con el uso estratégico de condiciones iniciales imperfectas y/o de modelos imperfectos de PNT en un sistema de predicción por conjuntos (SPC), podemos: establecer una gama de resultados posibles del pronóstico, estimar la probabilidad para cualquier resultado individual del pronóstico, y determinar el resultado de pronóstico más probable (que es lo que deseamos). Cómo se generan las perturbaciones Cada pronóstico individual dentro de un SPC se conoce como miembro del conjunto. conjunto. En el caso de los SPC que usan la incertidumbre en las condiciones iniciales para crear un pronóstico, la ejecución del miembro del conjunto a partir del análisis sin cambios se conoce como control del conjunto. conjunto. Los miembros que se ejecutan a partir de análisis que han sido cambiados para reflejar las incertidumbres en las condiciones iniciales se conocen como perturbaciones del conjunto. conjunto. Fuentes de incertidumbre para crear miembros del conjunto: Se introducen incertidumbres ya sea en las CI o en el modelo de pronóstico – Perturbaciones de las CI – Perturbaciones en la Configuración del Modelo: Parametrizaciones Formulación dinámica (coordenada vertical) Métodos numéricos (punto de retícula o espectrales) Resolución – Perturbaciones en las Condiciones de Borde (Modelos de Área Limitada). Condiciones de borde lateral Condiciones de superficie (SST o humedad de suelo) Incertidumbre asociada a distintos esquemas de parametrización en un mismo modelo: el impacto de bias sistemático y los errores dependen de el régimen del flujo: Cuál es el mejor modelo? Incertidumbre asociada a diferentes condiciones iniciales: determinar rango de posibles pronósticos considerando un rango razonable de incertidumbre en la CI. Implementaciones del SPC Vectores Singulares (ECMWF) Vectores Criados (NCEP) Observaciones perturbadas en múltiples ciclos de análisis (Canadá) Ensemble KalmanKalman-Filter Errores al azar Vectores Singulares Buizza 2000 Concepto: se utilizan métodos estadísticos para calcular las direcciones o "vectores" en los que las diferencias del pronóstico crecerán más rápidamente con el tiempo. Los vectores singulares son perturbaciones con un crecimiento máximo en un determinado período de tiempo. A partir de dichos vectores de crecimiento más rápido, el SPC retrocede hasta el tiempo inicial para obtener la estructura de la incertidumbre de las condiciones iniciales directamente relacionada con los "vectores" de crecimiento rápido. Luego el tamaño de estos vectores o perturbaciones se ajusta a los errores de observación esperados y los del campo preliminar. Finalmente, estas perturbaciones se suman a las CI. Vectores criados Para iniciar un ciclo de incubación, se añaden perturbaciones aleatorias a las condiciones iniciales de análisis del modelo. Se ejecutan entonces un pronóstico de control y otro perturbado para un plazo de pronóstico corto Luego los pronósticos de control y perturbado se diferencian para llegar a una perturbación tridimensional. Finalmente, esta perturbación se reduce a un tamaño que refleje las incertidumbres en las observaciones Estas nuevas perturbaciones se aplican entonces a un nuevo análisis proveniente del nuevo período de pronóstico y el ciclo "de incubación" se repite. El uso de los ciclos de incubación para generar perturbaciones en las condiciones iniciales se basa en las siguientes suposiciones básicas: los aspectos más importantes de la incertidumbre en la condiciones iniciales aparecerán y se volverán dominantes muy temprano en el período del pronóstico. Observaciones perturbadas en múltiples ciclos de análisis Utiliza un conjunto de ciclos de asimilación de datos que realizan análisis independientes. Cada ciclo de asimilación de datos emplea las observaciones perturbadas de manera diferente y un campo preliminar también perturbado de manera diferente. Esas perturbaciones se obtienen aleatoriamente a partir del rango de error esperado en las observaciones y en el modelo. Es posible usar el llamado filtro de Kalman para conjuntos (Ensemble Kalman Filter, Filter, o EnKF) para proveer al sistema de asimilación de datos y al SPC una estructura tridimensional de los "errores del día" para los campos de aproximación inicial y de análisis. El EnKF permite variar la estructura del error de análisis y de aproximación inicial, basándose en el régimen de flujo actual. El uso del EnKF da como resultado un vínculo directo entre el sistema de asimilación de datos y el sistema de pronóstico por conjuntos. Métodos estadísticos que se aplican a la Predicción por Ensambles Los pronósticos por ensamble requieren del desarrollo de metodologías estadísticas para poder aprovechar sus productos al máximo. Estas metodologías deben emplearse tanto para mostrar los productos como para evaluar la calidad de las predicciones. Repaso de algunos conceptos estadísticos básicos Una distribución de probabilidad representa la frecuencia de ocurrencia de valores o rangos de valores específicos en una muestra particular de datos. Para describir sucintamente la distribución de probabilidad de una muestra de datos obtenida de un conjunto grande de datos, utilizamos lo que se conoce como función de densidad de probabilidad, o FDP, en la cual el eje x representa los valores posibles para los datos y el eje y la probabilidad de que ese valor ocurra, de acuerdo con la muestra de datos. La FDP tiene una forma característica, una posición característica de su "centro" y una variabilidad o dispersión característica de los valores. Ejemplos básicos Normalmente, en la estadística de los pronósticos por conjuntos se supone una distribución normal. A veces, sin embargo, los datos del pronóstico por conjuntos no tienen una distribución normal, como es el caso, por ejemplo, cuando es preciso pronosticar dos o más regímenes diferentes, lo cual significa que hay dos o más pronósticos con alta frecuencia. A partir de una distribución de posibles estados iniciales podemos producir un set de pronósticos es decir una distribución de posibles pronósticos El centro de una distribución La media aritmética o promedio de una muestra de datos es simplemente la suma de los valores dividida por el número total de valores, Si organizamos un conjunto de datos de menor a mayor, el valor central que deja a cada lado (por encima y por debajo) la mitad de los datos es la mediana de la muestra. La estadística de tendencia central dada por el valor o intervalo observado con mayor frecuencia es la moda de la muestra de datos. Ninguno de los valores en la muestra, con excepción de los que están en la categoría de mayor frecuencia de observación, afecta al valor de la moda. Medidas del centro de una distribución Ejemplo Media = 82.09 F Mediana = 83 F Moda = 84 F Dispersión de una distribución Una buena medida de la variabilidad utiliza todos los datos y aumenta a medida que aumenta la dispersión de la población o de la muestra de datos. Ejemplo σ = (15,21 °F)1/2 = 3,90 °F Media= 82.09°F Distribución de probabilidad teórica y ajuste a la distribución observada: Los datos no se ajustan muy bien a la curva, lo cual puede deberse a: – pocos miembros en el conjunto para que sea una muestra representativa de todos los posibles resultados de pronóstico o, lo cual es más probable, – el pronóstico por conjuntos presenta una situación a la cual no se puede aplicar la distribución normal. Una posibilidad que puede producir una distribución atípica del pronóstico se da cuando algunos miembros pronostican el paso de un frente frío antes del momento de la verificación del pronóstico, y otros no. Otra manera de describir los datos de un conjunto consiste en organizarlos de modo que se pueda describir la posición relativa de un miembro particular dentro del conjunto completo. Una medida denominada percentil expresa esta posición en términos de porcentajes. El percentil de un valor da el porcentaje del conjunto de datos total que cae por debajo de ese valor. Mediana: Percentil 50 Cual es el valor del cuartil 1? Forma de una distribución Muchos procesos atmosféricos no son normales y tampoco presentan distribuciones normales: asimetría Tamaño de las colas de una distribución: Kurtosis Distribuciones multimulti-modales Un PDF con múltiples máximos de probabilidad puede indicar que: • el pronóstico por conjuntos no cuenta con suficientes miembros para dar una lectura exacta de las probabilidades de salidas de los pronósticos resultante con más frecuencia • que existen múltiples regímenes de flujo que tienen probabilidades considerables de poderse verificar. Uso de la FDP en el proceso de pronóstico: Cálculo de la probabilidad de un evento ¿Cómo podríamos utilizar el error estadístico del modelo en la práctica? Error medio: 0.5°C ; Desv del error: 0.8°C violeta: pronósticos (15.1°C) azul: análisis (14.6 °C) La dispersión del error nos da una medida de la incertidumbre del pronóstico Muestra = 1000 pronósticos Pronóstico: 15.5°C → 15°C 67% prob (1 ds) 14.2°C < T < 15.8°C) El método más lógico para generar un pronóstico probabilístico consiste en utilizar pronósticos por conjuntos para obtener una FDP de los posibles resultados del pronóstico. Los pronósticos por conjuntos tienen claras ventajas sobre los pronósticos deterministas simples, porque toman en cuenta los siguientes aspectos: – la incertidumbre de la condición inicial actual y la predecibilidad atmosférica; – el efecto del régimen del flujo actual sobre la predecibilidad y los sesgos del modelo de PNT