La predicción por ensambles - Laboratorio de prevision del tiempo

Anuncio
La predicción por
ensambles
Agradecimientos: este material se basa en el
módulo de “Explicación del pronóstico por
ensambles” tomado del Programa COMET
(www.comet.ucar.edu
www.comet.ucar.edu))
Laboratorio de Previsión del Tiempo
I cuatrimestre 2011
Dra. Silvina Solman
La predicción por ensambles

Los pronosticadores siempre han
entendido el valor de examinar
múltiples Pronósticos Numéricos
para poder producir un pronóstico
más confiable.
– Comparando diferentes pronósticos
(globales, regionales, o pronósticos
producidos por diferentes centros
de pronóstico, por ejemplo, GFS,
NOGAPS, GEM, ECMWF).
– Comparando diferentes corridas
del mismo modelo, para entender
de qué manera observaciones
adicionales pueden cambiar el
pronóstico.
Productos del pronóstico por ensambles:

La predicción por ensambles es la
técnica que permite integrar la
información basada en múltiples
realizaciones de un modelo de
pronóstico.
diagrama espagueti
Utiliza varios métodos estadísticos y gráficos
para combinar múltiples realizaciones
(corridas de un Modelo de Pronóstico)
basadas en diferentes Condiciones Iniciales o
en diferentes configuraciones del modelo
para incluir información acerca del nivel de
incertidumbre y del pronóstico más probable.
Puntos principales





Explicar los fundamentos de la Predicción por
ensambles y el significado del concepto de caos.
Describir los métodos que se utilizan para generar
los miembros del ensamble en un sistema de
predicción por ensambles.
Comprender los conceptos y métodos estadísticos
básicos que se aplican para el desarrollo de
productos de pronóstico por ensambles.
Reconocer e interpretar la variedad de productos
de la predicción por ensambles
Interpretar los productos de verificación de
ensambles.
Porqué utilizar ensambles?



Los Servicios Meteorológicos tienden a proporcionar
pronósticos meteorológicos en términos
probabilísticos.
La predicción probabilística reflejará, aún en el
corto plazo, lo que sabemos y lo que no sabemos
acerca del comportamiento de la atmósfera y
nuestra capacidad de modelarla con exactitud para
fines de pronóstico del tiempo.
Los Pronósticos por Ensamble están diseñados para
capturar la probabilidad de los eventos del tiempo y
el rango de incertidumbre inherente al pronóstico.
Qué es lo que podemos capturar cuando
utilizamos un pronóstico por ensambles?
Pronóstico a 12 hs
Pronóstico control

Pronóstico a 84 hs
Pronóstico con CI perturbadas
Las perturbaciones iniciales son bastante pequeñas, del orden de
10 a 20 metros en la mayoría de los lugares. Conforme el plazo
del pronóstico se incrementa, se nota que las diferencias entre los
ciclos de ejecución de control y perturbado (sombreado)
aumentan con respecto a las numerosas características que se
hallan en el estado inicial.
Ventajas del sistema de predicción
por conjuntos sobre el PNT individual
Característica
Pronóstico individual
Sistema de
pronóstico por
conjuntos
Incertidumbre
en las
condiciones
iniciales
El Sistema de Asimilación de Datos
está diseñado para minimizar los
errores en las CI. La incertidumbre
se toma en cuenta implícitamente a
través del peso relativo de cada
dato proveniente de las
observaciones y el campo
preliminar.
Aunque los errores en las CI se
pueden evaluar mediante las
observaciones de los satélites y
otras fuentes, no es posible estimar
explícitamente su impacto
subsiguiente en el pronóstico
numérico del tiempo.
La incertidumbre en las
CI se puede tomar en
cuenta determinando los
errores potenciales más
importantes (es decir, los
que crecen rápidamente)
para el pronóstico
subsiguiente del modelo
y reducirlos a una
perturbación razonable
en las CI
Ventajas del sistema de predicción
por conjuntos sobre el PNT individual
Característica
Pronóstico individual
Sistema de pronóstico
por conjuntos
Predecibilidad No se puede evaluar a Se puede evaluar por la
atmosférica partir de un pronóstico razón de aumento en la
individual. Se puede
deducir de manera
incompleta a partir del
grado de coherencia
entre ciclos de
ejecución consecutivos
del modelo.
dispersión de los pronósticos
de los miembros del
conjunto. El tamaño del
conjunto y el uso de
perturbaciones adecuadas en
las CI son importantes para
obtener una dispersión
adecuada del conjunto y una
medida de la predecibilidad
Ventajas del sistema de predicción
por conjuntos sobre el PNT individual
Característica Pronóstico individual
Sistema de pronóstico por
conjuntos
Incertidumbre
de la dinámica
del modelo
Sólo permite usar un
único método
numérico.
Se pueden usar varios
métodos numéricos, por
ejemplo, espectral, puntos
de retícula, puntos de
retícula con diferentes
configuraciones.
Incertidumbre
de la física del
modelo
Sólo se puede usar un
conjunto de
parametrizaciones
físicas.
Se pueden usar múltiples
combinaciones de
parametrizaciones físicas.
A qué se deben, esencialmente, las
diferencias entre las distintas
realizaciones de los PNT en un
conjunto de pronósticos?



A la naturaleza caótica de la atmósfera.
Sin embargo, atmósfera sigue ciertos patrones, lo cual
significa que tiene algunos modos de variabilidad
preferidos: predecibilidad.
La atmósfera exhibe una "dependencia sensible a las
condiciones iniciales", lo cual significa que las pequeñas
diferencias en el estado inicial de la atmósfera pueden
dar como resultado final grandes diferencias en el
pronóstico
Lorenz, 1963
Algunas limitaciones del PNT a tener en cuenta





Nunca podremos diseñar un modelo de PNT que refleje cada
detalle del comportamiento de la atmósfera con una
resolución infinitamente alta.
Aún si pudiéramos crear un modelo de PNT "perfecto", su
pronóstico podría eventualmente estar equivocado debido a
los errores en las CI, aunque la degradación podría tardar más
tiempo en ocurrir.
Que la sensibilidad de la atmósfera dependa de las CI significa
que las CI del modelo también necesitarían ser "perfectas"
para que hubiera esperanza de producir un pronóstico
perfecto.
La realidad es que nuestros sistemas de observación y
asimilación nunca nos proporcionarán CI perfectas.
Podemos, sin embargo, aplicar al proceso de pronóstico
nuestro conocimiento de que la atmósfera es caótica y
altamente sensible a las condiciones iniciales.
Cuál es la alternativa?
Con el uso estratégico de condiciones iniciales
imperfectas y/o de modelos
imperfectos de PNT en un sistema de predicción
por conjuntos (SPC), podemos:
 establecer una gama de resultados posibles del
pronóstico,
 estimar la probabilidad para cualquier
resultado individual del pronóstico, y
 determinar el resultado de pronóstico más
probable (que es lo que deseamos).
Cómo se generan las
perturbaciones



Cada pronóstico individual dentro de un SPC se
conoce como miembro del conjunto.
conjunto.
En el caso de los SPC que usan la incertidumbre
en las condiciones iniciales para crear un
pronóstico, la ejecución del miembro del
conjunto a partir del análisis sin cambios se
conoce como control del conjunto.
conjunto.
Los miembros que se ejecutan a partir de análisis
que han sido cambiados para reflejar las
incertidumbres en las condiciones iniciales se
conocen como perturbaciones del conjunto.
conjunto.
Fuentes de incertidumbre para
crear miembros del conjunto:

Se introducen incertidumbres ya sea en las CI
o en el modelo de pronóstico
– Perturbaciones de las CI
– Perturbaciones en la Configuración del Modelo:




Parametrizaciones
Formulación dinámica (coordenada vertical)
Métodos numéricos (punto de retícula o espectrales)
Resolución
– Perturbaciones en las Condiciones de Borde
(Modelos de Área Limitada).


Condiciones de borde lateral
Condiciones de superficie (SST o humedad de suelo)
Incertidumbre asociada a
distintos esquemas de
parametrización en un
mismo modelo: el impacto
de bias sistemático y los
errores dependen de el
régimen del flujo: Cuál es el
mejor modelo?
Incertidumbre asociada a
diferentes condiciones
iniciales: determinar rango de
posibles pronósticos considerando
un rango razonable de
incertidumbre en la CI.
Implementaciones del
SPC





Vectores Singulares (ECMWF)
Vectores Criados (NCEP)
Observaciones perturbadas en
múltiples ciclos de análisis (Canadá)
Ensemble KalmanKalman-Filter
Errores al azar
Vectores
Singulares

Buizza 2000
Concepto: se utilizan métodos
estadísticos para calcular las
direcciones o "vectores" en
los que las diferencias del
pronóstico crecerán más
rápidamente con el tiempo.
Los vectores singulares son perturbaciones con un
crecimiento máximo en un determinado período de tiempo.
 A partir de dichos vectores de crecimiento más rápido, el
SPC retrocede hasta el tiempo inicial para obtener la
estructura de la incertidumbre de las condiciones iniciales
directamente relacionada con los "vectores" de crecimiento
rápido. Luego el tamaño de estos vectores o
perturbaciones se ajusta a los errores de observación
esperados y los del campo preliminar. Finalmente, estas
perturbaciones se suman a las CI.
Vectores criados

Para iniciar un ciclo de incubación,
se añaden perturbaciones
aleatorias a las condiciones
iniciales de análisis del modelo. Se
ejecutan entonces un pronóstico de
control y otro perturbado para un
plazo de pronóstico corto
Luego los pronósticos de control y perturbado se diferencian para llegar a una
perturbación tridimensional. Finalmente, esta perturbación se reduce a un
tamaño que refleje las incertidumbres en las observaciones
Estas nuevas perturbaciones se aplican entonces a un nuevo análisis
proveniente del nuevo período de pronóstico y el ciclo "de incubación" se
repite.
El uso de los ciclos de incubación para generar perturbaciones en las
condiciones iniciales se basa en las siguientes suposiciones básicas:
los aspectos más importantes de la incertidumbre en la condiciones iniciales
aparecerán y se volverán dominantes muy temprano en el período del
pronóstico.
Observaciones perturbadas en
múltiples ciclos de análisis



Utiliza un conjunto de ciclos de asimilación de datos que
realizan análisis independientes.
Cada ciclo de asimilación de datos emplea las
observaciones perturbadas de manera diferente y un
campo preliminar también perturbado de manera diferente.
Esas perturbaciones se obtienen aleatoriamente a partir del
rango de error esperado en las observaciones y en el
modelo.
Es posible usar el llamado filtro de Kalman para conjuntos
(Ensemble Kalman Filter,
Filter, o EnKF) para proveer al sistema
de asimilación de datos y al SPC una estructura
tridimensional de los "errores del día" para los campos de
aproximación inicial y de análisis. El EnKF permite variar la
estructura del error de análisis y de aproximación inicial,
basándose en el régimen de flujo actual. El uso del EnKF da
como resultado un vínculo directo entre el sistema de
asimilación de datos y el sistema de pronóstico por
conjuntos.
Métodos estadísticos que se
aplican a la Predicción por
Ensambles


Los pronósticos por ensamble requieren
del desarrollo de metodologías
estadísticas para poder aprovechar sus
productos al máximo.
Estas metodologías deben emplearse
tanto para mostrar los productos como
para evaluar la calidad de las
predicciones.
Repaso de algunos conceptos
estadísticos básicos



Una distribución de probabilidad representa la frecuencia
de ocurrencia de valores o rangos de valores específicos
en una muestra particular de datos.
Para describir sucintamente la distribución de
probabilidad de una muestra de datos obtenida de un
conjunto grande de datos, utilizamos lo que se conoce
como función de densidad de probabilidad, o FDP, en la
cual el eje x representa los valores posibles para los
datos y el eje y la probabilidad de que ese valor ocurra,
de acuerdo con la muestra de datos.
La FDP tiene una forma característica, una posición
característica de su "centro" y una variabilidad o
dispersión característica de los valores.
Ejemplos básicos

Normalmente, en la
estadística de los pronósticos
por conjuntos se supone una
distribución normal. A veces,
sin embargo, los datos del
pronóstico por conjuntos no
tienen una distribución
normal, como es el caso, por
ejemplo, cuando es preciso
pronosticar dos o más
regímenes diferentes, lo cual
significa que hay dos o más
pronósticos con alta
frecuencia.
A partir de una distribución
de posibles estados
iniciales podemos producir
un set de pronósticos es
decir una distribución de
posibles pronósticos
El centro de una
distribución



La media aritmética o promedio de una muestra de
datos es simplemente la suma de los valores dividida por
el número total de valores,
Si organizamos un conjunto de datos de menor a mayor,
el valor central que deja a cada lado (por encima y por
debajo) la mitad de los datos es la mediana de la
muestra.
La estadística de tendencia central dada por el valor o
intervalo observado con mayor frecuencia es la moda de
la muestra de datos. Ninguno de los valores en la
muestra, con excepción de los que están en la categoría
de mayor frecuencia de observación, afecta al valor de la
moda.
Medidas del centro de
una distribución
Ejemplo



Media = 82.09 F
Mediana = 83 F
Moda = 84 F
Dispersión de una
distribución

Una buena medida de la variabilidad utiliza todos los
datos y aumenta a medida que aumenta la
dispersión de la población o de la muestra de datos.
Ejemplo σ = (15,21 °F)1/2 = 3,90 °F
Media= 82.09°F
Distribución de probabilidad
teórica y ajuste a la
distribución observada:

Los datos no se ajustan
muy bien a la curva, lo cual
puede deberse a:
– pocos miembros en el
conjunto para que sea una
muestra representativa de
todos los posibles
resultados de pronóstico o,
lo cual es más probable,
– el pronóstico por conjuntos
presenta una situación a la
cual no se puede aplicar la
distribución normal.

Una posibilidad que
puede producir una
distribución atípica del
pronóstico se da
cuando algunos
miembros pronostican
el paso de un frente
frío antes del
momento de la
verificación del
pronóstico, y otros no.
Otra manera de describir los datos de un conjunto
consiste en organizarlos de modo que se pueda
describir la posición relativa de un miembro
particular dentro del conjunto completo. Una
medida denominada percentil expresa esta
posición en términos de porcentajes. El percentil
de un valor da el porcentaje del conjunto de datos
total que cae por debajo de ese valor.
Mediana:
Percentil 50
Cual es el valor
del cuartil 1?
Forma de una distribución

Muchos procesos atmosféricos no son
normales y tampoco presentan distribuciones
normales: asimetría
Tamaño de las colas de
una distribución: Kurtosis
Distribuciones multimulti-modales
Un PDF con múltiples
máximos de probabilidad
puede indicar que:
• el pronóstico por conjuntos
no cuenta con suficientes
miembros para dar una
lectura exacta de las
probabilidades de salidas de
los pronósticos resultante
con más frecuencia
• que existen múltiples
regímenes de flujo que
tienen probabilidades
considerables de poderse
verificar.
Uso de la FDP en el proceso de pronóstico:
Cálculo de la probabilidad de un evento

¿Cómo podríamos utilizar el error
estadístico del modelo en la práctica?
Error medio: 0.5°C ; Desv del error: 0.8°C
violeta: pronósticos (15.1°C)
azul: análisis (14.6 °C)
La dispersión del error nos da una medida de la
incertidumbre del pronóstico
Muestra = 1000 pronósticos
Pronóstico: 15.5°C → 15°C
67% prob (1 ds) 14.2°C < T < 15.8°C)

El método más lógico para generar un
pronóstico probabilístico consiste en utilizar
pronósticos por conjuntos para obtener
una FDP de los posibles resultados del
pronóstico. Los pronósticos por conjuntos
tienen claras ventajas sobre los pronósticos
deterministas simples, porque toman en
cuenta los siguientes aspectos:
– la incertidumbre de la condición inicial actual y
la predecibilidad atmosférica;
– el efecto del régimen del flujo actual sobre la
predecibilidad y los sesgos del modelo de PNT
Descargar