Analyse de séquences de circulation atmosphérique menant à des situations hydrométéorologiques atypiques ou extrêmes

Lieu : Laboratoire LTHE, équipe HMCIS, université Grenoble-Alpes.
Encadrants : Juliette Blanchet (juliette.blanchet ujf-grenoble.fr), Jean-Dominique Creutin, Benoit Hingray.

Nous nous intéressons à des situations hydrométéorologiques (en termes de précipitations, vents ou débits) qui ont été atypiques, voire extrêmes, à l’échelle de plusieurs jours voire semaines sur diverses régions européennes (e.g. Centre France, Centre Norvège, Piémont italien). L’objectif est de déterminer si la séquence des situations atmosphériques grande échelle correspondantes présente un caractère atypique, et si oui sur quelle durée ces séquences ont-elles été atypiques. La circulation atmosphérique un jour donnée peut être caractérisée par 2 champs de geopotentiels en points de grille. Comparer différentes séquences de circulations atmosphériques revient à comparer ce que nous appellerons des trajectoires. Sur ces trajectoires, la position un jour donné est définie par un vecteur de grande dimension (les 2 champs de géopotentiels du jour). Ceci pose problème car les espaces de grande dimension sont « vides » et donc les points éparses – c’est ce qu’on appelle le fléau de la dimension – si bien que la comparaison de trajectoires est vaine en grande dimension.

En pratique, le stage consistera à :
1/ établir une description des trajectoires atmosphériques par des vecteurs de dimension modérée sur lesquels des distances puissent être calculées, afin d’identifier les trajectoires atypiques
2/ identifier des trajectoires atypiques et analyser si les situations hydrométéorologiques locales correspondantes sont atypiques
3/ inversement, identifier des situations hydrométéorologiques atypiques et identifier si cela correspond à des trajectoires atmosphériques atypiques

Données utilisées :
a/ réanalyses atmosphériques grande échelle ERA Interim
b/ données ECAD sur Europe entière + différentes sous régions.

La première étape du travail consistera à résumer les trajectoires atmosphériques par des vecteurs de dimension modérée (typiquement <10). Une première idée est d’utiliser une classification des jours en type de temps (TT) (Garavaglia et al. 2010) et de calculer la proportion de chacun des TT sur les trajectoires considérées. Chaque trajectoire est alors définie par un vecteur de taille 8 (pour 8 types de temps) et le calcul de distances en dimension 8 ne pose numériquement plus de problème. Cela peut se faire à partir de la classification « dure » de Garavaglia et al. 2010, ou bien à partir d’une classification « douce » considérant la probabilité qu’un jour donné soit dans chaque TT. Une difficulté est de calculer ces probabilités car la méthode de Garavaglia et al. 2010 ne nous donne que les scores de Teweles-Wobus qui sont une mesure de proximité entre la situation synoptique du jour et celle des centroids des TT. On envisagera comme probabilité de prendre les scores inverses normalisés ou une puissance de ces scores, éventuellement transformés en composantes quasi-gaussiennes pour faciliter l’utilisation des méthodes de clustering ci-dessous.

Dans une deuxième étape, on analysera si les trajectoires atmosphériques atypiques conduisent à des situations hydrométéorologiques atypiques et inversement. Pour ce faire, on appliquera aux trajectoires des techniques de clustering permettant de détecter des outliers. Les méthodes de clustering envisagées sont celles basées sur les modèles de mélanges (ex Fraley and Raftery 1998) ou les approches par « trimming » (ex trimmed kmeans de Cuesta-Albertos et al. 1997, package R trimcluster). On appliquera la/les méthode(s) pour des trajectoires de longueurs différentes (ex. 3j, 7j, 30j) afin de déterminer sur quelle période ces trajectoires sont effectivement atypiques. Un focus sera ensuite fait sur un certain nombre de situations hydrométéorologiques extrêmes : ces situations correspondent-elles à des trajectoires atypiques ? Inversement, les trajectoires atypiques donnent-elles usuellement des situations hydrométéorologiques extrêmes ?

Références

Cuesta-Albertos, J. A., Gordaliza, A. and Matrán, C., 1997. Trimmed $k$-means : an attempt to robustify quantizers. Ann. Statist., 25(2), 553—576.

Fraley, C. and Raftery, A. E., 1998. How Many Clusters ? Which Clustering Method ? Answers Via Model-Based Cluster Analysis. The Computer Journal, 41(8), 578-588.

Garavaglia, F., Gailhard, J., Paquet, E., Lang, M., Garçon, R. and Bernardara, P., 2010. Introducing a rainfall compound distribution model based on weather patterns sub-sampling. Hydrology and Earth System Sciences, 14(6), 951—964.

Mis à jour le 16 octobre 2015