Estimation de la pluie au sol par apprentissage automatique

5 mois de février à juin 2021
Laboratoire(s) de rattachement : CNRM (42 av G. Coriolis, 31057 Toulouse Cedex 01, France)
Encadrant(s) : Olivier Caumont (CNRM, Toulouse)
Co-encadrant(s) : & Brice Boudevillain (IGE, Grenoble)
Contact(s) : Olivier Caumont, 05 61 07 96 46, olivier.caumont meteo.fr ; Brice Boudevillain, 04 76 51 47 33, brice.boudevillain univ-grenoble-alpes.fr
Lieu : CNRM Toulouse
Niveau de formation & prérequis : Stage de niveau M2. Le/a candidat/e doit être à l’aise dans un environnement Linux+Python, et doit idéalement avoir une expérience dans l’utilisation d’algorithmes d’apprentissage automatique
Mots clés : Météorologie, Précipitations atmosphériques, Apprentissage automatique, Estimation et prévision de la pluie, Données issues de la télédétection et de la modélisation

La distribution en taille des gouttes de pluie (DSD, pour Drop Size Distribution) a un effet important sur l’estimation quantitative des précipitations par radar (car à la fois influente sur les observables radar et l’intensité de la pluie au sol) ainsi que sur les processus microphysiques (qui donnent naissance et font évoluer les nuages et les précipitations) simulés par les modèles de prévision numérique du temps (PNT) (Uijlenhoet et al. 2003 ; Brandes et al. 2006). Pour l’estimation des pluies par radar et dans les schémas microphysiques des modèles de PNT, la distribution des gouttes est presque toujours considérée sous une forme simple avec un nombre réduit de paramètres qui ne permet pas toujours de la représenter correctement. Par ailleurs, la variabilité de la DSD peut être très importante d’une situation météorologique à une autre. Ces simplifications et la forte variabilité de la DSD sont à l’origine des principales sources d’erreurs dans l’estimation et la prévision quantitative des précipitations. Ceci donne régulièrement lieu à des difficultés pour le suivi et la prévision d’événements de pluies intenses susceptibles de provoquer des crues soudaines.
Bien que les modèles de PNT ne soient pas en mesure de prévoir les DSD en accord avec les observations, ils ont une certaine capacité à prévoir des paramètres à plus grande échelle, c.-à-d. résolus (comme par exemple la température ou l’humidité). Ainsi, les modèles dont la grille horizontale a une taille de l’ordre du kilomètre permettent de prévoir explicitement des paramètres météorologiques tels que les altitudes de la base et du sommet des nuages, de l’isotherme 0 °C et d’autres paramètres caractérisant l’environnement dans lequel les précipitations surviennent et pour lesquelles les distributions des gouttes doivent être déterminées.
L’objectif ici est d’estimer la DSD près du sol grâce au modèle de PNT Arome utilisé à Météo-France et identifier des relations spécifiques entre la réflectivité radar Z et le taux de précipitation R (relations appelées « relations Z-R »). On souhaite ainsi : 1/ mieux comprendre la relation entre d’une part, l’environnement météorologique et d’autre part, les caractéristiques des systèmes précipitants en termes de DSD et 2/ améliorer les estimations et prévisions de pluie. À cette fin, une base de données pluriannuelle d’analyses et de prévisions du modèle Arome et de données de distributions de gouttes simultanées mesurées par des disdromètres sera utilisée. Des algorithmes d’apprentissage automatique (machine learning) seront appliqués pour créer un modèle statistique capable de diagnostiquer des DSD et/ou des relations Z-R spécifiques à partir des paramètres météorologiques déduits du modèle Arome.
Ce travail s’inscrit dans la continuité d’un stage de M2 effectué récemment. Au cours de ce stage, une base de données d’analyses et de prévisions d’Arome et de mesures disdrométriques sur cinq ans a été créée. La sensibilité des DSD et des relations Z-R près du sol à différents champs de variables d’Arome a été étudiée. Nous avons donc déjà la base de données et une première idée des paramètres météorologiques à considérer comme prédicteurs dans les algorithmes d’apprentissage automatique. L’intérêt pratique du modèle statistique diagnostiquant la distribution des gouttes près du sol sera évalué notamment en calculant d’une part l’erreur faite entre une estimation des précipitations obtenue par la relation Z-R conventionnelle, et d’autre part la relation Z-R spécifique obtenue par apprentissage automatique.

Le/a candidat/e doit être à l’aise dans un environnement Linux+Python, et doit idéalement avoir une expérience dans l’utilisation d’algorithmes d’apprentissage automatique.

Bibliographie :
Brandes, E.A., G. Zhang, and J. Sun, 2006 : On the Influence of Assumed Drop Size Distribution Form on Radar-Retrieved Thunderstorm Microphysics. J. Appl. Meteor. Climatol., 45, 259–268, https://doi.org/10.1175/JAM2335.1
Uijlenhoet, R., M. Steiner, and J.A. Smith, 2003 : Variability of Raindrop Size Distributions in a Squall Line and Implications for Radar Rainfall Estimation. J. Hydrometeor., 4, 43–61, https://doi.org/10.1175/1525-7541(2003)004<0043:VORSDI>2.0.CO ;2

Mis à jour le 1er septembre 2020