S'abonner à un flux RSS
 

D.08 - Diagramme de Talagrand (diagramme de rang)

De Wikibardig

Principe

Dans le cas d'un système de prévision fournissant une distribution de probabilité prévue (ou un ensemble de quantiles de prévision), le diagramme de Talagrand vise à vérifier que tous les intervalles de prévision déduits de la distribution de probabilité prévue, sont fiables (fiche D.02).

Construction

Le prévisionniste dispose d'une archive de n prévisions et des n observations correspondantes d'une variable X (de débit, de hauteur d'eau, de pluie, de température...). Chaque prévision est fournie sous la forme d'une densité de probabilité de la variable aléatoire X à prévoir ou d'un ensemble des valeurs de quelques quantiles (toujours les mêmes pour les n prévisions).

Le diagramme de Talagrand est construit par la procédure suivante :

  • a. L'intervalle [0;1] est divisé en m intervalles réguliers en fonction du nombre de prévisions disponibles et de la précision de l'information sur la densité de probabilité[1]. On obtient ainsi m + 1 valeurs (fréquences) qui sont 0, 1 / m, 2 / m, …, 1.
  • b. Pour chaque prévision i:

- on détermine les intervalles dont les bornes sont les quantiles de prévision correspondant aux valeurs (fréquences) déterminées à la première étape. Le je intervalle est donc:

Inc283.bmp.

- on note ensuite dans quel intervalle j se situe l'observation correspondante Xi : Ji prend la valeur j (comprise entre 1 et m).

  • c. Pour chaque valeur de j (c'est-à-dire pour chacun des intervalles définis en b.), on calcule sur les n prévisions le nombre de fois où l'observation s'est trouvée dans le je intervalle : Inc284.bmp.
  • d. Le diagramme de Talagrand est l'histogramme des valeurs Sj, c'est-à-dire des effectifs de ces intervalles.

Interprétation

Si les prévisions sont fiables, l'observation correspondant à chaque prévision a autant de probabilité de se situer dans un des m intervalles. Dans ce cas le diagramme de Talagrand est grosso modo plat (Fig. 1, au verso). Si le diagramme présente une forme en U (un sourire), les classes les plus extérieures sont sur-représentées. Cela signifie que les intervalles de prévision « centraux » contiennent moins souvent les observations qu'ils ne devraient, il y a sous-dispersion ou encore sous-estimation de l'incertitude. Inversement, une forme du diagramme de Talagrand est en ∏ permet de diagnostiquer une sur-estimation de l'incertitude ou sur-dispersion.

L'examen du diagramme de Talagrand peut également permettre de détecter la présence d'un biais systématique du système de prévision (fiche D.05). Cependant, certains biais systématiques peuvent ne pas être détectables. C'est classiquement le cas si un biais systématique sur les hauts débits est compensé par le biais contraire sur les bas débits. Il est donc recommandé de tracer un histogramme de rang pour chaque situation hydrologique.


Inc285.bmp


On rencontre parfois un score calculé sur le diagramme de rang pour le résumer. Il s’agit de l’écart normalisé du diagramme de rang au diagramme parfait. Sa valeur doit être la plus faible possible et une valeur nettement supérieure à 1 traduit une mauvaise fiabilité des prévisions.


Voir également

Fiche D.02 – Fiabilité d'une prévision

Fiche D.05 – Absence de biais


Pour aller plus loin

  • Candille, G. et Talagrand, O. (2005). Evaluation of probabilistic prediction systems for a scalar variable. Quart. J. Roy. Meteor. Soc., 131, 2131–2150.
  • Brochero, D., F. Anctil, and C. Gagne (2011). Simplifying a hydrological ensemble prediction system with a backward greedy selection of members - Part 1 : Optimization criteria. Hydrology and Earth System Sciences 15 (11), 3307—3325



  1. Si par exemple, la densité de probabilité est approchée par une prévision d'ensemble, il ne sert à rien de diviser l'intervalle [0;1] en beaucoup plus de classes que le nombre de membres de l'ensemble. Si, on ne dispose que de quelques quantiles, le nombre d’intervalles m doit être choisir par rapport à ces informations : il ne sert à rien de le choisir nettement supérieur au nombre de quantiles disponibles.
Outils personnels