On pourrait s’attendre à ce que les mesures non linéaires soient confondues, mais ont-elles une place dans une hiérarchie de modèles statistiques

– Par Rick Danielson Jr –

Un statisticien et un physicien discutaient d’une expérience autour d’une théière, lorsque cet échange hypothétique eut lieu : « Je sais que nous travaillons dans les bonnes unités, mais pensez-vous que certaines de nos mesures sont non linéaires? » Perplexe, le physicien prend une gorgée avant de répondre : « Vous voulez dire que des mesures individuelles pourraient être non linéaires? Est-ce que ça existe? » Le statisticien s’est aussi arrêté pour prendre une gorgée : « Eh bien, Kruskal (1988) a écrit sur Mahalanobis (1947) qui utilisait des règles avec des incréments non linéaires. Ils s’inquiétaient de voir les gens faire des erreurs corrélées, mais je suppose que cela ne s’applique pas à nos instruments. » « Non », a convenu le physicien, « pas si nous parlons d’erreurs répétées », et le statisticien a ajouté, « Nous vérifions nos instruments ». Puis les deux terminent à nouveau leurs pensées respectives : « Mais si nous connaissions parfaitement cette expérience… » « …nous ne la ferions pas! »

Image de xkcd

L’un des buts de cet échange hypothétique est de reconnaître que les mesures non linéaires ne sont pas familières. Cependant, cet échange illustre aussi une sorte de hiérarchie de modèles. Il y a d’abord la confirmation de l’existence d’une nouvelle idée (« est-ce que ça existe? »), puis une décision sur la pertinence de l’idée (« non »), et enfin, une prise en compte de l’inconnu. En un sens, les mesures et les modèles de l’expérience sont fournis, respectivement, par le statisticien et le physicien à différents moments de l’échange. Ensemble, il et elle déduisent les actions à entreprendre, le cas échéant. La seule chose notable est peut-être que cela se passe en quelques mots seulement.

L’autre objectif est de se demander si cette notion obscure, de mesure non linéaire, peut s’intégrer dans une hiérarchie de modèles statistiques. En s’adressant à un large public, Salsburg (2017) souligne que le principe central de l’enquête statistique est que les mesures = vérité + erreur. Autrement dit, les mesures sont linéairement liées à la vérité. Cela implique-t-il que notre règle a des incréments linéaires, ou que nous utilisons déjà l’unité la plus appropriée? Au contraire, les mesures qui sont considérées comme étant égales à linéaire + non linéaire + non associé, semblent confondre le principe central, du moins si la vérité = linéaire et l’erreur = non associé. En effet, la partie non linéaire n’entre dans aucune des deux catégories. Bien que cela puisse sembler critique, qu’en est-il de notre échange hypothétique, qui aboutit à un accord conditionnel pour modifier l’expérience, mais aucune action basée sur ce qui est inconnu ou non familier?

Peut-être devons-nous considérer le locataire central comme faisant partie d’une hiérarchie de modèles de complexité et de familiarité variables. Une telle idée n’est pas complètement nouvelle; elle apparaît dans la littérature géophysique. Notre échange hypothétique peut être proposé comme une autre analogie accessible. En d’autres mots, la décision d’agir repose sur le principe central (un modèle de vérité + erreur), mais la conversation ne s’arrête pas là. Par exemple, Mahalanobis (1947) prédit qu’à mesure que les mesures deviennent plus précises, le biais systématique devrait être plus facile à détecter. Il serait intéressant de voir si cette prédiction s’est vérifiée depuis qu’elle a été faite, avec les progrès constants de la métrologie, des mesures climatiques et de leurs unités.

Mahalanobis, P. C., 1947: Summary of a lecture on the combination of data from tests conducted at different laboratories (reported by J. Tucker Jr.). Amer. Soc. Test. Materials Bulletin, 144, 64–66.

Cet article a été co-publié avec le COSN et le bulletin SSC Liaison.


Rick Danielson est actuellement chercheur à l’Institut océanographique de Bedford, où il explore différentes mesures de l’interface entre le milieu marin et l’eau douce (principalement à l’aide de Radarsat et de WRFHydro). Il a été assez régulièrement mis au défi par la modélisation des mesures pendant quatre ans au Nansen Center de Bergen (Norvège), deux ans chacun en tant que chercheur invité au National Hurricane Center de Miami, et en tant que scientifique physique au CCCE de Dorval et Halifax. Les années de formation ont été passées en tant que post-doc à l’Université Dalhousie (avec quelques moments agréables au centre local de la SCMO) et en tant qu’étudiant diplômé à McGill.

les mesures non linéaires, Rick Danielson, statistique

Pour les numéros précédents allez à la page Archives sur le site principal.

© 2017 Société canadienne de météorologie et d’océanographie

Designed & powered by Creative Carbon