La boîte à moustaches

February 24, 2013
By

This post was kindly contributed by Baptiste Coulmont » R - go there to comment and to read the full post.

On n’utilise pas assez les boîtes à moustaches. Je ne suis pas le seul à faire le constat. Howard Becker, qui n’est pas connu pour être un “quantitatif”, regrette l’absence de telles boîtes moustachues dans les principales revues de sociologie américaines.
Rappelons ce que sont ces boîtes. Pour citer Becker, elles fournissent “une grande quantité de données sur un ensemble de chiffres, dans un format pratique, facile à lire et aisément comparable. La boîte à moustache montre de manière graphique (…) les données le splus importantes d’une distrtibution numérique — la médiane, les charnières (les points marquant les quartiles approximatifs), l’aire complète de distribution –, elle permet d’identifier facilement les cas qui sortent de la moyenne, pour s’y intéresser plus particulièrement.” [Becker, Howard S. Comment parler de la société, Paris, La Découverte, 2009 (édition originale, 2007), p.91]
C’est un graphique synthétique, qui permet de connaître, pour une distribution, sa dispersion, la tendance centrale, l’aire… mais aussi les extrêmes.
Ainsi la répartition des notes dans deux classes :
boitemoustache
La note médiane de classe “t1″ est 10, celle de la classe t2 est 9. Mais la distribution des notes des deux classes diffère : la classe “t1″ est plus homogène.
La zone en grisé représente ce qui se trouve entre le premier quartile et le troisième quartile. Les “charnières” se trouvent situées au point maximal situé en dessous de 1,5 fois l’écart inter-quartile en partant du 3e quartile (même chose, mais de manière inverse, pour le 1er quartile). Tous les points situés au dessus de cette “charnière” se trouvera représenté par un point, ce qui permet d’attirer l’attention sur certaines valeurs extrêmes. En l’occurrence, ici, les deux élèves ayant eu 20 de moyenne.

La boîte à moustache a été inventée par John Tuckey dans les années 1970 : le caractère relativement récent de cette création explique probablement qu’il n’y a pas qu’une seule convention de représentation. La moyenne est parfois représentée dans la boîte. Certains quantiles sont parfois aussi représentés… bref, il y a de la variation, et on n’est jamais certain (sauf à regarder la note de bas de page) de la convention utilisée pour dessiner la boîte à moustaches que l’on a sous les yeux.
Ceci explique probablement pourquoi Becker n’a trouvé aucune boîte dans les 77 articles de l’American Sociological Review et de l’American Journal of Sociology de l’année 2001, alors que 68 articles, écrit-il, contenaient des données qui auraient pu être synthétisées à l’aide de telles boîtes.

Note : avec R, l’instruction boxplot() dessine les boîtes à moustaches.

Tags: , , ,

Comments are closed.