jeudi 24 mai 2012

Comment choisir le meilleur graphique pour vos analyse ?

Imaginez que c'est un mardi après-midi, vous êtes tranquillement assis à votre bureau à jouer au solitaire... et la, soudainement vous recevez un email de Linda, votre boss, vous vous demandez ce qu'elle peut bien vous vouloir ! vous ouvrez l'email et lisez ceci :

Je dois réaliser un rapport sur les ventes pour Adam (le big boss), il veut avoir une vue d'ensemble sur les ventes par famille de produit et région commerciale pour tous les mois du trimestre en cours. Peux-tu me créer un rapport que je pourrais lui envoyer ? je le veux sur mon bureau pour demain matin 9h.
Voyant une chance d'impressionner le big boss, vous plongez sans perdre de temps dans la conception de votre rapport, choisissant avec soin l'arrière-plan, la typo et les couleurs à utiliser. Et au moment de représenter les données, pas question de choisir le banal histogramme ou le classique camembert. Vous parcourez la liste des graphiques disponibles dans votre outils de reporting à la recherche d'un truc "cool" et la bingo, vous trouvez votre bonheur : radars, anneaux et autres formes 3D.

Vers 9h le lendemain matin, vous recevez un autre email de Linda qui vous dit : "Très bon boulot", suivi d'un smiley. Elle est contente parce que son boss est content ! et vous vous ne pensez qu'à ce que vous allez faire avec votre future augmentation bien méritée...

Sauf que, en réalité, Adam va passer un temps supplémentaires pour décrypter les informations transmise par les graphes et peut-être même passer devant certains détails inaperçus.

Fort heureusement, nous allons voir dans ce billet quelques bonnes pratiques en matière de représentation des données, quelle représentation pour quelle circonstance, comment éviter les éléments distrayants et attirer l'attention sur l'information essentielle. Les éléments présentés sont très largement issus des recherches de Stephen Few, auteur de nombreux ouvrages de référence dans le domaine dans le célèbre Show Me the Numbers.

Concepts de base

La première chose que nous allons visiter est l'utilisation appropriés des tableaux vs graphiques.

Tableaux vs Graphiques

Les tableaux sont plus efficaces lorsqu'il y'a besoin de voir les valeurs individuellement ou que les valeurs numériques doivent être précises. Les graphes quant à eux sont plus efficaces lorsqu'on l'information recherchée réside dans la relation entre les données (comparaisons, tendances, exceptions...).



Si vous avez besoin de voir un taux de façon individuelle, comme par exemple le taux du mois de février 2001, ce tableau satisfait ce besoin de façon très efficace. Cependant, si vous souhaitez voir comment le cours a changé durant l'année 1996 et le comparer la courbe de ce changement avec l'année suivantes, un graph serait beaucoup plus efficace.



Les 7 relations courantes entre les données quantitatives

Comme j'avais expliqué dans un précédant article, un nombre par lui-même n'apporte que très peu de sens, ce qui donne du sens c'est de voir ce nombre en relation avec d'autres nombre appartenant au même contexte.

Stephen Few a identifié 7 types de relations porteuses de sens sur des données quantitatives en gestion.

1. Les séries temporelles

Sans doute la relation la plus courantes et la plus utilisée (75% des graphes en gestion affichent des séries temporelles). Elle exprime une suite de valeurs mesurées à interval de temps régulier. Elle permet de représenter l'évolution d'une quantité en fonction du temps. Les séries temporelles permettent entre autre de révéler les tendances.



Les méthodes de représentation pour ce type de relation sont :

- Lignes pour mettre l'accent sur la forme des données (détecter des tendances)
- Barres pour mettre l'accent sur la comparaison entre des valeurs individuelles
- Points connectés par des lignes pour accentuer les valeurs individuelles tout en ayant une vue sur la forme des données

2. Classement

Il est souvent utile en gestion de voir les choses classées, comme les dépenses par département ou la performance des commerciaux. Cela ne révèle pas seulement le classement mais rend plus facile la comparaison des valeurs en plaçant les plus proches côte à côte.

La meilleure façon de représenter ce type de relation est d'utiliser des barres (horizontales ou verticales). Mais attentions à bien veiller que l'échelle inclut la valeur 0. Dans le cas inverse, il convient d'utiliser des points.



3. Partie par rapport à l'ensemble

Le but de cette relation est de révéler la portion d'une valeur par rapport à l'ensemble, elle est utilisé pour voir comment quelque chose est divisée en plusieurs parties et le pourcentage de chaque partie. Par exemple comment un marché est répartie entre les différents concurrents ou comment les dépenses sont réparties par région.

Ce type de relation mérite une attention particulière car elle est couramment représentée par des secteurs (camemberts). Cependant l'utilisation de barres est plus efficace. Pour plus d'infos je vous recommande l'excellent article Gardez les camemberts pour le dessert



Si il est y'a besoin d'afficher les mesures de l'ensemble en plus de celle des parties, il convient d'utiliser les barres empilées.

4. Écarts

Cette relation est utilisée pour afficher l'écart entre un ensemble de valeurs et des valeurs de référence. L'utilisation la plus courante en gestion est l'affichage de valeurs réelles (ex: dépenses) par rapport aux valeurs prévues (ex: budget).

Si les valeurs représentés ont également une relation de série-temporelle, il convient d'utiliser les courbes ou courbes avec marques (pour mettre l'accent sur les valeurs individuelles).

Autrement, des barres.



5. Distribution

Le but de cette relation est de montrer comment un ensemble de valeurs sont répartis sur un interval. L'examination de la distribution d'un ensemble de valeurs peut en apprendre beaucoup, particulièrement la forme de la distribution qui révèle si il y'a des gaps ou des concentrations.

Il convient d'utiliser pour ce type de relation :

Histogramme (barres verticales) pour mettre l'accent sur les valeurs individuelles.
Polygone de fréquence (courbe) pour mettre l'accent sur la forme des données.



6. Corrélations

Utilisée pour révéler si il y'a une relation significative entre deux ensembles de mesures différentes (par exemple si l'une croit, l'autre croit aussi ou si l'une croit, l'autre décroit).

Utilisez cette relation si vous voulez examiner un lien de cause à effet entre deux sets de mesures quantitatives. La meilleure représentation pour ce type de relation est le nuage de points.



7. Comparaison nominale

Ce type de relation est utilisée pour comparer les valeurs entre des entités qui n'ont aucune relation sémantiques entre-elles, lorsque vous êtes face à ce type de relation, il est toujours utile de se poser la question si il est pas possible de mettre en lumière un autre type de relation apportant ainsi plus de sens au graphe. Dans l'exemple ci-dessous, un simple réarrangement des régions dans l'ordre croissant de leurs valeurs produirait une relation de classement.

Cependant, parfois les valeurs discrète d'une variable de catégorie doivent être arrangées dans un ordre particulier parce que les utilisateurs s'attendent à les voir dans cet ordre (comme des régions ou catégories d'âge) :



Pour plus d'infos sur le sujet, je vous recommande la lecture du livre Show Me The Numbers: Designing Tables And Graphs To Enlighten de Stephen Few.

Aucun commentaire:

Enregistrer un commentaire