jeudi 26 avril 2012

Apprendre à lire dans les nuages

Et oui, vous l'aurez deviné, il est question de nuages dans ce billet, et il ne s'agit pas de cloud pour une fois ! Ce que nous allons voir c'est comment découvrir des relations cachées en observant les nuages !

Vous avez certainement joué pendant votre enfance à ce jeu qui a inspiré nombre d'écrivains, poètes et cinéastes... s'allonger dans un champs, le regard levé vers le ciel et chercher des formes connues dans les nuages.

L'exercice que je vous propose est très similaire, sauf qu'au lieu de vous allonger dans un champs, vous restez sur votre bureau, et au lieu d'observer le ciel, vous posez les yeux sur votre ordinateur car c'est la que se trouve l'outils qui nous permettra de découvrir les relations cachées : le nuage de points.

Si comme moi, vous vous êtes toujours demandé à quoi pouvait servir ce graphique étrange et incompréhensible aux premiers abords ! vous n'aurez plus la même opinion après avoir lu cet article, sur cet outils très apprécié des scientifiques et particulièrement des économistes mais peu connu des autres professionnels.

Introduction

Le nuage de points est la meilleure représentation descriptive de la relation entre deux variables. Facile à comprendre, il donne accès à plusieurs informations au simple examen visuel.

Comment ça marche ?

Chacune des variables est projetée sur un axe. La forme de la projection permet de déterminer quel lien existe entre ces variables, et quel est la puissance de ce lien.


Quand l'utiliser ?

Il convient d'utiliser le nuage de points si vous souhaitez examiner si il existe une liaison entre deux variables numériques : relation de cause-à-effet, dépendances... Par exemple la sensibilité de la demande à la variation de prix d'un produit ou l'age de vos clients

Comment l'utiliser ?

Fabriquer le nuage est un véritable jeu d'enfants, la seule condition à respecter est que les données à représenter doivent être sous la forme de paires de mesures. Produire ensuite le graphique se fait généralement en quelques clics en fonction de l'outils que vous utilisez.

Quelle est la règle pour choisir sur quel axe devrait être les variables ?

Traditionnellement, il convient de place la variable considérée comme dépendante sur l'axe vertical (axe des y) et la variable considérée indépendante sur l'axe horizontal (les x).

Par exemple, si votre but est d'examiner la relation entre le salaire et le nombre d'années d’expérience. Le salaire (considérée comme la variable dépendante) est celui qui sera placé sur l'axe des y.

Interpréter le résultat 

La forme du nuage donne une indication sur le type de relation qui existe entre les variables, le tableau suivant résume les différents types de relations :


ExempleType de corrélationDescription
Forte positiveLa valeur de Y croit lorsque la valeur de X croit.
Forte négativeY décroit lorsque X croit.
Faible négativeOn peut établir une vague relation entre les deux variables.
Non linéaireTypiquement en forme de U ou de S, cela indique une relation non-linéaire entre les variables.
Aucune corrélationLe nuage de point couvre une grande surface et semble être rond ou ovale, il est peu probable qu’il l'ait corrélation entre les variables.

Degrès de corrélation

Plus la corrélation est forte, plus les points se regroupent autour d'une ligne. Dans le cas le plus extrême les points forment une ligne droite, ce qui exprime en forte liaison de type Y = A X + B et rend possible la prédiction de la valeur de l'effet pour n'importe quel valeur de la cause. A l'inverse plus la corrélation est faible et plus le nuage est diffus et couvre une large surface.


Les pièges à éviter

Attention, le nuage de points n'apporte pas de preuve formelle qu'une variable implique l'autre. L'étude des causalités est une exercice délicat, et il convient de faire attention à deux pièges dans lesquelles il est facile de tomber :

- Inverser le lien de causalité : si on cherche une corrélation entre le nombre de jours de pluie et la vente de parapluies il ne faudrait pas tirer la conclusion qu'il pleut parce qu’on vend plus de parapluies !

- La tierce cause : il se peut que deux phénomènes (A et B) soient liés à un troisième élément (C) qui les détermine tous les deux, dans ce cas on peut facilement penser que A détermine B et on trouvera toutes les preuves statistiques, sans jamais prendre en compte C.

1 commentaire:

  1. J'ai souvent la tête dans les nuages ,lol, mais je ne voyais que des formes que je trouvais amusantes et souvent je les photographie, mais j'ignorais qu'on pouvait y faire de la voyance, grâce à vous ce soir en allant coucher je serais un peu plus intelligente,lol

    RépondreSupprimer