lundi 12 mars 2012

Le Data Warehouse : à quoi sert-il ? et pourquoi en a t'on besoin ?

Les données sont conservées au sein des organisations dans deux emplacements : le système d'information opérationnel et l'entrepôt de données (Data warehouse).

Le système d'information opérationnel est le point d'entrée des données (lecture des codes-barres de vos articles lors de votre passage en caisse au supermarché) et le data warehouse est leur point de sortie (consultation du chiffre d'affaire réalisé la semaine dernière par le responsable du supermarché).
 Pourquoi a t'ont besoin d'un data warehouse ? pourquoi ne pas se contenter d'un seul système qui fait tout ?

Plusieurs raisons justifient la nécessité d'isoler le data warehouse du système opérationnel :

Différents besoins

Les systèmes opérationnels servent à la gestion opérationnelle de l'activité de l'organisation : prise de commandes, ajout de nouveaux clients, enregistrement des pleintes... Ils traitent quasiment qu'un seul enregistrement à la fois.

Le data warehouse quant à lui sert à l'analyse de l'activité de l'organisation : éxaminer l'impact des remises ou promotions sur les commandes, les principaux motifs de pleintes des clients... Et traite pour répondre à ces questions des centaines voire milliers d'enregistrements à la fois.

Ces traitements necessitent de grands calculs et les effectuer directement sur le système opérationnel pendant les heures d'activité le ralentirait et nuirait au bon déroulement des opérations (imaginez que vous ayez besoin de faire des recherches sur internet pour votre travail et que votre frère à côté consomme toutes la bande-passante avec des téléchargements ?)

Consolidation

Pour faire des analyses, on a souvent besoin de croiser les données internes de l'entreprise avec des données externes. Par exemple attribuer un score de potentiel d'achat aux clients selon leur comportement d'achat passé (données internes) et des données issues de statistiques socio-économiques tel que le revenu moyen par catégorie socioprofessionnel ou revenu moyen des ménages par commune (source externes). Le data warehouse reprend les données internes de l'entreprise mais peut aussi être enrichit par d'autres données issues de sources externes comme l'INSEE ou la DGI.

De plus, même lorsqu'il s'agit de données internes, souvent les entreprises n'ont pas un unique systèmes opérationnel mais plusieurs différents : un système pour la gestion commerciale, un autre pour la comptabilité, Excel pour la gestion du budget... et l'intérêt d'un data warehouse est de ressembler les données provenants de toutes ces sources dans un même endroit afin de pouvoir faire des analyses holistiques de l'activité.

Historisation

Contrairement au SI opérationnel, le data warehouse repose sur le principe de conservation de l'historique des données, la ou le SI opérationnel va conserver uniquement les données utiles pour l'expoitation (lors du changement du prix d'un article, le nouveau prix vient tout simplement remplacer l'ancien), dans le data warehouse, on conserve toute l'historique des données utiles pour l'analyse (on conserve une trace du changement de prix des articles). Cette information permettra par exemple aux analystes marketing d'analyser l'impact du changement de prix sur le volume des ventes.

Livre recommandé

3 commentaires: