linkedin twitter

Vous avez peut-être déjà entendu parler du modèle de données d’entreprise (Enterprise Data Model ou EDM) ? Vous en avez une idée peu précise et vous souhaitez en savoir un peu plus sur le sujet ?

Cet article se propose de faire un tour d’horizon rapide et de donner quelques repères clés qui vous seront utiles si vous participez à un projet d’alignement du Système d’information.

La première partie de notre propos va consister à positionner l’EDM par rapport aux modèles de données qui jalonnent habituellement les projets informatiques. Sont présentés ensuite les principaux apports de l’EDM et les différents contextes qui peuvent bénéficier de sa mise en œuvre. Pour conclure, nous  rappelons les différences fondamentales qui existent entre un EDM et le modèle de niveau logique utilisé durant la phase de spécification fonctionnelle d’une application.

 

Objectifs de la modélisation des données – Aperçu des différents modèles

Un modèle de données est un moyen de documenter les besoins en information et de définir des spécifications pour la conception des bases de données. Les analystes vont utiliser le modèle pour :

  • Confirmer, avec les propriétaires des données, la bonne compréhension des usages envisagés et des exigences associées,
  • Définir un cahier des charges à destination des équipes techniques en charge de concevoir et de maintenir les schémas physiques des bases qui hébergeront les données.

 

Il existe une variété de modèles qui jalonne le cycle de vie du Système d’Information. Les principaux modèles qui sont mis en œuvre en tant qu’outil de management de l’information sont les suivants :

  • L’Enterprise Data Model (EDM), appelé aussi modèle conceptuel de données d’entreprise ou plus simplement modèle de données d’entreprise. C’est celui qui nous intéresse au premier chef. Il est utilisé lors de l’élicitation des besoins relatifs à la construction du Système d’Information et définit une vue d’ensemble des principales entités métier et de leurs relations. C’est la vision statique d’un ou plusieurs domaines métier de l’organisation. On peut voir l’EDM comme les plans d’ensemble d’un bâtiment. Il fournit une bonne idée de ce qui est exigé au niveau du gros œuvre, sans détail superflue concernant les futurs aménagements.
  • Le modèle de données logique est un diagramme normalisé (au sens 3ième forme normale de Codd) qui décrit complètement chaque entité et les règles de gestion associées (cardinalités des relations, domaines de valeurs des attributs…). Ce modèle est élaboré durant la phase d’analyse des exigences métier des projets informatiques. C’est un jalon de la conception des systèmes d’information transactionnels. En revanche, il ne constitue pas un préalable à l’implémentation des projets dont le périmètre de gestion de l’information se limite à du transport, de la transformation, ou  de la valorisation  (comme les projets d’échange de données ou les projets décisionnels). Ce modèle est élaboré durant la phase de conception de l’architecture.
  • Le modèle physique est une représentation finale des structures de base de données qui seront produites et exploitées. Il compose le cahier des charges détaillé pour l’implémentation de la base de données. On associe couramment le langage de définition de données (DDL), utilisé pour créer la structure des bases de données, au modèle physique.
  • Enfin, le modèle dimensionnel (bien connu des informaticiens et consultants travaillant dans le domaine de l’informatique décisionnelle) représente des faits et des dimensions utilisés à des fins d’analyse et de reporting.  C’est un modèle « physique » bien que parfois il apparaisse dans une version logique dé-normalisée.

 

Les apports et contextes d’utilisation de l’EDM

Tout d’abord, l’EDM en tant que représentation de haut niveau fournit un cadre pertinent d’analyse de la répartition et de l’utilisation des données au sein des différents domaines métier. C’est un élément d’étude appréciable pour les projets d’amélioration de la qualité des données (minimisation des redondances, des disparités, des incohérences …) et pour les activités d’urbanisation du SI.

Mais dans les faits, le champ d’application du modèle de données d’entreprise est bien plus vaste. L’EMD va jouer un rôle essentiel dans la planification et la mise en œuvre des mécanismes de gouvernance de l’information au sein de l’entreprise. Parmi les problématiques pouvant bénéficier du déploiement d’un EDM citons notamment : la classification et l’indexation des données existantes, la définition d’une vision cible de l’organisation des données à l’échelle de l’entreprise, l’alignement des modèles de données locaux sur la vision cible, et enfin l’élaboration des modèles de processus métier.

  • Classifier et indexer les données existantes

La plupart des organisations ont réalisé des investissements conséquents dans le déploiement des applications et des bases de données existantes avec, toutefois, un niveau de qualité de la documentation qui reste très variable d’un contexte à l’autre.

Si la refonte du système d’information autour d’une structure de données commune est irréaliste (tout le monde en convient), l’absence d’un registre centralisé des bases de données est un  obstacle majeur à une utilisation optimale des informations disponibles. Comment mettre en place une gestion et un partage efficaces de l’information entre les différents métiers et les différentes applications si nous ne savons pas quelles données existent et où elles sont localisées ?  L’EMD, en tant que dictionnaire centralisé,  peut  contenir l’ensemble des métadonnées qui précisent la localisation et le format des informations réparties dans les diverses applications, ainsi que les correspondances qu’elles entretiennent les unes avec les autres. La méthode la plus efficace pour maintenir ces liens consiste à mapper chacune des entités métier vers l’élément unifié de l’EDM. En tant que registre centralisé des données métier, l’EMD devient l’élément pivot autour duquel sont définis les flux et les formats d’échange inter-applicatifs.

  • Proposer une vision cible à l’échelle de l’entreprise

A l’image d’un plan d’urbanisation d’une ville qui décrit ce que cette ville va devenir dans un futur plus ou moins proche, un modèle de données d’entreprise décrit vers quoi doit tendre l’organisation des données informatisées pour rester en phase avec l’évolution des métiers.  Avec des modèles de processus également à la cible, cette vision constitue le modèle d’activité métier à déployer afin de supporter la stratégie de l’organisation. Elle définit un ensemble minimal d’exigences auquel seront confrontées les solutions informatiques, qu’il s’agisse de développements spécifiques ou de solutions sur étagère.

  • Aligner les modèles de données locaux sur la vision unifiée

Il s’agit d’un apport limité aux projets qui vont faire l’objet d’un développement spécifique et pour lesquels l’élaboration  d’un modèle de données logique reste un jalon clé. Dans ces cas de figure, l’EMD devient le substrat qui facilite la construction des modèles plus détaillés, tout en limitant les risques de dérive vis-à-vis de la vision cible. Au démarrage d’un projet, le modèle de données d’entreprise est un soutien précieux pour traiter la question du périmètre fonctionnel et celle, plus épineuse, des recouvrements éventuels avec les modèles déjà en production. Il permet d’identifier au plus tôt les problèmes liés au partage des données et d’y remédier avec les solutions généralement les moins coûteuses.

  • Soutenir la modélisation des processus

Trop souvent les projets de modélisation de processus ne traitent que de manière implicite les besoins et les règles de gestion associés aux informations métier. Or l’information métier est pourtant bien la ressource que consomme ou produit le plus fréquemment un processus métier. Un projet de modélisation des processus qui va déboucher sur un développement informatique, même partiel, se doit d’intégrer la composante « données » en complément de la partie « traitement » qu’est le processus. Cette composante « donnée » c’est notre  modèle de données d’entreprise.  Le modèle  des processus et l’EDM sont deux visions duales des métiers de l’entreprise, qui doivent être intégrées dans une seule et même démarche de construction du Système d’Information.

L’EMD est d’autre part un outil qui facilite la création et la validation des modèles de processus dans la mesure où il catalogue les informations qui sont mises en jeu dans la réalisation des différents processus. On peut rapidement vérifier la cohérence des traitements modélisés  en examinant quand et comment sont produites et consommées les informations métier. L’EMD intègre par ailleurs un dictionnaire des termes métier permettant de disposer d’un vocabulaire commun au sein de l’organisation. Ce dictionnaire est d’une importance capitale car il contribue de manière significative à la compréhension du métier de l’entreprise ; que ce dernier soit présenté sous l’angle des données ou du point de vue des processus.

Il existe une logique d’alignement entre ces différents modèles de données : Modèle de données d’entreprise -> Modèle logique -> Modèle physique. Dans cette logique,  L’EDM tient le haut du pavé en tant que support à l’expression des besoins métier qui vont orienter les principales décisions relatives à la transformation du SI.

 

Les caractéristiques du modèle de données d’entreprise

Le modèle présente une organisation des données métier critiques, (on trouve assez souvent le terme d’invariant métier dans la littérature), indépendante de leur origine ou de la façon dont elles vont être utilisées. Il a pour principal objectif d’aligner les acteurs et les développements informatiques sur les aspects ayant trait à la sémantique des données.  On parle volontiers d’un modèle mais en réalité il s’agit plus fréquemment d’un ensemble de modèles interconnectés ; chaque modèle étant associé à un domaine d’activité.

Un modèle de données d’entreprise doit se borner à décrire :

  • Les objets métier significatifs pour l’organisation qui doivent être enregistrés dans le système d’information,
  • Les faits à propos de ces objets (relations et attributs principaux) qui doivent être connus et partagés de tous les acteurs.

 

Ce modèle contient une partie graphique (un diagramme entité-relation, IDEF1X, UML…) et une partie narrative (le dictionnaire des données). L’ensemble forme un tout indissociable qui doit répondre aux trois critères qualitatifs :

  • La conformité du modèle. L’EDM représente avant tout une réalité métier sans considération des technologies pouvant être utilisées. C’est cette réalité qui va structurer, au moins en partie, les modèles de processus et les développements du SI.
  • Sa capacité à être réutilisé.  Le modèle est-il utilisable à d’autres fins ? On doit pouvoir répondre par l’affirmative. Comme indiqué précédemment, l’EDM doit pouvoir être décliné en modèles de données locaux (modèles logiques des projets informatiques) ou servir les travaux de spécification des flux d’échanges inter-applicatifs.
  • Son intelligibilité. Le modèle est-il suffisamment communiquant ? Comment va-t-il être interprété par les différents acteurs participant à la transformation du SI ? Les entités et leurs définitions représentent-elles des notions métier avec lesquelles les utilisateurs sont familiers et qu’ils peuvent facilement vérifier ?   La qualité du modèle final dépend beaucoup de la participation des métiers à son élaboration. Les problèmes de communication les plus communs sont principalement dus à des modèles trop complexes ou à l’emploi d’une terminologie trop pointue et pas suffisamment maîtrisée de l’ensemble des acteurs.

 

La figure suivante dresse une liste des principales différences qui existent entre un EDM défini à un niveau conceptuel et un modèle logique de données tel que réalisé en phase de conception d’un projet SI.

 

Pour l’EDM, l’objectif est avant tout centré sur l’identification et le partage des concepts et des définitions de premier plan, et non pas sur la rigueur de la démarche ou sur l’exhaustivité du résultat.

L’exemple donné ci-après montre (en notation Barker) comment le modèle conceptuel de l’EDM évolue pour devenir un modèle logique complet (en terme d’attributs et de clés notamment) et normalisé selon les principes de Boyce et Codd.

Ci-dessus, un modèle conceptuel de l’EDM sans attributs (les attributs principaux auraient pu être mentionnés et avec une relation N:M non résolue.

Ci-dessus le modèle logique normalisé correspondant : tous les attributs sont identifiés (y compris les clés primaires et étrangères). La relation N:M a été résolue. L’entité correspondante porte les attributs de la relation.

 

En synthèse

Un modèle de données d’entreprise est une représentation d’ensemble de l’organisation des informations critiques nécessaires à l’exercice des métiers de l’entreprise. C’est justement parce qu’elle est synthétique que cette vision doit être partagée et qu’elle est un excellent support aux démarches visant à améliorer la qualité des données gérées dans le SI.

Nous avons souligné l’importance de la construction d’un EDM en tant qu’activité préparatoire pour l’implémentation des bases de données et la formalisation des exigences métier. De manière plus générale,  l’EDM fournit une base de travail structurante et exploitable à partir de laquelle des initiatives de modélisation complémentaires (les modèles de processus), ou plus détaillées (les modèles logiques de données), pourront être lancées et réalisées dans des conditions optimales.

L’élaboration et la gestion d’un modèle de données d’entreprise font désormais partie intégrante des démarches d’alignement du SI sur les métiers. Pas de déploiement d’une architecture d’entreprise sans y intégrer la Gouvernance des données ! Et pour qui souhaite produire un modèle d’activité métier qui soit cohérent et exploitable, pas de représentation des processus  sans modèles de données d’entreprise !

 

Sources et références
Data Modeling Essentials de Graeme Simsion et Graham Witt
Workflow Modeling: Tools for Process Improvement and Application Development de Alec Sharp et Patrick McDermott

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Voir plus
scroll to top