Commencer petit
Cet article fait partie de la série « Maillage de données avec Dremio ». Dans l’article précédent, nous avons rappelé ce qu’est le Data Mesh en 2026. Aujourd’hui, nous passons au concret avec le démarrage d’un tel projet.
« Il vous faut un sponsor. Un budget. Une feuille de route. Une équipe dédiée. » Cela en fait des choses à réunir avant même d’avoir commencé…
C’est pourquoi chez Synaltic, notre conseil a toujours été : commencez petit. Déployez. Testez. Apprenez. Et c’est parti.
Le piège de la préparation infinie
Construire un projet de consolidation de données à l’échelle de l’organisation est un projet qui s’avère forcément complexe. Par exemple, s’assurer que tout le monde possède une culture de la donnée et que tout le monde soit aligné ? Rien que ça, vous pourriez mettre un temps certain à l’obtenir !
Vous avez certainement entendu dire qu’il vous fallait un sponsor pour faire avancer votre projet. Vous vous direz aussi que vous devriez connaître votre budget avant même d’avoir commencé.
Le risque ? Passer des mois en phase de cadrage sans jamais rien livrer. Et perdre l’élan.

Figure 1 : Data Mesh – Construire votre Feuille de Route Technologique (Eric Broda – 2022)
Commencer petit, mais pas n’importe comment
Plus concrètement, commencer « petit » signifie : une équipe restreinte, un périmètre restreint. Il s’agit de construire une première valeur qui saura expliquer au plus grand nombre le projet que vous êtes en train de mener.
Si le périmètre choisi correspond aux concepts et aux cas d’usage que tout le monde comprend dans votre organisation, vous marquez de très bons points. La démonstration de la valeur sera d’autant plus grande si, en plus, vous avez « assez » de gouvernance afin que les acteurs de votre plateforme puissent aisément se projeter.
Au cours des premières étapes de développement, commencez modestement par la mise en œuvre, mais gardez en même temps une vue d’ensemble à l’esprit.
Choisir le bon premier domaine
Pas question de se retrouver coincé dans un catalogage des domaines qui n’en finirait pas. Au contraire, votre organisation fonctionne certainement par processus. Ne réinventez pas la roue. Partez de là.
Maintenant que vous avez les grands domaines, vous trouverez les grandes questions que l’on retrouve au sein des processus et sous-processus.

Figure 2 : Feuille de Route Data Mesh -Volet Opérationnel (Eric Broda – 2022)
Vous n’êtes pas obligé d’aller au bout du bout de cette démarche pour pouvoir faire de nouveaux pas. L’objectif ici est de comprendre comment ça fonctionne. Par contre, ce que nous aimons à répéter chez Synaltic, c’est que vous devez tout de même avoir la vision « holistique » du projet et de la plateforme. Parce qu’à chacune de vos itérations, vous vous rapprocherez un peu plus de la cible.
Chaque itération nourrit la suivante.
Commencez simplement avec des domaines que toute votre organisation sait comprendre. L’appropriation du projet et des données n’en sera que plus aisée.
Constituer la bonne équipe
Il est fort probable que l’on comprenne rapidement que ce projet va impliquer de nombreuses équipes. Il est tout aussi concevable qu’un modèle de données produit par une équipe, ou à un moment donné, soit utilisé pour tout ou partie afin de constituer un autre jeu de données, un autre « Produit de données ».

Figure 3 : Equipe Data Product (Eric Broda – 2022)
Pour votre premier domaine, vous aurez besoin de :
- Un Product Owner données — il porte la vision métier du produit de données
- Des ingénieurs de données — ils construisent les pipelines et les modèles
- Un ou plusieurs utilisateurs métier — ils valident la pertinence et connaissent leurs chiffres
Au-delà de la théorie, Synaltic n’a eu de cesse d’inviter ses clients à introduire les utilisateurs métier au plus tôt dans les projets. Les utilisateurs métiers connaissent leurs processus ! Ils connaissent souvent leurs chiffres sur le bout des doigts.
Il faut inclure les métiers et viser des cycles de livraison courts afin de garder l’engagement de tous intact. Bien sûr, laissez-leur du temps pour se consacrer à ce projet de données. Ils ont certainement tant à découvrir. Oui ! Il faut leur enseigner l’analyse de données et une vision de leur métier à l’aune des données.
Les invariants à poser dès le départ
Pour réussir votre projet, d’autres ingrédients sont vraiment nécessaires : gouvernance des données, traçabilité et observabilité des données, automatisation des déploiements et des livraisons.
La qualité des données est au cœur de votre stratégie : sans elle, vos décisions n’ont plus de fondements.
Une chose que nous avons apprise au cours de nos 20 années d’expérience, c’est la « fatigue » des systèmes — dit autrement, leur obsolescence : la fameuse dette technique. En posant vos fondations technologiques, vous savez déjà qu’à un moment donné vous devrez les faire évoluer. Vous devrez en changer.
La gouvernance, la gestion de la qualité, les automatisations, la culture de la donnée constituent des invariants que vous garderez, pour sûr, même après la mise en place de votre architecture et en ayant atteint des succès avec votre projet de data lakehouse.
Le volet communication : ne le négligez pas
Le volet communication, animation, formation est primordial ! Servez-vous-en afin de renforcer les pratiques de la littératie des données.
Vous comprendrez vite qu’il est important de :
- Communiquer votre vision,
- Constituer la bonne équipe,
- Optimiser votre architecture,
- Élaborer des feuilles de route,
- Définir les domaines,
- Identifier des processus,
- Sélectionner des cas d’utilisation.
Tout le monde doit être aligné, engagé et partager les mêmes objectifs.

Figure 4 : Feuille de Route Data Mesh – Volet Communication / Formation (Eric Broda – 2022)
Ce que vous devez avoir en sortie de cette phase
Pour rappel, à ce stade vous venez de :
- Vous aligner concernant les services de stockage, les outils ETL, la sécurité, le catalogue de données, le moteur de traitement, etc.
- Sélectionner le premier cas d’utilisation et identifier une équipe métier. Vous avez choisi la bonne équipe pour créer les premiers produits de données.
- Définir un projet restreint avec une portée claire mais limitée, et qui peut de préférence être terminé en quelques semaines.
- Identifier votre équipe « produit de données » et savoir vous appuyer sur une équipe plateforme de données afin de couvrir le périmètre technique requis.
N’industrialisez pas ce que vous n’avez pas encore compris
Ici, un conseil crucial : n’industrialisez pas ce que vous n’avez pas encore compris ! C’est la valeur qui nous intéresse. Pas la technologie pour la technologie.
Dremio présente un avantage certain. Vous prenez juste une machine avec suffisamment de ressources et cet « Agentic Lakehouse » sait d’ores et déjà vous servir ! Vous connectez une ou deux sources de données. Et c’est parti, vous êtes en mesure de délivrer un produit de données.
Au cours de votre projet, vous aurez l’organisation pour répéter aussi bien des POCs que des MVPs afin de mettre en œuvre de nouvelles fonctionnalités basées sur des briques nouvelles. Bien sûr, le but étant d’industrialiser… par la suite, vous prendrez le temps pour valider tel ou tel composant.
Rendez-vous au prochain article pour découvrir l’architecture technique : Dremio, Apache Iceberg™, et le modèle médaillon en pratique.


Sections commentaires non disponible.