Partez à la découverte de Tableau Data Management, un article de blog proposé par John Bontit, Data Analyst au sein de la #SynalTeam.
Tableau Data Management
Quelle problématique ?
-
Volumétrie de la donnée
Aujourd’hui les données sont partout, elles sont devenues indispensables pour le business d’où la dénomination de nouvel “or noir”. Face à cette prolifération de données, les entreprises se lancent de plus en plus dans des « use cases » pour challenger cet existant.
Cependant, la DSI n’a toujours pas conscience de l’existence, de la pertinence ou encore du champ d’application de certaines données capturées par les équipes métier. Elle peut donc rencontrer très souvent :
- Une instabilité ou un obstacle lorsqu’il s’agit de mettre à disposition ou hors service certaines tables et sources de données.
- De la difficulté à mesurer l’impact que cette instabilité pourrait avoir sur les utilisateurs finaux ou même sur les tableaux de bord stratégiques.
-
Utilisation des données : DSI ou métier
Les décisions stratégiques basées sur les données prennent de plus en plus d’importance au sein des entreprises ; bon nombre d’utilisateurs métier demandent à davantage accéder aux données afin de réaliser des micro analyses.
Cependant, malgré l’acquisition de compétences techniques avancées, la plupart des utilisateurs ne savent pas tous où trouver les données. Ou s’ils les trouvent, ils ne savent pas forcément sur lesquelles il faut se concentrer.
En effet, il peut s’avérer difficile pour des profils non IT de comprendre les structures des bases de données. (complexité des structures de données) Ou encore de comprendre les tables (convention de noms) à lier pour obtenir un résultat donné.
À l’époque où l’accès aux données était réservé à quelques spécialistes, il suffisait de s’adresser au responsable attitré des données. Aujourd’hui, face à l’augmentation des « use cases » impliquant des données de divers services et face à l’adoption rapide de l’analytique moderne, ce scénario n’est plus possible.
-
Transparence et confiance
Par le passé, déterminer la façon dont les données étaient utilisées dans toute l’entreprise était soit une préoccupation secondaire, soit réservée à un certain groupe d’individus. En effet, aujourd’hui, rares sont les utilisateurs finaux qui procèdent à la vérification, pertinence, actualisation des données qu’elles prévoient d’exploiter.
Pour que les utilisateurs finaux puissent déterminer la pertinence et la fiabilité des données à leur disposition, ils doivent donc avoir des informations sur la qualité de leurs données dans le contexte de l’analyse.
Le processus de conformité des données peut s’avérer dans certains cas comme un long et fastidieux processus. Cela peut aller jusqu’à remettre en cause les données. Toutefois, si nous leur donnons accès au métadonnées, alors ils auront une entière confiance en les données qu’ils utilisent.
Ces 3 points décrivent pleinement la problématique selon laquelle la variété des données ne cesse de croître. Les datawarehouses et autres outils de gestion ne sont pas exploités de façon optimale. De plus, l’accès des utilisateurs aux données appropriées pour la prise de décision n’est pas toujours facile à assurer.
Avec Tableau Data Management, c’est faciliter la gestion des données de manière à favoriser la prise de décision sur des données de qualité, fiable et à jour.
Qu’est ce que Tableau Data Management ?
Tableau Data Management, c’est un module Tableau qui permet de mieux gérer toutes les données d’une entreprise afin de garantir des données fiables et à jour. Une fois que vos données sont ingérées et stockées dans vos sources, elles sont traitées, analysées, puis partagées dans toute l’entreprise. Les processus de gestion des données, tels que l’actualisation des flux de préparation, l’accès aux métadonnées et leur ajout, ou encore l’identification du lignage des données sont étroitement intégrées dans Tableau Server/Online.
En phase avec l’adoption de l’analyse en self-service, elle renforce la confiance dans les données via un processus de 3 étapes :
-
La préparation des données : Tableau Prep Builder
Tableau Prep Builder est l’outil de préparation de données de Tableau Software. Il permet de combiner, nettoyer, échantillonner et de mettre en forme les données de manière visuelle et directe pour se lancer au plus vite dans l’analyse.
On peut le connecter à d’innombrables sources, manipuler tous types de données, de toutes formes et de toutes tailles, sur site, dans des applications cloud ou dans des fichiers plats.
Vous souhaitez en savoir plus sur Tableau Prep Builder ?
A la découverte de Tableau Prep Builder
De Tableau Prep à la visualisation sur Tableau
-
Le catalogage des données : Tableau Catalog
Tableau Catalog, c’est la gestion de vos données dans le détail. En effet, vous pouvez obtenir une vue complète de toutes les données utilisées par Tableau et la manière dont elles sont reliées à vos analyses.
Tout utilisateur peut identifier, comprendre et exploiter des données fiables avec une fonctionnalité puissante de recherche, un dictionnaire de données, le lignage et l’analyse d’impact.
-
Confiance :
Avec Tableau Catalog, c’est du win-win. Elle offre une visibilité totale sur les données et sur la manière dont elles s’intègrent à votre environnement analytique Tableau et renforce ainsi la confiance tout en facilitant la découverte, aussi bien pour la DSI que pour les utilisateurs métier. Tableau Catalog vous donne l’assurance que votre entreprise utilise toujours les bonnes données.
-
Data lineage :
La migration des bases de données, la définition d’un champ comme étant obsolète ou l’ajout d’une colonne à une table sont des actions qui peuvent toutes avoir des répercussions sur les contenus qui se trouvent dans votre environnement. Avec le lignage et l’analyse d’impact, vous pouvez non seulement voir les conséquences en amont et en aval, mais vous pouvez aussi déterminer qui sera affecté.
-
Metadata :
Cette fonctionnalité, comme sa définition l’indique, sert à définir ou à décrire une autre donnée. Elle garantit ainsi sur les données une confiance même pour les utilisateurs qui ne font que consulter un tableau de bord.
Avec les avertissements sur la qualité des données, il suffit de définir le statut à un endroit, puis de s’assurer que tous les éléments, des sources de données aux tableaux de bord, fournissent aux utilisateurs les bonnes informations pour une prise de décision pertinente. Pour conclure, Tableau Catalog, c’est la référence pour comprendre l’origine et la destination de nos données. Un champ décrit parfaitement son origine (base de données), les transformations qui lui ont été appliquées (Tableau Prep Builder, calculs), les classeurs et vues où ce champ est utilisé.
-
La gouvernance des données : Tableau Server/Online & Tableau Prep Conductor
Tableau Prep Conductor : c’est le complément de Tableau Prep Builder dans le sens où il est le responsable du partage, de la gestion et de l’automatisation des flux.
- Partage et exécution :
Il permet de partager et d’exécuter dans votre environnement de travail et en toute sécurité les sources de données avec Tableau Server/Online.
- Planification :
Il permet d’exécuter vos flux à n’importe quel moment ; et ainsi automatiser tous les process de préparation dans le but de bénéficier de données toujours prêtes et à jour.
- Surveillance :
Avec votre licence Creator et avec un accès administrateur de Serveur, il est possible de surveiller l’intégrité des flux et ainsi anticiper rapidement tout problème. Cela pourrait se faire par le biais d’alertes proactives qui renseignent sur l’état des flux.
Quelques critiques Tableau Data Management
- Tableau Prep Builder vs Talend Open Studio :
Le choix est évidemment vite fait pour un profil IT. L’étendue des fonctionnalités que propose Talend Open Studio n’a pas d’équivalence dans Tableau Prep Builder.
- Import et export de flux externes :
Talend avec Talend Big Data permet d’importer des flux Spark, des fonctionnalités permettant de gérer des scripts Python.
- TAC vs Tableau Prep Conductor :
La TAC un environnement plus complet pour la gestion des flux par rapport à son homologue Tableau.
Pourquoi Tableau Data Management ?
Tableau Server fournit une plateforme moderne et flexible qui peut être exécutée partout où vous le souhaitez dans votre infrastructure. Tableau Data Management s’intègre totalement dans l’infrastructure Tableau Server pour offrir :
- Une fiabilité maximale :
De la DSI à l’utilisateur isolé, Tableau Data Management offre la visibilité et le contrôle nécessaires pour renforcer la confiance dans l’environnement de données.
- Découverte des bonnes données :
Avec Tableau Data Management, tout un chacun a la garantie que l’analyse s’appuie sur des données fiables.
- Intégration à la plateforme Tableau :
Le potentiel de votre environnement de données est exploité à sa hauteur ; grâce à une option de gestion des données conçue pour Tableau et par Tableau.
- La gestion des données à grande échelle :
La préparation et l’analyse des données en libre-service deviennent aisées ; grâce à la mise en place et à l’automatisation de la gestion des données.
Vous découvrez Tableau Data Management et souhaitez aller plus loin ?
A propos de Tableau Data Management
Prise en main de Tableau Data Management
De plus, sachez qu’il y a également Tableau Server Management que nous essaierons d’approfondir dans un prochain article. En attendant, bonne lecture !