Partez à la découverte de Tableau Prep Builder, un article de blog proposé par Aya MHADHBI, Data Analyst au sein de la #SynalTeam.
“Tableau Prep se compose de deux outils : Tableau Prep Builder pour la création des flux de données et Tableau Prep Conductor pour la programmation, la surveillance et la gestion des flux dans l’entreprise.” https://www.tableau.com/fr-fr/products/prep
Dans cet article, nous traiterons essentiellement de Tableau Prep Builder. Par la suite, un nouvel article vous sera proposé pour découvrir en détail Tableau Prep Conductor et nous terminerons cette série sur le positionnement de Tableau Prep par rapport à la concurrence.
A présent, nous allons vous présenter Tableau Prep Builder et répondre aux questions qui peuvent vous passer par la tête !
Qu’est-ce que Tableau Prep Builder ?
Tableau Prep Builder est l’un des produits de la suite Tableau, il est sorti en 2018. Tableau Prep Builder prend en charge la préparation des données brutes en offrant un moyen visuel et direct d’explorer, de nettoyer, de transformer, d’enrichir et de filtrer les données.
Il permet aux analystes et aux utilisateurs de réduire énormément le temps de préparation de leurs données et de se lancer plus vite dans l’analyse.
Partons maintenant à la découverte de l’interface de Tableau Prep Builder et comment l’utiliser…
Découverte de l’interface
Voici une capture de l’interface de Tableau Prep Builder. En jetant un premier coup d’œil, vous remarquez 4 zones différentes qui se déclinent ainsi :
- La zone A est le Volet de connexion. Placé sur le côté gauche de l’espace de travail, il affiche toutes les bases de données et les types de fichiers auxquels il est possible de se connecter. Pour ajouter une source à votre flux de données, il suffit de double-cliquer ou de glisser-déposer la source vers le zone B.
- La zone B est le Volet flux, c’est là où vous construisez vos flux afin de bien préparer vos données. Le flux présente les différentes opérations par ordre d’affectation pour préparer vos données.
A la sortie de ce flux, les données peuvent être générées sous différents formats, certains ouverts (.csv) et d’autre propriétaire Tableau (.dte et pour les versions les plus récentes de Tableau Software, son petit-frère ultra-optimisé .hyper).
- La zone C est le Volet Profil, il vous montre la structure de chaque champ selon l’étape du flux concerné. Ce volet permet d’examiner les données et d’identifier les valeurs aberrantes et/ou nulles après chaque opération dans le flux de données.
Un menu d’options est placé sur chaque colonne, il permet d’effectuer un ensemble d’opérations possibles selon le type de données (par exemple supprimer les espaces excédentaires sur les chaînes de caractères).
- La zone D est la grille de données, affiche les données au niveau des lignes dans un format structuré. Les valeurs affichées sont les résultats des opérations effectuées dans le volet Profil.
Il existe 2 zones supplémentaires dans cette interface :
Zone Nettoyer
C’est la barre d’outils horizontale qui s’affiche en haut du volet profil. Elle montre les seules opérations de nettoyage disponibles à chaque étape du flux. Une ampoule propose automatiquement des recommandations de traitement par rapport à la sémantique et au type des colonnes. Par exemple, l’outil peut détecter des codes postaux et traiter les contenus en conséquence.
Une icône permet de naviguer entre le volet Profil, la grille de données et les métadonnées pour faciliter le nettoyage.
Zone Modification
C’est la barre d’outils verticale qui s’affiche à gauche du volet profil et de la grille de données. Elle montre l’ensemble des opérations effectuées sur vos données dans l’ordre d’exécution (la recette de traitement).
Le but de cet affichage est de permettre à l’utilisateur de revenir en arrière, vérifier, ajuster ou même supprimer des opérations. Il est également possible d’ajouter une description aux modifications ou de les copier et les réutiliser sur d’autres étapes de flux.
Liste des opérations
L’interface n’a plus de secret pour vous ? Passons maintenant aux types de transformations que nous pourrons effectuer sur les données.
Nettoyer :
Une étape de nettoyage est proposée par Tableau Prep Builder pour effectuer diverses opérations de nettoyage sur vos données (gérer la casse, supprimer les lettres/les chiffres, supprimer la ponctuation, supprimer les espaces…)
Agréger :
Une étape d’agrégation qui permet de changer le niveau de détail des données.
Permuter :
Une étape de permutation qui permet de permuter vos données ; par exemple convertir des données de colonnes en lignes ou des données de lignes en colonnes.
Jointure :
Une étape de jointure pour combiner vos données sur la base d’un champ pivot.
Union :
Une étape ou unir deux jeux de données à partir où les colonnes des deux sources sont équivalentes. Attention, si certains champs ne sont pas équivalents, Tableau prep les souligne et vous donne la possibilité de les aligner.
Sortie :
Créer une étape de sortie pour enregistrer le résultat dans un fichier d’extrait (.hyper), un fichier (.csv), publier la sortie en tant que source de données sur un serveur ou écrire votre sortie de flux dans une base de données. Il est également possible de “brancher” le flux directement à Tableau Desktop. Une seule règle : il faut que votre logiciel Tableau Desktop soit d’une version égale ou supérieure à Tableau Prep Builder.
Workflow : travailler en flux et en export avec Tableau Prep Builder et Tableau Desktop ?
A n’importe quelle étape de votre flux de travail, vous pouvez vérifier vos données en les consultant sur Tableau Desktop et commencer à développer des tableaux de bord.
Lorsque vous ouvrez le flux sur Tableau Desktop, vous pouvez voir l’échantillon sur lequel vous allez travailler jusqu’à l’étape que vous avez sélectionné.
Faites un clic droit sur l’étape où vous souhaitez afficher vos données et cliquez sur Aperçu dans Tableau Desktop depuis le menu contextuel.
Voici une illustration de cette étape :
Vous ne pouvez pas enregistrer votre classeur tableau sous format twbx. Pour cela, une fois que vos données sont prêtes, vous pourrez ajouter une étape de sortie dans votre flux et enregistrer la sortie dans un fichier ou une base de données. Par la suite, vous pourrez vous connecter à ses données depuis tableau Desktop.
1.Ajouter une étape de sortie : sortie 3
2.Se connecter à cette source de données depuis Tableau Desktop
Est-ce qu’il est possible d’utiliser cette fonctionnalité de flux vers Tableau Server ou vers Tableau Online ?
Comme nous l’avons vu, les flux de données peuvent être générés dans Tableau Desktop pour se lancer rapidement dans l’étape d’analyse mais serait-il possible de les partager avec nos collaborateurs via Tableau Server ou Tableau Online ?
C’est le rôle de Tableau Prep Conductor qui vient avec des nouvelles fonctionnalités de planification, d’alerte et de gestion. Grâce à ce produit qui s’intègre à la plateforme Tableau, vous pouvez publier vos flux de données de Tableau Prep Builder vers Tableau Server ou Tableau Online et créer des programmes d’exécution pour que les données soient toujours prêtes et mises à jour.
Vous voulez en savoir plus sur Tableau Conductor ? Un peu de patience, un article sur ce sujet est à venir. En attendant, voici un peu de documentation : https://help.tableau.com/current/prep/fr-fr/prep_conductor_get_started.htm
Les nouveautés de Tableau Prep Builder
Depuis son démarrage et notre dernier article en 2019, Tableau Prep n’a cessé d’offrir de nouveaux outils et features ; voici nos préférés :
- Avec la version 2020.1, au niveau de la création d’un champ calculé il est devenu possible de créer des LODs ou un Rang. (classement)
- Avec la sortie de la version 2020.3, il est possible d’écrire dans des bases de données externes et de les actualiser directement depuis Tableau Prep Builder.
- Il est désormais possible de stocker vos données préparées via Tableau Prep Builder dans 7 bases de données relationnelles : SQL server, Oracle, PostgreSQL, MySQL, Teradata, Snowflake et Amazon Redshift.
- Une nouveauté importante dans la version 2020.4 : la possibilité d’adopter tableau prep en version navigateur. Qu’est-ce que cela change? Cela permet de réduire les coûts de déploiement globaux et simplifier le processus de préparation de données.
En résumé,
Grâce à Tableau Prep Builder, la préparation de données devient visuelle et directe. En quelques clics, vous pouvez donc obtenir des informations exploitables et passer directement à l’étape d’analyse.
Avant Tableau Prep, vous passiez des heures à vérifier que vos données étaient propres et prêtes pour l’analyse. A l’aide de son interface intuitive, ses fonctions intelligentes qui ont facilité l’automatisation des tâches complexes, le temps de préparation de données est énormément réduit et vous pouvez passer plus de temps sur vos analyses.
Vous pouvez exporter vos données préparées vers Tableau Desktop et créer tout type de tableaux de bord. Et ainsi, les partager via Tableau Online ou Tableau Server ou les partager avec la communauté Tableau sur Tableau Public.
Vous l’aurez compris, contrairement à certains de ses concurrents, Tableau Prep est spécifiquement dédié à la solution Tableau. Néanmoins, les capacités d’export en CSV vous permettent d’utiliser l’outil indépendamment de la visualisation des données pour traiter vos fichiers plats. On vous en dit plus dans un article à venir sur le positionnement de la solution !
Tableau Prep Builder 2020.4 est arrivé
Tableau vient de sortir la version 2020.4. Grande nouveauté, Tableau Prep est officiellement dans le navigateur. Grâce à sa plateforme tout en un sur le web, vous pouvez préparer facilement vos données sans se prendre la tête avec la gestion des ordinateurs individuels. Les administrateurs IT se chargent de mettre le serveur pour que tout le monde puisse utiliser la dernière version.
Offres et tarification :
Tableau Prep Builder est inclus dans l’offre Tableau Creator qui coûte 70$ par utilisateur / mois.
A titre d’information, si vous disposez de Tableau CREATOR, vous bénéficiez de Tableau Prep Builder gratuitement !
Avantages et inconvénients :
Cet article vous a-t-il été utile ? Vous souhaitez en apprendre davantage ?
Inscrivez vous gratuitement au webinaire d’Aya, c’est Jeudi 04 Mars à 15h00 :
De Tableau Prep à la visualisation sur Tableau , en 30 minutes, découvrez comment combiner, remanier et nettoyer vos données dans une seule et même plateforme !
[…] A la découverte de Tableau Prep Builder […]