Savez-vous combien de temps cela nous prend de préparer les données pour pouvoir vous les restituer dans de jolies, pertinentes et efficaces data visualisations ? Notre experte Tableau Giselle Marin est partie à la découverte de Tableau Prep et elle semble ravie par le gain de temps qu’apporte cet outil à ses analyses !
Aujourd’hui l’un des principal problème dans la gestion de la data, c’est la grande quantité de temps (80 % du temps d’après Forbes[1] ) que nous passons à préparer les données et ce qui est plus dommage, c’est le peu de temps qu’il nous reste pour pouvoir analyser et sortir des indicateurs plus intéressants qui génèrent de la valeur à notre business et qui nous aident à la prise de décision !
Eh oui, eh oui ! C’est encore Tableau qui va venir vous aider à améliorer cet malheureux mais nécessaire processus de data préparation ! Dorénavant, si vous acquérez Tableau Desktop vous aurez aussi le nouvel l’outil « Tableau Prep ».
Mais à quoi ressemble Tableau Prep ?
Ne vous inquiétez pas ! Si vous avez déjà utilisé Tableau Desktop, vous ne serez pas dépaysé ! La bonne nouvelle, c’est que cela va vous prendre beaucoup moins de temps que lorsque vous deviez créer un script, une requête…où pire encore taper des fonction Excel a la mano ! Finies les RECHERCHEV !
Comme sur Tableau Desktop, vous trouverez différents connecteurs comme des fichiers plats et des bases des données classiques. En revanche, vous ne trouverez pas tous les connecteurs qu’il y a sur Tableau Desktop. Mais ne vous inquiétez pas, ça viendra sûrement dans les prochaines releases !
Dès que vous vous connectez vous arrivez sur une interface sur laquelle vous pouvez simplement faire un glisser-déposer pour faire apparaître votre table. Et ça y est, vous commencez à créer un flux de préparation !
Vous obtenez une liste des noms et des colonnes ainsi qu’un mini exemple, pour apercevoir vos data. Cela vous permettra de découvrir vos données.
Ensuite, vous avez différentes options comme par exemple créer une étape, pour nettoyer et organiser vos données.
D’un simple clic vous pouvez passer vos données en majuscule, faire un trim… Vous pouvez aussi créer des champs calculés ! Plus besoins de créer des champs calculés pour ce type des manipulations dans Tableau Desktop ! Vos tableaux des bords auront des champs calculés plus centrés sur l’analyse de la data !
D’autres options pour organiser la data sont disponibles, telles que pivot, mais aussi des options pour créer des agrégats, des jointures et des unions pour enrichir vos données.
J’ai fait par exemple un pivot en une minute ! C’est pas super ça ? Sur SQL il m’aurait fallu un peu plus du temps…!
Vous vous direz peut-être qu’il n’y a rien de nouveau et que les différentes fonctionnalités comme le Pivot, les Jointures et les Unions existent déjà sur Tableau Desktop. Alors, je pourrais vous dire oui, mais maintenant vous pouvez aller beaucoup plus loin. Par exemple, les unions ne seront pas limitées à une table. Vous pouvez préparer une table à partir de différentes étapes et ensuite faire une union avec une autre table de la même structure. Mais, ce qui est le plus important, c’est la performance que vous gagnerez avec un fichier Hyper moins lourd dans Tableau Desktop et Tableau Serveur !
Autre chose intéressante, vous pouvez avoir un aperçu du résultat de l’extrait sur Tableau Desktop à chaque différente étape du flux.
Quand vous aurez terminé votre préparation, vous obtiendrez un flux avec les différents composants, comme vous pouvez le voir sur l’image. Il faut juste ajouter une option de sortie, qui vous permettra d’obtenir une datasource Hyper, pour ensuite créer vos visualisations sur Tableau Desktop ou la publier sur Tableau Serveur directement !
C’est le moment de changer nos habitudes, afin d’améliorer un processus qui prend une charge considérable dans la mise en place de nos indicateurs et dans le monde de la gestion de la data en général !
Giselle Marin
[1] https://www.forbes.com/sites/gilpress/2016/03/23/data-preparation-most-time-consuming-least-enjoyable-data-science-task-survey-says/#653bab5e6f63
Sections commentaires non disponible.