Partez à la découverte de la combinaison des données sur Tableau Desktop ; un article rédigé par Piraveena CHIVANESAN.
La combinaison des données sur Tableau Desktop

Source : https://www.femmexpat.com/expatriation/choc-culturel-iceberg-droit-devant/
Ce que l’utilisateur final voit c’est la visualisation du tableau de bord. Il y a avant cela plusieurs étapes :
- récupérer les données,
- nettoyer les données,
- choisir les analyses à effectuer,
- traiter les données selon les analyses,
- effectuer les visualisations avec les bons champs.
Dans cet article, nous nous intéresserons plus précisément au traitement des données qui est la combinaison des données.
Cette dernière permet de créer le jeu de données final à analyser en combinant des données provenant soit d’une même source (un fichier Excel pouvant contenir un ou plusieurs onglets et représentant les tables) soit de sources multiples. (plusieurs fichiers pouvant provenir, ou non, de bases de données telles que MySQL, PostgreSQL, MariaDB).
Si dans mon analyse, je n’utilise qu’une seule table, la notion de combinaison n’est pas nécessaire. Cependant, lorsque j’ai plusieurs tables, il y a une nécessité de le faire.
Il existe pour cela diverses façons, dont 4 méthodes (jointure, jointure entre bases de données, fusion et relation) que nous allons découvrir ou redécouvrir au travers de ces trois articles.
- La première méthode est la jointure, consiste à créer une liaison entre deux ou plusieurs tables selon le (ou les) champ(s) en commun(s), qui sont par la suite fusionnées en une seule et même table.
- La seconde méthode est la fusion, permet de combiner les données provenant de sources de données différentes.
- La troisième méthode est la relation, permet d’une part de régler le problème que présente les fusions, à savoir le remplacement des valeurs multiples par un astérisque, et d’autre part de régler le problème des jointures statiques.
Conclusion
Résumons maintenant cette suite d’articles sur les méthodes de combinaisons de données.
*Sources de données (fichiers) bruts
Au départ, on pouvait effectuer sur Tableau Desktop des jointures entre les tables provenant seulement d’une connexion unique. Cependant, on peut avoir des jeux de données de différentes sources et à cet égard la méthode de jointure entre bases de données a été introduite. On peut avec cette méthode joindre des tables provenant de différents fichiers ou bases de données.
Toutefois, les jointures sont statiques, c’est-à-dire qu’une fois établies, on ne peut plus les modifier pour nos différentes analyses.
Au vu des quelques limites que nous avons pu aborder dans cet article, la fusion des données (ou data blending) se révèle être un substitut aux jointures. Cette dernière permet d’effectuer les jointures nécessaires au niveau de la visualisation et de les adapter en fonction des besoins.
Néanmoins, une des limites de la fusion, c’est qu’elle ne prend pas en compte les relations de cardinalité 1 à n ; les valeurs multiples sont représentées par des astérisques et encore elle n’est pas très optimale en termes de performances. Pour remédier à cela, on peut utiliser des relations, qui sont à la fois avantageuses pour régler le problème des valeurs, mais aussi pour les jointures contextuelles et n’en parlons même pas des performances.
Mon petit conseil 😉 :
“Use RELATIONSHIPS if you can, JOIN if you must, BLEND if you absolutely must.” ~ Donabel Santos
[…] La combinaison des données sur Tableau Desktop […]