Partez à la découverte de la jointure des données pour combiner vos données sur Tableau Desktop ; un article rédigé par Piraveena CHIVANESAN.
La jointure des données sur Tableau Desktop

Source : https://www.femmexpat.com/expatriation/choc-culturel-iceberg-droit-devant/
Ce que l’utilisateur final voit c’est la visualisation du tableau de bord. Il y a avant cela plusieurs étapes :
- récupérer les données,
- nettoyer les données,
- choisir les analyses à effectuer,
- traiter les données selon les analyses,
- effectuer les visualisations avec les bons champs.
Dans cet article, nous nous intéresserons plus précisément au traitement des données qui est la combinaison des données.
Cette dernière permet de créer le jeu de données final à analyser en combinant des données provenant soit d’une même source (un fichier Excel pouvant contenir un ou plusieurs onglets et représentant les tables) soit de sources multiples. (plusieurs fichiers pouvant provenir, ou non, de bases de données telles que MySQL, PostgreSQL, MariaDB).
Si dans mon analyse, je n’utilise qu’une seule table, la notion de combinaison n’est pas nécessaire. Cependant, lorsque j’ai plusieurs tables, il y a une nécessité de le faire.
Il existe pour cela diverses façons, dont 4 méthodes (jointure, jointure entre bases de données, fusion et relation) que nous allons découvrir ou redécouvrir à travers cet article.
La première méthode, qui est la jointure, consiste à créer une liaison entre deux ou plusieurs tables selon le (ou les) champ(s) en commun(s), qui sont par la suite fusionnées en une seule et même table.
Avant d’effectuer une jointure, il faut bien définir ses besoins. Pourquoi ? Les jointures sont statiques puisqu’elles doivent être définies au préalable et ne peuvent être modifiées par la suite. Les modifier entraînerait des erreurs sur les visualisations déjà créées.
Voici la présentation des différents types de jointure :

Source : https://velog.io/@chayezo/SQL-JOIN
INNER JOIN |
|
LEFT JOIN |
|
RIGHT JOIN |
|
FULL OUTER JOIN |
|
CROSS JOIN |
|
NB : nous pouvons utiliser tous les types de jointure sur Tableau Desktop, sauf la dernière (cross join)
Jointures : le cas de tables provenant de la même source
Exemples de jointure :

Source : https://www.youtube.com/watch?v=bypr1QPclao
Dans le cas de la jointure interne, puisqu’il n’y a pas de correspondance entre la table Customers et Orders pour “Sunday”, on peut voir que ces valeurs sont supprimées dans la table résultante.
Voyons le cas de la jointure gauche avec les tables Salary et Orders :

Source : Tableau Desktop
A la suite de la jointure gauche de ces deux tables, on obtient le résultat suivant :

Source : Tableau Desktop
On aperçoit que pour les clients ayant passé plusieurs commandes, leur salaire a été multiplié par le nombre de commandes qu’ils ont passées.
Pour régler cela, on peut utiliser la moyenne (au lieu de la somme effectuée par défaut par Tableau). Voici le résultat :

Source : Tableau Desktop
Une des limites que peut avoir la jointure est le fait qu’il peut y avoir des valeurs manquantes sans correspondances ou des doublons lorsque les tables sont à différents niveaux de détail.
Jointures : le cas de tables provenant de sources multiples

Source : Tableau Desktop
Jointure entre tables et choix de la jointure et des champs communs
Les jointures sont effectuées entre des tables qui appartiennent à la même base de données et on pourrait être amenés à les effectuer entre des tables qui appartiennent à plusieurs bases de données. Pour cela on va utiliser la jointure entre base de données (cross databases). Ces dernières imposent qu’on ait une source de données multi connexion. Par ailleurs, elles se basent sur les champs en communs des tables pour la jointure, tout comme pour les jointures des tables d’une connexion unique.

Source : Tableau Desktop
Les fichiers provenant de différentes connexions sont indiqués par des couleurs différentes. En effet, le fichier provenant de la connexion MariaDB est indiqué en orange et celui provenant de la connexion Customers est en bleu.
Voici un autre exemple de jointures de tables provenant de connexions multiples de fichiers Excel :

Source : Tableau Desktop
La différenciation entre la jointure et la jointure entre base de données, c’est que la première nécessite une connexion unique, tandis que la deuxième une connexion multiple.
|
Connexion unique |
Connexion multiple |
Avantages |
|
|
Limites |
|
|
En somme, les jointures permettent de combiner des données provenant d’une ou plusieurs sources de façon flexible.
Cependant, comme nous l’avons constaté plus haut, cette méthode présente des limites, telles que les jointures statiques et les tables à différents niveaux de détail. Pour remédier à ces problèmes nous pouvons utiliser les fusions (data blending). Elles permettent d’interroger indépendamment les sources de données. Cet approfondissement sera le sujet de l’article suivant :
La fusion des données sur Tableau Desktop
[…] La jointure des données sur Tableau Desktop […]