Partez à la découverte de la fusion des données pour combiner vos données sur Tableau Desktop ; un article rédigé par Piraveena CHIVANESAN.
La fusion des données – Data Blending sur Tableau Desktop
Tout comme la jointure, la fusion est une méthode pour combiner les données provenant de sources différentes. Cependant, les tables gardent leurs structures d’origine et ne sont fusionnées qu’au niveau de la visualisation, contrairement à la jointure où les tables sont jointes en amont. Avec cette méthode de combinaison de données, on peut joindre les tables différemment sur chaque feuille, selon nos besoins.
Tout d’abord, il faut ajouter les jeux de données dans Tableau. Pour ce faire, on ouvre un nouveau classeur Tableau et on clique sur l’icône de la source de données, pour ajouter le premier jeu de données.
Après avoir chargé le premier fichier, on charge le (ou les autres) jeu(x) de données à partir de l’onglet Source de données, comme indiqué sur l’image ci-dessous.
Lorsqu’on se positionne sur une feuille de calcul, on différencie bien les sources de données et les tables qui sont indépendantes. (elles ne sont pas combinées en une seule table)
Sur cette image, on aperçoit la table qui appartient à la source Salary, correspondant aux informations sur les salariés. On peut voir la table de la source Orders en cliquant dessus.
En fonction du choix d’une dimension (ou mesure) à partir d’une source, celle-ci deviendra la source primaire, caractérisée par une flèche bleue, et la source secondaire par une flèche orange. Par ailleurs, dans la liste des champs, on peut observer ceux qui sont communs dans les sources. Ces derniers sont marqués par un nœud rouge.
Pour la méthode de fusion, Tableau Desktop choisit par défaut la jointure gauche, c’est pourquoi on a les notions de sources primaire et secondaire.
Lorsqu’on choisit la table Orders comme source primaire, on a que les clients qui ont passé des commandes. Par ailleurs, on remarque que les salaires ne sont pas multipliés en fonction du nombre de commandes passées, comme c’était le cas avec les jointures.
Pour avoir tous les clients, on va choisir les champs Customer ID et Salary de la table Salary, en premier pour mettre cette table en source primaire, puis choisir le nombre de commandes (Orders Table) de la table Orders.
On a donc tous les clients, même ceux qui n’ont pas passé de commandes, avec leurs salaires, non multipliés. La fusion peut donc être appliquée sur chaque feuille de calcul en fonction des analyses que nous avons à effectuer. Cependant, cette méthode a aussi ses limites. L’une d’elles est que la fusion ne permet pas d’afficher les lignes dans les relations de cardinalité 1 à n.
Par exemple, lorsqu’un client a passé plusieurs commandes ou bien lorsqu’une commande est composée de plusieurs articles, celles-ci sont représentées par un astérisque (*) dans la visualisation.
Les avantages et limites de la fusion des données – Data Blending
Avantages
|
|
Limites |
|
Pour résumer, la fusion permet de combiner des données de sources différentes tout en gardant les tables d’origine de chaque source. Ainsi, nous avons beaucoup plus de flexibilité dans nos analyses. Néanmoins, nous l’avons vu au cours des exemples précédents que la fusion possède un problème plus conséquent. En effet, elle ne gère pas la présence de plusieurs correspondances pour une même valeur. Il en résulte que les lignes concernées verront un astérisque prendre la place des valeurs multiples.
Pour pallier ce problème nous pouvons utiliser une autre méthode de combinaison de données à savoir, les relations. Cet approfondissement sera le sujet de l’article suivant :
La relation des données sur Tableau Desktop
[…] La fusion des données sur Tableau Desktop […]
[…] La fusion des données sur Tableau Desktop […]
[…] seconde méthode est la fusion, permet de combiner les données provenant de sources de données […]