Apache Superset un outil de visualisation, qui rivalise avec les solutions propriétaires, un article rédigé par Chaimaa Abdellali ,Data Engineer au sein de la #SynalTeam.
Présentation d’Apache Superset
Apache Superset présente de vraies potentialités face aux solutions propriétaires
Apache Superset, un concurrent sérieux sur le marché de la visualisation de données. Il s’impose grâce à une multitude de fonctionnalités et à des améliorations continues soutenues par une communauté active de développeurs.
La version stable (2.1) la plus récente de cet outil puissant est datée du 5 avril 2023. Elle témoigne de sa progression constante. Grâce à ses capacités, Superset est capable de rivaliser avec les outils propriétaires les plus populaires actuellement. De plus, sa nature open source présente un avantage concurrentiel indéniable. Elle offre aux utilisateurs la possibilité de personnaliser le logiciel selon leurs besoins spécifiques, évitant les fonctionnalités payantes et superflues.
En fin de compte, Superset représente un choix particulièrement attractif pour les organisations qui aspirent à approfondir leur compréhension des données. Tout en prenant des décisions éclairées.
Une installation simple
Superset : un outil de visualisation de données flexible et adaptable pour une analyse efficace.
Superset est un outil de visualisation de données puissant et flexible. Il offre une grande adaptabilité pour répondre aux besoins spécifiques des utilisateurs. Il peut être installé de différentes façons, selon les préférences et les contraintes de chacun. Que ce soit en installant Superset sur une machine locale ou sur un serveur dans le cloud.
Il existe trois méthodes de déploiement de Superset :
Installation Facile avec Docker Compose
Tout d’abord, les utilisateurs peuvent opter pour Docker Compose, une solution qui permet une installation facile et rapide. Cette approche simplifie le processus d’installation et permet aux utilisateurs de démarrer rapidement avec Superset.
Installation sur une Machine Virtuelle Python avec Virtualenv
Une autre option consiste à installer Superset sur une machine virtuelle Python en utilisant Virtualenv. Cette méthode offre une grande flexibilité aux utilisateurs qui convient à leur environnement d’installation.
Installation Avancée avec HELM Kubernetes
Pour les utilisateurs avancés qui recherchent une infrastructure robuste pour le déploiement de Superset dans des environnements plus complexes, l’installation en utilisant HELM Kubernetes est recommandée.
Quelle que soit la méthode choisie, Superset se révèle être un outil puissant et flexible. Sa polyvalence permet aux utilisateurs d’explorer et d’exploiter leurs données de manière efficace et intuitive.
Premiers pas sur l’UI d’Apache Superset
La page principale de Superset offre non seulement une vue rapide et pratique des graphiques et des tableaux de bord récemment consultés par l’utilisateur.
Cette fonctionnalité permet aux utilisateurs de rester constamment informés des mises à jour et des changements récents dans les données et les analyses. Évitant de devoir effectuer une recherche manuelle fastidieuse pour trouver les graphiques pertinents.
Retrouvez facilement vos tableaux de bord et graphiques précédemment créés ou consultés. Un accès rapide et simple à vos analyses et données précédentes. Cela se traduit par un gain de temps substantiel et une amélioration de leur productivité.
En somme, ces fonctionnalités de Superset permettent une expérience utilisateur fluide et efficace pour l’analyse et la visualisation de données, offrant une grande flexibilité et une navigation intuitive.(figure)
L’intégration de ces fonctionnalités assure une expérience utilisateur fluide et efficace lors de l’analyse et de la visualisation de données. Elles offrent une grande flexibilité et une navigation intuitive, garantissant une expérience utilisateur optimale.
De multiples sources de données !
Il permet aux utilisateurs de se connecter simplement à diverses bases de données, notamment Google BigQuery, Oracle et Dremio, offrant ainsi une grande flexibilité. L’image ci-dessous illustre la liste complète des bases de données compatibles avec Superset.
La compatibilité avec diverses bases de données permet aux utilisateurs de bénéficier d’une expérience d’analyse de données plus complète et personnalisée. Grâce à cette fonctionnalité, il devient facile d’importer et d’analyser des données provenant de différentes sources.
De plus, il est possible de se connecter à la base de données. En ajoutant simplement une nouvelle source de données, de vérifier le type de base de données requis, et de saisir les informations de connexion. Telles que l’adresse, l’identifiant, le mot de passe et le port.
On peut faire du SQL(Structured Query Language) avec Superset !
Le résultat d’une requête peut être enregistré sous forme de table dématérialisée, appelée vue logique. Les vues logiques sont caractérisées par la particularité que les données ne sont pas stockées en brut, mais uniquement les métadonnées de la table en question.
Superset, avec son outil SQL Lab intégré, offre aux utilisateurs la possibilité d’écrire, d’exécuter et de sauvegarder des requêtes SQL de manière efficace. Grâce à cette fonctionnalité, il devient facile pour les utilisateurs de manipuler les données de leurs bases de données connectées via Superset. Ils peuvent effectuer des opérations SQL telles que les jointures, les unions et bien d’autres encore.
Une caractéristique intéressante est la capacité de sauvegarder les résultats des requêtes sous forme de tables dématérialisées, connues sous le nom de vues logiques. Les vues logiques ont la particularité que les données ne soient pas stockées en brut, mais seulement les métadonnées de la table en question.
La gestion des utilisateurs et des rôles
Superset offre la possibilité de créer différents utilisateurs et d’attribuer à chacun un rôle spécifique, en fonction de leurs besoins et de leurs responsabilités. De plus, les rôles disponibles, tels que Viewer, Editor, Admin, Public, Alpha et Gamma, peuvent être attribués, comme illustré dans la figure ci-dessous.
La partie DataViz: la création de graphiques et de dashboards.
La création de Dashboards et de graphiques sur Superset est très intuitive. De plus, divers types de graphiques sont disponibles, ce qui permet de visualiser les données de manière variée.
Graphique en barres (bar chart)
- Colonnes (column chart)
- Aires (area chart)
- Aires empilées (stacked area chart)
- Aires 100% empilées (100% stacked area chart)
- Courbes (line chart)
- Courbes multiples (multi-line chart)
- Nuage de points (scatter plot)
- Nuage de points multiples (multi-scatter plot)
- Radar (radar chart)
- Camembert (pie chart)
- Donut (donut chart)
- Carte choroplèthe (choropleth map)
- Carte géographique (geographic map)
- Heatmap (heatmap)
- Sankey (sankey chart)
Remarques :
Afin de personnaliser vos graphiques et tableaux de bord dans Superset, il est essentiel de créer et de modifier le CSS du tableau de bord. Par conséquent, suivez ces étapes simples pour y parvenir :
- Accédez aux paramètres (Settings) dans Superset.
- Créez un modèle CSS personnalisé.
- Écrivez le code CSS. Optimisez votre mise en forme graphique pour une personnalisation à votre image
En personnalisant la mise en forme des graphiques et des tableaux de bord uniques, vous obtiendrez des visualisations adaptées à vos besoins spécifiques.