Le Point

Le Point

Synaltic accompagne Le Point dans le déploiement de son DataHub, plate-forme de centralisation de données.

Le Point, acteur majeur de la presse hebdomadaire, souhaite disposer d’une plate-forme de centralisation de ses données afin d’avoir la possibilité de disposer d’analyses transverses, voire à 360°, de son activité.

Synaltic accompagne l’hebdomadaire pour la mise en place de ce « DataHub », s’appuyant à la fois sur des technologies Big Data (Hortonworks) et classiques (MariaDB, MariaDB Columnstore, Talend). Le Point a fait appel à Synaltic à la fois pour l’accompagnement technique mais également pour sa capacité de conseil sur les technologies à envisager.

Afin de mener ce projet à bien, Synaltic a constitué une équipe pluridisciplinaire afin de traiter l’ensemble de la donnée, de la récupération des sources jusqu’à la restitution en passant par l’intégration ou l’architecture. Cette équipe « Data » a ainsi été en mesure de mettre en place une architecture basée sur un cluster Hadoop, lui-même alimenté par des jobs Talend et le gestionnaire de workflow Airflow, ainsi qu’une base de données MariaDB Columnstore, permettant des restitutions analytiques.

orchestrateur airflow

C’est lors d’une phase de Proof of Concept, qui aura duré deux mois au total, que le choix de l’architecture à mettre en place a été effectué avec les équipes du Point. Ce « POC » a également permis à l’équipe projet de Synaltic d’évoluer en fonction des besoins et de l’avancement du développement, sans diminution d’efficacité. Par exemple, sur l’architecture, trois personnes se sont succédées sans subir de latences ni de pertes, grâce aux outils utilisés, facilitant des passages de témoin rapides et efficaces. Synaltic possède désormais plusieurs personnes en connaissance du projet, pouvant intervenir pour accompagner Le Point.

Une première source peut en cacher une autre

La démarche proposée par Synaltic a permis de traiter la première source de données en quelques semaines. De la découverte de la source à la modélisation décisionnelle, en passant par l’ingestion des futures données, l’équipe de Synaltic a pris soin de travailler conjointement avec celle du Point. A la fin du projet, Le Point a pu bénéficier d’un accès à des données issues de différents systèmes. Ce “désilotage” donne au Point la possibilité d’analyser de manière transverse ses données. Les barrières entre les différents systèmes existants sont retirées pour offrir aux utilisateurs finaux une vue globale de leur activité. Les corrélations possibles permettront aux Point de fournir des analyses enrichies.

architecture data lake le point

Basée sur ce « DataHub », la première analyse réalisée a croisé des données provenant d’une base MariaDB Columnstore pour les agrégations et du cluster Hadoop pour les données de détails. La volonté finale du Point était d’une part, de pouvoir disposer de données agrégées et rapidement interrogeables pour fournir des analyses et restitutions aux utilisateurs métiers et d’autre part, d’avoir à portée de main toutes les données historisées pour créer des analyses ad-hoc plus poussées. L’architecture mise en place par Synaltic a permis de répondre à ces deux besoins.

A terme, le but est de mettre à disposition des utilisateurs des données, issues de plusieurs systèmes internes, qui seront traitées et analysées avec des outils de visualisation type Tableau. Ce « DataHub » deviendra alors le point d’accès unique aux données du Point.

  • Client Le Point
  • Type Data Hub, Data Lake

Projets similaires

Contactez-nous et parlons de vos données