Juil 08

Création de nos propres relevés météorologiques

Nous avons récemment fait l’acquisition d’une station météorologique Davis Vantage Vue. Cette station comporte un ensemble de capteurs, qui communiquent leurs données à une console par radio 868MHz. Elle fournit plus d’une vingtaine de données différentes, ce qui est plus que ce que propose la majorité des grands sites météorologiques. Cette constatation nous a fait nous questionner sur la précision et la pertinence des informations météorologiques que l’on nous transmet au quotidien. Ainsi, nous avons décidé, en coopération avec La Fonderie, de proposer nos propres relevés de données, et ce en différents points de la région parisienne.

Pour ce faire, nous avons décidé de récupérer toutes les données fournies par la station météo à l’aide d’un Rapsberry Pi, utilisant Raspbian, système d’exploitation basé sur Debian et optimisé pour le Raspberry (les données de la station étant chiffrées, il était nécessaire d’utiliser cette OS plutôt qu’une OS du type tinyOS). L’objectif était ensuite de publier ces données sur un serveur, puis gérer le flux afin de pouvoir les afficher :

Une fois le Raspberry relié à la station météo, les données météorologiques sont récupérées et stockées dans un fichier csv à l’aide d’une librairie Python, Wospi. Ce fichier est ensuite lu et chaque nouvelle ligne est envoyée dans un format json en tant que message vers un broker MQTT Mosquitto, sous un topic spécifique pour chaque station. Dans l’architecture que nous avons choisi Mosquitto s’exécute au sein d’un container Docker chez notre fournisseur de cloud. Le service MQTT peut être accédé par l’ensemble des nano-machines couplés aux stations météo.

Nous créons ensuite un autre container Docker avec InfluxDB, une base de données. Sur ce container un programme Python, se connecte en tant que client à notre broker MQTT, s’abonne au topic de notre station, afin de recevoir chacun des messages. Ils sont traités pour chaque type de donnée (température, pression…) enregistré au sein d’InfluxDB.
Nous avons choisi InfluxDB car il permet nativement de gérer des séries temporelles : nos données seront donc conservées et historisées. En effet, ce n’est pas le but premier de Mosquitto, qui bien que sachant stocker les messages n’a pas vocation à les conserver sur du long terme.
Par ailleurs, InfluxDB s’accompagne souvent d’une interface graphique : Grafana. Celle-ci nous a permis de créer des graphes en fonction du temps, et de les afficher comme nous l’entendions.

Ainsi, il est aussi possible de tracer plusieurs courbes sur un même graphe, ce qui permet de mettre en valeur le lien entre les données. Par exemple, la figure précédente illustre le lien entre humidité et température : plus la température augmente, plus l’humidité baisse.
Grafana nous permet en outre de rajouter des valeurs supplémentaires ou des types de données au flux temporel, ainsi notre exploitation n’est pas limitée aux seules informations fournies par la station. Nous envisageons ainsi d’ajouter des données de pollution, ainsi que nos relevés de consommation en eau, en électricité et en gaz. L’interface nous permettra alors de mettre en évidence, de manière très visible, le lien entre conditions climatiques et consommations domestiques. Ces informations pourraient alors être exploitées avec un système IFTTT qui permettrait, par exemple, d’allumer le chauffage lorsque la température fournie par la station est trop faible, ou d’émettre un message d’alerte lorsque le niveau de pollution est trop important.

Plus d’informations :

Raspbian
Wospi
Mosquitto
InfluxDB
Grafana

Article réalisé en collaboration avec Briséis Varin et Guillaume Viscarret.
Un grand merci à Gaël Musquet pour son aide dans ce projet !

Source image : Visualhunt.com

A propos de l'auteur: Hélène Trouvé

Communicante de la #SynalTeam, Hélène s'occupe des réseaux sociaux, des contenus du blog et des goodies improbables qu'on distribue sur les salons.

Articles Suggérés

L’apport du ML au catalogage de données

Détection de types sémantiques dans les données tabulaires par apprentissage automatique à l’aide de données synthétiques

Voici une brève de l’article rédigé par notre docteur en intelligence artificielle Marc Chevallier. Pour lire l’intégralité, veuillez cliquer sur le bouton ci-dessous.

De nombreux outils de catalogage des données sont apparus grâce à l’accumulation massive de données désorganisées. Le but de ces outils va être de maximiser les possibilités de ré-usage des données afin de mieux les valoriser. Pour ce faire, il faut « connaître la donnée » pour pouvoir correctement la ranger et la retrouver, cette connaissance passe par l’usage d’un ensemble de méta-données décrivant la donnée. Cependant, une intervention humaine est nécessaire pour assurer un catalogage correct. Pour résoudre ce problème, il faut automatiser au maximum l’extraction des méta-informations des données.

Parmi ces informations, le type sémantique des données est particulièrement intéressant, car largement utiliser en data intégration. La plupart des outils de BI peuvent découvrir automatiquement quelques types sémantiques. Cette détection se fait classiquement à l’aide d’expressions régulières et de dictionnaires. Ces méthodes sont efficaces quand les données présentent des schémas réguliers et sont peu bruitées. Dans le cas contraire, la reconnaissance est difficile. Cette problématique a fait naître ces dernières années un nouveau courant de méthodes basées sur l’apprentissage artificiel.

Ces techniques vont essayer d’apprendre à partir de colonnes d’exemples à reconnaître les différents types sémantiques. Néanmoins, ces nouvelles méthodes ont besoin d’un large volume de données réel, ce qui limite l’usage à des types sémantiques pour lesquels beaucoup de données sont disponibles. Ainsi, une partie des travaux de R&D chez Synaltic visent à développer des méthodes basées sur l’apprentissage automatique pour identifier une plus grande variété de types sémantiques tout en minimisant le besoin de données réelles. C’est dans ce cadre que l’article « Semantic Type Detection in Tabular Data via Machine Learning Using Semi-synthetic Data » a été écrit et présenté à la conférence SoCPaR2022.

Lire l’article

Authentification MS Office 365 Exchange OAuth2 IMAP avec Talend ESB

Au cours des derniers mois, Microsoft a progressivement déprécié et désactivé l’authentification basique pour les protocoles Microsoft Exchange Online tels que POP et IMAP, SMTP.

Il est donc urgent de passer à la nouvelle authentification moderne, basée sur OAuth 2.0. A l’heure où sort ce post, vous devez déjà avoir subi des troubles pour permettre à vos applications tiers de collaborer avec les solutions IMAP, POP, SMTP de Microsoft Exchange Online. Cela semble être un changement simple, mais il s’est avéré gênant d’un point de vue de la configuration dans la pratique à certains points.

Tout comme pour Log4Shell, il nous est apparu utile de documenter cette évolution des API d’Authentification de Microsoft et vous faciliter leur mise en œuvre.

Cet article de blog est utile pour tous ceux qui s’occupent de l’accès programmatique aux e-mails en utilisant les API Java javax.mail ou qui utilisent respectivement au sein de leurs flux Talend DI ou ESB les composants tPop, ou cMail pour écouter les e-mails sur IMAP pour les boîtes aux lettres Microsoft Office 365 Exchange Online. Nous présentons l’accès programmatique, les configurations tant du point de vue Azure que de celui de Talend ESB.

REMARQUE : Ce guide couvre le flux Client Credentials Grant, généralement utilisé pour la communication de machine à machine sans interaction avec l’utilisateur.

ÉTAPE 1 – Enregistrer / configurer l’application dans Azure

L’application Azure gère l’identité et l’interface d’accès aux boîtes mails, auxquelles nous voulons accéder à partir d’applications, ici nous nous intéressons à Java ou Talend en utilisant une authentification moderne avec le flux OAuth2 Client Credentials.

REMARQUE : Il s’agit d’un guide pour la mise en place du flux d’octroi d’accréditations client uniquement, qui est généralement utilisé pour la communication de machine à machine, sans interaction avec l’utilisateur.

Pourquoi ?

Cette configuration vous permet d’obtenir un jeton d’accès en utilisant le flux d’octroi des informations d’identification du client OAuth2 pour votre application enregistrée. Ce jeton d’accès est utilisé comme mot de passe pour la connexion IMAP par la suite. OAuth2 est une norme largement répandue, assez complexe et quelque peu écrasante, avec beaucoup de choses à comprendre dans son intégralité. Cependant, pour ce cas d’utilisation, vous n’avez pas besoin de comprendre les détails. Nous avons simplement besoin du clientId, du clientSecret ou du certificat, et du nom du locataire Azure ou du tenantId.

1. Créer l’application

2. Ajoutez l’autorisation IMAP.AccessAsApp requise.

Depuis Autorisations API, ajoutez l’autorisation IMAP.AccessAsApp. Vous pouvez la trouver sous APIs votre organisation uses > Office 365 Exchange Online.

Comment trouver les autorisations Microsoft Office 365 Exchange

Azure API Permision

REMARQUE : Cette autorisation nécessite le consentement de l’administrateur. Si vous n’êtes pas l’administrateur, contactez votre administrateur et demandez-lui son accord. Voici à quoi cela devrait ressembler :

Autorisation Microsoft Azure IMAP.AccessAsApp

3. Créer le secret du client ou le certificat du client

IMAP Application secret

Pour se connecter à l’enregistrement de cette application via OAuth2, un secret client ou un certificat client (clé publique) est nécessaire.

Pour des raisons de simplicité, nous utilisons ici un secret client.

REMARQUE : Faites attention à la date d’expiration du secret du client ! Ou définissez une période personnalisée. Lorsque la clé expire, votre application client ne pourra plus se connecter.

REMARQUE : Copiez et stockez le secret du client juste après sa création dans un endroit sûr, par exemple, un stockage de clés sécurisé. Vous n’y aurez plus accès.

ÉTAPE 2 – Ajouter les autorisations de la boîte aux lettres à l’aide de la commande PowerShell

C’est la partie la plus compliquée en effet vous devez avoir un administrateur Azure avec vous ou avoir les droits d’administration sur Azure afin d’exécuter les étapes qui suivent. Nous espérons que vous avez les coordonnées de l’administrateur Azure de votre entreprise, au cas où vous ne le seriez pas.

Ensuite, nous allons créer un servicePrincipal et exécuter Add-MailboxPermission pour permettre l’accès à la boîte mail… Ce n’est possible qu’en exécutant “un peu de magie PowerShell”. Pour cela, nous avons besoin d’un Object ID spécial situé à des endroits très différents. Les deux endroits contiennent un Object ID, mais ils sont différents. Cela génère une certaine confusion et par voie de conséquence de la complexité. Il semble que beaucoup n’aient pas compris dès le départ. Nous allons essayer de rendre les choses plus claires.

Nous allons avoir besoin de l’Application (client) ID de la page d’aperçu de l’application, s’il vous plaît IGNOREZ l’Object ID dans cette section. Par contre, récupérez bien l’ENTERPRISE_OBJECT_ID à cet emplacement indiqué ci-dessous :L’ENTERPRISE Object ID peut être trouvé sous Enterprise applications > All applications > Tapez le nom de l’application dans le champ de recherche :

Obtenir l'Objet Id de l'application

Ne tenez pas compte de l’ID d’objet barré en rouge dans la vue d’ensemble de l’application, mais obtenez plutôt l’ID d’objet d’entreprise, à partir du point d’entrée des applications d’entreprise dans Azure.

C’est parti pour les commandes “magiques” PowerShell :

# Enregistrer le ServicePrincipal de l'application Azure AD dans Exchange :
New-ServicePrincipal -AppId "<APPLICATION_ID>" -ServiceId "<ENTERPRISE_OBJECT_ID>"
# Définir le nom d'affichage du ServicePrincipal nouvellement créé.
Set-ServicePrincipal -Identity "<ENTERPRISE_OBJECT_ID>" -DisplayName "<APP_DISPLAY_NAME>"
# Donnez au ServicePrincipal de l'application l'accès à une boîte mails : 
# Add-MailboxPermission -Identity "<EMAIL_ADDRESS>" -User Add-MailboxPermission-Identity "<EMAIL_ADDRESS>" -User "<ENTERPRISE_OBJECT_ID>" -AccessRightsFullAccess

Vous devrez peut-être d’abord installer certains modules PowerShell pour exécuter ces commandes. La description de Microsoft se trouve ici :

https://learn.microsoft.com/fr-fr/exchange/client-developer/legacy-protocols/how-to-authenticate-an-imap-pop-smtp-application-by-using-oauth#register-service-principals-in-exchange

https://www.limilabs.com/blog/oauth2-client-credential-flow-office365-exchange-imap-pop3-smtp

ÉTAPE 3 – L’heure des tests avec Talend ESB !

Pour pouvoir concevoir vos flux d’intégration avec Talend ESB qui dialoguent avec IMAP, POP, SMTP il vous faut des pré-requis :

Microsoft Authentication Library (MSAL) for Java
- https://github.com/AzureAD/microsoft-authentication-library-for-java
Apache Camel Mail Microsoft Oauth (camel-mail-microsoft-oauth)
- https://camel.apache.org/components/next/others/mail-microsoft-oauth.html
Javax.Mail 1.6.7
- https://mvnrepository.com/artifact/com.sun.mail/jakarta.mail/1.6.7

REMARQUE : Vous aurez aussi besoin de d’autres librairies java dont dépendent celles qui sont listées plus haut.

REMARQUE : Ici, nous avons choisi de réaliser ce test avec Talend ESB 8.0.1 (avec JAva 11)

Enregistrer le bean « exchangeAuthenticator » avec les différents paramètre attendu par l’authentification OAuth2 de Microsoft Azure pour les mails.

Talend ESB Studio Enregistrer un Bean

le code généré ressemble à celui-ci pour l’enregistrement du bean :

@BindToRegistry("exchangeAuthenticator")
public MicrosoftExchangeOnlineOAuth2MailAuthenticator exchangeAuthenticator(){
    return new MicrosoftExchangeOnlineOAuth2MailAuthenticator(<<tenantId>>, <<clientId>>, <<clientSecret>>, <<emailAddress>>);
}

Il vous reste alors à configurer le cMail

Talend ESB Studio Flux cMail Lire mail

from("imaps://outlook.office365.com:993"
                    +  "?authenticator=#exchangeAuthenticator"
                    +  "&mail.imaps.auth.mechanisms=XOAUTH2"
                    +  "&debugMode=true"
                    +  "&delete=false")

Et voilà !

Talend ESB Studio Flux mail complet

L’intégration de données trouve une certaine complexité dans la manipulation d’un grand nombre de sources de données, et d’API. Ici, nous avons cherché à simplifier l’appropriation de la configuration des API OAuth2 de Microsoft Azure pour Exchange Online.

Synaltic se tient à vos côtés pour vous aider dans la mise en œuvre de vos projets d’intégration de données avec Talend.

REMARQUE : vous pouvez aussi avoir besoin de mettre en œuvre l’authentification OAuth2 dans le cadre de vos flux DI avec un composant tPop. Vous trouverez ici toutes les informations utiles :Configurer une application Microsoft Azure pour les protocoles POP et IMAP
https://help.talend.com/r/fr-FR/8.0/pop/configuring-an-oauth2-application-for-pop-and-imap