Ce site stocke des cookies sur votre ordinateur. Nous les utilisons afin de personnaliser votre expérience de navigation ainsi que pour des analyses d'audience.
Le 15 février dernier, nous vous avions convié à la soirée de présentation du projet DataAsso, pour lequel une partie de la SynalTeam travaille depuis plusieurs mois.
DataAsso, c’est quoi ?
DataAsso est le site internet visant à présenter toutes les associations françaises relevant de la Loi 1901.
L’histoire de DataAsso est avant tout l’histoire d’une rencontre. Celle de Marc Sallières, pionnier dans la promotion de l’open source et l’open data en France et directeur général de Synaltic, de son équipe de développeurs et de Jean Karinthi, membre d’OpenStreetMap France et directeur de la Maison des Associations du 2ème arrondissement de Paris.
Le projet DataAsso, première plateforme ouverte de traitement et de visualisation de données publiques relatives à l’activité des 1,3 millions d’associations françaises, est le fruit de la rencontre de ces passionnés.
Ce 15 février 2016 était l’occasion de dévoiler la version bêta de DataAsso au public.
DataAsso présente la vie associative française sous différentes formes, accessibles via plusieurs rubriques :
La Carte où il est possible d’effectuer une recherche multicritères d’associations pour les géolocaliser à partir de leur adresse de correspondance et afficher leurs informations détaillées. Ces informations sont vouées à être enrichies, à mesure que les associations déclarent leurs informations sur le portail Service Public Associations.
L’Observatoire qui affiche des indicateurs pour différents domaines de la vie associative : répartition par territoire, par thématique, évolution dans le temps…qui a été réalisé par notre Data Analyst sur la plateforme Tableau Public.
Des services sont proposés pour permettre à l’utilisateur d’exporter les données en vue de les afficher ou de les exploiter en dehors du site DataAsso,
Via les API DataAsso qui permettent d’extraire les informations pour une association ou une liste d’associations. L’extraction par liste est limitée à 20 extractions.
Actualités où seront publiées les informations du monde associatif, mais aussi des portraits de bénévoles, de dirigeants, bref, de celles et ceux qui font que le monde associatif français est hors du commun !
Après Marc Sallières, ce fut au tour de Jean-François Moritz, de la DJEPVA, de présenter les perspectives d’évolutions de DataAsso.
Car au-delà d’être une plateforme de référencement, DataAsso est au cœur d’un projet d’envergure et pourrait devenir, à terme, un nœud central d’échange de données entre différentes plateformes de gestion de l’Etat, les associations et le citoyens.
Mais la route est encore longue…!
Pour l’heure, la SynalTeam continue son travail d’amélioration et de développement de DataAsso. Nous vous invitons bien évidemment à tester la plateforme et nous donner vos impressions !
De nombreux outils de catalogage des données sont apparus grâce à l’accumulation massive de données désorganisées. Le but de ces outils va être de maximiser les possibilités de ré-usage des données afin de mieux les valoriser. Pour ce faire, il faut « connaître la donnée » pour pouvoir correctement la ranger et la retrouver, cette connaissance passe par l’usage d’un ensemble de méta-données décrivant la donnée. Cependant, une intervention humaine est nécessaire pour assurer un catalogage correct. Pour résoudre ce problème, il faut automatiser au maximum l’extraction des méta-informations des données.
Parmi ces informations, le type sémantique des données est particulièrement intéressant, car largement utiliser en data intégration. La plupart des outils de BI peuvent découvrir automatiquement quelques types sémantiques. Cette détection se fait classiquement à l’aide d’expressions régulières et de dictionnaires. Ces méthodes sont efficaces quand les données présentent des schémas réguliers et sont peu bruitées. Dans le cas contraire, la reconnaissance est difficile. Cette problématique a fait naître ces dernières années un nouveau courant de méthodes basées sur l’apprentissage artificiel.
Ces techniques vont essayer d’apprendre à partir de colonnes d’exemples à reconnaître les différents types sémantiques. Néanmoins, ces nouvelles méthodes ont besoin d’un large volume de données réel, ce qui limite l’usage à des types sémantiques pour lesquels beaucoup de données sont disponibles. Ainsi, une partie des travaux de R&D chez Synaltic visent à développer des méthodes basées sur l’apprentissage automatique pour identifier une plus grande variété de types sémantiques tout en minimisant le besoin de données réelles. C’est dans ce cadre que l’article « Semantic Type Detection in Tabular Data via Machine Learning Using Semi-synthetic Data » a été écrit et présenté à la conférence SoCPaR2022.
L’intégration de données trouve une certaine complexité dans la manipulation d’un grand nombre de sources de données, et d’API. Ici, nous avons cherché à simplifier l’appropriation de la configuration des API OAuth2 de Microsoft Azure pour Exchange Online.
Synaltic se tient à vos côtés pour vous aider dans la mise en œuvre de vos projets d’intégration de données avec Talend.
Sections commentaires non disponible.