Ils/elles ont beau être parmi les compétences les plus recherchées dans le monde de l’IT, en Europe comme aux Etats-Unis, les data scientists font encore plus de nettoyage de données que d’analyses.
Source : Le Monde Informatique
Un article paru sur Le Monde Informatique, suite à une étude initialement diffusée sur le site CrowdFlower, révèle que les data scientists consacrent encore la majeure partie de leur temps (60%) au nettoyage et à l’organisation de données plutôt qu’à l’analyse.
Ainsi, pour un poste pourtant difficile à recruter (83% des sondés reconnaissent qu’il est difficile de trouver des data scientists dans le monde de l’entreprise), les compétences restent mal utilisées et cantonnées à une activité qui, d’après plus de la moitié des sondés, ne leur plait pas vraiment.

60% du temps de travail des data scientists est consacré au nettoyage et à l’organisation de la donnée.
La Data Preparation, une vision « à part »
Des solutions de Data Preparation existent pourtant : Trifacta, notre nouveau partenaire technologique en est une ; Talend, autre partenaire de Synaltic a également lancé sa plateforme de Data Preparation ces derniers mois.
Des solutions qui permettent aux business users de « prendre en main » leurs données pour les préparer et les enrichir mais aussi aux data scientists de gagner du temps pour se consacrer à l’analyse. Ces solutions permettent également, pour certaines, d’industrialiser ces étapes considérées comme « fastidieuses » afin de les reproduire à chaque mise à jour des données.
Téléchargez notre livre blanc sur la data preparation
Notre conseil : Ne laissez pas votre data scientist sous-employer ses compétences en SQL, Hadoop, Python, R… ! Optez pour une véritable démarche de Data Preparation !
Vous voulez en savoir plus sur notre vision de la Data Preparation ? Contactez-nous !
Sections commentaires non disponible.