Rechercher
Fermer ce champ de recherche.

État de l’art du Big Data : rencontre avec Dataiku

Cet article fait suite à un entretien entre l’entreprise Dataiku, le mardi 9 janvier 2018, et le club Big Data et IA de l’AEGE.

 

Une entreprise qui concrétise la Data Science dans les services aux organisations

Signifiant littéralement la “science des données”, la Data Science est issue du flux d’information massif appelé Big Data. Cette discipline récemment popularisée à grande échelle s’appuie sur différentes disciplines tels que les statistiques, les mathématiques ou encore l’informatique avancée.

La start-up Dataiku a été créée en France en 2013 par quatre co-fondateurs. Son PDG, Florian Douetteau, est l’ancien directeur de la R&D d’Exalead. Aujourd’hui, l’entreprise est implantée aux quatre coins du monde : Paris, Londres, New-York et un projet de bureau en Asie mûrit.

Dataiku a développé un logiciel destiné aux startups comme aux grands groupes ou à l’administration. Son software DSS (Data Science Studio) rend la Data Science accessible aux entreprises, comme les logiciels de Business Intelligence l’ont fait en leur temps pour le reporting de données issues de l’entreprise. DSS est une plateforme qui repose sur des technologies open source et qui est accessible à différents profils : data scientists et data analysts peuvent ainsi manipuler ensemble des données dans le but d’élaborer un modèle prédictif.

 

L’élaboration d’un projet de A à Z

Un projet de Data Science débute avec un premier contact établi par un partenaire ou par un membre de l’équipe de business développent de Dataiku afin de s’assurer de la maturité de l’organisation cliente et de la faisabilité du projet pour construire une solution adaptée. Dans cette démarche, l’intérêt du futur client est important pour véritablement connaître ses attentes vis-à-vis de la solution ainsi que pour quantifier le retour sur investissement potentiel du projet.

Le logiciel est installé directement sur les serveurs du client puis se connecte à l’infrastructure de ce dernier. En moyenne, 80% du travail de l’équipe technique de l’entreprise sera consacré à la récupération, au nettoyage et au formatage des données en vue de les rendre intelligibles. Les 20% restant seront consacrés à la réalisation d’un modèle prédictif. Différents algorithmes seront testés, optimisés et comparés entre eux. Puis, mis en production, ils vont permettre d’améliorer la prise de décisions utiles au client.

Comme exemples de cas d’usage, on peut citer les campagnes marketing ciblées ou encore les campagnes de type « anti churn », c’est-à-dire une stratégie permettant d’éviter de perdre des clients.

 

De l’intérêt du big data dans l’entreprise : étude du cas chez l’Oréal

Les équipes RH de l’Oréal avaient mis en place, en 2012, le réseau social d’entreprise “Yammer” pour l’ensemble de leurs salariés. L’objectif était d’utiliser ce réseau, partager et transmettre des connaissances en vue d’améliorer le Knowledge Management de l’entreprise de cosmétique. Pour cela, celle-ci a souhaité s’appuyer sur DSS pour identifier les salariés les plus actifs (leaders d’opinion, etc.) de la plateforme puis inciter les actions pour la transmission de connaissances entre acteurs pertinents. L’Oréal a utilisé DSS pour créer une application qui récupère automatiquement sur Yammer l’ensemble des informations nécessaires à la représentation graphique des flux conversationnels et des activités des groupes de discussion individuels sur le réseau social. En conséquence, l’Oréal a pu identifier trois types de leaders différents sur sa plateforme. Cela lui a permis de mieux gérer et stimuler ses différents groupes de travail. Elle a vu sa productivité augmenter grâce à une meilleure circulation du savoir au sein de l’entreprise.

 

Appréhender et manager les nouveaux métiers de la donnée

Matthieu Scordia est le premier salarié de l’entreprise. Après ses études à l’Université Pierre et Marie Curie (Paris VI) durant lesquelles il s’est spécialisé dans l’Intelligence Artificielle, il est engagé par la start-up, en 2013, comme Data Scientist.

Après ses études à HEC et son admission au barreau de Paris, Rémi Meunier s’est, quant à lui, dirigé vers la politique. Guidé par son appétence pour les défis technologiques, il décide de se confronter au monde des startups. Depuis peu, il est en charge du Business Développement de l’entreprise auprès des administrations publiques, notamment. Leur vision du Big Data et de leur métier permet un début d’esquisse des compétences du Data Scientist et du Data Analyst.

Le Data Scientist a besoin de posséder des compétences techniques solides en algorithmique et en maîtrise des langages de programmation comme R et Python, pour n’en citer que deux. Le Data Analyst apporte, quant à lui, une vision business via sa maîtrise des processus métiers du client. Il comprend l’importance d’une donnée et sa signification. Il cerne les problématiques du client et peut donc mieux répondre à ses besoins. 

 

Dataiku, plateforme d’innovation de l’armée française

Lors de notre rendez-vous, Matthieu Scordia nous a appris que l’entreprise avait signé un partenariat technologique dans le cadre d’un défi organisé par la Direction Générale de l’armement pour la prise en charge de la maintenance prédictive des Mirages 2000 des armées françaises, en prenant en compte toutes les contraintes de planification des différentes parties prenantes (industriels et sous-traitants, services et directions du Ministère des Armées). Ce concours, ouvert aux entreprises comme aux particuliers, s’appuie finalement sur la plateforme DSS pour trouver une solution innovante aux problèmes de disponibilité des Mirages de l’armée française. Un site dédié à ce concours a d’ailleurs été créé.

 

Il est intéressant de souligner la force de cette startup ainsi que ses capacités d’expansion. De même, on peut se féliciter de cette incursion française sur la scène internationale dans un marché dominé par des puissances étrangères.

 

Lucas Atton, Pierre-Alexandre Clayet, Iaguen David et Charlène Grel