Big Data et Artificial Intelligence

Les données massives, ou plus généralement le numérique, vont transformer de manière drastique notre environnement, tant au niveau économique que sociétal et ce, dans tous les secteurs. Cet évènement majeur et en perpétuelle évolution prend racine dans les années 1980, lorsque la puissance de calcul des ordinateurs commence à augmenter de manière exponentielle.

Jusqu’à la fin du XX^ème siècle, les hommes n’utilisent que de petites quantités de données qu’ils cherchent à interpréter afin de comprendre le monde. De nos jours, nous possédons infiniment plus de données qu’auparavant. Avec une telle quantité, c’est un océan de possibilités qui s’offre à l’humanité et qui permet d’accomplir des choses inimaginables. Les Big Data sont à la fois nouvelles et importantes, puisqu’avec une utilisation efficace, elles permettront de faire face à terme aux enjeux mondiaux : nourrir l'humanité, l'approvisionner en médicaments, en énergie, etc….

Quelle est l’évolution du Big Data ? Afin d’y répondre, un bref retour historique semble nécessaire. Dans le passé, précisément en 1908, sur l'île de Crète, des archéologues découvrent un disque d’un mètre de diamètre fait d’argile. Il est estimé vieux de 4000 ans. Dessus, les inscriptions sont indescriptibles mais nous pouvons constater à quoi ressemble l’information datée de 2000 ans av. J-C. C'est sous ce format que cet ancien peuple stockait et se transmettait l'information de génération en génération. Lorsque l’on y pense, la société n'a pas tant évolué que ça : les informations sont toujours stockées sur des disques, mais en quantité excessivement plus grande. De plus, elles sont nettement plus faciles à chercher, à copier, à partager ou encore à traiter. Elles sont aussi réutilisables pour des objectifs autres que ceux définis au moment où on les a collectées. Autrement dit, ces données ont changé d’état et sont aujourd’hui fluides et dynamiques. À titre de comparaison, ce disque découvert en Crète est grand, lourd et ne contient pas beaucoup d'informations. Il n’est pas non plus modifiable. En revanche, une clé USB, pas plus grande qu'une pièce de 50 centimes, a été plus que suffisante pour stocker et diffuser tous les fichiers qu'Edward Snowden a pris à la NSA aux États-Unis.

Que valent alors les Big Data ? Dans cette nouvelle ère du « tout numérique », la principale raison pour laquelle nous possédons tant de données aujourd’hui est que l’information brute a toujours été l’unité, la ressource de référence, et que celle-ci n’a jamais été transformée en donnée, par le passé. L'exemple le plus flagrant concerne les données de géolocalisation. Dans le temps, si on voulait retracer le parcours d’une personne, on devait le suivre en permanence, accompagné d’une carte et d’une plume pour noter ses différentes positions. Aujourd'hui, avec un téléphone portable muni d'un GPS, il existe quelque part un tableau qui enregistre vos informations de déplacement. Ainsi, la localisation a été transformée en données. Mais ceci n’est qu’un exemple de ce qui existe déjà. Étudions la position, les gestes voire la posture des personnes. Le physique étant unique et propre à chaque humain, il convient de dire que chacun possède sa posture, un peu comme son empreinte digitale. Si nous réalisions une analyse à l’aide de capteurs, nous serions alors en mesure de cerner votre unique posture, mais dans quel but ? Des ingénieurs de l'Advanced Institute of Industrial Technology de Tokyo l’utilisent comme potentiel système antivol dans les voitures. Inutile de préciser que si un voleur s’assoit au volant d’une berline, même si le moteur est déjà en marche, sa course ne sera pas longue : la voiture refusera toute accélération et stoppera le moteur.

Quelle place pour l’Intelligence artificielle ? Une des applications les plus impressionnantes des Big Data concerne le domaine de l'apprentissage automatique ou machine learning. Il s'agit d'une des branches les plus importantes de l'Intelligence artificielle. En définitive, l'idée est qu’à l’instar de l’humain, l’ordinateur apprenne seul. Pour ce faire, on lui fournit d’abord une grande quantité d’informations de base puis, on lui demande d’en apprendre plus avec. Sa capacité de calcul ultra-puissante lui permet de recroiser des données dans tous les sens et de manière répétitive pour en dégager de nouvelles solutions. L’exemple de l’informaticien Arthur Samuel aide à mieux comprendre ce processus d’apprentissage. Grand amateur du jeu de Dames, il créé un programme informatique afin de jouer contre son ordinateur. Or, étant un habitué et fin stratège, il gagne en permanence car l’ordinateur ne connaît que les coups de base. Il décide alors de créer un second programme qui vient épauler le premier. Son objectif est d’emmagasiner de la connaissance, d’étudier chaque coup en fonction du précédent et du suivant. Plus ils jouent ensemble, plus l’ordinateur apprend grâce à son algorithme qui augmente la précision de ses prédictions. Afin de gagner du temps, Arthur Samuel laisse l’ordinateur jouer contre lui-même tout au long d’une période. À son retour, face à la machine, il ne gagne pas une seule partie. Dès lors, cet homme a créé une machine capable de le surpasser dans une discipline qu'il lui a enseignée. Plus récemment, des chercheurs ont étudié des biopsies de cellules cancéreuses et accumulé un nombre important de données. Ils ont ensuite demandé à des ordinateurs d'analyser le taux de survie pour déterminer quelles cellules étaient réellement cancéreuses. Sans surprise, l'algorithme d'apprentissage automatique a été capable d'identifier 12 signes prédisant au mieux que ces cellules tumorales étaient en effet cancéreuses. Avant le test, les médecins ne connaissaient seulement que 9 signes. Trois ont été identifiés par l'ordinateur sans qu’aucune équipe ne passe de temps à réaliser des recherches. Outre le gain de temps, c’est aussi un gain d’argent conséquent.

Quelles limites accordons-nous à l'Intelligence artificielle ? Avons-nous réellement révolutionné le monde qui nous entoure grâce à ces nouvelles technologies ? La réponse est non. Malgré l’avancée conséquente, c’est surtout l’approche du problème qui a évolué. Au lieu d’indiquer ouvertement à l’ordinateur les axes à suivre, on lui donne un amas d’informations et on lui demande de faire de son mieux pour déceler des nouveautés au travers de tests rapides et incessants. L'apprentissage automatique est à la base de nombreux outils en ligne : les moteurs de recherche, la traduction par ordinateur, la reconnaissance vocale ou encore l'algorithme de personnalisation d'Amazon. Cependant, à s’avance toujours plus loin, on découvre une face sombre des Big Data et de l’Intelligence artificielle qui pose des problèmes au niveau éthique. Le premier concerne le stockage et l’appropriation des données personnelles : le film visionnaire de 2002, « Minority Report », raconte que « la société du futur a éradiqué le meurtre en se dotant du système de prévention / détection / répression le plus sophistiqué du monde ». On admet alors, la possibilité de collecter des informations au niveau de l’individu en vue d’analyser les comportements sous différents critères qui peuvent être : les activités sportives, la situation sociale, le parcours scolaire voire des données de réactions biochimiques produisant des pensées agressives. Finalement, le vrai défi est de préserver le libre-arbitre, les choix moraux, le consentement et la capacité d'agir de l'homme. Le second problème concerne l’emploi. Les algorithmes vont entrer en concurrence directe avec les humains, de la même manière que l'automatisation des lignes de montage. Il est vrai que dans le progrès, de nombreux emplois sont créés, néanmoins, des catégories d'emplois sont simplement éliminées et jamais remplacées. La théorie de la « destruction créatrice » de Joseph Schumpeter a longtemps fonctionné. Cependant, la vitesse du progrès technologique arrive à un point tel qu'il devient très compliqué pour les êtres humains de s'adapter professionnellement aux cycles des changements technologiques.

Les chevaux n’ont certainement pas dû apprécier l’arrivée de l’automobile durant la révolution industrielle…

Iaguen DAVID

Club Big Data et Intelligence artificielle