L’école de guerre Economique a accueilli le 15 mars Lucile Hyon-Le Gourriec, Senior Advisor chez IBM, afin de présenter l’utilisation des Big Data dans le domaine du sport et plus particulièrement, son utilisation dans le tennis.
La collecte et l’analyse de données statistiques en sport ne sont pas une nouveauté. La première application moderne des statistiques remonte à 1964 dans un livre, Percentage Baseball d’Ernshaw Cook. Cette méthode est connu du grand public depuis le film Moneyball sorti en 2011. L’outil statistique appliqué au baseball initia une discipline appelée sabermétrique. L’analyse statistique dans le sport sert à la recherche de l’efficacité et à l’amélioration de l’expérience.
L’usage des techniques analytiques sont agréables à présenter dans le domaine du sport. En effet, l’analyse de donnée peut apparaitre fastidieuse suivant le champ d’analyse. Avec le sport, la présentation des usages est parlante à tous. Afin de présenter les usages de l’analyse du Big Data, Lucile Hyon – le Gourriec mobilise le tennis. En effet, IBM est partenaire de Roland Garros depuis 32 ans et couvre désormais les 4 tournois du Grand Chelem (Open d’Australie, Roland Garros, US Open, Wimbledon).
L’acquisition données sur le terrain
L’ambition d’IBM est de pouvoir gérer tout ce qui est quantifiable. Il s’agit non seulement du score mais aussi de la vitesse de service, du nombre d’échanges, du type du joueur (offensif ou défensif). L’essentiel des données est consigné manuellement. Deux marqueurs sont présents sur les courts ; ils permettent d’enregistrer tout ce qui se passe sur le court, notamment tous les coups tactiques. A proximité du court, des collaborateurs consignent sur un clavier sténographique tout ce qu’ils peuvent observer.
La mesure de la vitesse se fait par un radar à effet doppler. Les radars de Roland Garros sont présents sur le « P » de Paribas. C’est le même système qui est utilisé pour mesurer la vitesse des voitures.
Avec les deux trackers présents sur le court, pour enregistrer les coups tactiques, ce sont plus de 45 000 coups et 2000 aces qui sont enregistrés par tournoi. Ces enregistrements permettent de voir les performances des joueurs en direct.
L’exploitation des données recouvrent plusieurs fonctionnalités dont certaines sont purement sportives et visent l’évaluation de la performance des joueurs, d’autres sont tournées vers le spectateur et l’infrastructure où a lieu la compétition.
La nouveauté induite grâce au Big Data est une analyse plus fine et la possibilité de leur visualisation en complémentarité du spectacle sportif. Le second usage, sur les réseaux sociaux permet de prédire les réactions du public, ainsi que son assentiment envers un joueur.
De l’évaluation de la performance individuelle à l’analyse prédictive
Les données sont enregistrées depuis très longtemps déjà. Mais auparavant, les données n’étaient remises qu’aux entraineurs et aux joueurs afin qu’ils puissent améliorer leur performance. Depuis 15 ans, les données sont diffusées auprès du public. Cette pratique s’inscrit dans la logique récente de l’Open Data.
L’application Roland Garros permet de voir le déroulement des matchs, en dehors des temps de disponibilité normaux. On peut ainsi assister au déroulement d’un match en journée par l’application mobile. Le but est de proposer un contenu additionnel et de pouvoir échanger avec l’écosystème sur des informations comme les records établis au service, la durée des échanges, le pourcentage de retours gagnants.
Pour chacun des joueurs, l’analyse visant à tenter de savoir qui va gagner en fonction de l’historique et de ce qui se déroule pendant le match repose trois critères décisifs : le nombre d’échanges gagnants, le nombre de retour gagnant ainsi que le nombre de coup droit gagnant On peut alors en déduire la capacité d’achievement au cours du match.
La diffusion des données
Toute les statistiques diffusées par France Télévision sont produites par IBM dont les équipes créent des éléments statistiques visibles en ligne. Pour diffuser tous les matches, ainsi que les informations statistiques, tant en France qu’à l’international, France Télévision dispose à Roland Garros de 7 camions de production. Un opérateur est affecté au choix de la diffusion des bonnes statistiques au bon moment. Par ailleurs les informations statistiques sont également diffusées en temps réel sur des écrans géants à l’intérieur du stade, ainsi que sur le site internet de Roland Garros. Les données des moments forts sont donc largement diffusées et partageables. Les enregistrements sont visibles sur la plateforme Slamtracker et sont mis à disposition de tous sur le site de l’événement.
Une application intitulée Turnament Alert Dashboard a été développée avec l’IA Watson. Cette fonctionnalité est capable de produire des alertes à l’équipe éditoriale de la Féderation Française de Tennis pour signaler des faits marquants en temps réel comme les records de vitesse de services, les records de nombre d’aces pendant le tournoi ou au cours de l’histoire. Ces dépêches peuvent être diffusées en temps réel sur les médias.
La solution d’Intelligence Artificielle permet aussi la collecte et l’analyse de tweets et d’autres messages sur les réseaux sociaux. Au début, cette application n’était que récréative mais elle s’est montrée très utile dans le domaine de l’analyse prédictive grâce à l’afflux de données provenant des réseaux sociaux. Avec l’augmentation de tweets et autres messages, ainsi qu’avec le développement de l’internet mobile (smartphones et tablettes), une nouvelle infrastructure informatique pour le site internet et le traitement du Big Data a dû être mise en place. Ces serveurs sont utilisés habituellement pour l’infrastructure informatique de la société, servent exceptionnellement pour la durée du tournoi à un client pour répondre à un besoin spécifique dans le temps.
L’analyse des réseaux sociaux
L’analyse des tweets s’est révélée très utile dans plusieurs domaines. Cette analyse utilise une solution d’intelligence cognitive qui permet d’identifier et de comprendre de manière automatique les tendances et les retours sur les évènements externes, comme la météo, le café, les files d’attente. Ces données sont très intéressantes pour la Fédération Française de Tennis pour gérer au mieux ses infrastructures.
Ensuite, cette analyse permet la détermination du Social Sentiment c’est-à-dire l’analyse de la perception des challengers en identifiant le joueur faisant le plus de buzz sur twitter, en s’appuyant sur le nombre de tweets concernant le challenger et le pourcentage de tweets positifs.
Dans les autres sports
Au rugby, la Rugby football Union analyse plus de 300 matches pour déterminer les moments clés du match pour chaque équipe, en proposant une visualisation en temps réel du jeu, jusqu’à l’analyse de l’influence de chaque joueur dans le déroulement de la compétition. Les tigres de Leicester utilisent l’analyse prédictive pour mesurer les performances de chaque joueur à partir de différents facteurs comme la fatigue, l’intensité du jeu, et ainsi adapter des programmes d’entrainement en fonction du risque de blessures de chaque joueur.
Les applications du Big Data dans le sport ne s’adressent pas seulement à l’expérience des joueurs mais aussi à celle des spectateurs. En effet, les tournois sportifs n’ont pas la même dimension outre atlantique. Ainsi les stades de hockey mobilisent l’analyse prédictive de Watson par l’application Behavior Based Fan Insight afin de personnaliser au mieux l’expérience du spectateur dans l’enceinte sportive. En Europe, des fonctionnalités similaires ont été développé à l’Amsterdam Arena avec IBM Interactive experience, afin de permettre au fan des expériences virtuelles via une application dédié.
Après avoir développé les capacités de calcul et de l’analyse prédictive pour les joueurs, le Big Data a rendu possible le partage de l’information entre les joueurs, les entraineurs, le stade et les spectateurs. Afin de pouvoir accéder à ces informations, le fan doit se connecter à l’infrastructure du site pour bénéficier d’une expérience augmentée par le numérique. Il s’agit désormais de rendre l’expérience de l’utilisateur au centre, par la proposition de contenu dédié et personnalisé selon l’individu et ses habitudes sportives.