Faux profils : quelle méthodologie pour les détecter ?

En utilisant des outils d’OSINT et analyse d’images, il est parfois possible d’identifier un faux profil sur les réseaux sociaux, simplement en étudiant la photo de celui-ci. Voici un guide détaillé, étape par étape, visant à maximiser les chances de succès lors de votre investigation.

La recherche d’image inversée

La première étape consiste à effectuer une simple recherche d’image inversée par le biais des moteurs Yandex, Bing, TinEye et Google Images. L’add onRevEye Reverse Search Image est pour cela très utile, il permet de lancer d’un simple clic une recherche d’images sur les quatre moteurs précédemment cités. Un tableau comparatif des moteurs de recherche d’images a d’ailleurs été récemment publié sur Domain Tools, afin de voir les avantages comparatifs de chacun des moteurs de recherche : 

https://blog.domaintools.com/wp-content/uploads/2019/09/Chart2-900x343.png

Lors d’une investigation sur un visage, Yandex et Bing se démarquent du fait de leur capacité à identifier et retrouver un visage. Un cas concret :

Google et Bing n’arrivent pas à trouver cette image contrairement à Yandex et TinEye qui eux identifient différentes sources. Il convient alors de se demander si cette photo a été retrouvée sur le site personnel de l’individu, son blog et réseaux sociaux ou bien à partir d’une multitude de sources ?

Dans le cas présent, la photo apparaît sur un site de freelance et la personne se présente sous le prénom de Béatrice, ce qui ne correspond pas l’identité présentée sur LinkedIn.

 

En couplant cela à l’important nombre d’utilisations de cette photo sur internet, il est possible d’affirmer que la personne qui a créé le compte LinkedIn analysé n’utilise pas sa propre photo sur le réseau social. Cela ne signifie pas nécessairement qu’il s’agit d’un faux profil, mais la crédibilité du compte en est altérée. Aussi, la photo d’une personne a pu être usurpée et utilisée sans son consentement. C’est à l’investigateur de déterminer le scénario le plus probable en fonction des indices recoupés.

Dans le cas où l’image est retrouvée sur plusieurs réseaux sociaux ou sites internet au nom d’une même personne, il convient de pousser l’analyse en observant attentivement les détails de l’image. Les photos générées par une intelligence artificielle comportent de nombreuses imperfections et certains indices sont visibles à l’œil nu. Une image provenant de thispersondoesnotexist, un site internet qui fournit des images humaines de synthèse entièrement automatisées à partir de réels portraits, aura tendance à avoir les caractéristiques suivantes :

  • Yeux vairons
  • Qualité de peau non homogène (visage marqué, rides à un seul endroit)
  • Dentition peu nette ou tachetée
  • Aura / flou autour du visage et de la chevelure 
  • Mèches de cheveux floues
  • Asymétrie du visage
  • Distorsion de l’arrière-plan le rendant peu réaliste

La distorsion de l’arrière-plan permet d’un simple coup d’œil d’affirmer que cette image est effectivement le fruit d’une intelligence artificielle. Cependant, si cette même image est rognée, cela devient beaucoup plus difficile.


Certains indices restent identifiables :

– Les cheveux ne semblent pas naturels sur la partie droite
– On dénote une légère aura autour des cheveux            
– Il y a trois traits semblables à des rides au niveau du sourcil droit du sujet        
– La finition de l’iris gauche du sujet est mauvaise

En outre, il est possible de se référer à l’analyse du niveau d’erreur de l’image (ELA). Cet outil mesure la quantité de changement lors d’une nouvelle sauvegarde JPEG. Lorsqu’une photo numérique est retouchée, les parties modifiées auront un niveau d’erreur différent de celui du reste de la photo. Les modifications significatives apparaîtront généralement en surbrillance. Une retouche ne signifie pas que le sujet d’une photo n’est pas réel, mais simplement que l’image n’est pas authentique. Il peut s’agir par exemple d’une personne ayant modifié les couleurs de sa photo ou un léger détail en arrière-plan.

Le site fotoforensics permet par exemple d’effectuer cette analyse. Voici une comparaison de l’image obtenue via thispoersondoesnotexist (à gauche) et une photo d’un autre sujet prise par un smartphone (à droite).

 

L’image de gauche présente de nombreuses surbrillances contrairement à l’image de droite, ce qui est un indice supplémentaire pour identifier une image montée de toutes pièces. Cependant, la possibilité qu’il s’agisse d’une réelle photo juste retouchée n’est toujours pas exclue.

Prenons l’exemple des photos LinkedIn de deux sujets réels et identifiés : d’Augustin Roch (à gauche) et Alfred Huot de Saint Albin (à droite). Bien que ces deux personnes soient réelles, l’analyse du niveau d’erreur révèle malgré tout de légers changements. Elle a été effectuée avec 29a, un site proposant un ensemble d’outils pour l’analyse d’images numériques, 

Le traitement des photographies par LinkedIn et leurs téléchargements ont amenuisé la visibilité des modifications. Voici ci-dessous une comparaison de l’ELA de la même photo, modifiée avec un filtre Snapchat. À gauche la photo a été envoyée par mail et téléchargée sur pc, à droite elle a en plus été enregistrée sur Facebook et téléchargée à nouveau.

 

Après le traitement par Facebook et un nouveau téléchargement, la surbrillance a été réduite et l’image apparait obscurcie, ce qui traduit une baisse de la qualité. Les modifications restent toutefois visibles.

L’altération du niveau d’erreur n’est pas la seule chose résultant du traitement de l’image par Facebook. Lorsqu’une photo est traitée par le réseau social, celui-ci efface l’Exchangeable Image File, plus connu sous le nom de données EXIF. Ces données, analysables via notamment le site exif.regex, peuvent révéler des informations importantes sur une image telles que la date et l’heure à laquelle a été prise la photographie, les coordonnées GPS ou encore le type d’appareil utilisé.
Effectuons une comparaison des données obtenues entre une photo prise par un smartphone traitée par le réseau social à gauche et non traitée à droite.

 

Les données EXIF ne sont pas disponibles sur la photographie téléchargée depuis Facebook tandis que celle conservée sur ordinateur regorge d’informations qui se révèlent être exactes.

Le site imatag.com a publié en mai 2018 un article relatif aux métadonnées ainsi qu’un tableau présentant la transformation des images par les réseaux sociaux : 

Il apparaît qu’il est impossible d’obtenir directement les données EXIF d’une photographie lorsque l’on investigue sur un réseau social. Cependant, si la recherche d’image inversée se révèle être fructueuse, il est possible de les obtenir via une autre source.

En effet, lorsqu’un filtre de couleur ou de type Snapchat a été appliqué sur une photo, il est encore plus difficile de déceler les indices mentionnés au début de l’article. De plus, il est nécessaire de relever que l’application Snapchat efface automatiquement les données EXIF. Le filtre peut obstruer une partie du visage et les effets visuels justifier certaines imperfections dans l’image et plus particulièrement l’aura. Cependant, certains défauts ne laissent place à aucun doute.
Voici l’image précédemment utilisée suite à l’ajout d’un filtre Snapchat :

 

Il est inutile de s’attarder sur les données (ELA) car la modification de la photographie est évidente (utilisation d’un filtre masque de squelette).

Cependant, sur la photo originale étudiée, la coloration de l’iris du sujet a été relevée comme un échec. L’iris n’est donc pas régulier et un mauvais choix de couleur lors de la pixellisation par l’intelligence artificielle est également notable. Ce problème n’a pas été corrigé par le filtre Snapchat bien qu’il modifie la forme de la pupille du sujet :

Les filtres Snapchat rendent beaucoup plus complexe la détection d’indices, mais il demeure possible d’identifier une photo synthétisée par une intelligence artificielle. La manière la plus efficace de détecter une telle image reste une analyse minutieuse. Il est possible pour un individu d’acheter des selfies « exclusifs », qui n’apparaissent nulle part ailleurs sur internet. Toute tentative d’investigation conduite exclusivement par l’utilisation des techniques mentionnées ci-dessus est alors rendue obsolète.

 

 

Julien Vachel

pour le Club OSINT