Notre génome, une donnée à protéger

À l’ère de la numérisation des données de santé, les progrès de la recherche sur le génome humain en font un sujet sensible. Exacerbée par les fuites de données régulières qui marquent l’actualité, son séquençage pose problème. Les informations portées par le génome humain sont si nombreuses qu’elles en font aujourd’hui l’ultime donnée confidentielle qu’il est indispensable de protéger pour éviter qu’elle ne devienne une arme stratégique.

Le séquençage du génome humain

Le génome humain désigne l’ensemble du matériel génétique d’un être humain, c'est-à-dire l’ensemble des informations portées dans ses gènes. Chaque gène détermine un caractère précis d’un individu et correspond à une portion d’un brin d’ADN. Cet ADN est le support de l’hérédité et constitue les vingt-trois paires de chromosomes que l’on retrouve dans toutes les cellules de notre corps. On dit que l’ADN est un support d’information, car il se compose d’une succession de bases azotées dont l’ordre décrit une information et qui servent de “langage biologique” (on compte 4 bases différentes pour l’ADN : l’adénine, la thymine, la cytosine et la guanine). Ces quatre bases azotées sont les lettres de l’alphabet avec lesquelles l’histoire de l’être humain s’est écrite. Au total, on dénombre plus de trois milliards de paires de bases dans l’ADN. Cependant, tous les individus n’ont pas exactement le même code : entre deux personnes, on trouve environ trois millions de différences ponctuelles. Celles-ci se traduisent par le remplacement d’une base azotée par une autre en un point précis de l’ADN, appelé SNP (Single Nucleotide Polymorphism). On dit alors qu’il existe deux allèles du gène, c’est-à-dire que le gène peut exister sous deux formes différentes.

Ces variations participent à la diversité au sein de l’espèce humaine. Elles peuvent affecter une caractéristique physique (par exemple la couleur des yeux, qui n’est déterminée que par huit SNP), un trait de caractère ou la résistance à certains types de maladies. Puisque 99,9% de l’ADN est commun d’un individu à un autre et que les différents SNP sont toujours localisés aux mêmes endroits, le séquençage du génome consiste simplement à extraire la valeur de chaque SNP.

 

Le prix du génome humain

Initié en 1990, le Projet du Génome Humain (PGH) était un projet de recherche international impliquant les États-Unis, le Canada, le Royaume-Uni, la France et le Japon. Il a abouti en 2003 au séquençage complet du génome humain, une avancée majeure qui contribue encore aujourd’hui aux progrès scientifiques. On doit d’ailleurs à cette compréhension de l’ADN les récents vaccins contre la Covid-19. Les recherches se poursuivent et la technologie évolue, si bien que des sociétés privées se sont dotées d’équipements de séquençage et proposent ce service au grand public. Ilumina, qui détient, selon les Échos, 90% des parts de marché aux États-Unis, présente une offre de départ pour environ mille dollars, le prix variant ensuite en fonction du niveau de précision demandé. Plus de vingt-cinq millions d’Américains ont déjà fait séquencer leur génome, par curiosité, sous la forme d’un cadeau ou dans le but de retrouver des ancêtres ou un lien de parenté avec d’autres personnes.

Si l’information peut s’acquérir librement aux États-Unis, il n’en est pas de même en France. En 2004, la loi de bioéthique précisait clairement que « l'examen des caractéristiques génétiques d'une personne ne peut être entrepris qu'à des fins médicales ou de recherche scientifique ». En effet, on considère d’une part que le génome n’est pas la propriété exclusive d’un individu puisqu’il est l’héritage de celui de ses parents, et d’autre part que la connaissance du génome peut conduire à des dérives, en étant par exemple invoqué pour reconnaître un lien de filiation lors d’un héritage, ou pour juger de la “bonne santé” d’un fœtus. Le séquençage de l’enfant à naître ouvre la porte à des pratiques eugénistes, dangereuses et immorales. S’il est toutefois possible de procéder à une analyse ADN dans le cadre médical, cela n’est effectué que sur certains gènes précis liés à des maladies graves. Ces tests ne sont pas sans conséquences sur la grossesse et ne sont pas systématiques.

La France est l’un des seuls pays à avoir mis en place cette interdiction, à l’inverse de l’Angleterre ou de la Chine où des programmes d’États encouragent même le séquençage d’une partie de la population. Aux États-Unis, on considère que la connaissance du génome de 2% de la population suffirait à identifier la plupart des individus. Pourtant, ces données sont mal protégées et la richesse qu’elles constituent en font un véritable enjeu de sécurité nationale.

 

Le génome humain, l’ultime donnée à protéger

La méthode de séquençage du génome est simple : la société envoie à ses clients un kit de prélèvement qu’il faut lui retourner par la poste, puis elle procède à l’analyse de l’ADN. Le séquençage intégral est coûteux, l’offre la plus populaire consiste à rechercher uniquement la valeur des SNP, les bases azotées variables qui représentent moins d’un millième du génome. Ces informations forment un code, stocké dans un simple fichier texte, et sont analysées automatiquement à l’aide des résultats de recherches scientifiques pour identifier des signes de prédisposition à certaines maladies ou des similitudes avec d’autres individus.

 

Malheureusement, le génome et le résultat de l’analyse sont des données mal protégées. Hébergées en ligne, elles sont particulièrement exposées aux fuites de données régulières auxquelles n’échappent pas les entreprises. On peut citer par exemple MyHeritage ou Veritas pour avoir fait l’objet d’attaques réussies contre leur système d’information, respectivement en 2018 et en 2019.

 

En dehors des problématiques d’eugénisme et d’éthique individuelle posées par le séquençage sur le plan théorique, le vol du génome peut avoir des conséquences beaucoup plus directes sur les individus. Les informations qui en découlent intéressent les assurances et peuvent faire l’objet d’un marketing de la santé. Pour de nombreuses personnes, le secret lié à une maladie génétique grave peut donner lieu à un chantage. Cette menace pèse sur les particuliers, mais également sur les entités qui emploient ces données. En effet, dans de nombreux pays, les hôpitaux sont aujourd’hui la cible d’attaques pour extorquer des rançons et voler des données facilement monnayables.

 

Cela va plus loin encore, avec le développement des connaissances scientifiques en génétique. Aujourd’hui, de nombreuses recherches viennent associer certains gènes spécifiques à des caractéristiques physiques, mais également à des prédispositions comportementales, comme le présente le site genomelink.io. Ainsi, à partir d’une analyse du génome, il est possible de déterminer si une personne a une tendance naturelle à développer un certain caractère, comme l’attrait du jeu ou le désir d’aider. 

 

S’il reste évident que ces caractères sont issus de l’éducation et des expériences individuelles, ces prédispositions peuvent toutefois procurer un avantage statistique à un cyber-attaquant dans le cadre d’une campagne d'ingénierie sociale, en utilisant les meilleurs pièges sur les cibles les plus vulnérables. 

De là à admettre un déterminisme génétique, il n’y a qu’un pas qu’il ne s’agit pas de franchir. L’école d’anthropologie criminelle de Lombroso en 1870, qui consistait à croire que les assassins sont physiquement différents des autres hommes, figure parmi les plus grandes erreurs de l’histoire des idées. Les relations humaines et l’environnement des individus ont un impact bien plus grand sur leur façon d’être que leur héritage génétique. Les avancées scientifiques réalisées dans le domaine médical grâce à la meilleure connaissance du génome humain sont fantastiques, mais celui-ci n’en constitue pas moins une mine d’or d’informations personnelles. Par conséquent, protéger la confidentialité de ces données est un enjeu majeur, tant pour les individus que pour les nations elles-mêmes. Si leur sécurité ne peut être garantie par les entreprises de séquençage, il vaut mieux faire preuve de retenue et s’abstenir de produire cette information en dehors d’un cadre légal ou médical.

 

Néha Grivet & Olivier Schoeffel

Cette analyse est librement inspirée de la conférence de Renaud Lifchitz le 25 janvier 2021, organisée par Gérard Peliks dans le cadre des "Lundi de la cybersécurité"

Pour aller plus loin :