lundi 20 mars 2017

Croiser les données génomique et les données santé est-ce utile ? est-ce dangereux ?

Du génome a la vie.
Le croisement de fichiers est à l'ordre du jour pour ce qui est du croisement des fichiers d'identité.
Le fait de rassembler deux fichiers distincts en un seul, en établissant des liens entre eux, n'est pas anodin.
Au contraire ! Les possibilités d'exploitation de ces fichiers sont considérablement renforcées et étendues.

Et croiser les fichiers génétiques traités en grand nombre avec les big data de santé, c'est très utile et c'est très dangereux !


La génomique fonctionnelle, une génétique "à haut débit"

Les génomes des molécules d'ADN, c'est-à-dire le matériel génétique d'un individu, est décodé pour en déduire, à partir de son séquençage, les "annotations fonctionnelles"

"Une fois les génomes annotés, l'étape suivante sera la recherche de la fonction des séquences informatives identifiées. 
La génomique fonctionnelle peut être considérée comme de la génétique à « haut débit ».


Analyser l ADN
Les techniques utilisées seront comparables mais généralement appliquées à un grand nombre de gènes en parallèle, cela peut être, par exemple, la création de mutants et l'analyse de leurs phénotypes pour toute une famille de gènes, ou l'analyse de l'expression de tous les gènes d'un organisme entier." (Wikipédia)

Les fichiers génomiques contiennent des informations appelées "annotations fonctionnelles" qui peuvent prédire des risques fonctionnels, en particulier, ceux liés à l'hérédité.

Les données de santé alimentent depuis longtemps les Big Data


Elles proviennent de sources diverses :
  • des systèmes hospitaliers
  • de l'assurance maladie
  • des causes de décès
  • des remboursements des mutuelles et assurances complémentaires
mais aussi :
  • les industriels du secteur médical et pharmaceutique
  • les chercheurs des organismes publics et privés
  • les patients et associations de patients
  • et... les moteurs de recherche comme Google, dont les algorithmes cernent les épidémies et les sujets de santé consultés sur le net

Elles sont à l'origine des informations médicales statistiques et les déterminants de santé (les facteurs qui influencent, seuls ou en combinaison, les états de santé).

Regrouper les deux, on peut imaginer les formidables débouchés

Si le travail sur les génomes permet de travailler sur les maladies génétiques et les cancers, cela va plus loin avec la possibilité de tests génétiques prédictifs.

Anticiper des maladies, mais aussi mieux les soigner, en personnalisant les traitements.

«Le séquençage seul ne suffit toutefois pas à établir le diagnostic, met en garde le généticien. Pour interpréter le génome, il faut croiser les données génétiques avec d’autres informations, les symptômes notamment. C’est un travail pluridisciplinaire.» écrit Pascale Minet dans l'article : "La santé dans les gènes". 
"Les techniques d'analyse du patrimoine génétique de chacun ouvrent la voie à une médecine «personnalisée», ou «de précision», pleine de promesses mais qui fait aussi débat"

Cette pluridisciplinarité, si elle inclut les autres données de santé, permettra un bond gigantesque dans l'efficacité et la qualité des soins !

Mais apparaissent aussi des risques d’exploitation très dangereux et préjudiciables.

L'ombre du film de Spielberg, "Minority Report" n'est pas loin.
ADN

Prédire c'est bien, si c'est au service des soins aux personnes.

Mais que se passera-t-il quand les entreprises s'empareront de ces données pour sélectionner leurs personnels, les compagnies d'assurance leurs clients ?

Ils n'auront "pas le droit" peut-on répondre naïvement.
Les données sont anonymisées, on ne peur les rattacher à des individus.
Dans le monde médical, ces données sont couvertes par le secret médical et leur divulgation est punie par la loi.

La loi permet aussi le droit de consultation de ses données personnelles, de rectification et de suppression.

Ceci, nous le verrons plus loin, n'est pas si simple ni si évident.

D'autre part, même sans individualisation, les statistiques définissent des typologies qui peuvent se révéler toute aussi dangereuses pour les personnes qui y correspondent.

L'anonymisation des données personnelles, à la fois une protection très relative et un obstacle à certaines recherches

La suppression de toutes les références personnalisantes comme nom, prénom, adresse, numéro de
Anonymat
Sécurité Sociale et leur remplacement par des codes anonymes est largement pratiquée.

L'anonymisation empêche :

  • le suivi d'une personne sur le long terme 
  • le croisement de renseignements sur différents traitements
  • de réinterroger le patient pour préciser un point important

sinon, l'identification serait trop facilitée.

On conçoit aussi que ce sont des freins aux recherches.

Enfin, on le sait très bien : ces données vont devenir un enjeu tellement important pour la science et surtout pour les intérêts financiers qui peuvent en tirer des profits énormes, qu'on se demande combien de temps les digues, mêmes les plus solides, tiendront.

Une équipe du Projet Données massives en santé (CHU de Rennes) a étudié la "Protection des données de santé lors de leur réutilisation à des fins de recherche au sein des entrepôts de données biomédicaux".

Le chapitre 5.2.3 décrit le risque de ré-identification.

La question est posée : "Avec l’avènement du big data et le croisement de données multi-sources, peut-on encore aujourd’hui garantir l’anonymat lors des traitements des données ?"

Il est donc important de rester vigilant, de dresser des contre-pouvoirs, d'imposer des garanties, sans se laisser distancer par l'avidité des lobbies du domaine si lucratif de la santé.