Big data : pour le meilleur et pour le pire

Les données, désormais produites en masse, sont à l’origine de l’essor de la médecine personnalisée.

Les algorithmes qui offriront à chaque patient un diagnostic plus précis, plus ciblé, plus individualisé, ont besoin des informations de dizaines de milliers de patients pour « apprendre ». Si les centres hospitaliers sont des fournisseurs majeurs de données biomédicales, pas besoin cependant de passer une IRM ou de faire un test génétique pour participer au big data. A longueur de journée, nous contribuons au phénomène, parfois même sans le savoir.

Tout ou presque aujourd’hui peut produire des données, du pèse-personne connecté aux smartphones, sans parler de tous les objets dont on n’imagine même pas qu’ils puissent collecter des informations. Comme ces robots-aspirateurs capables de fournir des cartes précises des appartements. « Les scientifiques travaillaient sur des données figées, acquises dans un espace-temps défini : un “lac” de données. Dorénavant, nous sommes face à des données en mouvement, des flux continus, incessants, “des fleuves” ! », illustre le Pr Christian Lovis, médecin chef du service des sciences de l’information médicale.

La science s’est toujours nourrie de données

Utiliser des données pour faire avancer la science n’est pas nouveau. « C’est ainsi qu’est née la démarche scientifique : les chercheurs observent, échafaudent des hypothèses, puis recueillent des données pour les vérifier », rappelle Christian Lovis. Mais certaines estimations prévoient qu’à l’horizon 2020, plus de 2000 exaoctets (soit 2000 millions de téraoctets) de données biomédicales seront produits. Cette quantité de data sans précédent est-elle en train de révolutionner la recherche ? « La météorologie ou l’astrophysique travaillent avec des données massives depuis très longtemps, mais elles sont obtenues dans des buts précis. Or, la science actuelle utilise d’une part des sources nombreuses et hétérogènes, et d’autre part, réutilise des données dans d’autres buts que ceux ayant motivé leur création », explique le spécialiste.

Analyse des tweets

Pour certains de ses travaux, le chercheur analyse d’ailleurs des messages postés sur Twitter : « Le texte est un objet d’étude très riche. Celui des dossiers médicaux, comme celui des réseaux sociaux », souligne-t-il. L’analyse des tweets a ainsi permis de mieux repérer les effets secondaires de certains médicaments ou de voir comment les patients expriment leur douleur.

Echanger les données

Faut-il avoir peur de ces traces numériques que nous produisons en si grande quantité ? « Aucune invention, du couteau suisse aux montres connectées, n’est faite que pour le meilleur, constate Christian Lovis. Tout objet peut conduire à des dérives. » Pour le chercheur, il est l’heure de sortir d’une vision idéaliste et naïve d’un usage totalement ouvert des données, qui ont désormais une réelle valeur monétaire. « Elles se négocient, se vendent, s’achètent. Il faut donc inventer de nouveaux modèles pour échanger contractuellement les données, assurer la traçabilité, un usage équitable, mais aussi la confidentialité. Or, cela n’est pas compatible avec l’open data actuel. Je soutiens donc l’idée de développer un centre de data privé pour les recherches d’intérêt public… en attendant mieux ! »

Dossier Santé personnalisée :

avril 2018