La génomique chez Imagia : Comment l’IA peut aider à libérer le pouvoir clinique des données génomiques

Gabrielle Bertier
DHDP Partnership Manager

 

 
Le pouvoir de la génomique

De mon dégoût incontrôlable pour la coriandre au risque accru de cancer du sein dans ma famille, beaucoup d’informations sont encodées dans mon génome. Cette séquence de 3,2 milliards de lettres (A, T, C et G) contenue dans chaque cellule de mon corps a non seulement un impact sur le goût des aliments et sur les risques pour la santé, mais elle est aussi totalement unique et peut donc être utilisée pour m’identifier. Elle est aussi partiellement partagée au sein de ma famille, des groupes ethniques auxquels j’appartiens et de l’ensemble de la population humaine. Parce que ces informations sont si uniques et si puissantes, on pensait qu’en y accédant, il serait possible d’éradiquer complètement les maladies. Comment les données génétiques sont-elles utilisées dans les soins de santé aujourd’hui?

Les tests génétiques sont disponibles dans une variété de scénarios cliniques. Qu’il s’agisse des tests génétiques prénataux, du dépistage des nouveau-nés, du dépistage des cancers héréditaires, du diagnostic des maladies rares ou de la détermination de la probabilité qu’un patient réponde bien à des traitements spécifiques, la génétique a imprégné de nombreux domaines de la médecine. Dans ma famille par exemple, où de nombreuses femmes étaient touchées par le cancer du sein et d’autres cancers, les médecins ont décidé d’étudier si la génétique jouait un rôle dans la santé de notre famille. Ils ont d’abord identifié une mutation génétique BRCA-2 chez ma grande-tante, qui lui donnait un risque accru de développer un cancer du sein ou des ovaires. Ils ont recommandé que toutes les femmes de la famille soient testées, et celles dont le test était positif pour la mutation se sont vu proposer des suivis fréquents, et même des opérations chirurgicales préventives pour minimiser leur risque de développer la maladie. Le pouvoir prédictif de ces informations génétiques n’est qu’une des façons dont la génomique peut influencer les soins du cancer. En effet, toutes les cellules cancéreuses hébergent des altérations génétiques qui, si elles sont identifiées et comprises correctement, peuvent nous aider à détecter le cancer à un stade précoce, à prédire comment une tumeur spécifique réagira à un traitement et à associer un patient à un médicament spécifique.

Les technologies de séquençage génétique sont le plus souvent utilisées en oncologie, en cardiologie et en immunologie, et sont continuellement améliorées. Qu’il s’agisse du dépistage d’un changement de lettre spécifique ou d’un “variant nucléotidique unique” à un endroit précis du génome ou de l’analyse des 3,2 milliards de lettres ou “paires de bases” qui composent l’ensemble du génome humain, les technologies se sont considérablement améliorées et le coût (en temps et en argent) de la production de ces données a baissé à un rythme remarquable. Pour le démontrer, les généticiens aiment comparer ce qu’il a fallu pour séquencer le génome humain dans les années 1980 (plus de 2 milliards de dollars, une équipe internationale de centaines de scientifiques et un total de 13 ans) à ce qu’il faut aujourd’hui (une séquence complète du génome peut être produite sur une machine en quelques jours, pour moins de 2 000 dollars).

Cependant, on peut dire qu’il reste encore beaucoup de progrès à faire. En effet, nous sommes loin d’avoir résolu tous les grands problèmes de santé, et le pronostic pour la plupart des patients diagnostiqués aujourd’hui avec un cancer est encore sombre. Bien sûr, la génétique ne peut pas tout résoudre, et de nombreux autres facteurs – tels que l’environnement, le régime alimentaire et le mode de vie – jouent un rôle majeur dans notre probabilité de développer des maladies. Pourtant, nous ne comprenons pratiquement pas ce que fait la majorité de notre génome (la somme des 20 000 gènes ne représente qu’environ 2 % de la séquence complète de notre génome!), et nous n’avons fait qu’effleurer la manière dont nos gènes interagissent entre eux et avec d’autres éléments de notre corps. Donc, récapitulons. Chacune des 30 trillions de cellules d’un corps humain contient un code de 3,2 milliards de lettres, composé de quatre (4) lettres, à l’intérieur duquel sont contenus 20 000 gènes, et 64 millions de lettres en dehors des gènes… Chaque seconde, chaque cellule active une combinaison spécifique de gènes pour accomplir ses fonctions essentielles. Lorsque les erreurs s’accumulent dans les cellules, cela peut produire des tumeurs et conduire au cancer… En fin de compte, il semble que la compréhension de la génomique soit un problème de “mégadonnées”, alors, l’IA pourrait-elle aider à faire avancer les choses?


Source: https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

Les limites actuelles et la façon dont Imagia les aborde

Premièrement, même si elle est de plus en plus courante au Canada, la production de données génomiques de qualité clinique est encore coûteuse, ne fait pas partie des soins cliniques de routine pour la plupart des patients et n’est disponible que dans les grands hôpitaux de recherche. Les données produites sont si volumineuses (plusieurs gigaoctets par patient pour une séquence du génome entier) qu’elles ne sont pas stockées dans les dossiers médicaux électroniques (DME) des hôpitaux et ne sont donc pas facilement accessibles pour la recherche. Les informations génétiques stockées dans les dossiers médicaux des patients se présentent souvent sous la forme d’un rapport textuel d’un généticien clinique décrivant la présence ou l’absence de mutations génétiques, et une interprétation de la manière dont cela affecte les soins du patient.

Pour combler cette lacune, Imagia a lancé des projets de recherche sur les moyens de déduire le statut génétique en analysant des images cliniques standard. Par exemple, nous analysons des images de tomographie par ordinateur (CT) et de tomographie par émission de positons (PET) de patients atteints de cancer du poumon qui ont subi un test génétique (RNAseq, ou séquençage de l’acide ribonucléique (ARN), qui est le produit de gènes actifs). Dans ces cancers, qui sont les plus fréquents chez les adultes au Canada, les tests génétiques sont utilisés en clinique pour définir le traitement le plus approprié.

Cependant, ces tests nécessitent une biopsie de la tumeur, qui est une procédure invasive, et les résultats peuvent être longs à obtenir. Si nos algorithmes d’apprentissage machine peuvent trouver des marqueurs sur l’image qui permettent de prédire les résultats des tests génétiques, cela pourrait permettre d’associer plus rapidement et plus efficacement les patients au meilleur traitement. La possibilité de générer des informations génétiques sans jamais avoir à effectuer une gamme complète de tests génétiques coûteux pourrait permettre d’accroître l’accès à la médecine personnalisée au Canada.

Deuxièmement, les données génomiques générées en clinique et accessibles à la recherche sont non seulement rares, mais elles manquent aussi cruellement de diversité. En effet, la plupart des données génomiques générées à ce jour proviennent de personnes d’ascendance européenne [1] , ce qui a un impact considérable sur notre capacité à interpréter les mutations génétiques, dont la fréquence et le mécanisme d’action diffèrent parfois selon les populations [2].

Source: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5089703/

Tout comme dans la communauté de la génomique, la question des biais est également très discutée dans la communauté de l’intelligence artificielle, et les chercheurs du monde entier sont aux prises avec ce problème [3]. L’une des façons de résoudre ce problème est de partager les données – car des résultats plus puissants, reproductibles et généralisables peuvent être obtenus si des données plus nombreuses et plus diverses sont produites et partagées entre les institutions et les provinces.

Cependant, deux (2) problèmes se posent lorsque l’on souhaite partager les données des patients: la concurrence est féroce, et il y a des problèmes de confidentialité et d’autres problèmes juridiques. En effet, le partage généralisé des données sur les patients peut être perçu comme risqué: des réglementations fédérales et provinciales complexes entrent en jeu pour protéger la vie privée des patients, en particulier si elles contiennent des informations personnelles ou sont considérées comme “identifiables”, comme une séquence génomique complète.

En tant que gardiens des données, les établissements de soins de santé sont chargés de veiller à ce que ces données soient sécurisées et protégées de manière appropriée, ce qui génère parfois une réticence au partage. Pour les entreprises, ces données peuvent également contenir des informations et des connaissances protégées par des dispositions relatives à la propriété intellectuelle. Et pour les chercheurs, qui dépendent de financements rares et extrêmement compétitifs pour produire des données et générer des résultats publiables, le partage des données peut signifier la perte de leur avantage concurrentiel.

Source: https://www.healthcatalyst.com/insights/social-determinants-health-todays-data-imperative

Pour répondre à ces problèmes, Imagia a développé une solution technologique: Notre plateforme EVIDENS est basée sur le concept d’apprentissage fédéré, où les données brutes des patients restent toujours au sein de l’institution dans laquelle elles ont été produites, et où seuls les aperçus sur les données sont partagés. Les cliniciens et les chercheurs peuvent collaborer entre plusieurs instituts sans jamais partager de données brutes, ce qui nous permet de surmonter ce manque de diversité et de taille d’échantillon tout en atténuant les principaux problèmes de confidentialité (pour plus de détails, vous pouvez vous référer à notre précédent article de blog).

Cette approche innovante est également utilisée dans la nouvelle plateforme de découverte et de santé numérique (DHDP), une initiative pancanadienne financée par le gouvernement fédéral et dirigée conjointement par Imagia et l’Institut de recherche Terry Fox (IRTF). La DHDP vise à accélérer la médecine de précision en réunissant des leaders dans les domaines de l’intelligence artificielle et des soins de santé. Les partenaires de la DHDP développent également des moyens d’engager des partenaires publics et privés dans des projets mutuellement bénéfiques afin de stimuler l’innovation et la commercialisation de produits cliniques.

Troisièmement, il y a un manque de normalisation dans la génération, l’analyse et l’interprétation des données génomiques. Bien qu’une grande majorité des données génomiques soient produites à ce jour sur des machines conçues par le leader mondial de l’industrie, Illumina, la manière dont les cliniciens et les chercheurs passent des données sorties des machines de séquençage à l’interprétation clinique varie considérablement. Cela ne veut pas dire qu’il n’y a pas d’efforts de normalisation en cours, le plus notable étant mené par l’Alliance mondiale pour la génomique et la santé ou GA4GH. Imagia participe activement à cet effort, en travaillant directement avec Illumina sur un projet visant notamment à générer et tester l’efficacité des pipelines génomiques standards (voir notre communiqué de presse ici). Le problème des normes est que, même lorsqu’elles existent, il est difficile d’inciter de grands groupes à les utiliser. Afin d’inciter la communauté à utiliser une approche standardisée, les outils technologiques et logiciels de pointe que nous et d’autres développons seront intégrés directement dans notre plateforme DHDP et nous contribuerons à financer les projets qui les utilisent, ce qui incitera fortement les chercheurs canadiens à les inclure dans leurs pratiques de recherche.

Enfin, les données génomiques sont plus utiles si elles sont interprétées dans le contexte du parcours clinique du patient. Seules, les données génétiques sont souvent insuffisantes pour obtenir une compréhension complète de l’état d’un patient, qui ne peut être obtenue qu’en combinant plusieurs sources de données: dossiers des patients, rapports des cliniciens, résultats de tests médicaux (par exemple, analyses sanguines en laboratoire), données d’imagerie, etc.

En réponse à ce défi, notre plateforme EVIDENS prend en charge l’ingestion de multiples sources de données, et nous avons développé des méthodes d’intelligence artificielle avancées pour combiner de manière efficace et fiable ces riches ensembles de données. Par exemple, nous travaillons sur un projet visant à développer un algorithme d’apprentissage machine (ML) capable de traiter une combinaison de données cliniques, de rapports de pathologie, de données génomiques et de données d’imagerie clinique chez des patients atteints de cancer du poumon. Cela nous permet de générer des modèles plus puissants et augmente notre potentiel de découvertes.

Notre espoir pour l’avenir

Chez Imagia, nous pensons que les données génomiques, combinées à d’autres données cliniques et analysées à l’aide de technologies d’IA/apprentissage machine (ML) de précision, peuvent aider un plus grand nombre de patients atteints de maladies graves au Canada. Pour relever ce défi, nous nous associons à des leaders canadiens et mondiaux de la génomique. Parce que les patients sont au centre de tout ce que nous faisons, notre équipe a développé des solutions technologiques pour garantir que les données des patients sont toujours sécurisées et protégées, et que leur vie privée est respectée tout au long de notre pipeline. Imagia développe activement des méthodes pour générer des découvertes qui se traduiront par un meilleur diagnostic/traitement pour tous les patients, et ce, même s’ils n’ont pas subi de test génétique. Il reste encore un long chemin à parcourir jusqu’à ce que le séquençage du génome entier devienne une pratique clinique courante. En attendant, nous pensons que les méthodes d’IA/ML peuvent contribuer à libérer le potentiel clinique des données génomiques.

 


 

[1] Abul-Husn NS, Kenny EE. Personalized Medicine and the Power of Electronic Health Records. Cell. 21 mars 2019;177(1):58-69. doi: 10.1016/j.cell.2019.02.039. PMID: 30901549; PMCID: PMC6921466.

[2] Bien SA, Wojcik GL, Hodonsky CJ, Gignoux CR, Cheng I, Matise TC, Peters U, Kenny EE, North KE. The Future of Genomic Studies Must Be Globally Representative: Perspectives from PAGE. Annu Rev Genomics Hum Genet. 31 août 2019;20:181-200.

[3] Reproducibility in machine learning for health research: Still a ways to go. Matthew B. A. Mcdermott, Shirly Wang, Nikki Marinsek, Rajesh Ranganath, Luca Foschini, Marzyeh Ghassemi, Science Translational Medicine, 24 Mar 2021.

Related posts

La génomique chez Imagia :                                  Comment l'IA peut aider à libérer le pouvoir clinique des données génomiques

La génomique chez Imagia : Comment l'IA peut aider à libérer le pouvoir clinique des données génomiques

Les données génomiques ont le potentiel d’être cliniquement utiles, mais leur utilisation est aujourd’hui très limitée R

...
En savoir plus
Imagia annonce la nomination de Jennifer M. Buechel à son conseil d'administration

Imagia annonce la nomination de Jennifer M. Buechel à son conseil d'administration

Imagia renforce son conseil d’administration par l’arrivée d’une leader expérimentée du secteur de la biotechnologie, d

...
En savoir plus
Apprentissage Machine - Comprendre les différences entre les données réelles et celles des essais cliniques pour améliorer les résultats des patients.

Apprentissage Machine - Comprendre les différences entre les données réelles et celles des essais cliniques pour améliorer les résultats des patients.

La manière dont les données sont collectées et gérées aura un impact sur les découvertes futures en matière d’intelligence arti

...
En savoir plus